石南AI工具导航
登录
网站目录
ChatGPT账号购买

Open AI的o1满血版翻身当爸爸,“强化微调”直接PK顶尖专家,奥特曼还是会玩!

石南1152024-12-07 16:55:21

前两天奥特曼放出消息说OpenAI将连续12天直播大放送,我还特意发了篇文章,充满期待!

我知道好多AI圈子里的人别说GPT5、sora了,AGI我们都准备好迎接了,但是直播是啥情况呢?

Open AI的o1满血版翻身当爸爸,“强化微调”直接PK顶尖专家,奥特曼还是会玩! 第1张

15分钟极速直播就一个o1满血版,还在这炫耀!!!


Open AI的o1满血版翻身当爸爸,“强化微调”直接PK顶尖专家,奥特曼还是会玩! 第2张

看到很多人都在狂喷这次发布会,号称史上最寒酸的发布会,有一位网友,对于产品的定价,也算是说出了大家的心声~

Open AI的o1满血版翻身当爸爸,“强化微调”直接PK顶尖专家,奥特曼还是会玩! 第3张

不过,作为人工智能领域的科技巨头,OpenAI还是有点东西的,这两天讲了点啥呢?

|o1 模型:性能的实质性提升

相较于之前的预览版本,o1 模型在多个关键维度上实现了明显进步:

1.智能能力的提升OpenAI 通过数学竞赛题、编程挑战和科学难题的测试,展示了 o1 模型在基础智能能力上的显著进步。

测试数据显示,模型出现重大错误的概率较预览版**降低了约34%**,这意味着在日常使用场景中,模型的可靠性和准确性都得到了实质性提升。

Open AI的o1满血版翻身当爸爸,“强化微调”直接PK顶尖专家,奥特曼还是会玩! 第4张

2.响应速度的优化

针对此前用户反馈"慢思考"的诟病,o1 模型在响应机制上做出了重大调整。通过智能判断问题复杂程度,模型能够对简单问题给出快速响应,同时在面对复杂问题时仍保持深入思考的能力。OpenAI 内部研究表明,模型整体思考速度较预览版提高了约50%。

Open AI的o1满血版翻身当爸爸,“强化微调”直接PK顶尖专家,奥特曼还是会玩! 第5张

3.多模态能力的扩展

图像识别是 o1 模型的一个重要突破。在发布会现场演示中,研究人员上传了一张手绘的热力学草图,模型成功识别并进行多模态推理。

虽然看起来这么厉害,但天底下哪有免费的午餐,说话间就带出了一个比Plus订阅贵十倍的新订阅计划……

Open AI的o1满血版翻身当爸爸,“强化微调”直接PK顶尖专家,奥特曼还是会玩! 第6张

奥特曼,你当我们是韭菜吗?


不过也能看出来,看来OpenAI也是真缺钱了~

他们也说了,200美元的月度订阅价格并非面向普通消费者,而是专门针对对人工智能有刚性需求的高阶用户和专业团队。

Pro 版本的核心价值

无限制使用高级模型

全天候高级语音模式

模型结果可靠性的微小提升

优先体验最新技术特性

不过励志做科研的人员,值得尝试一下~

|强化微调

第二天,奥特曼直接不来了,让团队继续上演15分钟小课堂,讲了o1mini的强化微调

Open AI的o1满血版翻身当爸爸,“强化微调”直接PK顶尖专家,奥特曼还是会玩! 第7张

这个具体有什么用呢?


一句话说,就是以后大家可以用自己的数据集把o1从高中水平升级到你所在领域的博士专家级水平。

现场也是有一位遗传病专家演示了经过微调之后的omini模型,得分上升了80%,甚至比满血版的o1还要强。那这个强化微调到底是什么呢?

Open AI的o1满血版翻身当爸爸,“强化微调”直接PK顶尖专家,奥特曼还是会玩! 第8张

首先听名字肯定用的是强化学习方法,但是跟原来的微调有什么区别呢?

想象一下,我们有两种方式来教一个人如何烹饪。

Open AI的o1满血版翻身当爸爸,“强化微调”直接PK顶尖专家,奥特曼还是会玩! 第9张

传统微调的方式就像是这样:你给一个新手厨师看很多食谱和成品照片,让他们仔细观察这些成功的菜肴是什么样子的,但并不让他们亲自下厨。

你只是让他们看,希望他们能从这些食谱和成品照片中自己领悟出烹饪的技巧。

强化微调的方式则不同:你给新手厨师一些基本的食材和烹饪工具,让他们自己尝试做菜。每次他们做完一道菜后,你尝一尝,然后告诉他们这道菜做得怎么样,比如这道菜的味道不错,但是火候掌握得不够好。

厨师就会根据你的反馈来调整自己的烹饪方法,强化做得好的地方,改进做得不好的地方。这样,他们可能只需要做几次菜就能掌握烹饪技巧,而且学得更快、更好。

但是,强化微调并不是对所有事情都有效。比如学习园艺,可能多观察植物的生长、多浇水施肥会更有帮助。

而在需要逻辑推理和系统思考的任务上,比如设计一座花园,你可能需要自己先规划,然后让有经验的园丁来给你提建议。

所以,强化微调更适合那些需要专业知识和系统性思考的领域,比如法律、医疗、建筑设计、园艺规划、烹饪艺术等。

对于简单的模仿和重复性工作,比如模仿某个人的签名或者简单的流水线作业,可能就不是那么适用。

现在它还只面向一些高校、企业和开发者开放测试。

两天的发布会不仅仅是一次技术更新,更是 OpenAI 在人工智能商业化道路上的又一次尝试。200美元的 Pro 版本,实际上是在测试市场:到底有多少用户愿意为"世界上最聪明"的大模型付费?

而强化微调,似乎又在通往AGI的道路上前进了一小步~

好了,暂时就说这么多,另外,Altman又放出了一个新的信号……

Open AI的o1满血版翻身当爸爸,“强化微调”直接PK顶尖专家,奥特曼还是会玩! 第10张


本文链接:http://www.jxyuhui.com/post/1806.html ,转载需注明文章链接来源:http://www.jxyuhui.com/

分享到:
标签:Open AIChatGPT
  • 不喜欢(2
本文转载自互联网,具体来源未知,或在文章中已说明来源,若有权利人发现,请联系我们更正。本站尊重原创,转载文章仅为传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网站转载使用,请保留本站注明的文章来源,并自负版权等法律责任。如有关于文章内容的疑问或投诉,请及时联系我们。我们转载此文的目的在于传递更多信息,同时也希望找到原作者,感谢各位读者的支持!

本文链接:http://www.jxyuhui.com/post/1806.html

ChatGPT账号购买

猜你喜欢

石南

暂无个人介绍

1785 文章
2 页面
0 评论
414 附件
石南最近发表
最新文章
文章推荐
随机文章
    热门标签
    侧栏广告位
    ChatGPT账号购买
    ChatGPT账号购买