前两天奥特曼放出消息说OpenAI将连续12天直播大放送,我还特意发了篇文章,充满期待!
我知道好多AI圈子里的人别说GPT5、sora了,AGI我们都准备好迎接了,但是直播是啥情况呢?
15分钟极速直播就一个o1满血版,还在这炫耀!!!
看到很多人都在狂喷这次发布会,号称史上最寒酸的发布会,有一位网友,对于产品的定价,也算是说出了大家的心声~
不过,作为人工智能领域的科技巨头,OpenAI还是有点东西的,这两天讲了点啥呢?
|o1 模型:性能的实质性提升
相较于之前的预览版本,o1 模型在多个关键维度上实现了明显进步:
1.智能能力的提升OpenAI 通过数学竞赛题、编程挑战和科学难题的测试,展示了 o1 模型在基础智能能力上的显著进步。
测试数据显示,模型出现重大错误的概率较预览版**降低了约34%**,这意味着在日常使用场景中,模型的可靠性和准确性都得到了实质性提升。
2.响应速度的优化
针对此前用户反馈"慢思考"的诟病,o1 模型在响应机制上做出了重大调整。通过智能判断问题复杂程度,模型能够对简单问题给出快速响应,同时在面对复杂问题时仍保持深入思考的能力。OpenAI 内部研究表明,模型整体思考速度较预览版提高了约50%。
3.多模态能力的扩展
图像识别是 o1 模型的一个重要突破。在发布会现场演示中,研究人员上传了一张手绘的热力学草图,模型成功识别并进行多模态推理。
虽然看起来这么厉害,但天底下哪有免费的午餐,说话间就带出了一个比Plus订阅贵十倍的新订阅计划……
奥特曼,你当我们是韭菜吗?
不过也能看出来,看来OpenAI也是真缺钱了~
他们也说了,200美元的月度订阅价格并非面向普通消费者,而是专门针对对人工智能有刚性需求的高阶用户和专业团队。
Pro 版本的核心价值
无限制使用高级模型
全天候高级语音模式
模型结果可靠性的微小提升
优先体验最新技术特性
不过励志做科研的人员,值得尝试一下~
|强化微调
第二天,奥特曼直接不来了,让团队继续上演15分钟小课堂,讲了o1mini的强化微调。
这个具体有什么用呢?
一句话说,就是以后大家可以用自己的数据集把o1从高中水平升级到你所在领域的博士专家级水平。
现场也是有一位遗传病专家演示了经过微调之后的omini模型,得分上升了80%,甚至比满血版的o1还要强。那这个强化微调到底是什么呢?
首先听名字肯定用的是强化学习方法,但是跟原来的微调有什么区别呢?
想象一下,我们有两种方式来教一个人如何烹饪。
传统微调的方式就像是这样:你给一个新手厨师看很多食谱和成品照片,让他们仔细观察这些成功的菜肴是什么样子的,但并不让他们亲自下厨。
你只是让他们看,希望他们能从这些食谱和成品照片中自己领悟出烹饪的技巧。
强化微调的方式则不同:你给新手厨师一些基本的食材和烹饪工具,让他们自己尝试做菜。每次他们做完一道菜后,你尝一尝,然后告诉他们这道菜做得怎么样,比如这道菜的味道不错,但是火候掌握得不够好。
厨师就会根据你的反馈来调整自己的烹饪方法,强化做得好的地方,改进做得不好的地方。这样,他们可能只需要做几次菜就能掌握烹饪技巧,而且学得更快、更好。
但是,强化微调并不是对所有事情都有效。比如学习园艺,可能多观察植物的生长、多浇水施肥会更有帮助。
而在需要逻辑推理和系统思考的任务上,比如设计一座花园,你可能需要自己先规划,然后让有经验的园丁来给你提建议。
所以,强化微调更适合那些需要专业知识和系统性思考的领域,比如法律、医疗、建筑设计、园艺规划、烹饪艺术等。
对于简单的模仿和重复性工作,比如模仿某个人的签名或者简单的流水线作业,可能就不是那么适用。
现在它还只面向一些高校、企业和开发者开放测试。
两天的发布会不仅仅是一次技术更新,更是 OpenAI 在人工智能商业化道路上的又一次尝试。200美元的 Pro 版本,实际上是在测试市场:到底有多少用户愿意为"世界上最聪明"的大模型付费?
而强化微调,似乎又在通往AGI的道路上前进了一小步~
好了,暂时就说这么多,另外,Altman又放出了一个新的信号……
本文链接:http://www.jxyuhui.com/post/1806.html ,转载需注明文章链接来源:http://www.jxyuhui.com/
- 喜欢(10)
- 不喜欢(2)