1.从Turbo说开去
Turbo,直译“涡轮增压器”。
进入IT领域,它被赋予了另外一层含义——性能更强,速度更快。
比如OpenAI的杠把子——ChatGPT-4 Turbo模型,自去年11月发布以来已有10个多月,但依然能够在各个测试基准上霸榜,大杀四方。
如果你的新模型准备要命名Turbo,还必须得有点东西。
最近,我看到腾讯推出“混元Turbo模型”,据其介绍:
“相比前代模型,混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评位居国内第一。”
简单总结就是:混元Turbo在训练、推理效率提升1倍的同时,价格降低到了前代模型(混元Pro)的一半。
性能提升,价格下降,这听起来就很有吸引力呢,那模型质量呢?
2.混元Turbo成色如何?
9月初,独立第三方测评机构SuperCLUE发布了《中文大模型基准测评(8月报告)》,为我们提供了一定的参考。
测评由理科、文科和Hard三个维度构成。理科能力分为计算、逻辑推理、代码能力三部分;文科任务包括知识百科、语言理解、长文本、角色扮演、生成与创作、安全和工具使用七个部分;Hard任务则侧重于精确指令遵循以及复杂任务高阶推理。
在最新测评里,SuperCLUE选取了国内外具有代表性的43个大模型,进行3226道题的测评。
据测评结果显示,“混元Turbo模型”以78.64总分位居国内大模型第一,与“ChatGPT-4o”只有1分之差。
在理科、文科和Hard三大维度上,“混元Turbo”均为国内第一。Hard任务,混元得分74.33.是国内唯一超过70分的大模型。
在11项能力测评中,“混元Turbo”有8项位居国内第一,成为榜单中进步最快的模型之一。
更重要的是,在“混元Turbo”发布后,国内Top1模型与国外领先模型的差距只缩小到了1.29%。而去年5月,这个差距还是30.12%。
为什么腾讯混元能够取得如此出色的成果?答案只有一个:技术创新。
据混元技术团队介绍:
“相较于上一代混元Pro大模型,Turbo模型在数据优化之外,自研了全新的万亿级分层异构MoE结构,在模型不同层采用不同的专家个数和不同的激活参数量,最终用更多的专家数、更少的激活参数量,使得混元Turbo在效果和性能上均实现大幅度的提升。”
可以看到,混元Turbo推理速度有了明显提升
有了技术创新,在价格上也就有了让利的底气。于是,混元Turbo模型的价格降至混元Pro的50%。
性能翻倍,价格减半,对于开发者而言,简直妙不可言。
目前,该模型已在腾讯云上线,企业和开发者可以通过API接入使用。同时,腾讯元宝的底层模型也切换成了Turbo,所有用户可以直接使用。
3.从技术到实用
技术不只是技术,还需要「实用」。
腾讯不只是造模型,还围绕底层模型打造了全链路的工具链和产品。
比如:
1)混元大模型提供API、专属模型、精调模型等接入和使用方式,所有企业及个人开发者都可以使用。
2)专属模型,开放了代码生成、角色扮演、Functioncall等功能,企业通过腾讯云TI平台即可对模型进行精调,实现定制化应用。
3)「腾讯元宝」上线了品牌智能体专区,邀请到10多家合作伙伴入驻,涵盖工作提效和生活娱乐等多个场景,所有用户都可以直接体验。
本文链接:https://www.jxyuhui.com/post/1738.html ,转载需注明文章链接来源:https://www.jxyuhui.com/
- 喜欢(11)
- 不喜欢(1)