石南AI工具导航
登录
网站目录

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书

石南12212024-09-15 20:08:32

在国产AI里,笔者经常使用的文本AI,除了Kimi外,剩下的就是通义千问了。

近期,通义千问更新了不少新功能,挺实用的,不知道大家有没有发现。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第1张

此前(点此回顾),通义千问的文本、图片、文档解析模式无法互通,是独立的3个接口,只能选择其中一个接口单独使用。

最近,通义千问调整了下产品逻辑,将文档、图片上传功能直接放在了对话框的旁边。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第2张

文档,一次对话,可以同时上传100个文件(每个150MB),支持PDF、word、excel、Mardown、EPUB、Mobi、txt等格式。

其中,Mardown文档一般后缀为.html或.md格式,EPUB和Mobi则是电子书的格式。

图片,每次上传1张不超过10M,支持jpg和png格式。

可以看到,无论大小、数量还是格式,通义千问都有意要比Kimi多一点点。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第3张

数据来自沃垠AI的整理

3月底,通义千问还向所有人免费开放了1000万字的上下文。背靠阿里云,通义千问确实不愁算力。

在国产AI里,长上下文这个功能最早由Kimi发扬光大,也是Kimi为大家所知、所用的起因之一。

Kimi的文档总结,非常简单、便捷,“文件,拖进来;网址,发出来”Slogan言简意赅,一用即会。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第4张

受此影响,通义千问、文心一言、讯飞星火和豆包,也都改进了自己的产品逻辑,均增加了文档上传功能。

文心一言的文档上传功能,一次最多可上传1个文件,不超过10M。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第5张

讯飞星火最多可上传100个文件,单个文件不超过100M。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第6张

豆包也新增了文档总结功能,一次仅上传1个文件,不超过20M。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第7张

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第8张

这个功能的使用层级较深,可能部分同学没有注意到。需要先点左侧边栏的“效率”icon(图标),看到几个“工具箱”。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第9张

然后,再点“上传音视频”工具,就可以用通义千问来读音视频了。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第10张

音频和视频都是最多可上传50个,最长支持6小时。视频单个最大不超过6G,音频单个最大不超过500M。

这大小限制,实际中用起来基本绰绰有余。

我上传了一节我们的付费课《上市100问-对赌协议》到通义千问。视频时长13分钟,通义千问只用不到1分钟就给我做好了全方位解读,包含智能速览、关键词、全文概要和原文

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第11张

智能总结,分为章节速览、发言总结、要点回顾、提取PPT四个部分,可以帮助我们快速了解视频内容,或根据需要定位、提取相关内容。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第12张

最下面,是视频原文。如果觉得AI总结有问题,可以到原文区求证。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第13张

右上角,是一些功能键:搜索、查找与替换、摘取、筛选、翻译、收起/展开视频、发言人区分、AI改写,可以帮助我们快速提取或摘取信息。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第14张

最右边是一个编辑器,我们可以在这里写学习笔记。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第15张

另外,在左侧边栏,还可以对所有内容进行导出,包括原文、智能速览、笔记和PPT,都可以保存到本地

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第16张

熟悉通义产品的同学应该想到了,这个功能其实就是通义听悟。原来,通义听悟只能做音视频转文字;现在,依托通义千问大语言模型,不仅能转文字,还能帮助用户继续智能化记录、整理和分析音视频内容,包括OCR文字识别。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第17张

目前,在国产大模型里,只有2家能读音视频,分别是通义千问和讯飞星火。通义千问依托的是通义听悟,讯飞星火依托的是讯飞听见。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第3张

讯飞星火的读音视频功能,也是4月底随星火模型更新到3.5版后,才集成到讯飞星火上的。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第19张

如果需要本地化运行,则推荐另一款AI工具——Memo AI,支持在本地安装运行(支持Windows、macOS系统)。可将YouTube、播客、本地音频视频进行转文本、字幕翻译或合成新语音,也可以通过多种AI模型提炼内容精华,生成脑图、思维导图等。

需要注意,目前依然没有任何一款AI能看在线视频。让AI“看”在线视频,需要转换处理,具体见《3s看完B站长视频,这个提示词很管用》。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第20张

通义有很多的产品矩阵,阿里云精选了部分功能,集合进了通义千问的通义效率板块。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第21张

除了上面介绍的读文档、音视频外,还可以读网页、论文、图书和播客。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第22张

我随便找了篇沃垠AI的文章,发给通义总结,输出质量不输Kimi。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第23张

让它提取一本书的核心观点,也是游刃有余。甚至我打错了字,都不影响它对问题的理解。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第24张

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第25张

在主页,点击右上角上传按钮,可一键切回到历史会话。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第26张

不管你与通义千问聊了多久多少次,依然可以在这里快速回到之前的会话背景,比如视频、文档、书籍等。让AI迅速依据这个材料背景来与你对话。

4月底,通义千问开源了1100亿参数模型Qwen1.5-110B,在多项基准测评中创下可与Llama3-70B媲美的成绩。

这一版(v2.1.1),通义千问的记忆力和连贯性有了明显提升。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第27张

在输入框输入“/”或同时按下“Ctrl+/”,可快捷调用指令。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第28张

指令,也就是提示词,与Kimi的Kimi+有异曲同工之妙。不同的是,Kimi的快捷调用是输入“@”。

通义千问,分别在办公助理、学习助手、创意文案、趣味生活、AI作画这五个领域,内置了整好100个提示词。

细说通义千问隐藏的5个新功能,一键读文档、视频、论文、图书 第29张

只不过,这些提示词都比较简单,可以满足大家的日常需求。但如果需要大模型输出特定行业的特殊需求,建议还是要自行编写提示词来与大模型对话。


本文链接:https://www.jxyuhui.com/post/1737.html ,转载需注明文章链接来源:https://www.jxyuhui.com/

分享到:
标签:通义千问AI
  • 不喜欢(3
本文转载自互联网,具体来源未知,或在文章中已说明来源,若有权利人发现,请联系我们更正。本站尊重原创,转载文章仅为传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网站转载使用,请保留本站注明的文章来源,并自负版权等法律责任。如有关于文章内容的疑问或投诉,请及时联系我们。我们转载此文的目的在于传递更多信息,同时也希望找到原作者,感谢各位读者的支持!

本文链接:https://www.jxyuhui.com/post/1737.html

猜你喜欢

石南

暂无个人介绍

1819 文章
2 页面
0 评论
589 附件
石南最近发表
最新文章
文章推荐
随机文章
    热门标签
    侧栏广告位
    ChatGPT账号购买