【科学强国】大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。
摄影/宁颖
OpenAI官方去年11月发布的GPT-4 Turbo,支持128k上下文,大约相当于10万汉字。Kimi智能助手在去年10月首次亮相时,支持20万汉字的无损上下文长度;5个月后,3月18日,Kimi智能助手启动200万字无损上下文内测。从“20万”提升至“200万”,不到半年。
国产大模型Kimi火了
Kimi是谁?这是来自Kimi的自我介绍:“嗨,我是Kimi,由月之暗面科技有限公司(以下简称“月之暗面”)开发的人工智能助手。我擅长中英文对话,能够提供安全、有帮助且准确的信息。我可以阅读和理解各种文件格式,解析网页内容,并结合搜索结果来回答问题。如果你有任何疑问或需要帮助,随时可以问我。”
3月18日,月之暗面宣布,Kimi智能助手已支持200万字超长无损上下文,并开启产品内测。Kimi智能助手的智能搜索功能,可根据用户的问题,主动去互联网上搜索、分析和总结最相关的多个页面,生成更直接、更准确的答案。此前,在2023年10月公司的智能助手可以实现20万无损上下文长度,最新能力提升了一个数量级。
关于长度提升后有何变化,21日,月之暗面相关负责人表示,这会进一步帮助打开对AI应用场景的想象力,包括完整代码库分析理解、可自主帮人类完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。
3月21日,因流量突然剧增,有不少用户在社交平台上表示,kimi智能助手的APP和小程序无法正常使用。当天,月之暗面发布情况说明表示,从3月20日上午九点半开始,官方观测到Kimi的系统流量持续异常增高,流量增加的趋势远超公司对资源的预期规划。这导致了从3月20日上午十点开始,有较多SaaS(software as a service,软件即服务)客户持续遇到“429:engine is overloaded”的异常问题,对此月之暗面表示抱歉。
图源:网络
AI应用及算力打开增量空间
Kimi作为千亿大模型,能够支持复杂运算,同时还能接受和处理大文本,解决了很多大模型实际应用中的难题,后续商业化潜力凸显。
有一个演示鲜明地展现了Kimi高超的“吃瓜”智能。使用者将《甄嬛传》剧本传给Kimi,再问它哪些细节表明甄嬛的孩子是果郡王的?Kimi能在不同时间段、各个场景的故事情节中,深入挖掘出相关线索并一一列出,堪比一个看了几十遍电视剧的“甄”学家。
经济观察报记者测试将一份长达187页的上市公司年报全文输入到Kimi,1分钟之内,仅为1页的核心内容被提取出来,包括上市公司的基本信息、财务概览(营业收入、净利润等)、利润分配、公司治理等十项核心内容。这一功能可以帮助投资者迅速了解上市公司的简要财务情况。
国信证券表示,Kimi成为国产大模型曙光,带动产业链革新。Kimi凭借其在处理长文本方面的卓越能力,能够处理高达200万字的输入,显示出其在无损阅读方面的巨大潜力。这一突破不仅提升了内容创作和整理的效率,还为小说、剧本创作等领域带来了深化和创新,同时在游戏互动、AI陪伴和专业领域任务执行等方面开辟了新的应用场景。
值得注意的是,业内人士认为,文本长度只是反映大模型能力的一个侧面,并非评判模型训练能力的唯一标准。郭涛表示,模型的训练能力还包括对不同类型数据的处理能力、模型的稳定性、可扩展性等多个维度。“在多模态、参数规模、通用性等方面,我们与Open AI等海外企业还有一定距离。”赛智产业研究院院长赵刚坦言。
人工智能需要差异化竞争
从千亿参数到千万长文本,大模型又“卷”出了新高度。而一同被“卷”起来的,还有大模型的商业化进程。
360集团、阿里、百度等头部厂商纷纷宣布升级AI大模型技术。3月22日,阿里通义千问宣布,向所有人免费开放1000万字的长文档处理功能。3月23日,360智脑宣布正式内测500万字长文本处理功能,该功能即将入驻360AI浏览器,同时360AI浏览器App也即将上线。另外,百度文心一言4月份将进行版本升级,届时将开放长文本处理能力,文字范围在200万-500万字。
不少AI从业者认为,目前,长文本能力或可以成为大模型公司吸引市场关注,赢得竞争的路径之一,不过要做好“长”“准”、成本三者之间的平衡,还需要不断摸索。
从Kimi智能助手宣布升级后用户激增导致产品出现无法正常使用的现象来看,人们确实有大量的对大模型处理长上下文的需求。不过,提升上下文长度还存在一些难题,比如引起大模型智能水平下降或大幅增加运营成本等。此次各个大模型迅速宣布升级,是否都能达到让用户满意的效果,还需要时间观察才能得出结论。
纵观海内外大模型发展概况,国际上,呈现Open AI和微软领先、谷歌追赶、Meta发力开源的格局,通用大模型能力相对成熟,应用生态呈现繁荣发展态势。国内方面,腾讯、阿里、百度、科大讯飞、商汤科技等巨头和AI公司都纷纷推出了大模型,同时,各行业也不断涌现垂类大模型。目前,国内公布的大模型数量已超过200个。
(中国小康网综合经济日报、澎湃新闻、第一财经、中工网、中国证券报等)
来源:中国小康网
作者:风华
审核:龚紫陌
来源:科学强国微信公众号