【科学强国】多款AI大模型向公众开放!从拼参数走向拼应用
继百度“文心一言”和商汤科技“商量”之后,9月5日,科大讯飞宣布讯飞星火认知大模型面向全民开放;同日,360智脑大模型也宣布向公众开放。首批国产大模型产品获批面向用户开放服务,在从8月31日起的短短几天内,就实现了手机端、网页端都可体验的“速度感”。
图源/hellorf
据不完全统计,目前中国10亿以上参数规模的大模型已有近80个。国产大模型的“批量上市”,意味着“多模大战”正从上一阶段的“生出来”,走向“用起来”的新阶段。
首批AI大模型产品陆续开放
8月31日零时,百度“文心一言”宣布率先向全社会全面开放,用户可以在应用商店下载“文心一言”App或登录“文心一言官网”体验。据悉,百度还将开放一批经过全新重构的AI原生应用,让用户充分体验生成式AI的理解、生成、逻辑、记忆四大核心能力。百度官方显示,文心一言上线首日用户就突破了100万大关。
在首批8家通过《生成式人工智能服务管理暂行办法》备案的大模型公司中,上海地区占据3席,分别是MiniMax的“ABAB”、上海人工智能实验室的书生通用大模型、商汤科技的“商量”。
其中,商汤科技的“商量”于今年4月推出,是国内最早的基于千亿参数大语言模型之一,在向C端开放之前,其已在金融、医疗、汽车、地产、能源、传媒、工业制造等B端行业有了不同程度的落地应用。
书生通用大模型体系则由上海人工智能实验室发布,其中“书生·浦语”同样是千亿级参数的大语言模型。
MiniMax是2021年12月在沪成立的一家大模型初创公司,今年6月刚刚获得超2.5亿美元的A轮融资,此次其自研的通用大模型“ABAB”获批面世。
在北京地区,除了百度外,抖音的“云雀”、百川智能的“百川”、智谱华章旗下的“智谱清言”以及中科院旗下的“紫东太初”也同样获批。
其中,字节跳动旗下的基于云雀大模型开发的 AI 机器人 “豆包”, 从8月中旬就开始了小范围的邀请测试。用户可通过手机号、抖音或者 Apple ID 登录。“豆包” 提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息。
8月31日凌晨,百川智能表示通过《生成式人工智能服务管理暂行办法》备案,今日起面向全社会开放服务。用户可感受“百川大模型”在知识问答、文本创作等领域带来的体验。成立仅4个月,百川智能便相继发布了3款通用大语言模型,其中包括国内首款开源可免费商用70亿参数量大语言模型Baichuan-7B、参数量530亿的大语言模型Baichuan-53B等。
清华系AI公司智谱华章的生成式AI助手 “智谱清言”也于8月31日在各大应用商店上线。据悉,智谱清言已具备通用问答、多轮对话、创意写作、代码生成以及虚拟对话等能力,未来还将开放多模态等生成能力。
中科院旗下 “紫东太初”则于9月1日面向公众开放服务,定位为跨模态通用人工智能平台,拥有视觉、文本、语音多种模态,基于全栈国产化基础软硬件平台建立。目前,“紫东太初” 已在文本创作、医疗、物流、政务等多个行业实现应用落地。
有消息称,广东、安徽等省市的3家大模型公司也将很快面世。
大模型“狂飙”产业落地
随着人工智能技术日益成为企业竞争的焦点,企业正在疯狂投入资源、竞相开发人工智能相关的大模型产品。
国产AI大模型从狂热到正式上线效率可见一斑,面向C端的对话式应用产品吹响了号角,带动了更大的B端产业大模型陆续落地变现,“百模大战”的风已经吹向了“百模应用之争”,有关于商业化的真正较量才刚刚开始。
在多位专家看来,除了商用之外,大模型面向普通人开放是一个重要的里程碑。数字商业分析师郝智伟认为,大模型在C端的应用可以被认为是赋能工具、生活助手,是“重要的效率提升工具”,可帮助用户更快速处理各类文本和信息、做Excel表格、进行简单的编程等,让生活和工作变得更便利。
而对于企业来说,大模型“飞入寻常百姓家”,则意味着更庞大规模的中文语料投喂和更丰富的原生应用场景。C端是大模型普及的基础,大模型只有走向全社会开放,才能完成大数据意义上的语料累积,达成深度学习并实现个体赋能。
以GPT为目标,国内大模型们的商业模式持续清晰起来。当前包括文心大模型V3.5、讯飞星火认知大模型V2.0、智源悟道V3.0、紫东太初全模态大模型在内的版本正在陆续更新,在面向C端,可以实现文本生成、知识问答、数学、逻辑推理、代码以及多模态能力的输出。在开启大规模推广应用后,随着数据反馈叠加升级,国产大模型的学习能力将不断得到提升。
此外,基于大模型的B端应用也在逐渐清晰起来。当下对于已经拥有大模型的公司来说,大致分为三条腿走路。一方面通过将大模型融入现有业务中,以提高产品竞争力,另一方面通过出售大模型API接口,向企业按照使用次数收费,此外,还可以直接向传统企业输出大模型行业解决方案实现商业价值。
多位专家表示,“多模之战”正从拼参数走向拼应用,能建立起真实用户调用和模型迭代之间的“飞轮效应”,有利于真正服务国人。
从“事后监管”到“边跑边管”
今年4月,国家互联网信息办公室发布了关于《生成式人工智能服务管理办法(征求意见稿)》,提出利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。
由国家七部委联合公布的,我国首个针对生成式人工智能产业的规范性政策《生成式人工智能服务管理暂行办法》也于8月15日正式施行。
在业界看来,相较于稀缺牌照管理模式,当前践行的“备案制”管理模式将更好激发国产大模型的自主研发活力,进一步推动大模型生态应用落地。
而人工智能作为创新性技术,发展过程中具备诸多不确定性,需要不断发展出办法来解决问题。政策利好下,大模型的全面放开,将直面用户和市场,意味着更多的用户反馈将“协助”推进大模型的迭代。
展望下一步,我国将进一步加快通用人工智能创新和发展。工信部日前表示,将结合全球通用人工智能发展的新态势,会同相关部门加快研究制定产业政策,进一步明确产业发展目标和重点任务,引导各界集聚资源形成发展合力。同时,将围绕算力、算法、数据、框架等底座技术加大创新攻关,加快推进软硬件适配,构建从智能芯片到算法框架到大模型的全栈式产业链。
(中国小康网综合北京日报、经济参考报、界面新闻、文汇报、海报新闻等)
来源:中国小康网
作者:风华
审核:龚紫陌
来源:科学强国微信公众号