大模型研发要稳步推动扎实进行
今年以来,ChatGPT引领了人工智能的新一轮创新浪潮。各个企业机构都在关注并投入力量进入这一划时代技术的研发应用中,科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,我国研发的大模型数量位居全球第二。目前,中国已进入“百模大战”的新时代,这固然体现了我国在人工智能领域的创新实力和发展潜力,但大模型研发毕竟不是商业模式的创新,而是技术、算力、基础设施的创新,一方面我们要积极关注投入,但也应稳步推动,扎实进行。
就国内的大型互联网企业来说,百度较早对大模型进行了投入和尝试,在文心一言发布之后的几个月里,据百度披露,无论其从效果上、效率上以及功能上都有了显著的提升。在效果方面,无论是创作问答还是推理代码等任务上,能力得到了全面的提升,效果累计提升超过50%。而且在内容安全性方面也得到了很大的提升。在IDC推出的《AI大模型技术能力评估报告,2023》中,认为百度目前的大模型整体上总分绝对第一,算法模型绝对第一,行业覆盖绝对第一。
IDC是全球领先的IT市场研究和咨询公司,其报告能给出如此高的评价令人振奋。百度之所以投入大模型研发早,因为其一直在深耕人工智能领域,有其自身的行业优势,百度在产业应用上对接行业比较广泛,技术落地能够进行行业覆盖,这是大模型扎实稳定推进的一个重要前提。
中国工程院院士郑纬民指出,大模型是新型基础设施的关键底座之一,大模型的竞争也是国家科技战略的竞争,中国一定要布局全栈自主创新的大模型产品,同时要构建国产化算力,也要解决算力能耗与国家“双碳”战略的平衡。
当前,我国 大模型面临着四方面的挑战:一是中文语料库和英文语料库在质和量上都存在较大差距,缺乏高质量的中文语料数据和行业数据;二是大模型需要大算力,但受制于国外技术封锁,中国缺乏先进、有效的算力;三是当前大模型训练算法框架大量依赖于国外框架;四是我国缺乏顶尖的AI人才。这些挑战对我国 大模型的研发和应用构成了制约。
为了应对这些挑战,我们要加强自主创新能力,从算力、算法、框架、工程化、人才等各个层面提升我国 大模型的核心竞争力。
同时,我们也应该看到,中国具有强大的工业基础和丰富的行业应用场景,为国产大模型的发展带来了独特机会。
中国坐拥庞大的实体产业基础,以制造业为例,据统计,中国目前共有31个制造业大类、609个小类,拥有全球产业门类最齐全、产业体系最完整的工业体系。
同时,中国持续构建现代化产业体系,对于人工智能技术与行业应用的深度融合,有着更庞大、更迫切、更具价值的实际需求,也提供了更为广大的创新实践空间。
中国工程院院士邬贺铨指出,Chat类的大模型引发新一轮热潮,但对话、写诗、作画绝不是大模型的全部。我们需要去深入思考大模型的应用方向,要将大模型切实投入到城市发展、金融科技、生物医药、工业制造、科学研究等领域,也需要专业的企业和组织加速其在实体产业落地,为产业刚需带来实实在在的大价值,去真正意义大规模服务社会。
面对大模型产业化的挑战,百度首席技术官王海峰表示,类似芯片代工厂模式,一些具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。这一产业化路径已在文心大模型产业实践中得到验证。百度与各行业头部企业、机构共建了包括能源、金融、航天、制造、传媒、城市、社科以及影视等十来个行业大模型。
我们期待,百度等企业在大模型研发应用中可以不断取得可借鉴的成果,同时我们也应该认识到目前我国在大模型研发方面存在的一些需要克服的困难,同时也要认清自己的优势,稳步推动扎实推进,有针对性的发力,摸准方向,唯有如此方能在科技竞争中行稳致远。
工人日报-中工网记者 车辉
来源:中工网