详情
搜索

大模型的下一步该怎么走

来源:科技日报 时间:2023-11-24

在近日举办的第六届世界声博会暨2023科大讯飞全球1024开发者节上,科大讯飞股份有限公司(以下简称科大讯飞)正式发布讯飞星火认知大模型V3.0,在文本生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、多模态能力等7个方面较上一个版本进行了智能升级。

面向行业找到刚需应用场景

本次发布会上,除了发布讯飞星火认知大模型V3.0外,科大讯飞还一口气发布了面向工业、法律、金融等12个行业的专属行业大模型。

如何深入行业,一直是困扰大模型发展的难题。科大讯飞董事长刘庆峰认为,面向具体行业,找到刚需的应用场景是推动大模型迈向产业、实现商业价值的重要基础。

科大讯飞此次发布的12个行业大模型,瞄准的正是许多行业中的智能化痛点。

“要做出符合行业特点和需求的大模型,就必须要与真正懂行业、懂应用场景的龙头企业合作。”刘庆峰表示,行业大模型在龙头企业内部打造成功后,可以对全行业进行赋能,所以合作企业要有开放的精神。

刘庆峰认为,一整套方便易用的训练工具能对行业专属内容进行高效训练。这对于大模型在行业中落地至关重要。“我们需要开发出定制化工具,让企业自己‘拖拖拽拽’就能解决问题。”他说。

针对行业定制大模型成本居高不下的现状,刘庆峰认为,大模型要先找到典型应用场景,和行业龙头企业一起做好共性场景的应用。在大模型具备一定的行业通用能力后,需要定制的内容会越来越少,成本自然会下降。

此外,他还表示,大模型要想真正赋能千行百业,需要实现从多轮对话、主动对话再到启发式对话的跨越。大模型不仅要能回答问题,还要能像人一样主动提问。

着眼于此,讯飞星火认知大模型在此番更新中便新增了个性化AI人设功能。该功能可以为讯飞星火认知大模型形成一个初始“性格”,使大模型具备长期稳定的记忆力、多样化的个性和丰富的情感,再结合特定知识学习、对话记忆学习,形成一个更个性化的AI人设。

找到方向形成完整自主生态

大模型的训练和应用离不开由显卡搭建的算力平台,这让算力再次成为中国人工智能发展过程中的焦点。在此次发布会上,除了讯飞星火认知大模型V3.0,最受关注的便是科大讯飞与华为联合发布的国产算力平台“飞星一号”。刘庆峰表示,讯飞星火认知大模型V3.0正是在国产算力平台上训练出来的大模型。

华为轮值董事长徐直军在发布会现场表示,华为的使命和愿景是让每个人、家庭、组织畅享数字世界,构建万物互联的智能世界。在全面智能化战略的指引下,华为将持续打造坚实的算力底座,最终让所有对象可联接,所有决策可计算,让大模型真正赋能千行百业。

徐直军透露,讯飞星火认知大模型V3.0在“飞星一号”平台上训练效率翻番,能够实现更为高效稳定的训练迭代。接下来,华为还将为更大参数的讯飞星火认知大模型V4.0版本提供有力支撑。

自主创新的算力底座是中国大模型发展的重要基础。刘庆峰表示,虽然目前使用国产化算力平台仍然存在一定迁移成本,但这一步是必须迈出的。

接下来,科大讯飞将在“飞星一号”平台的基础上,启动对标GPT-4的更大参数规模的讯飞星火认知大模型V4.0的训练。刘庆峰表示,这对于科大讯飞来说,绝不仅仅是一个简单的技术对标问题。“我们要走出自己的技术路线,走出自己的产业方向,形成自己完整的生态。”他说。