人工智能大模型陆续上线 加速赋能产业发展
来源:经济参考报 时间:2023-10-17
业内人士认为,当前国内大模型研发虽然进展迅速,但算力、人才等瓶颈仍待进一步突破,商业模式也还需进一步明晰。
在上海人工智能实验室教授林达华看来,千亿参数规模语言大模型的训练,最大的困难和挑战还不在于缺数据,而是试错成本很高。一个千亿参数的大模型,在千卡集群上面需要3个月训练。每一次更新都需要很大的算力支撑,训练的周期很长。
于浩认为,作为“底座技术”的大模型目前仍然处于“婴儿期”,其成长需要极其昂贵并耗能巨大的“算力暖房”,身边要围着一批专精人工智能算法优化的“专家保姆”,要供给海量的高质量“数据食材”。稍有不慎摄入“污染食材”或者对大模型“调教不严”,就极可能培育出“胡说八道”的“熊孩子”,给大模型企业造成难以估量的影响。
“考虑未来可持续发展,一方面是建设大模型基础设施引擎,筑牢底座,另一方面是培植小模型生态系统,进化出适应人工智能多样化小场景长尾需求的技术堆栈,用小模型解决实际问题,创造价值变现,再反哺大模型。”于浩说。
在谈到国内大模型的发展趋势时,孙乐认为,首先是随着大量高价值数据和用户反馈的获得,国内大模型的水平会迅速提升。其次,在应用方面大模型会大范围落地,并且在适合的场景会逐渐形成典型的应用范式。最后,大模型仍然会面临一些长期的科学问题,如可靠、可控和可信问题,同时也会在大范围的落地过程中发现新的科学问题,这些问题需要政府、企业界和学术界合力解决。
清华大学新闻与传播学院教授沈阳认为,国内大模型集中上线将催生一系列发展趋势,包括技术迭代加速、行业应用深化、商业模式多元化、数据和伦理问题凸显,以及国际化趋势。这些趋势不仅将影响模型本身的发展,还将对社会经济、法律规范和国际竞争格局产生深远影响。因此,各方需要密切关注,并做好相应的战略规划和应对措施。