详情
搜索

人工智能大模型陆续上线 加速赋能产业发展

来源:经济参考报 时间:2023-10-17


业内人士认为,当前国内大模型研发虽然进展迅速,但算力、人才等瓶颈仍待进一步突破,商业模式也还需进一步明晰。

 

在上海人工智能实验室教授林达华看来,千亿参数规模语言大模型的训练,最大的困难和挑战还不在于缺数据,而是试错成本很高。一个千亿参数的大模型,在千卡集群上面需要3个月训练。每一次更新都需要很大的算力支撑,训练的周期很长。

 

于浩认为,作为底座技术的大模型目前仍然处于婴儿期,其成长需要极其昂贵并耗能巨大的算力暖房,身边要围着一批专精人工智能算法优化的专家保姆,要供给海量的高质量数据食材。稍有不慎摄入污染食材或者对大模型调教不严,就极可能培育出胡说八道熊孩子,给大模型企业造成难以估量的影响。

 

考虑未来可持续发展,一方面是建设大模型基础设施引擎,筑牢底座,另一方面是培植小模型生态系统,进化出适应人工智能多样化小场景长尾需求的技术堆栈,用小模型解决实际问题,创造价值变现,再反哺大模型。于浩说。

 

在谈到国内大模型的发展趋势时,孙乐认为,首先是随着大量高价值数据和用户反馈的获得,国内大模型的水平会迅速提升。其次,在应用方面大模型会大范围落地,并且在适合的场景会逐渐形成典型的应用范式。最后,大模型仍然会面临一些长期的科学问题,如可靠、可控和可信问题,同时也会在大范围的落地过程中发现新的科学问题,这些问题需要政府、企业界和学术界合力解决。

 

清华大学新闻与传播学院教授沈阳认为,国内大模型集中上线将催生一系列发展趋势,包括技术迭代加速、行业应用深化、商业模式多元化、数据和伦理问题凸显,以及国际化趋势。这些趋势不仅将影响模型本身的发展,还将对社会经济、法律规范和国际竞争格局产生深远影响。因此,各方需要密切关注,并做好相应的战略规划和应对措施。