中国国际数字经济博览会

当前位置：首页新闻中心行业资讯

新闻中心大会公告要闻动态精彩视频数字河北媒体聚焦行业资讯

别怕，和ChatGPT 一起奔向未来

来源：人民邮电报时间：2023-02-23

达到1亿月活跃用户，Tiktok用了大约9个月，Meta的Instagram用了约2.5年，而美国人工智能公司OpenAI推出的人工智能聊天程序ChatGPT仅用了两个月。近期大热的ChatGPT 一鸣惊人，如何客观看待这一新生事物？AI应用已经超越人类了吗？我们不妨聊聊ChatGPT的“成长过程”。

ChatGPT“学”了各领域的巨量知识，千亿规模参数量带来智能化程度提升。2018年，GPT（生成式预训练Transformer）模型已经在NLP（自然语言处理）领域火起来，该模型能够从大型文本语料库学习语言模式，进而生成自然语言文本。生成式模型的输出并不来自人们事先给定的训练数据，而是由模型学习归纳后进行演绎创造得来。从GPT-1（1.17亿参数）、GPT2（15亿参数）、GPT-3（1750亿参数）、InstructGPT到ChatGPT，模型的参数规模已从最初的几亿快速增长为千亿。其中，InstructGPT是经过微调的GPT3，参数量与GPT-3模型相当，能够尽可能减少不真实和有偏差的输出结果。ChatGPT是InstructGPT的姐妹模型，在训练过程中加入了基于人类反馈的强化学习，使得模型能产生更加近似人类的回复内容。简单来说，ChatGPT“博览群书”，学得多自然懂得多，写文章、编代码、归纳论文摘要等任务难不倒它。

知不足补不足，持续学习能力对于个人成长至关重要，对于AI产品也是如此。细心的用户应该已经发现了，并不能与ChatGPT“聊”实事，因为其训练数据截止到2021年，对于近期发生的“新鲜事”，它并不了解，很有可能胡编乱造。对比引入了ChatGPT能力的新版必应（搜索引擎），可以理解为联网版ChatGPT，能够整合网上的最新资讯，“持续学习”能力得到一定程度的提升。日前，在微软新版必应的演示中，展示了如何使用ChatGPT版必应对比不同吸尘器的优缺点、快速比较公司盈利结果等。然而，据外媒消息，ChatGPT版必应给出的搜索结果存在问题：比如其未能准确区分吸尘器的类型，甚至编造了某些产品信息；对比Gap和Lululemon营业利润率的相关表述和比较分析都存在错误。“知之为知之，不知为不知，是知也。”这是我们很早就明白的道理，对于现阶段的ChatGPT类应用，还需进一步发现自身不足，通过“持续学习”来为用户提供更加准确、全面的输出结果。

“近朱者赤，近墨者黑。”ChatGPT是通过对大量数据进行训练得到的，由于其不具备独立思考和判断能力，好的坏的通通都学，如果训练数据存在偏见，那么其输出结果也会保留这种偏见。有用户在使用过程中发现ChatGPT的输出内容带有种族歧视、政治偏见，比如加州大学伯克利分校的计算神经科学家史蒂文·皮安塔多西就在推特上分享，在他用ChatGPT 开发的一个判断“一个人是否应根据原籍国而受到酷刑”的Python程序中，当输入朝鲜、叙利亚等国家时，给出的答案是肯定的。不难看出，ChatGPT的思考能力和判断能力亟待提升，而作为人类的我们，在成长过程中一直遵循“见贤思齐焉，见不贤而内自省也”的方式，追求进步的同时注重纠偏和自省，逐步形成的批判性思维能力是目前技术水平下的ChatGPT无法企及的。

“悟已往之不谏，知来者之可追。”ChatGPT确实火了，从它一路“狂飙”成长中，我们不禁对AI领域的突破性进展发出赞叹。与此同时，我们也再次认识到独立思考能力、持续学习能力对于自身成长的重要意义。未来，ChatGPT类应用将进一步优化，各领域与AI技术的融合创新也将迈向新的阶段，“人类的工作是否会被AI取代？”在网上，很多人表达了这样的焦虑。但人类与AI之间一定是竞争或者替代的关系吗？大可不必，AI技术的发展有助于人类更加高效解决复杂问题，放眼历史长河，重大科技成果必然引发人们生活方式的改变，与此同时，它们也无一例外成为人类文明发展的活力因子。与其恐惧被替代，不如一起向未来。

ChatGPT核心知识点

GPT模型能够从大型文本语料库学习语言模式，进而生成自然语言文本。生成式模型的输出并不来自人们事先给定的训练数据，而是由模型学习归纳后进行演绎创造得来。

ChatGPT有多火？

达到1亿月活跃用户，Tiktok用了大约9个月，Meta的Instagram用了约2.5年，而美国人工智能公司OpenAI推出的人工智能聊天程序ChatGPT仅用了两个月。

参数规模已达千亿级别

从GPT-1（1.17亿参数）、GPT2（15亿参数）、GPT- 3（1750亿参数）、InstructGPT到ChatGPT，模型的参数规模已从最初的几亿快速增长为千亿。其中，InstructGPT是经过微调的GPT-3，参数量与GPT-3模型相当，能够尽可能减少不真实和有偏差的输出结果。ChatGPT是InstructGPT的姐妹模型，在训练过程中加入了基于人类反馈的强化学习，使得模型能产生更加近似人类的回复内容。

不具备思考判断能力

ChatGPT是通过对大量数据进行训练得到的，由于其不具备独立思考和判断能力，好的坏的通通都学，如果训练数据存在偏见，那么其输出结果也会保留这种偏见。

公众号

小程序

主办单位

工业和信息化部

国家发展和改革委员会

河北省人民政府

联系我们

电话：0311-87908710

地址：石家庄（正定）国际会展中心

承办单位

展开全部

中国工业互联网研究院

中国信息通信研究院

中国电子信息产业发展研究院（赛迪研究院）

国家发展改革委创新驱动发展中心（数字经济研究发展中心）

中国网络社会组织联合会

中国电子商会

中国国际电子商务中心

中国电子学会

国家工业信息安全发展研究中心

中国服务贸易协会

中关村创业投资和股权投资基金协会

北京基金业协会（PE）

中关村互联网金融研究院

石家庄市人民政府

河北省工业和信息化厅

河北省发展和改革委员会

河北省互联网信息办公室

河北省商务厅

河北省通信管理局

河北省地方金融监督管理局

协办单位

展开全部

中国电子技术标准化研究院

工业和信息化部网络安全产业发展中心（信息中心）

中国电子信息行业联合会

中国通信学会

中国软件行业协会

中国通信企业协会

河北省数字经济联合会

联系我们

电话：0311-66611065

传真：xxxxxxxx

地址：石家庄（正定）国际会展中心