封面新闻记者 边雪
每一个使用过ChatGPT的人,大抵都会有同样的感觉:“有趣”“上头”“不可思议”,甚至会产生“科幻照进现实”的错觉。
人工智能发展多年,ChatGPT是首个达到用户数量在亿级,并在全球范围内争相体验的产品。封面传媒副总经理兼首席数据官徐桢虎看来,ChatGPT如此火爆,是因为在一定程度上满足了很多人对于影视中出现的AI的想象。
徐桢虎表示,随着封面科技数字化业务的增长,今年AIGC的产品研发也是封面的一个重要方向。“大家可以期待一下今年封面科技推出的新产品。”
带着这份期待,封面新闻记者也与徐桢虎深入地聊了聊ChatGPT的前世、今生与未来。
“ChatGPT看起来像是真的有了自己的思想,就像是流浪地球2中的MOSS”
封面新闻:理论上,ChatGPT 不是什么新鲜事,它背后的基础模型 GPT3/GPT3.5 早就问世了,您认为ChatGPT全球爆火的原因是什么?
徐桢虎:对于普通人来说,最主要的原因是,ChatGPT在一定程度上满足了很多人对于影视中出现的AI的想象,它能够通过学习和理解人类的语言来进行对话,还能根据聊天内容的上下文进行互动,像人一样沟通交流。
可能源于人们对于人工智能技术的期望往往高于实际能力,以往出现的那些人机交互类型的AI产品,比如聊天机器人、自动驾驶系统、智能家居设备,由于表现不佳、结果不准确或不可靠,常常被用户称为“人工智障”。
而ChatGPT看起来像是真的有了自己的思想,就像是流浪地球2中的MOSS,用户询问什么它都可以给出相对满意的答案,而不是一个“人工智障”产品。
封面新闻:ChatGPT能实现目前这样自然的语言交互,对AI研究发展意味着什么?
徐桢虎:ChatGPT带来了新一轮的AI技术范式革新。ChatGPT的横空出世,对于谷歌、百度等科技巨头而言是很焦虑,但ChatGPT的冲击力不仅止于此。它真正让所有人都感到吃惊的,是背后大模型的创建和学习能力。
事实上,在ChatGPT推出之前,国内外已有不少大模型。但相比其他大模型,ChatGPT在AI的技术路线和训练方式上的变革,带来了业界意料之外的突破。
包括有一个非常强大的技术底座也就是InstructGPT模型,同时引入的强化学习机制上取得了突破,并且在数据质量和多样性上也非常讲究。光是基础模型本身的差距,虽然国内外也训练了很多万亿模型或者是几千亿的模型,但训练的充分程度,是远远不够的。
有人用同样的问题向某大型AI厂商的大模型和ChatGPT发问,ChatGPT从回答的逻辑性和完整度上都远超对手,其他大模型的答案带有明显的拼凑感和主题之外的胡编内容。
所以,当ChatGPT出现时,内行来看的震惊程度比外行来说更高,因为知道这样的提升是非常困难的。AI算法科研领域正经历算法、开源代码、工程、算力的增长飞轮,而ChatGPT所代表的大模型的创建和学习能力会成为新的流行方向。而且可以预见,更多这类大模型会雨后春笋一般快速出现。
“ChatGPT内容信源的可靠性依然是一个大问题。”
封面新闻:据了解,ChatGPT背后的大型语言模型的训练集最近数据截止于2021年底,所以任何关于2022年里发生的事件,它无法给出准确的答案,这个会为用户带来什么样的问题?将来有可能解决吗?
徐桢虎:得益于ChatGPT背后最先进的GPT3.5大模型,它的绝大部分回答在数据集时间范围内都是准确的,因此普通用户并不知道它的运作机制,会倾向于认为它无所不知。而ChatGPT可能会以一种非常自信的口吻来编造事实,这是一个大问题。
不过不必过于担忧,ChatGPT背后有着海量的资料库和庞大的算力做支撑,随着它与搜索引擎的结合度越来越高,对于知识更新的实时性问题肯定可以得到解决。以后我们甚至可以把chatGPT当成一个交互式的搜索引擎来用。
封面新闻:在您看来ChatGPT目前还存在哪些问题?将会导致什么样的结果?
徐桢虎:目前主要有三类问题——
结果不稳定。这会导致对结果准确性要求高的业务无法直接应用,需要人工审核,更多是作为辅助应用或娱乐性强的场景。推理能力有限。例如询问现在的美国总统是谁,会回答奥巴马或特朗普,但又能回答出拜登是第46届总统。我们可以发现模型中事实存在,但它无法推理出正确答案。知识更新实时性不够。原因一方面是因为整个模型的二次训练成本很高,另一方面知识更新也会带来知识遗忘。
总而言之,ChatGPT内容信源的可靠性依然是一个大问题。除此之外,ChatGPT目前最核心的问题还是,它会以一种非常自信的口吻来编造事实。因此,即使是面向普通大众用户,我们也需要引入不同的行业专家。比如哲学、社会科学、艺术和人文学科的人士来参与管理ChatGPT的使用。所以,AI公司有责任让公众意识到这些问题,同时,监管机构和政府也需要对这个系统进行更多的重视。
“未来传媒行业的人机高效协作将会成为更加常见的场景。”
封面新闻:“美国版今日头条”BuzzFeed宣布计划采用ChatGPT协助创作个性化内容,您认为ChatGPT将在新闻媒体行业中将会承担什么样的职能?
徐桢虎:2017年的时候我在云栖大会成都峰会分享时说过,AI在传媒行业的作用更多是辅助内容生产,媒体的内容要有自己的价值观。现在我的观点可能要改变了,AI技术的发展太快,数字人+chatGPT+多模态内容生成,已经能够替代主持人、记者、编辑的很多工作。从文章写作、新闻获取、方案制定、人机互动,chatGPT都能在数秒内完成,未来传媒行业的人机高效协作将会成为更加常见的场景。
封面新闻:您认为ChatGPT更适合应用于哪些领域?为什么?
徐桢虎:现在的ChatGPT能力非常全面,能完成撰写邮件、视频脚本、活动文案、文章写作、代码编写等各种类型的任务。
但我个人觉得它还是更适合应用在小说写作、剧本创作、活动策划等需要解放生产力的行业。
因为对于某些领域来说ChatGPT的应用会引起巨大争议,甚至会遭到业界大佬的“封杀令”。比如说学术领域,ChatGPT即使不需要理解专业的知识,它也能生成一篇专业性更高的内容,并获得专家认可。“学术伦理”的问题需要得到更多的监管。
“2023年,AIGC的商业化产品应用将是封面科技研发的一个重要方向”
封面新闻:封面科技有可能会使用或者研发ChatGPT相关的产品吗?
徐桢虎:我更愿意把chatGPT、AI绘画、多模态内容合成等人工智能生成内容(AIGC)称为一个发展方向。
其实,封面从2017年就开始进行了对话机器人相关技术和产品的研发,只不过那时候受到数据、算力限制,模型效果还远远达不到现在chatGPT的水平。而AI绘画我们算是探索得比较早的,已经在业务场景中应用了近一年。
随着封面科技数字化业务的增长,2023年,AIGC的商业化产品应用将是封面科技研发的一个重要方向,大家可以期待一下今年封面科技推出的新产品。
封面新闻:ChatGPT为人工智能技术的未来发展指明了什么样的方向?会产生新的发展方向吗?
徐桢虎:对于普通用户来说,ChatGPT目前还有很多问题。但只要用过ChatGPT的人,即使一小部分人还不认可它是真正的AI,但没人认为它和之前那些“人工智障”的聊天机器人是一样的。直观来说,我们会认为是AI的智力提升了,但实际上ChatGPT背后的GPT3.5大模型,更多的提升在于“用人类所喜欢的方式回答”。
其实,可以把最近几个月开始火爆的ChatGPT和AI绘画放在一起说,它们所代表的人工智能生成内容(AIGC)已经是从去年开始最火爆的一个AI发展方向,2022年也被称为AIGC元年。
对于商业圈来说,有可能带来新一轮技术革新和商业模式革新,最近开始流行一句话:“所有行业都值得用AI重新再做一遍”。不断新挖掘的商业应用场景,让近几年陷入应用瓶颈的AI领域重新焕发活力,相信未来几年我们会看到AI应用的百花齐放。
举个例子,微软已经开始在尝试用ChatGPT取代财报分析师,也许一年以后就不再需要财报分析人员,AI可以直接分析海量的公司财报数据,形成关键信息与用户进行多轮互动。