1.3 生成式AI带来的降维打击
1.ChatGPT与AIGC
在过去的十年里,人工智能技术取得了显著的进步。从AlphaGo击败围棋世界冠军李世石,到图像识别、语音识别和机器翻译等技术的成熟,AI技术已然渗透到了各个领域。然而,ChatGPT的问世标志着AI技术又一次有了重大突破。
要了解这个突破,需要先从了解AIGC(AI Generated Content,人工智能生成内容)说起。
AIGC的本质是包括文字、图片、音频、视频等多种形式的内容生产,其生产的方式是通过人工智能自动完成的。与传统的判别式AI(偏重识别能力)不同,AIGC作为新生代生成式AI,具备了一定程度的认知能力和创造力,能够处理更加复杂的场景,并且支持自然语言对话场景下的交互。
通俗地说,判别式AI的智能体现在“能听会看”,它擅长识别和分类输入的信息。而最新的生成式AI的智能则体现在“能说会写”,这意味着它不仅仅具有被动接受和判别信息的能力,更拥有主动创作和表达的能力。
判别式AI与生成式AI的不同之处
从原理到应用,ChatGPT作为生成式AI的代表,与传统的判别式AI有着根本的区别:
(1)ChatGPT模型的训练采用自我监督学习、强化学习。自我监督学习的方式,是指通过大量的文本数据进行训练,使其能够生成准确的预测;人类反馈的强化学习(RLHF)[4]则强调通过真实的语境和人的反馈,对机器的学习进行优化,输出更合适、更精准的回应。
(2)ChatGPT展示了更高维度的内容生产能力。这表现在ChatGPT不仅能理解和回答问题,还能生成新的建议。对于ChatGPT具备的这种突破性能力,我们分别从“GPT”和“Chat”这两个词背后的意思来进一步解释。
2.GPT:能力升级,从被动判别到主动创造
如前文所述,判别式AI主要专注于识别和分类。举个例子,我们将一张宠物照片录入,判别式AI会识别图像中的宠物种类、颜色等,而录入一段语音,也可以将其转换为文字。然而,GPT作为生成式AI的代表,它的主要特点在于创造性的内容生成能力。
这种能力的提升,使得AI从一个被动的工具变成了一个更加主动、能提供交互式服务的创造者。
在多段对话场景的交互中,生成式AI能够精准理解上下文是否隶属同一个主题,即便是一些诸如“能展开说说吗?”“能举个例子吗?”之类的表达,它也可以使得到的回复不偏离前面的对话场景与内容。
ChatGPT理解上下文的能力
在这段对话中,第一个问题提到了“昆明”,因此在第二个问题中,即使没有明确指定昆明有哪些美食,ChatGPT依然识别出了我们讨论的背景是“昆明”。
ChatGPT模糊提问的功能
“能展开说说吗?”这句话本身是一个较为模糊的问题,ChatGPT依然给出了令人期待的回答。它能识别出“展开说说”的对象是上文对话中的“过桥米线、香辣烤鱼、鲜花饼”。这种上下文理解能力,使得我们与它的对话体验非常接近真人沟通。
3.Chat:交互革新,从专用人工智能迈向通用人工智能
“Chat”,即聊天的意思,代表了AI交互模式的革新。
在过去,AI系统主要依赖于复杂的机器语言进行交互,这对普通用户来说是极具挑战性的。在ChatGPT出现之前,想要充分利用AI的强大能力,用户必须进行大量的技术性工作,包括数据处理、模型训练、模型部署以及API接口调用等。这些工作需要用户拥有丰富的编程和开发知识,这对大多数非技术背景的人来说,是一项巨大的学习负担,而这也导致了技术普及受阻。
然而,不同于机器语言交互,ChatGPT采取的是自然语言交互,用户不必通过再学习,就可通过日常对话获取所需的信息。要达到这种普及程度,ChatGPT的交互能力需要兼顾三个重要的方面。
1)地域普及程度提升
ChatGPT几乎支持全球50多种语言的输入,是一个大型的智能语言模型。正是因为这种多语言之间无缝切换的功能,其普及程度大大提高,受众群体突破了区域性的限制。从这个维度来看,ChatGPT在跨地区语言交流和翻译过程中,给人们提供了很多核心竞争力。
(1)即时性。用户可以与ChatGPT对话,实现语言的实时翻译,无论是通过App的口头语言转录还是书面文本,这种即时性基本上可以理解为随身携带了一位同声传译,帮助用户跨国旅行或进行商务和跨文化的沟通。
(2)多语言转换。ChatGPT支持多语言的翻译任务,以满足用户多样化场景的需求。这在很大程度上提升了内容从生产到跨语种转换的效率,最大化内容推广的可及性。
(3)文化适应性。鉴于ChatGPT积累的海量资料和学习算力,一些文化的差异和习惯用语也在翻译和运用的过程中更加准确。它能够帮助用户减少误解和歧义,使其表达更加自然和容易被理解。
ChatGPT的多语言能力
2)指令容错率提升
对于口语化和非正式的表达,ChatGPT具有很强的理解能力和较高的容错率。对于语气助词、模糊字词的表述,ChatGPT能够站在“类人”的语境中,精准理解其含义,为表达者降低被误解的概率。
ChatGPT对于模糊表达的推断理解能力
3)自然语言交互
ChatGPT打破了人类语言与机器编程语言的壁垒,用自然语言完成了人机交互的可能。
这意味着,无论是编程高手,还是对编程一窍不通的普通用户,都可以通过自然语言与AI进行有效沟通,完成各种复杂任务。这种从专用模型到通用模型的转变,打破了特有技术的高壁垒,使得普通的用户经过简单的培训,也可拥有私人定制的AI助手。
[1] Turing A M. Computing machinery and intelligence[J]. The Essential Turing:the Ideas That Gave Birth to the Computer Age,2012:433-464.
[2] OpenAI由Elon Musk(伊隆·马斯克)、Sam Altman(山姆·阿尔特曼)等人于2015年12月11日创立,总部位于美国旧金山。
[3] 周鸿祎.万字长文|周鸿祎谈ChatGPT:六大观点、四大挑战、两大预测、一大战略[EB/OL].(2023-04-16)[2023-07-13].https://mp.weixin.qq.com/s/olG5wGuB2Aki5oJydAQt5ww.
[4] 人类反馈的强化学习是一种机器学习方法。其中,人类指导或反馈被用来帮助AI系统做出更好的决策。简单来说,就像是在AI训练过程中引入了一位人类教练。