3.2 如何对AI进行调教?
这里总结了4种调教AI的方法,可以解决不同的问题。
1.第一个指令:继续指令
“继续指令”的本质作用就是帮助AI突破 AI 厂商的输出限制,让AI不受限制地输出。这是因为AI 大模型的训练成本是非常高的,可能是基于算力成本的考量,各大AI厂商,包括 OpenAI 在内,都会尽可能地控制 AI 生成内容的篇幅,以及尽可能地概括文本内容,让内容变得简练。
例如,ChatGPT目前的单次最大输出不超过 4096 个字符,一旦超出,ChatGPT的回答就会被强制截断。
所以,在厂商的“篇幅”及“内容概括”这两个限制下,AI一次性生成的内容常常让人感觉篇幅不够或者深度不够。而继续指令就可以帮助AI突破这两个限制,让超过 2048 个字(中文1个字为2个字符)的内容可以继续生成,或者继续详细展开第一次回答不充分的地方。
以旅行攻略为例,当输出到规定字符数后,AI就停止了回答,这时就可以通过继续指令,让它继续生成。
同样,即使它提供了完整回答,我们也可以通过继续指令,让它对回答得不够深入、不够具体的地方进行展开。
上文的实例只是继续指令最基础的用法,它还有进一步的追问用法。追问用法指的是,如果我们觉得AI第一次回答得不充分,那么可以在第一次回答的基础上,通过进一步的追问来获得我们所需要的全部内容。
以上一章提到的试听课课程设计为例,如果我们对AI提供的第三点有疑问,觉得表述得没那么清楚,就可以通过追问的方式,让AI对第三点进行展开介绍。
而且,在追问时,还可以用上前面用来补要求的提示词。比如,我们对内容中“和弦”的作用不太理解,就可以直接让AI用通俗易懂的方式介绍什么是和弦。
在这种持续追问的机制下,你只需要按照 AI 最开始提供的框架,对其中的环节持续追问深挖,再把追问得到的具体内容拼接到生成的大框架中,基本上就可以形成一个完全由AI生成的课程。最后你只需要把 AI 生成的内容替换成自己的语言,做好逻辑的拼接并进行相应润色,就可以拿它来讲课了。
所以,以后再碰到 AI 第一次生成的内容不完整的情况,我们就可以用继续指令和追问的方法,对内容“打破砂锅问到底”,让AI 生成的内容慢慢由“骨头架子”变得“有血有肉”。
2.第二个指令:奖惩指令
如果说继续指令解决的是AI回答不充分的问题,那么奖惩指令解决的就是AI回答不合格的问题了。我们知道,由于语言表达的局限性,或者我们的表达能力和思维能力的有限性,AI 生成的答案可能并不总是让我们满意。甚至在我们与它互动的过程中,会出现聊着聊着跑偏的现象。这时,奖惩指令就可以发挥出威力了。
使用奖惩指令调教AI就像教育孩子。如果我们希望孩子做出理想的行为,就需要对他进行教育:孩子做得好,要及时地夸奖,鼓励他变得更好;孩子做得不对,则要进行惩罚,让孩子知道遵守规则,并且给予正确的反馈。在不断的奖励与惩罚的训练下,孩子自然就会形成一套理想的行为体系。
我们也可以把教育孩子的这一套理论用于调教AI。在与AI互动的过程中,如果我们满意AI生成的内容,就可以用肯定的词汇,比如很好、非常好,给予积极反馈;反之,对于不符合要求的内容,则可以用否定的词汇,比如不对、你错了、我不满意,给予消极反馈。
这里还是拿前面的旅行攻略举例。当我们给予 AI消极反馈时,一般AI会马上向你道歉,并在前面的基础上,按照新的指示改正它的错误。经过多次奖惩对话后,AI的答案就会从原来的不合格,变成合格甚至优秀。
你:你是一名专业的导游,我要到海南游玩,预算1万元,旅行人数3个人,行程7天,请帮我做一份详细的旅行攻略。
请注意:
1.我不喜欢行程太紧凑,行程安排请轻松一些;
2.我不喜欢“网红”景点,请避开“网红”景点,多推荐有历史沉淀、文化底蕴的景点;
3.你推荐的每一处景点都需要附上该景点的门票价格。
AI:海南是一个充满历史和文化底蕴的美丽地方,您的旅行预算为1万元,行程7天,旅行人数3人,我将为您安排一个轻松的行程,避开“网红”景点,重点介绍历史文化景点,并为每个景点提供门票价格。以下是您的海南七日游攻略。
(具体生成内容略)
你:餐饮2000元的支出你没有说明白,请在这个预算的基础上,推荐一些当地的特色美食,以及纪念礼品,并附上参考价格。
AI:非常抱歉没有详细说明餐饮和纪念礼品支出。以下是在餐饮和购物方面的建议,以及参考价格。
(具体生成内容略)
你:很好,请把餐饮建议和购物建议,根据最初攻略的各个地点,加到整个旅行攻略里。
AI:当然,以下是更新后的海南七日游攻略,包括餐饮建议和购物建议。根据各个地点的具体情况……
(后续生成内容略)
● 用微信扫描右侧二维码并回复“3111”,查看此系列场景下AI生成的完整信息。
3.第三个指令:思维链提示
想要知道思维链(Chain of Thought,CoT)提示可以实现什么效果,就必须先了解思维链的概念。
在第1章讲AI能力原理的时候提到过,AI之所以会具备“百晓生”的能力,靠的是海量数据的训练。AI本身不具备像人类一样的智能计算与推理能力,它所具备的能力都是“大力出奇迹”的结果。
所以涉及智能推理的问题,它虽然也可以回答,但是答案都是基于它的数据库给出的,并非它实际计算和推理得出的。一旦需要计算和推理的内容不在AI的数据集里,它就会给出错误的答案。
你:食堂原本有 23 个苹果,如果他们用了20 个苹果做午餐,又买了 6 个苹果,他们一共还有多少个苹果?
AI:答案是 27 个。(错误)
注:此案例仅作为示范,经过升级后,目前的AI已经可以解决这类简单推理问题了;但是面对大部分复杂场景,如果不运用一些技巧,AI的表现仍然很差劲。
对于需要AI像人类一样逐层推理和思考的问题,思维链就可以起作用了。还是拿上面的数学题举例,如果想要让AI输出正确的答案,就可以把解决问题的过程给它贴出来,引导激发AI的推理和思考能力。
你:食堂原本有23个苹果,如果他们用了20 个苹果做午餐,又买了6个苹果,他们一共还有多少个苹果?
你可以这样思考:
1.食堂原本有23个苹果;
2.做午餐用去了20个,即23−20;
3.又买了6个。
AI:答案是 9 个。
可以看到,AI顺着提示词进行逐层推理,最终给出了正确答案。
在我们与AI的互动中,思维链解决的就是AI推理和思考能力不足的问题,即通过人工干预的方式,促使AI自行推理。
知道了思维链的作用后,把它应用到提示词里的思路也就清晰了。在给 AI 下指令的时候,如果问题或者任务比较棘手,涉及的环节比较多,那么千万不要直接抛给 AI 一个大问题,下一个大而空的指令,而是要尝试引入思维链提示,把大任务分解成一个个环节和步骤,引导 AI 逐步进行思考。这种化大为小的方式可以进一步提高AI的回答精度,让 AI 出色地完成更复杂的任务。
比如,对于完成中国考研情况数据分析报告的任务,我们就可以通过引入思维链提示,引导AI思考和推理,提高AI的回答精度,并引导AI往我们期望的方向生成分析报告。
● 用微信扫描35页的二维码并回复“3112”,查看此系列场景下AI生成的完整信息。
4.第四个指令:逆调指令
逆调指令是指对相关的提示词指令换一种表达方式,以绕过 AI 的一些惯性规则,获得不被 AI厂商“污染”“阉割”或者我们无法更精准描述的内容。
随着AI的能力越来越强,它受到监管的力度也越来越大,各大厂商会给AI“戴”上各种各样的“紧箍咒”。在正常使用AI的过程中,我们会发现有很多实际需要的内容无法从 AI 处获得,或者 AI 生成的内容莫名其妙。逆调指令主要用来解决因为AI受到的某些限制或者我们自身表达能力的局限,而无法通过正面提问从AI那里得到好答案的问题。
它的具体用法也很简单,就是我们常说的逆向思维。也就是说,如果从正面得不到好的答案,就从反面提问;如果从反面也得不到,就从侧面去提问,更换不同的问法直到得到我们满意的结果为止。
比如,让AI写诗正常的思路是描述想要生成的诗歌,包括诗歌的主题、形式、风格、语言等。
你:你是伟大的浪漫主义诗人,请你帮我写一首诗歌,诗歌的主题是爱情。
请注意:
1.你生成的诗歌是押韵的;
2.你生成的风格调性是深情、细腻的;
3.诗歌的语言应该是古典的。
如果你听明白了你的任务,请开始充分发挥你的想象力进行创作吧!
AI:在月下的微风中,
倚窗思绪绵绵。
思君之情融入笔墨,
化作一曲爱情颂。
浩然情感如溪水,
…………
除了这种提问方式外,我们还可以反过来,不是告诉AI我们想要什么样的诗歌,而是告诉它我们不想要的主题、形式、风格、语言等。
你:你是伟大的浪漫主义诗人,请你帮我写一首诗歌,诗歌的主题是爱情。
请注意:
1.你生成的诗歌不应该是自由诗;
2.你生成的风格调性不应该是欢乐的、轻浮的;
3.诗歌的语言不应该是现代的、通俗的。
如果你听明白了你的任务,请开始充分发挥你的想象力进行创作吧!
AI:在黄昏的柔美下,我缱绻思念,
如同远古的风,翻涌着爱的涟漪。
心灵的翅膀展开,飞过星辰和海洋,
穿越时光的轮回,寻觅那份永恒。
你是我诗篇中的句读,抚慰我灵魂的旋律,
你是我眼中的明月,映照我心底的真情。
…………
其他场景也是如此。比如,我们可以直接问AI:“孩子学钢琴有哪些好处?”但若对AI生成的答案不满意,那么可以使用逆调指令,比如问:“如果让孩子放弃学钢琴,有哪些坏处?”
正向提问
你:孩子学钢琴有哪些好处?
AI:孩子学钢琴有许多好处,包括音乐方面的和认知发展方面的。以下是一些主要的好处。
1.音乐技能发展:(具体生成内容略)
2.手眼协调性:(具体生成内容略)
3.集中注意力:(具体生成内容略)
4.创造力和表达能力:(具体生成内容略)
5.自信心:(具体生成内容略)
6.耐心和毅力:(具体生成内容略)
7.社交互动:(具体生成内容略)
8.认知发展:(具体生成内容略)
总之,学习钢琴对孩子的综合发展有很多好处,不仅培养了音乐才能,还有助于提高认知能力、社交技能和情感表达能力。此外,音乐也可以带来乐趣和满足感,使孩子在学习的过程中感到愉悦和满足。
逆向提问
你:如果让孩子放弃学钢琴,有哪些坏处?
AI:让孩子放弃学钢琴可能会带来一些潜在的坏处,这些坏处可能会因个体差异而异,但一般来说,以下是一些可能出现的不利影响。
1.失去艺术和文化体验:(具体生成内容略)
2.失去音乐技能:(具体生成内容略)
3.失去自信心:(具体生成内容略)
4.缺乏毅力和耐心:(具体生成内容略)
5.失去潜在的就业机会:(具体生成内容略)
6.失去创造性表达途径:(具体生成内容略)
7.影响学术表现:(具体生成内容略)
然而,需要注意的是,是否让孩子继续学习钢琴应该根据孩子的兴趣和天赋、家庭的需求和其他因素来权衡。有时候,如果孩子对……
● 用微信扫描右侧二维码并回复“3113”,查看此系列场景下AI生成的完整信息。
可以看到,使用逆向思维写出的提示词和普通提示词相比,所生成内容的语言张力强了很多,可以产生意想不到的提问角度。所以,当我们通过正向思维得不到好效果的时候,就可以试试逆向思维。熟练掌握这种方法之后,你会经常得到令你意想不到的内容。
以上就是调教AI的核心方法,为了帮助你用好 AI,这里再介绍几个调教 AI 的注意事项。