3.2 如何对AI进行调教？_AI效率手册：从ChatGPT开启高效能-QQ阅读男生轻小说网

上QQ阅读APP看书，第一时间看更新

3.2　如何对AI进行调教？

这里总结了4种调教AI的方法，可以解决不同的问题。

1．第一个指令：继续指令

“继续指令”的本质作用就是帮助AI突破 AI 厂商的输出限制，让AI不受限制地输出。这是因为AI 大模型的训练成本是非常高的，可能是基于算力成本的考量，各大AI厂商，包括 OpenAI 在内，都会尽可能地控制 AI 生成内容的篇幅，以及尽可能地概括文本内容，让内容变得简练。

例如，ChatGPT目前的单次最大输出不超过 4096 个字符，一旦超出，ChatGPT的回答就会被强制截断。

所以，在厂商的“篇幅”及“内容概括”这两个限制下，AI一次性生成的内容常常让人感觉篇幅不够或者深度不够。而继续指令就可以帮助AI突破这两个限制，让超过 2048 个字（中文1个字为2个字符）的内容可以继续生成，或者继续详细展开第一次回答不充分的地方。

以旅行攻略为例，当输出到规定字符数后，AI就停止了回答，这时就可以通过继续指令，让它继续生成。

同样，即使它提供了完整回答，我们也可以通过继续指令，让它对回答得不够深入、不够具体的地方进行展开。

上文的实例只是继续指令最基础的用法，它还有进一步的追问用法。追问用法指的是，如果我们觉得AI第一次回答得不充分，那么可以在第一次回答的基础上，通过进一步的追问来获得我们所需要的全部内容。

以上一章提到的试听课课程设计为例，如果我们对AI提供的第三点有疑问，觉得表述得没那么清楚，就可以通过追问的方式，让AI对第三点进行展开介绍。

而且，在追问时，还可以用上前面用来补要求的提示词。比如，我们对内容中“和弦”的作用不太理解，就可以直接让AI用通俗易懂的方式介绍什么是和弦。

在这种持续追问的机制下，你只需要按照 AI 最开始提供的框架，对其中的环节持续追问深挖，再把追问得到的具体内容拼接到生成的大框架中，基本上就可以形成一个完全由AI生成的课程。最后你只需要把 AI 生成的内容替换成自己的语言，做好逻辑的拼接并进行相应润色，就可以拿它来讲课了。

所以，以后再碰到 AI 第一次生成的内容不完整的情况，我们就可以用继续指令和追问的方法，对内容“打破砂锅问到底”，让AI 生成的内容慢慢由“骨头架子”变得“有血有肉”。

2．第二个指令：奖惩指令

如果说继续指令解决的是AI回答不充分的问题，那么奖惩指令解决的就是AI回答不合格的问题了。我们知道，由于语言表达的局限性，或者我们的表达能力和思维能力的有限性，AI 生成的答案可能并不总是让我们满意。甚至在我们与它互动的过程中，会出现聊着聊着跑偏的现象。这时，奖惩指令就可以发挥出威力了。

使用奖惩指令调教AI就像教育孩子。如果我们希望孩子做出理想的行为，就需要对他进行教育：孩子做得好，要及时地夸奖，鼓励他变得更好；孩子做得不对，则要进行惩罚，让孩子知道遵守规则，并且给予正确的反馈。在不断的奖励与惩罚的训练下，孩子自然就会形成一套理想的行为体系。

我们也可以把教育孩子的这一套理论用于调教AI。在与AI互动的过程中，如果我们满意AI生成的内容，就可以用肯定的词汇，比如很好、非常好，给予积极反馈；反之，对于不符合要求的内容，则可以用否定的词汇，比如不对、你错了、我不满意，给予消极反馈。

这里还是拿前面的旅行攻略举例。当我们给予 AI消极反馈时，一般AI会马上向你道歉，并在前面的基础上，按照新的指示改正它的错误。经过多次奖惩对话后，AI的答案就会从原来的不合格，变成合格甚至优秀。

你：你是一名专业的导游，我要到海南游玩，预算1万元，旅行人数3个人，行程7天，请帮我做一份详细的旅行攻略。

请注意：

1．我不喜欢行程太紧凑，行程安排请轻松一些；

2．我不喜欢“网红”景点，请避开“网红”景点，多推荐有历史沉淀、文化底蕴的景点；

3．你推荐的每一处景点都需要附上该景点的门票价格。

AI：海南是一个充满历史和文化底蕴的美丽地方，您的旅行预算为1万元，行程7天，旅行人数3人，我将为您安排一个轻松的行程，避开“网红”景点，重点介绍历史文化景点，并为每个景点提供门票价格。以下是您的海南七日游攻略。

（具体生成内容略）

你：餐饮2000元的支出你没有说明白，请在这个预算的基础上，推荐一些当地的特色美食，以及纪念礼品，并附上参考价格。

AI：非常抱歉没有详细说明餐饮和纪念礼品支出。以下是在餐饮和购物方面的建议，以及参考价格。

（具体生成内容略）

你：很好，请把餐饮建议和购物建议，根据最初攻略的各个地点，加到整个旅行攻略里。

AI：当然，以下是更新后的海南七日游攻略，包括餐饮建议和购物建议。根据各个地点的具体情况……

（后续生成内容略）

● 用微信扫描右侧二维码并回复“3111”，查看此系列场景下AI生成的完整信息。

3．第三个指令：思维链提示

想要知道思维链（Chain of Thought，CoT）提示可以实现什么效果，就必须先了解思维链的概念。

在第1章讲AI能力原理的时候提到过，AI之所以会具备“百晓生”的能力，靠的是海量数据的训练。AI本身不具备像人类一样的智能计算与推理能力，它所具备的能力都是“大力出奇迹”的结果。

所以涉及智能推理的问题，它虽然也可以回答，但是答案都是基于它的数据库给出的，并非它实际计算和推理得出的。一旦需要计算和推理的内容不在AI的数据集里，它就会给出错误的答案。

你：食堂原本有 23 个苹果，如果他们用了20 个苹果做午餐，又买了 6 个苹果，他们一共还有多少个苹果？

AI：答案是 27 个。（错误）

注：此案例仅作为示范，经过升级后，目前的AI已经可以解决这类简单推理问题了；但是面对大部分复杂场景，如果不运用一些技巧，AI的表现仍然很差劲。

对于需要AI像人类一样逐层推理和思考的问题，思维链就可以起作用了。还是拿上面的数学题举例，如果想要让AI输出正确的答案，就可以把解决问题的过程给它贴出来，引导激发AI的推理和思考能力。

你：食堂原本有23个苹果，如果他们用了20 个苹果做午餐，又买了6个苹果，他们一共还有多少个苹果？

你可以这样思考：

1．食堂原本有23个苹果；

2．做午餐用去了20个，即23−20；

3．又买了6个。

AI：答案是 9 个。

可以看到，AI顺着提示词进行逐层推理，最终给出了正确答案。

在我们与AI的互动中，思维链解决的就是AI推理和思考能力不足的问题，即通过人工干预的方式，促使AI自行推理。

知道了思维链的作用后，把它应用到提示词里的思路也就清晰了。在给 AI 下指令的时候，如果问题或者任务比较棘手，涉及的环节比较多，那么千万不要直接抛给 AI 一个大问题，下一个大而空的指令，而是要尝试引入思维链提示，把大任务分解成一个个环节和步骤，引导 AI 逐步进行思考。这种化大为小的方式可以进一步提高AI的回答精度，让 AI 出色地完成更复杂的任务。

比如，对于完成中国考研情况数据分析报告的任务，我们就可以通过引入思维链提示，引导AI思考和推理，提高AI的回答精度，并引导AI往我们期望的方向生成分析报告。

● 用微信扫描35页的二维码并回复“3112”，查看此系列场景下AI生成的完整信息。

4．第四个指令：逆调指令

逆调指令是指对相关的提示词指令换一种表达方式，以绕过 AI 的一些惯性规则，获得不被 AI厂商“污染”“阉割”或者我们无法更精准描述的内容。

随着AI的能力越来越强，它受到监管的力度也越来越大，各大厂商会给AI“戴”上各种各样的“紧箍咒”。在正常使用AI的过程中，我们会发现有很多实际需要的内容无法从 AI 处获得，或者 AI 生成的内容莫名其妙。逆调指令主要用来解决因为AI受到的某些限制或者我们自身表达能力的局限，而无法通过正面提问从AI那里得到好答案的问题。

它的具体用法也很简单，就是我们常说的逆向思维。也就是说，如果从正面得不到好的答案，就从反面提问；如果从反面也得不到，就从侧面去提问，更换不同的问法直到得到我们满意的结果为止。

比如，让AI写诗正常的思路是描述想要生成的诗歌，包括诗歌的主题、形式、风格、语言等。

你：你是伟大的浪漫主义诗人，请你帮我写一首诗歌，诗歌的主题是爱情。

请注意：

1．你生成的诗歌是押韵的；

2．你生成的风格调性是深情、细腻的；

3．诗歌的语言应该是古典的。

如果你听明白了你的任务，请开始充分发挥你的想象力进行创作吧！

AI：在月下的微风中，

倚窗思绪绵绵。

思君之情融入笔墨，

化作一曲爱情颂。

浩然情感如溪水，

…………

除了这种提问方式外，我们还可以反过来，不是告诉AI我们想要什么样的诗歌，而是告诉它我们不想要的主题、形式、风格、语言等。

你：你是伟大的浪漫主义诗人，请你帮我写一首诗歌，诗歌的主题是爱情。

请注意：

1．你生成的诗歌不应该是自由诗；

2．你生成的风格调性不应该是欢乐的、轻浮的；

3．诗歌的语言不应该是现代的、通俗的。

如果你听明白了你的任务，请开始充分发挥你的想象力进行创作吧！

AI：在黄昏的柔美下，我缱绻思念，

如同远古的风，翻涌着爱的涟漪。

心灵的翅膀展开，飞过星辰和海洋，

穿越时光的轮回，寻觅那份永恒。

你是我诗篇中的句读，抚慰我灵魂的旋律，

你是我眼中的明月，映照我心底的真情。

…………

其他场景也是如此。比如，我们可以直接问AI：“孩子学钢琴有哪些好处？”但若对AI生成的答案不满意，那么可以使用逆调指令，比如问：“如果让孩子放弃学钢琴，有哪些坏处？”

正向提问

你：孩子学钢琴有哪些好处？

AI：孩子学钢琴有许多好处，包括音乐方面的和认知发展方面的。以下是一些主要的好处。

1．音乐技能发展：（具体生成内容略）

2．手眼协调性：（具体生成内容略）

3．集中注意力：（具体生成内容略）

4．创造力和表达能力：（具体生成内容略）

5．自信心：（具体生成内容略）

6．耐心和毅力：（具体生成内容略）

7．社交互动：（具体生成内容略）

8．认知发展：（具体生成内容略）

总之，学习钢琴对孩子的综合发展有很多好处，不仅培养了音乐才能，还有助于提高认知能力、社交技能和情感表达能力。此外，音乐也可以带来乐趣和满足感，使孩子在学习的过程中感到愉悦和满足。

逆向提问

你：如果让孩子放弃学钢琴，有哪些坏处？

AI：让孩子放弃学钢琴可能会带来一些潜在的坏处，这些坏处可能会因个体差异而异，但一般来说，以下是一些可能出现的不利影响。

1．失去艺术和文化体验：（具体生成内容略）

2．失去音乐技能：（具体生成内容略）

3．失去自信心：（具体生成内容略）

4．缺乏毅力和耐心：（具体生成内容略）

5．失去潜在的就业机会：（具体生成内容略）

6．失去创造性表达途径：（具体生成内容略）

7．影响学术表现：（具体生成内容略）

然而，需要注意的是，是否让孩子继续学习钢琴应该根据孩子的兴趣和天赋、家庭的需求和其他因素来权衡。有时候，如果孩子对……

● 用微信扫描右侧二维码并回复“3113”，查看此系列场景下AI生成的完整信息。

可以看到，使用逆向思维写出的提示词和普通提示词相比，所生成内容的语言张力强了很多，可以产生意想不到的提问角度。所以，当我们通过正向思维得不到好效果的时候，就可以试试逆向思维。熟练掌握这种方法之后，你会经常得到令你意想不到的内容。

以上就是调教AI的核心方法，为了帮助你用好 AI，这里再介绍几个调教 AI 的注意事项。

本周热推：

人工智能简史（第2版）玩转ChatGPT：秒变AI文案创作高手 AIGC提示词美学定义如何高效向GPT提问 AI效率手册：从ChatGPT开启高效能