引言

常常我们会碰到这种问题,当我们想要ai实现要求时,往往无法达到我们想要的要求,这就涉及了提示词的使用了。

简单介绍

在大型语言模型或LLM的开发中,大体上有两种类型的LLM,我将其称为Base LLM 和 Instruction Tuned LLM.下面分别进行介绍:

  • Base LLM: 从互联网直接抓取了大量文本数据进行训练,可以回答一下基础的问题,可以根据已知的信息,为了回答或是续写后面的内容,例如你问“法国的首都是什么?” ,它会回答“巴黎” ,这种信息都可以从互联网中搜集得到。但其也有可能回答错误,或是不知道。
  • Instruction Tuned LLM(经过指令调整后的LLM): 其根据用户输入的指令,以及回答的反馈进行优化,也就是被称为RLHF(人类反馈强化学习技术)进一步进行细化,更加符合具体的场景,还可以考虑到安全,回答的无害性,这种LLM将来更符合生产或是使用场景。

由于经过指令调整后的LLM, 其刻意被训练为有用的,无害的(无害可以理解为错误的回答以及进行不良的行为示范)模型,很多实际应用场景渐渐开始向指令调整后的LLM转移,因此,建议大多数人应该专注于经过指令调整后的LLM。

指南

原则一:编写清晰而具体的指令

应该使用尽可能清晰和具体的指令来表达希望执行的操作,这会引导模型给出正确的输出,减少你得到的无关的响应。但注意清晰不等于简短的指令,有时候更长的提示也有利于更详细和相关的输出。

  • 策略一:使用分隔符不同的输入中的不同部分—目的是可以避免提示注入
  • 策略二:要求结构化的输出—更好地被解析,例如HTML格式。JSON格式等
  •  策略三:要求模型检查是否满足条件—模型解决的任务中假设条件不一定满足,可以让模型先检查这些假设,如果不满足假设,可以直接让其停止执行。自查方式
  •  策略四:提供少量示例

原则二:给模型充足的思考时间

提供足够耐心去等待模型思考,如果中途停止,可能导致模型也带上错误理解执行下去。

策略一:指定完成任务所需的步骤-将一个任务拆分后逐步提交给模型实现

策略二:指导模型得出结论前自己制定一个解决方案-最好有个基本方案,明确指导模型在做出结论之前自行推理出解决方案,会得到更好的结果,这和之前提到的给模型时间思考问题,是一致的解决思路

策略三:模型的局限性-其实他也会骗人,因为无法分清网络的真假出现幻觉(可能会虚构听起来很有道理但实际上不正确的东西),所以我们通常做的是误差分析,找到其中不太合理的地方。

迭代

使用ChatGPT等大模型进行提问时,一次尝试就找到了最好的答案是不太可能的。我们通常做的是误差分析,找到其中不太合理的地方,进行改进。所以说如果第一次提示得到的回复不好,应该进行迭代,改进提示,直到是自己满意的结果,即改进的过程才是最重要的。

在迭代过程中一般碰到以下两个问题:

  • 问题一:上述生成的文本长度过长-我们喜欢将所有问题一次性给模型,导致模型理解错误,也就是消化不良,导致回答不如人意。实际上,大模型使用了一种分词器(tokenizer)
  • 问题二:描述的角度不对-当我们描述问题时容易造成对象的错误,比如我是作者角度想它以读者回答,但是它却以编辑角度回答,这就造成理解上的错误,从而导致回答也会偏颇。

总结:使用者需要先尝试编写提示,然后通过迭代逐步完善它,直至得到需要的结果。

摘要

LLM最有效的应用之一是使用它来概括或总结文本。

  • 总结的字数大小,侧重角度
  • 注意 "总结"和"提取"的区别

总结需理解原文语义并重新组织语言生成浓缩内容,保留核心信息的同时可能改变表述方式。提取直接挑选原文中的关键句子或片段,不改变原始表达形式。总结更适合需要可读性输出的场景,提取更注重信息保真度。

推理

文本推理可以理解为这样的一个任务,模型接收文本作为输入并进行某种分析的任务,例如提取对应的标签,提取关键名称,理解文本的情感等等。

下面就 文本推理对应的子任务进行说明;

  • 文本情感分析- 首先初步判断情感方向(正面,负面),然后分析情感类型
  • 信息抽取-在文本中抽取你想要的相关信息,一般会进行联想推理(如果进行了联网处理)
  • 主题推断-给定一段长文本,需要知道该篇文章是关于什么的?有哪些主题?

转换

  • 大型语言模型非常擅长将输入转换成不同的格式,例如将一段文本从一种语言输入并将其转换或翻译成另一种语言,或者帮助进行拼写和语法纠正,因此将可能不完全符合语法的文本作为输入,并帮助您稍微修正一下,甚至转换格式,例如将HTML输入并输出JSON。
  • 文本翻译-不仅将从未认识的文本翻译过来,甚至可以进行多语言翻译。
  • 语气或风格的调整-即使是同样的内容也会根据受众而有所调整。
  • 格式转换-ChatGPT非常擅长不同格式之间的转换,例如从JSONHTML, XML,Markdown等。
  • 拼写和语法检查-拼写和语法检查是一个比较LLM中一个比较实用的功能,如果要将自己的文章正式发表到公共场合中,特别是学术论文,专业报告,报纸期刊

扩展

文本扩展(Expanding)是将短文本例如仅仅是一组说明或主题列表,输入到LLM中,从而生成更长的文本,还可以是基于某个主题直接生成一篇文章。

  • 定制回复-通过文本推理(inferrring)可以判断该评论的情感属性,是消极的。接着就根据其情感属性和内容为该客户定制邮件进行回复。
  • 使用温度系数(temperture)增加随机性-temperture是模型中可指定的一个参数,其可以改变模型回复内容的多样性,也就是说该参数可以视为模型探索性或者生成随机的程度

  官方使用建议:  

 对于需要可靠性,要求回复内容在自己的预测范围内的,例如业务问题,咨询的专业问题等,可以设置temperature=0,或者尽量设置小一点的值;

对于生成的内容有多样性,创新性要求的,例如续写,诗歌创作等,可以尽量将Temperature值设置的高一些,例如大于0.5; 

聊天

ChatGPT提供的是一个Web界面,即有一个交互式的聊天界面。但是也可使用LLM构建一个自定义的聊天机器人,例如AI客户代理或AI点餐员等角色。注意的是,需要将聊天过程中的输入与响应都保存到上下文中,才能不断进行下去。

总结

 就是将以往的问ai方式进行规划,补充相关的基础知识。现在如果想去除模型的人机味,其实来一句“说人话,通俗点”都能理解了

吴恩达-提示词工程http://【【吴恩达】2025年公认最好的【提示词工程】教程!大模型入门到进阶,一套全解决!Prompt Engineering-附带课件代码】 https://www.bilibili.com/video/BV1173jzNELG/?share_source=copy_web&vd_source=71bd2963f8d8ac75ebb217d0cf923dd9

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐