大模型-提示工程
本文系统介绍了大语言模型(LLM)的类型与使用方法,重点对比了基础大模型(基于概率预测)和指令微调模型(通过RLHF优化)的差异。详细阐述了ChatGPT提问的两大核心原则:1)编写清晰具体的指令(使用分隔符、结构化输出等技巧);2)给予模型思考时间(分步推理等)。同时介绍了温度参数、角色权重等接口设置,并提供了总结、推断等5种典型应用场景。
知识框架

内容详介
大语言模型(Large Language Models)
分为两种:基础大预言模型(Base LLM)、指令微调大语言模型(Instruction Tuned LLM)。
基础大预言模型:基于训练数据的统计概率,给出上文预测下文
指令微调大语言模型:使用RLHF(Reinforcement Learning Human Feedback)技术微调,让模型根据命令给出回答
示例:给出问题-法国的首都在哪里?
回答:
- 基础大预言模型:法国最大的城市是什么?
- 指令微调大语言模型:法国的首都在巴黎
ChatGPT提问的原则
原则1:编写具体清晰的指令
原则2:给ChatGPT思考的时间
原则1
有如下的4个技巧:
1)使用分割符
三个引号"""、三个反斜杠、三个横杠---、尖括号<>、XML标签<tag></tag>
2)要求模型给出结构化输出
输出JSON格式
输出HTML格式
3)检查条件是否满足
告诉ChatGPT边界条件,以及此时应该如何处理
4)给出示例(Few-shot prompting)
给出一两个例子,让ChatGPT学习如何回答
原则2
有如下的4个技巧:
1)让ChatGPT按照步骤给出思考过程:给出实现步骤
2)让ChatGPT给出结论之前先自己思考一下
提示工程的循环迭代
迭代过程
ChatGPT的使用举例
1、总结:给定文本按照要求总结
2、推断:情感识别、推断对话讨论的主题
3、转换:多语种翻译、拼写和语法检查和改写
4、扩展:按照要求续写、创作
5、聊天机器人
ChatGPT接口的重要参数
1、Temperature
取值为0~1,决定ChatGPT回答的随机性
2、Role
ChatGPT在处理信息时候的权重:System < Assistant < User
System:系统预置的信息,就像在ChatGPT耳边不断低语,通常用户不可见
Assistant:ChatGPT回复的信息
User:用户发送的信息
结尾
亲爱的读者朋友:感谢您在繁忙中驻足阅读本期内容!您的到来是对我们最大的支持❤️
正如古语所言:"当局者迷,旁观者清"。您独到的见解与客观评价,恰似一盏明灯💡,能帮助我们照亮内容盲区,让未来的创作更加贴近您的需求。
若此文给您带来启发或收获,不妨通过以下方式为彼此搭建一座桥梁: ✨ 点击右上角【点赞】图标,让好内容被更多人看见 ✨ 滑动屏幕【收藏】本篇,便于随时查阅回味 ✨ 在评论区留下您的真知灼见,让我们共同碰撞思维的火花
我始终秉持匠心精神,以键盘为犁铧深耕知识沃土💻,用每一次敲击传递专业价值,不断优化内容呈现形式,力求为您打造沉浸式的阅读盛宴📚。
有任何疑问或建议?评论区就是我们的连心桥!您的每一条留言我都将认真研读,并在24小时内回复解答📝。
愿我们携手同行,在知识的雨林中茁壮成长🌳,共享思想绽放的甘甜果实。下期相遇时,期待看到您智慧的评论与闪亮的点赞身影✨!
万分感谢🙏🙏您的点赞👍👍、收藏⭐🌟、评论💬🗯️、关注❤️💚~
自我介绍:一线互联网大厂资深算法研发(工作6年+),4年以上招聘面试官经验(一二面面试官,面试候选人400+),深谙岗位专业知识、技能雷达图,已累计辅导15+求职者顺利入职大中型互联网公司。熟练掌握大模型、NLP、搜索、推荐、数据挖掘算法和优化,提供面试辅导、专业知识入门到进阶辅导等定制化需求等服务,助力您顺利完成学习和求职之旅(有需要者可私信联系)
友友们,自己的知乎账号为“快乐星球”,定期更新技术文章,敬请关注!
更多推荐

所有评论(0)