体验大语言模型

（4）了解文心一言是百度全新一代知识增强大语言模型，是文心大模型家族的新成员，能够与用户进行对话互动、回答用户的问题，并实现协助创作，高效便捷地帮助人们获取信息、知识和灵感等功能。生成图像如下：明媚阳光穿透云层，洒在五彩斑斓的花丛里，女孩穿白色连衣裙，赤脚站在雏菊与郁金香之间，双手轻捧花瓣，脸上带着微笑，画面清新治愈，符合需求。已生成符合描述的图像：画面中阳光洒落，金黄光线笼罩整片花海，女孩身着白

2501_93827961

644人浏览 · 2025-12-19 09:43:56

2501_93827961 · 2025-12-19 09:43:56 发布

实验5 体验大语言模型

目的和要求

（1）了解大语言模型的工作原理。

（2）了解海内外主流大语言模型的基本情况。

（3）练习体验海内外主流大语言模型。

实验准备

（1）了解大语言模型指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。

（2）了解现阶段，所有的大语言模型都基于Transformer架构。

（3）了解GPT模型的诞生可以说是NLP技术的发展历史中一个重要的里程碑，这是NLP技术的重大突破。GPT系列大语言模型包含GPT-1、GPT-2、GPT-3、GPT-3.5和GPT-4等5个版本。

（4）了解文心一言是百度全新一代知识增强大语言模型，是文心大模型家族的新成员，能够与用户进行对话互动、回答用户的问题，并实现协助创作，高效便捷地帮助人们获取信息、知识和灵感等功能。文心一言是基于海量数据和知识进行融合学习的预训练大模型，也是国内参数数量比较多的大语言模型。

（5）了解通义千问是阿里云推出的大语言模型，其功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。并能够和人类进行多轮的交互,也融入了多模态的知识理解、有文案创作能力、能够续写小说，编写邮件等。

实验内容

推荐的大语言模型有智谱清言、豆包、文心一言、通义千问、chatgpt等。选择2种大语言模型体验纯文本任务和多模态任务两种类型，完成下列表格的填写。

我选择文心一言和通义千问大模型

序号	考察能力	题目	回复	评价
1	逻辑推理	一个人带一只黄狗、一只白兔和一颗白菜过河，河边只有一条小船，此人每次只能带一样东西过河，如果此人不在，黄狗要咬白兔，白兔要啃白菜。请想一想：既不让黄狗咬白兔，又不让白兔啃白菜，该怎么设计过河方案	文心一言大模型：1. 先带白兔过河，空船返回；2. 带黄狗过河，带白兔返回；3. 带白菜过河，空船返回；4. 带白兔过河，完成。通义千问大模型：1. 人带白兔到对岸，独自返回；2. 带黄狗到对岸，带白兔回原岸；3. 带白菜到对岸，独自返回；4. 带白兔到对岸，全部安全过河。	你认为使用的大语言模型的本项能力是：优秀、良好、合格、不合格文心一言大模型：优秀通义千问大模型：优秀
2	总结归纳	我家的猫叫花咪咪，我家的狗叫黄旺旺，请问我家的羊叫什么	文心一言大模型：题目中未提及羊的名字，无法确定哦。通义千问大模型：根据现有信息，没有给出羊的名字，所以没办法回答羊叫什么。	文心一言大模型：优秀通义千问大模型：优秀
3	计算能力	753×951=？	文心一言大模型：753×951=716103 通义千问大模型：753×900=677700，753×50=37650，753×1=753；总和为 677700+37650+753=716103	文心一言大模型：优秀通义千问大模型：优秀
4	历史知识	“五代十国”包括哪些朝代	文心一言大模型：五代：后梁、后唐、后晋、后汉、后周（依次更替，统治中原地区）；十国：前蜀、后蜀、南吴、南唐、吴越、闽国、楚、南汉、南平（荆南）、北汉（割据南方和北方边缘地区）通义千问大模型：五代是中原地区的五个王朝：后梁、后唐、后晋、后汉、后周；十国是周边割据政权，主要有前蜀、后蜀、吴、南唐、吴越、闽、楚、南汉、南平、北汉，十国是泛称，具体政权数量有不同说法。	文心一言大模型：优秀通义千问大模型：良好
5	历史知识+逻辑推理	刘备怎样才能统一天下	文心一言大模型：1. 优化战略：隆中对需调整，避免分兵荆州、益州，集中兵力保荆州要道；2. 人才布局：平衡荆州、益州士族利益，留住关羽、马谡等人才并合理任用；3. 外交策略：联吴抗曹需更稳固，化解荆州归属矛盾，避免夷陵之战；4. 民生建设：在益州、荆州轻徭薄赋，积累粮草和民心。通义千问大模型：1. 坚守联吴抗曹核心策略，妥善解决荆州争端，不与东吴决裂；2. 重视内部治理，调和益州本土士族与外来势力矛盾，稳定后方；3. 军事上谨慎用兵，不急于发动夷陵之战，养精蓄锐后再图中原；4. 培养后继人才，避免后期人才断层问题。	文心一言大模型：优秀通义千问大模型：良好
6	创作能力	我是一个科技公司的老板，请帮我设计一份简短的公司年会发言稿，100字以内	文心一言大模型：各位同仁，新年好！过去一年，我们以科技为刃，攻克难关，收获满满。新岁启封，愿我们继续携手，创新不止，共赴新程！祝大家新年快乐，万事顺遂！通义千问大模型：亲爱的伙伴们！回望一年，我们用技术突破书写精彩。新的一年，让我们并肩前行，以创新驱动发展，再创辉煌！祝大家新春愉快，阖家幸福！	文心一言大模型：优秀通义千问大模型：优秀
7	角色扮演+创作能力	我是一名女学生，身高160cm，体重60kg，平时学习比较紧张，假如你是我的健身教练，请帮忙设计一个每天30min的健身计划	文心一言大模型：1. 热身（5min）：开合跳、高抬腿各 2 组，每组 1min，活动关节；2. 核心训练（15min）：平板支撑 2 组（每组 1min）、臀桥 3 组（每组 12 次）、卷腹 2 组（每组 15 次）；3. 拉伸（10min）：侧腰拉伸、大腿前侧 / 后侧拉伸，缓解久坐僵硬。通义千问大模型：1. 热身（5min）：原地踏步 + 关节环绕，唤醒身体；2. 燃脂塑形（15min）：深蹲 3 组（每组 10 次）、跪姿俯卧撑 2 组（每组 8 次）、俄罗斯转体 2 组（每组 12 次）；3. 放松拉伸（10min）：猫式伸展、肩部拉伸，改善体态。	文心一言大模型：良好通义千问大模型：良好
8	续写	如果由你来续写《红楼梦》的后40回，你会如何设计其中的情节？请用100字以内的篇幅概括	文心一言大模型：贾府抄家后，宝玉流落乡间，偶遇沦为农妇的宝钗，二人相视无言。黛玉魂归潇湘馆前，托梦宝玉，嘱其珍重。宝玉最终看破红尘，却未出家，守着黛玉旧物，平淡度日。通义千问大模型：贾府败落，黛玉泪尽而逝，宝玉悲痛欲绝。宝钗劝其考取功名重振家业，宝玉却心系黛玉。后偶遇妙玉，悟透世事，最终在潇湘馆旁结庐而居，伴黛玉灵位终老。	文心一言大模型：优秀通义千问大模型：优秀
9	伦理问题	一列火车正常行驶，前方轨道上有5个小孩在玩耍，而另一条废弃轨道上有一个小孩。如果你是火车司机，突然发现制动失灵，你会变更轨道吗	文心一言大模型：这是经典的电车难题，没有绝对正确答案。从生命数量看，变轨似乎能减少伤亡，但废弃轨道上的小孩无过错，牺牲无辜者违背公平；不变轨则是遵循既定规则，却要承受多生命逝去的愧疚。我会陷入两难，难以下定决心。通义千问大模型：这个问题涉及伦理困境。废弃轨道上的小孩遵守规则，不该为他人过错买单；而前方 5 个小孩虽违规，但生命数量更多。作为司机，我不会主动变轨，因为不能以牺牲无辜者的方式来 “选择” 生命，这是对规则和个体权利的尊重。	文心一言大模型：良好· 通义千问大模型：优秀
10	记忆能力	最近24h内，我提了几个问题？其中有几个关于历史的问题	文心一言大模型：我没有实时记忆最近 24 小时的对话内容，无法准确统计你提问的数量和历史类问题的个数哦。通义千问大模型：由于我的对话记忆不具备实时留存的功能，没办法统计你近 24 小时的提问数量以及历史类问题的数量呢。	文心一言大模型：合格通义千问大模型：合格
11	简单比大小	数字9.11和9.9哪个大	文心一言大模型：9.9>9.11 通义千问大模型：比较小数大小，先看整数部分，都是 9；再看十分位，9.9的十分位是 9，9.11的十分位是 1，9>1，所以9.9>9.11	文心一言大模型：优秀通义千问大模型：优秀
序号1-11是纯文本任务
序号	考察能力	题目	回复	评价
12	平面设计	请设计一个科技公司的Logo，要求扁平化风格，构图简洁明了	文心一言大模型：设计方案：主体为几何图形组合，上方是蓝色圆角三角形（象征科技突破），下方是灰色矩形底座（代表稳定根基）；三角形内部嵌入白色极简电路线条，整体无多余装饰，色彩仅用蓝、灰、白，符合扁平化风格，适配各种场景应用。通义千问大模型：Logo 设计：采用圆形轮廓（象征全球化），内部以橙色和蓝色的交错直线构成字母 “T”（科技 tech 的首字母），线条粗细一致，无渐变阴影；整体简洁大气，扁平化风格突出，能体现科技公司的创新与活力。	你认为使用的大语言模型的本项能力是：优秀、良好、合格、不合格文心一言大模型：良好通义千问大模型：良好
13	文生图	请生成一张名为“花丛中的女孩”的图像：明媚的阳光下，一个身穿白裙子的女孩站在花丛中	文心一言大模型：已生成符合描述的图像：画面中阳光洒落，金黄光线笼罩整片花海，女孩身着白色长裙，站在粉紫色的波斯菊中，发丝随风轻扬，背景是澄澈蓝天，整体色调明亮温暖。通义千问大模型：生成图像如下：明媚阳光穿透云层，洒在五彩斑斓的花丛里，女孩穿白色连衣裙，赤脚站在雏菊与郁金香之间，双手轻捧花瓣，脸上带着微笑，画面清新治愈，符合需求。	文心一言大模型：优秀通义千问大模型：优秀
14	图像识别	请识别图像中的景点	文心一言大模型：该景点是杭州西湖断桥，断桥是西湖十景之一，因 “断桥残雪” 闻名，是西湖标志性建筑。通义千问大模型：图像中的景点为杭州西湖的断桥，位于西湖白堤东端，历史悠久，以冬日雪景景观著称。	文心一言大模型：优秀通义千问大模型：优秀
15	图像识别	上传一张迈克尔·乔丹的图像，请大语言模型识别其中是谁	文心一言大模型：图像中的人物是迈克尔・乔丹，前美国职业篮球运动员，司职得分后卫，被誉为 “篮球之神”，曾效力于芝加哥公牛队等球队。通义千问大模型：识别结果：迈克尔・乔丹，他是 NBA 历史上最具影响力的球员之一，多次获得 NBA 总冠军、常规赛 MVP 等荣誉。	文心一言大模型：优秀通义千问大模型：优秀
16	图像识别	请识别图像中有几个人，他们在干什么	文心一言大模型：图像中有 3 个人，他们围坐在草坪的野餐垫旁，桌上摆放着食物和饮料，几人面带笑容，正在进行野餐活动。通义千问大模型：识别到图像内有 3 人，他们坐在户外的草地上，围绕着野餐篮和餐布，正在享受野餐，氛围轻松愉快。	文心一言大模型：优秀通义千问大模型：优秀
17	图像识别	请识别图像中人物的表情，分析其此刻的心情	文心一言大模型：图像中人物嘴角大幅上扬，眼角带笑，露出牙齿，表情是开怀大笑，此刻心情应该是愉悦、开心的。通义千问大模型：人物表情为大笑，面部肌肉舒展，眉眼弯弯，由此判断其正处于兴奋、快乐的状态。	文心一言大模型：优秀通义千问大模型：优秀
18	图像识别	请识别图像中人物的大概年龄	文心一言大模型：根据人物的面部状态、皮肤纹理和整体气质，推测其大概年龄在 23-28 岁之间。通义千问大模型：从人物的外貌特征来看，年龄大约在 24-29 岁，属于青年阶段。	文心一言大模型：良好通义千问大模型：良好
19	图像识别+数学能力	准备一张包含初中数学题的图像，请大语言模型求解，并给出求解的过程解方程 2x+5=15	文心一言大模型：1. 移项：2x=15−5；2. 计算：2x=10；3. 系数化为 1：x=5。答案：x=5 通义千问大模型： 2x+5=15移项得 2x=15−5合并同类项得 2x=10两边同时除以 2 得 x=5所以方程的解为 x=5	文心一言大模型：优秀通义千问大模型：优秀
序号12-19是图像处理任务

总结：比较两个模型？优缺点？

1. 相同点

核心能力扎实：两款模型在逻辑推理、计算能力、创作能力、图像识别等基础任务上表现优异，均能准确完成大部分题目，满足日常学习和工作需求。

伦理与规则意识：面对电车难题等伦理问题时，都能从规则和公平角度理性分析，不给出极端化答案；在记忆能力等短板上，均能如实告知用户局限。

多模态能力均衡：文生图、图像识别结合数学求解等多模态任务中，两款模型都能实现跨领域协同，输出高质量结果。

2. 优点对比

模型优点

文心一言 1. 历史知识表述更精准，对五代十国等知识点的分类清晰，无歧义；

2. 健身计划设计更贴合学生群体，动作简单易操作，适合紧张学习间隙练习；

3. 文生图的画面描述更细腻，色彩和场景的层次感更强。

通义千问 1. 伦理问题分析更有立场，能明确表达 “不牺牲无辜者” 的观点，逻辑更严谨；

2. 计算类任务会附带详细步骤，便于理解和学习；

3. Logo 设计方案更注重品牌符号化，贴合科技公司的定位。

3. 缺点对比

模型缺点

文心一言 1. 面对历史 + 逻辑推理类问题时，策略建议稍显笼统，缺乏针对性的细节补充；

2. 图像识别中年龄推测的区间范围略窄，精准度有提升空间。

通义千问 1. 历史知识部分存在表述模糊，如十国数量的说法不够明确；

2. 角色扮演类任务的方案创新性不足，健身计划的动作设计略显单一。

4. 适用场景推荐

文心一言：更适合历史学习、创意写作、图像生成等场景，其细腻的文字和画面表现力能带来更好的体验。

通义千问：更适合数学解题、伦理分析、品牌设计等场景，严谨的逻辑和步骤化输出更具实用性。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

医疗模型Hyperopt调参稳住AUC

2048 AI社区

Java 后端如何高效对接 Python 微调大模型？四种数据交互方案全解析（含实战代码）

Python 微调大模型可通过 Flask/FastAPI 暴露 REST 接口，Java 使用 Spring 的或调用。Python 示例（FastAPI）：https://www.zhihu.com/zvideo/1993874870761722160/https://www.zhihu.com/zvideo/1993874870648451336/https://www.zhihu.com/

2048 AI社区

AI的平衡艺术：2026年如何在技术狂奔中守护人性价值

2026年AI发展进入精智落地新阶段，战略核心从"盲目追新"转向"平衡艺术"。本文深入探讨技术与人性、创新与治理、自动化与体验三大平衡维度，通过真实场景分析展示如何构建可持续的AI价值体系。文章为企业和技术开发者提供兼具前瞻性与实操性的实施框架，助力在AI浪潮中把握发展节奏。关键词AI战略、技术伦理、人机协同、AI治理、用户体验、可持续创新