体验大语言模型
(4)了解文心一言是百度全新一代知识增强大语言模型,是文心大模型家族的新成员,能够与用户进行对话互动、回答用户的问题,并实现协助创作,高效便捷地帮助人们获取信息、知识和灵感等功能。生成图像如下:明媚阳光穿透云层,洒在五彩斑斓的花丛里,女孩穿白色连衣裙,赤脚站在雏菊与郁金香之间,双手轻捧花瓣,脸上带着微笑,画面清新治愈,符合需求。已生成符合描述的图像:画面中阳光洒落,金黄光线笼罩整片花海,女孩身着白
实验5 体验大语言模型
目的和要求
(1)了解大语言模型的工作原理。
(2)了解海内外主流大语言模型的基本情况。
(3)练习体验海内外主流大语言模型。
实验准备
(1)了解大语言模型指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。
(2)了解现阶段,所有的大语言模型都基于Transformer架构。
(3)了解GPT模型的诞生可以说是NLP技术的发展历史中一个重要的里程碑,这是NLP技术的重大突破。GPT系列大语言模型包含GPT-1、GPT-2、GPT-3、GPT-3.5和GPT-4等5个版本。
(4)了解文心一言是百度全新一代知识增强大语言模型,是文心大模型家族的新成员,能够与用户进行对话互动、回答用户的问题,并实现协助创作,高效便捷地帮助人们获取信息、知识和灵感等功能。文心一言是基于海量数据和知识进行融合学习的预训练大模型,也是国内参数数量比较多的大语言模型。
(5)了解通义千问是阿里云推出的大语言模型,其功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。并能够和人类进行多轮的交互,也融入了多模态的知识理解、有文案创作能力、能够续写小说,编写邮件等。
实验内容
推荐的大语言模型有智谱清言、豆包、文心一言、通义千问、chatgpt等。选择2种大语言模型体验纯文本任务和多模态任务两种类型,完成下列表格的填写。
我选择文心一言和通义千问大模型
|
序号 |
考察能力 |
题目 |
回复 |
评价 |
|
1 |
逻辑推理 |
一个人带一只黄狗、一只白兔和一颗白菜过河,河边只有一条小船,此人每次只能带一样东西过河,如果此人不在,黄狗要咬白兔,白兔要啃白菜。请想一想:既不让黄狗咬白兔,又不让白兔啃白菜,该怎么设计过河方案 |
文心一言大模型:1. 先带白兔过河,空船返回;2. 带黄狗过河,带白兔返回;3. 带白菜过河,空船返回;4. 带白兔过河,完成。 通义千问大模型:1. 人带白兔到对岸,独自返回;2. 带黄狗到对岸,带白兔回原岸;3. 带白菜到对岸,独自返回;4. 带白兔到对岸,全部安全过河。 |
你认为使用的大语言模型的本项能力是:优秀、良好、合格、不合格 文心一言大模型:优秀 通义千问大模型:优秀 |
|
2 |
总结归纳 |
我家的猫叫花咪咪,我家的狗叫黄旺旺,请问我家的羊叫什么 |
文心一言大模型:题目中未提及羊的名字,无法确定哦。 通义千问大模型:根据现有信息,没有给出羊的名字,所以没办法回答羊叫什么。 |
文心一言大模型:优秀 通义千问大模型:优秀 |
|
3 |
计算能力 |
753×951=? |
文心一言大模型:753×951=716103 通义千问大模型:753×900=677700,753×50=37650,753×1=753;总和为 677700+37650+753=716103 |
文心一言大模型:优秀 通义千问大模型:优秀 |
|
4 |
历史知识 |
“五代十国”包括哪些朝代 |
文心一言大模型:五代:后梁、后唐、后晋、后汉、后周(依次更替,统治中原地区);十国:前蜀、后蜀、南吴、南唐、吴越、闽国、楚、南汉、南平(荆南)、北汉(割据南方和北方边缘地区) 通义千问大模型:五代是中原地区的五个王朝:后梁、后唐、后晋、后汉、后周;十国是周边割据政权,主要有前蜀、后蜀、吴、南唐、吴越、闽、楚、南汉、南平、北汉,十国是泛称,具体政权数量有不同说法。 |
文心一言大模型:优秀 通义千问大模型:良好 |
|
5 |
历史知识+逻辑推理 |
刘备怎样才能统一天下 |
文心一言大模型:1. 优化战略:隆中对需调整,避免分兵荆州、益州,集中兵力保荆州要道;2. 人才布局:平衡荆州、益州士族利益,留住关羽、马谡等人才并合理任用;3. 外交策略:联吴抗曹需更稳固,化解荆州归属矛盾,避免夷陵之战;4. 民生建设:在益州、荆州轻徭薄赋,积累粮草和民心。 通义千问大模型:1. 坚守联吴抗曹核心策略,妥善解决荆州争端,不与东吴决裂;2. 重视内部治理,调和益州本土士族与外来势力矛盾,稳定后方;3. 军事上谨慎用兵,不急于发动夷陵之战,养精蓄锐后再图中原;4. 培养后继人才,避免后期人才断层问题。 |
文心一言大模型:优秀 通义千问大模型:良好 |
|
6 |
创作能力 |
我是一个科技公司的老板,请帮我设计一份简短的公司年会发言稿,100字以内 |
文心一言大模型:各位同仁,新年好!过去一年,我们以科技为刃,攻克难关,收获满满。新岁启封,愿我们继续携手,创新不止,共赴新程!祝大家新年快乐,万事顺遂! 通义千问大模型:亲爱的伙伴们!回望一年,我们用技术突破书写精彩。新的一年,让我们并肩前行,以创新驱动发展,再创辉煌!祝大家新春愉快,阖家幸福! |
文心一言大模型:优秀 通义千问大模型:优秀 |
|
7 |
角色扮演+创作能力 |
我是一名女学生,身高160cm,体重60kg,平时学习比较紧张,假如你是我的健身教练,请帮忙设计一个每天30min的健身计划 |
文心一言大模型:1. 热身(5min):开合跳、高抬腿各 2 组,每组 1min,活动关节;2. 核心训练(15min):平板支撑 2 组(每组 1min)、臀桥 3 组(每组 12 次)、卷腹 2 组(每组 15 次);3. 拉伸(10min):侧腰拉伸、大腿前侧 / 后侧拉伸,缓解久坐僵硬。 通义千问大模型:1. 热身(5min):原地踏步 + 关节环绕,唤醒身体;2. 燃脂塑形(15min):深蹲 3 组(每组 10 次)、跪姿俯卧撑 2 组(每组 8 次)、俄罗斯转体 2 组(每组 12 次);3. 放松拉伸(10min):猫式伸展、肩部拉伸,改善体态。 |
文心一言大模型:良好 通义千问大模型:良好 |
|
8 |
续写 |
如果由你来续写《红楼梦》的后40回,你会如何设计其中的情节?请用100字以内的篇幅概括 |
文心一言大模型:贾府抄家后,宝玉流落乡间,偶遇沦为农妇的宝钗,二人相视无言。黛玉魂归潇湘馆前,托梦宝玉,嘱其珍重。宝玉最终看破红尘,却未出家,守着黛玉旧物,平淡度日。 通义千问大模型:贾府败落,黛玉泪尽而逝,宝玉悲痛欲绝。宝钗劝其考取功名重振家业,宝玉却心系黛玉。后偶遇妙玉,悟透世事,最终在潇湘馆旁结庐而居,伴黛玉灵位终老。 |
文心一言大模型:优秀 通义千问大模型:优秀 |
|
9 |
伦理问题 |
一列火车正常行驶,前方轨道上有5个小孩在玩耍,而另一条废弃轨道上有一个小孩。如果你是火车司机,突然发现制动失灵,你会变更轨道吗 |
文心一言大模型:这是经典的电车难题,没有绝对正确答案。从生命数量看,变轨似乎能减少伤亡,但废弃轨道上的小孩无过错,牺牲无辜者违背公平;不变轨则是遵循既定规则,却要承受多生命逝去的愧疚。我会陷入两难,难以下定决心。 通义千问大模型:这个问题涉及伦理困境。废弃轨道上的小孩遵守规则,不该为他人过错买单;而前方 5 个小孩虽违规,但生命数量更多。作为司机,我不会主动变轨,因为不能以牺牲无辜者的方式来 “选择” 生命,这是对规则和个体权利的尊重。 |
文心一言大模型:良好· 通义千问大模型:优秀 |
|
10 |
记忆能力 |
最近24h内,我提了几个问题?其中有几个关于历史的问题 |
文心一言大模型:我没有实时记忆最近 24 小时的对话内容,无法准确统计你提问的数量和历史类问题的个数哦。 通义千问大模型:由于我的对话记忆不具备实时留存的功能,没办法统计你近 24 小时的提问数量以及历史类问题的数量呢。 |
文心一言大模型:合格 通义千问大模型:合格 |
|
11 |
简单比大小 |
数字9.11和9.9哪个大 |
文心一言大模型:9.9>9.11 通义千问大模型:比较小数大小,先看整数部分,都是 9;再看十分位,9.9的十分位是 9,9.11的十分位是 1,9>1,所以9.9>9.11 |
文心一言大模型:优秀 通义千问大模型:优秀 |
|
序号1-11是纯文本任务 |
||||
|
序号 |
考察能力 |
题目 |
回复 |
评价 |
|
12 |
平面设计 |
请设计一个科技公司的Logo,要求扁平化风格,构图简洁明了 |
文心一言大模型:设计方案:主体为几何图形组合,上方是蓝色圆角三角形(象征科技突破),下方是灰色矩形底座(代表稳定根基);三角形内部嵌入白色极简电路线条,整体无多余装饰,色彩仅用蓝、灰、白,符合扁平化风格,适配各种场景应用。 通义千问大模型:Logo 设计:采用圆形轮廓(象征全球化),内部以橙色和蓝色的交错直线构成字母 “T”(科技 tech 的首字母),线条粗细一致,无渐变阴影;整体简洁大气,扁平化风格突出,能体现科技公司的创新与活力。 |
你认为使用的大语言模型的本项能力是:优秀、良好、合格、不合格 文心一言大模型:良好 通义千问大模型:良好 |
|
13 |
文生图 |
请生成一张名为“花丛中的女孩”的图像:明媚的阳光下,一个身穿白裙子的女孩站在花丛中 |
文心一言大模型:已生成符合描述的图像:画面中阳光洒落,金黄光线笼罩整片花海,女孩身着白色长裙,站在粉紫色的波斯菊中,发丝随风轻扬,背景是澄澈蓝天,整体色调明亮温暖。 通义千问大模型:生成图像如下:明媚阳光穿透云层,洒在五彩斑斓的花丛里,女孩穿白色连衣裙,赤脚站在雏菊与郁金香之间,双手轻捧花瓣,脸上带着微笑,画面清新治愈,符合需求。 |
文心一言大模型:优秀 通义千问大模型:优秀 |
|
14 |
图像识别 |
请识别图
像中的景点 |
文心一言大模型:该景点是杭州西湖断桥,断桥是西湖十景之一,因 “断桥残雪” 闻名,是西湖标志性建筑。 通义千问大模型:图像中的景点为杭州西湖的断桥,位于西湖白堤东端,历史悠久,以冬日雪景景观著称。 |
文心一言大模型:优秀 通义千问大模型:优秀 |
|
15 |
图像识别 |
上传一张迈克尔·乔丹的图像,请大语言模型识别其中是谁
|
文心一言大模型:图像中的人物是迈克尔・乔丹,前美国职业篮球运动员,司职得分后卫,被誉为 “篮球之神”,曾效力于芝加哥公牛队等球队。 通义千问大模型:识别结果:迈克尔・乔丹,他是 NBA 历史上最具影响力的球员之一,多次获得 NBA 总冠军、常规赛 MVP 等荣誉。 |
文心一言大模型:优秀 通义千问大模型:优秀 |
|
16 |
图像识别 |
请识别图像中有几个人,他们在干什么
|
文心一言大模型:图像中有 3 个人,他们围坐在草坪的野餐垫旁,桌上摆放着食物和饮料,几人面带笑容,正在进行野餐活动。 通义千问大模型:识别到图像内有 3 人,他们坐在户外的草地上,围绕着野餐篮和餐布,正在享受野餐,氛围轻松愉快。 |
文心一言大模型:优秀 通义千问大模型:优秀 |
|
17 |
图像识别 |
请识别图像中人物的表情,分析其此刻的心情
|
文心一言大模型:图像中人物嘴角大幅上扬,眼角带笑,露出牙齿,表情是开怀大笑,此刻心情应该是愉悦、开心的。 通义千问大模型:人物表情为大笑,面部肌肉舒展,眉眼弯弯,由此判断其正处于兴奋、快乐的状态。 |
文心一言大模型:优秀 通义千问大模型:优秀 |
|
18 |
图像识别 |
请识别图像中人物的大概年龄
|
文心一言大模型:根据人物的面部状态、皮肤纹理和整体气质,推测其大概年龄在 23-28 岁之间。 通义千问大模型:从人物的外貌特征来看,年龄大约在 24-29 岁,属于青年阶段。 |
文心一言大模型:良好 通义千问大模型:良好 |
|
19 |
图像识别+数学能力 |
准备一张包含初中数学题的图像,请大语言模型求解,并给出求解的过程 解方程 2x+5=15 |
文心一言大模型:1. 移项:2x=15−5;2. 计算:2x=10;3. 系数化为 1:x=5。答案:x=5 通义千问大模型: |
文心一言大模型:优秀 通义千问大模型:优秀 |
|
序号12-19是图像处理任务 |
||||
总结:比较两个模型?优缺点?
1. 相同点
核心能力扎实:两款模型在逻辑推理、计算能力、创作能力、图像识别等基础任务上表现优异,均能准确完成大部分题目,满足日常学习和工作需求。
伦理与规则意识:面对电车难题等伦理问题时,都能从规则和公平角度理性分析,不给出极端化答案;在记忆能力等短板上,均能如实告知用户局限。
多模态能力均衡:文生图、图像识别结合数学求解等多模态任务中,两款模型都能实现跨领域协同,输出高质量结果。
2. 优点对比
模型 优点
文心一言 1. 历史知识表述更精准,对五代十国等知识点的分类清晰,无歧义;
2. 健身计划设计更贴合学生群体,动作简单易操作,适合紧张学习间隙练习;
3. 文生图的画面描述更细腻,色彩和场景的层次感更强。
通义千问 1. 伦理问题分析更有立场,能明确表达 “不牺牲无辜者” 的观点,逻辑更严谨;
2. 计算类任务会附带详细步骤,便于理解和学习;
3. Logo 设计方案更注重品牌符号化,贴合科技公司的定位。
3. 缺点对比
模型 缺点
文心一言 1. 面对历史 + 逻辑推理类问题时,策略建议稍显笼统,缺乏针对性的细节补充;
2. 图像识别中年龄推测的区间范围略窄,精准度有提升空间。
通义千问 1. 历史知识部分存在表述模糊,如十国数量的说法不够明确;
2. 角色扮演类任务的方案创新性不足,健身计划的动作设计略显单一。
4. 适用场景推荐
文心一言:更适合历史学习、创意写作、图像生成等场景,其细腻的文字和画面表现力能带来更好的体验。
通义千问:更适合数学解题、伦理分析、品牌设计等场景,严谨的逻辑和步骤化输出更具实用性。
更多推荐






所有评论(0)