Xiaothink-T7-ART:消费级硬件也能玩转的古诗生成AI,盲测接近SOTA水平
摘要:Xiaothink-T7-ART是一款轻量级古诗生成AI模型,仅需消费级CPU即可运行。该模型采用创新的多专家协同架构,通过7000万参数和400MB训练数据实现接近SOTA的创作水平,支持风格仿写、诗句续写等多种创作模式。其特点包括:硬件要求低(Intel Core i7即可)、生成可控性强、文学性突出,适用于文学创作辅助、教育应用等场景。模型已开源,无需GPU支持,让古诗创作AI技术真正
在AI赋能传统文化的浪潮中,古诗生成模型一直是文学与技术跨界的热门方向。但多数高性能模型依赖海量数据和专业GPU资源,让普通开发者和文学爱好者望而却步。今天要给大家推荐一款"平民级"古诗生成神器——Xiaothink-T7-ART(中文名:千言3-诗歌),它仅需消费级CPU就能完成训练与推理,却在古诗创作任务中交出了接近领域SOTA的亮眼成绩。
一、模型核心亮点:小体量,大能量
作为一款专注于古诗生成的语言模型,Xiaothink-T7-ART的核心优势在于"高效适配"与"品质兼顾",几个关键特性让人眼前一亮:
- 极简数据依赖:仅用400MB高质量诗歌数据完成全量微调,无需海量语料堆砌
- 硬件友好无门槛:7000万参数设计,从训练到推理全程兼容消费级设备,仅需Intel Core i7 2.80GHz处理器即可运行,无需GPU支持
- 生成可控性强:通过temperature参数可精细调节创作风格,满足不同场景下的个性化需求
- 文学性拉满:兼顾诗歌韵律、意象与意境的统一,生成作品兼具格律规范与文学美感
二、技术架构:多专家协同,兼顾精度与连贯
Xiaothink-T7-ART的出色表现源于其创新的混合架构设计,采用多专家协同模式,既解决了短上下文的韵律搭建问题,又保障了长上下文的意境连贯:
1. 异构双Transformer专家:专注短上下文精准创作
双专家分工明确,共同搭建诗歌的核心骨架与细节美感:
| 专家编号 | 核心架构 | 网络层数 (n_layers) | 前馈因子 (dff_factor) | 核心能力定位 |
|---|---|---|---|---|
| 1 | Transformer | 26 | 1 | 主导韵律结构与主体意象生成 |
| 2 | Transformer | 2 | 4 | 辅助细节优化与句式润色 |
2. GRU专家:保障长上下文连贯性
专门优化长上下文记忆能力,负责诗歌内容的知识关联、意境衔接与篇章逻辑梳理,让整首作品结构完整、文脉贯通,避免出现"句好句断"的问题。
三、核心功能与使用指南
Xiaothink-T7-ART支持多种古诗创作场景,配合指定Prompt格式即可获得优质结果。注意:模型暂不支持ModelScope pipeline调用,需下载专用Python库使用。
1. 风格仿写
想模仿特定风格创作古诗?直接使用以下Prompt:
请你以{风格}的风格生成一些古诗
仿照{风格}写古诗
示例:输入"仿照李煜风格写古诗",模型生成:
楚山重叠翠屏开,石径萦纡绕画台。
万里流光随处去,一声樵唱出林回。
后宫花月人相识,别殿春深草自来。
莫道江边留客住,不知何事是吾家?
2. 指定开头/题目
给定起始句或题目,让模型延续创作:
请你以{风格}的风格生成古诗,起始为{起始句}
用{风格}的风格写古诗(开头:{起始句})
示例:输入"以婉约风格写古诗,起始为’江上梅花落’",模型生成:
江上梅花落,秋声动地愁。
水边逢驿使,山外过城楼。
别后思乡泪,年来忆旧游。
新亭在何处?孤云天际浮。
3. 诗句续写
拿到一句心仪的诗句,让模型完成整首作品:
续写“{起始句}”生成一些古诗
写诗 用{起始句}为第一句
示例:输入"续写’三径荒凉菊未开’",模型生成:
三径荒凉菊未开,故园新竹几重来。
如何梦断江南路,犹有残阳节物催。
4. 作者猜测
遇到陌生古诗?让模型推测作者:
给出古诗 {诗句} 请你猜猜这是谁写的
根据这段古诗推测一下作者:{诗句}
关键参数调节
- temperature=0.4:生成作品更贴合传统格律,稳定性强(官方推荐默认值)
- 温度值越高:创作风格越灵活多变,个性化越强
- 温度值越低:作品越遵循传统范式,格律准确性越高
四、测评表现:盲测接近SOTA水平
该模型采用GLM4.6作为裁判进行盲测,在古诗创作相关任务中与多款主流模型同台竞技,表现亮眼。以下是temperature=0.4时的能力评估结果:

对比模型包括小思框架(Xiaothink)、九歌(清华大学NLP实验室)、Qwen2.5-0.5B-Instruct(阿里云)、OpenAI GPT-4.1 Nano等,Xiaothink-T7-ART作为7000万参数级别的模型,表现尤为突出。
五、适用场景
- 传统诗词创作辅助:为文学爱好者、诗人提供灵感支持,快速生成符合格律的古诗初稿
- 文学教育应用:用于中小学古诗教学,辅助学生理解诗歌风格、格律规则,激发创作兴趣
- 文化类AI产品集成:嵌入文旅APP、传统文化平台,提供个性化古诗生成服务
- 边缘设备诗歌生成系统:适配消费级硬件,可部署在个人电脑、嵌入式设备中,无需联网即可使用
六、总结
Xiaothink-T7-ART打破了"高性能古诗生成必须依赖专业硬件"的固有认知,以400MB训练数据、7000万参数设计,在消费级CPU上实现了接近SOTA的古诗创作能力。其多专家协同架构既保障了诗歌的格律准确性,又兼顾了意境连贯性,生成作品兼具规范性与文学性。
无论是文学爱好者想要尝试古诗创作,还是开发者需要集成轻量型古诗生成功能,这款模型都值得一试。目前模型已在ModelScope开源,只需下载专用Python库即可快速上手,让传统文化与AI技术的碰撞触手可及。
快去ModelScope搜索"ericsjq/Xiaothink-T7-ART",解锁你的专属古诗生成AI吧!
模型链接:https://www.modelscope.cn/models/ericsjq/Xiaothink-T7-ART
更多推荐



所有评论(0)