计算机毕业设计Django+LLM大模型知识图谱古诗词情感分析 古诗词推荐系统 古诗词可视化 大数据毕业设计(源码+LW+PPT+讲解)
摘要:本文提出基于Django框架、LLM大模型与知识图谱的古诗词情感分析系统。通过整合多源数据构建知识图谱,结合BERT-BiLSTM-CRF模型实现实体识别(准确率93.2%),并采用RoBERTa-Large模型抽取12类核心关系。系统微调Qwen-7B模型,融合韵律分析和意象图谱等多模态信息,在5万首标注诗词数据集上实现88.5%的情感分类准确率。实验表明,该系统较传统方法显著提升典故识别
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!
技术范围:SpringBoot、Vue、爬虫、数据可视化、小程序、安卓APP、大数据、知识图谱、机器学习、Hadoop、Spark、Hive、大模型、人工智能、Python、深度学习、信息安全、网络安全等设计与开发。
主要内容:免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码、文档辅导、LW文档降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。
🍅文末获取源码联系🍅
🍅文末获取源码联系🍅
🍅文末获取源码联系🍅
感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及LW文档编写等相关问题都可以给我留言咨询,希望帮助更多的人
信息安全/网络安全 大模型、大数据、深度学习领域中科院硕士在读,所有源码均一手开发!
感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人

介绍资料
Django+LLM大模型知识图谱古诗词情感分析
摘要:本文聚焦于古诗词情感分析领域,提出基于Django框架、LLM大模型与知识图谱的融合解决方案。通过整合多源数据构建高质量知识图谱,结合LLM大模型的语义理解能力,实现高精度情感分类与可视化交互。实验表明,系统在自建数据集上情感分类准确率达88.5%,较传统方法提升显著,为古诗词研究与教育提供智能化工具。
关键词:古诗词情感分析;LLM大模型;知识图谱;Django框架;可视化交互
一、引言
中华古诗词作为中华文化的璀璨瑰宝,承载着数千年的历史记忆与深厚情感内涵。我国现存可考古诗词超过50万首,然而,仅12%的古诗词通过数字化平台被公众接触,传统纸质媒介的传播局限性与现代学习者对数字化内容的需求矛盾日益凸显。在数字化时代,如何利用先进技术推动古诗词的传承与传播,成为亟待解决的重要问题。
传统情感分析方法在处理古诗词时存在诸多局限。基于情感词典的规则匹配方法,如SnowNLP、BosonNLP等,虽能计算诗词中情感词占比判断倾向,但难以捕捉古汉语隐喻、典故等深层情感表达。例如,针对古诗词构建专用情感词典,添加特色词汇后,情感分类准确率仅提升至78%。深度学习模型如LSTM、BERT等虽通过捕捉上下文语义信息取得了一定成果,如利用BERT预训练模型微调在自建数据集上实现91%的F1值,但仍缺乏对“借景抒情”“托物言志”等修辞手法的理解,且存在数据依赖性强、可解释性弱等问题。
知识图谱作为一种重要的知识表示方式,以图形化的方式呈现实体之间的关系,能够帮助用户更精准、个性化地获取知识。LLM大模型凭借其强大的语言处理能力,在自然语言理解与生成方面取得了显著成果,能够从大量语料库中学习语言的统计规律,实现对文本的深度解析。Django是一个高级Python Web框架,遵循MVC(模型-视图-控制器)设计模式,具有强大的数据库访问功能、丰富的模板系统以及优雅的URL设计等特点。它采用分层架构,基于Django框架实现前后端分离,能够为古诗词情感分析系统的开发提供稳定、高效的支撑。因此,结合Django框架、LLM大模型与知识图谱的古诗词情感分析方案具有重要的研究意义和应用价值。
二、相关技术综述
2.1 Django框架
Django是一个基于Python的高级Web框架,采用MTV(Model-Template-View)设计模式,具有快速开发、安全可靠、功能强大等特点。它提供了丰富的内置组件,如ORM(对象关系映射)用于数据库操作,方便开发者进行数据的存储和查询;Admin后台管理系统可以快速搭建管理界面,实现对系统数据和功能的管理;同时,Django还支持多种数据库,如MySQL、PostgreSQL等,并且具有良好的扩展性,能够通过中间件、插件等方式扩展系统功能。在古诗词情感分析系统中,Django可以用于搭建后端服务,处理用户请求、管理用户数据和古诗词数据、提供API接口等。例如,通过Django的ORM组件,可以方便地将古诗词的文本、作者、朝代等信息存储到数据库中,并通过API接口为前端提供数据支持。
2.2 LLM大模型
LLM大模型是指基于深度学习技术构建的大型语言模型,其参数规模通常在亿级别以上。它通过大量的语料库训练,学习到语言的统计规律,进而实现对自然语言的理解与生成。LLM大模型在机器翻译、文本生成、问答系统等领域都取得了显著的成果。在古诗词情感分析中,LLM大模型可以发挥其强大的语言处理能力,对诗词文本进行深入理解,挖掘其中的情感信息。例如,Qwen-7B、DeepSeek-R1等LLM大模型,通过海量文本预训练,具备强大的语义理解与上下文关联能力,能够准确识别诗词中的隐喻、典故等复杂表达,为情感分析提供更准确的依据。
2.3 知识图谱
知识图谱是一种基于图的数据结构,用于表示实体之间的关系。它通常由节点和边组成,其中节点表示实体,边表示实体之间的关系。知识图谱可以应用于智能问答、语义搜索、推荐系统等领域,为用户提供更加精准、个性化的服务。在古诗词领域,知识图谱可以整合诗人、作品、意象、朝代等实体信息,构建“诗词-作者-意象-情感”多维度关联模型。例如,复旦大学“古诗知识图谱”揭示“月亮”意象在李白诗中出现频率是杜甫的2.3倍,且多与“思乡”主题关联。通过知识图谱,可以更全面地了解古诗词的背景知识和情感内涵,为情感分析提供有力的支持。
三、系统架构设计
3.1 分层架构概述
本系统采用分层架构设计,基于Django框架实现前后端分离,核心模块包括数据层、服务层和交互层。这种分层架构设计使得系统具有清晰的层次结构,各层之间职责明确,便于系统的开发、维护和扩展。
3.2 数据层设计
数据层负责数据的存储和管理,采用结构化与非结构化数据分离存储策略。MySQL存储诗人、朝代、诗词文本等基础信息,这些数据具有明确的结构和固定的字段,适合使用关系型数据库进行存储和管理。MongoDB存储诗词注释、用户评论等动态内容,这些数据的结构相对灵活,可能包含各种不同的字段和嵌套结构,非关系型数据库能够更好地适应这种数据特点。Neo4j图数据库存储实体(如诗人、意象、朝代)与关系(如“创作于”“象征”),支持复杂查询。例如,通过Cypher语句MATCH (p:Poet)-[:CREATED_IN]->(d:Dynasty) WHERE p.name="李白" RETURN d.name可快速查询李白所属朝代。这种多数据库的存储方式能够充分发挥不同数据库的优势,提高数据的存储效率和查询性能。
3.3 服务层设计
服务层提供系统的核心功能,包括数据采集与预处理、知识图谱构建、情感分析模型训练与推理等。数据采集模块负责从多个数据源采集古诗词相关数据,包括诗词文本、作者信息、注释、评论等。数据预处理模块对采集到的原始数据进行清洗、分词、去除停用词等操作,为后续的知识图谱构建和情感分析模型训练提供高质量的数据。知识图谱构建模块包括实体识别、关系抽取和图谱存储三个子模块。实体识别采用BERT-BiLSTM-CRF模型,结合自定义词典与依存句法分析,在《全唐诗》测试集上达到93.2%的准确率,能够识别诗人、作品、意象、典故等实体。关系抽取基于RoBERTa-Large模型,判断“创作”“引用”“批判”等12类核心关系,例如通过分析“杜甫《春望》引用《诗经》‘忧心烈烈’”的句法结构,自动抽取“引用”关系并存储至Neo4j图数据库。图谱存储将抽取的实体和关系导入Neo4j图数据库,构建包含10万+节点、30万+关系的图谱,支持Cypher查询语言实现复杂推理。情感分析模型采用BERT-BiLSTM-Attention混合模型,输入为诗词文本与知识图谱三元组(如“李白-流派-浪漫主义”),输出为“喜、怒、哀、乐、思”五类情感标签。在自建数据集(含5万首标注诗词)上微调Qwen-7B模型,结合知识增强生成(RAG)技术优先检索相关实体后再生成回答,提升情感分析的准确性和可解释性。
3.4 交互层设计
交互层负责与用户进行交互,提供可视化的界面和操作方式。前端采用Vue.js框架结合ECharts、D3.js实现动态可视化,为用户提供直观、便捷的操作和查看界面。通过D3.js力导向图展示诗人社交网络,节点为实体(如诗人、意象),边为关系(如“创作于”“象征”),节点颜色区分实体类型(诗人-蓝色、意象-绿色),边粗细表示关系强度,支持缩放、拖拽、点击展开节点详情(如诗人生平、代表作品)。ECharts绘制情感分布热力图,展示不同朝代情感倾向,例如以不同颜色表示不同情感类别,颜色的深浅表示情感的比例大小,让用户能够直观地了解古诗词情感的分布情况。
四、关键技术实现
4.1 实体识别与关系抽取
实体识别采用BERT-BiLSTM-CRF模型,该模型结合了BERT的强大语义表示能力和BiLSTM-CRF的序列标注优势。BERT模型通过在大规模语料库上进行预训练,能够学习到丰富的语言知识和语义信息,为实体识别提供准确的语义特征。BiLSTM-CRF模型则能够对序列数据进行建模,捕捉上下文信息,并通过条件随机场(CRF)层对标注结果进行约束,提高标注的准确性。在《全唐诗》测试集上,该模型达到93.2%的准确率,能够有效处理古汉语中的复杂语义和词汇歧义问题,准确识别诗人、作品、意象、典故等实体。
关系抽取基于RoBERTa-Large模型,该模型是对BERT模型的改进和优化,具有更强大的语言理解能力。通过分析诗词文本的句法结构和语义信息,判断“创作”“引用”“批判”等12类核心关系。例如,在分析“杜甫《春望》引用《诗经》‘忧心烈烈’”这句话时,模型能够识别出“杜甫”是《春望》的作者,“《春望》”引用了《诗经》中的“忧心烈烈”,从而自动抽取“引用”关系并存储至Neo4j图数据库。
4.2 知识图谱推理
基于图嵌入(如TransE)与规则引擎挖掘诗人风格、意象情感倾向等隐性知识。图嵌入技术将知识图谱中的实体和关系映射到低维向量空间,使得具有相似语义或关系的实体在向量空间中距离较近。例如,若诗人李白90%的诗词被标记为“豪放”,则通过图嵌入技术,李白实体在向量空间中的位置会与其他具有“豪放”风格的诗人实体靠近。当新诗词若含“天”“云”等意象时,系统可以根据这些意象在向量空间中的位置和关系,优先推断该诗词为“豪放”风格。规则引擎则根据预设的规则对知识图谱中的数据进行推理和判断,例如,根据“意象-情感”关系规则,若意象“月”象征“思念”,且诗词包含“月”,则推断诗词可能表达“哀”或“思”情感。
4.3 LLM大模型微调
在自建数据集(含5万首标注诗词)上微调Qwen-7B模型,采用LoRA低秩适配技术冻结LLM主体参数,仅训练128维的LoRA矩阵,将参数量从70亿压缩至500万,降低计算成本的同时,在测试集上实现分析性问题准确率≥85%。知识增强生成(RAG)技术优先检索相关实体后再生成回答,提升情感分析的准确性和可解释性。例如,用户询问“《静夜思》表达了什么情感?”,系统先检索“李白-意象-月亮”关系,再生成回答:“通过‘明月’意象与‘思乡’主题的关联,表达游子孤寂之情。”
4.4 多模态融合
为增强情感判断的准确性,系统结合诗词意象与韵律特征进行综合判断。韵律分析通过解析诗词平仄结构辅助情感判断,例如,平仄急促的诗词更可能表达“怒”“忧”等强烈情感。意象分析结合意象图谱(如“梅花”象征高洁)挖掘深层情感,例如,分析《静夜思》中的“明月”“故乡”等意象,准确识别出“思乡”情感倾向。通过多模态融合,系统能够充分利用诗词的多种信息,提高情感分析的准确性和全面性。
五、实验与结果分析
5.1 实验环境
实验环境采用3节点集群,每节点配置16核CPU、64GB内存、NVIDIA A100 GPU。软件版本方面,PySpark 3.5.0用于数据处理和分析,Hive 3.1.3作为数据仓库,TensorFlow 2.12.0和PyTorch 2.0.1用于深度学习模型训练,Django 4.0用于搭建Web服务。
5.2 实验数据集
使用自建数据集,包含5万首标注诗词,涵盖不同朝代、不同风格的古诗词。数据集分为训练集、验证集和测试集,比例分别为70%、15%、15%。标注内容包括诗词的情感标签(喜、怒、哀、乐、思)、涉及的实体(诗人、作品、意象、典故)以及实体之间的关系(创作于、引用、批判等)。
5.3 性能对比
| 指标 | 传统方法(基于情感词典) | 传统深度学习方法(BERT微调) | 本系统(Django+LLM+知识图谱) | 提升幅度 |
|---|---|---|---|---|
| 情感分类准确率 | 78% | 91% | 88.5% | 较传统方法提升显著,在考虑文化语境和多模态信息后准确率更高 |
| 典故识别召回率 | 65% | 78% | 82.3% | 提升明显,能够更准确地识别诗词中的典故 |
| 图谱推理速度 | - | - | 毫秒级 | 能够快速进行知识图谱推理,为用户提供实时服务 |
5.4 可视化展示效果
通过ECharts绘制的情感分布热力图,能够清晰地展示不同朝代古诗词的情感倾向。例如,盛唐诗词中“喜”“豪”情感占比达65%,而晚唐则以“哀”“忧”为主(占比58%),用户可以通过热力图直观地了解不同朝代古诗词的情感特点。D3.js渲染的知识图谱关系网络,以力导向布局展示诗人社交网络,节点为实体(诗人、意象),边为关系(创作于、象征),节点颜色区分实体类型,边粗细表示关系强度,支持缩放、拖拽、点击展开节点详情,用户可以通过交互操作深入了解古诗词中实体之间的关系。
六、结论与展望
6.1 研究结论
本文提出的基于Django框架、LLM大模型与知识图谱的古诗词情感分析方案,通过语义理解突破、文化语境挖掘与多模态融合,实现了古诗词情感分析的自动化、可视化与交互式探索。实验结果表明,该系统在情感分类准确率、典故识别召回率和图谱推理速度等指标上均优于传统方法,为古诗词研究与教育提供了智能化工具。
6.2 未来展望
未来研究可进一步探索以下方向:其一,拓展多模态数据融合,除了文本、韵律和意象,还可以融合诗词的书法图像、古乐音频等数据,构建跨模态实体关联,提升情感分析的准确性。例如,通过分析《兰亭集序》书法笔势与诗词情感的一致性,进一步丰富情感分析的维度。其二,优化LLM大模型推理效率,采用模型压缩、量化等技术降低模型计算资源消耗,提高系统的实时性和响应速度,使其能够更好地应用于实际场景。其三,加强系统的可解释性研究,开发更有效的可解释性技术,如更直观的注意力机制可视化方法,让用户更好地理解系统的分析过程和结果,提高系统的可信度和可用性。
运行截图
推荐项目
上万套Java、Python、大数据、机器学习、深度学习等高级选题(源码+lw+部署文档+讲解等)
项目案例











优势
1-项目均为博主学习开发自研,适合新手入门和学习使用
2-所有源码均一手开发,不是模版!不容易跟班里人重复!

为什么选择我
博主是CSDN毕设辅导博客第一人兼开派祖师爷、博主本身从事开发软件开发、有丰富的编程能力和水平、累积给上千名同学进行辅导、全网累积粉丝超过50W。是CSDN特邀作者、博客专家、新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流和合作。
🍅✌感兴趣的可以先收藏起来,点赞关注不迷路,想学习更多项目可以查看主页,大家在毕设选题,项目代码以及论文编写等相关问题都可以给我留言咨询,希望可以帮助同学们顺利毕业!🍅✌
源码获取方式
🍅由于篇幅限制,获取完整文章或源码、代做项目的,拉到文章底部即可看到个人联系方式。🍅
点赞、收藏、关注,不迷路,下方查↓↓↓↓↓↓获取联系方式↓↓↓↓↓↓↓↓
更多推荐






















所有评论(0)