计算机毕业设计Python知识图谱中华古诗词可视化古诗词情感分析古诗词智能问答系统 AI大模型自动写诗大数据毕业设计(源码+LW文档+PPT+讲解)

摘要：本文介绍了一个基于Python的中华古诗词知识图谱可视化系统设计方案。系统采用模块化架构，包含数据采集、知识图谱构建和可视化展示三大模块，通过Spacy、Neo4j、NetworkX等技术实现古诗词实体识别、关系抽取和交互式可视化。系统可展示诗人社交网络、诗词意象关联及时空轨迹，为文化研究和教育传播提供支持。文章详细阐述了技术实现细节，包括数据预处理、实体关系抽取、可视化方法等，并提出了多模

haochengxu2022

385人浏览 · 2026-01-15 10:35:53

haochengxu2022 · 2026-01-15 10:35:53 发布

温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！

温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！

温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！

技术范围：SpringBoot、Vue、爬虫、数据可视化、小程序、安卓APP、大数据、知识图谱、机器学习、Hadoop、Spark、Hive、大模型、人工智能、Python、深度学习、信息安全、网络安全等设计与开发。

主要内容：免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码、文档辅导、LW文档降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。

🍅文末获取源码联系🍅

🍅文末获取源码联系🍅

🍅文末获取源码联系🍅

感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及LW文档编写等相关问题都可以给我留言咨询，希望帮助更多的人

信息安全/网络安全大模型、大数据、深度学习领域中科院硕士在读，所有源码均一手开发！

感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人

介绍资料

Python知识图谱中华古诗词可视化技术说明

一、技术背景与目标

中华古诗词作为中华文化的重要载体，蕴含着丰富的历史、地理、人物及情感信息。传统诗词研究多依赖人工文本分析，难以挖掘其深层关联。知识图谱技术通过结构化数据建模，可揭示诗词中实体（如诗人、朝代、意象）间的复杂关系；可视化技术则将抽象数据转化为直观图形，辅助用户快速理解诗词网络。本方案旨在利用Python构建古诗词知识图谱，并通过可视化技术实现多维信息展示，为文化研究、教育传播提供工具支持。

二、系统架构设计

系统采用模块化设计，分为数据采集、知识图谱构建、可视化展示三大核心模块，各模块间通过JSON/CSV格式交互数据。

（一）数据采集与预处理

数据源选择
- 结构化数据：从《全唐诗》《全宋词》等古籍数字化文本中提取诗词元数据（标题、作者、朝代、正文）。
- 半结构化数据：爬取诗词网站（如古诗文网、搜韵网）的诗人简介、创作背景、注释等非结构化文本。
- 外部知识库：整合DBpedia、百度百科等开放知识库中的诗人关系（师承、交游）、历史事件等数据。
数据清洗与标准化
- 使用正则表达式去除HTML标签、特殊符号，统一诗人姓名别称（如“李白”与“李太白”）。
- 通过NLTK分词工具对诗词正文分词，标注词性（名词、动词等），提取高频意象（如“月”“酒”“雁”）。
- 示例代码：
  python
```
1import re
2from nltk.tokenize import word_tokenize
3
4def clean_poem(text):
5    text = re.sub(r'<[^>]+>', '', text)  # 去除HTML标签
6    tokens = word_tokenize(text)
7    return [token for token in tokens if token.isalpha()]  # 保留字母字符
```

（二）知识图谱构建

实体识别与关系抽取
- 实体类型：诗人、朝代、诗词、意象、地点。
- 关系类型：
  - 诗人-朝代（如“李白→唐朝”）
  - 诗人-诗词（如“杜甫→《春望》”）
  - 诗词-意象（如“《静夜思》→月”）
  - 诗人-交游（如“李白→杜甫”）
- 使用Spacy库进行命名实体识别（NER），结合规则匹配抽取关系。
- 示例代码：
  python
```
1import spacy
2
3nlp = spacy.load("zh_core_web_sm")  # 加载中文模型
4doc = nlp("李白与杜甫是好友，均活跃于唐朝")
5for ent in doc.ents:
6    print(ent.text, ent.label_)  # 输出实体及类型
```

图数据库存储

选择Neo4j图数据库存储知识图谱，利用其Cypher查询语言高效检索关系。
通过Py2neo库实现Python与Neo4j交互，批量导入实体和关系。

示例代码：

python

1from py2neo import Graph, Node, Relationship
2
3graph = Graph("bolt://localhost:7687", auth=("user", "password"))
4li_bai = Node("Poet", name="李白")
5du_fu = Node("Poet", name="杜甫")
6friendship = Relationship(li_bai, "FRIEND_WITH", du_fu)
7graph.create(friendship)

（三）可视化展示

静态可视化：NetworkX+Matplotlib

生成诗人社交网络图，节点大小表示诗词数量，边粗细表示交游频率。

示例代码：

python

1import networkx as nx
2import matplotlib.pyplot as plt
3
4G = nx.Graph()
5G.add_edge("李白", "杜甫", weight=5)
6G.add_edge("李白", "孟浩然", weight=3)
7pos = nx.spring_layout(G)  # 布局算法
8nx.draw(G, pos, with_labels=True, node_size=1000, width=[d["weight"]*0.5 for _, _, d in G.edges(data=True)])
9plt.show()

动态可视化：PyVis+D3.js

使用PyVis生成交互式HTML图表，支持缩放、拖拽、悬停显示详情。

示例代码：

python

1from pyvis.network import Network
2
3net = Network(height="750px", width="100%", directed=False)
4net.add_node(1, label="李白", size=20)
5net.add_node(2, label="杜甫", size=15)
6net.add_edge(1, 2, title="好友")
7net.show("poets_network.html")  # 生成HTML文件

时空可视化：Folium+Geopandas

结合诗词创作地点与时间轴，生成动态地图展示诗人游历轨迹。

示例代码：

python

1import folium
2import geopandas as gpd
3
4# 加载中国地图数据
5china = gpd.read_file("china_shapefile.shp")
6m = folium.Map(location=[35, 105], zoom_start=4)
7for _, row in china.iterrows():
8    folium.GeoJson(row["geometry"], name=row["name"]).add_to(m)
9# 添加诗人轨迹点
10folium.Marker([31.2, 121.5], popup="李白在苏州").add_to(m)
11m.save("poets_map.html")

三、关键技术实现

（一）诗人交游关系挖掘

共现分析：统计诗词中同时提及两位诗人的频率，作为交游强度指标。

文本相似度：计算诗人诗词的TF-IDF向量余弦相似度，辅助判断风格影响关系。

python

1from sklearn.feature_extraction.text import TfidfVectorizer
2from sklearn.metrics.pairwise import cosine_similarity
3
4poems = ["李白诗1", "杜甫诗1", "李白诗2"]
5vectorizer = TfidfVectorizer()
6tfidf = vectorizer.fit_transform(poems)
7similarity = cosine_similarity(tfidf[0], tfidf[1])  # 李白与杜甫诗词相似度

（二）意象情感分析

情感词典匹配：构建中文情感词典（如BosonNLP），标注意象情感倾向（积极/消极）。

LSTM模型训练：使用诗词数据集训练情感分类模型，预测整首诗词情感极性。

python

1from tensorflow.keras.models import Sequential
2from tensorflow.keras.layers import LSTM, Dense
3
4model = Sequential([
5    LSTM(64, input_shape=(100, 1)),  # 假设诗词长度为100
6    Dense(1, activation="sigmoid")
7])
8model.compile(loss="binary_crossentropy", optimizer="adam")
9model.fit(X_train, y_train, epochs=10)  # X_train为词向量序列

四、应用场景与效果

教育领域：生成诗人关系图谱辅助课堂教学，学生可通过交互式图表探索诗词背景。
文化研究：量化分析诗人风格演变（如从盛唐到中唐的意象变化），为学术研究提供数据支持。
公众传播：开发微信小程序，用户输入诗人姓名即可查看其社交网络与代表诗词地图。

效果示例：

在李白知识图谱中，用户点击“李白”节点可展开其好友（杜甫、孟浩然）、游历地点（长安、洛阳）、代表诗词（《将进酒》《静夜思》）等子节点。
时空地图动态展示李白一生轨迹，标记关键事件（如“赐金放还”发生地）。

五、未来优化方向

多模态扩展：引入诗词朗诵音频、书法图片等非文本数据，丰富图谱维度。
实时更新：对接诗词创作平台API，动态添加新作品至知识图谱。
跨语言支持：构建中英双语知识图谱，促进国际文化交流。

本方案通过Python生态工具链实现了古诗词知识图谱的自动化构建与可视化，为传统文化数字化提供了可复用的技术框架。

运行截图

项目案例

优势

1-项目均为博主学习开发自研，适合新手入门和学习使用

2-所有源码均一手开发，不是模版！不容易跟班里人重复！

为什么选择我

博主是CSDN毕设辅导博客第一人兼开派祖师爷、博主本身从事开发软件开发、有丰富的编程能力和水平、累积给上千名同学进行辅导、全网累积粉丝超过50W。是CSDN特邀作者、博客专家、新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流和合作。

🍅✌感兴趣的可以先收藏起来，点赞关注不迷路，想学习更多项目可以查看主页，大家在毕设选题，项目代码以及论文编写等相关问题都可以给我留言咨询，希望可以帮助同学们顺利毕业！🍅✌

源码获取方式

🍅由于篇幅限制，获取完整文章或源码、代做项目的，拉到文章底部即可看到个人联系方式。🍅

点赞、收藏、关注，不迷路，下方查↓↓↓↓↓↓获取联系方式↓↓↓↓↓↓↓↓

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

数据库范式那些事

简单的说，bc范式是在第三范式的基础上的一种特殊情况，既每个表中只有一个候选键（在一个数据库中每行的值都不相同，则可称为候选键），在上面第三范式的noNf表中可以看出，每一个员工的email都是唯一的（难道两个人用同一个email?数据库范式在数据库设计中的地位一直很暧昧，教科书中对于数据库范式倒是都给出了学术性的定义，但实际应用中范式的应用却不甚乐观，这篇文章会用简单的语言和一个简单的数据库DE

2048 AI社区

基于SpringAI的在线考试系统-DDD业务领域模块设计思路

2048 AI社区

CSS AI 编程

AI 技术的飞速发展正在深刻改变开发者的工作方式。在 HTML 网页开发中，我们常常被大量细微却高频的重复操作降低效率。因此，AI 的出现可以改变我们的编程方式与提高效率。AI 对我们来说就是一个可靠的编程助手，给我们提供了实时的建议和解决方案，无论是根据图片生成前端页面、快速修复错误，或者查找关键文档和资源，AI 作为编程助手都能让你事半功倍。