一、系统说明

宫颈癌风险因素分析与可视化系统是基于大数据和机器学习技术开发的智能化健康管理平台。系统采用 Flask 框架构建,集成了随机森林算法、K-Means聚类分析、PySpark 大数据处理以及 DeepSeek AI 智能助手,为用户提供全方位的宫颈癌风险评估和健康管理服务。系统支持用户和管理员双角色,实现了从健康数据采集、风险评估、可视化报告到群体特征分析的全流程管理,通过科学的数据分析和可视化展示,帮助用户了解自身健康状况,为医疗决策提供数据支持。
在这里插入图片描述
完整代码请点这里下载

二、系统架构

技术栈

  • 后端框架: Flask 3.0.0
  • 前端技术: Bootstrap 5.3.0 + ECharts 5.4.3
  • 机器学习: scikit-learn 1.3.2(随机森林、K-Means)
  • 大数据处理: PySpark 3.5.0
  • 数据库: SQLite
  • AI服务: DeepSeek API

系统角色

  • 普通用户: 健康数据管理、风险评估、报告查看
  • 管理员: 数据管理、用户管理、模型管理、系统监控

三、用户端功能

1. 健康数据录入

用户可详细录入个人健康信息,包括年龄、体重、身高、生活习惯(吸烟、饮酒、运动频率)、生育史、HPV感染情况、家族病史等十四项关键风险因素。系统提供表单验证和实时提示,确保数据的完整性和准确性,为后续的风险评估提供可靠的数据基础。
在这里插入图片描述

2. 风险评估

基于随机森林算法对用户健康数据进行智能分析,快速生成风险评估报告。系统综合考虑各项风险因素的权重和交互作用,输出低、中、高三个风险等级,并显示各项指标的风险概率,帮助用户直观了解自身宫颈癌患病风险,为预防措施提供科学依据。
在这里插入图片描述

3. 评估报告

提供详细的可视化评估报告,包含风险等级、风险概率、特征重要性分析以及各风险因素的具体影响程度。报告以图表和文字相结合的方式呈现,支持在线查看和下载,便于用户保存记录和与医生沟通,实现个性化的健康指导。
在这里插入图片描述

4. 历史记录

记录用户所有历史评估结果,支持按时间轴查看,追踪健康状况变化趋势。系统自动保存每次评估的详细数据,用户可随时回顾历史报告,对比不同时期的健康指标,及时发现健康变化,为长期健康管理提供参考依据和决策支持。
在这里插入图片描述

5. 趋势分析

基于历史评估数据,运用可视化图表展示用户健康状况的变化趋势。系统提供多种图表类型(折线图、柱状图等),直观呈现风险等级变化、关键指标波动等趋势信息,帮助用户了解健康状态的发展方向,及时调整生活习惯和预防策略。

6. 聚类分析

运用 K-Means 聚类算法将用户群体划分为不同的风险类别,展示用户所属群体的特征分布。系统分析群体共性特征,提供同类用户的健康状况对比,帮助用户了解自己在群体中的位置,获得更具参考价值的健康建议。
在这里插入图片描述

7. AI 助手

集成 DeepSeek 大语言模型,提供智能健康咨询服务。用户可向 AI 助手提问关于宫颈癌预防、症状识别、治疗建议等相关问题,系统基于海量医学知识库提供专业、准确的解答,实现 7×24 小时的智能健康咨询。
在这里插入图片描述

8. 个人资料管理

用户可管理个人基本信息,包括用户名、邮箱、联系方式等。支持修改密码、更新头像等功能,确保账户安全。个人资料与评估结果关联,系统可根据用户年龄、性别等信息提供更精准的健康建议和个性化风险评估服务。
在这里插入图片描述


四、管理员端功能

1. 数据驾驶舱

提供系统运营数据的实时可视化展示,包括用户统计、评估统计、风险分布、评估趋势等关键指标。通过仪表盘、图表、卡片等多种形式展示系统运行状态,帮助管理员快速掌握系统整体情况,为决策提供全面的数据支持和分析。
在这里插入图片描述

2. 数据管理

支持对系统中的健康数据、评估结果、用户信息进行统一管理。提供数据浏览、搜索、筛选功能,支持批量导入和导出 Excel 格式数据,包括血液检测数据的批量导入。管理员可查看、编辑、删除数据记录,确保数据的准确性和完整性。
在这里插入图片描述

3. 用户管理

实现用户账户的全生命周期管理,包括用户注册审核、信息查看、账户状态管理。支持启用/禁用用户账户、修改用户角色(普通用户/管理员)、查看用户活动记录等功能。管理员可维护用户数据库,确保系统的安全性和稳定性。
在这里插入图片描述

4. 模型管理

提供机器学习模型的训练、评估和性能监控功能。管理员可重新训练随机森林模型,设置训练参数(如树的数量、最大深度),查看模型评估指标(准确率、精确率、召回率、F1分数),监控模型性能变化,确保模型持续优化。
在这里插入图片描述

5. 聚类分析

对全系统用户数据进行 K-Means 聚类分析,识别不同用户群体的特征模式。管理员可设置聚类数量,查看各聚类中心的特征分布、用户数量占比等,为精准健康管理和个性化服务提供深层次的群体数据洞察和决策参考。
在这里插入图片描述

6. 系统监控

实时监控系统运行状态,包括服务器性能(CPU、内存、磁盘)、数据库状态、API调用统计、错误日志等。提供性能指标的可视化展示和预警机制,帮助管理员及时发现和解决系统问题,有效保障系统的稳定运行和持续服务。
在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐