论文阅读:AIED 2025 Automatic Modeling and Analysis of Students’ Problem-Solving Handwriting Trajectories
本文提出了一种结合数字笔技术与多模态大型语言模型(MLLMs)的新型方法CogChain,通过收集25名高中生在数学、物理、化学三科共87,679条解题手写轨迹数据,自动构建逻辑链并从解题维度、时间维度、课程维度展开多维度分析,发现中等复杂度解题模式准确率最高、结构化推理时间占比更高的学生表现更优、不同学科需适配专属解题与时间管理策略等关键结论,为个性化教育提供了重要指导。核心痛点:传统考试评估难
总目录 大模型相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328
https://link.springer.com/chapter/10.1007/978-3-031-98414-3_16
https://www.doubao.com/chat/35331140679072514
论文原文:https://download.csdn.net/download/WhiffeYF/92545046
论文集下载:https://download.csdn.net/download/WhiffeYF/92543315
论文翻译:https://blog.csdn.net/WhiffeYF/article/details/156719731

速览
1. 一段话总结
本文提出了一种结合数字笔技术与多模态大型语言模型(MLLMs) 的新型方法CogChain,通过收集25名高中生在数学、物理、化学三科共87,679条解题手写轨迹数据,自动构建逻辑链并从解题维度、时间维度、课程维度展开多维度分析,发现中等复杂度解题模式准确率最高、结构化推理时间占比更高的学生表现更优、不同学科需适配专属解题与时间管理策略等关键结论,为个性化教育提供了重要指导。
2. 思维导图

## 研究背景与目标
- 背景:传统方法难捕捉解题认知模式,手写轨迹可重构逻辑链
- 目标:通过CogChain构建逻辑链,分析多维度认知模式
## 核心组件
- 数据收集:数字笔记录时空坐标、时间等87,679条轨迹
- CogChain方法
- 时间分段:2s阈值划分书写/思考阶段
- 轨迹分类:草图、方程等5类
- 可视化:甘特图呈现逻辑链
- 多维度分析:解题、时间、课程维度
## 关键发现
- 解题维度:4类模式,中等复杂度(分步推导)准确率74.1%最高
- 时间维度:3类分配模式,结构化推理占比高者表现优
- 课程维度:数学需分步推导,物理需视觉推理,化学需快速解题
## 研究价值与局限
- 价值:为个性化教学、智能题库等提供数据支撑
- 局限:数据集规模/多样性不足,MLLMs难抓深层推理
3. 详细总结
一、研究背景与意义
- 核心痛点:传统考试评估难以逐一分析学生完整解题过程,学生也难以准确回忆解题思路,无法有效捕捉认知模式。
- 解决思路:通过数字笔记录手写轨迹,重构解题逻辑链(含解题轨迹模式与时间分配模式),为个性化教学和教学策略优化提供依据。
- 研究目标:明确逻辑链在解题、时间、课程三个维度的特征与规律。
二、数据收集与方法设计
(一)数据集构建
| 关键信息 | 具体内容 |
|---|---|
| 样本规模 | 25名高中生(10男15女,17-19岁) |
| 学科覆盖 | 数学、物理、化学 |
| 数据量 | 37套试卷,共87,679条手写轨迹段 |
| 数据维度 | 笔运动时空坐标(x,y)、时间戳、状态(落笔/移动/抬笔)等 |
| 预处理 | 坐标映射到答题卡,关联题目、评分等信息 |
(二)CogChain逻辑链构建流程
- 时间基于轨迹分段:设定2s阈值,相邻轨迹间隔<2s归为连续书写阶段,>2s视为思考间隙,记录各阶段时长。
- 手写轨迹分类:通过MLLMs将轨迹分为5类——草图(坐标轴等)、方程(计算表达式)、标记(划线/下划线)、选择题答案(A/B/C/D)、未知内容(涂鸦等),同时实现题目关联匹配。
- 逻辑链可视化:采用甘特图呈现,横轴为时间进程,纵轴为题目,不同颜色标注书写类型,灰色区域表示思考间隙。
三、多维度分析结果
(一)解题维度(4类解题轨迹模式)
| 模式类型 | 核心特征 | 平均轨迹组数 | 准确率 | 适用场景 |
|---|---|---|---|---|
| 快速解题 | 以标记为主,计算最少 | 2.8 | 71.8% | 选择题、代数类题目(函数变换等) |
| 视觉推理 | 以草图为核心 | 6.7 | 70.7% | 几何类题目(圆弦角、 cyclic四边形) |
| 分步推导 | 方程+标记结合,逻辑系统 | 11.2 | 74.1% | 主观题、需详细解释的题目 |
| 综合计算 | 大量方程推导,过程详尽 | 29.5 | 73.6% | 复杂主观题 |
- 关键发现:解题复杂度与准确率无正相关,中等复杂度的分步推导模式准确率最高(74.1%),学生需根据题目类型(选择/主观)和知识主题(代数/几何)自适应选择模式。
(二)时间维度(3类时间分配模式)
| 模式类型 | 书写速度(平均) | 思考间隙(平均) | 准确率 | 核心特征 |
|---|---|---|---|---|
| 快速-低准确率 | 12.1s | 95.8s | 45.0% | 反向答题占比5.3%,思考低效 |
| 快速-高准确率 | 12.7s | 47.2s | 65.5% | 时间效率最高,总解题时间59.8s |
| 慢速-高准确率 | 42.8s | 106.6s | 70.3% | 后期答题时间(249.4s)远高于前期,推理深入 |
- 关键发现:思考间隙的功能存在差异,长思考时间未必带来高准确率,结构化推理时间占比更高的学生表现更优;快速-低准确率组过度依赖快速解题,需引导采用系统方法。
(三)课程维度
| 学科 | 最优解题策略 | 平均准确率 | 时间分配特征(中位数) | 学生常见问题 |
|---|---|---|---|---|
| 数学 | 分步推导 | 80% | 书写时间5s,思考时间28s | 偏好快速解题,准确率偏低 |
| 物理 | 视觉推理 | 93.8% | 书写时间11s,思考时间57s | 倾向慢速策略,未充分利用视觉推理 |
| 化学 | 快速解题 | 80.9% | 书写时间12s,思考时间46s | 过度依赖慢速策略,效率不足 |
- 关键发现:各学科认知模式差异显著,思考间隙中位数为书写时间的4-5倍,分析规划是解题核心;快速解题模式在各学科均存在时间分布分散的不稳定性。
四、研究价值与局限
(一)核心价值
- 认知诊断:为 educators 分析解题过程、智能题库系统适配学习需求提供数据支撑。
- 学习策略:构建学生认知画像,指导学生和 educators 优化学习策略。
- 学科教学:为教材编写(强化思维训练)和考试设计(匹配学科特征)提供参考。
(二)局限性
- 数据集:仅覆盖单班理科学生,规模小、多样性不足,未涉及不同学业水平、 socioeconomic背景学生。
- 技术层面:MLLMs依赖表面模式匹配,难以捕捉深层推理和概念错误,自适应反馈能力有限。
4. 关键问题
问题1:CogChain方法是如何从原始手写轨迹数据中构建出可用于分析的逻辑链?
- 答案:CogChain通过三步实现逻辑链构建:①时间基于轨迹分段,设定2s阈值,将相邻轨迹间隔<2s的归为连续书写阶段,>2s的视为思考间隙,记录各阶段时长;②通过MLLMs对分段后的轨迹进行双分类,既识别轨迹类型(草图、方程、标记、选择题答案、未知内容5类),又关联对应的题目;③采用甘特图可视化逻辑链,横轴为时间进程,纵轴为题目,用不同颜色标注书写类型、灰色区域表示思考间隙,清晰呈现解题的时间序列和逻辑关系。
问题2:不同解题轨迹模式的适用场景和准确率表现如何,能给学生解题带来哪些具体指导?
- 答案:研究识别出4类解题轨迹模式,具体适用场景和准确率如下:①快速解题(平均2.8组轨迹,准确率71.8%),适用于选择题和代数类题目(如函数变换),需减少无效计算,聚焦关键信息;②视觉推理(平均6.7组轨迹,准确率70.7%),适用于几何类题目(如圆弦角),需善用图形辅助理解;③分步推导(平均11.2组轨迹,准确率74.1%),适用于主观题和需详细解释的题目,需注重逻辑连贯性;④综合计算(平均29.5组轨迹,准确率73.6%),适用于复杂主观题,需控制推导冗余。指导意义:解题需平衡细节与简洁性,避免盲目追求复杂或简化,应根据题目类型(选择/主观)和知识主题(代数/几何)自适应选择模式。
问题3:不同学科在解题策略和时间管理上有哪些核心差异, educators 应如何制定个性化教学策略?
- 答案:学科核心差异及教学策略如下:①数学(逻辑严谨):最优策略为分步推导(准确率80%),时间分配上思考时间(28s)远长于书写时间(5s),教学中应强化逻辑推导训练,引导学生减少对快速解题的过度依赖;②物理(抽象概念多):最优策略为视觉推理(准确率93.8%),思考时间最长(57s),需多提供图形化教学工具,培养学生通过草图拆解问题的能力;③化学(知识点零散):最优策略为快速解题(准确率80.9%),书写时间(12s)相对较长,教学中应梳理知识体系,提升学生快速提取关键信息的能力。此外,针对时间分配模式,需引导快速-低准确率学生增加结构化推理时间,鼓励采用分步推导;为慢速-高准确率学生优化时间分配,提升答题效率。
更多推荐


所有评论(0)