论文阅读：BRACIS 2024 Investigating Universal Adversarial Attacks Against Transformers-Based Automatic Es

先说说背景：现在很多自动评分系统用的是“Transformer”这种先进的AI技术（比如BERT、Phi-3、Gemini这些模型），虽然评分效率高，还能用于GRE、托福这类重要考试，但这些AI其实可能“走捷径”——不是真的看懂作文质量，而是靠一些表面特征（比如字数多、用了很多副词形容词）来打分。这份文档主要研究了一个很实际的问题：现在常用的“自动作文评分系统”（比如改作业时帮老师打分的AI），会

CV-杨帆

319人浏览 · 2025-09-15 21:11:36

CV-杨帆 · 2025-09-15 21:11:36 发布

总目录大模型相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328

https://dl.acm.org/doi/10.1007/978-3-031-79032-4_12

https://www.doubao.com/chat/20594626384092674

Investigating Universal Adversarial Attacks Against Transformers-Based Automatic Essay Scoring Systems

在这里插入图片描述

速览

这份文档主要研究了一个很实际的问题：现在常用的“自动作文评分系统”（比如改作业时帮老师打分的AI），会不会被学生用简单方法“骗分”——也就是学生没写出好作文，却让AI给高分。研究团队还专门测试了三款主流的AI模型，看看它们的“防骗能力”怎么样。

先说说背景：现在很多自动评分系统用的是“Transformer”这种先进的AI技术（比如BERT、Phi-3、Gemini这些模型），虽然评分效率高，还能用于GRE、托福这类重要考试，但这些AI其实可能“走捷径”——不是真的看懂作文质量，而是靠一些表面特征（比如字数多、用了很多副词形容词）来打分。学生要是发现了这些规律，就可能故意钻空子。

研究团队是怎么做的呢？

先搞清楚AI可能关注哪些“表面特征”：他们训练了一个简单的“线性回归模型”，分析了72个作文特征（比如副词占比、形容词数量、文章长度），发现“副词多、形容词多”是AI很看重的加分项。
模拟学生“骗分”：根据这些特征，设计了9种简单的“骗分作文”，比如：
- 只列一堆副词（“好地、坏地、快速地……”）；
- 把副词列表重复4遍，假装是4段作文；
- 写一句堆满副词形容词的话（比如“无可否认地，缓慢又仔细地思考这个重要又复杂的问题”），然后重复10遍凑字数。
  后来还加了第10种：写一句像“结尾段”的话（比如“政府应该快速通过法律解决这些可怕的问题”），重复7遍，专门骗“结尾段评分”。
测试三款AI：把这些“骗分作文”发给BERT、Phi-3、Gemini打分，看它们会不会给高分（满分1000，600算及格）。

结果很有意思，三款AI表现不一样，但都有漏洞：