以 GPT 技术为核心的人工智能系统出现后迅速引领了行业的变革,不仅用于大量的语言工作(如邮件编写或文章生成等工作),还被应用在一些较特殊的领域——例如去年就有同学尝试使用 ChatGPT 作弊并被当场逮捕(全校被取消成绩)。相信聪明的你一定不会犯一样的错误!

言归正传,对于 GPT 类的 AI,一个使用方式受到不少年轻用户的欢迎——将 AI 变成猫娘:

image.png


部分公司使用 AI 进行网络营销,网友同样乐于使用“变猫娘”的方式进行反击。注意:图中内容与题目无关,如无法看到图片不影响解题。

当然,由于训练数据里并不区分道德或伦理倾向,因此如果不加审查,AI 会生成大量的、不一定符合社会公序良俗的内容。尽管关于这个问题仍有争论,但至少在比赛中,我们还是期望 AI 能用于对人类更有帮助的方向上,少来一点猫娘。

因此你的工作是实现一个审查内容的代码,用于对 AI 生成的内容的初步审定。更具体地说,你会得到一段由大小写字母、数字、空格及 ASCII 码范围内的标点符号的文字,以及若干个违禁词以及警告阈值,你需要首先检查内容里有多少违禁词,如果少于阈值个,则简单地将违禁词替换为<censored>;如果大于等于阈值个,则直接输出一段警告并输出有几个违禁词。

输入格式:

输入第一行是一个正整数 N (1≤N≤100),表示违禁词的数量。接下来的 N 行,每行一个长度不超过 10 的、只包含大小写字母、数字及 ASCII 码范围内的标点符号的单词,表示应当屏蔽的违禁词。
然后的一行是一个非负整数 k (0≤k≤100),表示违禁词的阈值。
最后是一行不超过 5000 个字符的字符串,表示需要检查的文字。
从左到右处理文本,违禁词则按照输入顺序依次处理;对于有重叠的情况,无论计数还是替换,查找完成后从违禁词末尾继续处理。

输出格式:

如果违禁词数量小于阈值,则输出替换后的文本;否则先输出一行一个数字,表示违禁词的数量,然后输出He Xie Ni Quan Jia!

输入样例1:

5
MaoNiang
SeQing
BaoLi
WeiGui
BuHeShi
4
BianCheng MaoNiang ba! WeiGui De Hua Ye Keyi Shuo! BuYao BaoLi NeiRong.

输出样例1:

BianCheng <censored> ba! <censored> De Hua Ye Keyi Shuo! BuYao <censored> NeiRong.

输入样例2:

5
MaoNiang
SeQing
BaoLi
WeiGui
BuHeShi
3
BianCheng MaoNiang ba! WeiGui De Hua Ye Keyi Shuo! BuYao BaoLi NeiRong.

输出样例2:

3
He Xie Ni Quan Jia!

输入样例3:

2
AA
BB
3
AAABBB

输出样例3:

<censored>A<censored>B

输入样例4:

2
AB
BB
3
AAABBB

输出样例4:

AA<censored><censored>

输入样例5:

2
BB
AB
3
AAABBB

输出样例5:

AAA<censored>B

题目大意

给定一个敏感词列表和一段文本,要求:

  1. 按顺序匹配每个敏感词;
  2. 一旦发现某个敏感词出现在文本中,将其替换为 <censored>
  3. 替换后将文本分为三部分:
    • 左边部分:继续用下一个敏感词检查
    • 中间部分:替换为 <censored>
    • 右边部分:从第一个敏感词重新开始检查
  4. 统计总共替换次数;
  5. 若替换次数 ≥ 阈值 key,输出:
    [替换次数]
    He Xie Ni Quan Jia!
    否则输出处理后的文本。

Java实现:

import java.io.*;
import java.util.ArrayList;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
        BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(System.out));

        List<String> sensitiveWords = new ArrayList<>();
        int wordCount = Integer.parseInt(br.readLine());
        for (int i = 0; i < wordCount; i++) {
            String word = br.readLine().trim();
            // 防止 <censored> 导致无限递归
            if ("<censored>".equals(word)) {
                continue;
            }
            if (!word.isEmpty()) {
                sensitiveWords.add(word);
            }
        }

        int threshold = Integer.parseInt(br.readLine());
        String message = br.readLine();

        Integer[] count = {0};
        String result = filter(sensitiveWords, 0, message, count);

        if (count[0] >= threshold) {
            System.out.println(count[0]);
            System.out.println("He Xie Ni Quan Jia!");
        } else {
            System.out.println(result);
        }

        br.close();
        bw.close();
    }

    /**
     * 递归过滤函数
     * @param words 敏感词列表
     * @param index 当前检查的敏感词索引
     * @param text 当前待处理文本
     * @param count 替换次数(引用传递)
     * @return 处理后的文本
     */
    public static String filter(List<String> words, int index, String text, Integer[] count) {
        // 所有敏感词已检查完,返回当前文本
        if (index >= words.size()) {
            return text;
        }

        String currentWord = words.get(index);
        int pos = text.indexOf(currentWord); // 找第一个匹配位置

        if (pos != -1) {
            count[0]++; // 替换次数 +1

            // 左段:从 index+1 开始继续检查
            String left = filter(words, index + 1, text.substring(0, pos), count);
            // 右段:从 0 开始重新检查(关键!)
            String right = filter(words, 0, text.substring(pos + currentWord.length()), count);

            return left + "<censored>" + right;
        } else {
            // 当前词未匹配,检查下一个
            return filter(words, index + 1, text, count);
        }
    }
}

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐