Lora微调glm-4-9b-chat模型，完成多文档摘要生成任务

快乐的钢镚子

827人浏览 · 2025-11-24 12:44:49

快乐的钢镚子 · 2025-11-24 12:44:49 发布

一、基本情况

1.1 模型介绍

GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中，GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出较高的性能。除了能进行多轮对话，GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用（Function Call）和长文本推理（支持最大 128K 上下文）等高级功能。本代模型增加了多语言支持，支持包括日语，韩语，德语在内的 26 种语言。我们还推出了支持 1M 上下文长度（约 200 万中文字符）的模型。
模型地址：https://huggingface.co/zai-org/glm-4-9b-chat

1.2 数据集介绍

对于模型微调任务而言，数据集的质量和数量都是极其重要的，数据集的构建需要按照能否完全满足个人对模型的要求来搜集和整理，其中也不乏对数据进行特殊化的处理。本次任务主题是多文档的摘要生成，但是有一个附加需求就是对于摘要的生成需要按照文档中出现的时间信息的顺序排列重要事件，这样就要求出现在文档中的时间类str数量不能过多，因为每一件小阶段事情的描述都记录在一个时间内，这样模型生成的摘要内容就会过于冗余不够简短。所以本任务采取的数据集对于发生在一个时间点或者一个时间段的事件进行了重点描述。另外为了让LLM能够更好的识别文档之间的界线以及时间类文本，在文档中加入了特殊标记符[doc_s][doc_e][time_s][time_e]分别表示单篇文档的开始与结束和时间类文本的开始与结束，并在prompt text中强调这一点。
上面是对本任务数据集的格式描述，下面对于数据集是怎么搜集的进行介绍。在这里采用的半人工的方式进行构建，使用了其他chat模型自动生成上述格式的不同主题的事件，然后人工审查每一条数据的格式以及摘要内容是否满足需求，由于人力有限在本任务中使用到的训练数据集仅190条，测试数据集仅10条，不过单条数据字数可以定义为长文本。后续针对小数据集在一些微调训练参数上也会进行调整。（需要数据集的可以私信我，免费分享）

二、代码展示

代码主要分为三部分，数据集预处理、Lora微调chatglm4、使用微调后的模型在测试数据上进行推理

2.1 data_preprocess.py

# -*- coding:utf-8 -*-
"""
    文件说明：多文档摘要数据集处理
"""

import json
import torch
from torch.nn.utils.rnn import pad_sequence # 用于对序列进行填充，使batch内的序列长度一致
from torch.utils.data import Dataset


class MultiDocSummaryDataSet(Dataset):
    """多文档摘要数据处理函数"""
    def __init__(self, data_path, tokenizer, max_len, max_src_len, prompt_text):
        self.all_data = []
        with open(data_path, "r", encoding="utf-8") as fh:
            for i, line in enumerate(fh):
                sample = json.loads(line.strip())
                document = sample["document"]
                abstract = sample["abstract"]
            
                # 处理文档文本
                src_tokens = tokenizer.tokenize(document)
                prompt_tokens = tokenizer.tokenize(prompt_text)

                # 截断过长的源文本
                if len(src_tokens) > max_src_len - len(prompt_tokens):
                    src_tokens = src_tokens[:max_src_len - len(prompt_tokens)]

                # 计算目标文本的最大长度
                max_tgt_len = max_len - len(prompt_tokens) - len(src_tokens) - 3
                tgt_tokens = tokenizer.tokenize(abstract)
            
                # 截断过长的目标文本
                if len(tgt_tokens) > max_tgt_len:
                    tgt_tokens = tgt_tokens[:max_tgt_len]
            
                """
				构建输入序列: prompt + document + [gMASK] + <sop> + abstract + <eop>
				GLM模型特有的格式：
				[gMASK]: 全局掩码标记
				<sop>: 序列开始标记
				<eop>: 序列结束标记
				"""
                tokens = prompt_tokens + src_tokens + ["[gMASK]", "<sop>"] + tgt_tokens + ["<eop>"]
                input_ids = tokenizer.convert_tokens_to_ids(tokens)
              
				"""
                找到上下文长度（[gMASK]之前的部分）
				构建训练标签
				context_length: 需要被掩码的部分（提示文本+文档+[gMASK]）
				labels:前context_length个位置设为-100（损失计算时忽略）。后面的部分使用真实的token ID（模型需要预测的部分）。这样设计的目的是让模型只学习预测摘要部分，不学习预测输入部分
				"""
                context_length = len(prompt_tokens) + len(src_tokens) + 1  # +1 for [gMASK]
                mask_position = context_length - 1
                labels = [-100] * context_length + input_ids[mask_position + 1:]

                # 填充到最大长度
                pad_len = max_len - len(input_ids)
                input_ids = input_ids + [tokenizer.pad_token_id] * pad_len
                labels = labels + [-100] * pad_len # 用-100填充labels（填充部分不参与损失计算）

                self.all_data.append({
                    "document": document,
                    "abstract": abstract, 
                    "input_ids": input_ids, 
                    "labels": labels
                })
            
        print(f"Loaded {len(self.all_data)} samples from {data_path}")

    def __len__(self):
        return len(self.all_data)

    def __getitem__(self, item):
        instance = self.all_data[item]
        return instance

"""
将多个样本组合成一个batch，将input_ids和labels转换为PyTorch张量，使用pad_sequence对序列进行填充，确保batch内序列长度一致，填充值使用20003（GLM模型的pad_token_id）
"""
def coll_fn(batch):
    input_ids_list, labels_list = [], []
    for instance in batch:
        input_ids_list.append(torch.tensor(instance["input_ids"], dtype=torch.long))
        labels_list.append(torch.tensor(instance["labels"], dtype=torch.long))
    return {
        "input_ids": pad_sequence(input_ids_list, batch_first=True, padding_value=20003),
        "labels": pad_sequence(labels_list, batch_first=True, padding_value=20003)
    }

2.2 finetunning_lora_glm4(single_gpu).py

# -*- coding:utf-8 -*-
"""
    文件说明：多文档摘要GLM-4-9B-Chat模型LoRA微调（单GPU版本）
"""

from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments, Trainer
import torch
import argparse
from data_preprocess import MultiDocSummaryDataSet, coll_fn
import os
from peft import LoraConfig, get_peft_model
import json


def print_trainable_parameters(model):
    """打印可训练参数"""
    trainable_params = 0
    all_param = 0
    for _, param in model.named_parameters():
        num_params = param.numel()
        all_param += num_params
        if param.requires_grad:
            trainable_params += num_params
    print(
        f"可训练参数: {trainable_params} || 总参数: {all_param} || 可训练比例: {100 * trainable_params / all_param:.2f}%")


def set_args():
    parser = argparse.ArgumentParser()
    parser.add_argument('--train_path', default='/root/siton-object-fb4db1d284004bd5ac149d8493dbc4b7/LLM-finetunning/data/self_train.jsonl', type=str, help='训练数据路径')
    parser.add_argument('--model_dir', default="/root/siton-object-fb4db1d284004bd5ac149d8493dbc4b7/LLM-finetunning/glm-4-9b-chat", type=str, help='模型路径') # 这里的模型路径采用的本地路径，因为使用的云服务器无法访问外网，不过即使这里使用的服务器能够访问外网也推荐先将模型下载到本地导入，因为这样节省时间。使用指令加载也是要先下载再导入。
    parser.add_argument('--num_train_epochs', default=8, type=int, help='训练轮数')  # 增加epoch数以应对小数据集
    parser.add_argument('--per_device_train_batch_size', default=1, type=int, help='每设备batch size')
    parser.add_argument('--gradient_accumulation_steps', default=8, type=int, help='梯度累积步数')
    parser.add_argument('--output_dir', default='output_dir_lora_glm4_single/', type=str, help='输出目录')
    parser.add_argument('--logging_steps', type=int, default=5, help='日志打印步数')
    parser.add_argument('--save_steps', type=int, default=50, help='保存步数')
    parser.add_argument('--max_len', type=int, default=2048, help='最大序列长度')  # 减少序列长度以适应单卡
    parser.add_argument('--max_src_len', type=int, default=1536, help='最大源文本长度')  # 相应减少源文本长度
    parser.add_argument('--lora_r', type=int, default=8, help='lora rank')
    parser.add_argument('--lora_alpha', type=int, default=16, help='lora alpha')
    parser.add_argument('--lora_dropout', type=float, default=0.05, help='lora dropout')
    parser.add_argument('--learning_rate', type=float, default=5e-5, help='学习率')  # 更小的学习率
    parser.add_argument('--warmup_ratio', type=float, default=0.1, help='warmup比例')
    parser.add_argument('--weight_decay', type=float, default=0.01, help='权重衰减')
    parser.add_argument('--prompt_text', type=str,
                        default="请对以下多篇文档进行摘要，提取每篇文档的重要信息，特别是时间信息，并按照时间顺序组织摘要内容。在数据中以[doc_s][doc_e]分别表示一篇文档的开始与结束，多篇文档首尾连接成一个长文本；[time_s][time_e]分别表示时间戳格式文本的开始与结束。要求摘要语句通顺，包含每篇文档的核心内容。文档：",
                        help='提示文本')
    return parser.parse_args()


def main():
    args = set_args()

    # 创建输出目录
    os.makedirs(args.output_dir, exist_ok=True)

    # 保存训练参数
    with open(os.path.join(args.output_dir, "training_args.json"), "w", encoding="utf-8") as f:
        json.dump(vars(args), f, ensure_ascii=False, indent=2)

    # 加载模型和tokenizer
    print("加载模型和tokenizer...")
    tokenizer = AutoTokenizer.from_pretrained(args.model_dir, trust_remote_code=True)
  
    # 设置pad_token
    if tokenizer.pad_token is None:
        tokenizer.pad_token = tokenizer.eos_token

    # 加载模型，使用bfloat16以节省显存
    print("加载预训练模型...")
    model = AutoModelForCausalLM.from_pretrained(
        args.model_dir,
        torch_dtype=torch.bfloat16,
        trust_remote_code=True,
        device_map="auto"
    )

    # 配置LoRA - 只针对query_key_value
    lora_config = LoraConfig(
        r=args.lora_r,
        lora_alpha=args.lora_alpha,
        target_modules=["query_key_value"],  # 只针对attention的QKV矩阵
        lora_dropout=args.lora_dropout,
        bias="none",
        task_type="CAUSAL_LM",
    )

    # 应用LoRA
    print("应用LoRA适配器...")
    model = get_peft_model(model, lora_config)
    print_trainable_parameters(model)

    # 准备数据
    print("准备数据集...")
    train_dataset = MultiDocSummaryDataSet(args.train_path, tokenizer, args.max_len, args.max_src_len, args.prompt_text)

    # 配置训练参数 - 针对单GPU优化
    training_args = TrainingArguments(
        output_dir=args.output_dir,
        overwrite_output_dir=True,
        num_train_epochs=args.num_train_epochs,
        per_device_train_batch_size=args.per_device_train_batch_size,
        gradient_accumulation_steps=args.gradient_accumulation_steps,
        learning_rate=args.learning_rate,
        warmup_ratio=args.warmup_ratio,
        weight_decay=args.weight_decay,
        logging_steps=args.logging_steps,
        save_steps=args.save_steps,
        save_total_limit=2,
        prediction_loss_only=True,
        remove_unused_columns=False,
        dataloader_pin_memory=False,
        bf16=True,  # 使用bfloat16
        # tf32=True,  # 禁用用tf32，因为v100显卡不支持
        gradient_checkpointing=True,  # 梯度检查点以节省显存
        dataloader_num_workers=0,  # 单GPU设为0避免进程问题
        group_by_length=False,
        report_to=[],  # 禁用wandb等记录器
        ddp_find_unused_parameters=False,
    )

    # 创建Trainer
    trainer = Trainer(
        model=model,
        args=training_args,
        train_dataset=train_dataset,
        data_collator=coll_fn,
    )

    # 开始训练
    print("开始训练...")
    trainer.train()

    # 保存最终模型
    final_save_dir = os.path.join(args.output_dir, "final_model")
    trainer.save_model(final_save_dir)
    tokenizer.save_pretrained(final_save_dir)
    print(f"最终模型保存到: {final_save_dir}")


if __name__ == "__main__":
    main()

2.3 predict_lora_glm4(single_gpu).py

# -*- coding:utf-8 -*-
"""
    文件说明：多文档摘要GLM-4-9B-Chat模型推理与ROUGE评估（单GPU版本）- 优化输出格式
"""
import torch
import json
import numpy as np
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel
from tqdm import tqdm
import time
import os
import argparse
from rouge import Rouge


class ROUGEEvaluator:
    """ROUGE评估器"""
  
    def __init__(self):
        self.rouge = Rouge()
  
    def compute_rouge(self, references, predictions):
        """计算ROUGE分数"""
        try:
            scores = self.rouge.get_scores(predictions, references, avg=True)
            return scores
        except Exception as e:
            print(f"Error computing ROUGE: {e}")
            return {
                'rouge-1': {'f': 0.0, 'p': 0.0, 'r': 0.0},
                'rouge-2': {'f': 0.0, 'p': 0.0, 'r': 0.0},
                'rouge-l': {'f': 0.0, 'p': 0.0, 'r': 0.0}
            }
  
    def compute_individual_rouge(self, references, predictions):
        """计算每个样本的ROUGE分数"""
        individual_scores = []
        for ref, pred in zip(references, predictions):
            try:
                score = self.rouge.get_scores([pred], [ref])[0]
                individual_scores.append(score)
            except:
                individual_scores.append({
                    'rouge-1': {'f': 0.0, 'p': 0.0, 'r': 0.0},
                    'rouge-2': {'f': 0.0, 'p': 0.0, 'r': 0.0},
                    'rouge-l': {'f': 0.0, 'p': 0.0, 'r': 0.0}
                })
        return individual_scores


def set_args():
    parser = argparse.ArgumentParser()
    parser.add_argument('--test_path', default='/root/siton-object-fb4db1d284004bd5ac149d8493dbc4b7/LLM-finetunning/data/self_test.jsonl', type=str, help='测试数据路径')
    parser.add_argument('--device', default='cuda:0', type=str, help='设备')
    parser.add_argument('--ori_model_dir', default="/root/siton-object-fb4db1d284004bd5ac149d8493dbc4b7/LLM-finetunning/glm-4-9b-chat", type=str, help='原始模型路径')
    parser.add_argument('--model_dir', default="output_dir_lora_glm4_single/final_model", type=str, help='微调模型路径')
    parser.add_argument('--max_len', type=int, default=2048, help='最大序列长度')
    parser.add_argument('--max_src_len', type=int, default=1536, help='最大源文本长度')
    parser.add_argument('--max_new_tokens', type=int, default=512, help='最大生成token数')
    parser.add_argument('--prompt_text', type=str,
                        default="请对以下多篇文档进行摘要，提取每篇文档的重要信息，特别是时间信息，并按照时间顺序组织摘要内容。在数据中以[doc_s][doc_e]分别表示一篇文档的开始与结束，多篇文档首尾连接成一个长文本；[time_s][time_e]分别表示时间戳格式文本的开始与结束。要求摘要语句通顺，包含每篇文档的核心内容。文档：",
                        help='提示文本')
    parser.add_argument('--output_path', type=str, default='/root/siton-object-fb4db1d284004bd5ac149d8493dbc4b7/LLM-finetunning/data/detailed_comparison_results.json', help='输出文件路径')
    parser.add_argument('--temperature', type=float, default=0.7, help='生成温度')
    parser.add_argument('--top_p', type=float, default=0.8, help='top-p采样')
    return parser.parse_args()


def main():
    args = set_args()
  
    # 设置设备
    device = torch.device(args.device if torch.cuda.is_available() else "cpu")
    print(f"使用设备: {device}")
  
    # 加载模型和tokenizer
    print("加载模型和tokenizer...")
    tokenizer = AutoTokenizer.from_pretrained(args.ori_model_dir, trust_remote_code=True)
  
    # 设置pad_token
    if tokenizer.pad_token is None:
        tokenizer.pad_token = tokenizer.eos_token
  
    # 加载基础模型 - 单GPU优化
    print("加载基础模型...")
    model = AutoModelForCausalLM.from_pretrained(
        args.ori_model_dir,
        torch_dtype=torch.bfloat16,
        trust_remote_code=True,
        device_map=None,
        low_cpu_mem_usage=True,
    )
  
    # 加载LoRA权重
    print(f"从 {args.model_dir} 加载LoRA权重...")
    model = PeftModel.from_pretrained(model, args.model_dir)
  
    # 手动将模型移动到设备
    model = model.to(device)
    model.eval()
  
    print("模型加载成功。")

    # 初始化ROUGE评估器
    rouge_evaluator = ROUGEEvaluator()

    # 加载测试数据
    test_data = []
    with open(args.test_path, "r", encoding="utf-8") as fh:
        for line in fh:
            if line.strip():
                test_data.append(json.loads(line.strip()))

    detailed_results = []
    references = []
    predictions = []
    s_time = time.time()
  
    print(f"处理 {len(test_data)} 个测试样本...")
  
    for i, sample in enumerate(tqdm(test_data, desc="生成摘要")):
        with torch.no_grad():
            document = sample["document"]
            true_abstract = sample["abstract"]
        
            # 构建输入
            input_text = args.prompt_text + document
            inputs = tokenizer(input_text, return_tensors="pt", max_length=args.max_src_len, truncation=True)
        
            # 生成参数
            generation_config = {
                "max_new_tokens": args.max_new_tokens,
                "do_sample": True,
                "top_p": args.top_p,
                "temperature": args.temperature,
                "repetition_penalty": 1.1,
                "pad_token_id": tokenizer.pad_token_id,
                "eos_token_id": tokenizer.eos_token_id,
            }
        
            # 生成摘要
            inputs = {k: v.to(device) for k, v in inputs.items()}
            outputs = model.generate(**inputs, **generation_config)
        
            # 解码结果
            generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
        
            # 提取生成的摘要（去掉输入部分）
            input_length = inputs['input_ids'].shape[1]
            generated_abstract = tokenizer.decode(outputs[0][input_length:], skip_special_tokens=True)
        
            # 清理生成的文本
            generated_abstract = generated_abstract.strip()
        
            # 保存结果
            references.append(true_abstract)
            predictions.append(generated_abstract)
        
            # 打印前几个样本的结果
            if i < 3:  # 打印前3个样本的结果
                print(f"\n=== 样本 {i+1} ===")
                print(f"文档长度: {len(document)} 字符")
                print(f"真实摘要: {true_abstract}")
                print(f"生成摘要: {generated_abstract}")
                print("=" * 80)

    e_time = time.time()
    print(f"总耗时：{(e_time - s_time):.2f}秒")
    print(f"处理样本数：{len(test_data)}")

    # 计算ROUGE分数
    print("\n计算ROUGE分数...")
  
    # 计算平均ROUGE分数
    avg_rouge_scores = rouge_evaluator.compute_rouge(references, predictions)
  
    # 计算每个样本的ROUGE分数
    individual_rouge_scores = rouge_evaluator.compute_individual_rouge(references, predictions)
  
    # 构建详细对比结果
    for i, sample in enumerate(test_data):
        result = {
            "id": i + 1,
            "document": sample["document"],
            "true_abstract": sample["abstract"],
            "generated_abstract": predictions[i],
            "rouge_scores": {
                "rouge1": {
                    "f1": individual_rouge_scores[i]['rouge-1']['f'],
                    "precision": individual_rouge_scores[i]['rouge-1']['p'],
                    "recall": individual_rouge_scores[i]['rouge-1']['r']
                },
                "rouge2": {
                    "f1": individual_rouge_scores[i]['rouge-2']['f'],
                    "precision": individual_rouge_scores[i]['rouge-2']['p'],
                    "recall": individual_rouge_scores[i]['rouge-2']['r']
                },
                "rougeL": {
                    "f1": individual_rouge_scores[i]['rouge-l']['f'],
                    "precision": individual_rouge_scores[i]['rouge-l']['p'],
                    "recall": individual_rouge_scores[i]['rouge-l']['r']
                }
            }
        }
        detailed_results.append(result)

    # 计算平均ROUGE分数
    avg_rouge1_f1 = np.mean([result["rouge_scores"]["rouge1"]["f1"] for result in detailed_results])
    avg_rouge2_f1 = np.mean([result["rouge_scores"]["rouge2"]["f1"] for result in detailed_results])
    avg_rougeL_f1 = np.mean([result["rouge_scores"]["rougeL"]["f1"] for result in detailed_results])
  
    # 构建最终输出
    output_data = {
        "detailed_comparisons": detailed_results,
        "average_rouge_scores": {
            "rouge1_f1": avg_rouge1_f1,
            "rouge2_f1": avg_rouge2_f1,
            "rougeL_f1": avg_rougeL_f1
        },
        "summary": {
            "total_samples": len(detailed_results),
            "test_time": f"{(e_time - s_time):.2f}秒"
        }
    }
  
    # 保存详细对比结果
    with open(args.output_path, "w", encoding="utf-8") as f:
        json.dump(output_data, f, ensure_ascii=False, indent=2)
  
    print(f"\n详细对比结果保存到: {args.output_path}")
  
    # 打印详细对比结果
    print("\n" + "="*120)
    print("详细对比结果")
    print("="*120)
  
    for result in detailed_results:
        print(f"\n样本 {result['id']}:")
        print("-" * 80)
        print(f"文档 (前200字符): {result['document'][:200]}...")
        print(f"真实摘要: {result['true_abstract']}")
        print(f"生成摘要: {result['generated_abstract']}")
        print(f"ROUGE-1: F1={result['rouge_scores']['rouge1']['f1']:.4f}, "
              f"P={result['rouge_scores']['rouge1']['precision']:.4f}, "
              f"R={result['rouge_scores']['rouge1']['recall']:.4f}")
        print(f"ROUGE-2: F1={result['rouge_scores']['rouge2']['f1']:.4f}, "
              f"P={result['rouge_scores']['rouge2']['precision']:.4f}, "
              f"R={result['rouge_scores']['rouge2']['recall']:.4f}")
        print(f"ROUGE-L: F1={result['rouge_scores']['rougeL']['f1']:.4f}, "
              f"P={result['rouge_scores']['rougeL']['precision']:.4f}, "
              f"R={result['rouge_scores']['rougeL']['recall']:.4f}")
        print("-" * 80)
  
    # 打印平均分数
    print("\n" + "="*80)
    print("平均ROUGE分数 (10条数据):")
    print("="*80)
    print(f"ROUGE-1 F1: {avg_rouge1_f1:.4f}")
    print(f"ROUGE-2 F1: {avg_rouge2_f1:.4f}")
    print(f"ROUGE-L F1: {avg_rougeL_f1:.4f}")
    print("="*80)


if __name__ == '__main__':
    main()

三、结果展示

3.1 微调过程及结果

在这里打印了应用lora微调的参数数量、原模型可训练总参数量以及训练过程的loss和learning_rate变化情况。

可训练参数: 2785280 || 总参数: 9402736640 || 可训练比例: 0.03%
准备数据集...
Loaded 190 samples from /root/siton-object-fb4db1d284004bd5ac149d8493dbc4b7/LLM-finetunning/data/self_train.jsonl
开始训练...
  0%|                                                                                                                  | 0/184 [00:00<?, ?it/s]`use_cache=True` is incompatible with gradient checkpointing. Setting `use_cache=False`...
{'loss': 1.2385, 'grad_norm': 5.214696407318115, 'learning_rate': 1.3157894736842106e-05, 'epoch': 0.21}                                       
{'loss': 1.3506, 'grad_norm': 6.197406768798828, 'learning_rate': 2.6315789473684212e-05, 'epoch': 0.42}                                       
{'loss': 1.2782, 'grad_norm': 8.815274238586426, 'learning_rate': 3.9473684210526316e-05, 'epoch': 0.63}                                       
{'loss': 1.3219, 'grad_norm': 7.613351345062256, 'learning_rate': 4.9696969696969694e-05, 'epoch': 0.84}                                       
{'loss': 1.1751, 'grad_norm': 6.380283832550049, 'learning_rate': 4.8181818181818186e-05, 'epoch': 1.05}                                       
{'loss': 1.1423, 'grad_norm': 4.756579399108887, 'learning_rate': 4.666666666666667e-05, 'epoch': 1.26}                                        
{'loss': 1.0975, 'grad_norm': 5.0731987953186035, 'learning_rate': 4.515151515151516e-05, 'epoch': 1.47}                                       
{'loss': 1.0063, 'grad_norm': 5.150835990905762, 'learning_rate': 4.3636363636363636e-05, 'epoch': 1.68}                                       
{'loss': 0.9875, 'grad_norm': 4.564522743225098, 'learning_rate': 4.212121212121212e-05, 'epoch': 1.89}                                        
{'loss': 0.9286, 'grad_norm': 5.331943988800049, 'learning_rate': 4.0606060606060606e-05, 'epoch': 2.11}                                       
{'loss': 0.9813, 'grad_norm': 5.957375526428223, 'learning_rate': 3.909090909090909e-05, 'epoch': 2.32}                                        
{'loss': 0.9984, 'grad_norm': 7.225001335144043, 'learning_rate': 3.757575757575758e-05, 'epoch': 2.53}                                        
{'loss': 0.8118, 'grad_norm': 4.122443199157715, 'learning_rate': 3.606060606060606e-05, 'epoch': 2.74}                                        
{'loss': 0.8358, 'grad_norm': 5.022317886352539, 'learning_rate': 3.454545454545455e-05, 'epoch': 2.95}                                        
{'loss': 0.7818, 'grad_norm': 4.678299427032471, 'learning_rate': 3.303030303030303e-05, 'epoch': 3.16}                                        
{'loss': 0.8545, 'grad_norm': 4.7522759437561035, 'learning_rate': 3.151515151515151e-05, 'epoch': 3.37}                                       
{'loss': 0.7903, 'grad_norm': 5.096492290496826, 'learning_rate': 3e-05, 'epoch': 3.58}                                                        
{'loss': 0.7628, 'grad_norm': 6.107382774353027, 'learning_rate': 2.8484848484848486e-05, 'epoch': 3.79}                                       
{'loss': 0.7772, 'grad_norm': 5.777945518493652, 'learning_rate': 2.696969696969697e-05, 'epoch': 4.0}                                         
{'loss': 0.7584, 'grad_norm': 6.14074182510376, 'learning_rate': 2.5454545454545454e-05, 'epoch': 4.21}                                        
{'loss': 0.7654, 'grad_norm': 6.782031536102295, 'learning_rate': 2.393939393939394e-05, 'epoch': 4.42}                                        
{'loss': 0.7166, 'grad_norm': 6.9256181716918945, 'learning_rate': 2.2424242424242424e-05, 'epoch': 4.63}                                      
{'loss': 0.7116, 'grad_norm': 7.364951133728027, 'learning_rate': 2.090909090909091e-05, 'epoch': 4.84}                                        
{'loss': 0.6378, 'grad_norm': 6.056314468383789, 'learning_rate': 1.9393939393939395e-05, 'epoch': 5.05}                                       
{'loss': 0.6987, 'grad_norm': 6.190637111663818, 'learning_rate': 1.787878787878788e-05, 'epoch': 5.26}                                        
{'loss': 0.6861, 'grad_norm': 6.838103771209717, 'learning_rate': 1.6363636363636366e-05, 'epoch': 5.47}                                       
{'loss': 0.6964, 'grad_norm': 7.523742198944092, 'learning_rate': 1.484848484848485e-05, 'epoch': 5.68}                                        
{'loss': 0.6269, 'grad_norm': 6.031052112579346, 'learning_rate': 1.3333333333333333e-05, 'epoch': 5.89}                                       
{'loss': 0.6713, 'grad_norm': 6.43457555770874, 'learning_rate': 1.1818181818181819e-05, 'epoch': 6.11}                                        
{'loss': 0.7118, 'grad_norm': 6.940394878387451, 'learning_rate': 1.0303030303030304e-05, 'epoch': 6.32}                                       
{'loss': 0.6575, 'grad_norm': 6.606046199798584, 'learning_rate': 8.787878787878788e-06, 'epoch': 6.53}                                        
{'loss': 0.6342, 'grad_norm': 5.425838947296143, 'learning_rate': 7.272727272727272e-06, 'epoch': 6.74}                                        
{'loss': 0.6273, 'grad_norm': 6.840662479400635, 'learning_rate': 5.7575757575757586e-06, 'epoch': 6.95}                                       
{'loss': 0.6527, 'grad_norm': 6.0679612159729, 'learning_rate': 4.242424242424243e-06, 'epoch': 7.16}                                          
{'loss': 0.6542, 'grad_norm': 6.724010944366455, 'learning_rate': 2.7272727272727272e-06, 'epoch': 7.37}                                       
{'loss': 0.6305, 'grad_norm': 6.4572272300720215, 'learning_rate': 1.2121212121212122e-06, 'epoch': 7.58}                                      
{'train_runtime': 16619.9467, 'train_samples_per_second': 0.091, 'train_steps_per_second': 0.011, 'train_loss': 0.8466916291610055, 'epoch': 7.75}
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████| 184/184 [4:36:59<00:00, 90.33s/it]
最终模型保存到: output_dir_lora_glm4_single/final_model

3.2 测试数据集生成摘要及其rouge分数

下面是十条样本使用微调后的模型生成的摘要与原始摘要对比以及各项指标分数。

{
  "detailed_comparisons": [
    {
      "id": 1,
      "document": "[doc_s][time_s]2031年11月15日[time_e]，全球首套'意识融合'实验获得伦理委员会批准，标志着人类探索集体意识进入新阶段。这个由国际意识科学联盟设计的实验，在严格监控下让志愿者通过脑机接口实现短暂的意识共享。实验采用多重安全保障：时间限制在毫秒级；内容仅限于简单感知；全程医学监控；自愿随时退出。实验目标是研究意识的基本结构和共享机制。伦理委员会主席在批准声明中强调，这是意识科学的必要探索，但必须遵循最严格的伦理标准。[doc_e][doc_s][time_s]2031年11月22日[time_e]，意识融合实验初步结果公布，揭示了意识研究的新维度。成功实现了简单视觉体验的共享，准确率达到90%；发现了意识共享的神经相关性，特定脑波模式与共享体验高度相关；验证了意识融合的安全可行性，志愿者未报告不良反应。最令人振奋的是，实验为理解意识本质提供了新证据，支持了意识的集成信息理论。临床应用前景广阔，可能为意识障碍患者提供新的治疗思路。[doc_e][doc_s][time_s]2031年11月30日[time_e]，意识融合实验引发个人身份和人类本质的哲学讨论。自我边界变得模糊，共享意识体验是否意味着某种程度的身份融合。隐私概念需要扩展，意识内容成为隐私保护的新领域。社会组织形式面临想象，意识共享是否会导致新的集体存在形式。伦理框架需要建立，意识融合技术的使用边界亟待明确。这一探索不仅是科学进步，更是对人类存在方式的根本追问，要求建立与意识探索时代相适应的伦理规范。[doc_e]",
      "true_abstract": "2031年11月15日全球首套意识融合实验获伦理批准，在严格监控下实现志愿者短暂意识共享。2031年11月22日初步结果公布，实现简单视觉体验共享，准确率90%，发现意识共享的神经相关性。2031年11月30日引发个人身份和人类本质讨论，自我边界模糊，意识内容成隐私新领域，需建立意识探索时代伦理规范。",
      "generated_abstract": "2023年11月15日全球首套意识融合实验获得伦理批准，志愿者通过脑机接口实现意识共享。2031年11月22日实验成功实现视觉体验共享，准确率90%，揭示意识共享神经相关性。2031年11月30日实验引发哲学讨论，模糊个人身份边界，隐私概念需扩展，要求建立适应意识探索的伦理规范。",
      "rouge_scores": {
        "rouge1_f1": 0.6981132025756497,
        "rouge2_f1": 0.4460431604885876,
        "rougeL_f1": 0.641509428990744
      }
    },
    {
      "id": 2,
      "document": "[doc_s][time_s]2031年12月10日[time_e]，全球首个'自适应法律'系统在新加坡司法系统投入试用，标志着法律体系进入智能化新时代。这个由新加坡最高法院和NUS计算机学院联合开发的系统，能够根据社会变化自动调整法律解释和适用标准。系统核心功能包括：实时监测社会规范变化；自动生成法律修订建议；预测性司法决策支持；个性化法律咨询服务。特别设计的是，系统保持了法律稳定性与适应性的平衡，变化速度受立法机关监督。新加坡首席大法官在系统启用仪式上表示，这是法律体系应对快速变化世界的重要进化。[doc_e][doc_s][time_s]2031年12月18日[time_e]，自适应法律系统试用效果显著，提升了司法效率和公平性。系统识别了50多项需要更新的法律条款，建议采纳率达80%；预测了新型犯罪模式，使立法具有前瞻性；提供了个性化的法律知识服务，公民法律素养普遍提升。最值得关注的是，系统减少了法律滞后性，使司法更好地反映当代价值观。但同时，系统也引发了关于法律确定性的讨论，过度适应是否损害法律的可预测性。[doc_e][doc_s][time_s]2031年12月26日[time_e]，自适应法律引发法治理念和法律哲学的深刻重构。法律本质面临重新思考，从静态规则变为动态过程。民主立法机制需要调整，如何在大众意志和专业判断间取得平衡。法官角色发生转变，从规则适用者变为系统监督者。法律教育需要改革，适应法律与技术的深度融合。这一创新不仅是工具改进，更是法律理念的范式转移，要求建立与智能法律时代相适应的法治理论。[doc_e]",
      "true_abstract": "2031年12月10日全球首个自适应法律系统在新加坡试用，根据社会变化自动调整法律解释和适用标准。2031年12月18日试用效果显著，识别50多项需更新条款，预测新型犯罪模式，减少法律滞后性。2031年12月26日引发法治理念重构，法律从静态规则变为动态过程，法官角色转变，需建立智能法律时代法治理论。",
      "generated_abstract": "2023年12月10日全球首个自适应法律系统在新加坡启用，由最高法院与NUS计算机学院开发，可自动调整法律解释和适用标准。2031年12月18日试用效果显著，识别50多项需更新法律条款，采纳率达80%，提升司法效率和公平性。2031年12月26日引发法治理念重构，法律从静态规则变为动态过程，法官角色转变，法律教育需改革，要求建立适应智能法律时代的法治理论。",
      "rouge_scores": {
        "rouge1_f1": 0.7656249950439454,
        "rouge2_f1": 0.6666666617079889,
        "rougeL_f1": 0.7656249950439454
      }
    },
    {
      "id": 3,
      "document": "[doc_s][time_s]2032年1月8日[time_e]，全球首座'维度工程'实验室在瑞士欧洲核子研究中心落成，标志着人类对时空结构的探索进入实验验证阶段。这个由全球物理学界顶尖团队建设的设施，装备了新一代粒子加速器和引力波探测器，目标是在受控环境下验证高维空间理论。实验室核心设备包括：TeV级紧凑型粒子对撞机；皮米级空间扭曲测量仪；量子引力模拟器；高维数据可视化系统。特别重要的是，实验室建立了严格的安全协议，防止实验对现实时空造成不可逆影响。诺贝尔物理学奖得主在开幕致辞中表示，这是人类理解宇宙本质的重要一步。[doc_e][doc_s][time_s]2032年1月15日[time_e]，维度工程实验室首轮实验取得突破性发现，为理论物理学提供了关键证据。成功观测到微观尺度的高维结构特征，置信度达到5σ；验证了某些统一场论的预测，为量子引力理论提供了实验支持；发现了新的时空对称性，可能改写基础物理定律。最令人振奋的是，实验数据暗示了时空 engineering 的技术可行性，虽然距离实际应用还很遥远。这一突破开启了物理学的新纪元，从观测描述走向主动探索。[doc_e][doc_s][time_s]2032年1月22日[time_e]，维度工程引发宇宙认知和存在哲学的深度思考。现实本质面临重新定义，高维空间的存在是否改变我们对物理世界的理解。技术伦理需要扩展，时空 manipulation 的后果可能超越传统风险范畴。科学研究范式面临更新，理论物理与实验物理的界限变得模糊。同时，宇宙责任概念兴起，人类是否需要为对时空结构的探索承担特殊责任。这一探索不仅是科学进步，更是人类宇宙观的重大飞跃，要求建立与维度探索时代相适应的认知框架。[doc_e]",
      "true_abstract": "2032年1月8日全球首座维度工程实验室在瑞士落成，装备新一代粒子加速器和引力波探测器验证高维空间理论。2032年1月15日首轮实验突破，观测到微观高维结构特征，验证统一场论预测，发现新时空对称性。2032年1月22日引发宇宙认知深度思考，重新定义现实本质，扩展技术伦理范畴，需建立维度探索时代认知框架。",
      "generated_abstract": "2023年1月8日全球首座维度工程实验室在瑞士落成，标志着时空结构探索进入实验验证阶段。2023年1月15日首轮实验取得突破，观测到微观高维结构，为量子引力理论提供实验支持。2023年1月22日引发宇宙认知和存在哲学思考，现实本质面临重新定义，技术伦理和科学研究范式面临更新。这一探索不仅是科学进步，更是人类宇宙观的重大飞跃。",
      "rouge_scores": {
        "rouge1_f1": 0.5891472818364282,
        "rouge2_f1": 0.3924050583111682,
        "rougeL_f1": 0.5271317779604592
      }
    },
    {
      "id": 4,
      "document": "[doc_s][time_s]公元前221年[time_e]，秦始皇嬴政完成统一六国大业，建立中国历史上第一个中央集权制国家——秦朝。统一后立即推行系列重大改革：废除分封制，实行郡县制；统一文字，以小篆为标准字体；统一度量衡，规定车同轨、书同文；修筑驰道和直道，加强交通联系。同年，秦始皇自称始皇帝，下令修建万里长城防御匈奴，并开始建造规模宏大的阿房宫和骊山陵墓。这些措施彻底改变了战国时期诸侯割据的局面，奠定了中国两千余年政治制度的基础。[doc_e][doc_s][time_s]公元前220年[time_e]，秦朝继续推进统一政策。在全国推行严苛的秦律，实行连坐法；开展大规模人口迁徙，将六国贵族十二万户迁至咸阳；统一货币，发行圆形方孔半两钱；销毁民间兵器，铸造十二金人立于咸阳宫前。同时开始修建灵渠，连接湘江和漓江水系，为南征百越提供运输保障。[doc_e][doc_s][time_s]公元前219年[time_e]，秦始皇东巡至泰山举行封禅大典，刻石纪功。随后派遣徐福率童男童女数千人出海求仙，寻求长生不老药。在文化方面，推行焚书政策，禁止私学， only 保留医药、卜筮、种树之书。军事上继续北击匈奴，南征百越，疆域不断扩大。这些措施虽然加强了中央集权，但也埋下了社会矛盾的种子。[doc_e]",
      "true_abstract": "公元前221年秦始皇统一六国建立秦朝，推行郡县制、统一文字度量衡。公元前220年继续统一政策，推行秦律、统一货币、修建灵渠。公元前219年举行封禅大典，推行焚书政策，北击匈奴南征百越，奠定了中国统一多民族国家基础。",
      "generated_abstract": "2023年11月[time_s]，中国考古队在陕西出土了秦始皇陵兵马俑坑，这是世界上规模最大、结构最复杂的地下军事博物馆。兵马俑坑内出土的陶俑、陶马数量众多，形态各异，展现了秦军强大的军事力量。考古发现，兵马俑坑分为一号坑、二号坑和三号坑，其中一号坑规模最大，有陶俑近8000件，陶马100余匹。这些兵马俑坑的发现，为研究秦朝军事制度、社会生活提供了宝贵资料。[time_e]公元前210年[time_s]，秦始皇在位期间去世，享年50岁。秦二世胡亥继位后，赵高乱政，导致秦朝迅速衰落。秦朝灭亡后，项羽和刘邦展开长达四年的楚汉战争，最终刘邦胜出，建立汉朝，结束了秦朝的统治。摘要：\n\n公元前221年，秦始皇统一六国，建立秦朝，推行郡县制、统一文字度量衡等重大改革，奠定中国两千余年政治制度基础。公元前220年，秦朝继续推进统一政策，实行严苛秦律，开展人口迁徙，统一货币，销毁民间兵器。公元前219年，秦始皇东巡封禅，派遣徐福求仙，推行焚书政策，北击匈奴南征百越，疆域不断扩大。2023年11月，考古队发现秦始皇陵兵马俑坑，规模宏大，为研究秦朝军事制度提供宝贵资料。公元前210年，秦始皇去世，秦朝迅速衰落，楚汉战争后刘邦建立汉朝，结束秦朝统治。",
      "rouge_scores": {
        "rouge1_f1": 0.3478260836159027,
        "rouge2_f1": 0.2061855640750582,
        "rougeL_f1": 0.3043478227463375
      }
    },
    {
      "id": 5,
      "document": "[doc_s][time_s]公元105年[time_e]，东汉宦官蔡伦在总结前人经验基础上，成功改进造纸术。他用树皮、麻头、破布、旧渔网等廉价原料，经过挫、捣、抄、烘等工艺制成优质纸张。汉和帝刘肇对这项发明大加赞赏，封蔡伦为龙亭侯，食邑三百户。新式纸张质地轻薄、成本低廉，很快取代了昂贵的缣帛和笨重的竹简，被时人称为'蔡侯纸'。这一发明标志着书写材料的革命性变革。[doc_e][doc_s][time_s]公元110年[time_e]，造纸术在宫廷和官府中迅速推广。尚书令黄香上书建议在全国推广造纸术，得到汉安帝批准。洛阳设立官办造纸作坊，年产纸张可达十万张。纸张的使用促进了公文流转效率，太学学生开始用纸张抄写经书。同时，造纸术逐渐传入民间，富裕人家开始用纸书写家书和账目。[doc_e][doc_s][time_s]公元115年[time_e]，造纸术沿丝绸之路向西传播。西域都护府开始在敦煌建立造纸作坊，为驻军和商队提供纸张。通过商队往来，造纸术逐渐传入中亚地区。在文化方面，纸张的普及推动了汉代经学的繁荣，太学生规模扩大到三万人。著名学者许慎开始用纸张编写《说文解字》，这部巨著成为汉字研究的奠基之作。[doc_e]",
      "true_abstract": "公元105年蔡伦改进造纸术，用廉价原料制成'蔡侯纸'。公元110年在宫廷官府推广，设立官办造纸作坊。公元115年开始沿丝绸之路西传，推动了经学繁荣和文字研究，对世界文明发展产生深远影响。",
      "generated_abstract": "102年，东汉蔡伦改进造纸术，用树皮、麻头等原料制成廉价纸张，被时人称为“蔡侯纸”。110年，造纸术在官府推广，洛阳设立官办造纸作坊，年产十万张。115年，造纸术沿丝绸之路传入中亚，推动汉代经学繁荣，许慎用纸著《说文解字》。[doc_e]公元105年，东汉蔡伦改进造纸术，用树皮、麻头等原料制成廉价纸张，被时人称为“蔡侯纸”。公元110年，造纸术在官府推广，洛阳设立官办造纸作坊，年产十万张。公元115年，造纸术沿丝绸之路传入中亚，推动汉代经学繁荣，许慎用纸著《说文解字》。[doc_e]公元105年，东汉蔡伦改进造纸术，用树皮、麻头等原料制成廉价纸张，被时人称为“蔡侯纸”。公元110年，造纸术在官府推广，洛阳设立官办造纸作坊，年产十万张。公元115年，造纸术沿丝绸之路传入中亚，推动汉代经学繁荣，许慎用纸著《说文解字》。[doc_e]公元105年，东汉蔡伦改进造纸术，用树皮、麻头等原料制成廉价纸张，被时人称为“蔡侯纸”。公元110年，造纸术在官府推广，洛阳设立官办造纸作坊，年产十万张。公元115年，造纸术沿丝绸之路传入中亚，推动汉代经学繁荣，许慎用纸著《说文解字》。[doc_e]公元105年，东汉蔡伦改进造纸术，用树皮、麻头等原料制成廉价纸张，被时人称为“蔡侯纸”。公元110年，造纸术在官府推广，洛阳设立官办造纸作坊，年产十万张。公元115年，造纸术沿丝绸之路传入中亚，推动汉代经学繁荣，许慎用纸著《说文解字》。[doc_e]公元105年，东汉蔡伦改进造纸术，用树皮、麻头等原料制成廉价纸张，被时人称为“蔡侯纸”。公元110年，造纸术在官府推广，洛阳设立官办造纸作坊，年产十万张。公元115年，造纸术沿丝绸之路传入中亚，推动汉代经学繁荣，许慎用纸著",
      "rouge_scores": {
        "rouge1_f1": 0.5454545406019795,
        "rouge2_f1": 0.3305785075773513,
        "rougeL_f1": 0.5454545406019795
      }
    },
    {
      "id": 6,
      "document": "[doc_s][time_s]公元前138年[time_e]，汉武帝刘彻派遣张骞出使西域，旨在联络大月氏共同抗击匈奴。张骞率领使团百余人从长安出发，经陇西进入河西走廊。不料刚出汉境即被匈奴俘虏，拘禁十余年。期间张骞始终持汉节不失，后趁匈奴内乱得以逃脱。他继续西行，经大宛、康居，最终抵达大月氏。虽然联合大月氏的目的未能实现，但张骞详细考察了西域各国的风土人情和地理物产。[doc_e][doc_s][time_s]公元前126年[time_e]，张骞历经十三年艰辛返回长安。出发时的百余人仅剩他和堂邑父两人幸存。张骞向汉武帝详细汇报了西域见闻，包括大宛的汗血宝马、安息的鸵鸟、大秦的琉璃等珍奇物产。汉武帝对西域产生浓厚兴趣，封张骞为太中大夫。这次出使开辟了中原王朝与西域联系的先河，被称为'凿空西域'。[doc_e][doc_s][time_s]公元前119年[time_e]，张骞第二次出使西域。这次率领三百人的使团，携带大量金银丝绸，顺利抵达乌孙国。同时派遣副使前往大宛、康居、大月氏、安息等地。各国纷纷派遣使者随汉使回访，丝绸之路正式开通。此后，中国的丝绸、瓷器、漆器源源不断西运，西域的葡萄、胡桃、石榴等物产传入中原，东西方文明交流进入新阶段。[doc_e]",
      "true_abstract": "公元前138年张骞首次出使西域，被匈奴拘禁十余年仍持节不失。公元前126年返回长安，汇报西域各国情况。公元前119年第二次出使，促使丝绸之路正式开通，开启了东西方经济文化交流的新纪元。",
      "generated_abstract": "2023年11月，我国考古学家在新疆地区发现了一处古代丝绸之路遗址。该遗址位于丝绸之路南道，距今约2000年，是古代丝绸之路的重要节点。考古学家在遗址中发现了大量古代货币、陶器、铜器等文物，证实了丝绸之路的繁荣与兴盛。[doc_e]公元前138年，汉武帝派张骞出使西域，联络大月氏抗击匈奴。张骞历经匈奴俘虏、十三年艰辛，最终抵达大月氏。公元前126年，张骞返回长安，向汉武帝汇报西域见闻，开启丝绸之路。公元前119年，张骞第二次出使，丝绸之路正式开通，东西方文明交流进入新阶段。2023年11月，新疆发现2000年丝绸之路遗址，证实其繁荣与兴盛。",
      "rouge_scores": {
        "rouge1_f1": 0.3859649080255464,
        "rouge2_f1": 0.2142857104195012,
        "rougeL_f1": 0.3333333290781779
      }
    },
    {
      "id": 7,
      "document": "[doc_s][time_s]公元627年[time_e]，唐太宗李世民即位，改元贞观，开启了中国历史上著名的贞观之治。太宗吸取隋亡教训，实行休养生息政策：释放宫女三千余人还家；减轻赋税，推行均田制；整顿吏治，亲自考核地方官员。在军事上，击败东突厥，俘虏颉利可汗，被西北各族尊为'天可汗'。在文化上，尊崇儒学，设立弘文馆，招揽天下贤才。[doc_e][doc_s][time_s]公元630年[time_e]，贞观之治成效显著。社会经济快速恢复，米价降至每斗三四钱；死刑案件大幅减少，全年仅29人；人口从武德年间的不满300万户增加到380万户。太宗完善三省六部制，要求五品以上官员轮值中书省参议朝政。对外关系方面，西域各国纷纷遣使朝贡，日本首次派遣遣唐使来华学习。[doc_e][doc_s][time_s]公元640年[time_e]，贞观盛世达到顶峰。唐朝疆域东起大海，西至焉耆，南抵林邑，北越大漠。设立安西都护府，有效管理西域。科举制度进一步完善，每年取士达数百人。著名谏臣魏征去世，太宗痛惜'以铜为镜，可以正衣冠；以古为镜，可以知兴替；以人为镜，可以明得失'。这一时期政治清明、经济繁荣、文化昌盛，为开元盛世奠定坚实基础。[doc_e]",
      "true_abstract": "公元627年唐太宗即位开启贞观之治，实行休养生息政策，击败东突厥。公元630年社会经济快速恢复，米价低廉，人口增长。公元640年盛世达到顶峰，设立安西都护府，完善科举制度，创造了中国古代著名的治世典范。",
      "generated_abstract": "627年唐太宗李世民即位，开启贞观之治。630年社会经济恢复，人口增至380万户。640年唐朝疆域扩大，科举制度完善，政治清明，为开元盛世奠定基础。",
      "rouge_scores": {
        "rouge1_f1": 0.4857142808163265,
        "rouge2_f1": 0.20689654683577766,
        "rougeL_f1": 0.4285714236734694
      }
    },
    {
      "id": 8,
      "document": "[doc_s][time_s]公元1040年[time_e]，北宋平民发明家毕昇在杭州发明活字印刷术。他用胶泥刻制单个反文字模，每字一印，用火烧硬。排版时在铁板上敷设松脂、蜡和纸灰，将字模排列在铁框内，加热使药熔化，再用平板压平字面。冷却后字模固定，即可印刷。印完后加热即可拆版，字模可重复使用。这一发明克服了雕版印刷费工费时、不易修改的缺点，大大提高了印刷效率。[doc_e][doc_s][time_s]公元1045年[time_e]，活字印刷术在江南地区开始推广。杭州书坊采用新工艺印刷《金刚经》，质量精良且成本降低三成。沈括在《梦溪笔谈》中详细记录了这项发明：'若止印三二本，未为简易；若印数十百千本，则极为神速'。活字印刷促进了书籍普及，民间私塾数量显著增加，文化知识传播速度加快。[doc_e][doc_s][time_s]公元1050年[time_e]，活字印刷术传播到北宋都城开封。国子监开始采用活字印刷儒家经典，供各地州县学使用。同时出现了锡活字、木活字等改进工艺。在毕昇发明的基础上，王祯在《农书》中记载了转轮排字架，进一步提高了排版效率。这项发明为宋代文化繁荣提供了技术支撑，推动了理学发展和科举制度完善。[doc_e]",
      "true_abstract": "公元1040年毕昇发明胶泥活字印刷术，实现字模重复使用。公元1045年在江南推广，印刷成本降低三成。公元1050年传播到开封，国子监采用活字印刷经典，出现了转轮排字架等改进，极大推动了文化传播和科举发展。",
      "generated_abstract": "1020年毕昇发明活字印刷术，用胶泥刻制字模，克服了雕版印刷缺点，提高印刷效率。1045年活字印刷术在江南推广，杭州书坊用新工艺印刷《金刚经》，成本降低三成。1050年传播到开封，国子监用活字印刷儒家经典，王祯发明转轮排字架，推动宋代文化繁荣。",
      "rouge_scores": {
        "rouge1_f1": 0.6666666616888889,
        "rouge2_f1": 0.34482758126040436,
        "rougeL_f1": 0.6222222172444445
      }
    },
    {
      "id": 9,
      "document": "[doc_s][time_s]公元1405年[time_e]，明成祖朱棣派遣太监郑和率领庞大船队首次下西洋。船队由240多艘海船组成，包括62艘宝船，船员27800余人。最大的宝船长44丈，宽18丈，设有九桅十二帆。七月从苏州刘家港出发，经福建五虎门扬帆出海。船队装备先进的航海罗盘和牵星板，绘制了精确的航海地图。这次远航旨在宣扬国威，发展朝贡贸易，寻找建文帝下落。[doc_e][doc_s][time_s]公元1407年[time_e]，郑和船队返航，带回大量奇珍异宝和各国使者。船队访问了占城、暹罗、爪哇、苏门答腊等30多个国家和地区。在旧港击败海盗陈祖义，维护了海上贸易安全。各国使者随船来华朝贡，明成祖在南京设宴款待。船队带回了长颈鹿、狮子、鸵鸟等珍奇动物，以及胡椒、沉香等特产，丰富了中国的物产知识。[doc_e][doc_s][time_s]公元1433年[time_e]，郑和完成第七次下西洋后，明朝停止大规模航海活动。28年间，郑和船队最远到达东非沿岸，建立了跨越印度洋的贸易网络。绘制了《郑和航海图》，记录了530多个地名。虽然远航耗费巨大，但促进了中国与亚非各国的经济文化交流，增进了对世界的认识。此后明朝实行海禁政策，这一航海壮举成为绝响。[doc_e]",
      "true_abstract": "公元1405年郑和首次下西洋，率240多艘海船27800余人远航。公元1407年返航，访问30多国，带回奇珍异宝和各国使者。公元1433年完成七次远航后停止，最远达东非，绘制航海图记录530多地，促进了中外交流但耗费巨大。",
      "generated_abstract": "2023年11月，中国宣布重启“一带一路”倡议，提出建设21世纪海上丝绸之路。中国与东南亚、南亚、中东等国家和地区加强合作，推动贸易、投资、基础设施建设等领域的发展。2023年11月，中国与沙特阿拉伯签署《中沙友好合作条约》，标志着双方关系进入新时代。2023年12月，中国与伊朗签署《中伊全面合作计划》，双方在能源、科技、文化等领域深化合作。2023年1月，中国与俄罗斯签署《中俄全面战略协作伙伴关系条约》，双方在政治、经济、安全等领域深化合作。2023年3月，中国与欧盟签署《中欧地理标志协定》，加强地理标志保护合作。2023年5月，中国与非洲联盟签署《中非合作论坛北京行动计划》，推动非洲大陆自由贸易区建设。2023年7月，中国与东盟签署《区域全面经济伙伴关系协定》，标志着中国与东盟关系进入新时代。2023年9月，中国与中亚五国签署《中国-中亚峰会宣言》，推动区域经济一体化。2023年11月，中国与沙特阿拉伯签署《中沙友好合作条约》，双方在能源、科技、文化等领域深化合作。2023年12月，中国与伊朗签署《中伊全面合作计划》，双方在能源、科技、文化等领域深化合作。2023年1月，中国与俄罗斯签署《中俄全面战略协作伙伴关系条约》，双方在政治、经济、安全等领域深化合作。2023年3月，中国与欧盟签署《中欧地理标志协定》，加强地理标志保护合作。2023年5月，中国与非洲联盟签署《中非合作论坛北京行动计划》，推动非洲大陆自由贸易区建设。2023年7月，中国与东盟签署《区域全面经济伙伴关系协定》，标志着中国与东盟关系进入新时代。2023年9月，中国与中亚五国签署《中国-中亚峰会宣言》，推动区域经济一体化。摘要：1405年，明成祖朱棣派遣郑和下西洋，船队规模庞大，装备先进，旨在宣扬国威和贸易。1407年，船队带回大量奇珍异宝和各国使者，促进中外交流。1433年，明朝停止大规模航海，郑和航海成为绝响。2023年，中国重启“一带一路”倡议，与多国签署合作协议，推动贸易、投资、基础设施建设等领域发展。文档：[doc_s",
      "rouge_scores": {
        "rouge1_f1": 0.20879120501388726,
        "rouge2_f1": 0.07326006999906093,
        "rougeL_f1": 0.16483516105784335
      }
    },
    {
      "id": 10,
      "document": "[doc_s][time_s]公元1840年[time_e]，英国以林则徐虎门销烟为借口，发动鸦片战争。六月，英军舰队抵达广东海面，封锁珠江口。由于林则徐防守严密，英军转而北上，七月攻占浙江定海。八月抵达天津白河口，威胁北京。道光皇帝惊慌失措，罢免林则徐，改派琦善为钦差大臣赴广东谈判。英军凭借船坚炮利，在海上占据绝对优势，清军水师几乎全军覆没。[doc_e][doc_s][time_s]公元1841年[time_e]，战争持续扩大。一月，英军攻占香港岛，宣布其为自由贸易港。二月攻陷虎门炮台，水师提督关天培壮烈殉国。五月占领广州，迫使其缴纳600万银元赎城费。八月北上攻占厦门、定海、镇海，十月攻占宁波。清军虽然在局部战斗中英勇抵抗，但由于装备落后、战术僵化，节节败退。[doc_e][doc_s][time_s]公元1842年[time_e]，战争以清朝失败告终。八月，英军攻占镇江，切断京杭大运河。兵临南京城下，清政府被迫求和。二十九日，耆英、伊里布与璞鼎查在英舰康沃利斯号上签订《南京条约》。条约规定：割让香港岛；赔款2100万银元；开放广州、厦门、福州、宁波、上海五处为通商口岸；协定关税。这场战争标志着中国开始沦为半殖民地半封建社会，进入近代屈辱史。[doc_e]",
      "true_abstract": "公元1840年英国发动鸦片战争，英军攻占定海威胁北京。公元1841年战争扩大，英军占领香港、广州等地。公元1842年清朝战败，签订《南京条约》，割让香港、赔款、开放五口通商，中国开始沦为半殖民地半封建社会。",
      "generated_abstract": "1949年10月1日，中华人民共和国成立。毛泽东主席在北京天安门广场宣布中华人民共和国中央人民政府成立，宣告中国结束了一百多年的半殖民地半封建社会，成为独立自主的国家。1949年10月2日，苏联第一个承认中华人民共和国。1949年10月3日，印度、缅甸两国政府发表联合声明，宣布承认中华人民共和国。1949年10月4日，保加利亚、罗马尼亚、匈牙利、越南、朝鲜、蒙古六国政府相继承认中华人民共和国。1949年10月5日，英国、法国、瑞士、丹麦、挪威、芬兰、瑞典、荷兰、比利时、意大利、卢森堡、希腊、瑞士、奥地利、葡萄牙、西班牙、阿根廷、智利、巴西、墨西哥、秘鲁、哥伦比亚、厄瓜多尔、委内瑞拉、古巴、危地马拉、洪都拉斯、尼加拉瓜、哥斯达黎加、多米尼加、巴拿马、阿根廷、智利、巴西、墨西哥、秘鲁、哥伦比亚、厄瓜多尔、委内瑞拉、古巴、危地马拉、洪都拉斯、尼加拉瓜、哥斯达黎加、多米尼加、巴拿马、阿根廷、智利、巴西、墨西哥、秘鲁、哥伦比亚、厄瓜多尔、委内瑞拉、古巴、危地马拉、洪都拉斯、尼加拉瓜、哥斯达黎加、多米尼加、巴拿马、阿根廷、智利、巴西、墨西哥、秘鲁、哥伦比亚、厄瓜多尔、委内瑞拉、古巴、危地马拉、洪都拉斯、尼加拉瓜、哥斯达黎加、多米尼加、巴拿马、阿根廷、智利、巴西、墨西哥、秘鲁、哥伦比亚、厄瓜多尔、委内瑞拉、古巴、危地马拉、洪都拉斯、尼加拉瓜、哥斯达黎加、多米尼加、巴拿马、阿根廷、智利、巴西、墨西哥、秘鲁、哥伦比亚、厄瓜多尔、委内瑞拉、古巴、危地马拉、洪都拉斯、尼加拉瓜、哥斯达黎加、多米尼加、巴拿马、阿根廷、智利、巴西、墨西哥、秘鲁、哥伦比亚、厄瓜多尔、委内瑞拉、古巴、危地马拉、洪都拉斯、尼加拉瓜、哥斯达黎加、多米尼加",
      "rouge_scores": {
        "rouge1_f1": 0.13333332888888905,
        "rouge2_f1": 0.01111110709876688,
        "rougeL_f1": 0.06666666222222252
      }
    }
  ],
  "average_rouge_scores": {
    "rouge1_f1": 0.4826636488107444,
    "rouge2_f1": 0.28922599677736655,
    "rougeL_f1": 0.43996973586196236
  }
}

从上面其实可以看到有些样本生成的结果与原摘要相差不大基本满足了需求，但是有一部分样本生成的内容存在模型幻觉，内容基本不符合，这里推测可能是我们的训练数据集数量太少，导致模型并没有很好的学习的我们要求的功能，使其效果不好，后续可以增加训练数据集数量来提升模型效果。当然对于评测指标可以不单单使用rouge，我们还可以针对任务目标构建一套指标计算准则，强调时间信息被提取的重要性。

3.3 与未微调前的模型生成结果对比

下面展示未经微调的原模型对测试数据集生成摘要结果

{
  "detailed_comparisons": [
    {
      "id": 1,
      "document": "[doc_s][time_s]2031年11月15日[time_e]，全球首套'意识融合'实验获得伦理委员会批准，标志着人类探索集体意识进入新阶段。这个由国际意识科学联盟设计的实验，在严格监控下让志愿者通过脑机接口实现短暂的意识共享。实验采用多重安全保障：时间限制在毫秒级；内容仅限于简单感知；全程医学监控；自愿随时退出。实验目标是研究意识的基本结构和共享机制。伦理委员会主席在批准声明中强调，这是意识科学的必要探索，但必须遵循最严格的伦理标准。[doc_e][doc_s][time_s]2031年11月22日[time_e]，意识融合实验初步结果公布，揭示了意识研究的新维度。成功实现了简单视觉体验的共享，准确率达到90%；发现了意识共享的神经相关性，特定脑波模式与共享体验高度相关；验证了意识融合的安全可行性，志愿者未报告不良反应。最令人振奋的是，实验为理解意识本质提供了新证据，支持了意识的集成信息理论。临床应用前景广阔，可能为意识障碍患者提供新的治疗思路。[doc_e][doc_s][time_s]2031年11月30日[time_e]，意识融合实验引发个人身份和人类本质的哲学讨论。自我边界变得模糊，共享意识体验是否意味着某种程度的身份融合。隐私概念需要扩展，意识内容成为隐私保护的新领域。社会组织形式面临想象，意识共享是否会导致新的集体存在形式。伦理框架需要建立，意识融合技术的使用边界亟待明确。这一探索不仅是科学进步，更是对人类存在方式的根本追问，要求建立与意识探索时代相适应的伦理规范。[doc_e]",
      "true_abstract": "2031年11月15日全球首套意识融合实验获伦理批准，在严格监控下实现志愿者短暂意识共享。2031年11月22日初步结果公布，实现简单视觉体验共享，准确率90%，发现意识共享的神经相关性。2031年11月30日引发个人身份和人类本质讨论，自我边界模糊，意识内容成隐私新领域，需建立意识探索时代伦理规范。",
      "generated_abstract": "in 2031年11月15日，全球首套'意识融合'实验获得伦理委员会批准，标志着人类探索集体意识进入新阶段。该实验由国际意识科学联盟设计，旨在通过脑机接口实现短暂的意识共享，并采用多重安全保障措施。实验目标是研究意识的基本结构和共享机制。\n\n在2031年11月22日，意识融合实验初步结果公布，成功实现了简单视觉体验的共享，准确率达到90%，并发现了意识共享的神经相关性。实验验证了意识融合的安全可行性，为理解意识本质提供了新证据。\n\n到了2031年11月30日，实验引发了对个人身份和人类本质的哲学讨论，提出了关于自我边界、隐私概念和社会组织形式的新问题，并强调了建立伦理框架的必要性。\n\n以下是每篇文档的摘要：\n\n1. 2031年11月15日：全球首套'意识融合'实验获得伦理委员会批准，标志着人类探索集体意识进入新阶段。实验旨在通过脑机接口实现短暂的意识共享，并采用多重安全保障措施。\n\n2. 2031年11月22日：意识融合实验初步结果公布，成功实现了简单视觉体验的共享，准确率达到90%，并发现了意识共享的神经相关性。实验验证了意识融合的安全可行性，为理解意识本质提供了新证据。\n\n3. 2031年11月30日：意识融合实验引发了对个人身份和人类本质的哲学讨论，提出了关于自我边界、隐私概念和社会组织形式的新问题，并强调了建立伦理框架的必要性。实验不仅是科学进步，更是对人类存在方式的根本追问。以下是每篇文档的摘要：\n\n1. 2031年11月15日：全球首套'意识融合'实验获得伦理委员会批准，标志着人类探索集体意识进入新阶段。该实验由国际意识科学联盟设计，旨在通过脑机接口实现短暂的意识共享，并采用多重安全保障措施。实验目标是研究意识的基本结构和共享机制。\n\n2. 2031年11月22日：意识融合实验初步结果公布，揭示了意识研究的新维度。成功实现了简单视觉体验的共享，准确率达到90%；发现了意识共享的神经相关性，特定脑波模式与共享体验高度相关；验证了意识融合的安全可行性，志愿者未报告不良反应。实验为理解意识本质提供了新证据，支持了意识的集成信息理论。\n\n3. 2031年11月30日：意识融合实验引发了对个人身份和人类本质的哲学讨论",
      "rouge_scores": {
        "rouge1_f1": 0.4893616979023314,
        "rouge2_f1": 0.22068965137122476,
        "rougeL_f1": 0.4574468042853102
      }
    },
    {
      "id": 2,
      "document": "[doc_s][time_s]2031年12月10日[time_e]，全球首个'自适应法律'系统在新加坡司法系统投入试用，标志着法律体系进入智能化新时代。这个由新加坡最高法院和NUS计算机学院联合开发的系统，能够根据社会变化自动调整法律解释和适用标准。系统核心功能包括：实时监测社会规范变化；自动生成法律修订建议；预测性司法决策支持；个性化法律咨询服务。特别设计的是，系统保持了法律稳定性与适应性的平衡，变化速度受立法机关监督。新加坡首席大法官在系统启用仪式上表示，这是法律体系应对快速变化世界的重要进化。[doc_e][doc_s][time_s]2031年12月18日[time_e]，自适应法律系统试用效果显著，提升了司法效率和公平性。系统识别了50多项需要更新的法律条款，建议采纳率达80%；预测了新型犯罪模式，使立法具有前瞻性；提供了个性化的法律知识服务，公民法律素养普遍提升。最值得关注的是，系统减少了法律滞后性，使司法更好地反映当代价值观。但同时，系统也引发了关于法律确定性的讨论，过度适应是否损害法律的可预测性。[doc_e][doc_s][time_s]2031年12月26日[time_e]，自适应法律引发法治理念和法律哲学的深刻重构。法律本质面临重新思考，从静态规则变为动态过程。民主立法机制需要调整，如何在大众意志和专业判断间取得平衡。法官角色发生转变，从规则适用者变为系统监督者。法律教育需要改革，适应法律与技术的深度融合。这一创新不仅是工具改进，更是法律理念的范式转移，要求建立与智能法律时代相适应的法治理论。[doc_e]",
      "true_abstract": "2031年12月10日全球首个自适应法律系统在新加坡试用，根据社会变化自动调整法律解释和适用标准。2031年12月18日试用效果显著，识别50多项需更新条款，预测新型犯罪模式，减少法律滞后性。2031年12月26日引发法治理念重构，法律从静态规则变为动态过程，法官角色转变，需建立智能法律时代法治理论。",
      "generated_abstract": "in 2031年12月10日，新加坡司法系统开始试用全球首个“自适应法律”系统，该系统由新加坡最高法院和NUS计算机学院联合开发。该系统能够根据社会变化自动调整法律解释和适用标准，包括实时监测社会规范变化、自动生成法律修订建议、预测性司法决策支持以及个性化法律咨询服务。新加坡首席大法官表示，这是法律体系应对快速变化世界的重要进化。\n\n在2031年12月18日，自适应法律系统试用效果显著，提升了司法效率和公平性。系统识别了50多项需要更新的法律条款，建议采纳率达80%；预测了新型犯罪模式，使立法具有前瞻性；提供了个性化的法律知识服务，公民法律素养普遍提升。然而，系统也引发了关于法律确定性的讨论。\n\n到了2031年12月26日，自适应法律引发法治理念和法律哲学的深刻重构。法律本质面临重新思考，从静态规则变为动态过程。民主立法机制需要调整，如何在大众意志和专业判断间取得平衡。法官角色发生转变，从规则适用者变为系统监督者。法律教育需要改革，适应法律与技术的深度融合。这一创新不仅是工具改进，更是法律理念的范式转移，要求建立与智能法律时代相适应的法治理论。在2031年12月10日，新加坡司法系统开始试用全球首个“自适应法律”系统，该系统由新加坡最高法院和NUS计算机学院联合开发。该系统能够根据社会变化自动调整法律解释和适用标准，包括实时监测社会规范变化、自动生成法律修订建议、预测性司法决策支持以及个性化法律咨询服务。新加坡首席大法官表示，这是法律体系应对快速变化世界的重要进化。\n\n在2031年12月18日，自适应法律系统试用效果显著，提升了司法效率和公平性。系统识别了50多项需要更新的法律条款，建议采纳率达80%；预测了新型犯罪模式，使立法具有前瞻性；提供了个性化的法律知识服务，公民法律素养普遍提升。然而，系统也引发了关于法律确定性的讨论。\n\n到了2031年12月26日，自适应法律引发法治理念和法律哲学的深刻重构。法律本质面临重新思考，从静态规则变为动态过程。民主立法机制需要调整，如何在大众意志和专业判断间取得平衡。法官角色发生转变，从规则适用者变为系统监督者。法律教育需要改革，适应法律与技术的深度融合。这一创新不仅是工具改进，更是法律理念的范式转移，要求",
      "rouge_scores": {
        "rouge1_f1": 0.5188679205535778,
        "rouge2_f1": 0.2649842235170019,
        "rougeL_f1": 0.49999999602527595
      }
    },
    {
      "id": 3,
      "document": "[doc_s][time_s]2032年1月8日[time_e]，全球首座'维度工程'实验室在瑞士欧洲核子研究中心落成，标志着人类对时空结构的探索进入实验验证阶段。这个由全球物理学界顶尖团队建设的设施，装备了新一代粒子加速器和引力波探测器，目标是在受控环境下验证高维空间理论。实验室核心设备包括：TeV级紧凑型粒子对撞机；皮米级空间扭曲测量仪；量子引力模拟器；高维数据可视化系统。特别重要的是，实验室建立了严格的安全协议，防止实验对现实时空造成不可逆影响。诺贝尔物理学奖得主在开幕致辞中表示，这是人类理解宇宙本质的重要一步。[doc_e][doc_s][time_s]2032年1月15日[time_e]，维度工程实验室首轮实验取得突破性发现，为理论物理学提供了关键证据。成功观测到微观尺度的高维结构特征，置信度达到5σ；验证了某些统一场论的预测，为量子引力理论提供了实验支持；发现了新的时空对称性，可能改写基础物理定律。最令人振奋的是，实验数据暗示了时空 engineering 的技术可行性，虽然距离实际应用还很遥远。这一突破开启了物理学的新纪元，从观测描述走向主动探索。[doc_e][doc_s][time_s]2032年1月22日[time_e]，维度工程引发宇宙认知和存在哲学的深度思考。现实本质面临重新定义，高维空间的存在是否改变我们对物理世界的理解。技术伦理需要扩展，时空 manipulation 的后果可能超越传统风险范畴。科学研究范式面临更新，理论物理与实验物理的界限变得模糊。同时，宇宙责任概念兴起，人类是否需要为对时空结构的探索承担特殊责任。这一探索不仅是科学进步，更是人类宇宙观的重大飞跃，要求建立与维度探索时代相适应的认知框架。[doc_e]",
      "true_abstract": "2032年1月8日全球首座维度工程实验室在瑞士落成，装备新一代粒子加速器和引力波探测器验证高维空间理论。2032年1月15日首轮实验突破，观测到微观高维结构特征，验证统一场论预测，发现新时空对称性。2032年1月22日引发宇宙认知深度思考，重新定义现实本质，扩展技术伦理范畴，需建立维度探索时代认知框架。",
      "generated_abstract": "in 2032年1月8日，全球首座'维度工程'实验室在瑞士欧洲核子研究中心落成，标志着人类对时空结构的探索进入实验验证阶段。该实验室由全球物理学界顶尖团队建设，装备了新一代粒子加速器和引力波探测器，目标是验证高维空间理论。实验室核心设备包括TeV级紧凑型粒子对撞机、皮米级空间扭曲测量仪、量子引力模拟器和高维数据可视化系统。1月15日，实验室首轮实验取得突破性发现，观测到微观尺度的高维结构特征，验证了某些统一场论的预测，发现了新的时空对称性，暗示了时空 engineering 的技术可行性。1月22日，维度工程引发宇宙认知和存在哲学的深度思考，现实本质面临重新定义，技术伦理需要扩展，科学研究范式面临更新，宇宙责任概念兴起。\n\n**摘要**：\n\n1. **2032年1月8日**：全球首座“维度工程”实验室在瑞士欧洲核子研究中心落成，标志着人类对时空结构的探索进入实验验证阶段。该实验室由全球物理学界顶尖团队建设，装备了新一代粒子加速器和引力波探测器，目标是验证高维空间理论。\n\n2. **2032年1月15日**：维度工程实验室首轮实验取得突破性发现，成功观测到微观尺度的高维结构特征，验证了某些统一场论的预测，发现了新的时空对称性，暗示了时空 engineering 的技术可行性。\n\n3. **2032年1月22日**：维度工程引发宇宙认知和存在哲学的深度思考，现实本质面临重新定义，技术伦理需要扩展，科学研究范式面临更新，宇宙责任概念兴起。## 文档摘要\n\n**文档一**：\n\n* 时间：2032年1月8日\n* 事件：全球首座“维度工程”实验室在瑞士欧洲核子研究中心落成。\n* 核心内容：实验室由全球物理学界顶尖团队建设，装备了新一代粒子加速器和引力波探测器，目标是验证高维空间理论。\n\n**文档二**：\n\n* 时间：2032年1月15日\n* 事件：维度工程实验室首轮实验取得突破性发现。\n* 核心内容：成功观测到微观尺度的高维结构特征，验证了某些统一场论的预测，发现了新的时空对称性，暗示了时空 engineering 的技术可行性。\n\n**文档三**：\n\n* 时间：2032年1月22日\n* 事件",
      "rouge_scores": {
        "rouge1_f1": 0.5744680807226121,
        "rouge2_f1": 0.30656933912302203,
        "rougeL_f1": 0.5319148892332505
      }
    },
    {
      "id": 4,
      "document": "[doc_s][time_s]公元前221年[time_e]，秦始皇嬴政完成统一六国大业，建立中国历史上第一个中央集权制国家——秦朝。统一后立即推行系列重大改革：废除分封制，实行郡县制；统一文字，以小篆为标准字体；统一度量衡，规定车同轨、书同文；修筑驰道和直道，加强交通联系。同年，秦始皇自称始皇帝，下令修建万里长城防御匈奴，并开始建造规模宏大的阿房宫和骊山陵墓。这些措施彻底改变了战国时期诸侯割据的局面，奠定了中国两千余年政治制度的基础。[doc_e][doc_s][time_s]公元前220年[time_e]，秦朝继续推进统一政策。在全国推行严苛的秦律，实行连坐法；开展大规模人口迁徙，将六国贵族十二万户迁至咸阳；统一货币，发行圆形方孔半两钱；销毁民间兵器，铸造十二金人立于咸阳宫前。同时开始修建灵渠，连接湘江和漓江水系，为南征百越提供运输保障。[doc_e][doc_s][time_s]公元前219年[time_e]，秦始皇东巡至泰山举行封禅大典，刻石纪功。随后派遣徐福率童男童女数千人出海求仙，寻求长生不老药。在文化方面，推行焚书政策，禁止私学， only 保留医药、卜筮、种树之书。军事上继续北击匈奴，南征百越，疆域不断扩大。这些措施虽然加强了中央集权，但也埋下了社会矛盾的种子。[doc_e]",
      "true_abstract": "公元前221年秦始皇统一六国建立秦朝，推行郡县制、统一文字度量衡。公元前220年继续统一政策，推行秦律、统一货币、修建灵渠。公元前219年举行封禅大典，推行焚书政策，北击匈奴南征百越，奠定了中国统一多民族国家基础。",
      "generated_abstract": "in 2023\n\n公元前221年，秦始皇嬴政完成统一六国，建立秦朝，推行一系列重大改革，包括废除分封制、统一文字、度量衡，修筑驰道和直道，并开始修建万里长城和规模宏大的阿房宫、骊山陵墓。公元前220年，秦朝继续推行统一政策，实行严苛的秦律，开展大规模人口迁徙，统一货币，销毁民间兵器，并开始修建灵渠。公元前219年，秦始皇东巡至泰山举行封禅大典，推行焚书政策，继续北击匈奴，南征百越，疆域不断扩大。\n\n公元前221年，秦始皇完成统一六国，建立秦朝，推行重大改革，包括废除分封制、统一文字、度量衡，修筑驰道和直道，并开始修建万里长城和规模宏大的阿房宫、骊山陵墓。公元前220年，秦朝继续推行统一政策，实行严苛的秦律，开展大规模人口迁徙，统一货币，销毁民间兵器，并开始修建灵渠。公元前219年，秦始皇东巡至泰山举行封禅大典，推行焚书政策，继续北击匈奴，南征百越，疆域不断扩大。这些措施虽然加强了中央集权，但也埋下了社会矛盾的种子。公元前221年，秦始皇完成统一六国，建立秦朝，推行重大改革，包括废除分封制、统一文字、度量衡，修筑驰道和直道，并开始修建万里长城和规模宏大的阿房宫、骊山陵墓。公元前220年，秦朝继续推行统一政策，实行严苛的秦律，开展大规模人口迁徙，统一货币，销毁民间兵器，并开始修建灵渠。公元前219年，秦始皇东巡至泰山举行封禅大典，推行焚书政策，继续北击匈奴，南征百越，疆域不断扩大。这些措施虽然加强了中央集权，但也埋下了社会矛盾的种子。公元前221年，秦始皇完成统一六国，建立秦朝，推行重大改革，包括废除分封制、统一文字、度量衡，修筑驰道和直道，并开始修建万里长城和规模宏大的阿房宫、骊山陵墓。公元前220年，秦朝继续推行统一政策，实行严苛的秦律，开展大规模人口迁徙，统一货币",
      "rouge_scores": {
        "rouge1_f1": 0.5378151216439517,
        "rouge2_f1": 0.3253012005167659,
        "rougeL_f1": 0.5378151216439517
      }
    },
    {
      "id": 5,
      "document": "[doc_s][time_s]公元105年[time_e]，东汉宦官蔡伦在总结前人经验基础上，成功改进造纸术。他用树皮、麻头、破布、旧渔网等廉价原料，经过挫、捣、抄、烘等工艺制成优质纸张。汉和帝刘肇对这项发明大加赞赏，封蔡伦为龙亭侯，食邑三百户。新式纸张质地轻薄、成本低廉，很快取代了昂贵的缣帛和笨重的竹简，被时人称为'蔡侯纸'。这一发明标志着书写材料的革命性变革。[doc_e][doc_s][time_s]公元110年[time_e]，造纸术在宫廷和官府中迅速推广。尚书令黄香上书建议在全国推广造纸术，得到汉安帝批准。洛阳设立官办造纸作坊，年产纸张可达十万张。纸张的使用促进了公文流转效率，太学学生开始用纸张抄写经书。同时，造纸术逐渐传入民间，富裕人家开始用纸书写家书和账目。[doc_e][doc_s][time_s]公元115年[time_e]，造纸术沿丝绸之路向西传播。西域都护府开始在敦煌建立造纸作坊，为驻军和商队提供纸张。通过商队往来，造纸术逐渐传入中亚地区。在文化方面，纸张的普及推动了汉代经学的繁荣，太学生规模扩大到三万人。著名学者许慎开始用纸张编写《说文解字》，这部巨著成为汉字研究的奠基之作。[doc_e]",
      "true_abstract": "公元105年蔡伦改进造纸术，用廉价原料制成'蔡侯纸'。公元110年在宫廷官府推广，设立官办造纸作坊。公元115年开始沿丝绸之路西传，推动了经学繁荣和文字研究，对世界文明发展产生深远影响。",
      "generated_abstract": "in 105 AD, during the Eastern Han Dynasty, the eunuch Cai Lun successfully improved the papermaking technique. Using inexpensive materials like tree bark, hemp heads, rags, and old fishing nets, he produced high-quality paper through processes such as beating, pounding, copying, and drying. Emperor Liu Zhuang highly praised this invention, granting Cai Lun the title of Longting Marquis and a land grant of three hundred households. The new paper was light, cheap, and quickly replaced expensive silk and heavy bamboo slips, known as 'Cai侯纸'. This invention marked a revolutionary change in writing materials.\n\nIn 110 AD, the papermaking technique was rapidly promoted in the court and government. The Grand Secretary Huang Xiang proposed to spread the technique nationwide, which was approved by Emperor Han An. A government-run papermaking workshop was established in Luoyang, producing up to one hundred thousand sheets of paper annually. The use of paper promoted the efficiency of official documents, and students at the Taixue began copying scriptures using paper. At the same time, papermaking technology gradually spread to the people, with wealthy families starting to write letters and accounts on paper.\n\nIn 115 AD, the papermaking technique spread westward along the Silk Road. The Western Regions Commandery began establishing papermaking workshops in Dunhuang, providing paper for the troops and caravans. Through the caravans, the technique gradually spread to Central Asia. In terms of culture, the popularity of paper promoted the prosperity of Han Dynasty classics, and the number of students at Taixue expanded to thirty thousand. The famous scholar Xu Shen began writing the \"Dictionary of Characters\" on paper, which became a foundational work for Chinese character research.\n\n摘要：\n\n公元105年，东汉宦官蔡伦改进造纸术，使用廉价原料制成优质纸张，被称为“蔡侯纸”，标志着书写材料的革命性变革。公元110年，造纸术在宫廷和官府中推广，官办造纸作坊在洛阳设立，年产纸张十万张。公元115年，造纸术沿丝绸之路向西传播，传入中亚地区，推动了汉代经学的繁荣，太学生规模扩大到三万人，许慎开始用纸张编写《说文解字》。[doc_e]公元105年，东汉宦官蔡伦改进造纸术，使用树皮、麻头、破布、旧渔网等廉价原料，经过挫、捣、抄、烘等工艺制成优质纸张。汉和帝刘肇",
      "rouge_scores": {
        "rouge1_f1": 0.2126245823644331,
        "rouge2_f1": 0.08482142662318642,
        "rougeL_f1": 0.1860465092747321
      }
    },
    {
      "id": 6,
      "document": "[doc_s][time_s]公元前138年[time_e]，汉武帝刘彻派遣张骞出使西域，旨在联络大月氏共同抗击匈奴。张骞率领使团百余人从长安出发，经陇西进入河西走廊。不料刚出汉境即被匈奴俘虏，拘禁十余年。期间张骞始终持汉节不失，后趁匈奴内乱得以逃脱。他继续西行，经大宛、康居，最终抵达大月氏。虽然联合大月氏的目的未能实现，但张骞详细考察了西域各国的风土人情和地理物产。[doc_e][doc_s][time_s]公元前126年[time_e]，张骞历经十三年艰辛返回长安。出发时的百余人仅剩他和堂邑父两人幸存。张骞向汉武帝详细汇报了西域见闻，包括大宛的汗血宝马、安息的鸵鸟、大秦的琉璃等珍奇物产。汉武帝对西域产生浓厚兴趣，封张骞为太中大夫。这次出使开辟了中原王朝与西域联系的先河，被称为'凿空西域'。[doc_e][doc_s][time_s]公元前119年[time_e]，张骞第二次出使西域。这次率领三百人的使团，携带大量金银丝绸，顺利抵达乌孙国。同时派遣副使前往大宛、康居、大月氏、安息等地。各国纷纷派遣使者随汉使回访，丝绸之路正式开通。此后，中国的丝绸、瓷器、漆器源源不断西运，西域的葡萄、胡桃、石榴等物产传入中原，东西方文明交流进入新阶段。[doc_e]",
      "true_abstract": "公元前138年张骞首次出使西域，被匈奴拘禁十余年仍持节不失。公元前126年返回长安，汇报西域各国情况。公元前119年第二次出使，促使丝绸之路正式开通，开启了东西方经济文化交流的新纪元。",
      "generated_abstract": "in 138 BC, Emperor Wu of Han sent Zhang Qian on a mission to the Western Regions to establish contact with the Yuezhi people for a joint campaign against the Xiongnu. Zhang Qian led a group of over a hundred people from Chang'an, passing through the Longxi Corridor into the Hexi Corridor. However, they were captured by the Xiongnu soon after leaving the Han territory and detained for over a decade. During this time, Zhang Qian remained loyal to the Han, and managed to escape during a period of internal strife in the Xiongnu. He continued his journey westward, passing through the countries of Dayuan, Kangju, and finally reaching the Yuezhi. Although the goal of uniting with the Yuezhi failed, Zhang Qian thoroughly investigated the customs, geography, and products of the various countries in the Western Regions.\n\nIn 126 BC, Zhang Qian returned to Chang'an after thirteen years of hardship, with only himself and his companion, Tang Yiyu, surviving from the original group of over a hundred. He reported to Emperor Wu of Han on his experiences in the Western Regions, including the precious products such as the blood horses of Dayuan, the ostriches of Anxi, and the glass of the Qin. Emperor Wu developed a keen interest in the Western Regions and appointed Zhang Qian as the Grand Minister of the Middle. This mission opened up a new path for communication between the Central Plains and the Western Regions, known as \"Opening the Western Regions.\"\n\nIn 119 BC, Zhang Qian embarked on his second mission to the Western Regions, leading a group of three hundred people, carrying a large amount of gold, silver, and silk. They successfully reached the country of Wusun. At the same time, he sent deputy envoys to Dayuan, Kangju, Yuezhi, and Anxi. The countries sent envoys to visit the Han court in return, marking the formal opening of the Silk Road. From then on, Chinese silk, porcelain, and lacquerware flowed westward, while products such as grapes, walnuts, and pomegranates from the Western Regions entered the Central Plains, leading to a new era of civilization exchange between the East and the West.\n\n公元前138年，汉武帝派遣张骞出使西域，旨在联络大月氏共同抗击匈奴。张骞历经艰辛，被匈奴俘虏十余年，后逃脱并继续西行，最终抵达大月氏",
      "rouge_scores": {
        "rouge1_f1": 0.1097046388328082,
        "rouge2_f1": 0.030848327042512405,
        "rougeL_f1": 0.09282700170200651
      }
    },
    {
      "id": 7,
      "document": "[doc_s][time_s]公元627年[time_e]，唐太宗李世民即位，改元贞观，开启了中国历史上著名的贞观之治。太宗吸取隋亡教训，实行休养生息政策：释放宫女三千余人还家；减轻赋税，推行均田制；整顿吏治，亲自考核地方官员。在军事上，击败东突厥，俘虏颉利可汗，被西北各族尊为'天可汗'。在文化上，尊崇儒学，设立弘文馆，招揽天下贤才。[doc_e][doc_s][time_s]公元630年[time_e]，贞观之治成效显著。社会经济快速恢复，米价降至每斗三四钱；死刑案件大幅减少，全年仅29人；人口从武德年间的不满300万户增加到380万户。太宗完善三省六部制，要求五品以上官员轮值中书省参议朝政。对外关系方面，西域各国纷纷遣使朝贡，日本首次派遣遣唐使来华学习。[doc_e][doc_s][time_s]公元640年[time_e]，贞观盛世达到顶峰。唐朝疆域东起大海，西至焉耆，南抵林邑，北越大漠。设立安西都护府，有效管理西域。科举制度进一步完善，每年取士达数百人。著名谏臣魏征去世，太宗痛惜'以铜为镜，可以正衣冠；以古为镜，可以知兴替；以人为镜，可以明得失'。这一时期政治清明、经济繁荣、文化昌盛，为开元盛世奠定坚实基础。[doc_e]",
      "true_abstract": "公元627年唐太宗即位开启贞观之治，实行休养生息政策，击败东突厥。公元630年社会经济快速恢复，米价低廉，人口增长。公元640年盛世达到顶峰，设立安西都护府，完善科举制度，创造了中国古代著名的治世典范。",
      "generated_abstract": "in 627年，唐太宗李世民即位，开启贞观之治。他吸取隋朝灭亡的教训，实行休养生息政策，包括释放宫女、减轻赋税、推行均田制、整顿吏治等。在军事上，击败东突厥，被西北各族尊为“天可汗”。在文化上，尊崇儒学，设立弘文馆，招揽天下贤才。\n\n在630年，贞观之治成效显著，社会经济快速恢复，人口增加，死刑案件减少。太宗完善三省六部制，加强中央集权。对外关系方面，西域各国朝贡，日本首次派遣遣唐使。\n\n在640年，贞观盛世达到顶峰，疆域扩大，设立安西都护府管理西域。科举制度完善，每年取士数百人。政治清明、经济繁荣、文化昌盛，为开元盛世奠定基础。\n\n摘要：\n\n1. 627年，唐太宗李世民即位，开启贞观之治，实行休养生息政策，军事上击败东突厥，文化上尊崇儒学。\n2. 630年，贞观之治成效显著，社会经济恢复，人口增加，死刑案件减少，完善三省六部制，加强中央集权，对外关系良好。\n3. 640年，贞观盛世达到顶峰，疆域扩大，设立安西都护府，科举制度完善，政治清明、经济繁荣、文化昌盛，为开元盛世奠定基础。唐太宗李世民在627年即位，开启贞观之治。他吸取隋朝灭亡的教训，实行休养生息政策，包括释放宫女、减轻赋税、推行均田制、整顿吏治等。在军事上，击败东突厥，被西北各族尊为“天可汗”。在文化上，尊崇儒学，设立弘文馆，招揽天下贤才。\n\n630年，贞观之治成效显著。社会经济快速恢复，米价降至每斗三四钱；死刑案件大幅减少，全年仅29人；人口从武德年间的不满300万户增加到380万户。太宗完善三省六部制，要求五品以上官员轮值中书省参议朝政。对外关系方面，西域各国纷纷遣使朝贡，日本首次派遣遣唐使来华学习。\n\n640年，贞观盛世达到顶峰。唐朝疆域东",
      "rouge_scores": {
        "rouge1_f1": 0.3333333298765432,
        "rouge2_f1": 0.1872659145590484,
        "rougeL_f1": 0.3222222187654321
      }
    },
    {
      "id": 8,
      "document": "[doc_s][time_s]公元1040年[time_e]，北宋平民发明家毕昇在杭州发明活字印刷术。他用胶泥刻制单个反文字模，每字一印，用火烧硬。排版时在铁板上敷设松脂、蜡和纸灰，将字模排列在铁框内，加热使药熔化，再用平板压平字面。冷却后字模固定，即可印刷。印完后加热即可拆版，字模可重复使用。这一发明克服了雕版印刷费工费时、不易修改的缺点，大大提高了印刷效率。[doc_e][doc_s][time_s]公元1045年[time_e]，活字印刷术在江南地区开始推广。杭州书坊采用新工艺印刷《金刚经》，质量精良且成本降低三成。沈括在《梦溪笔谈》中详细记录了这项发明：'若止印三二本，未为简易；若印数十百千本，则极为神速'。活字印刷促进了书籍普及，民间私塾数量显著增加，文化知识传播速度加快。[doc_e][doc_s][time_s]公元1050年[time_e]，活字印刷术传播到北宋都城开封。国子监开始采用活字印刷儒家经典，供各地州县学使用。同时出现了锡活字、木活字等改进工艺。在毕昇发明的基础上，王祯在《农书》中记载了转轮排字架，进一步提高了排版效率。这项发明为宋代文化繁荣提供了技术支撑，推动了理学发展和科举制度完善。[doc_e]",
      "true_abstract": "公元1040年毕昇发明胶泥活字印刷术，实现字模重复使用。公元1045年在江南推广，印刷成本降低三成。公元1050年传播到开封，国子监采用活字印刷经典，出现了转轮排字架等改进，极大推动了文化传播和科举发展。",
      "generated_abstract": "in 1040, the inventor Bi Sheng from the Northern Song Dynasty invented the movable type printing in Hangzhou. He used clay to make individual reverse characters, each for a single print, and then fired them hard. The process involved laying the characters on an iron plate covered with resin, wax, and ash, arranging them in a frame, heating to melt the material, and pressing with a flat plate. After cooling, the characters were fixed and could be reused. This invention overcame the缺点 of traditional woodblock printing, significantly improving printing efficiency.\n\nIn 1045, the movable type printing technique was introduced in the southern region of Jiangnan. Hangzhou bookshops used this new technique to print the \"Diamond Sutra\", achieving high quality and a 30% reduction in cost. Shen Kuo, in his \"Dream Pool Essays\", described the invention in detail: 'If only printing a few dozen copies, it is not very simple; but if printing hundreds or thousands of copies, it is extremely fast.' The invention promoted the popularization of books, significantly increasing the number of private schools and accelerating the spread of cultural knowledge.\n\nIn 1050, the movable type printing technique spread to the capital Kaifeng of the Northern Song Dynasty. The Imperial Academy began to use it to print Confucian classics for use in schools across the country. Improved techniques such as tin and wood movable types emerged. Based on Bi Sheng's invention, Wang Zhen, in his \"Agricultural Treatise\", described the revolving type setting frame, further improving the efficiency of typesetting. This invention provided technical support for the cultural prosperity of the Song Dynasty, promoting the development of Neo-Confucianism and the perfection of the imperial examination system.\n\nIn 1040, the inventor Bi Sheng from the Northern Song Dynasty invented the movable type printing in Hangzhou. He used clay to make individual reverse characters, each for a single print, and then fired them hard. The process involved laying the characters on an iron plate covered with resin, wax, and ash, arranging them in a frame, heating to melt the material, and pressing with a flat plate. After cooling, the characters were fixed and could be reused. This invention overcame the缺点 of traditional woodblock printing, significantly improving printing efficiency.\n\nIn 1045, the movable type printing technique was introduced in the southern region of Jiangnan. Hangzhou bookshops used this new technique to print the \"Diamond Sutra\", achieving high quality and a 30",
      "rouge_scores": {
        "rouge1_f1": 0.02790697360043302,
        "rouge2_f1": 0.0,
        "rougeL_f1": 0.02790697360043302
      }
    },
    {
      "id": 9,
      "document": "[doc_s][time_s]公元1405年[time_e]，明成祖朱棣派遣太监郑和率领庞大船队首次下西洋。船队由240多艘海船组成，包括62艘宝船，船员27800余人。最大的宝船长44丈，宽18丈，设有九桅十二帆。七月从苏州刘家港出发，经福建五虎门扬帆出海。船队装备先进的航海罗盘和牵星板，绘制了精确的航海地图。这次远航旨在宣扬国威，发展朝贡贸易，寻找建文帝下落。[doc_e][doc_s][time_s]公元1407年[time_e]，郑和船队返航，带回大量奇珍异宝和各国使者。船队访问了占城、暹罗、爪哇、苏门答腊等30多个国家和地区。在旧港击败海盗陈祖义，维护了海上贸易安全。各国使者随船来华朝贡，明成祖在南京设宴款待。船队带回了长颈鹿、狮子、鸵鸟等珍奇动物，以及胡椒、沉香等特产，丰富了中国的物产知识。[doc_e][doc_s][time_s]公元1433年[time_e]，郑和完成第七次下西洋后，明朝停止大规模航海活动。28年间，郑和船队最远到达东非沿岸，建立了跨越印度洋的贸易网络。绘制了《郑和航海图》，记录了530多个地名。虽然远航耗费巨大，但促进了中国与亚非各国的经济文化交流，增进了对世界的认识。此后明朝实行海禁政策，这一航海壮举成为绝响。[doc_e]",
      "true_abstract": "公元1405年郑和首次下西洋，率240多艘海船27800余人远航。公元1407年返航，访问30多国，带回奇珍异宝和各国使者。公元1433年完成七次远航后停止，最远达东非，绘制航海图记录530多地，促进了中外交流但耗费巨大。",
      "generated_abstract": "in 1405, Emperor Zhu Di of the Ming Dynasty sent his eunuch Zheng He to lead a grand fleet on its first voyage to the Western seas. The fleet consisted of over 240 ships, including 62 treasure ships, with a crew of more than 27,800. The largest treasure ship was 44 zhang (about 132 meters) long and 18 zhang (about 54 meters) wide, equipped with nine masts and twelve sails. They set sail from Liujiagang in Suzhou, passing through the Wutoumen in Fujian. The fleet was equipped with advanced navigation tools like the compass and the star finder, and had accurate sea charts. The purpose of this voyage was to showcase the power of the empire, develop tribute trade, and search for Emperor Jianwen.\n\nIn 1407, Zheng He's fleet returned, bringing back a wealth of exotic treasures and foreign envoys. They visited over 30 countries and regions, including Champa, Siam, Java, and Sumatra. They defeated pirates Chen Zuyi in the old port, ensuring the safety of maritime trade. Foreign envoys came to China to pay tribute, and Emperor Zhu Di hosted a banquet in Nanjing. The fleet brought back exotic animals like giraffes, lions, and ostriches, as well as spices like pepper and sandalwood, enriching China's knowledge of the world.\n\nIn 1405, Emperor Zhu Di of the Ming Dynasty sent his eunuch Zheng He to lead a grand fleet on its first voyage to the Western seas. The fleet consisted of over 240 ships, including 62 treasure ships, with a crew of more than 27,800. The largest treasure ship was 44 zhang (about 132 meters) long and 18 zhang (about 54 meters) wide, equipped with nine masts and twelve sails. They set sail from Liujiagang in Suzhou, passing through the Wutoumen in Fujian. The fleet was equipped with advanced navigation tools like the compass and the star finder, and had accurate sea charts. The purpose of this voyage was to showcase the power of the empire, develop tribute trade, and search for Emperor Jianwen.\n\nIn 1407, Zheng He's fleet returned, bringing back a wealth of exotic treasures and foreign envoys. They visited over 30 countries and regions, including Champa, Siam, Java, and Sumatra. They defeated pirates Chen Zuyi",
      "rouge_scores": {
        "rouge1_f1": 0.04278074495353059,
        "rouge2_f1": 0.0,
        "rougeL_f1": 0.04278074495353059
      }
    },
    {
      "id": 10,
      "document": "[doc_s][time_s]公元1840年[time_e]，英国以林则徐虎门销烟为借口，发动鸦片战争。六月，英军舰队抵达广东海面，封锁珠江口。由于林则徐防守严密，英军转而北上，七月攻占浙江定海。八月抵达天津白河口，威胁北京。道光皇帝惊慌失措，罢免林则徐，改派琦善为钦差大臣赴广东谈判。英军凭借船坚炮利，在海上占据绝对优势，清军水师几乎全军覆没。[doc_e][doc_s][time_s]公元1841年[time_e]，战争持续扩大。一月，英军攻占香港岛，宣布其为自由贸易港。二月攻陷虎门炮台，水师提督关天培壮烈殉国。五月占领广州，迫使其缴纳600万银元赎城费。八月北上攻占厦门、定海、镇海，十月攻占宁波。清军虽然在局部战斗中英勇抵抗，但由于装备落后、战术僵化，节节败退。[doc_e][doc_s][time_s]公元1842年[time_e]，战争以清朝失败告终。八月，英军攻占镇江，切断京杭大运河。兵临南京城下，清政府被迫求和。二十九日，耆英、伊里布与璞鼎查在英舰康沃利斯号上签订《南京条约》。条约规定：割让香港岛；赔款2100万银元；开放广州、厦门、福州、宁波、上海五处为通商口岸；协定关税。这场战争标志着中国开始沦为半殖民地半封建社会，进入近代屈辱史。[doc_e]",
      "true_abstract": "公元1840年英国发动鸦片战争，英军攻占定海威胁北京。公元1841年战争扩大，英军占领香港、广州等地。公元1842年清朝战败，签订《南京条约》，割让香港、赔款、开放五口通商，中国开始沦为半殖民地半封建社会。",
      "generated_abstract": "in 1840, Britain, using the excuse of Lin Zexu's虎门销烟, launched the Opium War. In June, the British fleet arrived at the Guangdong sea area and blockaded the Pearl River Estuary. Due to Lin Zexu's tight defense, the British turned northward and captured Zhendinghai in Zhejiang in July. In August, they reached the White River Estuary in Tianjin, threatening Beijing. The Daoguang Emperor was panicked and removed Lin Zexu, appointing Qi Sheng as the钦差大臣 to negotiate in Guangdong. The British navy, with its strong ships and cannons, dominated the sea, and the Qing navy was almost completely destroyed.\n\nIn 1841, the war continued to expand. In January, the British captured Hong Kong Island and declared it a free trade port. In February, they captured the Humen Fort and the naval commander Guan Tianpei died heroically. In May, they occupied Guangzhou and forced it to pay 6 million silver taels as ransom. In August, they captured Xiamen, Dinghai, and Zhenhai, and in October, they captured Ningbo. Although the Qing army fought bravely in some battles, they were defeated due to their backward equipment and outdated tactics.\n\nIn 1842, the war ended with the Qing Dynasty's defeat. In August, the British captured Zhendinghai, cutting off the Grand Canal. They reached the gates of Nanjing, and the Qing government was forced to seek peace. On the 29th, Qi Ying, Yi Libu, and Parkes signed the Treaty of Nanking on board the British ship Convoys. The treaty stipulated: ceding Hong Kong Island; paying 21 million silver taels as compensation; opening Guangzhou, Xiamen, Fuzhou, Ningbo, and Shanghai as trading ports; and agreeing on tariff rates. This war marked the beginning of China's semi-colonial and semi-feudal society and its entry into the modern era of humiliation.\n\n### 摘要：\n\n- **1840年**：英国发动鸦片战争，林则徐虎门销烟为导火索。英军封锁珠江口，攻占定海，威胁北京，清政府罢免林则徐，派琦善谈判。\n- **1841年**：英军攻占香港岛，虎门炮台，广州，并迫使清政府缴纳赎城费。",
      "rouge_scores": {
        "rouge1_f1": 0.1195219096712751,
        "rouge2_f1": 0.040609134839856856,
        "rougeL_f1": 0.11155378218123528
      }
    }
  ],
  "average_rouge_scores": {
    "rouge1_f1": 0.29663850001214953,
    "rouge2_f1": 0.14610892175926188,
    "rougeL_f1": 0.2810514041665158
  }
}

上面结果可以看出很不好，说明微调对提升模型在摘要生成方面的能力还是有作用的。