第1章 重新定义“数字人文的建成环境”:从对象到证据链

1.1 行业痛点(为什么需要AI)

  • 史料海量且异构:文本、地图、照片、地籍、图纸、口述史彼此割裂
  • “看起来很美”的可视化多,“可复核的结论”少
  • 地名、门牌、行政区、街巷在历史中频繁变更,导致空间定位不稳定

1.2 本文的核心主张

数字人文项目的AI不是为了“自动生成结论”,而是为了建立一种能力:
把证据组织成结构化、可检索、可复核的时空事实库,并能支撑叙事、比较与公共传播。

本章交付物(写作/项目都适用)

  • 研究对象界定(城市/街区/建筑类型/基础设施线)
  • “证据链”定义:每条结构化事实必须回链到原件(档号/页码/图片ID)
  • 成果形态选择:论文型 / 公众型 / 平台型(可多选)

第2章 问题如何问对:把人文问题写成可证伪的“时空假设”

2.1 选题模板(行业高成功率)

  • 形态演化:路网、地块、建筑密度在关键时期如何变化
  • 制度冲击:规划、征收、租界、战争、灾害如何重塑空间
  • 产业与生活:工厂/码头/市场等节点如何改变居住与商业格局
  • 记忆地景:口述史与地点绑定,形成“记忆地图”的证据链

2.2 “可证伪假设”的写法(强烈建议写进项目书)

例:

  • “通商口岸时期公共建筑沿水岸形成带状扩散”
  • “某类里弄在电车线路开通后出现显著的密度与功能变化”

本章交付物

  • 1页研究问题书(核心问题 + 假设 + 指标候选)
  • 研究边界:时间范围、空间范围、材料范围、不可做事项

第3章 数据盘点:史料与空间数据的“来源—可信度—版权”三件事

3.1 数据类型清单(按DH建成环境常用)

  • 文本:地方志、档案、报刊、修缮记录、规划文本、契约
  • 图像:历史照片/明信片/航片、街景(用于对照与训练)
  • 地图:老地图、地籍图、规划图、分区图、管线图(若有)
  • 现状:OSM/现状矢量、DEM、遥感底图(对照与配准辅助)

3.2 元数据(Metadata)最低标准

  • 来源(馆藏/数据库/采集者)
  • 时间(拍摄/出版/绘制/不确定范围)
  • 权属与使用许可
  • 可信度标注(原件/抄本/转述;清晰度与缺损)

本章交付物

  • 数据清单(含版权状态)
  • 元数据字段规范(最少一页说明)
  • 数据命名与目录规则(为后续版本控制做铺垫)

第4章 工具链总览:一条可落地的“文本—地图—图像—时空数据库”流水线

这里给你一个行业可执行的“最小可用工具链”,强调稳、可复现、可交付。

4.1 文本侧(OCR + 信息抽取 + 可追溯)

  • OCR:PaddleOCR(中文场景强,易部署)/ ABBYY(商业强)
  • 版面分析:PaddleOCR版面、LayoutParser(学术常用)
  • 结构化抽取:
    • 轻量路线:正则 + 词典 + 人工校对(更稳)
    • 进阶路线:spaCy / HanLP / LLM + RAG(必须回链证据)

4.2 地图侧(配准 + 矢量化 + 时态)

  • GIS:QGIS(开源、可复现)、ArcGIS(若单位已采购)
  • 地图配准:QGIS Georeferencer(控制点+误差)
  • 矢量化:半自动描绘(质量最稳)+ 分割模型辅助(按需)

4.3 图像侧(分类/识别/字幕与招牌文本)

  • 图像分类与检索:CLIP类思路(或现成多模态检索)
  • OCR(照片上的牌匾/路牌):PaddleOCR
  • 立面要素识别:视数据量决定,通常先做“分类+标注+局部识别”

4.4 数据底座(强烈建议从第一天就做)

  • 数据库:PostgreSQL + PostGIS(时空对象最稳)
  • 检索:Elasticsearch / OpenSearch(全文检索可选)
  • 版本:Git + DVC(数据版本)或至少“版本号+变更日志”

本章交付物

  • 统一架构图(数据流向、模块、接口)
  • 工具选型表述(写清“为什么选它、替代方案是什么”)
  • 最小可用流水线(MVP)定义:先跑通一条街/一类建筑/一个年份切片

第5章 证据链设计:DH项目能不能站住,关键在“可回链”

5.1 证据链的最小单位:Fact(事实)+ Evidence(证据)

建议你把每条结构化记录都设计成:

  • Fact:结构化字段(谁/何时/何地/发生了什么)
  • Evidence:原始材料指针(档号、页码、截图坐标、地图图幅、照片ID)
  • Confidence:可信度(人工确认/模型推断/二手转述等)

5.2 常见错误(会导致学术上被质疑)

  • 结论无法回到原件
  • 把推断当事实(例如“推测地点”没标不确定性)
  • 不记录版本与修改来源(后续无法复现)

本章交付物

  • 证据链规范(写进附录也行)
  • 可信度分级规则(3级或5级都可)
  • 证据截图/页码标注规范

第6章 地名与地点:历史地名消歧与“时态地理编码”怎么做

这是数字人文建成环境的高频难点,也是最容易做出“方法贡献”的部分。

6.1 两个必须承认的现实

  • 历史地点常常不是一个点,而是一段街、一片里坊、一个模糊区域
  • 同一地名可能在不同时期对应不同位置(更名、行政区调整、门牌改制)

6.2 推荐的数据结构(可直接落库)

  • Place(地点实体):统一ID
  • Name(名称记录):名称、别称、语言/字形、适用时间范围
  • Geometry(几何):点/线/面 + 坐标系 + 时间范围 + 来源证据
  • Link(对照关系):旧称→新称、模糊对应、包含关系(街道包含门牌等)

6.3 工具与做法

  • 起步阶段:人工地名表 + QGIS标注(最快建立可信底座)
  • 进阶:地名候选生成(文本抽取)+ 人工确认(人机协同)
  • 强调:把“不确定性”显式化(范围、多候选、置信度)

本章交付物

  • 时态地名库(哪怕先做1000条,也比“全自动但不可信”强)
  • 地名消歧日志(记录为什么这样判定)
  • 地名对照表(旧门牌/旧街名/别称)

第7章 老地图工程化:配准、误差、要素抽取与矢量图层标准

7.1 配准(Georeferencing)的底线要求

  • 控制点选择策略:稳定地物(河岸、城墙遗址、路口)优先
  • 误差指标记录:RMSE、控制点数量、异常点剔除原因
  • 多版本地图:每张图的配准参数与误差都要存档

7.2 要素图层(最常用四层)

  • 道路/巷弄(线)
  • 水系/岸线(线/面)
  • 地块(面)
  • 建筑轮廓/重要设施(面/点)

7.3 “半自动”比“全自动”更适合多数DH团队

  • 先用模型做粗分割/候选线,再人工校对
  • 让“人工校对”成为工作流的一部分(可计工时、可控质量)

本章交付物

  • 每张地图:配准文件 + 误差报告 + 控制点清单
  • 标准化GIS图层(含字段规范)
  • 关键要素的矢量数据(可导出GeoJSON/GeoPackage)

第8章 历史照片与街景:从“图像堆”到“可检索的空间证据”

8.1 最值得先做的两件事

  • 图像分类与编目:年代、地点、视角、题材(街景/建筑/人物活动)
  • 图像OCR:招牌、门牌、路牌是地理定位与社会生活的关键线索

8.2 立面与构件识别:建议以“研究问题”驱动

除非你有足够标注数据,否则不要一开始就追求复杂的构件检测。更务实的路径是:

  • 先做“建筑类型/风格”分类
  • 再针对一个高价值构件(例如拱券、山花、牌坊、招牌)做小模型

本章交付物

  • 图像库(含元数据与可检索标签)
  • 图像文本抽取结果(可回链到图像框选位置)
  • 重点对象的小规模标注集(为后续模型迭代做资产)

第9章 结构化抽取:把档案文本变成“事件表”和“建筑生命史”

9.1 两张表最关键

  • 事件表(Event):建造、修缮、拆除、迁移、灾害、用途变更、产权变更
  • 对象表(Building/Parcel/Institution):建筑/地块/机构的统一ID与属性

9.2 最实用的人机协同策略

  • 用AI做“候选抽取”(人名/地名/时间/动作词)
  • 人工做“确认与归一”(同名合并、地名消歧、时间规范化)
  • 每条记录必须挂 Evidence(原文截图/页码)

本章交付物

  • 事件数据库(可检索、可导出)
  • 建筑/地块“生命史时间线”(对象—事件序列)
  • 人工校对规范(保证多人协作一致)

第10章 分析模块:形态指标、可达性、网络关系与可比较结论

你不需要把分析写得“高深”,但要写得“可复核、可比较”。

10.1 形态演化(适合讲建成环境“怎么变”)

  • 路网连通(交叉口密度、连通度、绕行系数)
  • 地块破碎(平均地块面积、形状指数、分割程度)
  • 建筑强度(覆盖率、密度变化、沿街界面连续性等)

10.2 可达性(适合讲“为什么在这里/为何扩散”)

  • 到关键节点的网络距离(车站、码头、市场、学校、工厂)
  • 时期对比:节点出现前后可达性变化

10.3 关系网络(适合讲“谁在塑造空间”)

  • 机构—人物—建筑—事件的知识图谱
  • 看的是:权力、资本、社群如何通过空间落地

本章交付物

  • 指标定义文档(每个指标的计算方法与数据来源)
  • 结果图与可复现脚本/流程说明
  • 结论与反例(写清不成立的情况,反而更学术可信)

第11章 呈现与产品:互动地图、时间滑条、故事线三件套怎么交付

数字人文的行业交付,往往不是论文,而是“可使用的作品”。建议你把呈现分三层:

11.1 数据探索层(给研究者)

  • 时空检索:输入地名/建筑/事件 → 返回证据与地图定位
  • 对比视图:两个时期的地图叠加/切换

11.2 公众叙事层(给大众)

  • 故事地图(Story Map):按事件链讲述“空间如何被改变”
  • 时间滑条:让用户看到“扩张/收缩/迁移”

11.3 可下载与引用层(给学术与教育)

  • 数据导出(按许可控制)
  • 引用格式与证据链接(让成果可被引用、可被复核)

推荐技术栈(不绑定,但给你可落地选项)

  • 地图前端:Leaflet / Mapbox GL JS(看预算与许可)
  • 后端:PostGIS + API(FastAPI/Node均可)
  • 静态发布:如果团队小,可先做静态站点+预生成数据

本章交付物

  • 交互原型(MVP)
  • 可用的检索与证据回链功能
  • 发布说明(版权与使用边界)

第12章 验收与复盘:DH建成环境项目的“质量指标”怎么写才经得起审

这章建议你写得非常“硬”,因为它决定项目能否通过评审与长期使用。

12.1 三类验收指标(建议写进合同/课题书)

A 学术可信度

  • 结构化事实的证据回链率(例如 [≥95%] 有可定位证据)
  • 不确定性标注覆盖率(模糊地点/模糊时间必须标注)
  • 复现能力:同一数据与流程能否重跑得到一致结果

B 数据与工程质量

  • OCR抽检准确率、地图配准误差记录完整性
  • 数据字典覆盖率、字段一致性
  • 版本与变更日志完整性

C 使用效果

  • 研究检索效率提升(例如定位一个地点相关史料所需时间下降)
  • 展陈/公众使用数据(访问、停留、检索次数)
  • 二次研究复用(引用、合作请求)

12.2 复盘机制(让项目不止“交付即结束”)

  • 月度数据修订与版本发布
  • 新材料接入流程
  • 标注与模型迭代机制(把标注当资产)

本章交付物

  • 验收报告模板
  • 数据发布与许可说明
  • 迭代计划(下一阶段扩展到更多街区/更多时期/更多类型)

一份“可直接粘到项目书”的交付清单(按阶段)

阶段0:立项与方案(1–2周)

  • 研究问题书 + 可证伪假设
  • 数据来源与版权清单
  • 架构与工具选型说明
  • MVP范围(例如:一条街 + 两个时期 + 三类材料)

阶段1:数据底座(2–6周)

  • 元数据规范与数据字典
  • PostGIS库(含Place/Name/Event/Evidence等核心表)
  • 数据目录与版本规则
  • 初版证据链规范

阶段2:处理与结构化(4–10周)

  • OCR文本与可检索档案库
  • 时态地名库(含消歧记录)
  • 老地图配准文件 + 误差报告
  • GIS要素图层(道路/地块/建筑等)
  • 图像库标签化 + 图像OCR结果

阶段3:分析与论文级结果(4–8周)

  • 指标计算说明与可复现流程
  • 时空对比结果图与论证文本
  • 网络关系/知识图谱(若需要)
  • “结论—证据—反例”对应表述(写进报告)

阶段4:产品与发布(3–8周)

  • 互动地图/时间滑条/故事地图(MVP→正式版)
  • 证据回链功能(点击结论回到原始材料)
  • 数据导出与引用规范
  • 最终验收报告 + 迭代计划

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐