前言

  2025被称为智能体元年,大家都开始搞智能体了,都开始让智能体来解决实际问题。在实际的应用中,大模型承担规划者的角色,智能体承担执行者的角色。2025年GIS大模型和智能体都发展到了什么水平?用一句话简单回答就是,各行各业的GIS从业者基本都在做本行业的大模型训练、微调或智能体构建。毕竟我们GIS已经被应用到了各行各业,别人不比你聪明,你也不比别人笨,大家都在各自的领域发光发热。接下来我们就逐个来盘一盘。

1 搞AI的这帮人都是些什么人?

  搞AI这帮人都是些什么人?关于这个问题,有AI大佬总结出了四类人:

  1. 使用AI代工的人。简单来说就是用户知道某件事该怎么做,但是做起来很麻烦,很枯燥,就像电子厂里那帮安装电子零件的工人一样,每一个步骤早已经轻车熟路了,这种不停的、机械的、重复的浪费生命的事理所应当要交给AI做。
  2. 解锁了新能力的人。就是那些原本不会编程的人或者不会做某事的人,使用AI/智能体就能出来一个小网站,一个小程序,一个app之类的人,他们发现了新世界。
  3. 万恶的资本家们。就是那些老板们,原本要雇佣人帮他们做一些东西,但是突然发现AI也可以做,而且做出来的东西不一定比人工差。他们在对比了AI和人工成本后,发现AI可以24小时干活,成本和人工相比不值一提,于是他们也仿佛找到了新大陆。
  4. 在过程中学习的人。我可能就属于这类人了吧,AI太强了,我把他当做我的个人助理和老师。不懂的,问;不会的,问;不明白的,问。主打的就是一个随时随地请教。

2 目前有哪些的典型的GIS大模型?

  我们可以用一张表来表示:

模型名称 预训练模型 方法 任务场景描述
K2 LLaMA2-7B 增量训练、监督微调 利用地球科学领域的专用语料库进行微调,提升了对地球科学知识的理解、推理和应用能力
GeoGalactica Galactica-30B 增量训练、监督微调 利用GeoSignal-v2数据集构建的地球科学专用大语言模型,提升了在地质学、地球物理、气象学等领域的知识问答、理解与推理能力
BB-GeoGPT LLaMA2-7B 增量训练、监督微调 通过GIS领域专业语料库微调,优化了基础模型在地理空间知识理解、地理问题问答和空间关系抽取等任务中的性能
ClimateGPT LLaMA2-7B、13B、70B 增量训练、监督微调 通过模型微调和检索增强生成,整合自然、经济与社会科学等领域知识,为气候变化研究和决策提供跨学科多语言问答服务
OceanGPT MiniCPM-2B、LLaMA2-7B、LLaMA3-8B 增量训练、监督微调 面向海洋科学任务,具备指令生成、知识推理和初步的具身智能能力,可支持海洋机器人在海洋工程任务中的规划与操作
GeoCode-GPT Code-LLaMA-7B 增量训练、监督微调 通过地理空间代码语料库微调,实现多平台多编程语言地理空间代码生成任务,同时建立GeoCode-Eval地理空间代码生成能力评价标准
ChatGeoAI LLaMA 监督微调 可通过自然语言查询自动生成并执行PyQGIS脚本,支持非专业用户使用GIS工具
Typhoon-T5 T5-large 监督微调 整合台风气象知识、灾害案例和灾害管理数据的台风灾害知识问答和预测系统
LLaMA-CoPB LLaMA3-8B 监督微调 结合“计划行为理论”设计的时空推理模型,可用于移动行为生成
UrbanGPT ChatGLM3-6B-Base 监督微调 城市动态预测设计专用大模型,能够在零样本场景下捕捉复杂的时空关系,服务于交通流量、人口迁移和犯罪率等预测任务

引自武汉大学吴华意老师论文《大语言模型驱动的GIS分析:方法、应用与展望》

通过这张表我们能发现几个问题:

  1. 基本都是通过对已有模型的增量训练或者监督微调实现的。
  2. 称之为中小模型似乎更为贴切,大模型的参数量至少应该在千亿以上,也可能是大模型太费显卡了,小模型在普通显卡上(显存24G以下)具有更广阔的实验场景。
  3. 涉及了多个领域。
  4. 尽管微调能够取得较好的效果,但是微调的数据集收集和制作困难,训练成本高,制约了模型微
    调的研究和推广。

对微调感兴趣的同学可以参考作者之前的文章
https://mp.weixin.qq.com/s/SsOiXia2_VUb9WA2sMWj9g

3 这些GIS大模型用到了哪些训练/微调数据集?

我们同样可以用一张表来表示:

用途 名称 时间 描述
知识语料库 GeoLLM 2024年2月 基于OpenStreetMap数据,生成地理坐标与社会经济信息映射提示的地理空间知识,应用于人口密度和经济状况等GIS分析任务
知识语料库 GeoQAMap 2023年9月 基于Wikidata知识库中的地理实体及其相关信息,增强地理问题的自动解答和地图可视化的能力
知识语料库 Geo-FuB 2024年10月 基于154075条GoogleEarthEngine脚本,通过抽象语法树和Apriori算法提取函数算子组合,并进行语义映射,构建操作-函数知识库
知识语料库 洪水知识构建模型 2023年6月 包含219个实体和236种关系类型的洪水知识图谱,以及定义操作关系和输入输出数据结构的GIS知识图谱
预训练集 BB-GeoPT 2024年6月 包含2499篇GIS论文和24408条Wikipedia页面,涵盖GIS领域的理论和操作内容
预训练集 GeoCode-PT 2024年10月 包含275374段代码、10190个操作符、853个数据集知识条目,涉及多语言地理代码示例和操作说明,用于提升地理空间代码生成能力
预训练集 GeoCorpus 2024年1月 包含5980293篇地球科学相关论文,旨在提高模型在地球科学任务中的理解和生成能力
预训练集 TransGPT-PT 2024年2月 包含9760万词元和超过3000张图像的交通领域文献和报告,用于提升模型在交通分析与问答任务中的专业能力
指令微调数据集 GeoCode-SFT 2024年10月 使用结构化遍历算法和Self-instruct框架,生成502047条指令数据,涵盖运算符、数据集、平台语言理解和代码总结,用于增强模型的地理空间代码生成能力
指令微调数据集 ClimateIQA 2024年6月 包含8760张气象热图和254040个问答对,旨在训练视觉-语言模型识别极端天气事件,并准确解释气象热图
指令微调数据集 MMRS-1M 2024年1月 整合了34个现有遥感数据集及百万级图文数据对,旨在提升模型在遥感任务上的通用性与推理能力
指令微调数据集 CityInstruction 2024年6月 包含34万条通用指令数据和25万条城市领域数据,涵盖实体认知、空间探索、空间推理,旨在提升大语言模型的城市空间认知与任务解决能力
评估集 OceanBench 2024年10月 包含15个海洋相关任务,涵盖问答、分类、生成和推理等多种任务类型,旨在评估大语言模型在海洋科学任务上的执行能力
评估集 PPNL 2024年10月 包含64080个单目标和123600个多目标路径规划任务实例,旨在评估大语言模型的时空推理与规划能力
评估集 GeoCode-Bench 2024年10月 包含5000道选择题、1500道填空题、1500道判断题及1000道主观编程任务,旨在评估大语言模型生成地理空间代码的能力
评估集 VRSBench 2024年6月 包含29614张遥感影像、52472个目标描述句、123221个问答对和详细图像描述,旨在评估和提升视觉-语言模型在遥感影像理解任务上的性能
工具集 LLM-Find 2024年8月 支持6种数据源,提供元数据及技术支持,旨在通过自然语言指令实现地理数据的自动检索、下载和分析
工具集 ShapefileGPT 2024年10月 专门用于Shapefile处理的27个功能库,涵盖几何操作、空间查询和拓扑分析等任务
工具集 POIGPT 2024年6月 通过集成命名实体识别模块与GoogleMapAPI调用工具,识别并定位社交媒体文本中的兴趣点
工具集 MapGPT 2024年10月 包含68种专业制图工具,支持通过自然语言交互生成和优化地图

引自武汉大学吴华意老师论文《大语言模型驱动的GIS分析:方法、应用与展望》

这些数据大部分不是免费获取的,可用的免费数据可在huggingface获取,不局限于本文介绍

4 有哪些开源的GIS大模型或智能体?

4.1 开源测绘地理信息大模型相关

名称 简介 代码/模型仓库
EarthMarker 首个视觉提示遥感多模态大模型,支持图像、区域、点粒度解译。 https://github.com/wivizhang/EarthMarker
Prithvi NASA与IBM合作的开源地理空间基础模型系列,包含洪水、作物分类等专用模型。 https://huggingface.co/ibm-nasa-geospatial
HyperSIGMA 面向高光谱图像的超大规模基础模型(>10亿参数),采用稀疏采样注意力机制。 https://github.com/WHU-Sigma/HyperSIGMA
SkySense 语义增强多模态遥感基础模型,支持像素级精细解析。 https://github.com/kang-wu/SkySensePlusPlus
TESSERA 像素级多模态遥感基础模型,提供全球逐年10米分辨率嵌入数据。 https://github.com/ucam-eo/geotessera
GeoChat 支持问答式交互和视觉定位的遥感大模型。 https://github.com/mbzuai-oryx/GeoChat
EarthMind 开源多模态大模型,引入空间注意力提示模块,高效处理多粒度地球观测数据。 https://github.com/shuyansy/EarthMind
EarthVL 渐进式地球视觉语言理解与生成框架,将语义分割与关系推理结合。 https://github.com/Junjue-Wang/EarthVL

4.2 开源地理信息智能体(Agent)框架相关

名称 简介 代码仓库
Earth-Agent 首个基于MCP工具生态整合RGB与光谱数据的智能体框架,实现跨模态、多步定量时空推理。 https://github.com/opendatalab
OpenEarthAgent 专为地理空间数据分析设计的统一智能体框架,能够规划流程、调用专业工具。 https://github.com/mbzuai-oryx
GeoEvolve 基于多智能体LLM的地理空间模型自动发现框架,融合领域知识与进化算法。 https://github.com/Vezarachan/GeoEvolve

4.3 其他相关开源框架与工具包

名称 简介 代码仓库
srai 标准化地理空间AI工具集的Python库,提供数据下载、区域划分、嵌入模型训练等完整管道。 https://github.com/kraina-ai/srai
Raster Vision 专注于卫星和航空影像的深度学习开源框架,简化地理空间计算机视觉任务的工作流程。 https://github.com/azavea/raster-vision
LuojiaNet 武汉大学自研的遥感深度学习框架,支持遥感AI模型的全生命周期管理。 https://github.com/WHULuoJiaTeam/luojianet
geoai 将人工智能与地理空间数据分析相结合的Python包,支持卫星影像处理和地理空间机器学习(可在QGIS中使用,重点推荐 https://github.com/opengeos/geoai
segment-geospatial 基于Segment Anything Model (SAM) 用于地理空间数据分割的Python工具包。 https://github.com/opengeos/segment-geospatial
city2graph 用于将地理空间数据转换为图结构以支持图神经网络分析的Python库。 https://github.com/c2g-dev/city2graph

5 总结

  这一年和同行们的沟通,或多或少大家都有一份焦虑和庆幸,焦虑的是能不能抓住AI科技发展的浪潮,庆幸的是AI辅助编程表象上是降低了编程的门槛,但实际上是对编程的基础要求更高了,不懂编程的人有极大概率会造成代码混乱加剧问题。
  AI到底会怎么发展?我到底能用AI干什么?也许很多人都曾有过这样的疑问。作者只能说大家目前还都处于探索阶段,乾坤未定,你我皆是黑马。
  虽然目前已经出现了一批如GeoGPT、GeoTool-GPT、MapGPT、autonomous GIS agent 等优秀的智能体工具,但是处于理论阶段、实验阶段还是工程阶段仍有待商榷。这些智能体的功能基本都是通过大模型将自然语言转为代码,然后去调用ArcGIS、QGIS、PostGIS等已经成熟的GIS工具来做分析、制图等。在可预见的未来,应该CASS、大疆等都会有人去做。希望CASS早日完善自己的文档,在官网找了很多次,都没有找到完善的文档。相信未来不能被大模型、智能体使用的工具大概率会被淘汰。
  这一年看了很多论文的原因是没发现几个好用又实用的AIGIS开源框架,所以转向学术界去寻找灵感。关注这个号的同学应该大都是搞工程的同学,建议不要为了做架构而去做架构,同样不要为了做AI而去做AI,适合自己的才是最好的,结合自己的业务方向和兴趣去做,去结合AI,坚持下去,一定能做出来好东西。
  国内的一些GIS大模型,说是发布了,但是好几个都找不到在哪里使用,建议好好学学大厂,做一个平台出来,这里就不一一列举了。回见~

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐