2025年GIS大模型和智能体大盘点

xiangshangdemayi

902人浏览 · 2026-02-28 09:57:25

xiangshangdemayi · 2026-02-28 09:57:25 发布

前言

2025被称为智能体元年，大家都开始搞智能体了，都开始让智能体来解决实际问题。在实际的应用中，大模型承担规划者的角色，智能体承担执行者的角色。2025年GIS大模型和智能体都发展到了什么水平？用一句话简单回答就是，各行各业的GIS从业者基本都在做本行业的大模型训练、微调或智能体构建。毕竟我们GIS已经被应用到了各行各业，别人不比你聪明，你也不比别人笨，大家都在各自的领域发光发热。接下来我们就逐个来盘一盘。

1 搞AI的这帮人都是些什么人？

搞AI这帮人都是些什么人？关于这个问题，有AI大佬总结出了四类人：

使用AI代工的人。简单来说就是用户知道某件事该怎么做，但是做起来很麻烦，很枯燥，就像电子厂里那帮安装电子零件的工人一样，每一个步骤早已经轻车熟路了，这种不停的、机械的、重复的浪费生命的事理所应当要交给AI做。
解锁了新能力的人。就是那些原本不会编程的人或者不会做某事的人，使用AI/智能体就能出来一个小网站，一个小程序，一个app之类的人，他们发现了新世界。
万恶的资本家们。就是那些老板们，原本要雇佣人帮他们做一些东西，但是突然发现AI也可以做，而且做出来的东西不一定比人工差。他们在对比了AI和人工成本后，发现AI可以24小时干活，成本和人工相比不值一提，于是他们也仿佛找到了新大陆。
在过程中学习的人。我可能就属于这类人了吧，AI太强了，我把他当做我的个人助理和老师。不懂的，问；不会的，问；不明白的，问。主打的就是一个随时随地请教。

2 目前有哪些的典型的GIS大模型？

我们可以用一张表来表示：

模型名称	预训练模型	方法	任务场景描述
K2	LLaMA2-7B	增量训练、监督微调	利用地球科学领域的专用语料库进行微调,提升了对地球科学知识的理解、推理和应用能力
GeoGalactica	Galactica-30B	增量训练、监督微调	利用GeoSignal-v2数据集构建的地球科学专用大语言模型,提升了在地质学、地球物理、气象学等领域的知识问答、理解与推理能力
BB-GeoGPT	LLaMA2-7B	增量训练、监督微调	通过GIS领域专业语料库微调,优化了基础模型在地理空间知识理解、地理问题问答和空间关系抽取等任务中的性能
ClimateGPT	LLaMA2-7B、13B、70B	增量训练、监督微调	通过模型微调和检索增强生成,整合自然、经济与社会科学等领域知识,为气候变化研究和决策提供跨学科多语言问答服务
OceanGPT	MiniCPM-2B、LLaMA2-7B、LLaMA3-8B	增量训练、监督微调	面向海洋科学任务,具备指令生成、知识推理和初步的具身智能能力,可支持海洋机器人在海洋工程任务中的规划与操作
GeoCode-GPT	Code-LLaMA-7B	增量训练、监督微调	通过地理空间代码语料库微调,实现多平台多编程语言地理空间代码生成任务,同时建立GeoCode-Eval地理空间代码生成能力评价标准
ChatGeoAI	LLaMA	监督微调	可通过自然语言查询自动生成并执行PyQGIS脚本,支持非专业用户使用GIS工具
Typhoon-T5	T5-large	监督微调	整合台风气象知识、灾害案例和灾害管理数据的台风灾害知识问答和预测系统
LLaMA-CoPB	LLaMA3-8B	监督微调	结合“计划行为理论”设计的时空推理模型,可用于移动行为生成
UrbanGPT	ChatGLM3-6B-Base	监督微调	城市动态预测设计专用大模型,能够在零样本场景下捕捉复杂的时空关系,服务于交通流量、人口迁移和犯罪率等预测任务

引自武汉大学吴华意老师论文《大语言模型驱动的GIS分析：方法、应用与展望》

通过这张表我们能发现几个问题：

基本都是通过对已有模型的增量训练或者监督微调实现的。
称之为中小模型似乎更为贴切，大模型的参数量至少应该在千亿以上，也可能是大模型太费显卡了，小模型在普通显卡上（显存24G以下）具有更广阔的实验场景。
涉及了多个领域。
尽管微调能够取得较好的效果,但是微调的数据集收集和制作困难,训练成本高,制约了模型微
调的研究和推广。

对微调感兴趣的同学可以参考作者之前的文章
https://mp.weixin.qq.com/s/SsOiXia2_VUb9WA2sMWj9g

3 这些GIS大模型用到了哪些训练/微调数据集？

我们同样可以用一张表来表示：

用途	名称	时间	描述
知识语料库	GeoLLM	2024年2月	基于OpenStreetMap数据,生成地理坐标与社会经济信息映射提示的地理空间知识,应用于人口密度和经济状况等GIS分析任务
知识语料库	GeoQAMap	2023年9月	基于Wikidata知识库中的地理实体及其相关信息,增强地理问题的自动解答和地图可视化的能力
知识语料库	Geo-FuB	2024年10月	基于154075条GoogleEarthEngine脚本,通过抽象语法树和Apriori算法提取函数算子组合,并进行语义映射,构建操作-函数知识库
知识语料库	洪水知识构建模型	2023年6月	包含219个实体和236种关系类型的洪水知识图谱,以及定义操作关系和输入输出数据结构的GIS知识图谱
预训练集	BB-GeoPT	2024年6月	包含2499篇GIS论文和24408条Wikipedia页面,涵盖GIS领域的理论和操作内容
预训练集	GeoCode-PT	2024年10月	包含275374段代码、10190个操作符、853个数据集知识条目,涉及多语言地理代码示例和操作说明,用于提升地理空间代码生成能力
预训练集	GeoCorpus	2024年1月	包含5980293篇地球科学相关论文,旨在提高模型在地球科学任务中的理解和生成能力
预训练集	TransGPT-PT	2024年2月	包含9760万词元和超过3000张图像的交通领域文献和报告,用于提升模型在交通分析与问答任务中的专业能力
指令微调数据集	GeoCode-SFT	2024年10月	使用结构化遍历算法和Self-instruct框架,生成502047条指令数据,涵盖运算符、数据集、平台语言理解和代码总结,用于增强模型的地理空间代码生成能力
指令微调数据集	ClimateIQA	2024年6月	包含8760张气象热图和254040个问答对,旨在训练视觉-语言模型识别极端天气事件,并准确解释气象热图
指令微调数据集	MMRS-1M	2024年1月	整合了34个现有遥感数据集及百万级图文数据对,旨在提升模型在遥感任务上的通用性与推理能力
指令微调数据集	CityInstruction	2024年6月	包含34万条通用指令数据和25万条城市领域数据,涵盖实体认知、空间探索、空间推理,旨在提升大语言模型的城市空间认知与任务解决能力
评估集	OceanBench	2024年10月	包含15个海洋相关任务,涵盖问答、分类、生成和推理等多种任务类型,旨在评估大语言模型在海洋科学任务上的执行能力
评估集	PPNL	2024年10月	包含64080个单目标和123600个多目标路径规划任务实例,旨在评估大语言模型的时空推理与规划能力
评估集	GeoCode-Bench	2024年10月	包含5000道选择题、1500道填空题、1500道判断题及1000道主观编程任务,旨在评估大语言模型生成地理空间代码的能力
评估集	VRSBench	2024年6月	包含29614张遥感影像、52472个目标描述句、123221个问答对和详细图像描述,旨在评估和提升视觉-语言模型在遥感影像理解任务上的性能
工具集	LLM-Find	2024年8月	支持6种数据源,提供元数据及技术支持,旨在通过自然语言指令实现地理数据的自动检索、下载和分析
工具集	ShapefileGPT	2024年10月	专门用于Shapefile处理的27个功能库,涵盖几何操作、空间查询和拓扑分析等任务
工具集	POIGPT	2024年6月	通过集成命名实体识别模块与GoogleMapAPI调用工具,识别并定位社交媒体文本中的兴趣点
工具集	MapGPT	2024年10月	包含68种专业制图工具,支持通过自然语言交互生成和优化地图

引自武汉大学吴华意老师论文《大语言模型驱动的GIS分析：方法、应用与展望》

这些数据大部分不是免费获取的，可用的免费数据可在huggingface获取，不局限于本文介绍

4 有哪些开源的GIS大模型或智能体？

4.1 开源测绘地理信息大模型相关

名称	简介	代码/模型仓库
EarthMarker	首个视觉提示遥感多模态大模型，支持图像、区域、点粒度解译。	https://github.com/wivizhang/EarthMarker
Prithvi	NASA与IBM合作的开源地理空间基础模型系列，包含洪水、作物分类等专用模型。	https://huggingface.co/ibm-nasa-geospatial
HyperSIGMA	面向高光谱图像的超大规模基础模型（>10亿参数），采用稀疏采样注意力机制。	https://github.com/WHU-Sigma/HyperSIGMA
SkySense	语义增强多模态遥感基础模型，支持像素级精细解析。	https://github.com/kang-wu/SkySensePlusPlus
TESSERA	像素级多模态遥感基础模型，提供全球逐年10米分辨率嵌入数据。	https://github.com/ucam-eo/geotessera
GeoChat	支持问答式交互和视觉定位的遥感大模型。	https://github.com/mbzuai-oryx/GeoChat
EarthMind	开源多模态大模型，引入空间注意力提示模块，高效处理多粒度地球观测数据。	https://github.com/shuyansy/EarthMind
EarthVL	渐进式地球视觉语言理解与生成框架，将语义分割与关系推理结合。	https://github.com/Junjue-Wang/EarthVL

4.2 开源地理信息智能体（Agent）框架相关

名称	简介	代码仓库
Earth-Agent	首个基于MCP工具生态整合RGB与光谱数据的智能体框架，实现跨模态、多步定量时空推理。	https://github.com/opendatalab
OpenEarthAgent	专为地理空间数据分析设计的统一智能体框架，能够规划流程、调用专业工具。	https://github.com/mbzuai-oryx
GeoEvolve	基于多智能体LLM的地理空间模型自动发现框架，融合领域知识与进化算法。	https://github.com/Vezarachan/GeoEvolve

4.3 其他相关开源框架与工具包

名称	简介	代码仓库
srai	标准化地理空间AI工具集的Python库，提供数据下载、区域划分、嵌入模型训练等完整管道。	https://github.com/kraina-ai/srai
Raster Vision	专注于卫星和航空影像的深度学习开源框架，简化地理空间计算机视觉任务的工作流程。	https://github.com/azavea/raster-vision
LuojiaNet	武汉大学自研的遥感深度学习框架，支持遥感AI模型的全生命周期管理。	https://github.com/WHULuoJiaTeam/luojianet
geoai	将人工智能与地理空间数据分析相结合的Python包，支持卫星影像处理和地理空间机器学习（可在QGIS中使用，重点推荐）	https://github.com/opengeos/geoai
segment-geospatial	基于Segment Anything Model (SAM) 用于地理空间数据分割的Python工具包。	https://github.com/opengeos/segment-geospatial
city2graph	用于将地理空间数据转换为图结构以支持图神经网络分析的Python库。	https://github.com/c2g-dev/city2graph

5 总结

这一年和同行们的沟通，或多或少大家都有一份焦虑和庆幸，焦虑的是能不能抓住AI科技发展的浪潮，庆幸的是AI辅助编程表象上是降低了编程的门槛，但实际上是对编程的基础要求更高了，不懂编程的人有极大概率会造成代码混乱加剧问题。
AI到底会怎么发展？我到底能用AI干什么？也许很多人都曾有过这样的疑问。作者只能说大家目前还都处于探索阶段，乾坤未定，你我皆是黑马。
虽然目前已经出现了一批如GeoGPT、GeoTool-GPT、MapGPT、autonomous GIS agent 等优秀的智能体工具，但是处于理论阶段、实验阶段还是工程阶段仍有待商榷。这些智能体的功能基本都是通过大模型将自然语言转为代码，然后去调用ArcGIS、QGIS、PostGIS等已经成熟的GIS工具来做分析、制图等。在可预见的未来，应该CASS、大疆等都会有人去做。希望CASS早日完善自己的文档，在官网找了很多次，都没有找到完善的文档。相信未来不能被大模型、智能体使用的工具大概率会被淘汰。
这一年看了很多论文的原因是没发现几个好用又实用的AIGIS开源框架，所以转向学术界去寻找灵感。关注这个号的同学应该大都是搞工程的同学，建议不要为了做架构而去做架构，同样不要为了做AI而去做AI，适合自己的才是最好的，结合自己的业务方向和兴趣去做，去结合AI，坚持下去，一定能做出来好东西。
国内的一些GIS大模型，说是发布了，但是好几个都找不到在哪里使用，建议好好学学大厂，做一个平台出来，这里就不一一列举了。回见~

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

A100、H100、H20算力租赁怎么选？企业级GPU选型指南

2048 AI社区

用 AI 一句话查 A 股数据，免费替代 Tushare（附完整教程）

【摘要】半导体板块近期大涨40%，存储芯片或迎超级周期。本文介绍一种零代码金融数据分析方案，通过阿里云百炼MCP平台的financial-expert技能，用自然语言即可查询A股/基金/宏观数据。3分钟完成安装（Node.js+CLI工具+API配置），支持五大实战场景：1)半导体行业估值分析；2)基本面选股（如筛选连续3年净利润增长>30%个股）；3)基金经理筛选；4)宏观指标趋势研判；5

2048 AI社区

工业级机器学习系统：总体架构设计

在以「工业大模型 × 数字孪生 × 具身智能」为核心驱动的智能制造系统（SoI）及高端装备全生命周期服务（AI-PSS）中，机器学习系统设计（Machine Learning System Design, MLSD）已跨越了传统“离线调包、单纯追求 AUC 分数、黑盒黑箱预测”的作坊模式。严肃工业与离散制造现场对 AI 随机性的幻觉具有零容忍、高确定性本质安全红线的刚性约束。