COG(Cloud optimized GeoTIFF——云优化GeoTiff)简介与实践
COG的简介,生成,使用
参考
简介部分翻译自cogeo
关于GeoTIFF文件格式,参考了osgeo和awaresystems
关于HTTP请求范围,参考MDN-HTTP范围请求
云优化GeoTIFF(COG)是一个常规的GeoTIFF文件,旨在托管在 HTTP 文件服务器上,其内部组织可以在云上实现更高效的工作流。它通过利用客户端发出HTTP来仅请求他们需要的文件部分来做到这一点。
常见的问题:
- 不是很明白这个东西有啥用?
简单来说,可以代替geoserver/arcgis server发布栅格数据,比wms/wmts节省服务器空间和内存 - 支持多大的tif?
我试过最大4G多的tif,一点问题没有,缩放平移十分流畅 - 缺点和局限?
目前前端API里只知道OpenLayers支持COG直接渲染,其他api不清楚。
OL使用webgl渲染cog,对于用canvas渲染的图层适用的比如后处理功能,有些不适用。
需要对数据做转化处理。 
技术概述
COG依赖两种技术
- 在GeoTIFF图片中保存除原始像元数据外的瓦片(tile)和概览(overview)
 - 使用HTTP范围请求获取单一文件的所需部分
 
GeoTIFF构建
COG所需的GeoTIFF,主要技术是在文件内部构建瓦片和概览,辅以图像压缩。
关于瓦片
熟悉地图开发的小伙伴应该对瓦片都很熟悉了,不清楚的可以自己搜一下关键字地图瓦片,简单介绍就是将完整的影像像拼图一样按照横竖的格网拆分成瓦片,只加载需要范围内的一个个瓦片而不是完整的巨大TIFF。
  常用的影像瓦片技术,比如ArcMap/ArcGIS Server,GeoServer的切片,都需要预先生成好切片存储到磁盘上,而COG是以瓦片格式存到TIFF文件中。
关于概览
概览创建同一图像的低分辨率重采样版本。这意味着它的细节要少得多(原始图像可能有 100 或 1000 像素对应到概览的 1 个像素),但也小得多。通常一个 GeoTIFF 会有很多概览,以匹配不同的缩放级别。这些增加了整个文件的大小,但能够更快地提供服务。
  用过ArcMap的可能更熟悉影像金字塔这个概念,和同事讨论了下,影像金字塔应该和概览意思差不多。
完整的文件结构
- TIFF / BigTIFF 签名
 - 全分辨率图像的 IFD ( Image File Directory文件图像目录 )
 - 不适合内嵌在 IFD 目录中的 TIFF 标签的值,例如TileOffsets,TileByteCounts和GeoTIFF键
 - 可选:第一个概览的 IFD(通常以 2 倍子采样),后跟不适合内联的标签值
 - 可选:第二个概览的 IFD(图像文件目录)(通常以 4 倍子采样),后跟不适合内联的标签值
 - ···
 - 可选:最后概览的 IFD(通常以 2的N次幂进行二次采样),后跟不适合内联的标签值
 - 可选:最后一个概览级别的瓦片内容
 - ···
 - 可选:第一个概览级别的瓦片内容
 - 全分辨率图像的瓦片内容
 
HTTP范围请求
HTTP 协议范围请求允许服务器只发送 HTTP 消息的一部分到客户端。范围请求在传送大的媒体文件,或者与文件下载的断点续传功能搭配使用时非常有用。
检测服务器端是否支持范围请求
假如在响应中存在 Accept-Ranges 头部(并且它的值不为 “none”),那么表示该服务器支持范围请求。
  这里请求的是我本地Nginx里的COG图像。
  在上面的响应中, Accept-Ranges: bytes 表示界定范围的单位是 bytes 。这里 Content-Length 也是有效信息,因为它提供了要检索的图片的完整大小。
从服务器端请求特定的范围
假如服务器支持范围请求的话,你可以使用 Range 头来生成该类请求。该首部指示服务器应该返回文件的哪一或哪几部分。
  这里就请求的该TIFF的0-65536字节。
两者结合
GeoTIFF将瓦片和概览按规则进行组织,存放放在云端(比如我本地测试用的Nginx),以便HTTP范围请求可以只请求相关的文件部分。
  当客户端想要渲染整个文件的概览图像时,它不必下载每个像素,它可以只请求更小的、已经创建的概览。HTTP范围请求支持服务器上的 GeoTIFF 文件的结构使客户端能够轻松找到所需的整个文件的一部分。
  当整个文件的一小部分需要处理或可视化时,瓦片就会发挥作用。这可能是概览的一部分,也可能是全分辨率。但是瓦片将一个区域的所有相关字节组织在文件的同一部分,因此范围请求可以获取它需要的内容。
  如果 GeoTIFF 没有通过概览和瓦片进行“云优化”,那么对数据进行远程操作仍然有效。只是当实际只需要很小一部分数据时,他们可能会下载整个文件或大部分文件。
COG生成
可以使用GDAL生成COG。这里简单介绍下GDAL,它是一个基于C++的空间数据功能库,我这里有基于JAVA和Python的安装介绍,见Java安装GDAL依赖,python安装GDAL。
  基于Java或Python开发可以将COG生成的功能比较方便地集成到现有工程里,除此之外也可以使用GDAL现成的脚本,这些脚本可以先按照Java安装GDAL依赖里下载的压缩包,解压后在release-1928-x64-dev\release-1928-x64\bin\gdal\apps下找到。
  使用脚本将普通tif转成COG可以这样操作:
- CD到脚本目录
 - 执行以下脚本,生成概览
 
gdaladdo -r average  你的tif路径 2 4 8 16 32
- 执行以下脚本,生成COG
 
gdal_translate 输入tif的路径 输出tif的路径 -co TILED=YES -co COMPRESS=DEFLATE -co COPY_SRC_OVERVIEWS=YES
主要参数的含义:
- TILED=YES 生成瓦片
 - COMPRESS=DEFLATE 使用DEFLATE方法压缩
 - COPY_SRC_OVERVIEWS=YES 从原数据中拷贝概览
 
使用Python程序生成的代码见这篇文章
成果查看
生成的COG有多种方法检验和查看,比如使用validate_cloud_optimized_geotiff.py检验
python validate_cloud_optimized_geotiff.py test.tif
至于查看,个人感觉比较方便的是使用QGIS(3.2以上版本)。
  QGIS是一个免费开源的GIS桌面端软件,和常用的ArcMap相比最大的优点肯定是免费(不需要破解 ),而且体量较轻,打开比较快,而且基本功能也比较全。
  当你生成了一个COG并且启用网络容器,如Nginx,就可以用QGIS打开COG的网络地址来在线查看。


  这样就可以看到了。右键图层窗口里的图层对象,查看Properties,可以查看该COG的属性信息,如范围,波段信息,空间参考等
  QGIS还可以加载在线地图服务,可以看下影像位置准不准,和其他资源对比下之类的
  这里做了波段拉伸,不然影像一片黑
在线渲染(基于Openlayers)
Openlayers更新了WebGLTile图层和GeoTIFFSource数据源,用geotiffjs解析tif源数据,再用WebGL渲染,实现了前端渲染GeoTIFF图像并进行波段组合,拉伸等功能。
  这里的例子用的是VUE2+TypeScript
  OL的引入不赘述了,下面是用到的组件
import GeoTIFFSource from "ol/source/GeoTIFF";
import Map from "ol/Map";
import WebGLTile from "ol/layer/WebGLTile";
import View from "ol/View";
获取元信息
COG文件里存储的波段信息和nodata值可以通过geotiffjs获取。
注意,这里获取是为了演示功能,如果仅为了显示不需要提前获取并使用自己指定的像素真实值范围,OL的GeoTIFFSource默认开启了normalize属性,将波段像素范围自动标准化为0-1之间的比例。
/**
 * 获取tif元信息
 * @param url
 * @returns  noData,波段信息
 */
export async function getGeoTifMetaData(url: string) {
  // 返回的是GeoTIFF对象 https://geotiffjs.github.io/geotiff.js/module-geotiff-GeoTIFF.html
  const tiff = await fromUrl(url);
  // 返回GeoTIFFImage https://geotiffjs.github.io/geotiff.js/module-geotiffimage-GeoTIFFImage.html
  const image = await tiff.getImage();
  const bands = [];
  // 获取波段数
  const samples = image.getSamplesPerPixel();
  for (let i = 0; i < samples; i++) {
    // 获取该波段信息
    const element = image.getGDALMetadata(i);
    bands.push(element);
  }
  // 获取nodata值
  const noData = image.getGDALNoData();
  return { noData, bands };
}
获取的元信息如下
编写渲染表达式
OL的WebGL图层使用表达式配置图层的渲染样式,具体的语法详见ExpressionValue
const url = "http://localhost:8082/static/cogtest/cog_origin.tif";
const metaData = await this.getGeoTifMetaData(url);
// 取出元信息里的波段最大最小值
const bands = metaData.bands.map((item) => {
  return {
    min: parseFloat(item.STATISTICS_MINIMUM),
    max: parseFloat(item.STATISTICS_MAXIMUM),
  };
});
const style = {
  color: [
    "array",
    // 这里123波段对应RGB,分别做线性拉伸,最大值*0.1为了效果比较好
    // 若初始化GeoTIFFSource时normalize为true则不需要使用像素值拉伸,而是0-1之间的比例
    ["interpolate", ["linear"], ["band", 1], bands[0].min, 0, bands[0].max * 0.1, 1],
    ["interpolate", ["linear"], ["band", 2], bands[1].min, 0, bands[1].max * 0.1, 1],
    ["interpolate", ["linear"], ["band", 3], bands[2].min, 0, bands[2].max * 0.1, 1],
    1,
  ],
};
加载图层
const source = new GeoTIFFSource({
  // 默认为true,这里为了演示使用真实值拉伸设为false
  normalize: false,
  sources: [
    {
      url,
      // 这里可以手动重设min,max,nodata等属性以覆盖tif原始信息
      nodata: 0,
    },
  ],
});
// GeoTIFF的view是异步的,里面存了COG的范围,空间参考等信息
source.getView().then((view) => {
  const layer = new WebGLTile({
    className: "WebGLTile",
    style,
    source,
    extent: view.extent,
  });
  const map = new Map({
    target: "map",
    layers: [layer],
    view: new View({
      projection: "EPSG:3857",
    }),
  });
  map.getView().fit(view.extent!, { padding: [50, 50, 50, 50] });
});
显示效果

  其他功能示例可以参考OL官网的示例
  使用ArcGIS Maps SDK for JavaScript加载COG见示例
  https://developers.arcgis.com/javascript/latest/sample-code/layers-imagerytilelayer-cog/
  cesium加载cog没有官方实现,但有别人开发的插件
  https://github.com/hongfaqiu/TIFFImageryProvider
更多推荐
 

所有评论(0)