GADM 数据库

GADM,是一个全球行政区划数据库。包括了几乎全部国家和地区的行政区划界线数据。

主页: http://www.gadm.org/

下载数据

下载地址: http://www.gadm.org/country

GADM 提供的数据格式有 6 种:ESRI file geodatabase、Shapefile、Geopackage(SpatiaLite)、R(SpatialPolygonsDataFrame)、Google Earth .kmz 和 ESRI personal geodatabase。这里,数据格式应选择 shapefile。

在 GADM 中,country 的定义为 “any entity with an ISO country code”。关于 ISO country code,可以参考 维基百科。因而 想要下载完整的中国数据,实际上需要四个文件:China、Hong Kong、Macao、Taiwan。

也可以在 http://www.gadm.org/version2 下载全球的行政区划数据,但非常不推荐。一方面是数据量偏大,另一方面是全球区划数据保存到一个文件中,难以整理。不如麻烦一点,需要哪个国家下哪个 国家。

解压数据

以 china 数据为例

unzip CHN_adm_shp.zip -d CHN_adm

解压后得到一堆文件,其中 CHN_adm0.shpCHN_adm1.shpCHN_adm2.shpCHN_adm3.shp 为实际需要的 shapefile 数据。0、1、2、3 为第零、一、二、三级行政区划界线。对于 china 数据,基本相当于中国大陆地区的边界、省界、市界和区县界。如果是 Hong Kong 的数据,0 依然是边界,但是 1 理解为省界显然不合适,总之就是更低一级的行政区划界线。

格式转换

GMT 不能识别 shapefile 格式。需要使用 gdal 的 ogr2ogr 命令将 shapefile 格式转换为 GMT 可识别的格式。如果系统里找不到 ogr2ogr 命令,则说明 gdal 没有安装。Ubuntu 下的包 名是 gdal-bin ,CentOS 下的是 gdal。Windows 用户则需要到 gdal 官网下载安装。 另外,Windows 用户也可以用 ArcGIS 等软件实现格式的转换。

具体的转换命令是从网上找到的,CHN_adm0 为要生成的数据的文件名前缀,但是为什么要出现两次,表示很不解。

ogr2ogr -f GMT -nln CHN_adm0 CHN_adm0 CHN_adm0.shp
ogr2ogr -f GMT -nln CHN_adm1 CHN_adm1 CHN_adm1.shp
ogr2ogr -f GMT -nln CHN_adm2 CHN_adm2 CHN_adm2.shp
ogr2ogr -f GMT -nln CHN_adm3 CHN_adm3 CHN_adm3.shp

对于 Hong Kong、Macao、Taiwan 的数据做类似操作,最终生成了一堆以 gmt 结尾的文件。共计 12 个,如下:

CHN_adm0.gmt  CHN_adm2.gmt  HKG_adm0.gmt  MAC_adm0.gmt  MAC_adm2.gmt  TWN_adm1.gmt
CHN_adm1.gmt  CHN_adm3.gmt  HKG_adm1.gmt  MAC_adm1.gmt  TWN_adm0.gmt  TWN_adm2.gmt

绘图测试

PS1:数据为多段数据,在 GMT4 中需要使用 -m 选项,而 GMT5 已经可以自动处理多段数据,所以不需要使用 -m 选项。

PS2:数据中有领土纠纷的部分不符合中国政府的立场,笔者也不赞同。虽然有问题的部分不能在正规期刊上发表,但是没有问题的部分还是可以使用的。欢迎读者告诉我符合中国政府政策的数据。

中国全图

绘制中国全图需要全部的 0 级数据。

#!/bin/bash
R=72/136/15/54
J=M15c
PS=china.ps

gmt psxy -J$J -R$R -T -K -U > $PS
gmt psxy -R$R -J$J CHN_adm0.gmt -K -O >> $PS
gmt psxy -R$R -J$J HKG_adm0.gmt -K -O >> $PS
gmt psxy -R$R -J$J MAC_adm0.gmt -K -O >> $PS
gmt psxy -R$R -J$J TWN_adm0.gmt -K -O >> $PS
gmt psxy -R$R -J$J -T -O >> $PS

代码运行过程中 GMT 会出现如下的警告 (或错误?)

psxy: Bad OGR/GMT: @D record has more items than declared by @N

猜测是 ogr2ogr 转换的问题。在我的系统环境该警告不影响绘图效果,但评论中 @vv 指出在他的系统环境下会导致图形无法绘制。

效果图(缺了南海的九段线数据):

1 级行政区划

与上面的代码几乎一样,1 级数据中包含了 0 级数据,所以直接绘制 1 级数据即可。

R=72/136/15/54
J=M15c
PS=china.ps

gmt psxy -J$J -R$R -T -K -U > $PS
gmt psxy -R$R -J$J CHN_adm1.gmt -K -O >> $PS
gmt psxy -R$R -J$J HKG_adm1.gmt -K -O >> $PS
gmt psxy -R$R -J$J MAC_adm1.gmt -K -O >> $PS
gmt psxy -R$R -J$J TWN_adm1.gmt -K -O >> $PS
gmt psxy -R$R -J$J -T -O >> $PS

效果图:

在上一篇博文《GMT 中 DCW 数据的使用》中利用 GMT 自带的 DCW 数据也生成了类似的图,如下图。查看全图,对比一下会发现,两张图的细节方面还是有些区别的, 本文的数据绘制的似乎包含了更多的细节(主要是小的岛屿)。这个就得根据需求去选择了,当然也有 可能两个都是有问题的。

2 级行政区划

转换出来的 2 级数据中包含了全国所有的市级边界,用编辑器打开查看内容就会发现,每条线段都有 完整的注释,很容易从众多线段中提取出自己想要的部分。以安徽省为例,将与安徽有关的线段数据保存 到文件 Anhui_adm2.gmt 中:

R=114/120/29/35
J=M10c
PS=anhui.ps

gmt psxy -J$J -R$R -T -K -U > $PS
gmt psxy -R$R -J$J Anhui_adm2.gmt -K -O >> $PS
gmt psxy -R$R -J$J -T -O >> $PS

上面的脚本有一个很不方便的地方:想要画一个省的 2 级数据,每次都要从 CHN_adm2.gmt 中手动提取该省的数据信息。下面的例子可以避免这种手动提取的过程,主要通过 DCW 数据和 psclip 命令,使用全国 2 级数据(CHN_adm2.gmt),但是只绘制安徽省的 2 级数据。

R=114/120/29/35
J=M10c
PS=anhui.ps

gmt psxy -J$J -R$R -T -K -U > $PS
gmt pscoast -FCN.34 -M > Anhui_bnd.gmt
gmt psclip -J$J -R$R Anhui_bnd.gmt -K -O >> $PS
gmt psxy -R$R -J$J CHN_adm2.gmt -K -O >> $PS
gmt psclip -C -K -O >> $PS
gmt psxy -R$R -J$J -T -O >> $PS

脚本利用 pscoast 命令,将安徽省(代码为 34)的省界数据导出到文件 Anhui_bnd.gmt 中,然后利用该文件进行 clip,psxy 绘图时虽然使用的是全国的 2 级数据 CHN_adm2.gmt,但是只有安徽省内的部分会被绘制出来,最后还需要再次调用 psclip 以结束 clip。

上面的这个脚本生成了一个中间文件 Anhui_bnd.gmt,有强迫症的人是无法忍受这个的,因而上面的代码利用管道可以进一步简化为:

R=114/120/29/35
J=M10c
PS=anhui.ps

gmt psxy -J$J -R$R -T -K -U > $PS
gmt pscoast -FCN.34 -M | gmt psclip -J$J -R$R -K -O >> $PS
gmt psxy -R$R -J$J CHN_adm2.gmt -K -O >> $PS
gmt psclip -C -K -O >> $PS
gmt psxy -R$R -J$J -T -O >> $PS

上面三个脚本的最终结果基本是一致的,效果图如下:

注:三个脚本的成图效果是有差的,但是目前没有体现出来,在下一段 “3 级行政区划” 中,可以更明显地看出区别。

3 级行政区划

这里还是以安徽省为例,实际上只用 3 级数据即可,这里同时用了 2 级数据和 3 级数据,并且用不同的粗细和颜色来区分。需要注意,由于 3 级数据中包含了 2 级数据,所以下面的例子先画了 3 级数据,再用 2 级数据覆盖。如果画的顺序反了,效果就会差很多。

R=114.8/120/29.3/36
J=M14c
PS=anhui.ps

gmt psxy -J$J -R$R -T -K -U > $PS
gmt psxy -R$R -J$J CHN_adm3.gmt -W0.5p,gray -K -O >> $PS
gmt psxy -R$R -J$J CHN_adm2.gmt -W1p -K -O >> $PS
gmt psxy -R$R -J$J -T -O >> $PS

效果图如下:

下面的脚本利用了前面提到的 psclip 的方法:

R=114.8/120/29.3/36
J=M14c
PS=anhui.ps

gmt psxy -J$J -R$R -T -K -U > $PS
gmt pscoast -FCN.34 -M | gmt psclip -J$J -R$R -K -O >> $PS
gmt psxy -R$R -J$J CHN_adm3.gmt -W0.5p,gray -K -O >> $PS
gmt psxy -R$R -J$J CHN_adm2.gmt -W1p -K -O >> $PS
gmt psclip -C -K -O >> $PS
gmt psxy -R$R -J$J -T -O >> $PS

效果图如下:

将这两张图对比一下,容易发现,省界的部分线段明显变细了,这算是 clip 的一个缺点,使用省界数据进行 clip,同时又要绘制省界数据,如何判断省界数据点是否在 clip 区域内部是个问题。

修订历史

  • 2013-11-23:初稿;
  • 2013-11-28:绘制 2 级和 3 级边界时,利用 clip 的方法以减少人工操作。Thanks to @yangtze。
  • 2013-12-05:删除了数据包中的冗余隐藏文件,重新打包,提供多种格式下载。
  • 2014-01-19:不推荐下载全球行政区划数据;
  • 2015-04-11:存在个别 IP 恶意下载数据,导致我流量异常高,因而删除其他格式的数据压缩包,仅留下 7z 格式的,若仍出现流量异常,则删除该数据;
  • 2015-05-01:流量依然异常,猜测是搜索引擎会对齐定时抓取导致的;虽然已经在七牛限制了文件的非本站访问,但似乎对压缩文件无效。故删除该数据,有需要的可以自己去转换格式;
  • 2016-04-13:王亮添加了 GADM 数据库新增的 Macou 1、2 级数据,并修正了部分理解和表述;