文档章节

R语言做地图上的分析

openthings
 openthings
发布于 2015/07/03 08:22
字数 1581
阅读 9105
收藏 6

R和ggplot可视化功能非常强大,了解了一下其中的地图做法,发现R做世界地图、美国地图非常容易,但做中国地图就太麻烦了,需要自己DIY。

DIY也有多种方式,但网络上各种帖子教程的出图效果都不太理想,达不到工作用要求。下面是我的摸索过程,记录如下备忘,也请教于R老师们。

参考书目:ggplot2,R graphics cookbook,参考贴:http://site.douban.com/182577/widget/notes/10568279/note/257898418/


0、引子

R里有个绘制地图的maps包,加载后即可绘制地图,试一下以下命令:

library(maps)

map()

即可画出一个世界地图。再试试:

map("state")

map("county")

可分别画出美国分州和分county的地图,真是不费吹灰之力。


可是,要画一幅中国地图,就没有这么容易了,需要先加载一个mapdata包:

library(mapdata)

map("china")

但发现居然还是没有重庆的地图,太坑爹了,没法用,只有自己构造中国地图了。下面开始进入正题,如何用R绘制中国分省热力地图。


1、准备地图数据

先要找到中国地图数据文件。到国家基础地理信息中心的网站(http://nfgis.nsdi.gov.cn)下载官方空间文件,但这个政府网站总是打不开!你可到微信公众号 iamExcelPro 发送 shapefile 获得下载地址,我是雷锋。解压到 c:/rstudy 目录,有3个文件,都是需要的。

加载maptools包,读取空间文件:

library("maptools")

china_map = readShapePoly("c:/rstudy/bou2_4p.shp")       # 读取地图空间数据

plot一下看看,是一幅中国地图,有重庆,还包括南海的岛屿,政府数据就是严谨一些:

plot(china_map)

但地图投影方式不对,看起来太扁了,完全不是我们常见的昂首雄鸡状。

加载ggplot2包,用ggplot绘制,并使用polyconic投影方式,显示正常。

library(ggplot2)

ggplot(china_map,aes(x=long,y=lat,group=group)) +

    geom_polygon(fill="white",colour="grey") +

    coord_map("polyconic")

现在地图是可用的了,但还需要加载和拼接行政信息,以便能与业务数据映射。

x <- china_map@data           #读取行政信息

xs <- data.frame(x,id=seq(0:924)-1)          #含岛屿共925个形状

library(ggplot2)

china_map1 <- fortify(china_map)           #转化为数据框


library(plyr)

china_map_data <- join(china_map1, xs, type = "full")       #合并两个数据框

提示:Joining by: id

看不懂?没关系,过了就行。


2、准备业务数据

网上教程居然都是在命令行里输入数据,也很坑爹。我们还是从Excel表格转存来得方便。

按以下格式准备好指标数据,并存为csv格式文件。不直接读取xlsx文件是因为需要装的包比较麻烦。


注意第1列的字段名为NAME,各省名称也是要固定一致的,是为了和地图数据框里的省名一致,便于合并。各省名称是用以下命令查看并记下的。

> unique(china_map@data$NAME)

[1] 黑龙江省         内蒙古自治区     新疆维吾尔自治区 吉林省

[5] 辽宁省           甘肃省           河北省           北京市

[9] 山西省           天津市           陕西省           宁夏回族自治区

[13] 青海省           山东省           西藏自治区       河南省

[17] 江苏省           安徽省           四川省           湖北省

[21] 重庆市           上海市           浙江省           湖南省

[25] 江西省           云南省           贵州省           福建省

[29] 广西壮族自治区   台湾省           广东省           香港特别行政区

[33] 海南省


下面读取业务指标数据,并与地图数据合并:

mydata <- read.csv("c:/rstudy/geshengzhibiao.csv")          #读取指标数据,csv格式

china_data <- join(china_map_data, mydata, type="full")          #合并两个数据框

提示:Joining by: NAME


3、绘制地图

现在可以开始试试画填色地图了:

ggplot(china_data, aes(x = long, y = lat, group = group, fill = zhibiao)) +

    geom_polygon(colour="grey40") +

    scale_fill_gradient(low="white",high="steelblue") +  #指定渐变填充色,可使用RGB

    coord_map("polyconic")        #指定投影方式为polyconic,获得常见视角中国地图

好,看到填色地图了,但图中的背景色、坐标轴、经纬线都是不需要的,图例也可以放到左下角,用theme命令清除:

ggplot(china_data, aes(x = long, y = lat, group = group,fill = zhibiao)) +

    geom_polygon(colour="grey40") +

    scale_fill_gradient(low="white",high="steelblue") +  #指定渐变填充色,可使用RGB

    coord_map("polyconic") +       #指定投影方式为polyconic,获得常见视角中国地图

    theme(               #清除不需要的元素

         panel.grid = element_blank(),

         panel.background = element_blank(),

         axis.text = element_blank(),

         axis.ticks = element_blank(),

         axis.title = element_blank(),

         legend.position = c(0.2,0.3)

         )

4、添加省名标签

有时候需要显示省名标签,特别是给老领导看。可根据每个省形状的经纬度平均值求近似中心位置,标注省名。

midpos <- function(x) mean(range(x,na.rm=TRUE))#取形状内的平均坐标

centres <- ddply(china_data,.(province),colwise(midpos,.(long,lat)))


ggplot(china_data,aes(long,lat))+       #此处语法与前面不同,参考ggplot2一书P85

    geom_polygon(aes(group=group,fill=zhibiao),colour="black")+

    scale_fill_gradient(low="white",high="steelblue") +

    coord_map("polyconic") +

    geom_text(aes(label=province),data=centres) +

    theme(

         panel.grid = element_blank(),

         panel.background = element_blank(),

         axis.text = element_blank(),

         axis.ticks = element_blank(),

         axis.title = element_blank()

         )

但发现海南两个字跑到南海去了,不行。下面改使用省会城市的经纬度数据标注省名。

province_city <- read.csv("c:/rstudy/chinaprovincecity.csv")  #读取省会城市坐标


ggplot(china_data,aes(long,lat))+

    geom_polygon(aes(group=group,fill=zhibiao),colour="grey60")+

    scale_fill_gradient(low="white",high="steelblue") +

    coord_map("polyconic") +

geom_text(aes(x = jd,y = wd,label = province), data =province_city)+

    theme(

         panel.grid = element_blank(),

         panel.background = element_blank(),

         axis.text = element_blank(),

         axis.ticks = element_blank(),

         axis.title = element_blank()

         )

至此,终于DIY绘制出了一份中国分省的热力地图,真是够折腾够找虐的,好在图形很精准,以后也可以复用代码。


所以结论就是,一般非专业用户还是使用BingMap、PowerMap、Tableau或者《用地图说话》中的Excel模板,直接填数据出地图吧,其中Excel模板方式是最简单、便携,office协同性最好的。


如果你想用这些代码出图,可准备好用到的3个文件到相应目录,其中一个是你的业务指标csv文件,一步步运行以上代码,应该就可得到一幅中国地图。


© 著作权归作者所有

共有 人打赏支持
openthings
粉丝 297
博文 1091
码字总数 621386
作品 1
东城
架构师
私信 提问
R语言入门 – 什么是R语言,为什么选择R语言用于机器学习或数据挖掘

  R语言最近在TIOBE排名上取得了不小的进步,上升到了第13名。因为机器学习的火爆的程度和R语言特殊的语法,使得它的关注度越来越高。好多人对于R语言的特性和语法不太了解,而因我在上学的...

全栈开发
2018/03/06
0
0
给我两小时!带你发动R语言数据挖掘的高铁,一往直前!

主题: 数据挖掘快速上手之R语言实践 随之DT时代的到来,传统的统计分析方法已经不能解决海量高维数据,如何运用数据挖掘手段对复杂数据进行数据处理、数据可视化、数据建模及模型解读是每一...

李晓文
2017/04/18
0
0
微软拥抱开源的步伐又迈进了一步

去年,当萨提亚·纳德拉说出“微软深爱着Linux”这句话的时候,微软已经下定了决心要积极开放地拥抱开源。鲍尔默时代微软将开源操作系统视作 “毒瘤”的想法,可以说是已经荡然无存了。所以在...

oschina
2015/07/02
7.1K
17
R语言可视化学习笔记之相关矩阵可视化包ggcorrplot

基于ggplot2包以及corrplot包的相关矩阵可视化包ggcorrplot,ggcorrplot包提供对相关矩阵重排序以及在相关图中展示显著性水平的方法,同时也能计算相关性p-value 安装方法就不提了,不懂的可...

R语言中文社区
2018/01/25
0
0
【2017.8.19-20●上海】理论+实战:玩转R语言

随着生物信息、临床诊断等各个领域的信息化发展,大数据的分析与管理已经成为这个时代必然面对的机遇和挑战。数理统计学作为研究“数据智能”的科学,在数据科学领域扮演者越来越重要的角色。...

慧算学院
2017/06/06
15
0

没有更多内容

加载失败,请刷新页面

加载更多

四、RabbitMQ3.7在CentOS7下的安装

安装依赖 sudo yum install -y gcc gcc-c++ glibc-devel make ncurses-devel openssl-devel autoconf java-1.8.0-openjdk-devel git 创建yum源 vi /etc/yum.repos.d/rabbitmq-erlang.repo [......

XuePeng77
今天
2
0
android 延长Toast的时长

示例:myToast(5000,"hello"); public void myToast(int showTime, String msg) { Toast hello = Toast.makeText(getActivity(), msg, Toast.LENGTH_SHORT); new CountDownTimer(......

雨焰
昨天
4
0
浅谈mybatis的日志适配模式

Java开发中经常用到的日志框架有很多,Log4j、Log4j2、slf4j等等,Mybatis定义了一套统一的日志接口供上层使用,并为上述常用的日志框架提供了相应的适配器。有关适配器模式例子可以参考 设计...

算法之名
昨天
13
0
大数据教程(13.6)sqoop使用教程

上一章节,介绍了sqoop数据迁移工具安装以及简单导入实例的相关知识;本篇博客,博主将继续为小伙伴们分享sqoop的使用。 一、sqoop数据导入 (1)、导入关系表到HIVE ./sqoop import --connect...

em_aaron
昨天
3
0
Git cherry-pick 使用总结

应用背景:假设现在有两个分支:dev_01, dev_02. 如果我想把dev_01分支上的某几个commit合并到dev_02分支, 那么怎么办呢? 这就是cherry-pick的工作了。cherry-pick会捡选某些commit, 即把某...

天王盖地虎626
昨天
9
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部