文档章节

gdelt新闻中国国内版本来了,数据分析爱好者和新闻事件分析研究可以尽情的在数据海洋里遨游

z
 zhanshen战神
发布于 2016/06/15 10:47
字数 870
阅读 105
收藏 0

转至元数据起始

GDELT(www.gdeltproject.org)每时每刻监控着每个国家的几乎每个角落的100多种语言的新闻媒体--印刷的、广播的和web形式的,识别人员、位置、组织、数量、主题、数据源、情绪、报价、图片和每秒都在推动全球社会的事件,GDELT为全球提供了一个自由开放的计算平台。

GDELT2.0每个15分钟提供全球事件数据。GDELT目前的事件库约有3.5亿条事件数据。这些事件从1979年1月1日开始一直到今日。GDELT第一项服务就是免费的数据下载。同时GDELT还在谷歌的BigQuery上提供了数据API,这样您可以使用谷歌的分析工具进行分析。GDELT的数据除了事件数据外,还提供了GKG数据,也就是全球知识图(Global Knowledge Graph)的数据。在国内您也可以到疙瘩汤(www.gdelt.cn)上下载数据。

在2013年美国国际开发总署 (USAID)和人权联合会举办的模型挑战赛利用GDEL数据作为最后一轮技术暴行预防挑战,这个挑战要求挑战者创建一个算法模型来预测合适何地将会发生 大规模暴行。建百名挑战者提交了618个算法,获胜算法在有限或者没有历史大规模暴乱数据的情况下,每个区域只考虑23个地缘、社会政治和历史冲突因素, 在区域内暴行预测特别成功。
  这个是由来自北京的数据科学家李小石开发的,他在这个模型里融合了23个影响因素去做预测,并靠这个夺得了联合国防范暴行高科技竞赛的最高奖金,一万俩千 美金。令人难以置信的是,这个模型可以预测到在一个从未发生过暴乱的额地区将要发生的严重暴乱。这个模型最大作用不在于节省一个专家去预测在那些动荡地区 将要发生的暴乱,比如苏区和叙利亚地区,而在于预测那些被掉以轻心的事件。这个算法通常的预测正确率要高于另一个常用的dummy预测模型62%,而对于 那些在过去半年内没有暴乱的地区,这个模型的预测准确率却高于112%。

GDELT提供了分析服务,您需要的查询条件输入到页面。选择好需要的服务即可在10分钟内收到含有您需要的数据。利用这些数据即可对其进行分析。主要的分析形式有:事件浏览器、事件网络、事件时间线、事件热力图、GKG网络、GKG时间线、GKG热力图、GKG浏览等等。

GDELT还提供了四个解决方案,分别为态势感知、影响着网络、风险评估与全球趋势、政策反响和人权与危机处理等。

© 著作权归作者所有

共有 人打赏支持
z
粉丝 0
博文 1
码字总数 870
作品 0
海淀
私信 提问
使用 GDELT 2 和 PHP 来分析世界!

你对政治事件感兴趣吗? 你想玩转世界上最大的数据库之一吗? 如果你的回答是“是”,请往下阅读,相信你会对本文内容感兴趣! 本文承诺,接下来会使用 PHP 来操作 GDELT。 我会用一个简单例...

oschina
2016/12/06
2.9K
5
GDELT项目介绍

GDELT(www.gdeltproject.org)每时每刻监控着每个国家的几乎每个角落的100多种语言的新闻媒体--印刷的、广播的和web形式的,识别人员、位置、组织、数量、主题、数据源、情绪、报价、图片和每...

zhangkaiyuan1
2016/06/15
2.8K
0
“今日头条”怎么计算:“网络爬虫+相似矩阵”技术运作流程

今日头条这类资讯聚合平台是基于数据挖掘技术,筛选和推荐新闻:“它为用户推荐有价值的、个性化的信息,提供连接人与信息的新型服务,是国内移动互联网领域成长最快的产品服务之一”。自从2...

罗盛力
2016/07/30
163
0
坚守“品质阅读”初心 红板报让新闻更好看

  【IT168 评论】互联网发展至今,绝大多数信息都能从互联网中获取,然而筛选有价值的信息也将耗费大量的个人时间。在“标题党”“震惊体”充斥的网络环境下,Flipboard成为一股清流:一款...

it168网站
2017/10/20
0
0
这几个争做数据圈清流的公众号,你都知道吗?

关于数据,哪些才是你最关注的方面?是数据爬取、处理、可视化?是人工智能、机器学习等各种前瞻算法?还是各种热点趋势下的大数据洞察?在这个满屏营销文的繁杂网络环境下,简单有效地获取优...

enohtzvqijxo00atz3y8
2017/11/30
0
0

没有更多内容

加载失败,请刷新页面

加载更多

jquery通过id显示隐藏

var $div3 = $('#div3'); 显示 $div3.show(); 隐藏 $div3.hide();

yan_liu
今天
3
0
《乱世佳人》读书笔记及相关感悟3900字

《乱世佳人》读书笔记及相关感悟3900字: 之前一直听「荔枝」,后来不知怎的转向了「喜马拉雅」,一听就是三年。上班的时候听房产,买房了以后听装修,兴之所至时听旅行,分手后听亲密关系,...

原创小博客
今天
3
0
大数据教程(9.6)map端join实现

上一篇文章讲了mapreduce配合实现join,本节博主将讲述在map端的join实现; 一、需求 实现两个“表”的join操作,其中一个表数据量小,一个表很大,这种场景在实际中非常常见,比如“订单日志...

em_aaron
今天
3
0
cookie与session详解

session与cookie是什么? session与cookie属于一种会话控制技术.常用在身份识别,登录验证,数据传输等.举个例子,就像我们去超市买东西结账的时候,我们要拿出我们的会员卡才会获取优惠.这时...

士兵7
今天
3
0
十万个为什么之为什么大家都说dubbo

Dubbo是什么? 使用背景 dubbo为什么这么流行, 为什么大家都这么喜欢用dubbo; 通过了解分布式开发了解到, 为适应访问量暴增,业务拆分后, 子应用部署在多台服务器上,而多台服务器通过可以通过d...

尾生
今天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部