文档章节

gdelt新闻中国国内版本来了,数据分析爱好者和新闻事件分析研究可以尽情的在数据海洋里遨游

z
 zhanshen战神
发布于 2016/06/15 10:47
字数 870
阅读 87
收藏 0

转至元数据起始

GDELT(www.gdeltproject.org)每时每刻监控着每个国家的几乎每个角落的100多种语言的新闻媒体--印刷的、广播的和web形式的,识别人员、位置、组织、数量、主题、数据源、情绪、报价、图片和每秒都在推动全球社会的事件,GDELT为全球提供了一个自由开放的计算平台。

GDELT2.0每个15分钟提供全球事件数据。GDELT目前的事件库约有3.5亿条事件数据。这些事件从1979年1月1日开始一直到今日。GDELT第一项服务就是免费的数据下载。同时GDELT还在谷歌的BigQuery上提供了数据API,这样您可以使用谷歌的分析工具进行分析。GDELT的数据除了事件数据外,还提供了GKG数据,也就是全球知识图(Global Knowledge Graph)的数据。在国内您也可以到疙瘩汤(www.gdelt.cn)上下载数据。

在2013年美国国际开发总署 (USAID)和人权联合会举办的模型挑战赛利用GDEL数据作为最后一轮技术暴行预防挑战,这个挑战要求挑战者创建一个算法模型来预测合适何地将会发生 大规模暴行。建百名挑战者提交了618个算法,获胜算法在有限或者没有历史大规模暴乱数据的情况下,每个区域只考虑23个地缘、社会政治和历史冲突因素, 在区域内暴行预测特别成功。
  这个是由来自北京的数据科学家李小石开发的,他在这个模型里融合了23个影响因素去做预测,并靠这个夺得了联合国防范暴行高科技竞赛的最高奖金,一万俩千 美金。令人难以置信的是,这个模型可以预测到在一个从未发生过暴乱的额地区将要发生的严重暴乱。这个模型最大作用不在于节省一个专家去预测在那些动荡地区 将要发生的暴乱,比如苏区和叙利亚地区,而在于预测那些被掉以轻心的事件。这个算法通常的预测正确率要高于另一个常用的dummy预测模型62%,而对于 那些在过去半年内没有暴乱的地区,这个模型的预测准确率却高于112%。

GDELT提供了分析服务,您需要的查询条件输入到页面。选择好需要的服务即可在10分钟内收到含有您需要的数据。利用这些数据即可对其进行分析。主要的分析形式有:事件浏览器、事件网络、事件时间线、事件热力图、GKG网络、GKG时间线、GKG热力图、GKG浏览等等。

GDELT还提供了四个解决方案,分别为态势感知、影响着网络、风险评估与全球趋势、政策反响和人权与危机处理等。

© 著作权归作者所有

共有 人打赏支持
z
粉丝 0
博文 1
码字总数 870
作品 0
海淀
“今日头条”怎么计算:“网络爬虫+相似矩阵”技术运作流程

今日头条这类资讯聚合平台是基于数据挖掘技术,筛选和推荐新闻:“它为用户推荐有价值的、个性化的信息,提供连接人与信息的新型服务,是国内移动互联网领域成长最快的产品服务之一”。自从2...

罗盛力
2016/07/30
163
0
坚守“品质阅读”初心 红板报让新闻更好看

  【IT168 评论】互联网发展至今,绝大多数信息都能从互联网中获取,然而筛选有价值的信息也将耗费大量的个人时间。在“标题党”“震惊体”充斥的网络环境下,Flipboard成为一股清流:一款...

it168网站
2017/10/20
0
0
这几个争做数据圈清流的公众号,你都知道吗?

关于数据,哪些才是你最关注的方面?是数据爬取、处理、可视化?是人工智能、机器学习等各种前瞻算法?还是各种热点趋势下的大数据洞察?在这个满屏营销文的繁杂网络环境下,简单有效地获取优...

enohtzvqijxo00atz3y8
2017/11/30
0
0
你不知道的数字化转型,与IBM再造高效个性化新闻

根据慧聪的《2016年中国广电行业发展报告》,2016年我国广电行业搭乘“互联网+”的快车,深层融合、深度洗牌,深刻改变行业内在结构,激发行业新发展,2016年是广电改革发展、转型升级、提质...

云科技时代
2017/11/23
0
0
币圈数据一网打尽,区块网网罗链圈大小事

区块链(Blockchain)是比特币的一个重要概念,区块链是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了过去十分钟内所有比特币网络交易的信息,用于验证其信息的有效性(防伪)和生...

未来财经
2017/11/30
0
0

没有更多内容

加载失败,请刷新页面

加载更多

为什么Java大神,都在看Spring Boot和Spring Cloud的书?

如果你是一名Java开发人员,并且最近正打算学习Spring Boot和Spring Cloud框架并寻找一些关于它们的最好的书籍,那么,你今天就来对地方了。 本文,我们将讨论一些学习Spring Boot和Spring ...

Java小铺
32分钟前
9
0
springboot logback日志配置

springboot 如果不使用外部tomcat的话,日志是需要自己配置的,不然的话就只有控制台的日志,但是日志又是我们在项目上了生产环境,出问题时,检查问题的唯一途径,所以我们要配置详细的日志...

曾大大胖
32分钟前
2
0
Linux服务器集体篡改时间的方法

Red Hat 虚拟化课程RH318,中小型公司使用的话,感觉可以匹敌OpenStack。手头上有一个VMware的映像,RHEV 3.5版的,只能把系统时间调整到2016年才能使用。Red Hat的RHEV已经更新到4.1版,不过...

大别阿郎
32分钟前
2
0
Tomcat启动异常:java.lang.ClassNotFoundException

警告: Name = mysqlDataSource Property maxActive is not used in DBCP2, use maxTotal instead. maxTotal default value is 8. You have set value of "100" for "maxActive" property, wh......

hengbao5
34分钟前
1
0
GO错误的一些处理(defer,recover,panic)

package main import("fmt""errors")func main() {num := 10fmt.Printf("num的类型%T, num的值%v, num的地址%v\n", num, num, &num)num2 := new(int) //返回一个指针//num...

汤汤圆圆
43分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部