文档章节

gdelt新闻中国国内版本来了,数据分析爱好者和新闻事件分析研究可以尽情的在数据海洋里遨游

z
 zhanshen战神
发布于 2016/06/15 10:47
字数 870
阅读 178
收藏 0

转至元数据起始

GDELT(www.gdeltproject.org)每时每刻监控着每个国家的几乎每个角落的100多种语言的新闻媒体--印刷的、广播的和web形式的,识别人员、位置、组织、数量、主题、数据源、情绪、报价、图片和每秒都在推动全球社会的事件,GDELT为全球提供了一个自由开放的计算平台。

GDELT2.0每个15分钟提供全球事件数据。GDELT目前的事件库约有3.5亿条事件数据。这些事件从1979年1月1日开始一直到今日。GDELT第一项服务就是免费的数据下载。同时GDELT还在谷歌的BigQuery上提供了数据API,这样您可以使用谷歌的分析工具进行分析。GDELT的数据除了事件数据外,还提供了GKG数据,也就是全球知识图(Global Knowledge Graph)的数据。在国内您也可以到疙瘩汤(www.gdelt.cn)上下载数据。

在2013年美国国际开发总署 (USAID)和人权联合会举办的模型挑战赛利用GDEL数据作为最后一轮技术暴行预防挑战,这个挑战要求挑战者创建一个算法模型来预测合适何地将会发生 大规模暴行。建百名挑战者提交了618个算法,获胜算法在有限或者没有历史大规模暴乱数据的情况下,每个区域只考虑23个地缘、社会政治和历史冲突因素, 在区域内暴行预测特别成功。
  这个是由来自北京的数据科学家李小石开发的,他在这个模型里融合了23个影响因素去做预测,并靠这个夺得了联合国防范暴行高科技竞赛的最高奖金,一万俩千 美金。令人难以置信的是,这个模型可以预测到在一个从未发生过暴乱的额地区将要发生的严重暴乱。这个模型最大作用不在于节省一个专家去预测在那些动荡地区 将要发生的暴乱,比如苏区和叙利亚地区,而在于预测那些被掉以轻心的事件。这个算法通常的预测正确率要高于另一个常用的dummy预测模型62%,而对于 那些在过去半年内没有暴乱的地区,这个模型的预测准确率却高于112%。

GDELT提供了分析服务,您需要的查询条件输入到页面。选择好需要的服务即可在10分钟内收到含有您需要的数据。利用这些数据即可对其进行分析。主要的分析形式有:事件浏览器、事件网络、事件时间线、事件热力图、GKG网络、GKG时间线、GKG热力图、GKG浏览等等。

GDELT还提供了四个解决方案,分别为态势感知、影响着网络、风险评估与全球趋势、政策反响和人权与危机处理等。

© 著作权归作者所有

z
粉丝 0
博文 1
码字总数 870
作品 0
海淀
私信 提问
使用 GDELT 2 和 PHP 来分析世界!

你对政治事件感兴趣吗? 你想玩转世界上最大的数据库之一吗? 如果你的回答是“是”,请往下阅读,相信你会对本文内容感兴趣! 本文承诺,接下来会使用 PHP 来操作 GDELT。 我会用一个简单例...

oschina
2016/12/06
2.9K
5
GDELT项目介绍

GDELT(www.gdeltproject.org)每时每刻监控着每个国家的几乎每个角落的100多种语言的新闻媒体--印刷的、广播的和web形式的,识别人员、位置、组织、数量、主题、数据源、情绪、报价、图片和每...

zhangkaiyuan1
2016/06/15
2.8K
0
“今日头条”怎么计算:“网络爬虫+相似矩阵”技术运作流程

今日头条这类资讯聚合平台是基于数据挖掘技术,筛选和推荐新闻:“它为用户推荐有价值的、个性化的信息,提供连接人与信息的新型服务,是国内移动互联网领域成长最快的产品服务之一”。自从2...

罗盛力
2016/07/30
163
0
坚守“品质阅读”初心 红板报让新闻更好看

  【IT168 评论】互联网发展至今,绝大多数信息都能从互联网中获取,然而筛选有价值的信息也将耗费大量的个人时间。在“标题党”“震惊体”充斥的网络环境下,Flipboard成为一股清流:一款...

it168网站
2017/10/20
0
0
你不知道的数字化转型,与IBM再造高效个性化新闻

根据慧聪的《2016年中国广电行业发展报告》,2016年我国广电行业搭乘“互联网+”的快车,深层融合、深度洗牌,深刻改变行业内在结构,激发行业新发展,2016年是广电改革发展、转型升级、提质...

云科技时代
2017/11/23
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Guava RateLimiter + AOP注解实现单机限流、统计QPS

1、基于springboot项目pom.xml添加如下依赖: <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-aop</artifactId></dependency><d......

铁骨铮铮
8分钟前
0
0
龙芯版办公软件下载

金山wps office   rpm包:http://ftp.loongnix.org/os/loongnix/1.0/os/Packages/w/wps-office-10.8.0.6472-1.a20p1.mips64el.rpm   deb包:http://packages.deepin.com/loongson/pool/......

gugudu
14分钟前
0
0
BI报表分析和数据可视化,推荐这三个开源工具!

开源篇 一、Superset 1、技术架构:Python + Flask + React + Redux + SQLAlchemy 2、使用人群: (1)开发/分析人员做好看板,业务人员浏览看板数据 (2)业务人员可自行编辑图表,查看满足...

飓风2000
21分钟前
0
0
CountDownLatch

CountDownLatch的概念 CountDownLatch是一个同步工具类,用来协调多个线程之间的同步,或者说起到线程之间的通信(而不是用作互斥的作用)。 CountDownLatch能够使一个线程在等待另外一些线程...

少年已不再年少
29分钟前
0
0
centos7 新手阿里云服务器安装mongodb

简介 MongoDB 是一个基于分布式 文件存储的NoSQL数据库 由C++语言编写,运行稳定,性能高 旨在为 WEB 应用提供可扩展的高性能数据存储解决方案 MongoDB特点 模式自由 :可以把不同结构的文档存...

醉雨
40分钟前
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部