文档章节

gdelt新闻中国国内版本来了,数据分析爱好者和新闻事件分析研究可以尽情的在数据海洋里遨游

z
 zhanshen战神
发布于 2016/06/15 10:47
字数 870
阅读 79
收藏 0
点赞 0
评论 0

转至元数据起始

GDELT(www.gdeltproject.org)每时每刻监控着每个国家的几乎每个角落的100多种语言的新闻媒体--印刷的、广播的和web形式的,识别人员、位置、组织、数量、主题、数据源、情绪、报价、图片和每秒都在推动全球社会的事件,GDELT为全球提供了一个自由开放的计算平台。

GDELT2.0每个15分钟提供全球事件数据。GDELT目前的事件库约有3.5亿条事件数据。这些事件从1979年1月1日开始一直到今日。GDELT第一项服务就是免费的数据下载。同时GDELT还在谷歌的BigQuery上提供了数据API,这样您可以使用谷歌的分析工具进行分析。GDELT的数据除了事件数据外,还提供了GKG数据,也就是全球知识图(Global Knowledge Graph)的数据。在国内您也可以到疙瘩汤(www.gdelt.cn)上下载数据。

在2013年美国国际开发总署 (USAID)和人权联合会举办的模型挑战赛利用GDEL数据作为最后一轮技术暴行预防挑战,这个挑战要求挑战者创建一个算法模型来预测合适何地将会发生 大规模暴行。建百名挑战者提交了618个算法,获胜算法在有限或者没有历史大规模暴乱数据的情况下,每个区域只考虑23个地缘、社会政治和历史冲突因素, 在区域内暴行预测特别成功。
  这个是由来自北京的数据科学家李小石开发的,他在这个模型里融合了23个影响因素去做预测,并靠这个夺得了联合国防范暴行高科技竞赛的最高奖金,一万俩千 美金。令人难以置信的是,这个模型可以预测到在一个从未发生过暴乱的额地区将要发生的严重暴乱。这个模型最大作用不在于节省一个专家去预测在那些动荡地区 将要发生的暴乱,比如苏区和叙利亚地区,而在于预测那些被掉以轻心的事件。这个算法通常的预测正确率要高于另一个常用的dummy预测模型62%,而对于 那些在过去半年内没有暴乱的地区,这个模型的预测准确率却高于112%。

GDELT提供了分析服务,您需要的查询条件输入到页面。选择好需要的服务即可在10分钟内收到含有您需要的数据。利用这些数据即可对其进行分析。主要的分析形式有:事件浏览器、事件网络、事件时间线、事件热力图、GKG网络、GKG时间线、GKG热力图、GKG浏览等等。

GDELT还提供了四个解决方案,分别为态势感知、影响着网络、风险评估与全球趋势、政策反响和人权与危机处理等。

© 著作权归作者所有

共有 人打赏支持
z
粉丝 0
博文 1
码字总数 870
作品 0
海淀
“今日头条”怎么计算:“网络爬虫+相似矩阵”技术运作流程

今日头条这类资讯聚合平台是基于数据挖掘技术,筛选和推荐新闻:“它为用户推荐有价值的、个性化的信息,提供连接人与信息的新型服务,是国内移动互联网领域成长最快的产品服务之一”。自从2...

罗盛力
2016/07/30
163
0
坚守“品质阅读”初心 红板报让新闻更好看

  【IT168 评论】互联网发展至今,绝大多数信息都能从互联网中获取,然而筛选有价值的信息也将耗费大量的个人时间。在“标题党”“震惊体”充斥的网络环境下,Flipboard成为一股清流:一款...

it168网站
2017/10/20
0
0
这几个争做数据圈清流的公众号,你都知道吗?

关于数据,哪些才是你最关注的方面?是数据爬取、处理、可视化?是人工智能、机器学习等各种前瞻算法?还是各种热点趋势下的大数据洞察?在这个满屏营销文的繁杂网络环境下,简单有效地获取优...

enohtzvqijxo00atz3y8
2017/11/30
0
0
你不知道的数字化转型,与IBM再造高效个性化新闻

根据慧聪的《2016年中国广电行业发展报告》,2016年我国广电行业搭乘“互联网+”的快车,深层融合、深度洗牌,深刻改变行业内在结构,激发行业新发展,2016年是广电改革发展、转型升级、提质...

云科技时代
2017/11/23
0
0
币圈数据一网打尽,区块网网罗链圈大小事

区块链(Blockchain)是比特币的一个重要概念,区块链是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了过去十分钟内所有比特币网络交易的信息,用于验证其信息的有效性(防伪)和生...

未来财经
2017/11/30
0
0
由 Apache Kylin 组建的 Kyligence 公司获得数百万美元的天使轮投资

大数据初创公司Kyligence,由Apache Kylin™核心开发团队组建的创业公司,日前宣布获得了数百万美元的天使轮投资。 Kyligence是一家总部位于上海的大数据初创企业,成立于2016年初,是一家专...

oschina
2016/04/07
4.6K
10
大数据日报 2015-02-14

Spark SQL 数据源 API:Spark平台的统一数据接入 @网路冷眼 市民眼中的绿地为何没那么多?用大数据讲述城市意象 @市政厅官微 Fig部署Docker @Easy HIVE的CTAS用法探究 @IT技术博客大学习 Do...

Airship
2015/02/15
0
0
大数据或迎来掘金良机,短视频营销成新宠

继云计算、物联网、人工智能后,大数据带来信息技术领域又一次创新浪潮。在2016年的中国大数据产业峰会上,专家表示,2020年中国将成为全球数据中心。未来5年,中国大数据产业规模年均增长率...

玄学酱
04/24
0
0
双十二前夕爆京东12G数据泄露的真相是什么

今天早上手机上推送出京东12g数据泄漏的消息,随即搜了下网上的相关新闻,感觉舆论又一次的干了一件惊天地的事情,到底京东的哪所谓的12G的用户信息数据有没有泄漏?舆论为什么齐刷刷的在12月...

马浩周
2016/12/11
86
0
从网易首页变化看互联网15年变化

网站首页的变化不仅是一家互联网企业的“门面”,对“历史悠久”的网站来说,更能反映出互联网的变化,网易就是其中之一。本文将从网易首页15年来的变化,回顾15年来中国互联网发展历程。 19...

oschina
2012/05/23
7.3K
65

没有更多内容

加载失败,请刷新页面

加载更多

下一页

Kafka设计解析(一)- Kafka背景及架构介绍

原创文章,转载请务必将下面这段话置于文章开头处。(已授权InfoQ中文站发布) 本文转发自技术世界,原文链接 http://www.jasongj.com/2015/03/10/KafkaColumn1 摘要   Kafka是由LinkedI...

mskk
10分钟前
0
0
使用Service Mesh整合您的微服务架构

在微服务架构的世界中,它正在达到这样的程度,即管理系统的复杂性对于利用它带来的好处变得至关重要。 目前,如何实现这些微服务不再是一个问题,因为有很多可用的框架(Spring Boot,Vert....

xiaomin0322
13分钟前
0
0
看看 LinkedList Java 9

终于迎来了 LinkedList 类,实现的接口就有点多了 Serializable, Cloneable, Iterable<E>, Collection<E>, Deque<E>, List<E>, Queue<E>。LinkedList是一个实现了List接口和Deque接口的双端链......

woshixin
32分钟前
0
0
算法 - 冒泡排序 C++

大家好,我是ChungZH。今天我给大家讲一下最基础的排序算法:冒泡排序(BubbleSort)。 冒泡排序算法的原理如下: 比较相邻的元素。如果第一个比第二个大(可以相反),就交换他们两个。 对每...

ChungZH
34分钟前
0
0
jquery ajax request payload和fromData请求方式

请求头的不同 fromData var data = { name : 'yiifaa'};// 提交数据$.ajax('app/', { method:'POST', // 将数据编码为表单模式 contentType:'application/x-ww...

lsy999
36分钟前
0
0
阿里P7架构师,带你点亮程序员蜕变之路

前言: Java是现阶段中国互联网公司中,覆盖度最广的研发语言。 掌握了Java技术体系,不管在成熟的大公司,快速发展的公司,还是创业阶段的公司,都能有立足之地。 有不少朋友问,成为Java架...

Java大蜗牛
38分钟前
1
0
Ecstore 在没有后台管理界面(维护)的情况如何更新表的字段

window 系统: 切换到:app\base 目录下: C:\Users\qimh>d: D:\>cd D:\WWW\huaqh\app\base 执行:D:\WWW\huaqh\app\base>cmd update linux 系统: 1># cd /alidata/www.novoeshop.com/app/......

qimh
42分钟前
0
0
设计模式-策略模式

策略模式 解释 对工厂模式的再次封装,使用参数控制上下文信息(将工厂返回的实例赋值给context field) 不会返回bean实例,只是设置对应的条件 调用context的方法(调用field的方法) 用户只...

郭里奥
45分钟前
0
0
python使用有序字典

python自带的collections包中有很多有用的数据结构可供使用,其中有个叫OrderedDict类,它可以在使用的时候记录元素插入顺序,在遍历使用的时候就可以按照原顺序遍历。 a = {"a":1,"b"...

芝麻糖人
今天
0
0
RestTemplate HttpMessageConverter

RestTemplate 微信接口 text/plain HttpMessageConverter

微小宝
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部