文档章节

AI眼中的历史:用人工智能挖掘旧报纸里的英国现代史

乱蓬头
 乱蓬头
发布于 2017/05/31 13:23
字数 1640
阅读 1
收藏 0
点赞 0
评论 0

摘要: 试问,哪位历史学家有时间阅读跨越一个多世纪英国历史的数千万份报纸?没人可以。所以,计算机科学家和历史学家一起,教会了计算机做这件事——分析新闻报道中的数十亿个词,让我们重新认识19世纪到20世纪初的英国历史。

 

0?wx_fmt=jpeg

试问,哪位历史学家有时间阅读跨越一个多世纪英国历史的数千万份报纸?没人可以。所以,计算机科学家和历史学家一起,教会了计算机做这件事——分析新闻报道中的数十亿个词,让我们重新认识19世纪到20世纪初的英国历史。

这项研究发表在PNAS上(http://www.pnas.org/content/early/2017/01/03/1606380114),是对“文化组学”这一新兴学科的实践。

注:

文化组学culturomics,指通过数字化文本的定量分析研究人类行为和文化趋势的计算词汇学

计算机分析了1800年至1950年间的3500万份英国地区新闻报道中的286亿词汇,约占该时期英国地区报刊总量的14%。

作为对比,一个成年人的平均阅读速度为大约每分钟300字。按照这个速度,一个人需要整整180年来完成所有的阅读。如果算上人类的休息时间,阅读需要的时间就更长了。而计算机算法用大约8周完成了所有的工作,该项目研究员英国布里斯托大学计算机科学家Nello Cristianini称。

这项研究的第一步是人工检查,以确保计算机可以从报纸中提取真实的历史事件。检查的内容为计算机是否能准确地找到诸如加冕,已知的疾病流行和战争等事件。

有趣的部分发生在下一步:研究计算机算法是否可以找到历史学家使用传统方法不能找到的历史事件。

我们正在寻找一些不太明显的历史进程——例如,技术的兴起,”Cristianini说。“我们看到1900年左右,技术发生了变化。我们还能进一步解读更微妙的信号:我们可以看到电报,电话和广播被公众接受的速度有多快。这个速度在不断加快。现在,人们接受Twitter或Facebook只需要一年。”

人工智能分析不仅仅是简单的字数统计(这是曾经大量数字化文学研究的做法)。这一次,研究人员使用AI技术,如自然语言处理,以获得对上下文和文本含义的理解。你可以认为它是终极的快速阅读。

他们发现了什么?这是AI眼中的英国历史:

 

 电力什么时候赶超了蒸汽?

1898年。这一年,电在新闻中出现的频率开始超过蒸汽,电能逐渐取代了蒸汽。

0?wx_fmt=png

图:20世纪来临时,电力取代了蒸汽(来源Nello Cristianini / PNAS)

 

 火车什么时候赶超了马车?

 仅仅四年后的1902年。火车的时代开始于19世纪40年代,那时英国开始发展国家铁路系统。但就新闻方面而言,火车在半个多世纪后才变得比马车更重要。

0?wx_fmt=png

图:“铁马”(来源New York Public Library / Flickr)

 人们什么时候开始 

 不再讨论奴隶制?

 对奴隶制的报道高峰出现于1830-1870年废奴运动时期和1861-1865年美国南北战争期间。1870年后,报纸几乎不再提及奴隶制。

0?wx_fmt=png

图:1830年到1870年,奴隶制出现在新闻中(来源Nello Cristianini / PNAS)

 记者什么时候开始 

 报道妇女参政权运动?

1906年。一个戏剧性的报道高峰出现在1913年,在女性参政倡议者Emily Wilding Davison试图在赛马会上阻拦英国国王的马之后。

0?wx_fmt=png

图:Emily Davison倒在英国国王的马前,四天后她死于头部创伤(来源Hulton Archive)

注:

女权运动还有这段历史!今天的一切来之不易啊!

 

 女性什么时候得到了 

和男性相同数量的报道?

从来没有过。20世纪开始,对女性的报道率有上升趋势,且在二战时期突然增加。但在整个分析覆盖的时期,新闻中每提到一个女性大约会提到三个男性。在21世纪,这个数字更接近男女比2:1,但这种转变并不大。

0?wx_fmt=png

图:战争时期,女性得到了更多的报道(来源Wikime)

 

 勇气什么时候最重要?

毫不意外,在第一次和第二次世界大战期间勇气被提到最多。维多利亚时代的价值观,例如毅力,在整个分析覆盖时期表现出报道频率的稳步下降。但在战争年代,对耐力和勇气等价值观的报道出现了明显的增加。

 

 英国和英国人的概念

(Britishness)是何时出现的?

注:

英国全称为大不列颠及北爱尔兰联合王国United Kingdom of Great Britain and Northern Ireland。不列颠Britain/British是对英国和英国人的统称,相较于对英国某部分的特指例如England/English是指英格兰和英格兰人,或Scotland/Scottish是指苏格兰和苏格兰人。

对“不列颠”的报道出现于20世纪早期,1900年左右出现第一个峰值,一战和二战期间出现了两个更大的峰值。这个发现和很多历史学家的观点不同——很多历史学家认为“不列颠”在更早前就已经是一个活跃的概念了。

0?wx_fmt=png

图:“不列颠”的概念在20世纪早期开始活跃,而传统上,历史学家认为“不列颠”出现得更早(来源Nello Cristianini / PNAS)

 

 经济什么时候成为了口号?

与“经济”相比,“政治经济”一直是更为常用的术语,直到1900年左右,这两个词的用法变得更加模糊。20世纪初,这两个术语在约十年间的使用频率大致相似,之后,“经济”开始成为更受欢迎的用语,在几个剧烈的峰值后使用频率开始稳步上升。

0?wx_fmt=png

原文发布时间为:2017-01-17

本文转载自:http://click.aliyun.com/m/22145/

共有 人打赏支持
乱蓬头
粉丝 0
博文 382
码字总数 2595
作品 0
CIA 计划用 AI 取代间谍;俄罗斯利用 AI 管理在轨卫星群 | AI 掘金晚报

CIA计划用AI取代间谍 电影里007们伪造身份执行任务的画面曾经令无数人心潮澎湃,但这一切正在逐渐成为历史。因为很多国家正在使用AI技术识别敌方特工。 根据Meyerriecks的说法,至少有30个国...

刘伟 ⋅ 04/25 ⋅ 0

深度解读英国议会人工智能报告十大热点

     曹建峰 腾讯研究院高级研究员   英国政府高度重视人工智能对经济和社会发展的巨大潜力。此前已发布五份针对或涉及人工智能的政府报告,抢抓机遇并应对挑战。   2018年4月16日,...

深度学习 ⋅ 04/22 ⋅ 0

杨澜访谈录之卢臻:AI不会把人类灭掉

  ▲深醒科技卢臻董事长(右二)   出席数博会人工智能高端对话   刚刚获得全球人工智能大赛第一名的深醒科技,在数博会人工智能高端对话环节接受杨澜访谈时坦言创业心扉。   5月26日,...

中国机器人 ⋅ 05/30 ⋅ 0

英国拨款8400万英镑资助AI研究与智能能源创新

英国商业、能源和产业战略部部长克莱尔·佩里(Claire Perry)宣布将投资8400万英镑支持英国的人工智能(AI)与机器人技术研究,以及智能能源创新。 产业战略挑战基金将拨款6800余万英镑支持...

gs780j ⋅ 2017/12/22 ⋅ 0

当Google谈论机器学习时,世界将会更美好?

Google 一年一度的开发者大会 I/O 2018,本周在硅谷隆重上演。这你已经知道了,关于大会报道,请移步这里。 开幕前一天,Google 在总部举办了一堂名为“机器学习 101”的人工智能课,尝试用最...

六库科技 ⋅ 05/22 ⋅ 0

中英人工智能投资峰会2017(2017年9月22日)

中英人工智能投资峰会2017(2017年9月22日) 2017年7月16日 智元 AI行业活动   中英人工智能投资峰会   地点:英国, 伦敦,IET英国工程技术学会   日期:2017年9月22日   时间:8:0...

智元 ⋅ 2017/07/16 ⋅ 0

英国发布人工智能领域产业战略具体行动

英国政府发布《产业战略:人工智能领域行动》(IndustrialStrategy: Artificial Intelligence Sector Deal)政策文件,针对去年11月发布的《产业战略》中提及的“人工智能与数据经济”挑战,...

gs780j ⋅ 05/04 ⋅ 0

报告:拥抱机器–AI与商业的碰撞

199IT原创编译 The Integer Group发布了最新报告“拥抱机器:AI与商业的碰撞”,美国消费者更倾向于积极描述人工智能。而且,这些“积极”的消费者更好奇人工智能如何帮助他们购物。 调查发现...

d1j4robv ⋅ 2017/12/15 ⋅ 0

天搜科技总结人工智能对人类的影响

  人工智能是时代进步的产物,也是目前人们关注最多的一个产业,那么ai人工智能的产生对人类的影响有哪些呢,下面天搜科技为大家总结了几点:   1、人工智能对文化产业影响   据天搜科...

tszj12 ⋅ 06/13 ⋅ 0

AI WORLD2016世界人工智能大会:中国力量崛起

人工智能诞生至今已走过60年光阴。2016年3月,随着 AlphaGo 落下制胜棋子,人类迈入了超级智能的“后图灵时代”,人工智能也再次迎来“春天”。那么,中国的人工智能究竟发展到了怎样的水平,...

玄学酱 ⋅ 05/11 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

聊聊spring cloud gateway的LoadBalancerClientFilter

序 本文主要研究一下spring cloud gateway的LoadBalancerClientFilter GatewayLoadBalancerClientAutoConfiguration spring-cloud-gateway-core-2.0.0.RELEASE-sources.jar!/org/springfram......

go4it ⋅ 35分钟前 ⋅ 0

详解:Nginx反代实现Kibana登录认证功能

Kibana 5.5 版后,已不支持认证功能,也就是说,直接打开页面就能管理,想想都不安全,不过官方提供了 X-Pack 认证,但有时间限制。毕竟X-Pack是商业版。 下面我将操作如何使用Nginx反向代理...

问题终结者 ⋅ 41分钟前 ⋅ 0

002、nginx配置虚拟主机

一、nginx配置虚拟主机可分为三种方式,分别为: 1、基于域名的虚拟主机,通过域名来区分虚拟主机——应用:外部网站 2、基于端口的虚拟主机,通过端口来区分虚拟主机——应用:公司内部网站...

北岩 ⋅ 44分钟前 ⋅ 0

shell脚本之死循环写法

最近在学习写shell脚本,在练习if while等流程控制时,突然它们的死循环写法是怎么样的?经过百度与亲测记录如下: for死循环 #! /bin/bashfor ((;;));do date sleep 1d...

hensemlee ⋅ 46分钟前 ⋅ 0

苹果的ARKit2.0有多可怕,看了就知道

序言 ARKit主要由三部分组成: 跟踪(Tracking) 跟踪是ARKit的核心组件之一,其提供了设备在物理世界中的位置与方向信息,并对物体进行跟踪,如人脸。 2.场景理解(Scene Understanding) 场...

_小迷糊 ⋅ 47分钟前 ⋅ 0

5.1 vim介绍 5.2 vim移动光标 5.3 ,5.4vim一般模式下移动光标,复制粘贴

vim命令 vim是vi的一个升级版;vim可以显示文字的颜色 安装vim这一个包vim-enhanced 如果不知道安装包,可以使用 命令下面命令来查看vim命令是那个包安装的。 [root@linux-128 ~]# yum prov...

Linux_老吴 ⋅ 51分钟前 ⋅ 0

vim一般模式

vim 是什么 vim是什么 ? 在之前接触Linux,编辑网卡配置文件的时候我们用过了vi ,vim简单说就是vi的升级版,它跟vi一样是Linux系统中的一个文本编辑工具。 如果系统中没有vim ,需要安装一...

李超小牛子 ⋅ 59分钟前 ⋅ 0

docker实战

构建企业级Docker虚拟化平台实战 重点剖析虚拟化和云计算概念; 分析Docker虚拟化的概念和原理; 从0开始实战Docker虚拟化平台; 基于Docker构建Nginx WEB服务器和CentOS虚拟机; 基于开源监...

寰宇01 ⋅ 今天 ⋅ 0

vim介绍、vim颜色显示和移动光标、vim一般模式下移动光标、一般模式下复制粘贴剪切

VIM Vim 是 UNIX 文本编辑器 Vi 的加强版本,加入了更多特性来帮助编辑源代码。Vim 的部分增强功能包括文件比较(vimdiff),语法高亮,全面的帮助系统,本地脚本(Vimscript),和便于选择的...

蛋黄Yolks ⋅ 今天 ⋅ 0

springboot+mockito测试controller层遇到的问题

使用MockitoJUnitRunner测试的一个例子,原来报错无法找到bean, 类似的异常如下:createBeanError..... 原因:是因为@Runwith使用了SpringRunner,应该修改为MockitoJUnitRunner 代码如下: ...

writeademo ⋅ 今天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部