文档章节

GPT-2,吓坏创造者的「深度造假写手」

极光推送
 极光推送
发布于 05/15 10:55
字数 1019
阅读 11
收藏 0

简评: 今年二月份刷屏的 GPT-2 着实厉害,那个生成续写故事的例子更是效果好到吓人一跳,它到底有多厉害,本文略微讲讲。更详细的信息可参考文末 OpenAI 的博客链接。

你能从下面这两段文字里品味出什么区别?

「四月间,天气寒冷晴朗,钟敲了十三下。」 「我坐在小汽车里,前往西雅图开始一份新工作。给车加油,插入钥匙,让它自己开。我沉入冥思,想象这会是怎样的一天。」

第一段文字,是英国著名作家乔治·奥维尔(George Orwell)的传世经典,政治荒诞讽刺小说《1984》开篇第一句话。

第二段文字,则是将第一段文字输入 GPT-2 程序后,这个 AI 系统的自动续写。

仅仅输入这么简单的一句话,GPT-2 显然就精确的抓住了乔治·奥维尔《1984》的荒诞、压抑、恐惧和反乌托邦的笔调,洋洋洒洒的续写起来:

一百年后,2045 年, 我在中国一个贫穷农村地区的一所中学教书。我先开始教的是中国历史和中国科技史......

英国著名作家乔治·奥维尔(George Orwell)

▎「深度造假」

GPT-2 人工智能文字编写程序可以写小说、新闻、发言稿,还可以发短信推文。

程序开发者给它起了个绰号 —— 深度造假文字(deepfakes for text),精确地概括了它的功能。简而言之,GPT-2 就是一个文字发生器。你可以文字输入这个 AI 系统,只言片语或者大段文字都行,之后程序会根据自己的判断,决定接下来应该如何写作。

它产生的文字,从质量到数量到适应范围,都远远超出了设计者的预期。

它的「造假能力」如此令人信服,以至于其所属公司 Open AI 做出了一个不同寻常的决定:暂不公开 GPT-2 的技术信息,以免该技术被恶意使用。

▎以假乱真

与其它类似功能的程序相比,GPT-2 几乎不露马脚,比如写着写着忘了在写什么,或夹杂一些莫名其妙的词汇等。

英国《卫报》记者把英国脱欧的一些标题词汇输入 GPT-2,它写出了这样的一段「新闻稿」:

当被要求对有关报道做出澄清时,梅首相的发言人说:“首相已经明确表明,她要做的是尽快完成脱欧,这在上周的女王年度施政讲话中有明确授权。”

OpenAI 的研究负责人阿莫迪(Dario Amodei)对《卫报》说,GPT-2 从两个方面具有革命性的突破 —— 一是它的数据储藏能力巨大,是现有最前沿的 AI 文字发生器数据储量的 12 倍。这使得它能更好地理解掌握写作文风,笔法和意图。这也导致了它的第二个突破,即它的写作质量和应用的广泛性。

而也正是它生产出的文字达到了真假难辨的程度,也促使 OpenAI 公司决定暂时不公开 GPT-2 的技术。他们下一步将测试使用 GPT-2 可能出现的任何结果,以及如何防止恶意使用。

公司表示,使用 AI 技术的道德原则是一个全新的领域,他们还在探索之中。


博客链接:Better Language Models and Their Implications

推荐阅读:数字游戏:艺术家如何用大数据展现艺术

欢迎关注:微信公众号「极光开发者」

© 著作权归作者所有

极光推送
粉丝 42
博文 240
码字总数 257306
作品 1
深圳
个人站长
私信 提问
GPT-2,吓坏创造者的「深度造假写手」

简评: 今年二月份刷屏的 GPT-2 着实厉害,那个生成续写故事的例子更是效果好到吓人一跳,它到底有多厉害,本文略微讲讲。更详细的信息可参考文末 OpenAI 的博客链接。 你能从下面这两段文字...

极小光
05/15
0
0
逆天的GPT-2居然还能写代码(但OpenAI却被无情吐槽)

问耕 发自 麦蒿寺 量子位 出品 | 公众号 QbitAI 昨天,OpenAI发布了逆天的GPT-2,举世皆惊。 这个拥有15亿参数的语言AI,写起文章来文思泉涌毫无违和感,无需针对性训练就能横扫各种特定领域...

量子位
02/16
0
0
详解MBR分区结构以及GPT分区结构

一、MBR分区结构 MBR磁盘分区是一种使用最为广泛的分区结构,它也被称为DOS分区结构,但它并不仅仅应用于Windows系统平台,也应用于Linux,基于X86的UNIX等系统平台。它位于磁盘的0号扇区(一...

yun5277
2018/06/28
0
0
重装系统时,将MBR分区转为GPT 分区

首先搞明白什么是MBR分区表,什么又是GPT磁盘? (1)MBR和GPT是两种不同的磁盘类型,主要区别在于不同的分区结构和分区方法。GPT是近几年才出现的新型硬盘种类。 (2)GPT(Globally Unique...

Everget
2015/04/06
118.6K
5
超简单!pytorch入门教程(二):Autograd

一、autograd自动微分 假如我们有一个向量x=(1,1)当成input,经过一系列运算得到了output变量y,如下图所示: 如图所示,向量x经过与4和自身相乘之后得到向量z,z再求长度,得到y 我们想要求...

Zen_君
2017/02/01
0
0

没有更多内容

加载失败,请刷新页面

加载更多

只需一步,在Spring Boot中统一Restful API返回值格式与统一处理异常

统一返回值 在前后端分离大行其道的今天,有一个统一的返回值格式不仅能使我们的接口看起来更漂亮,而且还可以使前端可以统一处理很多东西,避免很多问题的产生。 比较通用的返回值格式如下:...

晓月寒丶
昨天
59
0
区块链应用到供应链上的好处和实际案例

区块链可以解决供应链中的很多问题,例如记录以及追踪产品。那么使用区块链应用到各产品供应链上到底有什么好处?猎头悬赏平台解优人才网小编给大家做个简单的分享: 使用区块链的最突出的优...

猎头悬赏平台
昨天
28
0
全世界到底有多少软件开发人员?

埃文斯数据公司(Evans Data Corporation) 2019 最新的统计数据(原文)显示,2018 年全球共有 2300 万软件开发人员,预计到 2019 年底这个数字将达到 2640万,到 2023 年达到 2770万。 而来自...

红薯
昨天
65
0
Go 语言基础—— 通道(channel)

通过通信来共享内存(Java是通过共享内存来通信的) 定义 func service() string {time.Sleep(time.Millisecond * 50)return "Done"}func AsyncService() chan string {retCh := mak......

刘一草
昨天
58
0
Apache Flink 零基础入门(一):基础概念解析

Apache Flink 的定义、架构及原理 Apache Flink 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态或无状态的计算,能够部署在各种集群环境,对各种规模大小的数据进行快速...

Vincent-Duan
昨天
60
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部