文档章节

NLTK 下载语料库遇到的问题

AllenOR灵感
 AllenOR灵感
发布于 2017/09/10 01:20
字数 207
阅读 1
收藏 0
点赞 0
评论 0

首先我们使用 pip3 下载 nltk 语料库。

pip3 install nltk

之后,我们在终端中进行语料库的安装

import nltk
nltk.download()

这个命令是用来下载 nltk 自带的语料库内容的。

结果你会碰到如下问题:


从图中,我们可以看到有这样一个错误:

SSL: CERTIFICATE_VERIFY_FAILED certificate verify failed(_ssl.c:749)

根据这里的信息判断,应该是在下载过程中调用openssl的内容之时发生的错误。

解决方案

打开Finder

进入到/Application/Python 3.6

双击Install Certificates.Command

然后就轻松解决了。

重新下载语料库

import nltk 
nltk.download()

你就能看到正常的下载界面了。


总结

本质上其为下载中openssl的证书问题造成的。

参考

  1. http://blog.csdn.net/blueheart20/article/details/72824921

  2. http://rffan.info/5805

本文转载自:http://www.jianshu.com/p/799764a950d8

共有 人打赏支持
AllenOR灵感
粉丝 10
博文 2634
码字总数 82983
作品 0
程序员
持续更新笔记:用Python进行自然语言处理(Natural Language Processing with python)

#下载 NLTK 图书集 >>> import nltk >>> nltk.download() 使用 nltk.download()浏览可用的软件包。下载器上的 Collections 选项卡显示软件包如何被打包分组。选择 book 标记所在行,可以获取...

gk4030
2016/09/03
297
0
干货|免费文本语料训练数据集

关于Word2Vec,上篇文章文本分类特征提取之Word2Vec中已有还算详尽的叙述。简单总结下:word2vec是Google在2013年提出的一款开源工具,其是一个Deep Learning模型(实际上该模型层次较浅,严...

m0epnwstyk4
2017/12/18
0
0
各种实用应用程序中的词语分析和 N 元模型

在词语级别为自然语言特征建模,并生成频率图 系列内容: 此内容是该系列 # 部分中的第 # 部分: 利用人工智能创建模式,第 2 部分 此内容是该系列的一部分:利用人工智能创建模式,第 2 部分...

Uche Ogbuji
05/21
0
0
nltk与ipython悲伤的故事之内存也许溢出。。。

一段nltk的代码,按照讲解用于在布朗语料库中分析情态动词在不同文体中出现的次数 ipython 运行,python版本3.5,代码如下 import nltkfrom nltk.corpus import browncfd = nltk.Conditional...

51asdisk
06/26
0
0
机器学习之nltk download出错:Error connecting to server...

机器学习常用到python的自然语言处理框架NLTK,这个是机器学习的常用包,在使用过程中会遇到不少问题。我会和大家分享在这其中的一些经验。 今天闲来说一下安装,在安装中出现的download错误...

蓝色象牙
2013/10/25
0
0
PyAnnotation

PyAnnotation是一个 Python库用来访问和操作语言标注语料库的文件。支持的文件格式是Kura XML,Elan XML和工具箱文件。提供 Corpus Reader API以支持在NLTK统计分析。 安装方法: $ tar xzf ...

匿名
2009/12/20
722
0
干货 | 自然语言处理(1)之聊一聊分词原理

前言 在做文本挖掘时,首先要做的预处理就是分词。英文单词天然有空格隔开容易按照空格分词,但有时也需要把多个单词做为一个分词,比如一些名词如“New York”,需要做为一个词看待。而中文...

sfm06sqvw55dft1
2017/12/08
0
0
nltk-比较中文文档相似度-完整实例

nltk同时也能处理中文的场景,只要做如下改动: 使用中文分词器(如我选用了结巴分词) 对中文字符做编码处理,使用unicode编码方式 python的源码编码统一声明为 gbk 使用支持中文的语料库 代码...

深蓝苹果
2014/09/17
0
9
自然语言处理(python)环境配置-NLTK的安装

自然语言处理(python)环境配置-NLTK的安装 1.自然语言处理的介绍 NLP (Natural Language Processing) 是人工智能(AI)的一个子领域。是机器真正能够理解人类说话的重要一环。自然语言处理也...

meiqi0538
04/08
0
0
python的nltk中文使用和学习资料汇总帮你入门提高

nltk是一个python工具包, 用来处理和自然语言处理相关的东西. 包括分词(tokenize), 词性标注(POS), 文本分类, 等等现成的工具. 1. nltk的安装 资料1.1: 黄聪:Python+NLTK自然语言处理学习(...

dm_ml
2015/12/24
136
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

改造工程步骤

背景: 对于存在有问题的项目(包括 代码不规范 数据库表命名不规范 )需要改造 步骤: 1 新建工程 : 将需要改造的项目拷贝一份 修改项目名称 2 将相应的表结构拷贝到新的数据库中 修改不直...

猿神出窍
3分钟前
0
0
node报错{ xxx, xxx}

nodemon 启动语法报错 重新打开项目node代码报错,在node4.4.2下报错,把node版本切换到6就没有问题

x29
6分钟前
0
0
防火墙未来的发展趋势在哪里?

防火墙(Firewall),也称防护墙,是由Check Point创立者Gil Shwed于1993年发明并引入国际互联网。当下互联网时代,无论是大小企业,大部分都会部署有防火墙的设备,但这些防火墙往往并不是都利...

六库科技
7分钟前
0
0
Elasitcsearch High Level Rest Client学习笔记(二) 基础API

1、index API IndexRequest request = new IndexRequest( "posts", //index "doc",  //type 类型,我对类型的理解有点类似于数据库中的表 index类似于数据库中的datab...

木子SMZ
9分钟前
0
0
[DUBBO] Ignore empty notify urls for subscribe url

学习dubbo,按照官方文档编写了 provider consumer 使用的注册中心是Multicast 多播(组播),报了上面的警告,客户端服务端都有类似的警告,并且服务消费者不能发现服务。网上找了各种解决办...

颖辉小居
21分钟前
0
0
unorder_map 随机元素

对于hash的结构来说 思路1:直接随机内部list 即可,但是数据量大的话 iter 要定位起来是个很麻烦的事情 思路2:先随机到一个可用bucket 然后再里面随机一个元素即可

梦想游戏人
27分钟前
0
0
g++编译过程

gcc & g++现在是gnu中最主要和最流行的c & c++编译器 。 g++是将默认语言设为c++,链接时自动使用C++标准库而不用 c标准库 C++标准库:http://www.runoob.com/cplusplus/cpp-standard-librar...

SibylY
28分钟前
0
0
docker更换镜像源

国内下载docker镜像大部分都比较慢,下面给大家介绍2个镜像源。 一、阿里云的docker镜像源 注册一个阿里云用户,访问 https://cr.console.aliyun.com/#/accelerator 获取专属Docker加速器地址...

xiaomin0322
30分钟前
0
0
7.07-获取多少天之前(之后)的日期

public String getDate(Date date,int days){ Calendar calendar=Calendar.getInstance(); calendar.setTime(date); calendar.add(Calendar.DATE,days); ......

静以修身2025
31分钟前
0
0
react native 0.56.0

0.56.0 更新日志 能力有限,如有问题,请包涵(哈哈)原文请点击 欢迎 React Native 2018年6月份正式版的发布,超过53位捐献者提供797次提交,非常感谢你们每一位。 在您阅读本文的此刻,这个...

古乙丁三雨
32分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部