加载中
NLP常用python模块工具

前言:做NLP工程时少不了利用各种现成的工具包来对文字进行处理,学习工作这么久,接触使用了不少nlp工具包,NLP中大多是以Python语言为主,因此大部分工具是Python的,少部分的是Java的以及...

python 调用stanford nlp

stanfordnlp的句法分析树还是很准确的,在某些业务场景效果很好。 一年前使用过stanford nlp,找了很多方法安装,最近又需要使用又是装了半天,特此记录下来: stanfordnlp 是基于java的,pyt...

stanford 句法、依存关系注释(转)

ROOT:要处理文本的语句 IP:简单从句 NP:名词短语 VP:动词短语 PU:断句符,通常是句号、问号、感叹号等标点符号 LCP:方位词短语 PP:介词短语 CP:由‘的’构成的表示修饰性关系的短语 ...

TextRank

自动文摘(Automatic Summarization)的方法主要有两种:Extraction和Abstraction。 其中Extraction是抽取式自动文摘方法,通过提取文档中已存在的关键词,句子形成摘要; Abstraction是生成...

04/29 11:13
33
文本相似度计算的常用方法

文本相似度在很多地方都能用到,比如文本分类,相似文本抽取,可以先建立词表或者句表,然后从数据库中找相似的文本,文书,文章或者评论。 相似度计算方法大概有几类,字符级别,关键词级别...

03/06 00:33
83
转()word2vec训练搜狗新闻语料

在搜狗实验室里下载相关语料,我下载的是全网新闻: http://www.sogou.com/labs/resource/ca.php 下下来的语料,看到有1.54G的大小: 文件大小 其中里面内容的格式为: 文本格式 刚下下来的语...

nlp
01/25 10:44
9

没有更多内容

加载失败,请刷新页面

返回顶部
顶部