加载中
文本自动摘要概述

1.文本自动摘要的分类 此处只介绍两种,一种是依据输入文本数量划分,一种是摘要和原文的关系划分。 根据输入文本的数量划分,文本摘要技术可以分为单文档摘要和多文档摘要; 根据文摘和原文...

2017/09/18 14:39
58
java中调用python脚本

三种方式中,当python脚本调用第三方函数库的时候,前两种方式不可用。原因是,不能完整调用第三方Model

2017/09/01 11:22
63
回归分析

知识图谱 前言 1.“回归”一词的由来 我们不必在“回归”一词上费太多脑筋。英国著名统计学家弗朗西斯·高尔顿(Francis Galton,1822—1911)是最先应用统计方法研究两个变量之间关系问题的人...

2017/08/31 18:01
92
关联规则

知识图谱 前言 关联分析是数据挖掘中一项基础又重要的技术,是一种在大型数据库中发现变量之间有趣关系的方法。说到数据挖掘的案例,相信很多人都会首先想到沃尔玛超市发现购买尿布的顾客通常...

2017/08/31 17:17
61
聚类算法研究总结

聚类图谱 1. 聚类的基本概念 1.1 定义 聚类是数据挖掘中的概念,就是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇...

2017/08/31 16:53
211
数据可视化

前言 数据可视化,是指将相对晦涩的的数据通过可视的、交互的方式进行展示,从而形象、直观地表达数据蕴含的信息和规律。 早期的数据可视化作为咨询机构、金融企业的专业工具,其应用领域较为...

2017/08/31 16:42
37
特征工程

特征工程 文本结构 1. 概述 机器学习被广泛定义为“利用经验来改善计算机系统的自身性能”。事实上,“经验”在计算机中主要是以数据的形式存在的,因此数据是机器学习的前提和基础。数据来源...

2017/08/31 16:29
68
主成分分析(PCA) Java

导入jar包:Jama-1.0.2.jar //========计算类=========== import java.util.ArrayList; import java.util.Collections; import java.util.HashMap; import java.util.Iterator; import java....

2017/08/28 16:25
327
相关词、替换词查询

替代词、相关词: 例如在一批关于“一带一路”关键词的语料中,依据现有的语料找出“一带一路”的相关词(如“丝绸之路“”“习大大”等)。 【方案一】 利用关联规则中pfgrowth算法,输出与...

2017/08/25 18:59
72
LDA主题抽取浅析

最近在搞文本主题相关的东西,所以花了很多时间研究LDA主题模型。个人感觉这个模型应用广泛,但是数学原理相对复杂,涉及到的数学公式比较多。下面总结一下。 传统判断两个文档相似性的方法是...

2017/06/30 09:23
207
余弦相似度计算

// 数据结构解析:<单词,二维数组>,其中单词表示公共词, // 二维数组一维度表示句子一的向量,另一维度表示句子二的向量 public class CosSimTextSim { Map<String, float[]> vectorMap = ne...

2017/06/29 17:04
22
文本相似度计算

本文所讲文本相似,以每个句话作为最小单位,进行字符串匹配。首先找到两篇文本相同的句子simstr,依据simstr的长度与两篇文档length进行比值计算。 另外,若更深度进行计算,可对两篇文档的...

2017/06/29 17:02
84
利用pfgrowth算法查找相关词

相关词查找: 例如在一批关于“一带一路”关键词的语料中,找出“一带一路”的相关词(如丝绸之路 习近平 等)。 【方案一】 利用关联规则中pfgrowth算法,输出与“一带一路”相关的规则。由...

2017/06/29 16:36
6

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部