加载中
mnist手写数字识别

数据包链接:http://pan.baidu.com/s/1bp2egtL 密码:lmkb 修改程序中文件地址:"E:/eclipseSpace/TensorflowTestPython/src/dataset",将数据包放在这个路径下即可。 # 手写识别 from tenso...

2017/10/16 19:27
31
文本自动摘要概述

1.文本自动摘要的分类 此处只介绍两种,一种是依据输入文本数量划分,一种是摘要和原文的关系划分。 根据输入文本的数量划分,文本摘要技术可以分为单文档摘要和多文档摘要; 根据文摘和原文...

2017/09/18 14:39
58
java中调用python脚本

三种方式中,当python脚本调用第三方函数库的时候,前两种方式不可用。原因是,不能完整调用第三方Model

2017/09/01 11:22
62
大数据计算框架与平台

1. 前言 计算机的基本工作就是处理数据,包括磁盘文件中的数据,通过网络传输的数据流或数据包,数据库中的结构化数据等。随着互联网、物联网等技术得到越来越广泛的应用,数据规模不断增加,...

2017/09/01 09:10
31
回归分析

知识图谱 前言 1.“回归”一词的由来 我们不必在“回归”一词上费太多脑筋。英国著名统计学家弗朗西斯·高尔顿(Francis Galton,1822—1911)是最先应用统计方法研究两个变量之间关系问题的人...

2017/08/31 18:01
90
关联规则

知识图谱 前言 关联分析是数据挖掘中一项基础又重要的技术,是一种在大型数据库中发现变量之间有趣关系的方法。说到数据挖掘的案例,相信很多人都会首先想到沃尔玛超市发现购买尿布的顾客通常...

2017/08/31 17:17
33
聚类算法研究总结

聚类图谱 1. 聚类的基本概念 1.1 定义 聚类是数据挖掘中的概念,就是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇...

2017/08/31 16:53
193
数据可视化

前言 数据可视化,是指将相对晦涩的的数据通过可视的、交互的方式进行展示,从而形象、直观地表达数据蕴含的信息和规律。 早期的数据可视化作为咨询机构、金融企业的专业工具,其应用领域较为...

2017/08/31 16:42
35
特征工程

特征工程 文本结构 1. 概述 机器学习被广泛定义为“利用经验来改善计算机系统的自身性能”。事实上,“经验”在计算机中主要是以数据的形式存在的,因此数据是机器学习的前提和基础。数据来源...

2017/08/31 16:29
68
主成分分析(PCA) Java

导入jar包:Jama-1.0.2.jar //========计算类=========== import java.util.ArrayList; import java.util.Collections; import java.util.HashMap; import java.util.Iterator; import java....

2017/08/28 16:25
296
相关词、替换词查询

替代词、相关词: 例如在一批关于“一带一路”关键词的语料中,依据现有的语料找出“一带一路”的相关词(如“丝绸之路“”“习大大”等)。 【方案一】 利用关联规则中pfgrowth算法,输出与...

2017/08/25 18:59
69
win7 64位 Python3.5 scipy,numpy+mkl, Gensim主题模型包安装

1.环境 win7 64位 numpy-1.13.1+mkl-cp35-cp35m-win_amd64.whl scipy-0.19.1-cp35-cp35m-win_amd64.whl gensim-0.13.0rc1-cp35-cp35m-win_amd64.whl 2.安装步骤 (1)安装pip、numpy python....

2017/08/24 14:50
42
Anaconda 下安装TensorFlow1.2

1.安装环境 Windows10 64位 Anaconda3-4.4.0-Windows-x86_64.exe 2.安装步骤 (1)傻瓜式安装Anaconda3-4.4.0 (2)安装Anaconda3-4.4.0后出现 打开,在该环境下依次执行之后的命令。 (3)C...

2017/08/14 11:35
164
Windows10 64位 安装TensorFlow 0.12.0/1.2

1.安装环境 Windows10 64位 Python 3.5.2 pip9.0.1 TensorFlow 0.12.0 | | 1.2.1 cuda 8.0 cudnn5.1 2.安装步骤 (1)下载安装Python3.5.2并配置环境变量 (2)与CMD类似,输入powershell,进...

2017/08/11 09:11
383
LDA主题抽取浅析

最近在搞文本主题相关的东西,所以花了很多时间研究LDA主题模型。个人感觉这个模型应用广泛,但是数学原理相对复杂,涉及到的数学公式比较多。下面总结一下。 传统判断两个文档相似性的方法是...

2017/06/30 09:23
184
余弦相似度计算

// 数据结构解析:<单词,二维数组>,其中单词表示公共词, // 二维数组一维度表示句子一的向量,另一维度表示句子二的向量 public class CosSimTextSim { Map<String, float[]> vectorMap = ne...

2017/06/29 17:04
22
文本相似度计算

本文所讲文本相似,以每个句话作为最小单位,进行字符串匹配。首先找到两篇文本相同的句子simstr,依据simstr的长度与两篇文档length进行比值计算。 另外,若更深度进行计算,可对两篇文档的...

2017/06/29 17:02
82
利用pfgrowth算法查找相关词

相关词查找: 例如在一批关于“一带一路”关键词的语料中,找出“一带一路”的相关词(如丝绸之路 习近平 等)。 【方案一】 利用关联规则中pfgrowth算法,输出与“一带一路”相关的规则。由...

2017/06/29 16:36
6
函数应用示例

前两课稍稍介绍了一下函数,但光说概念还是有些抽象了,今天就来把之前那个小游戏用函数改写一下。 我希望有这样一个函数,它比较两个数的大小。 如果第一个数小了,就输出“too small” 如果...

2016/04/19 01:14
30
【Python 第21课】 函数的参数

今天发现了一个iPad上的游戏,叫Cargo-Bot。这个游戏需要你用指令控制一个机械臂去搬箱子。游戏里蕴含了很多编程的思想,包括循环、函数调用、条件判断、寄存器、递归等等,挺有意思的。更厉...

2016/01/02 14:02
54

没有更多内容

加载失败,请刷新页面

返回顶部
顶部