加载中
史上最直白的logistic regression教程 之 一

本系列前四篇是随手涂鸦,只为讲清问题,有口语化,且有少数符号误写,以及重复絮叨,且不打算修改:) 第5篇提供了一个严谨的学术语言的完整pdf文档,敬请下载! Logistic Regession是什么 ...

2017/01/17 09:50
23
史上最直白的logistic regression教程 之 一

本系列前四篇是随手涂鸦,只为讲清问题,有口语化,且有少数符号误写,以及重复絮叨,且不打算修改:) 第5篇提供了一个严谨的学术语言的完整pdf文档,敬请下载! Logistic Regession是什么 ...

2017/01/17 09:50
7
史上最直白的logistic regression教程 之 一

本系列前四篇是随手涂鸦,只为讲清问题,有口语化,且有少数符号误写,以及重复絮叨,且不打算修改:) 第5篇提供了一个严谨的学术语言的完整pdf文档,敬请下载! Logistic Regession是什么 ...

2017/01/17 09:50
8
TensorFlow试用

Google发布了开源深度学习工具TensorFlow。 根据官方教程 http://tensorflow.org/tutorials/mnist/beginners/index.md 试用。 操作系统是ubuntu 14.04,64位,python 2.7,已经安装足够的pyt...

2017/01/17 09:47
44
weka实战005:基于HashSet实现的apriori关联规则算法

这个一个apriori算法的演示版本,所有的代码都在一个类。仅供研究算法参考 package test; import java.util.Collections; import java.util.HashMap; import java.util.HashSet; import ja...

2017/01/17 09:47
4
weka实战004:fp-growth关联规则算法

apriori算法的计算量太大,如果数据集略大一些,会比较慢,非常容易内存溢出。 我们可以算一下复杂度:假设样本数有N个,样本属性为M个,每个样本属性平均有K个nominal值。 1. 计算一项频繁集...

2017/01/17 09:47
118
weka实战003:apriori关联规则算法的实现

weka实现的apriori算法是在weka.associations包的Apriror类。 在这个类,挖掘关联规则的入口函数是public void buildAssociations(Instances instances),而instances就是数据集,检查数据,...

2017/01/17 09:46
7
weka实战002:apriori关联规则算法

关联规则算法最出名的例子就是啤酒和尿布放一起卖。 假如我们去超市买东西,付款后,会拿到一张购物清单。这个清单就是一个Transaction。对关联规则算法来说,每个产品的购买数量是无意义的,...

2017/01/17 09:46
50
weka实战001:一篇博文简单了解weka

weka是java写的开源模式识别和数据挖掘软件,已经有十多年的历史了。weka的官网在http://www.cs.waikato.ac.nz/ml/weka/。 模式识别和数据挖掘有四个问题, 第一:问题是什么 第二:数据是什...

2017/01/17 09:46
9
Hadoop 1.x的Task,ReduceTask,MapTask随想

Hadoop的技术体系,最令人称赞的是细节。它的基本原理是非常容易理解的,细节是魔鬼。 hadoop的hdfs是文件系统存储,它有三类节点namenode, scondraynamenode, datanode,前两种在集群分别只...

2017/01/17 09:45
1
Hadoop 1.x的Shuffle源码分析之3

shuffle有两种,一种是在内存存储数据,另一种是在本地文件存储数据,两者几乎一致。 以本地文件进行shuffle的过程为例: mapOutput = shuffleToDisk(mapOutputLoc, input, filename, ...

2017/01/17 09:44
4
Hadoop 1.x的Shuffle源码分析之2

ReduceTask类的内嵌类ReduceCopier的内嵌类MapOutputCopier的函数copyOutput是Shuffle里最重要的一环,它以http的方式,从远程主机取数据:创建临时文件名,然后用http读数据,再保存到内存文...

2017/01/17 09:44
7
Hadoop 1.x的Shuffle源码分析之1

先参考董西成的博文 http://dongxicheng.org/mapreduce/hadoop-shuffle-phase/ Hadoop中shuffle阶段流程分析 Hadoop的一个任务执行过程,分为Map和Reduce两个阶段。而shuffle发生在Reducer阶...

2017/01/17 09:44
23
weka实战001:一篇博文简单了解weka

weka是java写的开源模式识别和数据挖掘软件,已经有十多年的历史了。weka的官网在http://www.cs.waikato.ac.nz/ml/weka/。 模式识别和数据挖掘有四个问题, 第一:问题是什么 第二:数据是什...

2017/01/17 09:43
15
HBase 二次开发 java api和demo

1. 试用thrift python/java以及hbase client api,结论如下: 1.1 thrift的安装和发布繁琐,可能会遇到未知的错误,且hbase.thrift的版本在变化中。优点代码简单,需要打包的内容少。 1.2 hb...

2017/01/17 09:43
12
apache oozie安装试用

oozie是hadoop的工作流Scheduler,最新的版本到4.0.1了。试用了下,小坑还蛮多的。 1. 编译 我的主机上跑的是Hadoop 1.1.2,选的是oozie 3.3.0版本,下载源码,解压缩。 首先,要把源码里的j...

2017/01/17 09:43
32
一个网站的诞生10--自动化部署

所谓自动部署就是说,如果用10台机器跑tornado程序提供Web服务,它们上面的代码都是一样的,这也叫生产环境。在公司写新代码,写好了,测试通过,这叫开发环境。然后执行自动部署程序,它把新...

2017/01/17 09:42
15
一个网站的诞生09--自动监控

部署Web App,需要买一个域名,我推荐 http://www.namecheap.com/ ,用信用卡或者paypal付款,一年10刀。 如果需要VPS,买Linode.com的,它家新推出每月10刀的主机,性能绝佳,如果选择东京的...

2017/01/17 09:42
9
一个网站的诞生08-- 在Web App嵌入地图

LBS-Location Based Service,基于位置的服务。如果要在Web App嵌入地图,差不多可以做成LBS了。zuijiacanting.com的设计理念,是把Top餐厅放在地图上,那么当你到某个地方逛逛,或者有约会,...

2017/01/17 09:42
15
一个网站的诞生07-- Tornado Web Server

用Spider抓取数据,然后再做各种处理,然后放到web页面供大家使用。 那么,就需要一个Web Server。 几乎每种语言都有一大堆Web Server开发框架,Python也不例外,比如这里http://www.zhihu....

2017/01/17 09:42
14

没有更多内容

加载失败,请刷新页面

返回顶部
顶部