加载中
机器学习-特征工程-Feature generation 和 Feature selection

概述:上节咱们说了特征工程是机器学习的一个核心内容。然后咱们已经学习了特征工程中的基础内容,分别是missing value handling和categorical data encoding的一些方法技巧。但是光会前面的...

机器学习竞赛分享:NFL大数据碗(上篇)

kaggle竞赛分享:NFL大数据碗 - 上 竞赛简介 一年一度的NFL大数据碗,今年的预测目标是通过两队球员的静态数据,预测该次进攻推进的码数,并转换为该概率分布; 竞赛链接 https://www.kaggle...

机器学习回顾篇(15):集成学习之GDBT

1 引言¶ 梯度提升树算法(Gradient Boosting Decision Tree,GBDT)是一个非常经典的机器学习算法,和我们前面介绍过的Adaboost算法一样,都是提升学习系列算法中的一员。从“梯度提升树”这...

2019/04/10 10:10
7
机器学习竞赛分享:通用的团队竞技类的数据分析挖掘方法

前言 该篇分享来源于NFL竞赛官方的R语言版本,我做的主要是翻译为Python版本; 分享中用到的技巧、构建的特征、展示数据的方式都可以应用到其他领域,比如篮球、足球、LOL、双人羽毛球等等,...

2019/04/10 10:10
20
机器学习基础——带你实战朴素贝叶斯模型文本分类

本文始发于个人公众号:TechFlow <br> 上一篇文章当中我们介绍了朴素贝叶斯模型的基本原理。 <br> 朴素贝叶斯的核心本质是假设样本当中的变量服从某个分布,从而利用条件概率计算出样本属于某...

TensorFlow or PyTorch

既然你已经读到了这篇文章,我就断定你已经开始了你的深度学习之旅了,并且对人造神经网络的研究已经有一段时间了;或者也许你正打算开始你的学习之旅。无论是哪一种情况,你都是因为发现你陷...

「07」回归的诱惑:深入浅出逻辑回归

前言 上期文章:「05」回归的诱惑:一文读懂线性回归 中 , 我们介绍了线性回归的原理,组成和优缺点,并探讨了回归的本质含义。在这一期,我们将从回归开始,引出一个机器学习中最重要的任务...

MacOSX 安装 TensorFlow

TensorFlow是一个端到端开源机器学习平台。它拥有一个包含各种工具、库和社区资源的全面灵活生态系统,可以让研究人员推动机器学习领域的先进技术的。 准备 安装 Anaconda TensorFlow 安装的...

01/21 22:58
11
大数据风控系统概述

为什么要做风控系统 不做的话,会有以下风险: 各种小号、垃圾账号泛滥 撞库攻击、盗号、毁号、拖库等 拉新 10w 留存率不到 5% 百万营销费用,却增加不了用户粘性 投票票数差距非常悬殊 各种...

线性代数精华——从正交向量到正交矩阵

<br> 向量内积 <br> 这个基本上是中学当中数学课本上的概念,两个向量的内积非常简单,我们直接看公式回顾一下: $$X \cdot Y = \sum_{i=1}^n x_i*y_i$$ 这里X和Y都是n维的向量,两个向量能够...

2019/04/10 10:10
6
决策树中的熵和基尼指数

决策树是一种很基本的分类与回归方法,但正如前面博文机器学习排序算法:RankNet to LambdaRank to LambdaMART中所讲的LambdaMART算法一样,这种最基本的算法却是很多经典、复杂、高效的机器...

2018/10/22 09:42
5
L1与L2损失函数和正则化的区别

本文翻译自文章:Differences between L1 and L2 as Loss Function and Regularization,如有翻译不当之处,欢迎拍砖,谢谢~   在机器学习实践中,你也许需要在神秘的L1和L2中做出选择。通...

2018/10/21 10:47
33
.NET Core开发的iNeuOS工业互联平台,iNeuKernel物联网核心组件在Docker容器中部署。

目 录 1. 概述... 2 2. 演示信息... 2 3. 安装Docker容器... 2 4. 安装dotnet镜像... 3 5. 复制iNeuKernel到容器中... 4 6. 进入指定容器... 4 7. 安装dotnet框架... 4 8. 在Docker容器中运行...

由Kaggle竞赛wiki文章流量预测引发的pandas内存优化过程分享

pandas内存优化分享 缘由 最近在做Kaggle上的wiki文章流量预测项目,这里由于个人电脑配置问题,我一直都是用的Kaggle的kernel,但是我们知道kernel的内存限制是16G,如下: 在处理数据过程中...

把 CPU “玩”起来

前言 从开始学习编程之后,就渐渐痴迷于技术,平时遇到购书满减活动时就忍不住买一堆书。前两天闲着无聊,翻开了去年买的《编程之美》,目录里的“让 CPU 占用率听你指挥”吸引力我的眼球。这...

2019/04/10 10:10
14
Kaggle竞赛丨入门手写数字识别之KNN、CNN、降维

引言 这段时间来,看了西瓜书、蓝皮书,各种机器学习算法都有所了解,但在实践方面却缺乏相应的锻炼。于是我决定通过Kaggle这个平台来提升一下自己的应用能力,培养自己的数据分析能力。 我个...

2019/04/10 10:10
18
让你的 Linux 命令骚起来

[toc] 本文将为读者提供许多不同 Linux 命令的简要概述。 将特别强调解释如何在执行数据科学任务的上下文中使用每个命令。 我们的目标是让读者相信这些命令中的每一个都非常有用,并且让他们...

01/19 22:30
9

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部