加载中
常用机器学习算法训练预测模型的常规流程

以XGBoost算法为例,主要操作步骤如下: 读取集群目录数据 批量重新命名字段名称 统计各列缺失值个数 对缺失值进行填充(数值型变量采用中位数、分类变量采用众数) 过滤掉异常记录 过滤掉缺...

2019/02/13 18:02
496
Hive常用操作

--参考资料: --https://blog.csdn.net/qq_41028958/article/details/80853089 --https://blog.csdn.net/u012061196/article/details/85165224 --https://blog.csdn.net/a_drjiaoda/article/...

2019/11/01 10:23
43
分别在有网和无网状态下批量安装python库

连网状态下,批量安装python库 查看当前python环境下已安装的库包版本 查看命令:pip freeze """ alabaster==0.7.10 anaconda-client==1.6.3 anaconda-navigator==1.6.2 anaconda-project==0...

XGBoost原理公式推导

##AdaBoost算法原理简介 http://www.uml.org.cn/sjjmwj/2019030721.asp 参考资料 https://blog.csdn.net/u010665216/article/details/78532619 https://blog.csdn.net/jamexfx/article/deta...

2019/09/26 18:58
58
常规异常值检测方式

##正态假设检验 参考资料:https://blog.csdn.net/cyan_soul/article/details/81236124 ###正态分布,可考虑采用3西格玛准则,(μ-3σ,μ+3σ) 3σ原则为 数值分布在(μ-σ,μ+σ)中的概率为...

pyecharts使用教程

##pyecharts ##ImportError: cannot import name 'Bar' from 'pyecharts' https://blog.csdn.net/shaooping/article/details/90316540 ##参照GitHub上的代码操作 https://github.com/pyechar...

2019/08/28 10:25
237
CNN

##CNN参考资料: 降采样、全连接 https://www.cnblogs.com/guoyaohua/p/8534077.html https://www.cnblogs.com/bonelee/p/7716284.html https://www.jianshu.com/p/f0017585358f https://www...

2019/08/23 19:09
65
JupyterNotebook中的Markdown操作以及numpy操作

##参考资料:https://blog.csdn.net/weixin_38774821/article/details/80628591 JupyterNotebook部分常用操作 Cell不仅可以写代码,还能Markdown Markdown是用来写文章的,比如这个简书文章就...

Linux搭建spark单机操作环境

https://blog.csdn.net/king13127/article/details/86528416 https://www.cnblogs.com/duanxz/p/4437802.html ##spark、Hadoop、java、scala https://blog.csdn.net/pucao_cug/article/detai...

机器学习算法GPU版本安装配置

##XGBoost for GPU安装 https://blog.csdn.net/weixin_30963287/article/details/79145107 https://blog.csdn.net/wl2858623940/article/details/80546140 https://blog.csdn.net/u01164186...

2019/06/20 18:28
41
安装配置IntelliJ IDEA

##参考资料: https://blog.csdn.net/Haidaiya/article/details/81230636 https://www.cnblogs.com/yjmyzz/p/4694219.html https://my.oschina.net/u/3825598/blog/1789861 https://www.jian...

第三方算法打jar包操作

在实际运用算法建模过程中,spark自带的ml库中不一定都包含所需算法,这时就需要加载第三方算法包jar,主要有两种方式: ##方法一:首先在maven官网上找到相应算法对应的Jar包 官网地址:htt...

Tensorflow on Spark

##配置教程 http://www.mamicode.com/info-detail-2053559.html https://blog.csdn.net/fishseeker/article/details/61918138?utm_source=tuicool&utm_medium=referral ##源代码 https://gi...

GLIBC等相关文件升级更新

###参考资料:https://blog.csdn.net/glongljl/article/details/80156243 ###安装更新libstdc++.so文件 https://blog.csdn.net/xdzhangzhenhao/article/details/80746403 找一个更高版本的l...

2019/06/18 17:51
93
识别图片内容,并将相应内容写到对应文本文件中

-- coding: utf-8 -- """ Created on Thu Apr 18 17:05:47 2019 @author: HeyJude """ import time start_time = time.time() def GetText(pic_path, text_path): import pytesseract from P...

读取xml文件

-- coding: utf-8 -- """ Created on Thu Apr 18 14:41:44 2019 @author: HeyJude """ import xml.dom.minidom dom = xml.dom.minidom.parse("./word.xml") root = dom.documentElement imag...

2019/06/18 17:24
12
torch安装配置

##torch工程依赖包以及安装顺序:torch、torchvision、torch_baidu_ctc torch-1.1.0-cp36-cp36m-manylinux1_x86_64.whl torchvision-0.3.0-cp36-cp36m-manylinux1_x86_64.whl torch_baidu_c...

2019/06/18 17:11
155
keras工程安装配置

###以下均基于Anaconda3 for Python 3.6.5,安装文件为Anaconda3-5.2.0-Linux-x86_64.sh ##keras依赖包及安装顺序 Keras-Applications-1.0.7 Keras-Preprocessing-1.0.9 keras 2.2.4 keras_r...

安装tensorflow-gpu

###以下均基于Anaconda3 for Python 3.6.5,安装文件为Anaconda3-5.2.0-Linux-x86_64.sh ####安装tensorflow-gpu,依赖包及其顺序 termcolor grpcio protobuf gast astor absl-py markdown ...

GPU使用设置

keras参考资料:https://keras.io/zh/getting-started/faq/#sample-batch-epoch https://keras-cn.readthedocs.io/en/latest/ 参考资料:https://www.jianshu.com/p/5d47f152ff62 https://bl...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部