加载中
Python数据分析与挖掘学习路线图

1、Python学习。语言的学习,真正掌握语言的方式,是交流与实践,所以,这三本书,是由浅入深的步骤。大家在学习过程中,可以到群里面去进行交流沟通。 Python初学教程:《简明Python教程》 ...

2016/01/02 12:33
521
Python实现抓取城市的PM2.5浓度和排名

threading、BeautifulSoup

2016/01/02 13:19
133
数据分析有感

重点掌握基础的数据处理和分析方法,培养数据驱动业务的敏感度,有效地将数据分析与业务结合起来,能从产品功能和业务的角度提出有针对性的解决方案 。 技能要求:python,主要包含pandas、n...

2016/03/30 11:59
61
近30天数据操作

#!/usr/bin/env python import pandas as pd import datetime today = datetime.date.today() yesterday = today - datetime.timedelta(days=1) yesterday_time = str(int(yesterday.strftim...

2017/07/12 16:06
30
LightGBM学习

官方文档 https://lightgbm.readthedocs.io/en/latest/Python-API.html http://lightgbm.apachecn.org/cn/latest/index.html 开源|LightGBM基本原理,以及调用形式 https://blog.csdn.net/HH...

2018/09/15 17:33
442
分别在有网和无网状态下批量安装python库

连网状态下,批量安装python库 查看当前python环境下已安装的库包版本 查看命令:pip freeze """ alabaster==0.7.10 anaconda-client==1.6.3 anaconda-navigator==1.6.2 anaconda-project==0...

spark Pipeline操作

import org.apache.spark.ml.Pipeline import org.apache.spark.ml.classification.LogisticRegression import org.apache.spark.ml.evaluation.BinaryClassificationEvaluator import org.a...

2018/11/20 18:28
93
spark运用逻辑回归算法操作Titanic数据集

/* 参考资料: 使用scala部署XGBoost算法:http://bailiwick.io/2017/08/21/using-xgboost-with-the-titanic-dataset-from-kaggle/ 使用Java部署逻辑回归算法:https://blog.csdn.net/javaf...

2018/12/28 11:28
213
待整理代码

1、批量操作pd.get_dummies 2、NaiveBayes、LR、XGBoost单机&多进程核心代码 ##终于明白为什么,转换预测数据会有失败的,因为部分取值存在缺失,无法判断 https://stackoverflow.com/questi...

2018/09/02 20:05
57
IsolationForest算法spark实现

/* Notice: 需要事先将IsolationForest算法源码利用mvn方式jar包,才可以使用import org.apache.spark.ml.iforest.IForest scala源代码地址:https://github.com/titicaca/spark-iforest pyt...

2018/12/28 10:12
487
LR、XGB、RF案例

##LR https://www.cnblogs.com/wuchuanying/p/6243987.html ##XGB http://blog.csdn.net/sb19931201/article/details/52577592 ##RF http://www.oschina.net/translate/random-forests-in-py...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部