加载中
数据预处理

3.1 数据预处理     数据质量的三个要素:准确性、完整性和一致性。 3.1.2 数据预处理的主要任务   数据清理:填写缺失的值,光滑噪声数据,识别或删除离群点,并解决不一致性来”清理...

2019/04/06 22:26
19
如何用Python从海量文本抽取主题?

摘自https://www.jianshu.com/p/fdde9fc03f94 你在工作、学习中是否曾因信息过载叫苦不迭?有一种方法能够替你读海量文章,并将不同的主题和对应的关键词抽取出来,让你谈笑间观其大略。本文...

Boosting(提升方法)之XGBoost

XGBoost是一个机器学习味道非常浓厚的模型,在数学上非常规范,运用正则化、L2范数、二阶梯度、泰勒公式和分布式计算方法,对GBDT等提升树模型进行优化,不仅能处理更大规模的数据,而且运行...

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部