加载中
当 Mars 遇上 RAPIDS:用 GPU 以并行的方式加速数据科学

背景 在数据科学世界,Python 是一个不可忽视的存在,且有愈演愈烈之势。而其中主要的使用工具,包括 Numpy、Pandas 和 Scikit-learn 等。 Numpy Numpy 是数值计算的基础包,内部提供了多维数...

2020/04/16 18:36
381
Python数据科学“冷门”库

摘要: 这些python库真“冷”,但真的很强大! Python是一种神奇的语言。事实上,它是近几年世界上发展最快的编程语言之一,它一次又一次证明了它在开发工作和数据科学立场各行业的实用性。整...

Mars——基于矩阵的统一分布式计算框架

很高兴在这里宣布我们的新项目:Mars,一个基于矩阵的统一分布式计算框架。我们已经在 Github 开源:https://github.com/mars-project/mars 。 背景 Python Python 是一门相当古老的语言了,...

2019/01/09 12:01
271
6个步骤从头开始编写机器学习算法:感知器案例研究

摘要: 通用版学习机器学习算法的方法,你值得拥有! 从0开始编写机器学习算法是一种非常好的体验 点击这里你可以查看本文所用到的Python代码 当你点击之后你会感到压力,因为其中有些算法比...

2018/11/12 13:30
162
MaxCompute Mars 完全指南

Mars 简介 Mars 能利用并行和分布式技术,加速 Python 数据科学栈,包括 numpy、pandas 和 scikit-learn。同时,也能轻松与 TensorFlow、PyTorch 和 XGBoost 集成。 Mars tensor 的接口和 nu...

2020/05/15 15:05
522
200种最佳机器学习教程汇总【史上最全】

摘要: 不吹不黑,绝对史上最全的机器学习学习材料! 本文包含了迄今为止大家公认的最佳教程内容。它绝不是网上每个ML相关教程的详尽列表,而是经过精挑细选而成的,毕竟网上的东西并不全是好...

实战:用Python实现随机森林

摘要: 随机森林如何实现?为什么要用随机森林?看这篇足够了! 因为有Scikit-Learn这样的库,现在用Python实现任何机器学习算法都非常容易。实际上,我们现在不需要任何潜在的知识来了解模型...

2018/12/10 12:32
202
Keras文本分类实战(下)

摘要: 本文是使用kreas处理文本分析的入门教程(下),介绍文本处理的两种方法——独热编码和词嵌入。 在上一节Keras文本分类实战(上),讲述了关于NLP的基本知识。这部分,将学会以不同方...

Mars:加速数据科学的新方式

本文分为4个部分: Mars的背景和现状 Mars解决了什么问题 Mars背后的哲学 总结与展望 一、Mars的背景和现状 说到加速数据科学的新方式,就不得不说什么是数据科学,以下是维基的定义: 数据科...

Mars Remote API 轻松分布式执行 Python 函数

Mars 是一个并行和分布式 Python 框架,能轻松把单机大家耳熟能详的的 numpy、pandas、scikit-learn 等库,以及 Python 函数利用多核或者多机加速。这其中,并行和分布式 Python 函数主要利用...

Mars 应用与最佳实践

本文主要从以下几个方面展开: Mars简介 典型场景 Demo 最佳实践 一、Mars简介 Mars是统一的数据科学平台,它用来加速传统的Python数据科学技术栈,在单机中也可以用多核加速,或用分布式来加...

机器学习与数据科学决策树指南

摘要: 一份关于决策树的基本介绍,用实例说明详细讲解。 还在为如何抉择而感到纠结吗?快采用决策树(Decision Tree)算法帮你做出决定吧。决策树是一类非常强大的机器学习模型,具有高度可...

2018/12/26 11:52
25
阿里云 MaxCompute 2020-4 月刊

导读 【4月新功能】 【4月新文档】 【新增解决方案】 【新增最佳实践】 【4月新功能】 1. MaxCompute审计日志发布 MaxCompute在服务级别自动将您使用MaxCompute所产生的操作日志,实时投递到...

2020/05/14 16:17
41
2018最有用的六个机器学习项目

摘要: 用了这六个机器学习开源项目,你的项目一定进行的666! 2018年又是人工智能和机器学习快速发展的一年。许多新的机器学习的项目正在以非常高的影响力影响着诸多领域,特别是医疗保健、...

为什么要学习Python?这10个理由足够了!

摘要: 看完这十个理由,我决定买本python从入门到精通! 如果你定期关注现今的科技发展,那么你可能想知道我为什么要写这篇文章告诉人们学习Python?因为几年前我提倡Java而不是Python。 在...

转型为一名数据科学家的正确打开方式

摘要: 如果你是一名初级入门者,或者是一名软件工程师,亦或者是一名数学物理系毕业生,想要转型为一名数据科学家,按照我的建议一步一个脚印的去做,你会事半功倍。 维基百科是你在数据科学...

只需10分钟!就能用Flask,Docker和Jenkins部署机器学习模型

在生产环境中部署机器学习模型是数据工程中经常被忽视的领域。网上的大多数教程/博客都侧重于构建、训练和调整机器学习模型。如果它不能用于实际的预测,那么它又有什么用呢? 接下来了解一下...

2019/03/25 10:25
588
基于实时计算(Flink)与高斯模型构建实时异常检测系统

案例与解决方案汇总页: 阿里云实时计算产品案例&解决方案汇总 1. 概述 异常检测(anomaly detection)指的是对不符合预期模式或数据集(英语:dataset)中其他项目的项目、事件或观测值的识...

2019/03/06 15:15
503
机器学习基础:(Python)训练集测试集分割与交叉验证

摘要: 本文讲述了如何用Python对训练集测试集进行分割与交叉验证。 在上一篇关于Python中的线性回归的文章之后,我想再写一篇关于训练测试分割和交叉验证的文章。在数据科学和数据分析领域中...

2018/11/23 13:06
1.9K
Auto-Keras与AutoML:入门指南

摘要: 不会机器学习?不会人工智能?没关系!自动化程序来了! 在本教程中,你将学习如何使用Auto-Keras(Google的AutoML的开源替代品)来实现自动化机器学习和深度学习。 目前来说,深度学...

2019/01/28 11:16
331

没有更多内容

加载失败,请刷新页面

返回顶部
顶部