加载中
10种常用的图算法直观可视化解释

图已经成为一种强大的建模和捕获真实场景中的数据的手段,比如社交媒体网络、网页和链接,以及GPS中的位置和路线。如果您有一组相互关联的对象,那么您可以使用图来表示它们。 在这篇文章中,...

推理(Inference)与预测(Prediction)

在机器学习的背景下,很多人似乎混淆了这两个术语。这篇文章将试图澄清我们所说的这两个词是什么意思,每一个词在哪里有用,以及它们是如何应用的。在这里,我将举几个例子来直观地理解两者之...

2020/08/30 08:30
849
PandaSQL:一个让你能够通过SQL语句进行pandas的操作的python包

Pandas是近年来最好的数据操作库之一。它允许切片、分组、连接和执行任意数据转换。如果你熟练的使用SQL,那么这篇文章将介绍一种更直接、简单的使用Pandas处理大多数数据操作案例。 假设你对...

Quickprop介绍:一个加速梯度下降的学习方法

由于80年代/ 90年代的普通反向传播算法收敛缓慢,Scott Fahlman发明了一种名为Quickprop[1]的学习算法,它大致基于牛顿法。他的简单想法在诸如“N-M-N编码器”任务这样的问题域中优于反向传播...

你可能不知道的pandas的5个基本技巧

如何用pandas处理大数据学习“between”、“reindex”等功能。这5个pandas的功能是非常有用的,但有时候却被人忽略 between 函数 多年来我一直在SQL中使用“between”函数,但直到最近才在p...

2020/08/27 10:05
166
机器学习中的音频特征:理解Mel频谱图

如果你像我一样,试着理解mel的光谱图并不是一件容易的事。你读了一篇文章,却被引出了另一篇,又一篇,又一篇,没完没了。我希望这篇简短的文章能澄清一些困惑,并从头解释mel的光谱图。 信...

医学图像分割模型U-Net介绍和Kaggle的Top1解决方案源码解析

内容列表 介绍 先决条件 什么是U-NET U-NET结构 KAGGLE数据科学SCIENCE BOWL 2018 挑战赛 介绍 计算机视觉是人工智能的一个领域,训练计算机解释和理解视觉世界。利用来自相机、视频和深度学...

使用ML 和 DNN 建模的技巧总结

每个人都可以轻松地将数据放入任何模型机器学习或深度学习框架中。但是遵循最佳实践技巧可能有助于提升工作效率。以下是常见的一些方法。 本文内容 数据预处理 处理原始数据 使用张量 数据扩...

5分钟入门GANS:原理解释和keras代码实现

本篇文章包含以下内容 介绍 历史 直观解释 训练过程 GAN在MNIST数据集上的KERAS实现 介绍 生成式对抗网络通常也称为GANs,用于生成图像而不需要很少或没有输入。GANs允许我们生成由神经网络生...

2020/08/23 08:00
373
特征工程入门:应该保留和去掉那些特征

在特征/列上执行的任何能够帮助我们根据数据进行预测的操作都可以称为特征工程。这将包括以下内容: 添加新功能去掉一些讲述同样内容的特征将几个特性结合在一起将一个特性分解为多个特性 添加...

时间卷积网络TCN:时间序列处理的新模型

这篇文章回顾了基于TCN的解决方案的最新创新。我们首先介绍了一个运动检测的案例研究,并简要回顾了TCN架构及其相对于传统方法的优势,如卷积神经网络(CNN)和递归神经网络(RNN)。然后,我们介...

用Python编写代码分析《英雄联盟》游戏胜利的最重要因素

介绍 在过去的几年里,电子竞技社区发展迅速,曾经只是休闲娱乐的电子竞技产业,到2022年有望创造18亿美元的收入。虽然在这个生态系统中有很多电子游戏,但很少有游戏像《英雄联盟》那样成为...

2020/08/20 09:05
276
概率论和统计学中重要的分布函数

随机变量在概率空间中遵循不同类型的分布,这决定了它们的特征并有助于预测。 本文内容列表: 引言 高斯/正态分布(Gaussian/Normal Distribution) 二项分布(Binomial Distribution) 伯努利...

Python中得可视化:使用Seaborn绘制常用图表

Seaborn是Python中的一个库,主要用于生成统计图形。 Seaborn是构建在matplotlib之上的数据可视化库,与Python中的pandas数据结构紧密集成。可视化是Seaborn的核心部分,可以帮助探索和理解数...

2020/08/18 08:25
1.7W
机器学习入门:偏差和方差

偏差(bias):偏差衡量了模型的预测值与实际值之间的偏离关系。 方差(variance):方差描述的是训练数据在不同迭代阶段的训练模型中,预测值的变化波动情况(或称之为离散情况) 我们这里以线...

详解DBSCAN聚类

使用DBSCAN标识为员工分组 照片由Ishan @seefromthesky 在 Unsplash拍摄 基于密度的噪声应用空间聚类(DBSCAN)是一种无监督的ML聚类算法。无监督的意思是它不使用预先标记的目标来聚类数据点。...

2020/08/16 07:59
517
交叉验证和超参数调整:如何优化你的机器学习模型

准确预测Fitbit的睡眠得分 在本文的前两部分中,我获取了Fitbit的睡眠数据并对其进行预处理,将这些数据分为训练集、验证集和测试集,除此之外,我还训练了三种不同的机器学习模型并比较了它...

2020/08/15 09:17
2.2K
5个可以帮助pandas进行数据预处理的可视化图表

“一目了然胜过千言万语。”分析数据点的探索性数据分析(EDA)是在算法的数据建模之前制定假设的正确步骤。 数据科学行业中一个最常见的陷阱是花费数小时为他们的项目寻找最佳算法,而没有花...

为什么要停止过度使用置换重要性来寻找特征

数据分析师通常为了某些任务需要计算特征重要度。特征重要度可以帮助使用者了解数据中是否存在偏差或者模型中是否存在缺陷。并且特征重要度可用于理解底层流程和做出业务决策。模型最重要的特...

2020/08/13 09:11
120
使用tensorflow进行音乐类型的分类

音乐流媒体服务的兴起使得音乐无处不在。我们在上下班的时候听音乐,锻炼身体,工作或者只是放松一下。 这些服务的一个关键特性是播放列表,通常按流派分组。这些数据可能来自出版歌曲的人手...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部