加载中
亿级用户的平台是如何使用词嵌入来建立推荐系统的

推荐系统对于我们今天使用的几乎所有应用程序都是至关重要的。 借助大数据,我们有大量可供选择的内容。并且我们可以建系统,通过这些系统可以帮助我们筛选和确定选择的优先次序。 这些系统还...

使用神经网络的自动化特征工程

特征工程是生成精确模型的最重要步骤之一。但是没有人喜欢它,因为这个步骤非常繁琐,我坚信任何繁琐的事情都可以自动化。虽然我的解决方案并没有完全消除对手工工作的需要,但它确实大大减少...

2021/02/27 12:31
145
线性回归中的L1与L2正则化

在这篇文章中,我将介绍一个与回归相关的常见技术面试问题,我自己也经常会提到这个问题: 描述回归建模中的L1和L2正则化方法。 在处理复杂数据时,我们往往会创建复杂的模型。太复杂并不总是...

2021/02/26 08:45
257
用N.E.A.T遗传算法玩FlappyBird

项目介绍 使用Python实现《Flappy Bird》类,主要包括物理引擎和死亡机制以及像素精度碰撞检测 利用N.E.A.T实现神经网络,通过鸟类的每代繁殖,获得一定阈值的适应度,通过神经网络能计算出模...

2021/02/25 08:50
194
使用Deep Replay可视化神经网络学习的过程

深度学习通常被认为是一种黑盒技术,因为通常无法分析它在后端是如何工作的。例如创建了一个深层神经网络,然后将它与你的数据相匹配,我们知道它会使用不同层次的神经元和所有的激活等其他重...

通过随机采样和数据增强来解决数据不平衡的问题

在开发分类机器学习模型时遇到的挑战之一是类别不平衡。大多数用于分类的机器学习算法都是在假设平衡类的情况下开发的,然而,在现实生活中,拥有适当平衡的数据并不常见。因此,人们提出了各...

如何在评估机器学习模型时防止数据泄漏

本文讨论了评估模型性能时的数据泄漏问题以及避免数据泄漏的方法。 在模型评估过程中,当训练集的数据进入验证/测试集时,就会发生数据泄漏。这将导致模型对验证/测试集的性能评估存在偏差。...

2021/02/22 08:39
1K
TransGAN:使用Transformer替换卷积也可以构建一个强力的GAN

生成对抗网络(GANs)已经在包括图像合成、图像翻译和图像编辑在内的许多任务中取得了相当大的成功。但是因为生成对抗网络训练不稳定,为了稳定GAN训练付出很多人付出了许多努力例如引入了各种...

1x1卷积详解:概念、优势和应用

Lin等人的《网络中的网络(Network in Network, NiN)》一文,提出了一种特殊的卷积操作,它允许跨通道参数级联,通过汇聚跨通道信息来学习复杂的交互。他们将其称为“交叉通道参数池化层”(c...

论文解读:SKNet自适应动态选择机制,动态调整感受野尺寸

在标准的卷积网络中,每层网络中神经元的感受野的大小都是相同的。在神经学中,视觉神经元感受野的大小是由刺激机制构建的,而在卷积网络中却很少考虑这个因素。本文提出的方法可以使神经元对...

2021/02/19 09:16
326
深度信号处理:利用卷积神经网络测量距离

在信号处理中,有时需要测量信号某些特征(例如峰)之间的水平距离。一个很好的例子就是解释心电图(ECG),这在很大程度上取决于测量距离。 我们将考虑下图中只有两个峰的平滑信号的一个样例...

NFNETS论文解读:不使用BN的高性能大规模图像识别

简介与概述 因此,本文的重点是在不是使用BN来构建图像识别的卷积残差神经网络。但是如果没有BN,这些网络通常无法很好地运行或无法扩展到更大的批处理大小,但是本篇论文构建的网络可以使用...

可以格式化Python自定义对象的3个魔术方法

在Python中,下划线用于属性名时具有特殊含义。一种特殊形式是使用两对双下划线,一个在属性名之前,另一个在属性名之后,这被称为特殊方法或魔术方法。 例如,我们大多数人知道的第一个特殊...

def
2021/02/16 09:09
82
帮助你在2021年成为数据科学家的21个有用的小贴士

在这篇文章中,我将与你分享我从其他数据科学家以及我自己过去几年的经验中学到的21条建议。 这取决于你的职业生涯已经走了多远,其中一些建议肯定比其他的更适合你。例如,“花点时间来发现...

2021/02/15 09:51
117
机器学习中分类任务的常用评估指标和python代码实现

假设您的任务是训练ML模型,以将数据点分类为一定数量的预定义类。一旦完成分类模型的构建,下一个任务就是评估其性能。有许多指标可以帮助您根据用例进行操作。在此文章中,我们将尝试回答诸...

def
2021/02/14 10:41
370
如何知道一个变量的分布是否为高斯分布?

“你的输入变量/特征必须是高斯分布的”是一些机器学习模型(特别是线性模型)的要求。但我怎么知道变量的分布是高斯分布呢。本文重点介绍了保证变量分布为高斯分布的几种方法。 本文假定读者对...

2021/02/13 08:49
274
来自ML的祝福:和CycleGAN一起庆祝春节

使用CycleGAN和谷歌的QuickDraw数据集创建节日祥龙 今天是大年初一是2021年农历新年的开始。在农历新年里,我们会经常看到五颜六色的舞龙。这里我们使用ML的风格来庆祝我们的新年,我使用Cyc...

9个可以提高Jupyter Notebook开发效率的魔术命令

Jupyter Notebook包含一写特殊的命令,我们称之为魔术命令。 正如它的名字,魔术命令是一个特殊的命令。魔术命令通过将%符号与要运行的命令一起使用来工作。 魔术命令有很多种,但在本文中我...

经典Seq2Seq与注意力Seq2Seq模型结构详解

介绍 在本文中,我们将分析一个经典的序列对序列(Seq2Seq)模型的结构,并演示使用注意解码器的优点。这两个概念将为理解本文提出的Transformer奠定基础,因为“注意就是您所需要的一切”。 ...

这3个Seaborn函数可以搞定90%的可视化任务

数据可视化是数据科学的重要组成部分。它帮助我们探索和理解数据。数据可视化也是传递信息和交付结果的重要工具。 由于数据可视化的重要性,在数据科学的生态系统中有许多数据可视化库和框架...

2021/02/09 08:43
164

没有更多内容

加载失败,请刷新页面

返回顶部
顶部