加载中
手推公式:LSTM单元梯度的详细的数学推导

长短期记忆是复杂和先进的神经网络结构的重要组成部分。本文的主要思想是解释其背后的数学原理,所以阅读本文之前,建议首先对LSTM有一些了解。 介绍 上面是单个LSTM单元的图表。我知道它看起...

使用PyTorch从理论到实践理解变分自编码器VAE

变分自动编码器(Variational Auto Encoders,VAE)是种隐藏变量模型[1,2]。该模型的思想在于:由模型所生成的数据可以经变量参数化,而这些变量将生成具有给定数据的特征。因此,这些变量被...

降维算法:主成分分析 VS 自动编码器

降维是一种减少特征空间维度以获得稳定的、统计上可靠的机器学习模型的技术。降维主要有两种途径:特征选择和特征变换。 特征选择通过选择重要程度最高的若干特征,移除共性的或者重要程度较...

为什么在线性模型中相互作用的变量要相乘

在这篇文章中,我将解释为什么当建立一个线性模型,我们添加一个x₁₂术语如果我们认为变量x₁和x₂互动和添加交互条款订立原则方法。 我假设读者对线性模型的工作原理有一个基本的了解。 无交...

熵、交叉熵和KL散度的基本概念和交叉熵损失函数的通俗介绍

交叉熵(也称为对数损失)是分类问题中最常用的损失函数之一。但是,由于当今庞大的库和框架的存在以及它们的易用性,我们中的大多数人常常在不了解熵的核心概念的情况下着手解决问题。所以,...

为什么朴素贝叶斯定理会被叫做朴素的?

朴素贝叶斯算法是一种基于著名贝叶斯定理的分类算法。那么让我们先了解一下Bayes定理是怎么说的,并为朴素贝叶斯算法定理建立z自己的理解,它是如何工作的,它为什么被称为朴素? 贝叶斯定理...

BN,LN,IN,GN都是什么?不同归一化方法的比较

批归一化(BN)已经成为许多先进深度学习模型的重要组成部分,特别是在计算机视觉领域。它通过批处理中计算的平均值和方差来规范化层输入,因此得名。要使BN工作,批大小必须足够大,通常至少为...

​如何找到时序数据中线性的趋势

有时需要从时序数据中删除趋势,为下一步或数据清理过程的一部分做准备。如果可以确定趋势,那么只需从数据中减去它,结果就是非趋势数据。 如果趋势是线性的,你可以通过线性回归找到它。但...

keras搭建基于自动编码器的异常检测技术进行欺诈识别

我最近阅读了一篇名为《使用自动编码器进行异常检测》的文章,在该文中对所生成的数据进行了实验,并且我认为将使用自动编码器进行异常检测这一想法应用于真实世界当中的欺诈检测中,似乎是一...

流行的机器学习算法总结,帮助你开启机器学习算法学习之旅

机器学习算法概述 “机器智能是人类永远需要的一项发明。”— Nick Bostrom. 如果您可以回顾几年前的AI并将其与现在的AI进行比较,您会惊讶地发现AI的发展速度随着时间的增长呈指数级增长。 ...

使用Keras 构建基于 LSTM 模型的故事生成器

什么是 LSTM 网络? LSTM (Long Short Term Memory, 长短期神经网络)是一种特殊的循环神经网络(RNN, Recurrent neural networks)。LSTM 能够通过更新单元状态来学习参数间的长期依赖关系...

EfficientNet详解:用智能缩放的卷积神经网络获得精度增益

自从Alex net在2012年ImageNet挑战赛中获胜后,卷积神经网络就在计算机视觉领域中无处不在。它们甚至在自然语言处理中也有应用,目前最先进的模型使用卷积运算来保留上下文并提供更好的预测。...

NLP中的文本分析和特征工程

语言检测,文本清理,长度测量,情绪分析,命名实体识别,n字频率,词向量,主题建模 前言 在本文中,我将使用NLP和Python解释如何分析文本数据并为机器学习模型提取特征。 NLP(自然语言处理...

通过三个直观步骤理解ROC曲线

ROC曲线是一个分类模型效果好坏评判的的可视化表示。 在这篇文章中,我将分三个步骤头开始构建ROC曲线。 步骤1:获取分类模型预测 当我们训练一个分类模型时,我们得到得到一个结果的概率。在...

tpr
2020/06/17 08:34
188
从LeNet到EfficientNet:CNN的演变和特点总结

卷积神经网络:构建基块 卷积神经网络(或简称CNN)是提取“可学习特征”的常用方法。CNN在深度学习和神经网络的发展与普及中发挥了重要作用。 但是,这篇博客中,我将重点放在完整的CNN架构...

循环生成网络 CycleGan 原理介绍

本文旨在解释“循环生成网络”的内部工作原理,以及如何将其应用于解决现实世界中的任务。 介绍 循环生成对抗网络(简称CycleGans)[1]是功能强大的计算机算法,具有改善数字生态系统的潜力。...

5种常用的交叉验证技术,保证评估模型的稳定性

Kaggle的数据科学黑客大会最有趣和最具挑战性的一件事是:在公共和私有的排行榜中,努力保持同样的排名。当我的结果在一个私有的排行榜进行验证时,我就失去了共有的排名。 你有没有想过是什...

通俗易懂的讲解奇异值分解(SVD)和主成分分析(PCA)

0.本教程包含以下内容 特征分解 对称矩阵的特征分解 奇异值分解(The Singular Value Decomposition,SVD) 主成分分析(Principal Component Analysis ,PCA)——特征提取 1.特征分解 首先...

2020/06/13 19:07
700
为文本摘要模型添加注意力机制:采用LSTM的编解码器模型实现

摘要是自然语言处理领域中最具挑战性和最有趣的问题之一。它是一个从多种文本资源(如书籍、新闻文章、博客文章、研究论文、电子邮件和tweet)中生成简洁而有意义的文本摘要的过程。现在,随着...

极限学习机 Extreme Learning Machines 介绍

什么是极限学习机? 极限学习机(ELM, Extreme Learning Machines)是一种前馈神经网络,最早由新加坡南洋理工大学黄广斌教授于2006年提出。其发表的文章中对于极限学习机的描述如下: 该算法...

2020/06/11 09:00
436

没有更多内容

加载失败,请刷新页面

返回顶部
顶部