加载中
时间卷积网络TCN:CNN也可以处理时序数据并且比LSTM更好

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 本文回顾了 Shaojie Bai、J. Zico Kolter 和 Vladlen Koltun 撰写的论文:An Empirical Evaluation of Generic Convolutional and Recu...

基于遗传算法的特征选择:通过自然选择过程确定最优特征集

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 遗传算法是一种基于自然选择的优化问题的技术。在这篇文章中,我将展示如何使用遗传算法进行特征选择。 虽然 scikit-learn 中有许多众所...

激活函数其实并不简单:最新的激活函数如何选择?

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 如今,机器学习领域的科学进步速度是前所未有的。除非局限在一个狭窄的细分市场,否则要跟上时代的步伐是相当困难的。每天都有新论文出...

我总结了70篇论文的方法,帮你透彻理解神经网络的剪枝算法

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 无论是在计算机视觉、自然语言处理还是图像生成方面,深度神经网络目前表现出来的性能都是最先进的。然而,它们在计算能力、内存或能源...

使用 TimeGAN 建模和生成时间序列数据

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 在本文中,我们将研究时间序列数据并探索一种生成合成时间序列数据的方法。 时间序列数据 — 简要概述 时间序列数据与常规表格数据有什...

09/09 09:14
43
机器学习中的数据级联:被低估的数据,被高估的模型

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 来自谷歌的研究员在一篇题为“Everyone wants to do the model work, not the data work”的论文中指出:数据质量在AI中起到的作用正在...

机器学习中对抗性攻击的介绍和示例

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 概念 对抗样本是专门设计的输入,旨在欺骗机器学习 (ML) 模型,从而导致高置信度的错误分类。有趣的是这种方式对图像所做的修改虽然温和...

如何阅读机器学习论文

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 在这里我不会试图说服你为什么需要阅读技术和研究论文。我们在日常生活中使用的几乎所有算法都来自技术文献或者以教程或更简单的代码形...

神经网络的多任务学习方法,避免灾难性遗忘

神经网络非常擅长学习一件事。无论是下棋还是折叠蛋白质,只要有足够的数据和时间,神经网络都能取得惊人的效果。不幸的是,网络目前无法擅长一项以上的任务。你可以训练一个网络擅长某件事,...

机器学习是如何利用线性代数来解决数据问题的

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 机器或者说计算机只理解数字,我们所有的而计算,计算机都会将这些转换成某种方式数字表示进行处理,使这些机器能够通过从数据中学习而...

9个value_counts()的小技巧,提高Pandas 数据分析效率

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 数据科学家通常将大部分时间花在探索和预处理数据上。当谈到数据分析和理解数据结构时,Pandas value_counts() 是最受欢迎的函数之一。...

用随机游动生成时间序列的合成数据

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 随机游走是随机过程。它们由数学空间中的许多步骤组成。最常见的随机游走从值 0 开始,然后每一步都以相等的概率加或减 1。 随机游走可...

知识图谱指南:从理论到应用

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 知识图谱并不是一个全新的概念,早在 2006 年就有文献提出了语义网(Semantic Network)的概念,呼吁推广、完善使用本体模型来形式化表...

使用pytorch和GTP2生成文章标题

标题选的好,绅士少不了。标题与文章的点击量有很大的联系,一个好的标题能够带来更多的读者。标题是潜在观众在决定是否阅读的文章之前首先看到的内容。作为一名数据科学家,我决定制作一个模...

非线性降维方法 Isomap Embedding

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! Isomap Embedding 等距特征映射是一种新颖,高效的非线性降维技术,它的一个突出优点是只有两个参数需要设定,即邻域参数和嵌入维数. 在文...

Auto-Sklearn:通过自动化加速模型开发周期

背景 典型的机器学习工作流程是数据处理、特征处理、模型训练和评估的迭代循环。想象一下,必须对数据处理方法、模型算法和超参数的不同组合进行试验,直到我们获得令人满意的模型性能。这项...

论文推荐:所有 GAN 的性能都一样吗?

正如您现在听说的那样,生成对抗网络是一种能够从生成器和鉴别器之间的竞争中学习分布的框架。生成器学习生成希望与真实数据无法区分的样本,而鉴别器学习分类给定图像是真实的还是虚假的。自...

数据科学面试中应该知道的5个SQL日期函数

一个优秀的 SQL 开发人员是能够以他们喜欢的任何方式操作数据的——其中很大一部分是能够操作日期。因为日期非常重要,比如企业喜欢比较和评估不同时间段的业务绩效,统计一个时段的指标,这...

即席查询引擎对比:我为什么选择Presto

需求背景 即席查询AD-HOC :以单独的SQL语句的形式执行的查询就是即席查询,比如说:HUE里面输入SQL语句并获得结果或者使用dbeaver连接hiveserver2自己键入的SQL代码并获取结果,这样的操作就...

图神经网络的表示方法和使用案例

由于图数据结构无处不在,图神经网络 (GNN) 越来越受欢迎。图使我们能够对科学领域中的许多不同问题进行建模,例如(但不限于)生物学、社会学、生态学、视觉、教育、经济学等。此外,图表示...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部