加载中
白话张量 之 对偶空间里的躺平向量长啥样

本篇主要聊一下对偶空间里的对偶向量到底是神马东西,以及引入它的大致缘由。1 上篇回顾 我们回顾一下上次的例子,即一个躺平向量对应的线性函数, 其中上进向量 任意,它在自然基底 下的坐标...

什么是张量?你躺平一下就知道了。

学习里经常出现张量(Tensor),这个概念说平常也很平常,但它背后涉及的数学并不算浅显。 张量这个词在不同领域的人看来貌似有点一词多意。一般来说,你只要知道张量是一个多维数组,差不多...

股市要反弹?Python 帮你选出好股票

首先,看一眼今日的大盘各板块的涨跌云图[1]。一片大红,股市是要反弹了吗? 股市接下来怎么走?不好说,看月线的话,说不定接下来会走熊,当然也可能反弹起来继续走牛。 但不管怎么说,个股...

太巧妙了: 实际跑的 SVD 分解原来是这样实现的

这篇里介绍的核-PCA 算法在不直接提供映射函数的情况下试图实现在高维空间中线性可分。这似乎有点儿 又要马儿跑得快,又要马儿不吃草 的意思。 本篇来看另一个经典算法,随机 SVD 分解。如果...

机器学习基础 - 偏度、正态化以及 Box-Cox 变换

1引言 对于数据挖掘、机器学习中的很多算法,往往会假设变量服从正态分布。例如,在许多统计技术中,假定误差是正态分布的。这个假设使得能够构建置信区间并进行假设检验。因此,在数据预处理...

经典算法回顾 - 快速 get 核-PCA 的要点

引言 在机器学习中,将数据点按行摆放,所有数据点就构成一个矩阵(也可以看成表格、二维数组)。矩阵的一行对应一个数据,矩阵的一列对应一个特征,因此也称为特征矩阵。如下图所示,用矩阵...

异常值检测实践 - Python 代码与可视化

1介绍 .什么是异常值检测? 异常值检测也称为离群值检测、噪声检测、偏差检测或异常挖掘。一般来说并没有普遍接受的定义。(Grubbs,1969)给出的一个早期定义是: 异常值或离群值是似乎与其所...

R 与 Python 双语解读统计分析基础

本系列文章的主要目的是结合 R 和 Python 两种语言的代码来理解统计分析中的一些概念和方法。 主要是理解相关数学概念,不偏倚语言。为了让掌握或学习不同语言的读者都能阅读,本号特提供两种...

用 SVD 修改马氏距离及其应用

马氏距离(Mahalanobis distance)、高斯分布、奇异值分解(SVD)以及主成分分析(PCA)有内在联系。本文用一个简单的示例来揭示这层联系并且掌握它的实际应用。 1装备 library(ggplot2) lib...

为什么多元向量函数的导数是个矩阵

那是因为要求函数可微,而这个要求其实挺高的。 1函数可微性 微积分的基本理念是利用仿射函数对函数进行近似。如果存在线性函数 和向量 ,使得对于任意 ,都有 那么称函数 是一个仿射函数。 ...

新年福利 - 2020 新书好书限时限量大放送

一键打包带走,下载链接 https://cowtransfer.com/s/a59ef991a54d43 下载秘密请后台输入 新书密码 获取

凸优化入门 - 基本概念与 Jensen 不等式

1引言 机器学习中经常会碰到希望优化某个函数值的问题。 例如,给定一个函数 ,我们想找一个 使 取最小值(或取最大值)。具体如最小二乘、逻辑回归和支持向量机等这些问题都可被视为优化问题...

图网络(GNN)前传 : 图与矩阵的兄弟情结

为什么说 Graph 和 Matrix 是兄弟呢?因为它们有同一个爹! 矩阵的历史我们见识过了,知道 Matrix 一词是由英国(废话,这是英文单词,难道由法国人或者德国人首创吗)数学家西尔维斯特(Syl...

特征工程的这些基本功你都会了吗

1引言 特征是什么?为什么需要工程设计? 基本上,所有机器学习算法都是将一些输入数据转化为输出。这些输入数据包括若干特征,通常是以由列组成的表格形式出现。 而算法往往要求输入具有某些...

计算机视觉中的半监督学习(2013-2020)

在过去的几年中,计算机视觉的半监督学习方法一直在迅速发展。当前最先进的方法正在简化体系架构和损失函数方面的现有工作,或者通过混合不同的公式来引入混合方法。 在这篇文章中,我将通过...

UMAP 是怎么把 Hinton 的 t-SNE 淘汰掉的?

1摘要 本文将尝试介绍 UMAP 背后的数学原理及代码实现,并对 t-SNE 与 UMAP 进行详细比较,以探究为什么 UMAP 算法能够更快、更准地抓住数据的全局结构。我们还将尝试使用 Python 从头实现 ...

最优化理论发展简史 - 群英璀璨,全知道就服你!

1古代 希腊数学家解决了一些与其几何研究有关的优化问题。 公元前 300 年,欧几里得(Euclid)考虑了点与直线之间的最段距离,并证明了在给定的总边长下,正方形在矩形中面积最大。 公元前 ...

Kaggle 案例精选 - 附数据和代码

数据表明越来越多的客户放弃使用信用卡,这让银行客户经理们感到不安。如果能预测哪些客户将会流失,他们将会主动向相关客户提供更好的服务,从而挽留客户。 该数据集由 10,000 个客户组成,...

用 SVD 分解直观地看最小二乘法

下面这篇揭示了矩阵的基本子空间理论可以很好地解释降维算法的原理。 从奇异值分解 SVD 看 PCA 实际上,子空间还可以拿来解释线性最小二乘法。我们用一个简单例子来直观地分析最小二乘问题及...

2020/12/09 20:01
935
Python 数据可视化,被 Altair 圈粉了

神奇的Altair 介绍本期主角之前,先给大家一张GIF 是不是很炫酷?更神奇的是,完成这么一幅可交互的图表,仅需不到20行代码。 这幅图是用Python的可视化库Altair绘制的,Altair可以使用强大而...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部