加载中
凸优化整理

凸集 在最优化范畴中,凸优化问题是一类比较常见的,性质很好,很多时候可以帮助我们解决非凸问题的工具。 如果一个凸函数min f(x),它的可行集x∈S,S是一个凸集合,如此一般来说我们就认为这...

cos
11/25 11:27
538
复数整理

复数的三角表示 复数是由实部和虚部组成的数: z=a+bi (i^2=-1),其中a为实部,b为虚部。 复平面: Z(a,b) 这是一个平面直角坐标系,但是复数也可以用极坐标来表示,如:Z(ρ,θ) 其中的ρ代...

cos
11/22 11:30
455
卷积的意义

卷积公式 卷积在数学上的表达如下 这是两个函数组合的反常积分。我们用这样一个例子来说明,就是一个人一天的进食和消化情况。 这个f(t)函数代表了进食,横坐标代表着进食的时间,纵坐标代表...

11/17 08:52
485
图像分类语义特征降维可视化

T-SNE降维 在我们的CNN中,卷积神经网络用来提取图像的特征,全连接层用来进行线性分类。 在上图中,全连接层最后一层有5个神经元,代表5维的向量,就是原图的语义特征。最后一层是线性分类器...

11/11 17:59
114
YOLO系列介绍(三)

接YOLO系列介绍(二) YOLOV7 YOLOV7是YOLOV4的原班人马于2022年提出的最新的YOLO版本。 YOLOv7 的在速度和精度上的表现也优于 YOLOR、YOLOX、Scaled-YOLOv4、YOLOv5、DETR 等多种目标检测器。...

11/07 15:45
438
模式识别整理

模式识别介绍 模式:指需要识别且可测量的对象的描述。 这些对象与实际的应用有关,如:字符识别的模式——每个字符图像;人脸识别的模式——每幅人脸图像。 模式识别:利用机器(计算机)模仿...

ONNX整理

ONNX(Open Neural Network Exchange)——开放神经网络交换格式,作为框架共用的一种模型交换格式,使用protobuf二进制格式来序列化模型(protobuf序列化可以参考Netty整合Protobuffer ),可以...

PP-Structure版面分析、表格识别使用指南

版面分析 版面分析指的是对图片形式的文档进行区域划分,定位其中的关键区域,如文字、标题、表格、图片等。 在上图中,最上面有图片区域,中间是标题和表格区域,下面是文字区域。 命令行使...

SVTR文字识别模型介绍

一般的文字识别会包含两个阶段,一个是CNN,一个是RNN,可以参考PaddleOCR使用指南 中的CRNN 文字识别。这种架构虽然准确,但复杂且LSTM的效率较低,很多移动设备对LSTM的加速效果并不好,所...

迁移学习

迁移学习指的是在相同的模型下,我们在某一份数据上学习的知识可以应用到另外一份数据上去。也就是在某一个场景下学习的知识应用到另外一个场景,这两个场景间不同但是相关。 上式中的称为源...

Grad-CAM热力图可视化

原理篇 Grad-CAM热力图可视化属于深度学习可解释性的研究范畴。深度学习常被认为是一种黑盒的操作,对于图像分类来说,最终它的依据是什么,我们需要进行可解释性的探究。对于上图中的狗和猫...

安卓开发整理

先来一个HelloWorld. XML布局文件 <?xml version="1.0" encoding="utf-8"?> <!--线性布局--> <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" android:layout_w...

PaddleOCR使用指南

首先是安装飞桨,然后是安装paddleocr pip install "paddleocr>=2.0.1" 对图像进行识别 from paddleocr import PaddleOCR, draw_ocr from PIL import Image if __name__ == '__main__': ocr...

飞桨paddle技术点整理

前面的步骤跟乌班图安装Pytorch、Tensorflow Cuda环境 是一样。 安装GPU版本的paddle python -m pip install paddlepaddle-gpu==2.3.1.post116 -f https://www.paddlepaddle.org.cn/whl/lin...

深度学习网络模型的改进与调整

更换骨干网 MobileNet V2 MobileNet V2可以作为一些深度学习网络应用的骨干网使用。 MobileNet V2的主要贡献是一个新颖的层模块:具有线性瓶颈的倒残差(inverted residual):该模块将低维压缩...

MMOCR使用指南

MMOCR是通用视觉框架OpenMMLab的光学字符识别器。 安装配置环境 MMOCR github主页:GitHub - open-mmlab/mmocr: OpenMMLab Text Detection, Recognition and Understanding Toolbox pip inst...

信息论整理

信息论研究的目的和范畴 通信系统模型 古人近距离用语言来传递信息,远距离用手势、烽火来传递信息;现代人用各种通讯工具(电话、互联网)来传递信息。它们的手段不同,但是目的是相同的,都是...

07/16 10:14
525
DETR介绍

DETR是facebook发表于ECCV2020的使用Transformers进行端到端的目标检测的框架。 DETR只需要使用CNN提取图像特征,再单独使用Transformer就可以预测出目标边界框和分类。它不需要非极大值抑制...

07/05 06:44
388
半监督学习

半监督学习指的是结合了少量的有标记数据和大量无标记数据来完成训练的过程。 在某些特定领域,大量有标记的数据很少也很难标注。 比方说,我们现在有一个公开数据集,它全部都是有标注的。此...

07/02 08:57
1.9K
深度学习之三维重建

基于MVS的三维重建基础 三维信息表示方法 一般分为深度图/视差图、点云、网格。它们都是表达3D信息的一种方式,会根据实际应用场景不同来选取不同的方式来表示。比如说做一些背景序化、人脸特...

06/30 08:42
526

没有更多内容

加载失败,请刷新页面

返回顶部
顶部