文档章节

最漫长的一次训练

q
 qinhui99
发布于 2017/08/22 16:37
字数 316
阅读 54
收藏 0

这几天为了参加Kaggle某图像处理比赛,训练了一个大尺寸的u-net模型。一共训练了42轮,每轮3800秒以上,花费了将近48个小时。此外,为了生成提交文件,又额外花费了7个小时。两天半的时间就这样没了。

 

过程之所以这么漫长,是因为精度要求比较高(0.997以上才有希望拿到好的名次)。输入图片尺寸1024*1024,经过实验,只有采用了1024个以上filter的卷积层组成的U-NET,才有可能达到这样的精度。对于这个复杂的U-NET,我的GTX 1060 6G显存的GPU真地吃不消。一个批次最多只能训练两条数据,否则就内存溢出。如果有12G显存的GPU的话,训练时间可以减少一半以上。

 

这次漫长的训练,最大的收获是:学会了耐心等待,确认了带不断衰退的学习率的SGD优化器是可靠的。

------------------------------------------------------------------------------------------------------------

0823,更新

尝试训练1280x1280尺寸的图片,结果一次只能训练一张图片,训练一轮需要5430秒,实在是太慢了。考虑用mxnet方案来替换tensorflow。

 

© 著作权归作者所有

共有 人打赏支持
q
粉丝 63
博文 72
码字总数 32863
作品 0
深圳
程序员
让AI自动调参,才是百度无人车的进化方式:适应环境全靠自己 | 论文

车栗子 发自 凹非寺 量子位 出品 | 公众号 QbitAI  自动驾驶汽车,需要应对各式各样的路况,工作环境是每时每刻在变化的。 所以,训练好L4级的自动驾驶系统并不简单。需要依赖奖励函数 ...

量子位
08/31
0
0
理工男的文科梦 —— LSTM深度学习写春联

笔者作为一名根正苗红的理工男,内心却常常有很多文艺青年才会有的想法,例如写首诗、做首词,甚至包括春节写副对联,空有一番愿望却胸无点墨。随着对机器学习和深度学习的了解,逐渐萌生了使...

biggeng
2017/10/26
0
0
从零开始深度学习-1 TensorFlow的环境搭建

前言 该系列的文章重点不放在理论的研究方面,而是通过实践来不断了解理论。 什么是机器学习 机器学习,顾名思义,让机器去实现人类的学习行为。传统的编程中,如果需要解决一个问题,需要程...

养薛定谔的猫
01/10
0
0
Across the Channel

原文 Debbie hart is going to swim across the English Channel tomorrow. She is going to set out from the French coast at five o'clock in the morning. Debbie is only eleven years ......

Robinson_lu
2015/08/11
0
0
GoogLeNet的心路历程(五)

今年年初的时候,Szegedy写了GoogLeNet的第三篇续作,如下: [v4] Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning,top5 error 3.08% Szegedy读了此论......

Traphix
2016/08/08
0
0

没有更多内容

加载失败,请刷新页面

加载更多

gson1.7.1线程并发导致空指针问题

java.lang.NullPointerExceptionat com.google.gson.FieldAttributes.getAnnotationFromArray(FieldAttributes.java:231)at com.google.gson.FieldAttributes.getAnnotation(FieldAttribut......

东风125
59分钟前
3
0
以太坊RPC接口使用

以太坊RPC接口文档: https://github.com/ethereum/wiki/wiki/JSON-RPC#web3_clientversion 使用方式: 比如我要调用某个合约的balanceOf(address _owner)方法。 因为没有改变合约的状态,所以...

王坤charlie
今天
2
0
C#下的一个好用的日历库(sxtwl_cpp),支持农历转公历,和公历转农历等功能

sxtwl_cpp是寿星天文历的C++版本实现。支持多种语言的绑定 代码首页 懒人包 懒人包使用方法 1、右链工程中的引用-》添加引用-》浏览-》选中dotnet目录下的sxtwl.net.dll 2、生成解决方案-》找...

元谷
今天
3
0
C++基础知识

链接:https://zhuanlan.zhihu.com/p/38399566 本文主要提一下以下三个区别: 引用必须初始化,而指针可以不初始化。 我们在定义一个引用的时候必须为其指定一个初始值,但是指针却不需要。 ...

悲催的古灵武士
今天
3
0
Oracle备份脚本,保留10天数据

@echo off echo 删除10天前的备分文件和日志forfiles /p "D:\oracleback\backfile" /m *.dmp /d -10 /c "cmd /c del @path" forfiles /p "D:\oracleback\backfile" /m *.log /d -10......

lyle_luo
今天
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部