文档章节

最漫长的一次训练

q
 qinhui99
发布于 2017/08/22 16:37
字数 316
阅读 167
收藏 0

精选30+云产品,助力企业轻松上云!>>>

这几天为了参加Kaggle某图像处理比赛,训练了一个大尺寸的u-net模型。一共训练了42轮,每轮3800秒以上,花费了将近48个小时。此外,为了生成提交文件,又额外花费了7个小时。两天半的时间就这样没了。

 

过程之所以这么漫长,是因为精度要求比较高(0.997以上才有希望拿到好的名次)。输入图片尺寸1024*1024,经过实验,只有采用了1024个以上filter的卷积层组成的U-NET,才有可能达到这样的精度。对于这个复杂的U-NET,我的GTX 1060 6G显存的GPU真地吃不消。一个批次最多只能训练两条数据,否则就内存溢出。如果有12G显存的GPU的话,训练时间可以减少一半以上。

 

这次漫长的训练,最大的收获是:学会了耐心等待,确认了带不断衰退的学习率的SGD优化器是可靠的。

------------------------------------------------------------------------------------------------------------

0823,更新

尝试训练1280x1280尺寸的图片,结果一次只能训练一张图片,训练一轮需要5430秒,实在是太慢了。考虑用mxnet方案来替换tensorflow。

 

q
粉丝 66
博文 73
码字总数 34091
作品 0
深圳
程序员
私信 提问
加载中
请先登录后再评论。
训练过程——使用命令行参数

   大多数神经网络训练过程都是比较漫长的,为了避免过程中发生意外导致训练结果丢失,我们需要采用保存训练过程的方法。另外,物品们无法预知多少次训练才能达到合适的准确率,所以往往要...

osc_65w0uouu
2019/07/22
2
0
用tensorflow迁移学习猫狗分类

笔者这几天在跟着莫烦学习TensorFlow,正好到迁移学习(至于什么是迁移学习,看这篇),莫烦老师做的是预测猫和老虎尺寸大小的学习。作为一个有为的学生,笔者当然不能再预测猫啊狗啊的大小啦...

osc_estmv3bi
2018/04/19
7
0
训练要念动一致

什么是念动一致? 念动一致英文翻译为 “mind muscle connection” 字面意思是精神和肌肉建立连接。当然很多人看到这个翻译真的是不能理解这到底是个什么鬼,是不是专门发明出来忽悠人的词。...

BryceLoski
2019/06/21
69
0
拜托了,给初级码农一次机会吧

国庆前,投递了N份简历,感觉全部石沉大海,陷入了漫长的等待和猜想中,得出一个结论:基本没戏!应届生不敢奢望有太高的待遇,但求能够在大城市中养活自己,真心是抱着一颗学习的心态来的。...

君子之耀
2013/10/04
1.7K
18
让AI自动调参,才是百度无人车的进化方式:适应环境全靠自己 | 论文

车栗子 发自 凹非寺 量子位 出品 | 公众号 QbitAI  自动驾驶汽车,需要应对各式各样的路况,工作环境是每时每刻在变化的。 所以,训练好L4级的自动驾驶系统并不简单。需要依赖奖励函数 ...

量子位
2018/08/31
0
0

没有更多内容

加载失败,请刷新页面

加载更多

题解-洛谷P4724 【模板】三维凸包

洛谷P4724 【模板】三维凸包 给出空间中 \(n\) 个点 \(p_i\),求凸包表面积。 数据范围:\(1\le n\le 2000\)。 这篇题解因为是世界上最逊的人写的,所以也会有求凸包体积的讲解。 三位向量的...

osc_srnunz15
44分钟前
11
0
关于RNN (循环神经网络)相邻采样为什么在每次迭代之前都需要将参数detach

关于RNN (循环神经网络)相邻采样为什么在每次迭代之前都需要将参数detach 这个问题出自《动手学深度学习pytorch》中RNN 第六章6.4节内容,如下图所示: 当时看到这个注释,我是一脸懵逼,(...

osc_rl6hs0bo
44分钟前
11
0
为什么 wait 方法要在 synchronized 中调用?

作者:Yujiaao https://segmentfault.com/a/1190000019962661 一个有难度的 Java 问题,wait 和 notify。 它们是在有 synchronized 标记的方法或 synchronized 块中调用的,因为 wait 和 no...

Java技术栈
45分钟前
18
0
【退役贴】真·蒟蒻的acm感悟&回忆

窝是一只打过铁费了很大力气仍然只能大四拿铜的辣鸡的辣鸡的辣鸡…… 窝是一只打过铁费了很大力气仍然只能大四拿铜的辣鸡的辣鸡的辣鸡…… 窝是一只打过铁费了很大力气仍然只能大四拿铜的辣鸡...

osc_sqfqhs81
45分钟前
14
0
查询反模式 - GroupBy、HAVING的理解

为了最简单地说明问题,我特地设计了一张这样的表。    一、GROUP BY单值规则   规则1:单值规则,跟在SELECT后面的列表,对于每个分组来说,必须返回且仅仅返回一个值。   典型的表现...

osc_n87a5jpv
46分钟前
11
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部