文档章节

轻松上手UAI-Train,拍拍贷人脸识别算法优化效率提升85.7%

UCloudTech
 UCloudTech
发布于 05/10 15:20
字数 1682
阅读 12
收藏 0

“UAI-Train平台可以让我们方便地在短时内使用大量的GPU资源,用较低的成本训练海量的数据集,提高算法模型迭代优化的效率。” — 拍拍贷算法研究员 朱运

UAI-Train是什么

UAI-Train是面向AI训练任务的大规模分布式计算平台,基于P40、V100等GPU云主机集群,通过分布式扩展,最高可实现192TFlops的单精度计算能力。提供一站式训练任务托管服务,可自动化解决计算节点调度、训练环境准备、数据上传下载以及任务容灾等问题,并支持按需收费、成本可控,无需担心资源浪费。在视频图像识别、自然语言处理、语音处理等领域均已有诸多实践。

拍拍贷接入UAI-Train的效果

通过使用分布式GPU训练平台,700W人脸数据的模型训练所需时长可从原先的一周缩短至一天,整体算法优化效率提升85.7%, 相应的迭代频率也提高数倍,为更深层次的模型结构试验提供了可能。同时UAI-Train平台备有大量GPU资源,拍拍贷的算法工程师可以同时探索多种算法模型结构,极大缩短初期算法结构探索的时间。最重要的是UAI-Train平台具备按需收费的特性,拍拍贷人脸识别算法的 GPU资源成本可由原先的上万元/月,下降至数千元/月, GPU资源的有效利用率也达到了100%。

表:UAI-Train与购买GPU资源的特性对比

关于拍拍贷

拍拍贷是一家行业领先的金融科技公司,同时也是一家非常注重技术驱动、强调自主研发的高科技公司。一直以来非常重视AI技术的探索和应用,涉及到计算机视觉、语音分析和建模、自然语言处理、复杂网络分析等针对特定非结构化数据的领域,并将迁移学习、主动学习、强化学习、多任务学习、在线学习、非监督半监督等各种机器学习算法应用至多种业务场景。尤其是人脸识别、OCR、不良中介识别和欺诈团伙挖掘、智能对话机器人、社交文本挖掘等项目,在实际的业务实践中取得了不俗的效果,极大地提升了风险反欺诈水平和运营效率。

人脸识别

人脸识别是拍拍贷AI技术的一个重要研究方向,它通过算法识别人的脸部特征,从而可以做到实时地从图片或者视频流中检测和追踪特定的人。

目前拍拍贷自研人脸识别算法,在700W规模多年龄段、多姿态、多表情、多环境的人脸图片上进行训练。通过尝试不同的网络结构,包含Inception-v3、优化后的resnet等,以及多种损失函数,例如triplet_loss、sphere、cosine、arc_loss等来优化人脸识别算法,从而提升1:1人脸认证、1:N人脸搜索、N:N人脸交叉比对、人脸聚类等场景的识别精度,并将此类技术应用于拍拍贷的风险监控、反欺诈等业务,并发挥了重要作用。

图:人脸识别业务场景

面临的问题

算法人员在优化人脸识别算法的过程中发现**使用单台GPU机器迭代一次算法需要一周左右的时间,**效率过低影响研发进度,但是采购更多的GPU机器来探索不同算法会导致资源成本线性增长;此外由于算法调优工作涉及诸多研究内容,例如算法效果分析、新算法调研、开发等,实际的资源使用率不高。

接触UAI-Train

在一次线下技术交流活动中,拍拍贷技术人员了解到UCloud提供一种面向人工智能算法训练的UAI-Train平台,并支持GPU资源的按需租售服务,同时该平台上还可执行多机多卡的分布式训练任务。

为了提升模型训练的效率,充分高效地利用更多的新数据来进一步提高其准确率,拍拍贷抉择后选择尝试UAI-Train平台。UCloud AI团队在GitHub上发布了适配UAI-Train平台的Insightface开发案例,用于协助拍拍贷的算法工程师很方便地将单机的人脸识别算法转化成支持分布式训练的人脸识别算法,并成功在UAI-Train平台上进行算法的快速优化。

Insightface是GitHub上一个基于MXNet框架的开源人脸识别项目(https://github.com/deepinsight/insightface)。UCloud基于insightface开发了一整套能支持分布式训练的人脸识别训练和在线推理的案例代码,并发布在GitHub上(https://github.com/ucloud/uai-sdk/tree/master/examples/mxnet/insightface),其中包括基于MXNet框架的代码及开发案例。拍拍贷的工程师基于该案例,结合自身人脸识别算法的实现和数据,一周时间内就完成了开发和调试, 并顺利在UAI-Train平台上逐步展开人脸识别算法的训练迭代工作。

图:人脸识别算法接入过程

在多次算法优化迭代尝试后,拍拍贷通过利用高维向量表征人脸,余弦距离表达相似度,最终在开源测试集准确率表现为:lfw 99.8%, cfp_fp 97%, agedb_30 98.2% ,实际业务应用中的准确率高达 99% 以上,进一步提升了风险监管、反欺诈等业务的效率。

后续拍拍贷和UCloud计划在更多算法场景和应用场景展开深入合作,更好地服务于金融领域客户。

对人工智能更多应用场景和解决方案感兴趣的,欢迎扫描下方二维码进群交流。

TIC 2019报名火热进行中,欢迎扫描下方二维码或点击阅读原文加入我们,共同探讨企业上云的更多落地案例!

© 著作权归作者所有

UCloudTech
粉丝 18
博文 58
码字总数 134190
作品 0
私信 提问
人工智能的“咖啡”,“调和”后的味道很提神

作者 | 张戈 (公众号ID:TechECR) 人工智能很是感性,似乎无所不在,也无所不能;人工智能又很理性,涉及数据、计算、算法、场景等一系列复杂逻辑,环环相扣,且缺一不可。 李世石和柯杰,...

张戈BP
2018/07/04
0
0
UCan下午茶 悟有所值——用云的方式快速落地你的AI梦想

活动简介: 如今,人工智能技术已经渗透到生活中的方方面面,国内外大多数企业都已离开“尝鲜期”进入“AI落地期”,各种形式的人工智能部门甚至研究院亦如雨后春笋般应运而生。 那么,具体到...

UCloudTech
2017/11/28
15
0
[上海]中国第一家网络P2P借款平台拍拍贷招聘开发经理,月薪10K~20K

公司介绍: 上海厦众信息技术有限公司旗下的拍拍贷(ppdai.com),成立于2007年8月,是中国第一家P2P(个人对个人)信用网上借贷平台。拍拍贷的团队是一个充满激情和梦想的团队。创始团队来自...

张俊
2011/12/12
1K
14
UCan下午茶 悟有所值——用云的方式快速落地你的AI梦想

活动简介: 如今,人工智能技术已经渗透到生活中的方方面面,国内外大多数企业都已离开“尝鲜期”进入“AI落地期”,各种形式的人工智能部门甚至研究院亦如雨后春笋般应运而生。 那么,具体到...

UCloudTech
2017/11/28
25
0
迅雷发布星域云和迅雷链开放平台;智付支付被罚超4000万 | AI金融评论日报

迅雷发布星域云和迅雷链开放平台 雷锋网消息,迅雷发布星域云和迅雷链开放平台,迅雷CEO陈磊宣布,迅雷将把预留的3亿运营链克用于扶持迅雷链开放平台上的开发者,以推动国内区块链技术在实际...

徐晓飞
2018/05/17
0
0

没有更多内容

加载失败,请刷新页面

加载更多

nginx学习笔记

中间件位于客户机/ 服务器的操作系统之上,管理计算机资源和网络通讯。 是连接两个独立应用程序或独立系统的软件。 web请求通过中间件可以直接调用操作系统,也可以经过中间件把请求分发到多...

码农实战
57分钟前
5
0
Spring Security 实战干货:玩转自定义登录

1. 前言 前面的关于 Spring Security 相关的文章只是一个预热。为了接下来更好的实战,如果你错过了请从 Spring Security 实战系列 开始。安全访问的第一步就是认证(Authentication),认证...

码农小胖哥
今天
8
0
JAVA 实现雪花算法生成唯一订单号工具类

import lombok.SneakyThrows;import lombok.extern.slf4j.Slf4j;import java.util.Calendar;/** * Default distributed primary key generator. * * <p> * Use snowflake......

huangkejie
昨天
11
0
PhotoShop 色调:RGB/CMYK 颜色模式

一·、 RGB : 三原色:红绿蓝 1.通道:通道中的红绿蓝通道分别对应的是红绿蓝三种原色(RGB)的显示范围 1.差值模式能模拟三种原色叠加之后的效果 2.添加-颜色曲线:调整图像RGB颜色----R色增强...

东方墨天
昨天
10
1
将博客搬至CSDN

将博客搬至CSDN

算法与编程之美
昨天
12
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部