当前,反诈已经成为了一项全民参与的行动。在支付宝,人们给疑似诈骗账号转账时,就会在输入账号的0.1秒内接到一个电话,提醒你正在遭遇诈骗。迅速识别风险阻止诈骗发生,这背后,图计算技术发挥了至关重要的作用。
图,英文为Graph,是用来表示对象和对象之间关联关系的数据结构。图计算即以图数据模型来完整地抽象和分析数据之间关联关系的计算过程,是人工智能领域的前沿技术,也是目前为止最接近人脑建模的技术。
在蚂蚁集团的金融风控场景中,图计算技术的应用显著提升了欺诈洗钱等金融风险的实时识别能力和审理分析效率,成为了守护用户利益的重要堡垒。
当然,它的能力不光识别诈骗。
如果说人工智能是现代科学的“皇冠”,以图计算为代表的底层技术,可以说是皇冠上的“明珠”。蚂蚁有一支团队,专门从事这颗“明珠”的“雕琢”,赤宵和桥七就是其中的成员。小编和他们聊了聊,这项技术背后的故事。
解决看似不可能的问题
2015年,蚂蚁集团启动图数据库开发,开始了图计算技术的布局。次年蚂蚁自研的图数据库版本GeaBase1.0正式上线,接入支付宝链路并第一次参与当年的双11。2017年,图数据库经历新春五福大考,关系网络和可信体系的数据突破千亿条,成为支付宝主链路中不可或缺的关键技术。
如今,赤宵是这个团队的重要成员。
赤宵(上排左三)参加团队活动
28岁清华博士毕业后,赤宵在微软亚洲研究院工作了6年,从事分布式计算机和大规模机器学习,之后一直在图相关技术领域开展研究。2016年,赤宵和他清华的博士同学,在导师陈文光的支持下共同成立了费马科技公司,以清华图计算学术研究作为支撑,发布了支持超大规模图数据快速处理的图计算产品。
技术不等于产品,技术能实现多大的价值,需要真正地用起来。所谓,“产学研结合”,最后的产业化实现这一关,对于技术价值的衡量至关重要。
源于对产、学、研结合的向往, 2020年赤宵和费马科技核心团队加入了蚂蚁图计算团队,他们有一个共同的愿望,就是希望推动图计算技术的广泛应用,让这项技术真正达到世界第一的综合水准。而蚂蚁集团在图计算领域深耕多年,拥有深厚的研发实力和丰富的应用场景,赤宵和团队希望能在蚂蚁发挥这项技术应有的价值,“图计算其实真的能解决很多事情。”
2020年,蚂蚁图计算团队推出了大规模图计算平台TuGraph。TuGraph全面协助支付宝完成了风控体系升级,实现反欺诈从个体防控到群体识别再到团伙成员的精准识别,达到了时序图计算能力上限。TuGraph也于当年通过了信通院大数据产品能力评测。
“在蚂蚁,图计算的技术魅力得到了很大的释放”,赤宵说。
比如,在反欺诈场景。“因为我们尽可能在风险转账行为发生之前进行拦截”,需要对海量数据进行在线实时分析,也对系统提出了很高的要求,但蚂蚁自研的TuGraph集齐了图计算最优性能之大成,集合了实时和时序大规模图分析能力,具备毫秒级处理延时,解决了这个“看似不可能的问题”。对于反欺诈和反洗钱等复杂问题的分析,图计算技术深入到了这些应用场景的毛细血管。
去年开始,赤宵和团队开始了一些共建行业的项目,比如携手ISO/IEC JTC/SC32/WG3工作组,参与ISO GQL图数据库标准语言标准制定,提供图查询语言的方案建议,为行业生态圈建设提出建设性意见。
作为布道者,赤宵也把蚂蚁图计算技术经验输出到了越来越多的行业,得到了很好的落地。就在2021年,蚂蚁TuGraph入选了IDC推荐的主流图数据库供应商。去年底,图计算团队实现了基于完美哈希的实时图存储,大幅提升图数据库查询性能,这一设计在业内属于首创,同时也是理论上最高效的图存储模型。赤宵表示,新的存储系统有望于今年上半年推向生产系统。
因为现在带着一个团队在做更具体的事,赤宵的目标比较简单纯粹,就是持续优化图计算的性能。长远来看,赤宵希望图计算在更多场景发挥作用,去开拓我们认知之外的领域。
用起来,技术会发光
“好的技术不发论文非常可惜。”这是桥七的感慨。
今年32岁的桥七,是赤宵的师弟,本科、硕士、博士都出自清华,坊间把桥七这样的人才统称为“三清团”,他也经常被团队同学调侃是 “三清团”青年代表。
生活中桥七热爱户外活动
桥七介绍,图计算第一次被广泛讨论,是2010年谷歌发表的一篇相关论文。近年来,图计算虽然在技术开发和应用层面高速发展,但鲜少有影响力的学术成果。图计算在蚂蚁的应用已经迈入了非常成熟的阶段,但“我们蚂蚁的同学不是很喜欢发论文,这么好的技术积累却少见学术研究非常可惜”,桥七希望把蚂蚁的图计算成果推向学界。
技术用在今天,也要看到明天。
作为一项前沿性的技术,学术研究领域对于技术的判断往往比应用场景更具前瞻性,图计算团队也少不了智囊团的战略性输入。桥七的另一个重要工作,就是用新的、系统的研究,为业务团队从实际角度提供策略性建议,站在整体和复盘性的视角对于技术的使用进行分析,做出一套符合时代需求的技术设计。“当下的业务往前走,对技术提出的挑战也是往前走的,但做技术研究要更加往前看,到时再解决就手忙脚乱了”。
桥七总结了一套兼顾“当下”和“未来”的工作方法:做产品需要从业务角度考虑问题,客户第一。很多情况下为了满足业务需要,论文里的技术用就要费点劲,需要结合实际情况考虑很多事情。研究、发论文和做好产品,需要侧重的方面很不一样。应该想办法把做得好的事情转化成商业化的场景。“做好场景跟发一篇好的论文还挺不一样的。”
当然,这种方法的落地过程并非一帆风顺。桥七曾经向业务部门提出过一套新型系统,各项系数、POC结果业务方认可,但也遇到了问题,现有的系统能够满足业务需求,新系统替换会产生一定的风险,产品可以做到完美,但实际应用可能只需要80%。所以,技术要走出实验室,在应用场景中用起来,才知道它的边界和价值有多大。
目前,蚂蚁的图计算系统已经在能源、金融、工业、政务服务行业得到了应用,但这距离图计算团队的技术理想还有一定差距。
“业界现有的产品和技术应用距离目标还有很大发展空间。并且图计算在整个社会的应用和感知还不够广,可能常常出现在分析师报告、某些厂商的文章里,但是一些社会问题,比如流行病传播、社会治安管理等”,都是图计算技术能大放异彩的领域。
后记
科研,是创新的源动力。
产、学、研结合,必将迎来科研的“黄金时代”,实现产业化转化,真正做到“科技为人”。
本文分享自微信公众号 - 支付宝技术(Ant-Techfin)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。