“隐语”框架开源SCQL,让隐私计算更易用、更友好

2023/03/29 21:02
阅读数 128
3月29日,首届“隐语开源社区开放日”活动上,隐私计算开源框架“隐语”宣布产品升级,并开源了SCQL功能。
SCQL提供的简单易上手的BI分析,可帮助中小机构快速解决急迫的长尾数据安全分析需求,在工业界首次实现了隐私数据从Al分析到BI分析,是隐语走向易用的重要一步。
“隐语”框架负责人王磊发布“隐语”SCQL系统
在数据要素战略持续升级的背景下,发展以隐私计算为代表的密态技术,是解决大规模数据安全可信流转的技术手段。
由于隐私计算最早诞生于大规模数据场景,技术架构和资源投入对于小规模数据体量的机构来说相对复杂和奢侈,比如动辄百亿千亿数据规模的隐私保护机器学习,对于中小机构来说并不适用,如何简单快捷高性价比地使用隐私计算技术,提高易用性,一直是隐私计算行业待突破的技术难题之一。
围绕共建更好用的隐私计算技术和更健康的生态,“隐语开源社区开放日”活动现场,开发者、应用方、学术专家们展开了讨论。“隐语”开源框架负责人王磊重点介绍了“隐语”框架最新升级并开源的重磅功能SCQL。这是将业界常用的隐私计算技术多方安全计算(MPC)作为底座,以当前主流的SQL作为分析语言的多方安全数据分析系统,可让用户简单易上手地实现多方数据密态分析任务,能有效满足中小机构低成本使用隐私计算分析的需求。
隐语SCQL(Secure Collaborative Query Language),技术要点如下:

-以 SQL为使用接口,基于隐语MPC内核SPU构建,支持多方联合数据分析;
-支持虚拟库、虚拟表、用户等抽象,方便进行分项目与分表的合作项目权限管控;
-支持字段级别的数据权限控制机制(CCL);
-支持上游平台集成系统 API,封装独立的产品;
-支持常用算子:JOIN, GROUP BY, 支持聚合类函数(sum/min/max/avg)、算术类算子(+、-、*、/、INTDIV)、比较类算子(<、 <=、 >、 >=、=、!=)和 IN等算子与函数;

聚焦多方数据联合分析的场景, 隐语基于MPC技术内核的底层抽象SPU设备,创新实现了一种 SQL 多方安全分析语言 "SCQL"。
这种语言继承了 SQL 作为常用数据分析语言的普及性、易学性和高成熟度,同时还拓展了标准 SQL 的语义,可以描述基于多个数据源的安全计算,通过“SELECT FROM”、“JOIN ON”、“GROUP BY”等语句的组合搭配,即可完成联合分析的统计结果生成。
具体展开:
  • 从使用与集成上: 方便接入用户的本地数据源,使用方式和体感与传统SQL无异,且提供简单易用的 API 接口,便于集成封装,低成本满足业务中的多方数据协同分析需求;

  • 从数据访问控制上: 利用隐语CCL (Column Control List) 权限控制机制,参与方对数据授权的控制颗粒度可精细到「字段(列)」,在不同的场景、不同的联合项目中,可以根据不同数据字段(列)的价值区别,进行精准的使用与控制;

  • 从功能范围及灵活度上: 灵活支持SQL常用数据源,降低数据协同前的匹配成本(内置支持MySQL,且未来还计划支持postgres、Hive 和 csv等数据源);支持大部分常用数据分析算子&函数;既支持小而快、高频率为主要诉求的在线查询,也支持更复杂、侧重业务决策诉求的离线分析

  • 从计算性能上: 首个工业级多方安全数据分析系统,继承了传统数据库中Query下推等重要优化手段,在联合的多方数据分析中同样实现提前过滤数据、减少网络传输,降低了MPC计算的性能开销。

当前隐私计算在全球范围内都处于攻坚阶段,行业正在通过开源开放的方式,降低技术门槛,加速技术普及。
2022年7月,“隐语〞框架正式开源,覆盖了几乎所有主流隐私计算技术路线。本次“隐语〞开源框架升级是提升技术可用易用的又以一重要动作。隐语开源社区也将发布SCQL的共建任务,希望广大开发者参与进来,共同持续建设完善这一功能,共建隐私计算技术生态。

本文分享自微信公众号 - 支付宝技术(Ant-Techfin)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
0 评论
0 收藏
0
分享
返回顶部
顶部