滴滴滴~ MatrixOne今年再次参与由中科院软件所“开源软件供应链点亮计划”发起的开源之夏啦!
希望这个夏天,MatrixOne 能陪伴同学们一起参与开源软件的开发维护,培养和发掘出更多的优秀在校开发者,也希望能吸引更多同学陪伴我们一同成长~
加入MatrixOne开源项目,您可以深入了解数据库产品架构知识,近距离学习如何从零打造数据库软件,更有机会与MO技术大牛一起并肩作战,共同开发一个数据库模块,成为社区的核心贡献者!
MatrixOne项目介绍
在2023开源之夏活动中,我们准备了3个项目。成功通关结项的同学可以获得奖金与荣誉证书,同时也有可能掉落工作机会哦~
项目01 数据库机器学习及 AI 的 Python 嵌入
将 Python 嵌入到 MatrixOne 数据库中,使 Python 能够与数据库执行引擎通信,从而实现在数据库中使用ML/AI。Python 将在容器/沙箱中运行,以实现安全性和资源管理。
Python 工作负载将成为 MatrixOne 数据库的一等公民,这意味着查询优化器/执行器将像关系型数据库操作符一样优化/调度 Python,在并行/分布式环境中运行。
*Bonus:如果能够创建开发环境,使开发人员能够在 VSCode 中编码/调试,并且一键部署在TB级数据的数据库中,则会获得额外加分。
项目难度:进阶
产出要求:
- 实现定义和管理 Python UDF 的 SQL 语法;
- 实现在沙箱中安全地执行 Python UDF;
- (Bonus) 支持在 IDE 中调试和部署 Python UDF。
技术要求:
- 熟悉 Golang 和 Python;
- 了解容器技术。
导师信息:
吴叶磊 :wuyelei@matrixorigin.cn
申请链接:https://summer-ospp.ac.cn/org/prodetail/23b4d0427
项目02 为 MatrixOne 混沌自动化测试工程注入故障工具及模块
基于当前业界混沌测试相关的理论以及相关开源工具,实现基于分布式系统的混沌测试自动化能力,主要包括如下核心模块和能力:
- 故障注入模块,基于开源或定制开发的故障注入工具,可实现基于配置策略,自动向被测系统进行故障/错误注入,故障/错误恢复以及详细的持久化日志记录。
- 执行器模块,提供一些列标准的接口或配置等,实现一个统一的执行器可执行、监控各种异构的测试工具和测试场景。
- 结果分析模块,对故障注入/恢复数据、测试场景执行过程和结果数据进行分析并进行可视化展示。
项目难度:基础
产出要求:
- 项目成果至少满足可执行分布式MO的混沌测试,其他分布式系统可暂不做强要求;
- 详细的使用/实施文档,包括环境配置要求、详细安装/部署/配置手册等。
技术要求:
- 编程能力不限制,熟悉go/java/python任意即可,最好熟悉go编程;
- 了解容器云相关技术栈,如k8s、docker等。
导师信息:
苏动 :sudong@matrixorigin.cn
申请链接:https://summer-ospp.ac.cn/org/prodetail/23b4d0428
项目03 物联网和流媒体数据的高级数据类型和功能
设计并实现GIS、时间序列的数据存储格式及核心函数(这些功能后续将被集成到一个流式数据框架中)。要求存储格式能支持非常高的流量;能够加载数千条(或更多)的输入数据流;支持高效的查询技术(例如 GIS 中的距离和交集,以及时间序列数据的流算法);能基于流数据开发高级在线草图算法。
项目难度:进阶
产出要求:
- 研究和学习:鼓励参与学生研究和学习现有的GIS和时间序列数据格式、存储系统和查询技术。这将帮助他们了解当前的技术水平,并找到可以改进的领域。
- 设计存储格式:一同设计一个可以高效处理大量GIS和时间序列数据的存储格式。该格式应在存储空间和查询性能方面进行优化。
- 实现查询技术(取决于进度):帮助参与学生开发GIS和时间序列数据的高效查询技术。这可能涉及实现距离和交集计算的算法,以及时间序列数据的流式算法。
- 测试和评估:协助参与学生测试和评估存储格式和查询技术的性能。这可能涉及与现有解决方案进行基准测试,并找到改进的领域。
- 文档编写:鼓励参与学生记录他们的工作,包括存储格式的设计、实现的查询技术和开发的草图算法。这将使其他人更容易理解和基于他们的工作进行构建。
技术要求:
- 熟悉 Golang;
- 最好熟悉流计算和time-series data。
导师信息:
岳远源 :gyue@outlook.com
申请链接:https://summer-ospp.ac.cn/org/prodetail/23b4d0456
MatrixOne社区介绍
MatrixOne是一款面向未来的超融合异构云原生数据库管理系统。通过全新设计和研发的统一分布式数据库引擎,能够同时灵活支持OLTP、OLAP、 Streaming等不同工作负载的数据管理和应用,用户可以在公有云、自建数据中心和边缘节点上无缝部署和运行。
MatrixOrigin 官网: 新一代超融合异构开源数据库-矩阵起源(深圳)信息科技有限公司 MatrixOne