OpenMLDB 社区于近期邀请了社区的贡献者和使用者举行了十一月份的社区会议。本次会议主要总结了 OpenMLDB 0.3.0 版本的更新,以及讨论 0.4.0 版本的几个重要需求规划。同时,社区成员对于 OpenMLDB 后续的需求和社区发展规划提供了宝贵的建议。
社区反馈
会议上,社区小伙伴们对于 OpenMLDB 项目和社区的发展提供了很多宝贵的建议,主要记录如下:
- Benchmark 不仅需要和现有工具的比对,而且需要明确 OpenMLDB 本身的能力边界,比如数据承载量,具体场景下的性能能力等。
- 监控模块是企业上线非常重要的功能,OpenMLDB 的监控模块需要关注系统健康状态和性能指标等多方面。
- 长时间窗口的实现和优化需求
- 关于 materialized view 的支持需求
- 在某些特殊场景下,数据量特别大的情况下,在线模块性能会有较为严重的下降
- 分布式一致性需要更好的文档说明(目前是最终一致性),未来可能需要考虑更强的一致性需求
0.4.0 需求 RFC
同时,社区对于下一个版本 0.4.0 的主要需求进行了讨论,并且完善了需求的 RFC。几个重要的 RFC 简单介绍如下,欢迎各位小伙伴前往相关页面评论反馈。
- 完善 SQL CREATE INDEX 的能力: Fully functional "create index" SQL statement · Discussion #693 · 4paradigm/OpenMLDB
- 支持系统数据库和系统表: Supporting system databases and tables · Discussion #700 · 4paradigm/OpenMLDB
- Github CICD 流程优化: GitHub Workflow Reorganize · Discussion #691 · 4paradigm/OpenMLDB
- 编译过程优化: Complication Improvement · Discussion #688 · 4paradigm/OpenMLDB
- Demo 镜像优化: https://github.com/4paradigm/OpenMLDB/discussions/687
- SQL 操作支持 HAVING 和 LIKE: https://github.com/4paradigm/OpenMLDB/discussions/686
- 基于 CLI 的统一离线 SQL 开发: https://github.com/4paradigm/OpenMLDB/discussions/713
- 基于 CLI 的 Spark Task Manager 模块: https://github.com/4paradigm/OpenMLDB/discussions/732