闪光的实习生|StoneDB第一届实习生访谈录:想做数据内核研发,需要学什么?

2023/09/20 18:10
阅读数 109

闪光的实习生们

实习生访谈实录

@StoneDB研发部 

VOL.1


2023 年的暑期已经结束了,在这个暑期里,杭州石原子科技有限公司迎来了第一届实习生。其中 StoneDB 团队凭借在开源数据库社区的影响力,吸引了一大批有志于从事数据库内核研发的同学们,他们分别来自浙江大学、电子科技大学、中国科学技术大学、杭州电子科技大学、佐治亚理工学院(GT)、慕尼黑工业大学(TUM)等国内外知名高校。石原子科技始终保持对优秀人才的渴望并期待能够培养出一批优秀的国产数据库内核研发人才,随着同学们的实习陆续接近尾声,我们对部分实习同学进行了采访,来听听同学们真实的实习感受吧~


QUESTION.

本次实习学到了什么?

总结本次实习经历?

对于即将走入研发岗位的其他同学,有何建议?


听他们说 ——

ANSWER.


叶子骁

·慕尼黑工业大学

·信息学-硕士

采/访/实/录

INTERVIEW RECORD

Q1

你在实习期间的工作内容是什么?

"StoneDB的内核研发及相关函数支持"

Q2

总结一下你的实习经历吧?

"在StoneDB实习的这段时间我主要是做StoneDB内核相关函数的支持和实现,通过debug上手项目,阅读源码,加深了对数据库内核的理解。在实习期间导师对我的帮助很大,会定期组织实习生进行技术分享会,学习数据库内核不同组件的功能和实现原理,阅读源码。"

Q3

你对即将走入职场做数据库内核研发或者其他研发岗位的同学们有什么建议?

"如果打算走入数据库内核开发领域,首先要学习数据库理论和基础知识,掌握关系型数据库的基本概念、SQL 查询语言、事务管理、索引和查询优化等方面的知识。其次要多参与开源项目的贡献,通过开源项目获得宝贵的实际经验,学习编写数据库系统的核心代码。同时也要多阅读数据库领域的相关论文和书籍,了解数据库系统的最新发展和技术趋势。此外还可以尝试构建自己的项目,在学习和实践的过程中尝试动手构建小型数据库项目。总而言之,数据库内核开发需要热情和耐心,坚持不懈地学习和努力才能更好地在数据库领域有所建设。"



罗中天

·浙江大学

·软件工程-硕士

 你在实习期间的工作内容是什么?

实现基于内存的列式存储引擎rapid和修改StoneDB V2.0的 bug

请用一句话总结一下你的实习经历吧~

完成了实际的数据库内核的需求,实现了从阅读源码到动手改源码的飞跃。

你对即将走入职场做数据库内核研发或者其他研发岗位的同学们有什么建议?

1、多多阅读源码,源码面前没有秘密。

2、通过阅读顶会论文等方式了解一下新兴技术和行业动态。



徐鑫强

·电子科技大学

·计算机技术-硕士

采/访/实/录

INTERVIEW RECORD

Q1

你在实习期间的工作内容是什么?

“实习期间参与stonedb-5.7-v1.0.4版本的开发工作,对已有代码进行维护和优化,增强系统稳定性,我主要做了以下工作:

• 修复当前版本的bug,如在有常量查询寻下使用inner join连接谓词导致的crash等等。

• 参与StoneDB V2.0的数据类型转换的接口开发工作。”

Q2

总结一下你的实习经历吧?

“实习期间得到了李浩老师、丁奇老师的指导帮助,从最开始的无从下手到后来慢慢能看懂源码、定位问题、独立修改bug,这个过程中掌握了很多有用的技能方法,不管是常用的Git、Linux命令,还是对StoneDB源码的SQL处理逻辑的理解,都学到了不少。总的来说,这段经历还是有帮助的、有意义的。”

Q3

你对即将走入职场做数据库内核研发或者其他研发岗位的同学们有什么建议?

“打好基础,理论与实践并行,先掌握基本的数据库理论,再去写代码磨练。”




王若添

·中国科学技术大学

·软件工程-硕士

 你在实习期间的工作内容是什么?

参与StoneDB V2.0版本的研发和测试;参与 tianmu_rapid 二级引擎设计与研发.

请用一句话总结一下你的实习经历吧~

参与了数据库在真实工业界的开发,增长了排查和解决复杂问题的能力,把在学校里和书本上学习到的数据库理论知识落到了实处,开阔了技术眼界.

你对即将走入职场做数据库内核研发或者其他研发岗位的同学们有什么建议?

尽早参于工业界项目,无论是参与开源项目还是进入企业实习,在真实的业务场景下解决问题会进步更快。刚接触复杂的工程项目的时候可能会有所不适应,但是对待数据库这类系统软件的学习不能浮躁,慢慢实践积累终会领悟到它的魅力并且获得进步。



双飞

·杭州电子科技大学

·网络信息与安全-硕士

采/访/实/录

INTERVIEW RECORD

Q1

你在实习期间的工作内容是什么?

"修改 StoneDB 的 Bug,学习数据库相关知识"

Q2

总结一下你的实习经历吧?

"数据库开发入了个小门,但是还有很多要学,需要深入学习。"

Q3

你对即将走入职场做数据库内核研发或者其他研发岗位的同学们有什么建议?

"多学习学习基础知识,看看网课,打好基础."




无论是研发初期的坚持

还是脚踏实地砥砺前行

都是梦想照进现实的机会

都是宝贵的经验体会


公司寄语

叶建林(自修)

石原子科技创始人&CEO

StoneDB开源社区发起人

非常高兴看到有越来越多年轻人愿意投身到数据库行业,你们是数据库行业的火种,未来可期。


我一直坚信数据库行业是一个“长坡厚雪”的赛道,从市场规模上看:相关机构预计2025年全球数据库的市场规模会达到5000亿,国内数据库的市场规模大概在500亿,占全球数据库市场规模的10%左右。根据中国信通院等机构的研报数据,如果按年复合增长率(CAGR)约27%测算,那么到2027年,中国数据库市场规模有望增长到900亿元,对应潜在国产化数据库市场约为520亿元,其中信创数据库市场规模约占据国内总数据库市场规模的70%,占据绝对的领先地位。


能有这种大规模的增量市场,背后的核心原因是:全球数字经济远没有到天花板。当前看似成熟的市场(如美国,中国等)随着数字化越来越深入,数据量也越来越大,对数据库的需求也必然会与日俱增,同时新兴市场(如拉丁美洲)的发展其实还处于早期,也呈现出良性的发展态势。


所以,我对未来的判断是:在全球范围内,随着云计算和分布式技术的发展,云数据库会切走一部分非云数据库的市场蛋糕,分布式数据库会切走一部分集中式数据库的市场蛋糕;而在国内市场上,除了云数据库和分布式数据库带来的切法变化,还要关注一个重大政策因素产生的影响,那就是信创。


作为国产信创数据库服务商,我们石原子科技目前正在做的就是一体化实时HTAP数据库离在线一体化实时数仓,这两款产品均已积极融入信创生态建设。当然,核心技术上的持续突破也变得至关重要,这也是我们为什么持续招揽、培养核心技术研发人才的原因。从核心关键技术上看:


HTAP 数据库的关键技术包括高并发的混合工作负载、数据组织技术、数据同步技术、查询优化技术、资源调度技术高吞吐实时数据导入


OLAP 数据库的关键技术包括云原生架构、计算存储分离、冷热数据分离、支持高吞吐实时写入和数据强一致、高并发查询和大吞吐批处理的混合负载、实时分析、云原生Serverless、湖仓一体、数智融合以及流式数仓等。


如果同学们希望将来涉足分析型数据库行业的研发岗位,建议尽早学习并夯实上述技术的理论基础,并积极到企业中实习,去面对实际场景和解决实际问题,持续积累实践经验,这一定会让你们受益匪浅。



如果您对数据库内核研发抱有信仰,想参与进顶级的HTAP数据库和实时数仓研发团队,欢迎给我们投递简历~
投递邮箱:hr@stoneatom.com
关于石原子科技
石原子科技成立于 2021 年10 月,拥有国内顶级的数据库人才与专家,创始成员源于阿里云 PolarDB、AnalyticDB(简称ADB),腾讯云 TDSQL,华为云 GaussDB,Oracle 等国内外知名数据库团队,专注于一体化 MySQL 实时 HTAP 数据库和离在线一体化实时数据仓库的研发与应用,依托云中立的数据技术进行产品设计,致力于为客户提供大规模、高性能、低成本的一站式实时数据分析服务。

石原子科技坚持精细布局、自主创新的产品研发路线,打造了两款标杆信创产品:
业内首个单机内核开源、行列混存+内存计算架构的一体化 MySQL HTAP 数据库 StoneDB :该产品对标 Oracle HeatWave,使 MySQL  StoneDB  TP+AP 能显著 10-100  AP 系统 MySQL  AP  TP量 MySQL  + 
基于全场景的新一代高性能、低成本的离在线一体化实时数仓 StoneData :高度兼容 MySQL 语法,毫秒级更新,亚秒级查询,满足准实时和实时分析需求,一体化架构将实时和离线融合,减少数据冗余和移动,具有简化技术栈架构的能力;实现业务与技术解耦,支持自助式分析和敏捷分析;无论是数据湖中的非结构化或半结构化数据,还是数据库中的结构化数据,都可使用 StoneData 构建企业的数据分析平台,同时完成高吞吐离线处理和高性能在线分析,实现降本增效。

公司成立至今,已积累了上千位用户,种子客户达 300 多家,取得 30+ 项软件著作权,成功申请并获准通过了 16+ 项技术专利,分别获评杭州市创新型中小企业、浙江省科技型中小企业、国家级科技型中小企业,产品通过公安部三所认证,全面满足信创和等保要求。

石原子科技积极参与中国数据库产业建设,目前已经成为中国信通院分布式系统稳定性实验室成员单位、中国通信标准化协会(CCSA)大数据技术标准推进委员会(TC601)全权成员单位、中国信通院科技制造开源社区成员单位、中国信通院数据库应用创新实验室成员单位(汽车行业工作组首批共建单位和电信行业工作组第二批共建单位)、国家信创工作委员会技术活动单位、浙江省信创联盟会员单位、上海软协信创工委会成员单位、北京信创工委会会员单位、中关村软件和信息服务产业创新联盟成员单位,先后参与起草多项国家级和行业级标准的编写工作。公司层面通过了质量管理体系认证(ISO9001)信息安全管理体系认证(ISO27001)和 CMMI-3 认证,公司产品通过了中国信通院分布式分析型数据库基础能力专项评测和分布式分析型数据库稳定性测试,并与主流服务器、操作系统、中间件、BI工具等国产化软硬件生态体系进行全面兼容。

本文分享自微信公众号 - StoneDB(StoneDB2021)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
0 评论
0 收藏
0
分享
返回顶部
顶部