权威整理!2023年度数据库回顾:Databases in 2023: A Year in Review

原创
01/05 18:49
阅读数 107

StoneDB开源地址

https://github.com/stoneatom/stonedb

作者:Andy Pavlo

编辑:宇亭


今年和去年一样,我以服用抗生素的方式开始新的一年,因为我的亲生女儿从卡内基梅隆大学的幼儿园带回来一个讨厌的鼻窦问题。这发生在我第一任妻子背叛我并给我带来COVID之后。尽管如此,去年数据库领域发生了很多重大事件,是时候写一篇年度评论了。

我的目标是保持我的尖锐观点公正,避免哗众取宠的标题。如果你对这个游戏不熟悉,或者对我的无拘无束的机智不够了解,你也可以查看我其他针对2022年和2021年的年终数据库评论。

Rise of Vector Databases 

向量数据库的崛起


这无疑是向量数据库的一年。虽然其中的一些系统已经存在了几年,但对LLM和建立在它们之上的服务(例如ChatGPT)的广泛兴趣在去年把它们推向了最前沿。向量数据库承诺基于数据的语义而不是仅基于其内容来提供对数据的更深入的搜索。也就是说,应用程序可以搜索与主题相关的文档(例如“有关摆摊的歌曲的嘻哈团体”),而不是搜索包含确切关键词的文档(例如“武当派”)。


实现这些类型搜索的“魔法”是转换器,它们将数据转换为固定长度的一维浮点数向量,称为嵌入。这些嵌入中的值对人类来说是无法破译的。相反,它们的内容编码了参数和转换器的训练语料库之间的某种关系。这些嵌入向量的尺寸范围从简单转换器的100多个维度到高端模型的1000多个维度。


假设使用转换器为数据库中的所有记录生成嵌入。在这种情况下,可以通过在高维空间中找到最接近搜索嵌入的记录嵌入来搜索给定输入的相似记录。但是,暴力比较所有向量以找到最接近的匹配是极其昂贵的。


这种搜索的复杂性为O(N * d * k),其中N是嵌入的数量,d是每个向量的尺寸,k是您想要的匹配数 - 如果您不知道这意味着什么,请相信我,这很糟糕。感谢Ankur Goyal(CMU'17)的更正。


这就是向量数据库管理系统(Vector DBMS)的作用。从本质上讲,向量DBMS只是一个文档数据库,具有专用的索引数据结构,以加速对嵌入的相似性搜索。这些系统可以使用近似搜索来生成结果,而不是为每个查询执行最相似的向量的精确匹配,这使得“足够好”的权衡可以更快地返回结果。就是这样。


经历了2022年区块链数据库乱糟糟的崩溃之后,风险投资家们振作起来,重新燃起了热情。他们在一轮又一轮的大规模融资中投入了大量资金,几乎所有的主要玩家都在向量数据库游戏中获得了资金。2023年的种子轮中,Marqo获得了530万美元的种子资金,Qdrant获得了750万美元的种子资金,Chroma获得了1800万美元的种子资金。2023年4月,Weaviate凭借5000万美元的B轮融资大放异彩。但Pinecone在2023年以令人垂涎的1亿美元B轮融资领先群雄。显然,向量数据库公司在正确的时间和地点。

💩 安迪的见解:


随着ChatGPT在2022年底成为“主流”,几家数据库管理系统供应商在不到一年的时间里就添加了自己的向量搜索扩展。这些包括SingleStore、Oracle、Rockset和Clickhouse。几个PostgreSQL派生系统也宣布支持向量搜索;一些使用pgvectorextension(Supabase、AlloyDB),而其他一些使用其他开源ANN库(Timescale、Neon)。领先的NoSQL数据库管理系统如MongoDB和Cassandra也添加了向量索引。


有趣的是,与JSON数据类型的兴起相比,向量支持在多个数据库管理系统中的快速普及。在21世纪00年代末,原生存储JSON的NoSQL系统变得流行(例如MongoDB、CouchDB),但关系型数据库管理系统需要几年时间才能支持JSON(例如PostgreSQL、Oracle和MySQL分别在2012年、2014年和2015年添加了JSON数据类型)。SQL标准在SQL:2016中添加了对JSON数据的操作函数,但直到SQL:2023才添加了官方的JSON数据类型。考虑到许多关系型数据库管理系统已经支持概念上类似的XML数据类型,这一延迟有点令人惊讶。


向量搜索索引快速普及的两个可能解释是:第一个是因为通过嵌入进行的相似性搜索是一个如此引人注目的用例,以至于每个数据库管理系统供应商都立即推出了自己的版本并宣布它。第二个原因是引入等效的新的访问方法和索引数据结构所花费的工程努力非常小,以至于数据库管理系统供应商在添加向量搜索时没有花费太多工作。大多数供应商没有从头开始编写自己的向量索引,而是集成了可用的几个高质量的开源库(例如Microsoft DiskANN、Meta Faiss)。


但是,如果向数据库管理系统添加合理的向量搜索功能所花费的工程努力很小,那么危险在于向量数据库管理系统供应商没有足够大的护城河来防止现有数据库管理系统侵犯他们的领地。


最近,我告诉Pinecone和Weaviate的联合创始人,他们的系统可以采取两种路径(参见我与Weaviate首席技术官的播客采访)。第一种方式是,他们的客户将开始使用向量数据库管理系统作为他们的“记录数据库”,然后供应商将为运营工作负载提供更好地支持。最终,它们将看起来更像流行的文档数据库管理系统(例如MongoDB),然后在五年内,它们将像之前的NoSQL系统一样添加对SQL的支持。另一种路径是,向量数据库管理系统将保持作为二级数据库,通过上游运营数据库管理系统的更改进行更新。这就是人们如何使用像Elastic和Vespa这样的搜索引擎数据库管理系统。在这种情况下,向量数据库管理系统不需要扩展查询语言或拥有更结构化的数据模型就可以生存下去。


附加评论:我最近录制了一个关于向量与关系数据库的问答环节。你可以听到我的预测,即未来五年内,每个关系数据库管理系统都将拥有高性能的向量索引实现。


SQL Keeps Getting Better 

SQL 不断变得更好


即将到来的年份将是IBM Research的Don Chamberlain和Ray Boyce(RIP)创建SQL 50周年。最初被称为SEQUEL(结构化英语查询语言),自20世纪80年代以来,SQL已成为与数据库交互的事实上的标准编程语言。尽管它已经存在了很长时间,但SQL的使用和功能却在不断增强,特别是在过去的十年中。


去年见证了ISO/IEC 9075规范(更广为人知的是SQL:2023)的最新版本。这次更新包括许多“想要拥有”的功能,这些功能解决了各种SQL方言中的问题和不一致性(例如ANY_VALUE)。这里值得一提的是,SQL的两种增强功能进一步削弱了对替代数据模型和查询语言的需求。请记住,仅仅因为SQL规范中包含某些内容,并不意味着您喜欢的关系数据库管理系统会立即支持这些新功能。


Property Graph Queries (SQL/PGQ): 
属性图查询(SQL/PGQ):

SQL 现在支持在图形上定义只读查询。这允许应用程序在现有表上声明属性图结构。以下是一个在 Oracle v23c 中跟踪哪些人属于哪些乐队的事例:

CREATE TABLE PEOPLE (ID INT PRIMARY KEY, NAME VARCHAR(32) UNIQUE);CREATE TABLE BANDS (ID INT PRIMARY KEY, NAME VARCHAR(32) UNIQUE);CREATE TABLE MEMBEROF (PERSON_ID INT REFERENCES PEOPLE (ID),                        BAND_ID INT REFERENCES BANDS (ID),                        PRIMARY KEY (PERSON_ID, BAND_ID));
CREATE PROPERTY GRAPH BANDS_GRAPH VERTEX TABLES ( PEOPLE KEY (ID) PROPERTIES (ID, NAME), BANDS KEY (ID) PROPERTIES (ID, NAME) ) EDGE TABLES ( MEMBEROF KEY (PERSON_ID, BAND_ID) SOURCE KEY (PERSON_ID) REFERENCES PEOPLE (ID) DESTINATION KEY (BAND_ID) REFERENCES BANDS (ID) PROPERTIES (PERSON_ID, BAND_ID) );


这取决于数据库管理系统是否为属性图创建辅助数据结构(例如邻接矩阵)或仅跟踪元数据。然后,您可以使用 MATCH 关键字在 SQL 中编写图形遍历查询。该语法基于 Neo4j 的 Cypher 语言,并且是新兴的 GQL 标准的一个子集。以下查询返回每个乐队中的成员数量:


SELECT band_id, COUNT(1) AS num_members   FROM graph_table ( BANDS_GRAPH      MATCH (src) - [IS MEMBEROF] -> (dst)      COLUMNS ( dst.id AS band_id )   ) GROUP BY band_id ORDER BY num_members DESC FETCH FIRST 10 ROWS ONLY;


截至2024年1月,我所知道的支持SQL/PGQ功能的唯一数据库管理系统是Oracle。DuckDB还有一个实验分支也支持SQL/PGQ,但我的上述示例无法工作,因为它们支持的语法略有不同。您可以从CWI/DuckDB研究员Gabor Szarnyas整理的资源列表中了解更多关于SQL/PGQ的信息。


Multi-Dimensional Arrays (SQL/MDA): 

多维数组(SQL/MDA):


SQL自从SQL:1999引入了有限的一维、固定长度的数组数据类型以来,就支持数组。SQL:2003扩展了功能,支持没有预定义最大基数的不嵌套数组。SQL:2023中的SQL/MDA更新支持使用整数坐标的任意维度的真正多维数组。Rasdaman的RQL深受SQL/MDA语法的启发,提供了与SQL兼容的结构和操作数组构造,并与集合语义正交。这些增强功能使应用程序能够完全在SQL中交互和操作多维数组,而无需将其导出到Python笔记本中。下表(来源)显示了在CREATE TABLE语句中使用MDARRAY数据类型的不同示例:





尽管自2019年以来,SQL/MDA规范已经以技术报告的形式提供,但它直到SQL:2023才被纳入官方SQL标准。据我所知,除了Rasdaman之外,没有其他可用于生产环境的DBMS支持SQL/MDA扩展。我能找到的唯一其他原型是HSQLDB的一个分支,名为ASQLDB。


💩 安迪的见解:


SQL:2023修订版是普遍语言的持续发展和改进的下一阶段。当然,SQL并不完美,并且它并不是真正的可移植的,因为每个DBMS都有其特性、专有特性和非标准扩展。我个人喜欢PostgreSQL的 ::cast 操作符快捷方式。


SQL/PGQ是一个大问题。然而,我不认为它会立即对图形DBMS造成致命打击,因为已经有几种方法可以将图形导向查询转换为SQL。一些DBMS,包括SQL Server和Oracle,提供了内置的SQL扩展,使存储和查询图形数据更加容易。Amazon Neptune在其Aurora MySQL产品上提供了一个图形导向的外观。Apache AGE在PostgreSQL上提供了一个OpenCypher接口。我预计其他主要OLAP系统(例如Snowflake、Redshift、BigQuery)将在不久的将来支持SQL/PGQ。


在DBMS中添加SQL/PGQ并不像添加对新语法的支持那样简单。有几个工程方面的考虑因素可以确保图形查询的性能。例如,图形查询执行多路连接以遍历图形。但是,当这些连接的中间结果比基础表大时,会出现问题。DBMS必须使用最坏情况下的最优连接(WCOJ)算法来更有效地执行此类连接,而不是在连接两个表时使用的常规哈希连接。另一种重要技术是使用因子分解来避免在连接期间生成冗余的中间结果。这种压缩类型有助于DBMS避免因重复相同的连接记录而消耗大量内存。


我提到这些优化并不是说现有的图形DBMS实现了它们,因为据我所知,领先的图形系统,如Neo4j、TigerGraph等,并没有实现它们。我所知道的唯一图形导向系统是滑铁卢大学的嵌入式KuzuDBMS。大多数关系DBMS也没有实现它们(至少是开源的)。上面提到的DuckDB实验分支实现了WCOJ和因子分解优化,并在2023年的论文中表明,它在行业标准的图形基准测试中比Neo4j高出10倍。


正如我之前所说,SQL在你出生之前就已经存在,并且在你去世后仍将存在。我将继续嘲笑那些声称自然语言查询将完全取代SQL的说法。

附加评论:自从我公开下注以来已经两年了,我赌到2030年图形DBMSs不会在数据库市场上超越关系DBMSs。到目前为止,我还没有输。

Troubles in the Sea Lion Kingdom

海狮王国的烦恼


MariaDB公司(与MariaDB基金会分开)去年频频成为新闻头条,但情况并不乐观。2022年,该公司通过一个被称为SPAC的不太靠谱的合并工具进行后门首次公开募股(IPO)。但股票($MRDB)在上市三天后立即下跌了40%。由于该公司决定快速登陆纽约证券交易所并成为一家上市公司,其丑闻也随即被曝光。到2023年底,该股票价格从开盘起下跌了90%以上。

在这些问题之后,该公司宣布了两轮裁员。第一次是在2023年4月,但他们在2023年10月又进行了一次更大规模的裁员。该公司还宣布他们将停止开发两个产品:Xpand和SkySQL。2018年,该公司收购了Xpand,当时被称为Clustrix;我曾在2014年参观过Clustrix的旧金山办公室,当时感觉那里就像一个鬼城(大办公室里一半的灯都关着)。SkySQL的历史比较复杂。它最初是一家提供MariaDB服务的独立公司,但后来于2013年与Monty Program AB合并。然后,在2014年,合并后的Monty Program AB + SkySQL公司成为了我们今天所知的MariaDB公司。但2023年12月,该公司宣布SkySQL并未消亡,而是作为一家独立公司重新回到市场!


MariaDB公司的情况非常糟糕,以至于MariaDB基金会的首席执行官撰写了一篇文章,抱怨自首次公开募股以来,他们与公司的关系已经恶化,他们希望“重启”这种关系。其他问题包括微软在2023年9月宣布,他们将不再提供作为托管的Azure服务的MariaDB。相反,微软将专注于支持MySQL。如果你不知道的话,MariaDB是MySQL的一个分支,由MySQL的原始创建者Monty Widenus在2009年甲骨文宣布收购Sun Microsystems之后开始开发。请回顾一下,Sun在2008年收购了MySQL AB,而甲骨文在2005年收购了InnoBase(InnoDB的制造商)。但现在MySQL表现良好,而MariaDB却问题不断。你不需要看电影或电视节目来娱乐!通过数据库你可以得到你生活中所需要的所有剧情!


💩 安迪的见解:


在过去的十年里,数据库客户的“品味”变得更好了。公司再也不能用华而不实的基准数字、承诺替代SQL的新查询语言或名人代言来“假扮自己直到成功”。数据库管理系统的声誉比以往任何时候都更重要。而构建系统的公司也同样重要。这意味着DBMS软件本身必须可靠,而构建该软件的公司必须齐心协力。


在你认为开源能够保护你免受公司破产的影响之前,很少有DBMS项目能够在其盈利的创始公司失败后继续存在并蓬勃发展。PostgreSQL勉强算是一个例子,尽管我们今天所拥有的开源版本是基于加州大学伯克利分校的源代码,而不是商业版的Illustra版本(该版本于1996年被Informix收购)。另一个例子是,为MySQL构建InfiniDBOLAP引擎的公司于2014年破产,其GPLv2源代码被捡起并继续作为MariaDB的ColumnStore。


相反,有许多例子表明,一旦支付大部分(甚至全部)开发费用的公司消失,DBMS就会逐渐消亡。只有两个例子表明DBMS得以生存:Riak和RethinkDB。Basho在2017年破产,现在Riak由一个在英国国家医疗服务体系工作的人维护。RethinkDB公司在2017年倒闭(考虑到创始人对科技领域女性的看法,这并不奇怪),该DBMS的源代码被移交给了Linux基金会。尽管基金会接管了该项目,但RethinkDB项目仍需依靠生命支持:该项目在2023年发布了新版本,但它们只是用于处理位腐烂的补丁。你还可以在Apache基金会的阁楼中看到其他被遗弃的DBMS项目。


云数据库即服务(DBaaS)使得这个问题更加糟糕,因为如果公司破产(或开始面临财务压力),它将关闭托管您的数据库的服务器。当Xeround在2013年关闭服务器时,他们给了客户两周的时间来迁移数据库。为了削减成本,InfluxDB在2023年7月删除了整个地区之前给了客户六个月的时间,但人们仍然措手不及。


MariaDB比一般的数据库初创公司处于更好的位置,因为Monty和其他人建立了非营利基金会,该基金会控制着开源项目。但是,当您是一家开源DBMS的营利性公司时,一个非营利组织公开表示您很糟糕,这是一个不好的迹象!就像Chuck D与Flavvaover发生争执,在Public Enemy重组巡演中发生争执一样糟糕。与此同时,MySQL继续改进,而Oracle一直是该系统的合理良好的企业管家(至少从工程角度来看)。但是,MariaDB公司的混乱将进一步支持社会向PostgreSQL的转变。


不过 MariaDB也不能失败了,因为据我所知,Monty没有更多的孩子来命名数据库了(例如,MaxDB、MySQL、MariaDB)。

Government Database Crash Grounds US Air Travel

政府数据库崩溃导致美国航空旅行停飞

2023年1月11日,由于NOTAM系统发生故障,美国联邦航空管理局(FAA)暂停了所有美国国内航班。NOTAM系统向飞行员提供明文编码的消息,警告他们飞行途中可能遇到的意外变化或潜在危险。当NOTAM系统在1月11日早晨崩溃时,大约11000架美国国内航班被暂停起飞。其他国家也运行独立的NOTAM系统,不受美国NOTAM故障的影响。


根据美国联邦航空管理局的说法,此次停机是由于一个损坏的数据库文件引起的。一家第三方承包商的工程师试图用一个备份文件替换它,但事实证明,备份文件也出了问题。类似的问题也导致了美国联邦航空管理局传统基础设施在2008年的停机。


美国联邦航空管理局(FAA)的NOTAM系统用于向飞行员提供关于潜在飞行危险的警告。然而,关于FAA用于NOTAM系统的数据库管理系统(DBMS)的公开信息并不多。一些报道表明,该系统仍然在1988年的两台Philips DS714/81大型机上运行。这些机器并没有当今所熟知的操作系统;它们是20世纪60年代大型机时代的遗物。这意味着在20世纪80年代,FAA无法为这种应用使用现成的DBMS,尽管当时已经存在几个DBMS(例如,Oracle、Ingres和Informix都支持各种Unix平台)。根据我所能找到的最佳分析,NOTAM系统自己管理数据库,可能使用的是平面文件(例如CSV)。20世纪80年代由非数据库专家编写的应用程序代码负责从文件中读取/写入记录,复制到备用服务器,并在发生崩溃时维护数据完整性。因此,如果数据库发生故障,系统可能无法正常运行,导致航班延误或取消。


💩 安迪的见解:


在无法替代的遗留硬件上运行关键任务系统,同时使用由已经退休的内部开发人员编写的自定义数据库访问库,是每个数据库研究人员最糟糕的噩梦。我很惊讶它没有早点崩溃(除非2008年的故障与同一系统有关),所以我想我们应该为它持续运行35年而给予赞扬。


有消息来源称,NOTAM系统每秒仅处理20条消息。按照现代标准来看,这无疑是很小的,但请记住,FAA在20世纪80年代部署了该系统。数据库传奇人物和1998年图灵奖得主Jim Gray(已故)在1985年写道,“普通”的DBMS每秒可以执行大约50个事务(txn/sec),而高端DBMS可以达到200 txn/sec。作为参考,五年前,有人在树莓派3上使用20世纪80年代的基准(即TPC-B,基于TPC-A)运行PostgreSQL时,实现了大约200 txn/sec的吞吐量。如果不考虑使用强一致性复制跨数据中心的系统(这些系统受到光速的瓶颈限制),现代的单节点OLTP DBMS对于某些工作负载可以达到数百万txn/sec的吞吐量。NOTAM的峰值吞吐量为每秒20条消息,这在20世纪80年代并不是最先进的,而且现在肯定不是最先进的。


由于NOTAM没有将数据库与应用逻辑分离,因此无法独立升级这些组件。由于关系模型的优点在20世纪80年代中期就已经众所周知,因此我们可以合理地批评他们的这种设计选择。并不是说SQL可以防止这种确切的失败(这是一个人为错误),但这种独立性使单个组件更易于使用和管理。


尽管如此,美国政府在当时已经在使用商用关系型DBMS。例如,Stonebraker的RTI(Ingres制造商)1988年的首次公开募股文件提到,他们的现有客户包括国防部和内政部、军事部门和研究实验室。我相信美国政府的其他部门当时也在使用IBM DB2和Oracle。因此,除非NOTAM的运行环境有我不知道的情况,否则他们本可以使用真正的DBMS。


2023年在阿姆斯特丹举行CIDR会议期间,我就乘坐飞机飞回来,但飞机降落时发生了故障。幸运的是,这并没有影响到进港的国际航班,所以我们的飞机能够正常降落。但后来,我却被困在了纽瓦克机场,因为所有的国内航班都停飞了。如果你对这个机场不熟悉的话,它的非品牌航站楼非常拥挤,像纽瓦克到匹兹堡这样的区域航班都在那里起降。我不想待太久,因为我不想让我的脚被纽瓦克机场“打上标签”。


附加评论:请参阅我们去年发布的文章,了解为什么如果使用Amazon RDS,NOTAM数据库崩溃不太可能发生。

Database Money Stuff 

数据库经济问题


除了上面提到的向量DBMS领域的投资热潮外,其他类型的数据库系统在风险投资领域还有一些活动。但总体而言,今年的数据库融资活动比往年要低调得多。

在欧洲,自动调优启动器DBTune筹集了260万美元的种子轮融资PostgresML获得了450万美元的种子轮融资,用于构建一个带有自定义扩展的DBaaS,以便从SQL中调用机器学习框架。TileDB宣布他们在秋季获得了3400万美元的B轮融资,以继续构建他们的数组DBMS。尽管已有13年历史,但SQReam获得了4500万美元的C轮融资,用于加速其GPU DBMS。Neon在2023年8月获得了4600万美元的B轮融资,以扩展其无服务器PostgreSQL平台。当然,2023年的融资冠军仍然是Databricks,他们在2023年9月获得了5亿美元的I轮融资。是的,这笔钱很多。但与2021年的16亿美元的H轮融资相比,这并不算多。


2023年数据库领域也有一些收购活动。最大的一笔交易发生在年初,当时Progress Software以3.55亿美元的现金收购了MarkLogicMarkLogic是最早的XML DBMS之一(成立于2001年),而Progress拥有OpenEdge,这是一个更古老的DBMS(成立于1984年)IBM收购了Meta分拆出来的Ahana,该公司试图将PrestoDB商业化(与PrestoSQL硬分叉不同,后者已更名为Trino)。多云数据库服务提供商Aiven收购了由AI驱动的查询重写器EverSQL初创公司。EnterpriseDB利用贝恩资本的资金收购了Seafowl团队,该团队正在开发基于DataFusion的PostgreSQL兼容OLAP引擎。Snowflake收购了两家来自我的数据库同事的初创公司:

(1)Sisu Data,来自前斯坦福教授Peter Bailis;


(2)Ponder(基于Modin),来自加州大学伯克利分校教授Aditya Parameswaran。


💩 安迪的见解:


我的 VC 朋友们告诉我,与往年相比,2023年他们看到更多的新公司融资计划,但投出的支票却更少了。这一趋势适用于所有初创领域,数据库市场也不例外。与AI + LLMs有任何松散关联的东西都获得了大量关注(这是正确的,因为这是计算领域的新篇章)。


尽管美国2023年的某些宏观经济指标是积极的,但科技行业仍然不稳定,每个人都在寻求削减成本。对于OtterTune来说,客户希望我们的数据库优化能更积极地帮助他们降低2023年的数据库基础设施成本。这与公司早些年的情况不同,当时人们来找我们主要是为了提高他们的DBMS性能和稳定性。我们计划在2024年宣布新功能,以帮助降低数据库成本。回到大学时,这学期有比平时更多的学生请求我帮助他们找到数据库开发的工作。这些寻求帮助的请求让我感到惊讶,因为CMU CS的学生一直能够自己找到好的实习和全职职位(除了有一次,我最优秀的一名本科生重写了我们的查询优化器,但后来找不到暑期实习,因为他忘记问我,结果在匹兹堡机场附近的Dick's Sporting Goods做起了网络开发。现在他在Vertica公司工作得很开心)。


如果美国科技市场继续这样发展,未来几年许多数据库初创公司可能会难以达到下一个阶段。较小的DBMS初创公司可能会被大型科技公司或私募股权公司收购,或者直接倒闭。但那些已经筹集了大量资金且估值较高的公司正面临困境。正如我之前所说,一些公司可能无法进行首次公开募股,而且现在没有大型科技公司需要它们的DBMS,因为每家公司都有自己的DBMS。因此,这些较大的DBMS公司将面临三种选择。他们可以采取一轮融资来维持公司的运营。他们可以依靠私募股权公司的支持来维持生命(例如Cloudera)。或者他们可以被IT服务公司(例如Rocket、Actian)收购,将系统置于维护模式,但继续从无法轻松迁移的遗留应用程序中榨取客户的许可费用。对于数据库公司来说,这三条道路都不太理想,应该会让潜在的新客户望而却步。


最后,我想提醒大家,要问的问题不是Databricks是否会进行首次公开募股,而是何时进行。

The Most Expensive Password Change Ever 

最昂贵的密码更改


Oracle的创始人Larry Ellison在2023年如日中天。这对他已经辉煌的职业生涯来说是一个标志性的一年。2023年6月,他重回世界第四大富豪的宝座。Oracle的股价($ORCL)在2023年上涨了22%,略低于标准普尔500指数的24%回报率。然后,Larry于2023年9月生平第一次去了雷德蒙德(微软总部所在地)。他与微软首席执行官Satya Nadella一同登台,宣布Oracle的DBMS现已成为Azure云平台上的托管服务。之后,在2023年11月,股东们以压倒性多数投票决定,让79岁的Larry继续担任Oracle的董事会主席。


但2023年真正的重大新闻是,埃隆·马斯克(Elon Musk)在个人投资10亿美元参与马斯克收购社交媒体公司后,亲自帮助Larry重置了推特密码。随着这10亿美元的密码重置,我们在2023年10月有幸看到了Larry第二条推文以及他十多年来的第一条新推文。Larry预示了他即将访问牛津大学的行程,后来在那里宣布成立Ellison Institute of Technology(EIT)。


💩 安迪的见解:


如果你像我一样,那么你会清晰地记得Larry神秘的第二条推文发布时你身在何处以及你在做什么。我并不关心推文的内容。当然,计划的研究主题非常有趣,但这不是最重要的部分。重要的是Larry再次发推这一事实,这使得这一时刻意义重大。Larry和我本人都对他所获得的积极反馈感到高兴。我根据个人经验(别问我是怎么知道的)知道,Larry偶尔会查看他的推特动态,尤其喜欢详细的创业计划书、生日祝福和随意的淋浴思考。


Larry的推文之所以如此出乎意料,是因为你一直认为他总是忙于生活中更加宏大的活动。毕竟,这个人拥有一架米格-29战斗机和一座夏威夷岛屿。他有太多更好的选择。因此,当他抽出时间在社交媒体网站上留言,让我们知道他在做什么时,这对我们所有人来说都是一个重要的人生时刻。是的,Larry不得不先请一位朋友帮助他重置密码,而这位朋友恰好是世界上最富有的人。但是,在我们中间,谁没有遇到过需要重置父母密码的情况呢?也许不是首先花费10亿美元,但对于身价1030亿美元的人来说,这没什么大不了的。

More Awesomeness Next Year

明年更精彩


我期待着2024年的到来,并希望在数据库方面投入更多时间。这也将标志着Dana、Bohan和我成立OtterTune公司的四周年的到来。我们已经学到了很多,并且将我们的数据库优化服务扩展到了最初的学术原型之外。


我们计划在未来一年中分享一些关于使用人工智能改善实际MySQL和PostgreSQL数据库管理系统的高光时刻和发现。此外,我们还正在开发一些新的增强功能,让任何人都能够轻松维护一个健康、高效的数据库。


加入StoneDB社区
Github:https://github.com/stoneatom/stonedb
Gitee:https://gitee.com/StoneDB/stonedb
社区官网:https://stonedb.io/
哔哩哔哩:https://space.bilibili.com/1154290084
Twitter:https://twitter.com/StoneDataBase
Linkedin:https://www.linkedin.com/in/stonedb/

加入社群

数据库人的聚集地

加入微信群(左):添加社区助理-小石侠;加入钉钉群(右):扫描下方钉钉群二维码。



点击阅读原文,给 StoneDB 点个 Star 鼓励一下吧~

本文分享自微信公众号 - StoneDB(StoneDB2021)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部