自研、国产、开源,数据库领域的逆袭。
作者:贾宁宇
有这样一群人,他们原本是互联网大厂的“工程狮”,却一路选择了最难的道路,2010年,20人团队要“去IOE”中的O,甚至要和Oracle甲骨文、Google谷歌这些公司在数据库上较量一番。
“不知天高地厚,是不是只是玩票。”质疑声从未停止。但偏偏这群最偏执的追梦人,在2019年的「数据库领域的世界杯」,打败了称霸这一领域9年的Oracle。他们的梦想还不止于此,要让更多的企业都用上新一代分布式数据库。2020年6月8日,为了完成这个梦想,他们从大厂中独立出来创业。
十年冷板凳,这是属于这群最“偏执”人的追梦历程。今年,他们把300万行代码开源,创造属于自己的社区生态,这又是一项国内技术领域创举。在上周六的HICOOL 全球创业者峰会上,再次宣布“创计划”为中小企业“全免服务”。
聚集这群人的公司名为“北京奥星贝斯科技有限公司”,如果你对这个名字陌生,那并不意外。提起他们的产品,你也许听说过,名为“OceanBase”分布式数据库。如果再说起他们服务的客户,你一定不陌生,10亿级用户的支付宝平台,工商银行等200多家客户。
10年前,OceanBase为何立下Flag,10年后,他们为何又从蚂蚁集团中独立?如今,又为何要独立打造自主的开源技术社区?现在,为何又要为中小企业提供全免服务?
在刚刚结束的HICOOL全球创业者峰会期间,北京奥星贝斯CEO杨冰接受了Tech星球的专访,讲述了OceanBase战略发展的思考,以及开源、服务中小企业背后,再造OceanBase的逻辑,这群追梦人将自己演绎成了数字时代的主角。
底气在科技互联网时代,芯片和操作系统是大家熟知的技术高峰,而数据库由于概念难懂,大众对其认知并不深刻。实际上数据库也是俗称的“卡脖子”技术。在 2020 年 6 月科技日报发布了制约我国工业发展的 35 项技术,数据库管理系统即名列其中。
一直以来,国内企业的数据库,大都采用的是Oracle和IBM的传统关系型数据库。这两家企业在全球范围内,也是数据库的执牛耳者,Oracle一家的全球市场份额就超过50%。但对于很多快速发展的互联网企业来说,数据呈指数级增长,数据库却只能搭积木式的维持。
“这个事情有专业词语叫Scale up。”杨冰告诉Tech星球,”就像是你拿了一辆车,不断地给它装更高的配件。四缸变八缸变十二缸,但是再怎么样加配,你也是只能不断的升级,而不是换代。“
传统关系型数据库的水平扩展能力的缺失以及高昂价格,让不少企业开始思考有没有更好的替代方案。方案肯定是有,当时谷歌发布了 Google Spanner分布式数据库。“这种新型数据库架构也叫scale out,支持水平扩展。“杨冰形象地向Tech星球解释:”它可以连接形成一个网络,可以线性的扩展,只要加机器就有,这种方式就让它的处理性能没有天花板。”
当时,Oracle不是没有意识到这种新型数据库的潜力,只是自己传统集中式的数据库,与互联网时代的分布式数据库,天然存在利益冲突。Oracle没有决心革掉自己的命,还得在8年之后才深刻意识到。
Oracle躺着赚钱的心思不难理解,但对于阿里来说,其不仅是Oracle亚太地区最大客户,还是拥有全球最大的Oracle集群。每年缴纳巨额的费用,却日渐无法满足淘宝和天猫的发展。这让阿里动了换掉Oracle的心思。
杨冰回忆当时的起步缘由,创业团队从2方面考虑后决定做数据库。第一,现在淘宝的发展需要新型数据库,业务发展需要;第二个数据库相当于毕竟是软件领域当中的“芯片”,应该是软件当中,除了操作系统以外最难的产品。
“所以在这个层面上,我们也希望能够去打造一个中国的品牌,真正纯正的中国品牌,不是基于开源的技术。”很少有人知道,当时Oracle是最好的外企offer,毕业生都以进入Oracle、IBM和SAP为荣,阿里和腾讯无论是薪资还是名气都还排不上号。
就是在这样的背景下,现北京奥星贝斯首席科学家、OceanBase创始人阳振坤等人,已经开始了研发之路。这里还有插曲,也正是当年选择了全部自研,10年后,OceanBase才能选择 Open Core 商业模式,将300万行核心代码全部开源。
没人能打包票一定成功,那时阿里还有很多团队在做数据库,大家的技术路线也并不相同。留给OceanBase的机会并不多,最早只是在淘宝的收藏夹,这样一个小场景中适用。
在OceanBase发展的第二阶段,得到了“阿里云之父”的王坚博士的支持,他说服了原蚂蚁集团的CTO鲁肃。“新型分布式数据库在金融场景下应该是更适合。”
就这样,OceanBase并入蚂蚁,真正迎来跨越式发展,开始在蚂蚁集团的业务中登台亮相。杨冰说,“有一年双十一计划给我们1%的业务量,后来公司问我们双十一交易高峰给你10%行不行,我们说行。也没有别的选择,就来吧。然后顶过去了,顶过去就一战成名。”
在互联网场景中淬火的OceanBase,尤其经历蚂蚁集团的金融 互联网的锻炼,验证了其能力,也成就了OceanBase一张闪亮的名片。
最值得纪念的时刻,也是在OceanBase,他们实现了挑战技术霸主的愿望。
在2020年9月,数据库领域最权威的国际机构国际事务处理性能委员会 TPC 在官网发表了最新的 TPC-C 基准测试结果, OceanBase 以 7.07 亿 tpmC 的在线事务处理性能,打破了自己在 2019 年创造的世界纪录。
硬仗技术上登顶后,能不能改变国内数据库市场的格局?
在OceanBase成立10年后,这群偏执的人又给自己提出了这些疑问。离开巨头的怀抱,OceanBase独立出发了。
产品能不能经受的住客户考研?能不能让客户心甘情愿换代?独立后怎么养活自己?这些疑问是这帮技术人才,过去没有考虑过的问题。在2020年6月份成立后,他们还是勇敢迈出了这步。
但迎接OB的,并不是鲜花和掌声。如今中国现在两百多家数据库,现在数据库已经构成当年滴网约车大战,共享单车大战那种感觉。“大家都在搞,也是因为开源把入门的门槛变低了。”
这些开源的数据库产品,往往是基于MySQL或PostgreSQL 进行二次开发。演化的路径也分为两个派系,一方面OLTP(事务型),另一方面是OLAP(分析型)。但企业发展至今,往往需要两者数据库配合使用,但两者配合使用时存在延时的问题。这时候,HTAP型数据库就开始成为新一代主流数据库类型。
OceanBase就是这种数据库的代表,由于HTAP基于分布式架构,支持弹性扩容,可轻松应对高并发和海量数据库场景。但也是相对传统关系型数据库的这些优点,让不少企业开始质疑,OceanBase的产品,真的有这么厉害吗?
中国人保健康也经历了这种从质疑到相信的过程,在最初,中国人保健康后台需要离线处理保单,系统效率平均下来每单需要耗费 5 秒的时间。在接入支付宝合作后,巨大的流量冲垮了其传统的集中式架构。这时候支付宝自身采用的OceanBase分布式架构,走向其视野。
采用OceanBase的架构后,最明显的变化是,处理能力也从过去的 5 秒 1 单到现在每秒千单,系统保单的处理速度从 4 个小时缩短为 6 分钟。业务前台接入互联网,后端采用新一代数据库处理业务,中国人保健康也体验了一把“互联网速度”。
不仅是中国人保健康,在为期3个月的观察验证之后,中国工商银行与蚂蚁集团OceanBase、阿里云技术团队共同制定主机下移方案,并于今年9月正式投产。两地三中心的分布式集群,五副本 主备模式的高可用,传统金融单位也越来越信任OceanBase。
事实上,国内外的金融和电信行业,曾经是Oracle和IBM的数据库绝对垄断的领域。在OceanBase不断攻克传统金融巨头时,难道Oracle没有反击吗?
Oracle一直是王者,但英雄迟暮也是众所周知。2019年5月,一则Oracle中国区首批裁员900人,赔偿N+6的消息爆出,揭开了Oracle大调整的序幕。背后OceanBase等国产数据库的进击,以及Oracle市场份额从垄断到跌落至17%左右。
OceanBase的成人礼创业后,OceanBase也体会到独立过日子的不容易。
“以前是一个产品技术主导的一个体系,但是从去年开始,我们成立商业化团队之后,我们要把客户放在第一位。因为我们得从内走到外面,得到市场的肯定。这个时候客户的业务环境不同就有定制化的要求,我们就要去做定制化的开发。”
独立后的OceanBase树立10大标杆客户,主动上门布道,主动提供VIP服务,让客户真正把OceanBase用起来。
在这些企业中,使用效果如何?据杨冰告诉Tech星球,比原来集中式的数据库使用成本几乎降低一半:"50-80%都有可能,规模越大节约成本久会越大"。
但是它会有个下限,据杨冰介绍,如果客户只有三、五台,那就没有这个效果,如果说超过七、八十台,一百台MySQL的实力,这个规模下如果全部换成OceanBase,效果会很明显,起码砍一半成本以上。
但对于想颠覆国内传统数据库的局面,OceanBase还有很多事情要做。最关键的地方在于,尽管OceanBase兼容MySQL、Oracle等传统数据库,但是OceanBase的产品如何更快被企业接受,如何快速建立起不同于MySQL和PostgreSQL的第三套自研生态体系,都是一件任重道远的事情。
过去10年,杨冰形容OceanBase是在阿里巴巴和蚂蚁的这种“双十一”喂出来,磨出来的,在最复杂和海量的业务环境中磨练出来。但在未来如何打动中小企业,吸引其替换底层数据库是重点,“分布式数据库还是一个巨大的新兴的市场,Google Spanner 还没有开源,OceanBase在国内率先开源共创,就是期待抓住这一时代机遇。”
杨冰具体解释道:“因为开源开放很多参数可以调,很多其实他自己可以去适配,所以会更容易。我们在今年的6月1号,正好成立1年的大会上宣布开源。”这次开源后,开发者更容易下到OceanBase的代码,看到OceanBase的原理,中小企业可以去DIY去使用和调配。
据了解,在9月份的HICOOL 2021全球创业者峰会上,杨冰正式宣布“创计划”。“创计划”强调“全免服务费”, 解决中小企业数据库的技术痛点,首期“全免服务费”权益向100家中小企业开放。免费服务项目包括:前期的技术咨询、人才培训、数据迁移等全链路的技术服务。
创计划的推出,也意味着国产数据库的开源与服务中小企业口号,不是玩虚的。与国内众多企业一起共创未来,这将促使100%自主研发的OceanBase进化成何种模样,也是件值得关注的事情。
据介绍,目前在生态合作方面,OceanBase 在产业端也与40家伙伴完成了深度合作;OceanBase 认证工程师达到1万 ;技术/服务类伙伴也拓展至12家;此外还投入千万级资源参与高校人才建设;而在客户服务方面,目前 OceanBase 也累计服务200家客户。
“在中国并不缺一家数据库的公司,但却缺少一家真正能够完成核心替代的高端数据库。”杨冰总结道,期待OceanBase 可以实现最终梦想,成为国内外企业做最多选用的分布式数据库。