众所周知,“数字经济”自5年前在政府工作报告中首次提及至今,已对中国的经济运行方式产生了非常深远的影响,更成为目前经济高质量发展中的核心主线。
而作为数字经济中的关键生产要素,数据的重要性也愈发突出。在此过程中,对千行百业的行业用户而言,随着业务和应用的不断拓展和增加,其关键业务系统也在持续地产生出大量高价值密度的核心数据,而这些数据如何高安全、高性能、高稳定的运行以及如何更好地挖掘出其背后的价值就变得至关重要。
也正因此,过去几年分布式数据库强势崛起。IDC的数据显示,目前约26.8%的企业级市场用户部署了分布式数据库,超过90%的企业认可分布式数据库部署后的效果。其中,更有约66%的被访企业看到数据库系统性能的明显改善,切实解决了数据库企业级应用的痛点和难点。
但也要看到,在数据量持续高速增长的情况下,企业对分布式数据库也提出了更高的要求,如数据存储越来越多,对数据库的性能也越来越高;企业在数据迁移过程中,也对分布式数据库的兼容性提出了新目标,同样安全合规对分布式数据库库的安全性更提出新要求;不仅如此,应用场景多样化也需要分布式数据库有更强的适应能力等等。
8月10日,在2022 OceanBase年度发布会上,版本代号为“小鱼”的OceanBase4.0正式发布,这是业内首个单机分布式一体化数据库,它实现了单机部署并兼顾分布式架构的扩展性与集中式架构的性能优势,不仅一举突破了分布式数据库单机性能的瓶颈,实现了单机性能赶超集中式数据库的行业历史性“跨越”。
更关键的是,它还具备了更低的部署成本和运维复杂度,灵活满足不同使用场景需求,极大降低了中小企业使用分布式数据库的门槛,让分布式数据库在千行百业中实现“普惠化”夯实了基础。
正如OceanBase CEO杨冰所言:“中国基础软件行业已经有能力‘根创新’,坚持长期投入,中国数据库必将迎来大爆发。作为一款完全自研的企业级原生分布式数据库,我们希望通过不断地技术创新,为不同类型客户降低企业数据库的使用门槛,助力产业数字化。”
分布式数据库≠分布式系统
从1970年,关系数据库之父E.F.Codd在其论文中首次提出关系模型的概念算起,数据库的历史长河已经流淌了整整52年。这当中很长的一段时间内,集中式数据库在信息化时代所构建起的商业模式和生态体系,都让它的市场地位难以撼动。
但进入数字化时代,随着各行各业产生的数据量呈爆炸式增长,集中式数据库的局限性在面对大规模数据处理中逐渐显露,由此也催生了分布式数据库的出现,在国家工业信息安全发展研究中心等机构近期发布的《分布式数据库发展趋势研究报告》中,我们就看到了中国分布式数据库强势崛起的几个关键原因:
一是,从产业发展背景看,可以看到随着移动支付、大数据等新场景、新应用的出现,由此带来的体量增长,数据形态变化,都要求底层数据库处理能力需要持续的迭代升级,而在国家把数据确定为关键生产要素之后,一系列的政策驱动,更让中国分布式数据库产业的规模持续地壮大。
其中,在“十四五”软件和信息技术服务业发展规划中,就提出要“加速分布式分布式数据库、混合事务分析处理数据库、共享内存数据库集群等产品研发和应用推广。”此外,在《全国一体化大数据中心协同创新体系算力枢纽实施方案》中,也明确要求要“加大服务器芯片、操作系统、数据库、分布式计算与存储、数据流通模型等软硬件产品的规模化应用”。
二是,从场景倒逼创新看,主要体现在由于国内庞大的人口基础导致包括金融、电信等关系到“国计民生”的重点行业,无论是其关键应用的规模还是其数据的体量都在全球领先,由此也让这些行业面临“世界级”的数据处理压力,而传统数据库的性能往往无法满足这种规模的处理需求,因此也让越来越多的行业用户从集中式数据库走向了分布式数据库。
三是,从技术演进趋势看,分布式数据库本身也在持续的迭代和升级,比如最初的“分布式中间件 单机数据库”主要是在单机数据库系统上进行改造,解决了数据库扩展性的问题,但其本身也面临着全局事务能力、高可用,以及节点无法按需扩展等“短板”;此后出现的“非对称计算节点 分布式存储”,则通过分布式存储引擎,解决了数据一致性的问题,实现了写能力的高可用,但其本身的劣势也是有的,包括扩展性有限,需要分库处理,同时难以做到跨地域的高可用,且对底层的数据中心基础设施有着较强的依赖等等。
简单理解,基于分布式技术 缝合系统搭建的“分布式系统”,与分布式数据库有本质的区别,无论是分布分表带来的额外开支,还是扩容容易缩容难的成本问题,都需要更好的方式去解决。
直到原生分布式数据库的出现,可以说相当好地解决了上述技术路线中存在的难题。原生分布式数据库的架构设计,本身就是按照分布式一致性协议做底层设计的,由此在一致性、全局MVCC、高可用等方面支持更好。尤为重要的是,它还能够在普通服务器上实现无限水平扩展,通过添加低成本服务器即可扩展算力,提升数据库集群的整体性能等,因此分布式数据库走向原生设计在今天已成为大势所趋。
而诞生于2010年的OceanBase,正是原生分布式数据库的典型代表,同时 OceanBase还始终坚持“原创 自研”的模式,通过多样化的业务场景加速产品迭代,大大降低了用户的使用成本,让部署更加便捷,用技术让海量数据的管理和使用更简单。
目前,OceanBase 已帮助400 行业客户实现核心系统平滑迁移和升级,涉及金融、能源、通信等领域,这也让OceanBase正从最初的金融行业走向关乎“国计民生”行业,成为核心系统升级的首选。可以说在过去的十二年的时间,OceanBase以持续的技术创新和丰富的行业实践,在中国走出了一条原生分布式数据库的创新之路。
“小就是大”是把关键钥匙
在此过程中,原生分布式数据库虽然有着各种先天的优势,但其落地过程中也面临着两个方面的挑战:一方面,为了保证绝对高可用性,原生布式数据库往往以“三副本”形式部署,这意味着企业如果想要部署分布式数据库,就要同时进行多个服务器部署,门槛比单机高,且“分布”或“单体”的选择通常不可逆,选择了单机就意味着很难再去部署“分布式”。
另一方面,在过去通常都是大中型企业在部署原生分布式数据库系统,而中小企业由于数据量不大,应用场景相对简单,并不需要在业务量不足时部署分布式数据库系统,反而购买单机更为划算。但一旦部署单机,后续业务量庞大时再进行架构调整,又会进一步增加部署的难度。
如何解决这种“鱼和熊掌”难以兼得的难题呢?版本代号为“小鱼”的OceanBase4.0正是为此“应运而生”的,作为业内首个单机分布式一体化架构,有效兼顾了分布式架构的扩展性与集中式架构的性能优势,它的特点是既可以实现单机部署,又可以在单机部署下实现分布式部署的完整功能,从技术上首次突破了分布式数据库的单机性能瓶颈。
杨冰说:“4.0版本使得OceanBase在具备大规模处理能力的同时,又具备能够与传统单机数据库性能可以相媲美的能力,而且支持行业客户在小规模的场景下进行单机化的部署,为此我们给它起了一个非常不同寻常又充满寓意的名字——小鱼,英文名字是Paetica,袖珍鱼,是世界上最小的鱼,这个版本代表着OceanBase在小型化上的探索与创新,也是分布式到单机分布式的一次转折,真正让OceanBase可以按需扩展,实现从0到1再到N的创新。”
那么,OceanBase4.0的这些新特性究竟体现在哪些方面呢?我们可以从以下几个维度观察:
首先,是部署能够实现“小型化”, OceanBase4.0能在全球最小的电脑(树莓派)上运行,即使是普通的个人电脑也可以流畅运行单机分布式一体化数据库,让分布式数据库触手可及。换句话说,OceanBase4.0可以适应从个人小站点到银行核心系统、巨型电商网站等各种规模的业务。企业选用后,可以在业务发展不同阶段根据自身特点,灵活满足性价比和高可用的要求,极大地降低企业使用分布式数据库的门槛。技术的突破和使用成本的降低,也意味着 OceanBase 4.0 突破了分布式数据库的边界,让分布式数据库向通用性数据库又迈进了一步。
其次,是系统具备强大的“易用性”,具体体现在OceanBase4.0即便在单机部署模式下,仍然可以实现分布式部署的完整功能,包括 Oracle/MySQL 兼容性、TP 事务处理能力、AP 并行分析查询能力、租户资源隔离等。此外,相比前几个版本,OceanBase 4.0还大幅度提升交易处理能力,分析处理能力再上台阶,实现了由全场景向量化能力覆盖,同时还在业内率先将故障恢复时间(RTO)从 30 秒优化到 8 秒,而RTO的数值越小,代表系统故障恢复能力越强,这是中国数据库的第一次,也是全球数据库的第一次,这也意味着未来系统的故障恢复时间将真正跨入到秒级时代。
最后,是运营和维护的“低成本”, OceanBase Cloud 的正式发布也让OceanBase能够以更好的计费模式降低服务中小企业的门槛。OceanBase Cloud拥有 OceanBase 100% 的能力,可以让更多中小企业在云上更便捷、更低成本地拥有金融级高性能数据库,最快仅需几分钟即可在云上完成数据库设置。
也正因此,过去一年,OceanBase Cloud 年营收同比增长 300%,已成为强有力的第二增长曲线。据了解,OceanBase Cloud 除支持阿里云外,还将在今年9月份正式上线亚马逊云科技(AWS),后续也将陆续支持全球主流公有云基础设施,这不仅让OceanBase今后可以更好地赋能千行百业,也能够在全球市场更快地实现“开疆拓土”。
对此,杨冰也表示:“历史上OceanBase往前演进的时候一共有两次大的重构,第一次大重构是在0.5版本到1.0版本的过程中,这次大的重构让OceanBase变成今天对等化的分布式架构,成为真正的金融级分布式数据库;而第二次就是3.0到4.0的重构,而这次升级则彻底让OceanBase真正成为了面向云时代的通用数据库。”
从这个角度来看,OceanBase4.0真正诠释了“小就是大”的理念,它不仅让原生分布式数据库真正走向了“small is new big”的新时代,同时通过这种持续的技术创新,实现了不同企业对分布式数据库不同需求的合理匹配,更让“小就是大”成为了撬动产业数字化的关键钥匙,由此让千行百业都能够更好地奔赴数字化的“星辰大海”。
“四位一体”打造创新发动机
值得一提的是,OceanBase除了技术上首次突破分布式数据库的单机性能瓶颈之外,还在服务、生态、开源领域发布了一系列的新政策和新举措,希望以“四位一体”的新模式,释放OceanBase4.0不断创新带来的技术红利。
在服务方面,为了更好地服务行业客户,OceanBase推出“无忧 365”代运维服务,该服务针对客户核心场景,并联合中国信通院、中国人民保险和太平洋保险提供了三种不同等级的服务可用性等级保障方案,最高等级服务可用性达到 99.99%,即可以保障用户每个月单次服务故障不超过 5 分钟。让数据库笔笔算数,“你敢用,我敢赔。”
在生态方面,OceanBase全面升级商业生态策略,未来将构建以“合作伙伴”为中心的商业生态模式,并全面布局区域市场。为此,OceanBase 计划推出“珊瑚计划”,该计划将在未来3年,面向全国重点省会城市,培养 60 家核心经销商。在此基础上,通过政策支持,OceanBase将会帮助核心经销商持续成长,三年实现合作伙伴收入份额占总销售份额60% 以上。
在开源方面,去年6月1日,OceanBase正式宣布开源,经过过去一年多的努力,OceanBase已连接了超过3万多的社区开发者,并有超过100位小伙伴为OceanBase贡献了代码。同样,作为OceanBase的战略方向,OceanBase的开源政策也迎来了再次升级,包括OceanBase 将发布 4.0 社区版,进一步开源OceanBase的内核代码,即针对“MySQL兼容能力”全部开放,此外社区版将享受企业版同等性能等。而接下来,OceanBase 4.X 社区版也会走向“小型化”,未来最小将支持 4 核 8G 小规格,为更多开发者降低应用门槛的同时,也在中国开源数据库产业中贡献出更大的价值。
展望未来,杨冰最后强调说:“产品、服务、生态、开发者‘四维一体’将是OceanBase不断前进的金钥匙;而核心系统升级、全面上云、业务出海将是支持OceanBase未来增长的三级火箭,未来我们针对不同业务规模的客户、不同区域的客户都会提供优质的数据库产品和服务,在为客户创造价值的同时也实现自身的发展和共赢,共同推动中国产业数字化的新进程。”
全文总结,基于单机分布式一体化架构,OceanBase在技术创新上跨出的这“一小步”,对整个数据库产业而言无疑又是重要的“一大步”, 相信OceanBase未来持续的创新,以及在产品、服务、生态和开源领域的不断投入,所释放出来的强大势能,一定会让OceanBase从颠覆自我到颠覆行业,并对重构全球数据库市场的新格局,起到起到更加决定性的价值和作用。