生活在这样一个移动互联网的时代,每个人每天都在生产着大量的“数据”。我们的出行记录、消费记录、浏览的网页、发送的消息是数据,我们听到的音乐、看到的视频同样也是数据。通常来说,这些庞杂的数据会被按照一定的规则,存放在一个名为“数据库”的仓库中。
半个多世纪以来,全球数据库行业在技术和应用上一直处于相对稳定的状态,市场份额上则主要把持在Oracle(甲骨文)等几家欧美公司手中,中国市场亦是如此。相关数据显示,2020年全球数据库市场规模为671亿美元,其中中国数据库市场规模为35亿美元(占全球5.2%),几乎被国外品牌的数据库所垄断。
如果用一个很形象的比喻来说明这样的状况,那就是在过去几十年里,我们把很多重要的信息和数据存放在数据“仓库”中,但实际上这些仓库的钥匙却并不在我们自己手中。直到2010年,阳振坤的一次全新的尝试开启之后,让中国数据库市场开始有了一些新的变化。
阳振坤现任蚂蚁集团副总裁,同时也是OceanBase的创始人、首席科学家。2010年,45岁的阳振坤开始带领团队完全自主研发分布式关系型数据库OceanBase。经过十余年的自主创新,目前OceanBase已获授权发明专利202项,申请发明专利350余项,软件著作权19项,发表论文40余篇,主导和参与国家/行业/团体标准超25项,出版中文专著1部。成果300万行核心代码已基于木兰许可协议并采用OpenCore模式对外开放,致力于构建我国自有产权的数据库产品技术路线和生态体系。
在经历的各项“实战”中,OceanBase已连续10年稳定支撑“双十一”,创新推出“三地五中心”城市级容灾新标准,在2019年和2020年两次刷新了“数据库世界杯” TPC-C的世界纪录,成为榜单上首个分布式关系型数据库。目前,OceanBase已成为金融级数据库核心系统升级的首选。
据公开数据显示,目前,OceanBase已应用于超过1/4国内头部金融机构,并从金融开始走向国计民生、走向海外,现已服务工商银行、建设银行、交通银行、浦发银行、中国人寿、中国人保、中华财险、招商证券、山东移动、江苏移动、中石化、海底捞、理想、GCash等,助力政府机构、金融、运营商、零售、互联网等多个行业的400多家客户实现关键系统升级。
在业内人士看来,OceanBase的成功研发和规模化应用,验证了国产数据库技术在“换道超车”上的可行性,为数据库领域的国际竞争提供了新的赛道与空间,既为各行业分布式架构转型奠定了坚实的基础,也为国家关键行业信息基础设施安全和信息安全保障贡献了力量,还为国家“双碳”战略提供了有力的科技支撑。
在“正国潮”策划全面展开之际,我们专访到了这位自称“蚂蚁集团最老程序员”的阳振坤。他在很多问题上的开诚布公和独到见解,让我们对数据库行业有了全新的认识。
北京日报:OceanBase为什么专注于国产自研数据库?国内市场和产业的发展对于国产数据库有哪些需求?
阳振坤:关系数据库是整个社会的关键信息基础设施,支撑着整个国民经济和社会发展运行。数字经济的高速发展,使得关系数据库从商场、酒店、工厂等封闭环境走向了互联网等开放环境,传统的集中式数据库如Oracle等无法解决像“双十一”这种场景对数据处理的需求,全世界也没有成熟的解决方案,分布式关系数据库OceanBase应运而生。
其实国内市场与产业的发展,对国产数据库的成本要求、可扩展性及数据实时分析能力都有明确的需求。通俗理解,成本要低,性能不能低。现在,OceanBase也在淘宝、支付宝等业务场景得到了很好的打磨,并在国内银行、保险、证券、能源、通信、政务等领域得到了广泛的使用。特别是,在金融机构的核心系统升级里,OceanBase的性能优势体现得尤为明显。
北京日报:区别于国外的数据库,OceanBase在打造国产自研数据库的过程中,在技术上取得了哪些重要突破?这样的国产自研技术对于北京市打造信创产业高地意味着什么?对于国家的战略发展意味着什么?
阳振坤:OceanBase从第一天开始,走的就是完全自主研发的模式,独创了原生分布式数据库的路线和技术,以及到现在的单机分布式技术。研发之初,这些都是别人所没有的,完全和别人不一样。从技术角度来看,OceanBase是分布式数据库的开创者也是引领者,到今天为止,国内大部分还是基于中间件的分布式或者是基于云的共享存储模式,它们其实都是“集中式+”的概念,OceanBase已经是原生分布式,以及单机分布式。在这个维度上,我们是打破了数据库的技术边界的。
事实上,中国的基础软件已经进入有能力进行根创新的阶段,全球关系型数据库产品和技术都在从集中式走向原生分布式,国产数据库也不例外。国产数据库需要积极、主动参与国际竞争,努力成为全球主流数据库。
数据库作为三大核心的“卡脖子”工程,如果能在数据库自研的高地上走出来,必将助力北京的相关产业,同时北京大力发展基础科研的相关政策和举措,也必将有利于像数据库这样的基础科研的突破。这是一种联动模式,对国家来说也是种新型模式的探索。我们需要有信心,同时要有战略定力,只要坚持长期投入,未来国产数据库一定会迎来大爆发。
北京日报:今年三月份,OceanBase宣布开源三大开发者工具,迈出了走向生态化开放的重要一步。开源和生态化开放对于OceanBase来说意味着什么?对于国产数据库的发展来说有什么意义?
阳振坤:数据库的发展,生态是非常核心和关键的。其中,人才培养是数据库行业发展的基石。OceanBase自成立以来,就非常重视数据库人才培养,与华东师大、武大等国内众多高校共建联合实验室、课题研究中心,共同输出论文、专利和科研成果,以及积极参与国产数据库课改合作,用企业的力量去解决学校理论教育和实际工作脱节的问题。
在这个过程中,我们研发了专门锻炼学生内核开发能力的MiniOB教学实战平台及配套教材教程,还连续举办两届OceanBase数据库大赛,通过实际行动助力数据库人才生态建设。
开源,可以让更多的人用起来,让更多的人了解和使用这些工具,从而在这个基础上进行创新。开源最大的好处是可以降低学习门槛,提供共享的学习氛围和工程实践的测试场景,建设一个健康、繁荣的生态。2021年6月,我们正式开源300多万行代码,采用中国的木兰开源协议。开源以来,OceanBase社区版收到了很多开发者和行业用户的积极评价,在互联网、银行、保险等行业用户的生产环境中开始被试用和使用,累计逾300家客户进行了深度实践,其中包括携程、知乎、快手、翼鸥教育、作业帮、翼支付、浦发、360、58同城等客户。
OceanBase已连接了3万多的社区开发者,从2022年10月份开始OceanBase在中国数据库流行度榜单墨天轮上已连续6个月排名第一,在全球数据库流行度榜单DB-engines 排名126名,位居国产数据库前列。只有越来越多的企业参与到自研数据库的生态中来,数据库的产业才会更加地蓬勃发展。
OceanBase正在构建以合作伙伴为中心的商业模式,期待和更多的产业生态进行深度合作,共同推进数据库产业的发展。