文 | 第一新聲,作者 | 竹心
上世紀80年代, 中國數據庫開始萌芽; 90年代, IBM、Oracle壟斷國內數據庫市場; 本世紀初, 「四朵金花」陸續成立; 10年代, 互聯網公司開啟「去O」浪潮; 到了20年代, 國產數據庫已然呈現出「百花齊放」的態勢。 當前, 國產數據庫仍在不斷追趕與超越。
據國資委2022年釋出的檔,截止到2027年,「2+8+N」黨政與八大行業要實作數據庫的100%國產替代。
如今2024年接近尾聲,但面對國產數據庫去「IOE」的口號和替換時間表,行業的態度卻各有不同,有的企業已經在分享核心系統替換經驗,也有企業依然認為替代難度太大,不敢輕易嘗試……
目前國產數據庫到底能力如何?具不具備市場競爭能力?國產數據庫替代倒計時下,各行業的替換進展和成效如何? 在歷經一系列調研、采訪及資料整理後,第一新聲摸清了國產數據庫行業替代行業畫像。
國產數據庫的起步發展:從突破壟斷到「百團大戰」國產數據庫的發展,大致經歷了幾個發展關鍵期:
中國國產數據庫發展歷程
國產技術萌芽期1980s: 二十世紀八十年代,薩師煊教授和王珊教授 推開了中國數據庫領域的大門 ,培養了中國數據庫的第一代人才。
國外廠商壟斷期1990s: 1989年,Oracle進入中國;1991年,Sybase進入中國;1992年,IBM進入中國;DB2、Informix拿下金融行業市場;1997年,Oracle拿下電信市場。
這一時期的 國外數據庫幾乎壟斷了中國數據庫市場, 占中國數據庫市場規模80%以上。但是中國也有了第一代原型數據庫,比如東軟的Openbase、中軟的Cobase和華科的DM Database。
國產廠商萌芽期2000s: 基於863、核高基、973計劃,人大金倉、武漢達夢、南大通用、神舟通用等一批高校背景國產廠商成立。
進入二十一世紀後,國家的863 計劃設立了[數據庫重大專項],有了國家政策的扶持,並稱「國產數據庫四朵金花」的人大金倉(1999年)、達夢數據庫(2000年)、南大通用(2004年)、神州通用(2008年)開始發展。不過在原有的傳統關系型數據庫領域裏,Oracle 和 IBM 的先發優勢太大了,當時的環境要求的是經濟發展,而不是自主可控,於是國產數據庫進入了死迴圈,沒有市場就無法驗證數據庫是否可靠,無法驗證數據庫是否可靠那麽就沒有公司敢用,也就沒有市場。
快速發展期2010年至今: 雲端運算時代和開源社區的興起,國產數據庫開始了彎道超車。
萬事需要契機,外力也在推動這一切。2014年,「棱鏡」事件爆發,行業深刻意識到資訊保安的緊迫性以及自主可控的必要性。「四朵金花」等國產數據庫被廣泛關註。融資的融資,給專案的給專案,國產數據庫開始迎來黃金發展期。以前都是背靠產學研這條線,自阿裏喊出了「去IOE」的口號,騰訊、百度、華為等互聯網和IT巨頭也參與到國產數據庫的開發之中,國產數據庫開始了自身的市場實踐之路。與此同時,一系列優秀的數據庫和數據庫公司誕生了,比如TiDB、OceanBase等,這也造就了2020年國產數據庫「百團大戰」的盛況。
據資料顯示,2015年中國數據庫軟件市場規模為85.37億元,2017年中國數據庫軟件市場規模增長至120.00億元,其中國產數據庫產品市場規模為17.15億元,國外產品市場規模為103.07億元,國產數據庫產品國內市場份額占比從2009年的4.0%增長至2017年的14.26%。
「去O」浪潮下,甲骨文壟斷地位受到沖擊,2019年5月宣布中國區裁員500多人,這也標誌著國產數據庫替換「國進外退」局面的初步形成。
2022年深化階段: 據2022年9月國資委79號檔,截止到2027年「2+8+N」黨政與八大行業完成100%國產替代,替換範圍涵蓋芯片、基礎軟件、作業系統、中介軟體等領域。
在信創政策催化下,分布式數據庫、雲部署等技術不斷成熟,國產數據庫發展視窗被開啟,新舊交替的歷史行程按下了加速鍵。
黨政領域基本完成,金融領域整體替換率不高國資委79號檔中的「2+8+N」,「2」是指黨政,是信創產業發展的首要領域,「8」是金融、電力、電信、石油、交通、教育、醫療、航空航天等關於國計民生的八大行業,也是信創產業發展的重點行業,「N」是指包括消費市場和各種企業級市場,是信創產業未來發展的潛在市場和增長點。
根據第一新聲調研,目前黨政領域的數據庫國產替代率高達80%,已經基本處於替換的尾聲階段。
國產數據庫替代在黨政領域成功試水後,開始逐步向八大行業穩步滲透。
得金融者得天下。
金融業數據庫使用情況一直是數據庫產業發展風向標。1998年,IBM DB2、Informix在金融核心系統落地商用,奠定了此後20年大小機在核心系統的格局。如今,金融業成為大小機下移的急先鋒。
而國產數據庫替換領域一直流傳一句話:「金融摸著銀行過河,銀行摸著石頭過河。」
銀行領域的國產數據庫無痛遷移,成為金融行業乃至整個國產數據庫成功替換的關鍵。 數據庫作為基礎軟件,需要幾十年如一日的積澱,各大金融業開始了不同場景下的不同程度的業務替換。
時間拉回到十年前,國產數據庫替換已經在非傳統銀行的金融場景中布局。如國產數據庫OceanBase在2014年雙十一購物節上成功接管了支付寶10%的業務流量,2016年將支付寶所有核心數據遷移至OceanBase,全面支持支付寶的所有核心業務鏈路和五大業務板塊;繼支付寶之後,2015年成立的全球首家雲上銀行——網商銀行,於2017年全面采用OceanBase數據庫,成為銀行業中率先實作100%去IOE和自主可控的機構。2015年,微眾銀行核心系統正式上線,TDSQL也承載了微眾銀行數百個核心系統和全行所有OLTP業務,成為第一個使用在銀行核心系統的國產數據庫。
除了在非傳統銀行的金融場景試點,小型金融企業的核心系統也是國產數據庫的嘗試領域。
2019年,張家港農商行采用國產數據庫的新核心系統上線投產且高效穩定執行,成為中國傳統商業銀行核心業務系統成功采用分布式國產數據庫替代國外數據庫的首個落地案例。2019 年 5 月,華為GaussDB OLTP 數據庫在招商銀行綜合支付交易系統和工商銀行內成功上線投產;2019年中信銀行采用分布式數據庫GoldenDB,這是國內首個在大型股份制銀行信用卡核心系統中成功套用的國產分布式數據庫;湖北銀行、梅州客商行則分別在2019年、2020年采用達夢數據庫搭建的銀行核心解決方案,實作核心業務的全面接管。
越來越多銀行核心系統替換成功落地的案例,極大提升了業界對國產數據庫的認可,也加速了替換的行程。
此時國家政策的釋出如虎添翼。國家釋出三年實作金融核心系統的國產替代的目標:經過2019年-2021年三年金融信創試點,2022年金融信創將進入全面推廣階段。國家明確要求第一年實作OA等外圍系統的國產替代,第二年實作業務系統的國產替代,第三年實作核心系統的國產替代。同時宣布第一批國產化試點金融機構,包括主要的國有大行、頭部券商、交易所等共47家,要求當年新增IT采購的5%實作國產化,第二年實作15%,之後,又有兩批機構進入試點,一共接近150家。
時間表已定,各大銀行開始穩步推進數據庫遷移。 據不完全統計,2022年國產數據庫46%的采購單位集中在金融領域,其次是政府,占比達18%。這一趨勢也延續到了2023年。2024年上半年已經有130多個數據庫專案落地,而金融行業集中了近6成的專案,營運商其次,占比超15%。
但根據第一新聲調研及不完全統計結果,截至目前,八大行業由於對國產數據庫的穩定性、遷移難度、運維難度等方面要求更高,所以整體替換率依然不高。金融行業非核心系統處於40%左右。但即使在政策和市場的加持下,中國整體銀行業國產數據庫替代約為20%,國外數據庫在銀行核心系統的占比仍在80%以上。能源行業不足15%,醫療、制造、教育等多個行業甚至不足5%,這距離「2027年’2+8+N’黨政與八大行業完成100%國產替代「還有長的一段路要走。
叫好不叫座:數據庫遷移難度大、成本高在首位叫好不叫座,是目前國產數據庫面臨的尷尬局面。
特別是在金融領域,國產數據庫替代更多還是辦公系統和業務系統層面進行嘗試,而對核心交易系統的數據庫國產化多少還存在猶豫。畢竟金融行業向來倡導「無失真運維」,業務架構和程式碼調整以及不同數據庫平滑遷移的風險,讓眾多大型金融機構不敢貿然在核心系統替換上邁出太大的步子。
首先,在數據層面,數據一致性、數據安全性和程式碼安全性是最重要的考量因素。 尤其在金融和政府等行業,數據安全永遠排在第一位。
其次,在功能層面,包括相容與遷移能力、事務處理能力和大數據即時處理能力。 企業最擔心的因素是相容性。因為更換了數據庫後,向下需要擔心伺服器、芯片和作業系統的適配性,向上還要考慮OA、ERP等套用系統的相容性。
最後,在效果層面,包括穩定性、可靠性與性價比。其中,穩定性也是廠商和機構在選購時最在意的因素。
面對市場投擲的需求,國內數據庫廠商則良莠不一。縱觀整個數據庫替換,從傳統集中式數據庫向國產化數據庫轉型升級仍然面臨著開源數據風險、套用相容性、系統可用性、效能和擴充套件性、遷移成本等一系列挑戰。
一是數據庫遷移難度大、成本高。 這是國產數據庫替換首當其沖的問題。主要聚焦在遷移過程中的相容性、數據安全、停機時間、數據校驗和效能保證等;缺乏數據庫的一站式管理、運維與備份的復雜度高等也是數據庫遷移後維護的一大難題。在遷移成本中,也包括相容性的問題。一般來說,一家企業完成數據庫的國產替代需要花上2~3年的時間,在這過程中需要評估改造難度,一旦相容性出現問題,損失重大。
二是開源數據庫風險。 開源數據庫在銀行業廣泛使用,根據第一新聲調研,當前中國銀行業在用國產數據庫中,閉源數據庫占比僅為25.6%,大部份國產數據庫都是在現有的開源基礎上進行修改,國產數據庫在研發、專利和程式碼自主化程度上低都是經常被人詬病的幾大難點。但開源數據庫存在不同開源協定要求和限制差別較大、安全漏洞、侵權感染、停服斷供、政策風險、掌控能力不足等潛在風險。
三是國產數據庫生態不完善客觀存在。 銀行引入國產數據庫的同時涉及到整個生態系,包含管理、監控、備份、最佳化等需要相配套系列上下遊夥伴共同推進,當前銀行業數據庫尚無事實標準和頭部企業出現,各家技術選型未確定情況,ISV只能基於oracle標準或MySQL標準。
四是國產數據庫效能和功能不完善。 相較於Oracle等傳統商業數據庫,國產數據庫在高可用、高效能等方面表現不足。如在業務高峰期存在一定的效能壓力,面對復雜情況的漏洞發現和修復能力也差強人意。
國產化對於整個中國科技來說,都是一件重要的事情,但整個市場大部份原因卻是被政策催熟,在政策和市場都在全面加速的情況下,國產替換氛圍感拉滿但產品不給力,替換行程依然堪憂。
黨政領域重心下沈,金融領域進入深水區當前,在政策利好和市場推動下,國產數據庫依然在各個領域采取積極謹慎態度,調整不同行業的替換節奏。
第一新聲在大範圍調研後總結出了國產數據庫替換兩大特征:
一是在黨政領域,數據庫市場重心由省部級向地市、區縣下沈。 黨政領域內部辦公與電子公文在省部級的存量替換已接近尾聲,當前向地市和區縣大面積下沈,地方政府采購訂單逐漸增加。
二是在八大行業,數據庫正從非核心、次核心系統向核心突破, 不同於黨政,八大行業更加註重國產數據庫的穩定性,為了防止核心業務風險的出現,前幾年國產替換主要以非核心系統為主。以金融業為例,銀行核心系統的國產數據庫替代率15%左右;證券和保險核心系統的國產數據庫替代率不超過20%。相關領域將成為未來三年國產替代的重點。
資本和企業都認為,國產化是中國數據庫的絕佳機會,據調研機構Gartner預測,到2025年,中國分析型數據庫、交易型數據庫來自海外廠商分別將僅剩約30%和50%,國產化的需求如同風浪,正引導國產數據庫走向未知。
新王換舊王,遠非一日之功。
「2027年完成100%國產化替代」不是終點,更應該是國產化數據庫發展的裏程碑。 正如騰訊雲數據庫副總經理羅雲所說:「國產化之路依然道阻且艱,國產數據庫如何在產品服務和生態上全面跟進,需要甲方與乙方的共同合作,耐心應對過程中的坎坷與挑戰,才能確保國產化戰略的穩步推進。」