在數據倉庫體系發展的二三十年間,企業數據管理架構逐漸面臨嚴峻挑戰。數據孤島現象普遍,多源異構數據導致治理困難,而數據搬運和開發成本高昂。為了應對這些問題,企業曾寄望于數據中臺,但這一方案卻帶來了更多挑戰,如數據建模與任務運維的人力需求激增,使得數據中臺變成了企業的成本中心。
近年來,一個名為“數據編織”的新概念逐漸進入人們的視野。它將企業內部散落的數據編織成一張虛擬的數據網,僅在需要時才觸發任務,實現了數據的“柔性制造”。Gartner在其發布的《2024年中國數據、分析和人工智能技術成熟度曲線》中,將數據編織視為一種前瞻性的技術理念,并預測其在未來2到5年內將廣泛應用。根據2022年全球行業分析師報告,全球數據編織市場預計將從2020年的11億美元增長到2026年的37億美元,市場需求強勁。
在這樣的背景下,成立于2021年的Aloudata作為國內將數據編織落地的先行者,正在穩步前行。公司創始人兼CEO周衛林,在離開螞蟻金服后,與幾位聯合創始人共同創立了這家企業。周衛林在阿里巴巴和螞蟻金服的工作經歷,讓他深刻意識到數據工程變革的急迫性。在螞蟻金服工作期間,他見證了數據量的爆炸式增長,以及數據治理的復雜性。
Aloudata的CMO劉靚指出,數據中臺存在諸多弊端,如存算成本高、數據資產冗余、數據工程師能力要求高等。更重要的是,數據中臺并未能從根本上解決大量數據分析帶來的數據管理問題。而數據編織則提供了一種新的解決方案,通過動態虛擬集成數據,實現ETL自動化,降低了數據管理的復雜性。
周衛林和劉靚帶領團隊,在成立后不久就與招商銀行簽約,開始打磨產品。他們規劃了清晰的商業化三步走戰略:先與頭部客戶合作,打磨出最小可用的技術產品,完成PMF驗證后,再進行市場化推廣。經過兩三年的努力,Aloudata在2023年底發布了其三個商業化產品:國內首個邏輯數據平臺Aloudata AIR、全球首個算子級血緣的主動元數據平臺Aloudata BIG和自動化指標平臺Aloudata CAN。
Aloudata AIR和Aloudata CAN是數據編織的落地產品。在Aloudata AIR上,數據邏輯集成無需物理搬運,只需連接獲取元數據信息。用戶可以在邏輯集成的基礎上用SQL語言跨源開發邏輯視圖,無需關心任務的編排和調度。而Aloudata CAN則實現了數據倉庫匯總層和應用層的自動化,將業務語義和物理數據鏈路解耦,開放所有明細以供靈活分析。
Aloudata BIG則主要自動采集和解析元數據,精細刻畫數據之間的點和線關系,實現數據治理場景的高度自動化。不同于傳統血緣工具,Aloudata BIG能精細到某個具體字段算子級的加工邏輯。
然而,這套產品的誕生并非一帆風順。起初,Aloudata團隊希望直接從數據工程的智能化L5階段做起,但技術難度和市場接受度都超出了預期。在經歷了八九個月的嘗試后,團隊決定調整方向,增加人可以決策的部分,讓客戶更有安全感,從而推動商業化進程。
周衛林感慨,創業過程中最大的挑戰之一是避免將大廠的做事習慣帶入創業公司。創業公司需要找到更多有能力從0到1的人,補齊團隊能力。在商業決策上,Aloudata也摸著石頭過河,學會了在客戶定制化需求和公司研發節奏之間做出取舍。
如今,Aloudata已經簽約了二十幾家客戶,金融行業占比六七成。客戶涵蓋銀行、證券、品牌零售、先進制造、醫療等多個行業,包括工商銀行、民生銀行、興業銀行、平安證券、華泰證券、麥當勞、lululemon、理想汽車等頭部客戶。周衛林表示,公司對商業化進展頗為滿意,已經進入商業化收獲期,預計2025年將逐步走向盈利,營收能再翻三倍以上。
未來,Aloudata計劃結合大模型,發揮其語義理解能力和行動力,提高數據處理分析效率,真正實現數據工程智能化。站在大模型的肩膀上,Aloudata距離其數據工程領域“L5”的夢想將更近一步。