一個技術(shù)人“誤入歧途”,做了個向量數(shù)據(jù)庫新物種

向量數(shù)據(jù)庫公司 Zilliz 近日宣布完成一筆 6000 萬美元的 B+ 輪融資,累計融資 1.13 億美元。這在長于本土的開源創(chuàng)企中,無疑是非常耀眼的一筆。

而時間回到 6 年前,當 Zilliz 的創(chuàng)始人星爵帶著 Oracle 出身的背景尋找投資人,說出自己想要造一個新物種時,卻不似當下這番光景,更多時候面對的是投資人的不解:

“怎么誤入歧途呢?”

“你帶著 Oracle 的背景,隨隨便便做個數(shù)據(jù)庫公司,我肯定給你投錢啊。”

這些聲音會讓星爵開始審視要做的事情本質(zhì)上對不對?自己和投資人的溝通方式需要如何改進?但有一點非常明確——敢為天下先,要做就要做這個世界上還不存在的東西,即便在短期內(nèi)不被理解。

所幸,在 2017 年,星爵和他的團隊成功拿到了一筆天使輪融資,開始了對“新物種”的研究?;仡櫣景l(fā)展,星爵將 2017 年的天使輪融資作為第一個里程碑;2019 年將第一款真正意義上的產(chǎn)品 Milvus 開源視作第二個;第三個里程碑則發(fā)生在 2020 年下半年至 2021 年上半年,Zilliz 確立了接下來的“五年規(guī)劃”,即,把全球化作為核心發(fā)展目標。

在過去的 6 年創(chuàng)業(yè)時間里,星爵關(guān)注的重點一直只有技術(shù)創(chuàng)新,從用戶需求中摸索新的方向,然后實現(xiàn)它,并做到極致。商業(yè)化、資本市場的認可等要素尚未進入星爵的重點關(guān)注地帶,但也因為對技術(shù)的追求,讓 Zilliz 正成為下一個基礎(chǔ)軟件市場新星。

“不做”產(chǎn)品做技術(shù)

“在我們剛成立的那段時間里,我們覺得自己做的事產(chǎn)品,但現(xiàn)在回頭去看,我們當時做的是技術(shù)。”

Zilliz 的成立,來自于星爵對新技術(shù)的興趣和自身事業(yè)轉(zhuǎn)型的規(guī)劃。

讀華中科技大學(xué)研究生時,身在中國武漢的星爵跟隨老師參與“網(wǎng)格計算”技術(shù)相關(guān)的研究,這一技術(shù)后來被認為是云計算的前身。機緣巧合之下,星爵所在的小組和由芝加哥大學(xué)教授主導(dǎo)的網(wǎng)格計算項目 Globus 取得聯(lián)系,星爵也加入到 Globus 項目中去,學(xué)習(xí)和研究代碼,并且和 Globus 合作,最終建立起中國教育科研網(wǎng)格——中國最大的網(wǎng)格計算項目之一。

這是星爵第一次通過開源協(xié)作的模式,深度參與到開源軟件的建設(shè),“如果不是開源,我很難想象到,一端是在中國武漢,另一端在美國芝加哥大學(xué),相隔這么遠的實驗室科研人愿能夠連接起來,這對我來說非常陌生,同時也是打開了去學(xué)習(xí)全球最新技術(shù)的大門。”

碩士畢業(yè)后,星爵到了美國數(shù)據(jù)庫專業(yè)數(shù)一數(shù)二的威斯康星大學(xué)麥迪遜分校就讀,2009 年博士畢業(yè)進入硅谷 Oracle 工作,參與當時 Oracle 的云數(shù)據(jù)庫研發(fā)。2013 年,Oracle 12c 版本發(fā)布,主題是為云計算重新設(shè)計的數(shù)據(jù)庫,星爵正是核心開發(fā)人員之一。到了 2015 年,12c 已經(jīng)趨向于穩(wěn)定,星爵萌生了回國創(chuàng)業(yè)的想法。

一方面,此時的星爵在技術(shù)上有過數(shù)據(jù)處理和分布式項目經(jīng)歷,也見識到了一個大型數(shù)據(jù)庫軟件該怎么去做,希望能在不同維度拓寬自身能力。加之受到硅谷創(chuàng)業(yè)文化的影響,星爵想要通過技術(shù)創(chuàng)業(yè),完成從工程師到技術(shù)創(chuàng)業(yè)者的升華。

另一方面,在星爵看來,當時的數(shù)據(jù)分析走到了一個交叉路口,AI 模型、算法的研究如火如荼。基于 AI 研究,對各種非結(jié)構(gòu)化數(shù)據(jù),包括圖片、視頻、自然語言等的研究也到了一個新的高度,并且取得了一些很好的結(jié)果。計算機視覺領(lǐng)域的圖片分類水平也首次超過了人類平均水平。在這種 AI 研究與非結(jié)構(gòu)化數(shù)據(jù)研究的發(fā)展之中,星爵的心中隱隱浮現(xiàn)一個念頭:在數(shù)據(jù)處理的基礎(chǔ)軟件領(lǐng)域,將會有新的技術(shù)出現(xiàn),新的機會正在誕生。

帶著對新技術(shù)的熱情,星爵開始了創(chuàng)業(yè)之旅,“我們選擇了的 AI 應(yīng)用中的數(shù)據(jù)處理賽道,過去 5- 10 年間,中國的 AI 應(yīng)用,以及非結(jié)構(gòu)化數(shù)據(jù)處理是走在全球前列的,無論是數(shù)據(jù)的總量還是使用場景都領(lǐng)先于世界。”秉持著靠近需求源泉的原則,Zilliz 的故事從中國啟程。2017 年,Zilliz 拿到天使輪融資,正式出發(fā)。

成立之后,Ziliiz 最初的定位是將數(shù)據(jù)庫搬到 GPU 上,基于 GPU 硬件加速做新一代 OLAP 數(shù)據(jù)庫系統(tǒng),進而希望將性能提高 100 倍。星爵認為,AI 時代出現(xiàn)了一些 GPU、異構(gòu)計算等新技術(shù),那么便可以嘗試將分布式計算和異構(gòu)計算、數(shù)據(jù)處理等結(jié)合起來。Zilliz 先是做了一個通過 GPU 高效并行算法加速各種數(shù)據(jù)處理的引擎,將這一想法落地。

“我們沒有想清楚把這個引擎用到什么地方去,只覺得這個東西性能很好,很創(chuàng)新,很酷!所以要先把它做出來。”

接下來,便是拿著不斷地和用戶交流,接收反饋。最終,Zilliz 發(fā)現(xiàn)這套技術(shù)可以很好地用在幫用戶去加速 AI 應(yīng)用中向量數(shù)據(jù)的分析和處理,并且此類用戶需求是廣泛存在和飛速增長的。在這樣邊做技術(shù)邊摸索的過程中,Zilliz 逐漸將向量數(shù)據(jù)庫作為核心產(chǎn)品方向,并堅持到了今天。

  開源 + 從用戶需求出發(fā)

埋頭“很酷”的技術(shù) 2 年后,Zilliz 在 2019 年迎來了“技術(shù)產(chǎn)品化”的關(guān)鍵轉(zhuǎn)折點。

在做數(shù)據(jù)分析處理引擎期間,Zilliz 陸續(xù)接到了用戶反饋,看到了向量數(shù)據(jù)分析與處理的強勁需求。以此需求為依托,2018 年下半年開始,Zilliz 啟動了新項目的調(diào)研、開發(fā)工作,并在 2019 年將成果一口氣開源,這個成果便是向量數(shù)據(jù)庫——Milvus。

“對我們來說,是帶著自身積累的,對大規(guī)模數(shù)據(jù)的處理能力、分布式計算能力、異構(gòu)計算等能力,跨越了從技術(shù)到產(chǎn)品的鴻溝,找到了明確的產(chǎn)品方向,即向量數(shù)據(jù)庫。”但對于 Milvus 之后的發(fā)展,當時的星爵心里也沒底:“我們看到了用戶需求,看到了市場機會,但我們不知道自己提供的產(chǎn)品是不是真的能夠完美滿足市場需求。”

出于這個“痛點”,在加上團隊開放的工程師文化,Milvus 從發(fā)布之日起開源,采用 Apache 許可證。“開源開放是我們公司長期以來的基本原則,這是一群工程師很質(zhì)樸的想法,我們希望好的技術(shù)可以更快傳播出去,幫行業(yè)的人取得更好地成功,也通過開源把技術(shù)開放出去,獲得更廣泛地支持。”

對于這款開源產(chǎn)品成功與否的考量,標準只有一條:“它能不能取得一個很好的早期用戶增長。”這個結(jié)果直觀反映出產(chǎn)品是否真正解決了用戶的痛點,是否真的為其他開發(fā)者創(chuàng)造了價值。最終,在開源的半年內(nèi),擁有了約 60 家企業(yè)級用戶。“我記得從有了第一個用戶之后,基本上每周都會有捷報,最初是每周一個用戶,然后第二周增加了三四個,第三周又增加了七八個。”

事實上,Milvus 瞄準的價值市場,在過去基本是一篇空白。

在星爵看來,數(shù)據(jù)庫行業(yè)在過去 20 年經(jīng)歷了一場巨大的“分化”,關(guān)系型數(shù)據(jù)庫、分布式數(shù)據(jù)庫、圖數(shù)據(jù)庫、文檔數(shù)據(jù)庫、時間序列數(shù)據(jù)庫……未來,在 AI 時代,會有更多數(shù)據(jù)庫類型出現(xiàn),“比如我們現(xiàn)在提到量子計算,那很有可能接下來會出現(xiàn)一個面向量子計算的數(shù)據(jù)庫。”整體上,這個行業(yè)在不斷的分工與分化,類似汽車行業(yè),在過去 100 年間,發(fā)展出幾十上百個細分品類,在數(shù)據(jù)庫領(lǐng)域也是同樣,并且有兩點是不變的:

第一,人類的需求是不斷增加的,第二,人類社會的數(shù)字信息化程度在不斷提高,那么人們對數(shù)據(jù)分析和處理的需求必然也是在上升的,因此便會催生出更多數(shù)據(jù)的應(yīng)用場景,而在每個新興的應(yīng)用場景之下,都會出現(xiàn)一些更加具體、分工更加明確的數(shù)據(jù)庫產(chǎn)品。

那么,再看回 Milvus,它并不需要和其他種類的數(shù)據(jù)庫做比較,而是專注于為 AI 應(yīng)用處理非結(jié)構(gòu)化數(shù)據(jù),比如為金融應(yīng)用做欺詐分析、做物聯(lián)網(wǎng)領(lǐng)域的移動 APP 等等,滿足新興的非結(jié)構(gòu)化數(shù)據(jù)處理需求即可。

不僅僅是 Milvus,對于所有項目,Zilliz 的判斷標準只有“需求”。

2021 年 9 月,Zilliz 發(fā)布 Millvus 的上游軟件 Towhee。

“我們推出新項目只考慮一個問題,那就是解決用戶需求。”Zilliz 會從用戶需求中提煉出該做一個怎樣的產(chǎn)品給到用戶。具體到 Towhee,本質(zhì)是用戶在使用Millvus 的過程中,雖然能很好地解決數(shù)據(jù)分析問題,但是對于一些中小型公司來說,從各種不同的非結(jié)構(gòu)化數(shù)據(jù)中提取向量數(shù)據(jù)本身需要投入很多資源。因此,為了解決這部分用戶需求,Zilliz 推出開源的 embedding 框架,包含豐富的數(shù)據(jù)處理算法與神經(jīng)網(wǎng)絡(luò)模型,可以幫助用戶完成原始數(shù)據(jù)到向量的轉(zhuǎn)換。

在評估需求方面,Zilliz 的方法非常“樸實”,通常是在用戶群中主動收集或接收需求,然后將用戶反饋做匯總、歸類、排序,篩選出高頻需求,歸納趨同的需求。然后將數(shù)據(jù)結(jié)果放到研發(fā)社區(qū)做進一步討論,最終根據(jù)討論結(jié)果規(guī)劃產(chǎn)品的設(shè)計與迭代排期。

只在云上掙錢

對于做技術(shù)該怎么掙錢的問題,星爵和他的團隊很早就有一個標準:在公有云上通過服務(wù)賺錢。

落實到具體在什么時候?qū)崿F(xiàn)商業(yè)價值的轉(zhuǎn)換,就變得非常“隨緣”。

2019 年 Milvus 產(chǎn)品開源之后,很長一段時間內(nèi),這只隊伍都沉浸在“如何打造一個全球技術(shù)領(lǐng)先的產(chǎn)品”的目標之中?;乜串敃r的想法,星爵是抱著“如果這個技術(shù)和產(chǎn)品能夠解決用戶的痛點,同時技術(shù)上又是全球領(lǐng)先的,那么一定能為公司創(chuàng)造價值,所以前些年我們并沒有太去考慮商業(yè)模式,而是專注的把產(chǎn)品做好。”

對于 Milvus 團隊來說,2020 年底,產(chǎn)品開始邁入成熟階段,Milvus 已經(jīng)擁有 500 多家企業(yè)級用戶,產(chǎn)品趨于穩(wěn)定。一方面,他們發(fā)現(xiàn)了新的用戶核心需求:用戶希望能在云上使用,在云上提供一個更加便捷的云服務(wù)。對用戶來說,云服務(wù)可以省去安裝部署的步驟,直接通過 API 調(diào)用,那么開發(fā)和維護成本也會降低。結(jié)合這兩方面的因素,Zilliz 啟動了公有云產(chǎn)品的研發(fā)。

日前,Zilliz Cloud 的測試版本正式上線。Zilliz Cloud 定位于依托公有云的全托管數(shù)據(jù)庫即服務(wù),旨在為向量數(shù)據(jù)處理、?結(jié)構(gòu)化數(shù)據(jù)分析和企業(yè) AI 應(yīng)?開發(fā)提供?站式解決案。

Zilliz Cloud本質(zhì)是 Database as a service,是將 Zilliz 向量數(shù)據(jù)庫的能力以云上全托管的方式提供給用戶,免去用戶部署和運維的工作。同時,也幫用戶解決云上數(shù)據(jù)安全的問題,包括數(shù)據(jù)合規(guī)、高可用、容災(zāi)等等,為各類在開發(fā) AI 應(yīng)用的企業(yè),在其開發(fā)過程中,極大地簡化非結(jié)構(gòu)化數(shù)據(jù)管理的過程。

在云產(chǎn)品之前,Milvus 開源社區(qū)的用戶想向 Zilliz 購買服務(wù)的,都會遭到拒絕,“很為很早之前我們就決定,云才是我們商業(yè)產(chǎn)品的形態(tài),除此之外,不會收用戶的錢。”

事實上,許多開源的基礎(chǔ)軟件都和 Milvus 一樣,在走一條開源+長時間免費的道路。在星爵看來,基礎(chǔ)軟件的第一個特質(zhì)就是技術(shù)門檻高,那么在研發(fā)階段,就是一個慢工出細活的活動,需要長期投入,不斷總結(jié)用戶需求,將其做成通用產(chǎn)品。另一大特質(zhì)則是一旦做出了個全球領(lǐng)先的技術(shù)和產(chǎn)品,就會出現(xiàn)“贏者通吃”的格局。而這也是 Zilliz 長期堅持以技術(shù)主導(dǎo),開源開放的重要原因之一。

談?wù)劗斚?/strong>

當下,Zilliz 正沿著一年多前定下的策略,走全球化的路子。具體到剛剛起步的云服務(wù)業(yè)務(wù),北美市場將是接下來一兩年關(guān)注的重點。

“如果我們看全球市場的估量,在基礎(chǔ)軟件領(lǐng)域,美國市場占全球市場的 30%-40% 左右,是全球第一大單一市場。”因此,將全球劃作為目標的 Zilliz 將國際化的主戰(zhàn)場放到了北美。目前 Zilliz Cloud 已在 7 月支持 AWS,接下來將會進一步擴展能力,形成多云方案,包括支持谷歌 GCP,微軟的 Agile,實現(xiàn)北美三大公有云的跨云方案。

對于 Zilliz 來說,其與大型公有云廠商之間是競合關(guān)系,一方面 Zilliz Cloud 依托于公有云平臺,另一方面,在星爵看來,同臺競技也更能催生技術(shù)創(chuàng)新,“我們的信心是源于我們是一個創(chuàng)業(yè)公司,可以更快速地迭代產(chǎn)品,實現(xiàn)技術(shù)創(chuàng)新,所以在和公有云廠商同態(tài)競技的時候,我們會堅持開源開放,唯有產(chǎn)品和技術(shù)能保持核心競爭力,才能最終與大象共舞。”

談及 Zilliz Cloud 未來的發(fā)展,星爵并沒有做過多預(yù)測:“我不做預(yù)測,我們公司也很少做預(yù)測,預(yù)測容易打臉”。而商業(yè)化和營收,也依舊不是當下星爵關(guān)注的重點。面對在資本市場取得的成績,星爵將其歸因為團隊以技術(shù)為導(dǎo)向,敢為天下先地去創(chuàng)造了新技術(shù),并將其做到極致,“大家都知道稀缺性很重要,但往往在親身實踐的過程中,會發(fā)信追求稀缺性是一件很奢侈的事情,稀缺性是孤獨的,相當不確定的,高風(fēng)險的。”

同時,在星爵看來,將產(chǎn)品和技術(shù)做到極致之后再談商業(yè)化,也會更加容易實現(xiàn),“我們要先打造一個優(yōu)異的產(chǎn)品,這個產(chǎn)品如果不做到全球領(lǐng)先,我們認為就不應(yīng)該推向市場,更不應(yīng)該拿去賣。”

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )