數(shù)巔科技創(chuàng)始人及CEO何昌華博士

從場景出發(fā)向下發(fā)力,拓展“大模型+工具”模式的進化空間,也許恰是更有助于國內(nèi)企業(yè)突圍的數(shù)據(jù)智能“北坡”路線。數(shù)巔科技一路走來,留下的每一步腳印都值得借鑒。

偉大的公司都是從“一個問題”開始

對何昌華博士來說,數(shù)據(jù)智能并非從天而降,創(chuàng)業(yè)的想法也不是心血來潮,最初的種子很早就在土壤中萌芽了。

在斯坦福大學,“同學們都想找更好玩的企業(yè)或自己創(chuàng)業(yè)”,這種氛圍讓何博士感同身受。加入谷歌后,他發(fā)現(xiàn)“搜索引擎的商業(yè)模式就是收集全世界的數(shù)據(jù),并用數(shù)據(jù)解決問題”,大數(shù)據(jù)、人工智能等技術(shù)創(chuàng)新也隨之產(chǎn)生,這正是數(shù)據(jù)智能賽道的根基。

后來,何博士主導(dǎo)的咖啡因項目獲得谷歌公司最高的技術(shù)獎項,但他還是因為“不甘于平淡”而選擇加入國內(nèi)頂尖的金融科技公司。金融行業(yè)數(shù)據(jù)規(guī)模大、質(zhì)量好,曾被何博士當作實踐數(shù)據(jù)智能理想的最佳舞臺。

然而,他逐步發(fā)現(xiàn)金融行業(yè)也存在諸多碎片化場景,業(yè)務(wù)與技術(shù)的分割問題屢見不鮮,很多AI應(yīng)用因投入產(chǎn)出比不高而被迫擱淺。

這讓何博士開始反思:與其糾結(jié)于數(shù)據(jù)智能的宏大敘事,不如做些更實在的事情——“降低數(shù)據(jù)智能的使用門檻”,才是市場中最迫切需要解決的真問題。

每一家偉大的公司,都是從“一個問題”開始的。2022年,何昌華博士著手組建創(chuàng)業(yè)團隊,數(shù)巔科技由此啟航。

大模型是數(shù)據(jù)智能全鏈路自動化的終極答案

在創(chuàng)業(yè)初期,數(shù)巔科技的解題思路是“DataOPS+MLOPS”,將數(shù)據(jù)治理與模型訓(xùn)練、推理結(jié)合起來,為客戶提供一攬子工具,使其更容易操作,進而降低使用門檻。

從公司愿景的角度看,實現(xiàn)從數(shù)據(jù)到智能決策的全鏈路自動化,是何昌華博士夢寐以求的目標。他以自動駕駛進行類比:即使暫時做不到L4、L5,也至少可先做到L3,再通過“副駕”(工程師)輔助,讓用戶的感受接近L4甚至L5。

那時,面對紛繁復(fù)雜的數(shù)據(jù)場景,大多數(shù)人工智能公司主要借助AI小模型解決痛點問題。每個場景往往對應(yīng)不同的AI算法,要分別做調(diào)整和優(yōu)化。這意味著“副駕”的負擔很重,距離自動化還比較遙遠。

直到2022年11月,大模型橫空出世,何博士在親自試用并向業(yè)界朋友詳細了解“內(nèi)情”之后,又經(jīng)過了反復(fù)思考的過程,最終得出了自己的判斷:“大模型為數(shù)據(jù)智能全鏈路自動化提供了真正可能”。

其實,這個結(jié)論的形成并非一帆風順。彼時盛行一種說法——“大模型是人類所有已知知識的壓縮”。如果大模型能回答一切問題,那么數(shù)據(jù)處理和分析環(huán)節(jié)就可能失去獨立存在的價值。

擅長獨立思考的何博士卻有不同的看法:根據(jù)大模型的基礎(chǔ)架構(gòu)和計算模式,還不能做到“包打天下”。擁有知識也不是大模型的必要條件,基于知識產(chǎn)生邏輯判斷才是其核心能力。因此,所有數(shù)據(jù)應(yīng)該通過企業(yè)數(shù)據(jù)和外掛的知識庫來解決,大模型則調(diào)用不同工具完成相關(guān)任務(wù)。

由此可見,大模型非但不是數(shù)據(jù)公司的“終結(jié)者”,而且可能成為數(shù)據(jù)智能全鏈路自動化的“拯救者”。與過去的AI小模型相比,大模型解決的最關(guān)鍵問題是以通用的語言溝通能力和任務(wù)拆解能力,取代大部分需要定制化的服務(wù),為數(shù)據(jù)智能自動化奠定堅實基礎(chǔ)。

當然,自動化不可能一蹴而就,對于某些應(yīng)付不了的問題,大模型還可調(diào)用工具加以解決。有人可能“抬杠”——以前定制小模型,現(xiàn)在定制工具,不是一樣的嗎?區(qū)別在于,工具可以做到標準化,且數(shù)量級規(guī)模比場景小很多,這對自動化帶來的正面影響足以催生質(zhì)變。

打造驅(qū)動數(shù)據(jù)智能真正落地的企業(yè)大模型

對數(shù)巔科技這樣的開拓者而言,看清戰(zhàn)略方向之后,更重要的是打磨產(chǎn)品及方案,解決數(shù)據(jù)智能的落地難題。

第三方機構(gòu)的研究表明,在AI應(yīng)用落地進程中,80%的問題出在數(shù)據(jù)上,20%的問題與算法有關(guān)。通常的情況是,做數(shù)據(jù)的公司缺乏AI基因,而做AI的公司多數(shù)也不精于數(shù)據(jù)。

數(shù)巔科技的核心團隊來自數(shù)據(jù)、計算存儲、AI等多個領(lǐng)域,在技術(shù)創(chuàng)新、產(chǎn)品研發(fā)、商業(yè)化運作等方面都擁有豐富經(jīng)驗,這為打破AI與數(shù)據(jù)之間的壁壘、構(gòu)建企業(yè)大模型創(chuàng)造了必要條件,openAI收購Rockset也印證了這一內(nèi)在邏輯。

在大模型領(lǐng)域存在一個悖論——無法在同時滿足高準確率、高通用性和低成本的情況下,確保項目落地實施。數(shù)巔科技在用戶可接受的范圍內(nèi)做了一些調(diào)整,將“高準確率”定義為業(yè)務(wù)可用,即準確率足夠高,出錯的時候能被用戶識別,且可解釋產(chǎn)出的結(jié)果。

從降低客戶使用門檻的角度看,企業(yè)大模型的性價比也至關(guān)重要。因此,數(shù)巔科技將“低成本”定義為項目落地初期的成本一定要低,可以單機部署,且使用和維護零門檻;同時將“高通用性”定義為能夠工具化、自動化。

據(jù)何昌華博士透露,在數(shù)巔企業(yè)大模型研發(fā)過程中,發(fā)現(xiàn)300億到500億參數(shù)產(chǎn)生的邏輯能力已經(jīng)足以解決給定場景的問題,且調(diào)用相關(guān)知識和工具后通用程度也較高,這樣就能解決客戶做數(shù)據(jù)分析的實際問題。

測試結(jié)果顯示,數(shù)巔百億大模型分析準確度達95%以上,遠超千億大模型 GPT4+NL2SQL70%左右的準確度。在不拼參數(shù)規(guī)模也能取得好成績的背后,離不開一件“秘密武器”的鼎力支撐。

數(shù)巔企業(yè)大模型

在數(shù)巔企業(yè)大模型的底座中,數(shù)據(jù)虛擬化引擎X-Engine發(fā)揮著舉足輕重的作用。它為數(shù)巔企業(yè)大模型提供多模態(tài)數(shù)據(jù)的統(tǒng)一接入、計算存儲、數(shù)據(jù)治理、數(shù)據(jù)加速等一站式能力,堪稱數(shù)據(jù)智能自動化的最佳推進器。

與傳統(tǒng)的數(shù)據(jù)治理ETL模式不同,X-Engine提供的是一張?zhí)摂M的表,生成這個表無需耗費計算存儲資源,只有訪問數(shù)據(jù)的時候才進行計算。為了無限接近隨取隨算的理想狀態(tài),數(shù)巔科技一方面提升計算存儲性能,比業(yè)界同類產(chǎn)品增強5至10倍;另一方面用智能引擎做預(yù)測,基于預(yù)測提前自動生成結(jié)果,并以系統(tǒng)自適應(yīng)的方式覆蓋超預(yù)期需求。在X-Engine的加持下,數(shù)據(jù)全鏈路自動化的夢想逐漸照進現(xiàn)實。

以某頭部銀行信用卡業(yè)務(wù)財務(wù)中心進行財務(wù)數(shù)據(jù)分析和洞察的場景為例:該行有近1萬名員工負責各分行的損益分析,每到月底會面臨大量取數(shù)、制表、制圖、解讀等工作。在生成式智能分析應(yīng)用AskBI的助力下,員工通過自然語言交互,即可完成229條以上的財務(wù)指標及數(shù)十個維度的自由組合分析,員工1分鐘內(nèi)即可快速獲取各財務(wù)數(shù)據(jù)分析和報表查詢,準確率可達90%,顯著提升了員工的工作效率以及銀行的數(shù)字化管理能力。

雖然市面上也有類似功能的產(chǎn)品,但大多與AskBI的定位和演進方向不同。一些產(chǎn)品將自然語言直接生成代碼,主要為工程師服務(wù),而AskBI則定位于“大模型幫助企業(yè)基于數(shù)據(jù)做決策”,提供從數(shù)據(jù)提取到報表生成再到歸因洞察分析的完整鏈路,促進數(shù)據(jù)智能全面落地。

據(jù)了解,數(shù)巔企業(yè)大模型解決方案已在金融、通訊和制造業(yè)等場景成功落地,朝著端到端地幫助企業(yè)解決從數(shù)據(jù)到?jīng)Q策的難題邁出關(guān)鍵一步。站在更長遠的視角,“讓數(shù)據(jù)智能像水電一樣簡單”,讓每位員工都可以基于生成式智能分析做出數(shù)智化決策,真正實現(xiàn)數(shù)據(jù)智能決策全民化,是數(shù)巔科技的發(fā)展愿景。何昌華博士表示,如果大模型調(diào)用工具解決數(shù)據(jù)全鏈路自動化這條路走得順利,能在三年內(nèi)集齊數(shù)據(jù)智能領(lǐng)域的主要工具,數(shù)巔科技有望讓夢想盡快照進現(xiàn)實。山頂還很遙遠,路上的風景值得期待。

分享到

songjy

相關(guān)推薦