方磊指出,完整的基礎(chǔ)設(shè)施包括算力、數(shù)據(jù)和基礎(chǔ)軟件三大要素,大模型能否實(shí)現(xiàn)跨時(shí)代的發(fā)展取決于三大要素共同進(jìn)步的頻速。

其中,算力代表了硬件的進(jìn)展,按照當(dāng)前的發(fā)展趨勢(shì)將不會(huì)再形成資源鴻溝。數(shù)據(jù)的有效存儲(chǔ)、計(jì)算和流通仍然具有廣闊的發(fā)揮空間,在現(xiàn)實(shí)世界中,行業(yè)、企業(yè)、專業(yè)之間存在眾多獨(dú)立的數(shù)據(jù)領(lǐng)地,龐大的數(shù)據(jù)量和貫通數(shù)據(jù)領(lǐng)地的難度預(yù)示著通用大模型的落地難度。大模型的落地應(yīng)用會(huì)更早、更多地體現(xiàn)在行業(yè)、企業(yè)等垂類大模型,同樣垂類大模型的數(shù)量也會(huì)大大超過(guò)通用大模型。而基礎(chǔ)軟件,存在較大的性能和成本差異化。方磊指出,軟件、模型和硬件的統(tǒng)一優(yōu)化空間巨大,在三要素中是創(chuàng)新最活躍的地方。

大模型時(shí)代的AI技術(shù)依然需要“最后一公里”的結(jié)合。方磊指出,軟件、模型和硬件的統(tǒng)一優(yōu)化空間巨大,是創(chuàng)新最活躍的地方。強(qiáng)大靈活的基礎(chǔ)軟件,開放彈性的白盒模型,精通業(yè)務(wù)的專業(yè)人才,將加速實(shí)現(xiàn)最后一公里的跨越。本次產(chǎn)品發(fā)布會(huì)重磅發(fā)布的AIFS & DataPilot 產(chǎn)品體系,正是以此為目標(biāo)輸出的全新技術(shù)成果。

AIFS用AI原力探索模型應(yīng)用能力的邊界

AIFS(AI Foundation Software)是九章云極DataCanvas在大模型主導(dǎo)的New AI時(shí)代對(duì)于全面構(gòu)建AI能力的回答,也是DataCanvas產(chǎn)品家族的最新升級(jí)。

AIFS作為一款行業(yè)領(lǐng)先的人工智能應(yīng)用構(gòu)建基礎(chǔ)設(shè)施平臺(tái),覆蓋了大模型的訓(xùn)練、精調(diào)、壓縮、部署、推理和監(jiān)控以及小模型的全生命周期過(guò)程,它為數(shù)據(jù)科學(xué)家、應(yīng)用程序開發(fā)人員和業(yè)務(wù)專家提供了一套工具,使不同角色的人員可以相互協(xié)作,輕松地處理數(shù)據(jù)并使用這些數(shù)據(jù)來(lái)開發(fā)、訓(xùn)練和部署任何規(guī)模的模型。

作為人工智能基礎(chǔ)軟件體系,AIFS主要包括DataCanvas Alaya九章元識(shí)大模型、DataCanvas APS機(jī)器學(xué)習(xí)平臺(tái)、DataCanvas BAP面向業(yè)務(wù)自動(dòng)建模平臺(tái)、開源DAT自動(dòng)機(jī)器學(xué)習(xí)軟件、開源YLearn因果學(xué)習(xí)軟件等一系列全開放、高自動(dòng)、高協(xié)同的軟件工具,為用戶自主構(gòu)建全生命周期的“大+小”模型提供一站式支持。

重磅發(fā)布的DataCanvas Alaya九章元識(shí)大模型,具有“通識(shí)+產(chǎn)業(yè)”系列模型矩陣、多模態(tài)大模型、優(yōu)化的訓(xùn)練機(jī)制和友好的開源協(xié)議管理等特點(diǎn)。在開源支持方面,九章元識(shí)不僅支持阿帕奇2.0協(xié)議,還為用戶提供白盒模型,這在當(dāng)前大模型行業(yè)狀況下著實(shí)突出。于建崗強(qiáng)調(diào),這是公司對(duì)產(chǎn)品“開放性”的堅(jiān)守,旨在為用戶賦予更大自由度的AI創(chuàng)新能力,以求加速實(shí)現(xiàn)大模型在多元業(yè)務(wù)場(chǎng)景中的應(yīng)用。

多模態(tài)是人工智能大模型的下一個(gè)重要技術(shù)環(huán)節(jié),九章云極DataCanvas首席AI科學(xué)家繆旭著重介紹了九章元識(shí)大模型在多模態(tài)方向的技術(shù)路線。為實(shí)現(xiàn)對(duì)各行業(yè)的支持,九章元識(shí)大力發(fā)展結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)之間的融合對(duì)齊,從而讓大模型不僅僅可以利用文本信息,還可以利用行業(yè)數(shù)據(jù)庫(kù)以及大量不易處理的傳感器序列,讓智能更貼近業(yè)務(wù)場(chǎng)景。更進(jìn)一步,九章元識(shí)還為企業(yè)自有大模型的構(gòu)建提供微調(diào)技術(shù)創(chuàng)新,通過(guò)將復(fù)雜的微調(diào)任務(wù)分為不同子任務(wù)的方式實(shí)現(xiàn)效率的提升,讓大模型定制化過(guò)程變得更加輕松自如。

DataCanvas AIFS不是從小模型通往“大+小”模型時(shí)代的一小步,它是代表大模型時(shí)代核心軟件能力和白盒模型融合的一大步。AIFS同樣能夠?qū)崿F(xiàn)面向應(yīng)用端的巨大賦能,為未來(lái)企業(yè)構(gòu)建個(gè)性化、自主的大模型,并將大模型與以往積淀的小模型相融合進(jìn)而應(yīng)用于業(yè)務(wù),按下了“確認(rèn)鍵”。

DataPilot:暢游數(shù)據(jù)“向量?!钡男聲r(shí)代利器

一直以來(lái),AI和Data有著密切的關(guān)聯(lián)。在過(guò)去的十幾年,數(shù)據(jù)通常被認(rèn)為是AI的原料、基礎(chǔ)要素,我們稱之為Data for AI的架構(gòu)時(shí)代。大模型的出現(xiàn),讓數(shù)據(jù)得到了AI的反向賦能,這是全新New Data時(shí)代的標(biāo)志。

當(dāng)數(shù)據(jù)與AI能力大突破發(fā)生碰撞,它的未來(lái)又將如何變化?DataPilot正在向世界給出答案,“向量?!背蔀榇鸢傅年P(guān)鍵詞。

DataPilot數(shù)據(jù)領(lǐng)航員,一種數(shù)據(jù)處理新范式,是九章云極DataCanvas自研基于大模型的新一代數(shù)據(jù)架構(gòu)工具產(chǎn)品。充分利用DataCanvas Alaya九章元識(shí)大模型的通用文本的理解和生成能力以及在數(shù)據(jù)領(lǐng)域的微調(diào)優(yōu)化,DataPilot可以幫助用戶實(shí)現(xiàn)數(shù)據(jù)在建模全生命周期的智能化與自動(dòng)化。

而“向量?!保╒ector Ocean),則是九章云極DataCanvas基于多年來(lái)在數(shù)據(jù)庫(kù)領(lǐng)域的研究和實(shí)踐,結(jié)合向量數(shù)據(jù)的發(fā)展方向,創(chuàng)造性提出的數(shù)據(jù)發(fā)展的終極形態(tài)。

九章云極DataCanvas副總裁周曉凌介紹,DataPilot的特性包括多?!跋蛄亢!睌?shù)據(jù)架構(gòu),按需自動(dòng)化數(shù)據(jù)集成、代碼生成、流程編排和分析計(jì)算,以及基于自然語(yǔ)言的數(shù)據(jù)獲取、分析和機(jī)器學(xué)習(xí)建模能力。DataPilot能夠大幅降低數(shù)據(jù)集成、治理、建模、計(jì)算、查詢、分析、機(jī)器學(xué)習(xí)建模全鏈路的技術(shù)門檻,降低數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)發(fā)展的成本,加快數(shù)字化創(chuàng)新的進(jìn)程。

正是基于“向量?!崩砟?,DataPilot所包含的DataCanvas RT實(shí)時(shí)決策中心平臺(tái)、開源DingoDB多模向量數(shù)據(jù)庫(kù)等各類數(shù)據(jù)軟件,讓用戶具備AI技術(shù)突破情況下亟需的實(shí)時(shí)、多模態(tài)的數(shù)據(jù)能力。

其中,DingoDB作為一個(gè)款開源的多模態(tài)向量數(shù)據(jù)庫(kù),將是向量海時(shí)代的強(qiáng)大引擎。它結(jié)合了數(shù)據(jù)湖和向量數(shù)據(jù)庫(kù)的特性,支持存儲(chǔ)任何類型(鍵值、PDF、音頻、視頻等)和任何大小的數(shù)據(jù)。通過(guò)DingoDB,用戶可以構(gòu)建專屬的數(shù)據(jù)“向量?!?,不論是結(jié)構(gòu)化還是非結(jié)構(gòu)化數(shù)據(jù),僅通過(guò)1套SQL即可完成多模態(tài)數(shù)據(jù)的分析與科學(xué)計(jì)算。

From Software to Thought-ware:軟件演進(jìn)的全新形態(tài)

在與Data相互賦能的同時(shí), AI也正在對(duì)軟件形態(tài)的演進(jìn)產(chǎn)生深刻的甚至顛覆性的影響,New Software的時(shí)代篇章正式打開。

在AI技術(shù)新突破的賦能下,全球正在經(jīng)歷從“軟件”(Software)時(shí)代向“思維件”(Thought-ware)時(shí)代的跨越。傳統(tǒng)的“軟件”是圍繞著需求分析、產(chǎn)品設(shè)計(jì)、代碼實(shí)現(xiàn)三個(gè)環(huán)節(jié)不斷迭代的過(guò)程,是一種“被動(dòng)響應(yīng)需求”的范式。而“思維件”,則是以“思維”為核心的軟件進(jìn)化新范式。

九章云極DataCanvas主任架構(gòu)師楊健在發(fā)布會(huì)上對(duì)“思維件”做了進(jìn)一步闡釋,他說(shuō),“思維件”具有自主思考的能力、受控的行動(dòng)能力、主動(dòng)的自我演進(jìn)能力。

通過(guò)“自主思考”能力,思維件可以理解用戶意圖,并結(jié)合行動(dòng)能力,為用戶提供建設(shè)性的解決方案。自主的思考能力和行動(dòng)能力會(huì)引發(fā)對(duì)系統(tǒng)能力邊界的合法性、安全性、合規(guī)性的一系列關(guān)切,因此這樣的系統(tǒng)行動(dòng)能力必須要“受控”。此外,思維件還要具備主動(dòng)的自我演進(jìn)能力,這是一種主動(dòng)學(xué)習(xí)和自我優(yōu)化的能力,在運(yùn)行過(guò)程中,能夠在和用戶以及所在環(huán)境的交互中自主學(xué)習(xí),實(shí)現(xiàn)錯(cuò)誤糾正、需求適應(yīng)以及能力沉淀和優(yōu)化等一系列演進(jìn)過(guò)程。

楊健透露,九章云極DataCanvas已經(jīng)開始對(duì)新型軟件“思維件”的探索,并在發(fā)布會(huì)現(xiàn)場(chǎng)演示了“思維件”實(shí)驗(yàn)性產(chǎn)品TableGPT。

TableGPT遵循“所需即所得”的理念,用戶只需要用自然語(yǔ)言描述問(wèn)題和需求,無(wú)需輸入復(fù)雜命令或進(jìn)行手動(dòng)的算法選擇,TableGPT就能自動(dòng)理解用戶意圖,選擇合適的統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)方法并在私域數(shù)據(jù)上完成自動(dòng)建模,然后反饋用戶所需的數(shù)據(jù)分析結(jié)果并進(jìn)行解釋,同時(shí)還可以給出后續(xù)數(shù)據(jù)挖掘的建議。整個(gè)過(guò)程用戶無(wú)需關(guān)注、也不會(huì)接觸到任何具體的技術(shù)細(xì)節(jié),大大降低學(xué)習(xí)和使用難度。

這種以語(yǔ)言方式與人工智能軟件的互動(dòng),讓任何人都得以輕松地從數(shù)據(jù)中獲得洞見(jiàn),極簡(jiǎn)、新穎的交互體驗(yàn),和超預(yù)期的交互結(jié)果,將大力推動(dòng)數(shù)據(jù)分析的民主化和普及性。楊建稱,盡管還處在起步階段,TableGPT為數(shù)據(jù)科學(xué)和人工智能軟件的進(jìn)一步融合與發(fā)展指明了方向。

從AIFS到AIFS

此次發(fā)布的兩大產(chǎn)品體系延續(xù)“開放、自動(dòng)、云原生”的核心產(chǎn)品理念,在AIFS、DataPilot、Thought-ware相互賦能的作用下,九章云極DataCanvas軟件工具和解決方案將持續(xù)融入前沿AI創(chuàng)新技術(shù),助力其在大模型時(shí)代加速實(shí)現(xiàn)自主的數(shù)智化升級(jí)和AI規(guī)?;瘧?yīng)用。

據(jù)悉,九章云極DataCanvas未來(lái)將堅(jiān)持“云中云”(千云之中的AI云)戰(zhàn)略頂層規(guī)劃,聯(lián)合云廠商、智算中心等合作伙伴,提供一站式服務(wù),完成從AIFS (AI Foundation Software)產(chǎn)品到AIFS(AI Foundation Service)服務(wù)的華麗轉(zhuǎn)身。

分享到

nina

相關(guān)推薦