就在昨日,其首席執(zhí)行官山姆·奧爾特曼(Sam Altman)以一種極具震撼力的方式,揭開了一項(xiàng)特別計(jì)劃的神秘面紗:OpenAI將傾情呈現(xiàn)一場為期12天的直播馬拉松,內(nèi)容精彩紛呈,既有新品發(fā)布的激動(dòng)人心,也有功能更新的耳目一新,更有一系列被譽(yù)為“圣誕禮物”的神秘環(huán)節(jié),令人充滿期待。
OpenAI的這一活動(dòng)預(yù)告,猶如一顆石子投入平靜的湖面,瞬間激起了層層漣漪,引發(fā)了全球的轟動(dòng)。
全球的科技媒體為之沸騰,即便時(shí)差成為一道難以逾越的鴻溝,也阻擋不了他們渴望參與這場“科技盛宴”的滿腔熱情。
在北京時(shí)間12月6日凌晨兩點(diǎn),萬眾矚目的“12 Days of OpenAI, Day 1”直播終于拉開序幕。
重磅直播內(nèi)容
1.推出o1正式版,這是首次將多模態(tài)能力與新型推理范式相結(jié)合的版本。相比于 o1 preview,它更加智能,響應(yīng)速度顯著提升。目前o1模型已全面上線,API 功能也將在不久后推出。
2.發(fā)布了全新專業(yè)版套餐——ChatGPT Pro,訂閱費(fèi)用為每月200美元,用戶可無限訪問OpenAI的模型,包括語音功能。此外,Pro套餐還引入了o1 Pro模式,在數(shù)學(xué)、科學(xué)和編碼等挑戰(zhàn)性機(jī)器學(xué)習(xí)基準(zhǔn)測試中表現(xiàn)更好。
推出o1正式版
讓我們先聚焦于廣大用戶能夠親身體驗(yàn)的o1大模型。直播活動(dòng)結(jié)束后,ChatGPT Plus的用戶群體已逐步迎來了o1模型的完整版本?;厮葜?月,該模型首次以預(yù)覽版的形式與大家見面。o1模型的一大特色在于,它并非簡單地“脫口而出”答案,而是構(gòu)建了一個(gè)類似人類思考的內(nèi)部邏輯鏈條,顯著提升了回答專業(yè)問題時(shí)的精確度。簡而言之,新推出的完整版o1模型相較于預(yù)覽版,速度更快、性能更強(qiáng)、準(zhǔn)確度更高,并新增了多模態(tài)輸入功能,即用戶現(xiàn)在可以上傳圖片進(jìn)行詢問。
OpenAI透露,與預(yù)覽版相比,當(dāng)前的o1模型“思維過程已變得更加精簡高效”(提速約50%),并且在應(yīng)對復(fù)雜現(xiàn)實(shí)問題時(shí),發(fā)生重大錯(cuò)誤的概率降低了34%。在一次演示中,當(dāng)被要求“列出2世紀(jì)羅馬皇帝的名字、任期和主要成就”時(shí),o1模型僅“思考”了14秒便給出了答案,而預(yù)覽版則耗時(shí)34秒。值得一提的是,能力稍弱的GPT-4o在回答這個(gè)問題時(shí)還會出現(xiàn)錯(cuò)誤。
o1模型的另一項(xiàng)重大更新是支持圖片輸入功能,這意味著用戶可以在向模型詢問如“太空數(shù)據(jù)中心散熱問題”時(shí),附上一張手繪示意圖以輔助說明。OpenAI還表示,他們計(jì)劃在未來數(shù)月內(nèi)進(jìn)一步增加功能,如網(wǎng)頁瀏覽和文件上傳等。
此外,OpenAI還展示了o1模型(以中間淺紅色柱子表示)在回答數(shù)學(xué)、編程以及博士級別科學(xué)問題時(shí)的卓越表現(xiàn),其準(zhǔn)確率明顯高于o1預(yù)覽版(左邊橘色柱子)。而右邊的綠色柱子則代表了進(jìn)一步的提升,那是專為ChatGPT Pro用戶打造的o1 Pro模式。
一個(gè)月200美元的ChatGPT Pro
ChatGPT Pro是OpenAI推出的最新訂閱檔次,比ChatGPT Plus貴上10倍。
花費(fèi)1個(gè)月200美元后,用戶可以無限量地使用o1模型(Plus用戶目前的限制是每周50條信息),以及無限量使用o1 mini和高級語音模式,同時(shí)也能用上o1 pro模式。
官方的定義稱,o1 pro會使用更多的計(jì)算資源進(jìn)入深入思考,并為“最難的問題提供最好的答案”。OpenAI未來也會給這個(gè)訂閱檔次,添加更多更強(qiáng)大、計(jì)算密集型的功能。
簡而言之,如果您是一名科學(xué)研究人員或程序員,且o1模型的推理能力不足以滿足需求,那么可以考慮嘗試一下“氪金”進(jìn)階模式。
在演示中,OpenAI演示了通過設(shè)定一系列苛刻的條件,讓o1 pro篩選出符合條件的蛋白質(zhì)。
在OpenAI的公告中,也提到向10名醫(yī)學(xué)研究人員贈(zèng)送了免費(fèi)ChatGPT Pro,研究領(lǐng)域涵蓋孤兒病、癌癥、癡呆等。這大概也是使用這個(gè)訂閱服務(wù)的人群畫像。
ChatGPT Pro的特色之一是引入了o1 pro模式,增加了計(jì)算資源投入,讓模型在解答困難問題時(shí)進(jìn)行更深入的思考和分析。這項(xiàng)服務(wù)主要面向需要進(jìn)行高級數(shù)據(jù)分析和處理的科研人員、工程師以及其他專業(yè)人士,幫助他們提高工作效率并保持在人工智能技術(shù)最前沿。
根據(jù)外部專家的評測,o1 pro模式在處理復(fù)雜的數(shù)據(jù)科學(xué)、編程和案例分析問題時(shí),能夠提供比以往模型更為精確和全面的響應(yīng)。在進(jìn)行數(shù)學(xué)、科學(xué)和編程等領(lǐng)域的機(jī)器學(xué)習(xí)基準(zhǔn)測試時(shí),o1 pro模式的表現(xiàn)優(yōu)于o1和o1-preview模型。
為了突出o1 pro模式的主要優(yōu)勢(提高可靠性),OpenAI使用更嚴(yán)格的評估設(shè)置:只有當(dāng)模型在四次嘗試中有四次能夠正確回答問題(“4/4 可靠性”),才被認(rèn)為解決了問題。
思維鏈CoT的推理方法
不論是預(yù)覽版,還是完整版o1,都是通過大規(guī)模強(qiáng)化學(xué)習(xí)進(jìn)行了訓(xùn)練,掌握了一種前沿的思維鏈CoT的推理方法。這種方法,不僅僅是簡單地給出答案,而是像人類思考一樣,逐步分析和推理。而且,o1系列模型的一個(gè)重大突破在于——安全性推理能力。
當(dāng)面對潛在的不安全提示詞時(shí),它能精準(zhǔn)理解上下文,根據(jù)預(yù)設(shè)安全策略進(jìn)行深度推理。
這使得o1在多個(gè)安全基準(zhǔn)測試中,展現(xiàn)出卓越的性能,比如有效地址非法建議的生成、拒絕刻板印象的響應(yīng)、低于已知的模型越獄攻擊。結(jié)合CoT的智能增強(qiáng)的同時(shí),也帶了潛在的風(fēng)險(xiǎn)。
為了確保模型安全,OpenAI研發(fā)團(tuán)隊(duì)采取了多層次的風(fēng)險(xiǎn)管理策略。比如,他們建立了穩(wěn)健的對齊方法,進(jìn)行了廣泛的壓力測試,并維護(hù)細(xì)致的風(fēng)險(xiǎn)管理協(xié)議。
數(shù)據(jù)和訓(xùn)練
在此之前,先來了解下o1的數(shù)據(jù)和訓(xùn)練過程。完整版o1是該系列旗艦?zāi)P?,o1-mini是專注編碼的輕量級版本。通過強(qiáng)化學(xué)習(xí)RL進(jìn)行訓(xùn)練的目的,就是讓o1系列能夠進(jìn)行復(fù)雜的推理。o1在回答之前進(jìn)行思考——它可以在響應(yīng)用戶之前產(chǎn)生長的思維鏈條。
通過訓(xùn)練,模型學(xué)會了優(yōu)化思維過程,去嘗試不同的策略,并自主識別錯(cuò)誤。推理使o1模型能夠遵循OpenAI設(shè)定的特定指南和模型政策,幫助其符合安全期望。不僅如此,o1模型的訓(xùn)練數(shù)據(jù)源豐富多樣,包括公開可用數(shù)據(jù)、通過合作伙伴關(guān)系訪問的專有數(shù)據(jù),以及內(nèi)部開發(fā)的自定義數(shù)據(jù)集。
– 公共數(shù)據(jù):
兩個(gè)模型都在各種公開可用的數(shù)據(jù)集上進(jìn)行了訓(xùn)練,包括網(wǎng)絡(luò)數(shù)據(jù)和開源數(shù)據(jù)集。
關(guān)鍵組成部分包括推理數(shù)據(jù)和科學(xué)文獻(xiàn)。這確保了模型在一般知識和技術(shù)主題上都很精通,增強(qiáng)了它們執(zhí)行復(fù)雜推理任務(wù)的能力。
– 來自數(shù)據(jù)合作伙伴的專有數(shù)據(jù):
為了進(jìn)一步增強(qiáng)o1和o1-mini的能力,OpenAI通過戰(zhàn)略合作,獲取高價(jià)值的非公開數(shù)據(jù)集。
這些專有數(shù)據(jù)源包括收費(fèi)內(nèi)容、專業(yè)檔案和其他特定領(lǐng)域的數(shù)據(jù)集,提供了對行業(yè)特定知識和用例的更深入見解。
– 數(shù)據(jù)過濾和優(yōu)化:
OpenAI數(shù)據(jù)處理管道包括嚴(yán)格的過濾,以保持?jǐn)?shù)據(jù)質(zhì)量和減輕潛在風(fēng)險(xiǎn)。研究團(tuán)隊(duì)使用先進(jìn)的數(shù)據(jù)過濾流程來減少訓(xùn)練數(shù)據(jù)中的個(gè)人信息。他們還結(jié)合使用自家的審核API和安全分類器,防止使用有害或敏感內(nèi)容,包括諸如CSAM等材料。
結(jié)語
OpenAI的這一系列動(dòng)作,無疑將推動(dòng)AI技術(shù)的進(jìn)一步發(fā)展和應(yīng)用。隨著滿血版o1模型和ChatGPT Pro的推出,AI技術(shù)在各個(gè)領(lǐng)域的應(yīng)用將更加廣泛和深入。同時(shí),這也為相關(guān)企業(yè)和個(gè)人提供了新的商業(yè)機(jī)會和發(fā)展空間。
此外,據(jù)外媒報(bào)道,OpenAI還將在之后的直播中發(fā)布文生視頻工具Sora等新產(chǎn)品。這些新產(chǎn)品的推出,將進(jìn)一步豐富OpenAI的產(chǎn)品線,為用戶提供更加多樣化和個(gè)性化的服務(wù)。
綜上所述,OpenAI的為期12天的直播活動(dòng)已經(jīng)拉開了帷幕,滿血版o1模型和ChatGPT Pro的推出引發(fā)了廣泛關(guān)注和期待。未來,隨著AI技術(shù)的不斷發(fā)展和應(yīng)用,我們有理由相信OpenAI將為用戶帶來更多驚喜和突破。(文/宋雨涵)