快手副總裁、可靈AI負責人張迪
值得一提的是,可靈2.0大師版全面升級視頻及圖像創(chuàng)作可控生成與編輯能力,上線全新的多模態(tài)視頻編輯功能,能靈活理解用戶意圖。支持在一段視頻的基礎之上,通過輸入圖片或文字,對生成的視頻內(nèi)容實現(xiàn)元素的增加、刪減、替換,幫助創(chuàng)作者們實現(xiàn)更加靈活的二次編輯和處理。
可靈2.0大師版操作界面
可圖2.0:
圖像生成與編輯的「六邊形戰(zhàn)士」
快手負責人張迪披露,當前,圖生視頻約占到可靈AI視頻創(chuàng)作量的85%,圖片質(zhì)量也對視頻的生成效果產(chǎn)生重要作用。
在圖像生成大模型領域,快手的可圖2.0處于行業(yè)領先水平,擁有多項核心優(yōu)勢,諸如強大的復雜語義理解能力、電影級的畫面質(zhì)感、多條件的可控風格化生成等。在團隊內(nèi)部的多項勝負率評測中,相較于Midjourney V7、FLUX1.1 [pro]以及Reve等行業(yè)領先的圖像模型,均保持明顯優(yōu)勢。
張迪介紹,可圖2.0文生圖能力迎來全面升級。包括大幅提升指令遵循能力、顯著增強電影美學表現(xiàn)力以及更多元的藝術(shù)風格。在風格化響應上,可圖2.0可支持60多種風格化的效果轉(zhuǎn)繪,模型出圖創(chuàng)意和想象力實現(xiàn)大幅躍升。
同時,可圖2.0也上線了實用的圖像可控編輯功能——局部重繪和擴圖,支持圖片的增加、修改和修復。在圖像的多模態(tài)可控生成中,可圖2.0還上線了全新的風格轉(zhuǎn)繪功能,只需要上傳一張圖片加上風格描述,就能一鍵切換圖片的藝術(shù)風格,同時精準保留原圖的語義內(nèi)容。
3
AI生成進入“可信時代”
AIGC技術(shù)又一里程碑突破
可靈2.0的發(fā)布,標志著AIGC技術(shù)從“實驗室突破”邁向“產(chǎn)業(yè)可信化”:
技術(shù)普惠:通過MVL降低多模態(tài)創(chuàng)作門檻,非專業(yè)用戶可生成接近專業(yè)團隊的作品;
生態(tài)重構(gòu):與快手短視頻、直播業(yè)務深度耦合,推動“AI原生內(nèi)容”成為平臺核心競爭力;
標準建立:提出“動態(tài)質(zhì)量評估體系”,要求生成內(nèi)容在物理規(guī)律、情感表達等維度達到影視級標準。
不過,行業(yè)專家指出,可靈AI仍需解決兩大矛盾:生成質(zhì)量與成本的平衡(如高精度視頻的定價策略),以及創(chuàng)意同質(zhì)化風險(用戶過度依賴模板生成內(nèi)容)。
結(jié)語
一場“可靈速度”的長跑
從2024年6月首次發(fā)布到2025年4月迭代至2.0版本,快手僅用10個月便完成20余次技術(shù)升級,用戶規(guī)模增長25倍。這種“快迭代、強落地”的策略,既源于快手對短視頻內(nèi)容痛點的深刻理解,也凸顯其在AI競賽中的緊迫感。
快手高級副總裁蓋坤表示:“可靈AI將持續(xù)大力推動技術(shù)創(chuàng)新,用人與AI交互的全新語言,幫助用戶實現(xiàn)復雜創(chuàng)意的精確表達,“我們的初心,是讓每個人都能用AI講出好的故事,我們也真切地希望這一天更快到來”。這場由快手發(fā)起的“智能創(chuàng)作革命”,或許正拉開AI時代內(nèi)容生態(tài)重構(gòu)的序幕。