一个人在线观看www,中文字幕精品亚洲无线码一区

“我們已進(jìn)入了一個(gè)機(jī)器可以實(shí)時(shí)理解人類(lèi)語(yǔ)言的AI新時(shí)代。TensorRT 7使這成為可能，為世界各地的開(kāi)發(fā)者提供工具，使他們能夠構(gòu)建和部署更快、更智能的會(huì)話式AI服務(wù)，從而實(shí)現(xiàn)更自然的AI人機(jī)交互，” NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示。

據(jù)官方介紹，TensorRT 7 可實(shí)現(xiàn)和語(yǔ)音代理、聊天機(jī)器人、推薦引擎等應(yīng)用的實(shí)時(shí)互動(dòng)。其內(nèi)置新型深度學(xué)習(xí)編譯器，該編譯器能夠自動(dòng)優(yōu)化和加速遞歸神經(jīng)網(wǎng)絡(luò)與基于轉(zhuǎn)換器的神經(jīng)網(wǎng)絡(luò)。這些日益復(fù)雜的神經(jīng)網(wǎng)絡(luò)是AI語(yǔ)音應(yīng)用所必需的。與在CPU上運(yùn)行時(shí)相比，會(huì)話式AI組件速度提高了10倍以上，從而將延遲降低到實(shí)時(shí)交互所需的300毫秒閾值以下。首批使用NVIDIA會(huì)話式AI加速能力的企業(yè)包括——阿里巴巴、百度、滴滴出行、美團(tuán)、快手、平安、搜狗、騰訊和字節(jié)跳動(dòng)等。

TensorRT 7加快了AI模型的領(lǐng)域擴(kuò)展。這些模型被用于預(yù)測(cè)使用遞歸循環(huán)結(jié)構(gòu)（RNN）的時(shí)間序列、數(shù)據(jù)情景。除了用于會(huì)話式 AI語(yǔ)音網(wǎng)絡(luò)之外，RNN還可以幫助規(guī)劃汽車(chē)或衛(wèi)星到達(dá)時(shí)間、預(yù)測(cè)電子病歷中的異常情況預(yù)測(cè)金融資產(chǎn)和識(shí)別欺詐。

RNN配置和功能組合的爆炸式增長(zhǎng)為快速部署可以滿足實(shí)時(shí)性能標(biāo)準(zhǔn)的生產(chǎn)代碼帶來(lái)了挑戰(zhàn)，開(kāi)發(fā)者需要花費(fèi)長(zhǎng)達(dá)數(shù)月的時(shí)間創(chuàng)建手寫(xiě)代碼優(yōu)化，從而使得會(huì)話式AI僅局限于擁有必要專(zhuān)業(yè)人才的少數(shù)公司。通過(guò)TensorRT的新型深度學(xué)習(xí)編譯器，全球開(kāi)發(fā)者能夠?qū)⑦@些網(wǎng)絡(luò)（例如定制的自動(dòng)語(yǔ)音識(shí)別網(wǎng)絡(luò)以及用于文本-語(yǔ)音轉(zhuǎn)換的WaveRNN和Tacotron 2）實(shí)現(xiàn)自動(dòng)化，并實(shí)現(xiàn)最佳的性能和最低的延遲。新的編譯器還能優(yōu)化基于transformer的模型，例如用于自然語(yǔ)言處理的BERT等。

TensorRT 7可以快速優(yōu)化、驗(yàn)證并部署經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)，為超大型數(shù)據(jù)中心、嵌入式或汽車(chē)GPU平臺(tái)提供推理能力。NVIDIA的推理平臺(tái)，包括TensorRT和多個(gè)NVIDIA CUDA-X AI庫(kù)和NVIDIA GPU，不只能為會(huì)話式AI提供低延遲、高吞吐量的推理能力，也同樣能為包括圖像分類(lèi)、欺詐識(shí)別、分割、目標(biāo)檢測(cè)和推薦引擎在內(nèi)的其它應(yīng)用提供低延遲、高吞吐量的推理能力。該平臺(tái)各項(xiàng)能力已被阿里巴巴、美國(guó)運(yùn)通（American Express）、百度、PayPal、Pinterest、Snap、騰訊和Twitter等使用。

據(jù)了解，TensorRT 7 將在未來(lái)幾天內(nèi)開(kāi)放訪問(wèn)，以用于開(kāi)發(fā)和部署。NVIDIA開(kāi)發(fā)者計(jì)劃成員可通過(guò) TensorRT 網(wǎng)頁(yè)免費(fèi)獲得TensorRT 7。此外，新版本插件、語(yǔ)法分析器和樣本也將作為開(kāi)放資源，通過(guò)TensorRT GitHub 庫(kù)提供。

分享到

zhangnn

相關(guān)推薦

近期文章

熱門(mén)標(biāo)簽