阿里巴巴iDST團(tuán)隊(duì)以90.46%的準(zhǔn)確率奪得KITTI排名第一

據(jù)了解,此次重大技術(shù)突破是由阿里巴巴iDST視覺計(jì)算研究員華先勝領(lǐng)導(dǎo)的團(tuán)隊(duì)完成。他們提出了基于區(qū)域融合決策和上下文相關(guān)的多任務(wù)深度神經(jīng)網(wǎng)絡(luò),用于復(fù)雜場(chǎng)景下的車輛檢測(cè)任務(wù),重點(diǎn)解決其中多視角,多姿態(tài)以及車輛遮擋等問題。

在網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)上,團(tuán)隊(duì)利用反卷積操作提高了小目標(biāo)的召回率,同時(shí)拼接了多層特征以融合低層的局部信息和高層的語義信息,提高了邊框定位的準(zhǔn)確率。在訓(xùn)練過程中,還借鑒了GAN(生成對(duì)抗網(wǎng)絡(luò))中的對(duì)抗訓(xùn)練模式。

華先勝表示,“現(xiàn)在我們已經(jīng)將這樣的技術(shù)集成到阿里云ET當(dāng)中,并在城市大腦中得以應(yīng)用。它能夠幫助城市大腦準(zhǔn)確的看懂車流信息,快速的做出全局性判斷”。華先勝是視覺識(shí)別和搜索領(lǐng)域的國際級(jí)權(quán)威學(xué)者,曾獲選國際電氣與電子工程協(xié)會(huì)院士(IEEE Fellow)、美國計(jì)算機(jī)協(xié)會(huì)ACM杰出科學(xué)家。

城市大腦是包括阿里云在內(nèi)的13家企業(yè)聯(lián)合杭州市政府發(fā)起的項(xiàng)目,旨在構(gòu)建一個(gè)城市級(jí)的人工智能中樞,讓城市能夠與人類友好互動(dòng)。這其中分析視頻是城市大腦獲取信息的關(guān)鍵。

以交通治理為例,通過這項(xiàng)技術(shù),城市大腦通過普通攝像頭就可以感知復(fù)雜路況下車輛的運(yùn)行狀態(tài)和軌跡,對(duì)這些數(shù)據(jù)進(jìn)行實(shí)時(shí)分析?;诖?,進(jìn)行多種智能交通優(yōu)化。在視頻數(shù)據(jù)處理規(guī)模上,全球罕有。

在視覺計(jì)算領(lǐng)域的持續(xù)攻堅(jiān),是阿里巴巴“NASA”計(jì)劃的一部分。該計(jì)劃聚焦于機(jī)器學(xué)習(xí)、芯片、IoT、操作系統(tǒng)、生物識(shí)別等核心領(lǐng)域,他們希望能解決10年、20年后的困難。此前,已在光量子計(jì)算機(jī)、全浸沒液冷服務(wù)器等方面取得重大進(jìn)展。

KITTI是目前國際上最大的自動(dòng)駕駛場(chǎng)景下的計(jì)算機(jī)視覺算法評(píng)測(cè)數(shù)據(jù)集,可以用于評(píng)測(cè)目標(biāo)檢測(cè)等計(jì)算機(jī)視覺技術(shù)在復(fù)雜真實(shí)環(huán)境下的性能。KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場(chǎng)景采集的真實(shí)圖像數(shù)據(jù),有大量的微小目標(biāo)、欠曝和過曝、多種視角變化以及各種遮擋情況。

 

分享到

xiesc

相關(guān)推薦