近日,?低晠⑴cPASCAL VOC視覺識別競賽,其中目標檢測任務(wù)成績mAP性能達到87.9,刷新了世界記錄,排名第一名,領(lǐng)先第二名4.1個點。評測中,海康威視20類目標中的19類結(jié)果在所有的算法中均處于領(lǐng)先地位。
(數(shù)據(jù)來源:http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4)
PASCAL VOC目標檢測任務(wù)囊括了車、人、貓、狗等20類常見目標。訓練樣本較少、場景變化多端,非常具有挑戰(zhàn)性。提到奪冠之道,?低曆芯吭撼(wù)副院長浦世亮表示:“我們的預(yù)研團隊基于Faster R-CNN深度學習目標檢測算法,通過調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)、上下文建模、優(yōu)化訓練和預(yù)測等策略,大幅提升了檢測性能。研究成果可以應(yīng)用到視頻監(jiān)控的車輛檢測、車牌識別、人體檢測、人體屬性分析、視頻結(jié)構(gòu)化等產(chǎn)品中,將大幅提升產(chǎn)品性能與應(yīng)用效果。長遠來看,在智能安全監(jiān)控、汽車輔助駕駛、智能交通感知、視頻語義理解、機器人和無人機等各方面都有著巨大的應(yīng)用價值。”
PASCAL VOC可謂視覺識別類競賽的鼻祖,是由利茲大學、蘇黎世聯(lián)邦理工學院、愛丁堡大學、微軟、牛津大學等組織的一個視覺識別競賽,包含了物體分類、目標檢測、圖像分割等任務(wù)。PASCAL VOC對計算機視覺的發(fā)展具有深遠而巨大的影響,后續(xù)的ImageNet競賽的任務(wù)設(shè)置就基本沿用了它的設(shè)定。此前,微軟、英特爾、CMU、Facebook、UC Berkeley等國際頂尖研發(fā)團隊先后在這個排行榜上刷新紀錄。
海康威視研究院由智能分析、大數(shù)據(jù)技術(shù)、感知技術(shù)和多媒體技術(shù)等專業(yè)團隊組成,突出在音視頻技術(shù)的專注和積累,著重研究視音頻的智能算法、大數(shù)據(jù)的分析、挖掘和計算,同時針對新的圖像傳感器等感知技術(shù),視頻的播放技術(shù),人機交互等多媒體技術(shù)進行深入研究。目前在海康威視研究院眾多領(lǐng)域的研究都走在行業(yè)前列,2015年,?低曆芯吭涸贙ITTI的評測中,車輛檢測和車頭朝向估計兩項任務(wù)評分均排名世界第一;在MOT Challenge算法測評中獲得“計算機視覺的多目標跟蹤算法”世界第一;名列TRECVID2016 SED第二名、PASCAL VOC 2012圖像分割任務(wù)第二名。