上海2021年12月8日 /美通社/ -- 近日,繼2019-2020年獲得視覺跟蹤領(lǐng)域國際頂級賽事 VOT(Visual-Object-Tracking Challenge )多項挑戰(zhàn)賽冠軍以來,中科智云-大連理工聯(lián)合AI實驗室在今年計算機(jī)視覺三大頂會之一 -- 國際計算機(jī)視覺大會ICCV2021上舉辦的VOT 2021中再次披荊斬棘,包攬了五個賽道中兩項挑戰(zhàn)賽的冠軍:
VOT-RT2021(實時目標(biāo)跟蹤挑戰(zhàn)賽);
VOT-RGBD2021(顏色和深度的長時跟蹤挑戰(zhàn)賽)。
VOT是國際目標(biāo)跟蹤領(lǐng)域最權(quán)威的測評平臺,由于每年的評測序列都會更新,且標(biāo)注的精確度逐年提高,VOT競賽也被視為視覺跟蹤領(lǐng)域最難的競賽。VOT挑戰(zhàn)為跟蹤社區(qū)提供了一種精確定義和可重復(fù)的方法,用于比較短期跟蹤者和長期跟蹤者,以及討論視覺跟蹤領(lǐng)域的評估和進(jìn)展的通用平臺。
視覺目標(biāo)跟蹤是計算機(jī)視覺中的一個重要研究方向,有著廣泛的應(yīng)用,如:視頻監(jiān)控,人機(jī)交互,無人駕駛等。傳統(tǒng)的目標(biāo)跟蹤算法采用相關(guān)性運(yùn)算方式來實現(xiàn)模板與搜索區(qū)域相似度的簡單融合。然而,相關(guān)運(yùn)算本身是一個局部線性匹配過程,容易丟失語義信息,容易陷入局部最優(yōu),這可能是設(shè)計高精度跟蹤算法的瓶頸。
此次中科智云-大連理工聯(lián)合AI實驗室提出了一個新的基于Transformer 跟蹤框架TransT-M,能有效的結(jié)合注意力機(jī)制把模板和搜索區(qū)域的特征信息融合起來產(chǎn)生一個高性能目標(biāo)跟蹤器。該注意力機(jī)制同時又融合了基于自我注意的自我上下文增強(qiáng)模塊和基于交叉注意力的跨特征增強(qiáng)模塊,確保長距離跟蹤需要的充足的上下文有效信息,同時避免了不必要的信息干擾。實驗表明,我們的 TransT-M 在六個具有挑戰(zhàn)性的數(shù)據(jù)集上,尤其是在大規(guī)模 LaSOT、TrackingNet 和 GOT-10k 基準(zhǔn)測試上,無論在精度還是效率遠(yuǎn)遠(yuǎn)超出了目前現(xiàn)有算法,取得了非常不俗的結(jié)果。目前該算法已經(jīng)納入到智云X-Brain平臺的目標(biāo)物體視頻模塊中使用,為X-Brain的客戶提供最好的體驗。
中科智云近年來已經(jīng)先后在視頻跟蹤分割領(lǐng)域內(nèi)的多個國際挑戰(zhàn)大賽中獲得了領(lǐng)先的名次,標(biāo)志著中科智云在視頻目標(biāo)檢測,跟蹤和分割技術(shù)等視頻智能分析的關(guān)鍵技術(shù)已處于業(yè)界領(lǐng)先水平。這些技術(shù)將在國內(nèi)外的智能建造、智慧城市、智慧農(nóng)業(yè)、智慧交通、智慧醫(yī)療等領(lǐng)域的5G+AR視頻業(yè)務(wù)中獲得廣泛應(yīng)用。
歷屆VOT獲獎情況:
于2019年獲得 VOT-LT2019(Long-term tracking challenge,即長時跟蹤挑戰(zhàn)賽)冠軍,
于2020年獲得三項挑戰(zhàn)賽的冠軍
VOT-RT2020(Short-term Real-time tracking challenge,即實時跟蹤挑戰(zhàn)賽)
VOT-LT2020(Long-term tracking challenge,即長時跟蹤挑戰(zhàn)賽)
VOT-RGBD2020(Color and depth long-term tracking challenge。即顏色和深度的長期跟蹤挑戰(zhàn)賽)
中科智云作為計算機(jī)視覺領(lǐng)域的“佼佼者”,擁有全球頂尖的AI技術(shù)研發(fā)能力,并已實現(xiàn)關(guān)鍵核心技術(shù)國產(chǎn)可控。目前已與牛津大學(xué)、帝國理工等全球知名院校成立7家聯(lián)合實驗室;成立兩年來,公司已申請近50件國內(nèi)國際AI專利,多次在全球頂級會議發(fā)布論文,并斬獲多個國際大賽佳績。