近日,我校伟德betvlctor网页版伍雪冬教授視覺機器人控制團隊在人工智能領域頂級期刊Expert Systems With Applications上發表了21頁長文“Discriminative target predictor based on temporal-scene attention context enhancement and candidate matching mechanism”。伟德betvlctor网页版研究生曹百亨、張先鋒和馬治偉及湖南大學王耀南院士為論文共同作者。
計算機視覺是人工智能領域的熱門分支,針對現有深度學習下的視覺跟蹤算法具有精度和實時性之間的沖突、上下文信息利用不夠及跟蹤噪聲累積等問題,該團隊提出了一種基于注意力特征增強與候選機制的深度視覺目标跟蹤算法,主要創新點包括:提出了一種新的基于注意力機制的時間上下文增強模塊,能從跟蹤序列中提取穩健高效的時間上下文,并對注意力網絡性質進行了理論分析;提出了一種前向傳播網絡結構,以克服場景信息提取和利用的困難,并對算法收斂性進行了證明;提出了一種基于候選選擇機制的聯合目标預測跟蹤模塊,以進一步提高跟蹤精度和實時性。研究結果表明,與其它現有的21種最新先進跟蹤算法相比,團隊提出的新算法取得了很好的跟蹤效果。
基于注意力特征增強與候選機制的深度視覺目标跟蹤算法流程圖
據悉,團隊近期分别在人工智能領域期刊《Engineering Applications of Artificial Intelligence》(2023,https://doi.org/10.1016/j.engappai.2023.105901)和 《Applied Intelligence》(2022,https://doi.org/10.1007/s10489-022-03458-8)上發表了系列論文。
論文鍊接: https://doi.org/10.1016/j.eswa.2023.121400.