影像辨識同時偵測車列及車速 中研院研發物件偵測演算法「全世界最快準」
▲中央研究院研究團隊,與俄羅斯開發者博科夫斯基共同研發出目前世界上最快最準的物件偵測演算法。(圖/中央研究院提供)
臺灣參與人工智慧跨國研究取得重大突破!中央研究院研究團隊,與俄羅斯開發者博科夫斯基共同研發出目前世界上最快最準的物件偵測演算法(YOLOv4),平均正確率達43.5%,一舉超越其他種影像辨識技術。同時也運用該技術開發「智慧城市交通車流解決方案」,目前已佈設於桃園、新竹,在路口就能進行交通影像辨識及車流分析。
中央研究院資訊科學研究所特聘研究員廖弘源說明,YOLOv4是一種利用人工智慧執行即時物件偵測的技術,能偵測物件、追蹤及判斷,可應用於交通車流計算、自駕車研發、工廠瑕疵檢測、醫療影像分析、五官定位等。自今年4月以開放原始碼免費釋出後,全世界已有數萬人測試應用。
廖弘源表示,過去訓練電腦識別一張照片裡的物件,須執行幾千次的識別指令。YOLO是「You only look once」的簡稱,顧名思義,只需訓練一個網路模型,電腦只要看一眼,就能判斷照片或影像裡的物件類別與位置,大大提升辨識速度。自104年推出第一代版本後,深受開發者喜愛,爲電腦視覺技術立下重要的里程碑。改良後的YOLOv4性能更強大,經微軟開源影像資料庫測試,辨識物件的速度及精確度皆大幅提升,堪稱是目前世界上辨識速度最快、最精準的物件偵測演算法。
▲YOLOv4演算法已實際應用於「智慧城市交通車流解決方案計劃」,可即時偵測車輛、停等車列、車速。(圖/中央研究院提供)
博士後研究員王建堯提到,物件偵測技術追求速度和精準,二者缺一不可,卻難以兼備。他從去年開始改良YOLOv3,一改過去多采「降速求控球」,即降低或犧牲速度來換取準確度提升;轉而從YOLO所運行的人工智慧模型着手,改善網路識別物件的回傳機制,優化傳輸路徑,以減少演算法的計算量,因此能增加運算內容的多樣性及運算速度。
深度學習演算法的計算複雜度高,YOLOv4也突破過去的技術限制,擁有輕盈的系統架構、高效率的演算法等優勢,使用一般的圖形處理器就能運算,「像是用算盤打出計算機的速度!」王建堯表示,團隊的開發初衷,即希望打造一個親民、好用的偵測系統,降低硬體成本,讓每個人都能以此技術創造更多有趣的應用。
▲中央研究院研究團隊研發出目前世界上最快最準的物件偵測演算法。(圖/中央研究院提供)
廖弘源指出,YOLOv4使用的關鍵技術源自該團隊承接科技部人工智慧專案計劃,與義隆電子合作開發的「智慧城市交通車流解決方案」。爲建置智慧車流分析系統,需要結合影像感測器和電腦視覺,在每個路口就能即時偵測車輛、停等車列及車速。團隊藉由着手改良YOLO演算法,發展更輕量、精準、快速的物件偵測核心技術,以實際應用於交通影像辨識。
YOLOv4自今年4月在原始碼代管平臺公開後,任何人都可免費使用,在電腦視覺領域裡引起全球廣泛討論,各式自制的教學影片、各種應用層出不窮。廖弘源表示,在臺灣,以YOLOv4技術開發的智慧車流分析系統,目前已佈設於桃園、新竹等地,全世界已有許多研發單位以此爲基礎,發展相關的系統或產品。