智能視頻(IV,IntelligentVideo)源自計算機(jī)視覺(CV,ComputerVision)技術(shù)。計算機(jī)視覺技術(shù)是人工智能(AI,ArtificialIntelligent)研究的分支之一,它能夠在圖像及圖像描述之間建立映射關(guān)系,從而使計算能夠通過數(shù)字圖像處理和分析來理解視頻畫面中的內(nèi)容。
視頻監(jiān)控中所提到的智能視頻技術(shù)主要是指:“自動的分析和抽取視頻源中的關(guān)鍵信息。”如果把攝像機(jī)看作人的眼睛,而智能視頻系統(tǒng)或設(shè)備則可以看作人的大腦。
建造視頻監(jiān)控系統(tǒng)的目的,一是為了視覺上的延伸——把處于別地的畫面通過網(wǎng)絡(luò)與設(shè)備“拉近”到眼前,因此有了遠(yuǎn)程監(jiān)控;二是為了智力上的延伸——讓系統(tǒng)自動為我們分析問題并解決問題,于是有了智能監(jiān)控。當(dāng)然,后者是更高層次上的要求,但也是視頻監(jiān)控今后發(fā)展的必然要求。
傳統(tǒng)的視頻監(jiān)控系統(tǒng)缺乏智能,在很大程度上依賴于人的判斷。然而,人類有著自身難以克服的弱點,比如:(1)人力有限,人的反應(yīng)與處理速度有限,導(dǎo)致我們在指定的時間內(nèi)能夠進(jìn)行監(jiān)視的地點有限。這也就意味著各個被監(jiān)控點并非每時每刻都處于監(jiān)控當(dāng)中。(2)人并非一個可以完全信賴的觀察者,無論是在觀看實時的視頻流還是在觀看錄像回放的時候,由于自身生理上的弱點,我們經(jīng)常無法察覺安全威脅,從而導(dǎo)致漏報現(xiàn)象的發(fā)生。
從上述分析來看,當(dāng)開展大規(guī)模視頻監(jiān)控以后,智能監(jiān)控實際上已不是可有可無的裝飾品,而是系統(tǒng)所必備的一種能力。否則,巨大的投資將由于缺乏人力資源的跟進(jìn)以及人類自身的弱點,而有可能變?yōu)橐环N浪費。
智能視頻技術(shù)可以在很多地方得到應(yīng)用。比如:
(1)高級視頻移動偵測:在復(fù)雜的天氣環(huán)境中(例如雨雪、大霧、大風(fēng)等)精確地偵測和識別單個物體或多個物體的運動情況,包括運動方向、運動特征等。
(2)物體追蹤:偵測到移動物體之后,根據(jù)物體的運動情況,自動發(fā)送PTZ控制指令,使攝像機(jī)能夠自動跟蹤物體,在物體超出該攝像機(jī)監(jiān)控范圍之后,自動通知物體所在區(qū)域的攝像機(jī)繼續(xù)進(jìn)行追蹤。
(3)人物面部識別:自動識別人物的臉部特征,并通過與數(shù)據(jù)庫檔案進(jìn)行比較來識別或驗證人物的身份。此類應(yīng)用又可以細(xì)分為“合作型”和“非合作型”兩大類。“合作型”應(yīng)用需要被監(jiān)控者在攝像機(jī)前停留一段時間,通常與門禁系統(tǒng)配合使用。“非合作型”則可以在人群中識別出特定的個體,此類應(yīng)用可以在機(jī)場、火車站、體育場館等安防應(yīng)用場景中發(fā)揮很大的作用。
(4)車輛識別:識別車輛的形狀、顏色、車牌號碼等特征,并反饋給監(jiān)控者。此類應(yīng)用可以用在被盜車輛追蹤等場景中。
(5)非法滯留:當(dāng)一個物體(如箱子、包裹、車輛、人物等)在敏感區(qū)域停留的時間過長,或超過了預(yù)定義的時間長度就產(chǎn)生報警。典型應(yīng)用場景包括機(jī)場、火車站、地鐵站等。
(6)交通流量控制:用于在公路上監(jiān)視交通情況,例如統(tǒng)計通過的車數(shù)、平均車速、是否有非法停靠、是否有故障車輛等等。