會(huì )員登錄
密碼找回
密碼修改
綁定手機號
2023-12-27
科技大時(shí)代,引人入勝。視界千變萬(wàn)化,視界之大,盡收眼底?;貧w安防的本初,對圖像無(wú)止境的追求與打磨,才形成了現今以智能視頻為核的安防應用大生態(tài)。
有偏差的世界與視界
百態(tài)安防,各色精彩!之于2023歲末之際,之于圖像,回首初心、細看當下、瞭望未來(lái)。
人眼看到的世界與機器讀出來(lái)得視界,有所異同。
世界即視界,人眼看視界,或許都一樣。
人眼有著(zhù)很強觀(guān)察能力,能夠在復雜及變化的環(huán)境中識別目標,同時(shí)由大腦賦予了最高級的智能分析能力,可以運用邏輯分析和推理能力去識別變化目標。
為此,長(cháng)久以來(lái),在監控室里死盯屏幕,成了監控人員的日常,這也是視頻監控時(shí)代最為傳統與普遍的工作方式。但,人眼看到的視界,就是真實(shí)視界嗎?
人眼看視界,或許真不一樣。
人非機器,先天性有所短板,帶有主觀(guān)性,容易心里誤導,產(chǎn)生誤判。
與文字、聲音相比,視頻承載了更多信息量,而要從大量豐富信息當中去讀取有用數據,這是非常繁瑣復雜的工作,這種被動(dòng)應對方式,并不能主動(dòng)預防,并受制于人員數量和能力,比如:長(cháng)時(shí)間易疲勞、錯看漏看、看得不及時(shí)。此外,在顯示終端方面也因各種原因受制,你看到的視界,不一定為實(shí)。
故而,有偏差的世界與視界,就需要圖像處理、優(yōu)化、調教,甚至是多維度的時(shí)空融合,來(lái)讓圖像盡可能的全域性無(wú)所不在與無(wú)所不能。
機器視覺(jué)的“技術(shù)雛形”
既然回首過(guò)去,對于圖像,行業(yè)最開(kāi)始做法是不斷為圖像做加法,一堆的后處理技術(shù)進(jìn)行科研突破,最為明顯體現在視頻圖像處理技術(shù),簡(jiǎn)而言之就是用計算機對視頻數字圖像進(jìn)行處理,其本質(zhì)是一種信號處理過(guò)程,而且是離散信號處理。
這其實(shí)就是機器視覺(jué)的最初技術(shù)形態(tài),雖功能有限,但底子還在??磮D像處理技術(shù)應用價(jià)值,有幾個(gè)方面:
其一,提高圖像的視感質(zhì)量,如進(jìn)行圖像的亮度、彩色變換,增強、抑制某些成分,對圖像進(jìn)行幾何變換等,以改善視頻圖像的質(zhì)量。
其二,提取視頻圖像中所包含的某些特征或特殊信息,這些被提取的特征或信息往往為計算機分析圖像提供便利。
其三,視頻圖像增強與復原。圖像增強的目的是將圖像轉換為更適合人和機器的分析的形式。
其四,圖像的分析。從圖像中抽取某些有用的度量、數據和信息,以的到某種數值結果。
其五,能使圖像再現性。圖像在數字化時(shí)準確地表現了原稿,則數字圖像處理過(guò)程始終能保持圖像的再現。
其六,靈活多變的處理功能。把監控畫(huà)面分割為任意大小的二維數組,這意味著(zhù)圖像的數字化精度可以達到滿(mǎn)足任一應用需求。
其七,適用面寬。不論是來(lái)自哪個(gè)行業(yè)的信息源的圖像只要被變換為數字編碼形式后,均是用二維數組表示的灰度圖像組合而成。
其八,靈活性高。即凡是可以用數學(xué)公式或邏輯關(guān)系來(lái)表達的一切運算均可用數字圖像處理實(shí)現。
依據八大特性,圖像處理研究?jì)热菥头秩蟀鍓K:圖像壓縮;增強和復原;匹配、描述和識別。
機器讀懂視界的行業(yè)邏輯
時(shí)代在變革,技術(shù)在演進(jìn),與之相悖的,終將漸趨式微,這同樣適用于圖像處理技術(shù)。如樓宇對講到智能家居,防盜報警到AIOT一樣,圖像處理到機器視覺(jué),也只是時(shí)代產(chǎn)物,底色未變。
過(guò)去圖像處理在“后側”,而機器視覺(jué)更多“向前”。
在當下,智能攝像機本身作為前端產(chǎn)品,芯片、鏡頭、焦距、補光、外殼等一系列硬件工程是基礎。能將智能算法跟場(chǎng)景關(guān)聯(lián)后,根據算法需求界定一個(gè)范圍,盡量做到場(chǎng)景變化,但硬件減少變化,用軟件來(lái)做調節。
全天候的多維融合全域感知,這是智能攝像機對于圖像追求的另一個(gè)技術(shù)維度,視頻、音頻、氣味、生物特征等技術(shù)的發(fā)展和成熟,全面掌控防控場(chǎng)景和目標的完整信息成為可能,在安防應用中越來(lái)越多的部署更多類(lèi)別的感知設備,用于從更多維度采集目標信息,包括目標的各種要素、活動(dòng)軌跡以及關(guān)聯(lián)信息等,從而形成一個(gè)動(dòng)態(tài)感知體系,實(shí)現防控工作的“無(wú)所不在、無(wú)所不知”目標。這一點(diǎn)從最近幾年的聲光劃界攝像機、光譜水質(zhì)攝像機、雷視合一攝像機、氣象觀(guān)測攝像機、環(huán)保攝像機等一些列場(chǎng)景定義類(lèi)產(chǎn)品,無(wú)一不在說(shuō)明,圖像處理的多面與多角度,來(lái)適配多場(chǎng)景的深度。
當然,攝像機一個(gè)單品,不可能一肩挑起這時(shí)代與這視界,形成成熟與高價(jià)值的解決方案閉環(huán),是必然。
在追求極致更好圖像的行業(yè)進(jìn)程中,圖像的廣度在縮小,更多的是在深度的追求。通用型、一招鮮吃遍天的攝像機已經(jīng)不復存在,這還是源于用戶(hù)需求驅動(dòng)。
在2023深圳安博會(huì )參觀(guān)走訪(fǎng)期間,記者了解到很多底層用戶(hù)或中間生態(tài)位集成商大多表示,現有智能視頻方案過(guò)于通用,不夠適配行業(yè)具體場(chǎng)景。為此,此屆安博會(huì )最大不同之一就是硬件展示減少,方案展示居多的原因。
機器視覺(jué)解決方案需要與行業(yè)自身長(cháng)期運轉而沉淀下來(lái)的商業(yè)邏輯與行業(yè)經(jīng)驗相融合。除了成熟的技術(shù)能力外,該解決方案對行業(yè)具體場(chǎng)景的全方位適配必不可少。同樣,機器視覺(jué)解決方案應用門(mén)檻高,企業(yè)IT架構/基礎設施適配難度高。對于很多企業(yè)來(lái)說(shuō),算法訓練相對容易實(shí)現,但如何與實(shí)時(shí)推理結合起來(lái)部署到實(shí)際應用場(chǎng)景,卻是一個(gè)難題。為此,大模型的出現,或者類(lèi)似算法商城、算法工廠(chǎng)、AI自動(dòng)工具等,就開(kāi)辟了另一個(gè)戰場(chǎng),另一個(gè)對圖像追求無(wú)休止的行業(yè)邏輯。
圖像的未來(lái)之愿
對于圖像創(chuàng )新,行業(yè)心之所向。沉于過(guò)去,不能打破現狀,之于圖像的未來(lái),本當歸于平靜,來(lái)看未來(lái)之愿與應用模樣。
其一,大視界時(shí)代,未來(lái)數據圖像技術(shù)強調高清晰度、高速傳輸、實(shí)時(shí)圖像處理、三維成像或多維成像、智能化、自動(dòng)化等方向發(fā)展。
其二,智能化方面,力爭使計算機識別和理解能夠按照人的認識和思維方式工作,能夠考慮到主觀(guān)概率和非邏輯思維。這里有一點(diǎn)需要指出,AI在智能化方面可以做圖像數據與內容的提取與分析,但是并不能在視頻圖像處理方面做文章。
其三,未來(lái)圖像技術(shù)強調操作、運用的方便性,圖像處理功能的集中化趨勢是必然會(huì )存在的。所以,最近幾年硬件芯片廠(chǎng)家不斷將諸多AI功能固化在芯片上,形成一個(gè)SOC級的獨立小系統。
有偏差的視界,在以智能路為路徑,盡可能形成你是我的眼,你見(jiàn)如我見(jiàn);不止所見(jiàn),還能關(guān)聯(lián)其他,以圖像為圓點(diǎn),來(lái)畫(huà)視界。
(轉自CPS中安網(wǎng))