時間:2024-01-10 10:13:34
導言:作為寫作愛好者,不可錯過為您精心挑選的10篇計算機視覺的研究內(nèi)容,它們將為您的寫作提供全新的視角,我們衷心期待您的閱讀,并希望這些內(nèi)容能為您提供靈感和參考。
隨著經(jīng)濟的迅猛發(fā)展,汽車的迅速普及,根據(jù)社會對汽車產(chǎn)業(yè)的要求,車輛的各方面指標都受到人們越來越多地關(guān)注,汽車涂裝過程中的瑕疵直接影響汽車的外觀質(zhì)量,因此如何在生產(chǎn)過程中利用計算機視覺檢測技術(shù)檢測出并及時修補汽車涂裝過程中產(chǎn)生的瑕疵就成了首要的任務[1]。本文的研究內(nèi)容是首先了解計算機視覺檢測系統(tǒng)的工作原理,汽車涂裝瑕疵的種類,然后結(jié)合兩者的特點,應用計算機視覺檢測系統(tǒng)檢測汽車涂裝瑕疵。該研究的價值在于兩方面:①對于汽車生產(chǎn)的自動化和過程自動化,計算機視覺是現(xiàn)實真正意義的自動的基礎(chǔ)和一種重要的質(zhì)量控制的手段;②對于汽車涂裝瑕疵的修補可以提高其修補的精度。
2、汽車涂裝瑕疵的計算機視覺檢測系統(tǒng)
汽車涂裝瑕疵檢測系統(tǒng)主要包括照明系統(tǒng)、圖像采集卡、CCD攝像機、計算機以及軟件處理等幾個主要部分[2]。綜合計算機視覺檢測系統(tǒng)的構(gòu)成和線結(jié)構(gòu)光測量的原理,基于計算機視覺的汽車涂裝瑕疵的檢測系統(tǒng)大致是這樣構(gòu)成的:將線結(jié)構(gòu)光投射到被測物上,所形成的光斑作為傳感信號,用CCD攝像機采集光斑圖像,采集到的圖像信號被傳輸?shù)接嬎銠C,根據(jù)圖像處理和計算機視覺檢測系統(tǒng)的處理產(chǎn)生處理結(jié)果,返回到涂裝生產(chǎn)線,對車身的涂裝進行修正,從而提高產(chǎn)品質(zhì)量。汽車涂裝瑕疵的視覺檢測系統(tǒng)如圖1所示[3]。
3、計算機視覺檢測
計算機視覺是計算機對圖像進行自動處理并報告“圖像中有什么”的過程,也就是說它識別圖像中的內(nèi)容。圖像中的內(nèi)容往往是某些機器零件,而處理的目標不僅要能對機器零件定位,還要能對其進行檢驗。計算機視覺系統(tǒng)基本原理:機器視覺系統(tǒng)通常采用CCD相機攝取圖像,將其轉(zhuǎn)化為數(shù)字信號,再采用先進的計算機硬件與軟件技術(shù)對圖像數(shù)字信號進行處理,從而得到所需要的各種目標圖像特征值,并在此基礎(chǔ)上實現(xiàn)模式識別、坐標計算、灰度分布圖等多種功能。計算機視覺系統(tǒng)能夠根據(jù)其檢測結(jié)果快速地顯示圖像、輸出數(shù)據(jù)、指令,執(zhí)行機構(gòu)可以配合其完成指令的實施。計算機視覺系統(tǒng)主要由圖像獲取、圖像分析和處理、輸出顯示或控制三個功能模塊組成[4]。視覺檢測按其所處理的數(shù)據(jù)類型可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測。另外,還有X射線檢測、超聲波檢測和紅外線檢測。一個完整視覺檢測系統(tǒng)包括:圖像采集、圖像分割、零件識別、模型匹配和決策判斷。Newman[5]等描述了利用深度圖像進行零件檢測的AVI系統(tǒng),具有一定的代表性。一個典型的AVI系統(tǒng)如圖2所示。
4、汽車涂裝瑕疵的檢測算法
1.1計算機視覺概述
通過使用計算機和相關(guān)設備,對生物視覺進行模擬的方式,就是計算機視覺。對采集到的圖片或視頻進行相應的技術(shù)處理,從而獲得相應的三維信息場景,是計算機視覺的主要任務。計算機視覺是一門學問,它就如何通過計算機和照相機的運用,使人們獲得被拍攝對象的數(shù)據(jù)與信息所需等問題進行研究。簡單的說,就是讓計算機通過人們給其安裝上的“大腦”和“眼睛”,對周圍環(huán)境進行感知。計算機視覺是一門綜合性學科,在各個領(lǐng)域都有所作為,已經(jīng)吸引了各個領(lǐng)域的研究者對其研究。同時,計算機視覺也是科學領(lǐng)域中一個具有重要挑戰(zhàn)性的研究。
1.2計算機視覺領(lǐng)域基本體系結(jié)構(gòu)
提出第一個較為完善的視覺系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結(jié)合圖像處理、心理物理學等多領(lǐng)域的研究成果,提出被計算機視覺工作者基本接受的計算機視覺系統(tǒng)框架。在此基礎(chǔ)上,研究者們針對視覺系統(tǒng)框架的各個角度、各個階段、各個功能進行分析研究,得出了計算機視覺系統(tǒng)的基本體系結(jié)構(gòu),如圖1。
2計算機視覺在交通領(lǐng)域的應用
2.1牌照識別
車輛的唯一身份是車輛牌照。在檢測違規(guī)車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應用價值。然而在實際應用工作中,雖然車牌識別技術(shù)相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術(shù)仍需改善。車牌定位技術(shù)、車牌字符識別技術(shù)和車牌字符分割技術(shù)是組成車牌識別技術(shù)的重要部分。
2.2車輛檢測
目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續(xù)變化的。此外,對于某些交通區(qū)域來說,公共資源的配備,比如交通警察、交通車輛的數(shù)量是有限的。如果能根據(jù)計算機視覺技術(shù),對交通路口的不同時間、不同位置的交通情況進行分析計算,并對交通流量進行預測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據(jù)實際情況設置動態(tài)變化等技術(shù)提供支持。
2.3統(tǒng)計公交乘客人數(shù)
城市公共交通的核心內(nèi)容是城市公交調(diào)度問題,一個城市如何合理的解決公交調(diào)度問題,是緩解城市運力和運量矛盾,緩解城市交通緊張的有效措施。城市公交調(diào)度問題,為公交公司與乘客的平衡利益,為公交公司的經(jīng)濟利益和社會效益的提高做出了巨大的貢獻。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調(diào)度不均衡問題,使有限資源浪費嚴重。在計算機視覺智能公交系統(tǒng)中,自動乘客計數(shù)技術(shù)是其關(guān)鍵技術(shù)。自動乘客計數(shù)技術(shù),是對乘客上下車的時間和地點自動收集的最有效的技術(shù)之一。根據(jù)其收集到的數(shù)據(jù),從時間和地點兩方面對客流分析,為城市公交調(diào)度進行合理的安排。
2.4對車道偏離程度和駕駛員工作狀態(tài)判斷
交通事故的發(fā)生率隨著車輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關(guān)數(shù)據(jù)顯示,因車道偏離導致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導致車道偏離的主要原因。針對此種現(xiàn)象,為減少交通事故的發(fā)生,計算機視覺中車道偏離預警系統(tǒng)被研究開發(fā)并被廣泛應用。針對駕駛員眨眼頻率,利用計算機視覺對駕駛員面部進行圖像處理和分析,再根據(jù)疲勞駕駛關(guān)注度與眨眼頻率的關(guān)系,對駕駛員的工作狀態(tài)進行判斷。此外,根據(jù)道路識別技術(shù),對車輛行駛狀態(tài)進行檢測,也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計算機視覺的基礎(chǔ)上,檢測駕駛員疲勞狀態(tài)的有效方法。
2.5路面破損檢測
最常見的路面損壞方式就是裂縫。利用計算機視覺,及時發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴重之前進行修補,有利于節(jié)省維護成本,也避免出現(xiàn)路面坍塌,車輛凹陷的情況發(fā)生。利用計算機視覺進行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。
3結(jié)論
本文從計算機視覺的概述,及計算機視覺基本體系結(jié)構(gòu),和計算機視覺在交通領(lǐng)域中的應用三面進行分析,可見計算機視覺在交通領(lǐng)域中的廣泛應用,在交通領(lǐng)域中應用的有效性、顯著性,以此可得計算機視覺在現(xiàn)展過程中的重要性。隨著計算機視覺技術(shù)的越來越成熟,交通領(lǐng)域的檢測管理一定會加嚴格,更加安全。
作者:夏棟 單位:同濟大學軟件學院
參考文獻:
[1]段里仁.智能交通系境在我國道路空通管理中的應用[J].北方工業(yè)時報,2015(06).
[2]王豐元.計算機視覺在建筑區(qū)間的應用實例分析[J].河北電力學報,2015(04).
[3]李釗稱.主動測距技術(shù)在計算機數(shù)據(jù)分析中的作用探析[J].計算機應用,2015(08).
中圖分類號:TP37 文獻標識碼:A 文章編號:1009-3044(2016)03-0242-02
計算機人工智能技術(shù)中的一項重要技術(shù)就是計算機視覺技術(shù),這種技術(shù)主要是讓計算機利用圖像來實現(xiàn)認知環(huán)境信息的目的,這一目的的實現(xiàn)需要用到多種高尖端技術(shù)。近年來隨著計算機技術(shù)以及計算機網(wǎng)絡的普及與發(fā)展,計算機視覺技術(shù)也得到了較快發(fā)展,并且在實際生產(chǎn)與生活中的應用也越來越廣泛。
1 計算機視覺技術(shù)概述
1.1 基本概念
計算機視覺技術(shù)主要研究計算機認知能力的一門技術(shù),其具體主要是通過用攝像機代替人的眼睛,用電腦代替人的大腦,最終使計算機具備類似于人類的識別、判斷以及記憶目標的功能,代替人類進行部分生產(chǎn)作業(yè)。人們目前研究的人工智能技術(shù)中的一項重要內(nèi)容就是計算機視覺技術(shù),通過研究計算機視覺技術(shù)可以讓計算機擁有利用二維圖像認知三維環(huán)境的功能??偟膩碚f,計算機視覺技術(shù)是在圖像與信號處理技術(shù)、概率分析統(tǒng)計、網(wǎng)絡神經(jīng)技術(shù)以及信息處理技術(shù)的基礎(chǔ)上,利用計算機來分析、處理視覺信息的技術(shù),它是現(xiàn)代社會新興起的一門高新技術(shù)。
1.2 工作原理
在亮度滿足要求的情況下,首先使用攝像機對具體事物的圖像信息進行采集,利用網(wǎng)絡把采集到的圖像信息向計算機內(nèi)部輸送,然后在計算機系統(tǒng)內(nèi)部處理加工圖像信息會把事物的原始圖像得到,隨后利用圖像處理技術(shù)進一步處理原始圖像,獲得優(yōu)化質(zhì)量效果之后的圖像,分類與整理圖像中有特征價值的信息,通過智能識別技術(shù)識別與描述提取到的圖像信息特征,最后把得到的高層次的抽象信息存儲起來,在進行識別事務時分析對比這些儲存信息就可以實現(xiàn)事物的識別,這樣視覺系統(tǒng)的基本任務也就完成了。其具體視覺系統(tǒng)如圖1所示:
1.3理論框架
人類研究視覺技術(shù)雖然起步比較早,但取得較大進步是在20世紀80年代初伴隨著視覺計算理論的出現(xiàn)。它的出現(xiàn)把研究視覺理論的策略問題解決了,視覺技術(shù)是一項特別復雜的信息處理過程,要想對視覺的本質(zhì)準確完整的理解,必須從不同角度與層次研究與分析視覺本質(zhì)。視覺計算理論研究層次大致可分為:計算機理論、算法以及實際執(zhí)行。站在計算機理論的角度分析視覺技術(shù),我們可知必須用要素圖、維圖、以及三維模型表像來描述視覺信息。
所以,可以把計算機視覺技術(shù)當做從三維環(huán)境圖像中抽取、描述與解釋信息的過程,其主要分析步驟可分為感覺、處理、描述、識別、解釋等。若依據(jù)上述各過程實現(xiàn)需用到的方法與技術(shù)的復雜性劃分層次,可大致把計算機視覺技術(shù)劃分為:低層視覺處理、中層視覺處理、高層視覺處理三個層次。
2 計算機視覺技術(shù)在自動化中的應用
2.1 農(nóng)業(yè)自動化中計算機視覺技術(shù)的應用
在農(nóng)業(yè)自動化中應用計算機視覺技術(shù)可以全天候?qū)崟r監(jiān)測農(nóng)作物的生長狀況,便于科學管理農(nóng)作物。還可以應用計算機視覺技術(shù)來檢測農(nóng)產(chǎn)品的質(zhì)量,例如可以應用計算機監(jiān)測技術(shù)來監(jiān)測大多數(shù)蔬菜的質(zhì)量,傳統(tǒng)的人工檢測蔬菜質(zhì)量的方法,不僅費時費力,而且檢測結(jié)果的準確性也不能很好的保證,在實際人工檢測過程中還容易傷害蔬菜,可以通過利用計算機視覺技術(shù)來感應蔬菜自身釋放的紅外線、紫外線以及其他可見光的能量大小,然后和質(zhì)量達標蔬菜的光線能量大小進行對比,根據(jù)這些對比結(jié)果可以把蔬菜質(zhì)量的好壞準確判斷出來,在蔬菜質(zhì)量檢測過程中應用計算機視覺技術(shù),把傳統(tǒng)的蔬菜檢測方法完全顛覆了,極大的方便了農(nóng)產(chǎn)品的質(zhì)量檢測,由此可見,計算機視覺技術(shù)在農(nóng)業(yè)生產(chǎn)中有很高的使用與推廣價值。
2.2 在工業(yè)自動化中計算機視覺技術(shù)的應用
計算機視覺技術(shù)在工業(yè)自動化應用的一個重要領(lǐng)域就是可以精密測量零件尺寸,其測量與被測對象的原理如圖2所示。
光學系統(tǒng)、計算機處理系統(tǒng)以及CCD攝像頭,是計算機檢測系統(tǒng)的主要組成,被測物體由光源發(fā)出的平行光束進行照射,利用顯微光學鏡把待檢測部位的輪廓圖像呈現(xiàn)在攝像機的面陣CCD上,然后再通過計算機處理這些圖像,進而把被測部位的輪廓位置信息獲取下來,若被測對象是出現(xiàn)位移時,可通過兩次重復測量,利用兩次測量的位置差就可以得出,被測物體的位移量。
此外計算機視覺技術(shù)還可以應用于逆向工程中,應用3D數(shù)字化測量儀可以快速準確的測出現(xiàn)有工件輪廓的坐標值,同時還能構(gòu)建曲面,保存成CAD或CAM圖像,把這些圖像送入CNC制作中心加工,便可制作出產(chǎn)品,這也就是所謂的逆向工程。由上述分析我們可知逆向工程要想實現(xiàn),最關(guān)鍵的一環(huán)就是如何通過精密測量系統(tǒng)來測量樣品的三圍尺寸,獲得各部位數(shù)據(jù),進而做曲面處理進而加工生產(chǎn)。對于這一難題我可以通過利用線結(jié)構(gòu)光測量物體表面輪廓技術(shù)來實現(xiàn),器具體輪廓結(jié)構(gòu)示意圖如下圖3所示。
這種測量方法的工作原理為:利用激光穿越平行、等距的振幅光柵組件,或直接采用干涉儀發(fā)出的干涉條紋,形成平面條紋結(jié)構(gòu)光,再向物體表面投射,由于物體各表面的深度與曲率的不同,條紋會自動出現(xiàn)變化,然后再通過使用CCD攝像機對變形條紋進行拍攝。這樣就可以把物體表面輪廓的變化情況分析出來。攝像機在拍攝圖像的過程中,把圖像信號轉(zhuǎn)化為模擬信號,再轉(zhuǎn)化為數(shù)字信號,然后經(jīng)過傳送再還原信號到圖形處理系統(tǒng),就得到三維輪廓圖像。
在工業(yè)自動化中計算機視覺技術(shù)的深入廣泛應用,不但使工業(yè)產(chǎn)品的生產(chǎn)質(zhì)量得到了保障,而且跨越式的提高了工業(yè)產(chǎn)品的生產(chǎn)速度。如計算機視覺技術(shù)可以很好的檢測產(chǎn)品包裝質(zhì)量,封口質(zhì)量以及印刷質(zhì)量等等,如我國重點指定的印刷造幣機器的南京造幣廠,由于貨幣制造印刷是由印刷造幣機器來實現(xiàn)的,所以要嚴格要求其生產(chǎn)工藝,一絲一毫的生產(chǎn)差錯都不允許存在,為了保障印刷制造出來的造幣機器質(zhì)量完全達標,必須嚴格精確檢測生產(chǎn)出來的成品。在印刷造幣機器的過程中要求要有非常高的計算機視覺技術(shù),隨著計算機視覺技術(shù)的不斷進步,計算機視覺技術(shù)已經(jīng)對印刷造幣機器的需求完全滿足了,實際的應用效果也非常理想,印刷造幣機器在實際生產(chǎn)的過程中,南京造幣廠把計算機視覺技術(shù)應用在了每個應刷造幣機器最后的生產(chǎn)工序上,硬幣受到重力下落的瞬間,計算機視覺技術(shù)可以瞬間采集圖像的信息,準確拍攝硬幣在下落過程中的圖像,通過高速光纖傳感器可以把硬幣圖像向計算機系統(tǒng)快速傳輸,利用計算機系統(tǒng)處理信息與識別信息的超強能力,可以及時識別硬幣質(zhì)量,經(jīng)大量實踐研究得出,在印刷造幣機器上應用計算機視覺技術(shù)已經(jīng)幾乎沒有檢查差錯現(xiàn)象的發(fā)生,由此可知,在工業(yè)自動化中計算機視覺技術(shù)的應用不但可行,而且發(fā)展空間還很大。
2.3 在醫(yī)學自動化中計算機視覺技術(shù)的應用
在醫(yī)學領(lǐng)域計算機視覺技術(shù)也得到了廣泛應用,如醫(yī)學中經(jīng)常用到的CT圖像以及X射線圖都用到了計算機視覺技術(shù),這些技術(shù)的廣泛應用很大程度上方便了醫(yī)生準確判斷病人病情,另外,在生產(chǎn)藥品的過程中,應用計算機視覺技術(shù)可以高效檢測藥品包裝的合格與否,其基本流程是:傳送裝置先準確運輸藥品到指定位置,傳送裝置自身又可分為檢測與分離兩個區(qū)域,在傳送藥品的過程中藥品的圖像信息會被特定的攝像機采集,采集完成后向計算機系統(tǒng)傳遞采集信息,然后計算機系統(tǒng)會分析與處理這些信息,把沒有包裝好的藥品自動識別出來,并且向分離區(qū)傳遞識別信息,分離區(qū)的自動裝置會依據(jù)傳輸?shù)姆蛛x信息,隔離開沒有包裝好的藥品,這樣就可以有效分類包裝好的藥品與沒有包裝好的藥品,在藥品包裝檢測方面應用計算機視覺技術(shù)代替?zhèn)鹘y(tǒng)人工檢測,不但可以實現(xiàn)藥品準確無誤的檢測,而且還可以大大提高檢測藥品包裝質(zhì)量的效率,完善了藥品生產(chǎn)的自動化,由此可見,在醫(yī)學自動化中應用計算機視覺技術(shù)可以積極促進醫(yī)學自動化的發(fā)展。
3 結(jié)束語
總之,計算機視覺技術(shù)是一門研究計算機識別能力的高新技術(shù),它涵蓋了很多其他技術(shù),具有一定復雜性。要想使其在自動化生產(chǎn)中得到更好地推廣與應用,我們必須在明白其基本概念、工作原理以及理論框架的基礎(chǔ)上,結(jié)合實際生產(chǎn)情況,不斷進行深入研究,只有這樣才能使計算機視覺技術(shù)得到更好地推廣與應用,才能使這項現(xiàn)代化的高新技術(shù)更好的服務于社會,服務于人類。
參考文獻:
[1] 龔超,羅毅,涂光瑜.計算機視覺技術(shù)及其在電力系統(tǒng)自動化中的應用[J].電力系統(tǒng)自動化,2003(1).
接受信息的關(guān)鍵手段之一就是視覺系統(tǒng),隨著科學技術(shù)水平的不斷發(fā)展,以及計算機和信號處理理論的誕生,讓機器擁有人類視覺功能已經(jīng)不再是夢。對所采集視頻中的運動目標進行跟蹤、檢測,并對其目標行為進行分析,就是運動目標分析的內(nèi)容,運動目標分析是計算機視覺領(lǐng)域關(guān)鍵內(nèi)容之一,其屬于圖像理解與圖像分析的范疇。而在運動目標分析系統(tǒng)中,跟蹤與檢測運動目標則為中級和低級處理部分,是分析與理解行為的高等層分析模塊的基礎(chǔ)。檢測與跟蹤運動目標技術(shù)主要包括了:機器人視覺導航、軍事領(lǐng)域、運動圖像編碼、交通管制、視覺監(jiān)視等。
1目標檢測算法
連續(xù)圖像序列由視頻中提取出,由前景區(qū)域與背景區(qū)域共同組成了整個畫面。前景區(qū)域包含了如運動的人體、車輛等動態(tài)要素,它是指人們較為感興趣的區(qū)域。而背景區(qū)域主要包含例如樹木、建筑物等靜態(tài)要素,它的像素值僅發(fā)生微弱變化或者不產(chǎn)生變化。在連續(xù)圖像序列中,采用一系列算法分隔開背景區(qū)域和前景區(qū)域,將運動目標信息有效提取,則為運動目標檢測。以靜態(tài)場景為基礎(chǔ)的運動目標檢測算法包括了光流法、背景差分法、幀間查分法等,文章主要針對背景差分法進行介紹。
背景差分法通常適用于靜態(tài)場景,其是將背景圖像與當前幀圖像進行差分,運動目標依靠閥值化進行檢測,因為該算法僅能夠在背景變化緩慢或者不發(fā)生變化的情況下應用,因此就有著一定的局限性。假設當前幀圖像為fk(x,y),背景圖像B(x,y)可通過一定的方法得出,而這時背景差分圖像則為:
(1)
而假設二值化閥值為Th,二值化圖像B(x,y)則為:
(2)
運動目標檢測結(jié)果可通過數(shù)學形態(tài)學處理獲得。
2 背景模型的實時更新
要更新背景圖像可采用一階KALMAN濾波來實現(xiàn),為了克服氣候變化、光照變化等外部環(huán)境變化對運動檢測產(chǎn)生的影響,采用一階KALMAN濾波更新背景圖像公式如下:
Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)
而增益因子則為:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)
公式中?琢1和?琢2是權(quán)值系數(shù);M是第k時刻二值化后目標圖像中p像素的值;B為背景圖像;I為當前幀圖像。要想將運動目標從背景序列圖像中有效分割出來,就必須要達到?琢2足夠小的條件,且?琢1應等于或者大于10?琢2,若?琢1值過大,就會將算法自身的去噪特性喪失,在序列背景圖像中也會存儲越來越多的運動變化。
3 更新車輛目標模型
核與活動輪廓算法具有效率高、技術(shù)復雜度低等特點,它以非參數(shù)核概率密度估計理論為基礎(chǔ),在視頻運動目標跟蹤中廣泛應用。彩色圖像序列通過攝像機獲取,人臉目標模型可以采用RGB顏色空間來進行描述。在跟蹤車輛的過程中,噪聲、遮擋、光照等干擾或多或少存在,因干擾因素的存在,車輛像素特征也會發(fā)生相應的微弱變化。若不對目標模型進行更新,會對跟蹤精度產(chǎn)生影響,所以,采用的矩形模板會包括一定背景。而在實施跟蹤的過程中,要對車輛目標模型進行更換。如果其過程物遮擋,當BHATTACHARYYA系數(shù)滿足?籽>Tudm條件時,更新車輛目標模型,更新模型為:
(5)
公式中Tudm是模板更新閥值;qk-1是更新之前的車輛目標模型。通過視頻跟蹤,在近場景和遠場景拍攝到的視頻中,多尺度圖像空間由各個幀圖像構(gòu)成。例如:將將書本作為跟蹤對象,由遠及近從書本的正上方拍攝六十幀圖像,為了能使矩形框正好能夠包含書本,對每幀圖像張書本手工劃定矩形框,并對框內(nèi)圖像的信息量進行統(tǒng)計。最后,隨書本尺度的變化,給出圖像信息量變化曲線。
4 計算機視覺原理
計算機視覺是一門研究怎樣使機器進行觀察的科學,更切確地說,就是指利用電腦和攝影機代替人眼對目標進行識別、跟蹤和測量等機器視覺,并進一步做圖形處理,用電腦處理成為傳送給儀器檢測或更適合人眼觀察的圖像。計算機視覺研究相關(guān)的理論和技術(shù)作為一個科學學科,嘗試創(chuàng)建能夠從圖像或者多維數(shù)據(jù)中獲取信息的人工智能系統(tǒng)。這里所指的信息指Shannon定義的,可以用來幫助做一個決定的信息。因為感知可以看作是從感官信號中提取信息,所以計算機視覺也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中感知的科學。
計算機視覺就是由計算機來代替大腦完成處理和解釋,用各種成象系統(tǒng)代替視覺器官作為輸入敏感手段。使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應環(huán)境的能力就是計算機視覺的最終研究目標,而需要經(jīng)過長期的努力才能達到這個目標。所以,在實現(xiàn)最終目標以前,通過努力的中期目標是建立一種視覺系統(tǒng),這個系統(tǒng)能依靠反饋的某種程度的智能和視覺敏感完成一定的任務。例如:計算機視覺的一個重要應用領(lǐng)域就是自主車輛的視覺導航,但要實現(xiàn)自主導航的系統(tǒng),卻還沒有條件實現(xiàn)象人那樣能識別和理解任何環(huán)境。所以,人們通過不懈的努力,研究在高速公路上具有道路跟蹤能力,有效避免與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。人類視覺系統(tǒng)是有史以來,人們所知道的功能最強大和完善的視覺系統(tǒng)。這里要指出的一點是在計算機視覺系統(tǒng)中計算機起代替人腦的作用。計算機視覺可以而且應該根據(jù)計算機系統(tǒng)的特點來進行視覺信息的處理,但并不等于計算機必須按人類視覺的方法完成視覺信息的處理。可以說,對人類視覺處理機制的研究將給計算機視覺的研究提供指導和啟發(fā),所以,用計算機信息處理的方法研究人類視覺的機理,建立人類視覺的計算理論,與此同時也是一個十分重要和讓人感興趣的研究領(lǐng)域。這方面的研究被稱為計算視覺。計算視覺可被認為是計算機視覺中的一個研究領(lǐng)域。計算機視覺領(lǐng)域的不完善性與多樣性為其突出特點。
5 結(jié)束語
對視頻中的運動目標進行跟蹤、識別、檢測,并對目標行為進行研究、分析,這就是基于視覺運動目標分析。以計算機視覺為基礎(chǔ),分析運動目標,包括了目標行為的理解與分析、目標跟蹤、運動目標檢測、預處理圖像等,它是計算機視覺領(lǐng)域重要內(nèi)容之一。理解與分析運動目標的行為,既是計算機視覺的根本目的之一,也是檢測與跟蹤運動目標的最終目標。從理論層考慮,理解與分析運動目標的行為可以分為人工智能理論研究與模式識別。簡要闡述基于計算機視覺的運動目標分析,而所面臨的是對運動目標行為的理解。
參考文獻
[1]楊可,劉明軍,毛欣,夏維建,劉偉,周旋,吳煒,周凱.基于計算機視覺的電纜終端表面溫升分析系統(tǒng)[J].電視技術(shù),2013(7).
[2]葉闖,沈益青,李豪,曹思汗,王柏祥.基于人類視覺特性(HVS)的離散小波變換(DWT)數(shù)字水印算法[J].浙江大學學報:理學版,2013(2).
[3]何青海,馬本學,瞿端陽,李宏偉,王寶.基于機器視覺棉葉螨自動監(jiān)測與分級方法研究[J].農(nóng)機化研究,2013(4).
作者簡介:陳芳林(1983-),男,湖南株洲人,國防科學技術(shù)大學機電工程與自動化學院,講師;周宗潭(1969-),男,河南洛陽人,國防科學技術(shù)大學機電工程與自動化學院,教授。(湖南 長沙 410073)
中圖分類號:G643.2 文獻標識碼:A 文章編號:1007-0079(2013)26-0065-02
進入21世紀,創(chuàng)新型人才的培養(yǎng)成為各國政府和高等教育界關(guān)注的一個焦點。世界各國研究型大學的共同特點是在研究生教育階段致力于培養(yǎng)富有創(chuàng)新意識和創(chuàng)新能力的高級人才。[1]研討式教學是培養(yǎng)研究生創(chuàng)新精神、科研能力的有效途徑,教師講解與學生探討兩部分相結(jié)合是研討式教學采用的主要模式。[2]將課程分成兩部分之后,教師講解的時間就必須壓縮,教師一方面需要思考如何在較短的時間內(nèi)完成課程的講解,同時還需要考慮課程講解要與學生探討部分緊密結(jié)合。因此,如何上好研討式教學教師講解這部分課,越來越受高等院校的重視。本文針對筆者教授工科研究生課程“計算機視覺”的實踐與經(jīng)驗,闡述了筆者對于如何上好研討式教學教師講解這部分課的個人體會。總結(jié)為兩點:第一,首先要充分做好課程準備;第二,上課環(huán)節(jié)采取回顧—案例—小結(jié)的講解方式。下面從課程準備、課前回顧、課程講解、課后小結(jié)四個方面分別闡述(如圖1所示)。
一、“計算機視覺”課程準備
要上好一門研討式教學的課程,一定要結(jié)合該門課程的特點,量身定制課程內(nèi)容,進行精心準備。本節(jié)先介紹“計算機視覺”課程的特點,然后結(jié)合該門課程的特點,介紹筆者對于“計算機視覺”的課程準備。
1.“計算機視覺”課程特點
“計算機視覺”是“數(shù)字圖像處理”和“模式識別”等課程的后續(xù)課程。該課程重點在于圖像或者圖像序列的分析理解。課程知識在機器人導航、偵查、測繪、測量、精密加工和目標跟蹤等多個領(lǐng)域都有廣泛的應用。[3]近年來基于視覺信息的控制反饋也開始受到廣泛關(guān)注。國內(nèi)高校一般都為研究生開設了此門課程。
計算機視覺技術(shù)應用廣泛、算法原理涉及面廣:涉及到概率與數(shù)理統(tǒng)計、信號與系統(tǒng)、圖像等基礎(chǔ)知識?!坝嬎銠C視覺”是一門重要的控制類、電子類及計算機類專業(yè)研究生的選修課程,它內(nèi)容廣泛、綜合性強,研討能力的培養(yǎng)顯得非常關(guān)鍵。
2.課程準備
首先,結(jié)合“計算機視覺”課程內(nèi)容廣泛、技術(shù)日益更新和豐富的特點,將課程36學時分為12次課,每次課為3小時,每堂課教師講解一個專題。這種設計,一方面可以更廣地涉及計算機視覺的各個領(lǐng)域;另一方面以專題的形式來講解,可以將學生帶入到該專題,介紹基本背景、理論、知識和方法,讓學生有一個初步的了解,方便課后學生對感興趣的專題進一步深入挖掘與研究。
其次,在課程開始之前,教師仔細統(tǒng)籌,安排好每次課的專題,這樣既方便學生一開始對整個課程有一個整體的了解,也方便學生選擇課堂研討的題目與內(nèi)容。根據(jù)12個專題,將各個專題講解的內(nèi)容與課件在開課之前準備好,這樣有利于把握各個專題之間的前后承接關(guān)系。例如,“區(qū)域”與“分割”是既有區(qū)分又有聯(lián)系的兩個專題,在課程開始之前,將課件準備好,就有利于宏觀把握,在“區(qū)域”專題提到的分割算法,就不需要在“分割”專題再次重復,而在“分割”專題可以結(jié)合前面“區(qū)域”專題進行互相補充,以幫助學生融會貫通。
最后,在每個專題上課之前,再對課件進行精雕細琢,主要是對內(nèi)容分好層次,對方法進行分類,力圖在較短的時間內(nèi),讓學生對該專題有較全面的認識。例如,在講解圖像分割時,由于圖像分割方法非常多,可以將分割方法分為若干個大類,每個大類只講1~2個方法。這樣既可以盡可能涉及更廣的領(lǐng)域,又可以提高講解的效率。
二、“計算機視覺”課前回顧
課前回顧是指每堂課的前面一小段時間用來回顧上一堂課的內(nèi)容。雖然課前回顧時間非常短,一般為3~8分鐘,但是課前回顧是課堂教學中的一個重要環(huán)節(jié)。課前回顧可以幫助學生加強將要學習的內(nèi)容與已學過內(nèi)容之間的聯(lián)系。通過課前回顧,學生可以回憶前續(xù)課程所講解的概念、理論、算法的步驟等內(nèi)容,有助于解決新問題或者理解新知識。
課前回顧最重要的是既要復習前續(xù)課程的內(nèi)容,又要注意將前續(xù)內(nèi)容與當前內(nèi)容聯(lián)系起來。由于講解時間有限,要使研討式教學的教師講解部分效率高,教師幫助學生回憶上堂課的概念、模型、算法等內(nèi)容,就變得非常重要。如果不做課前回顧,那么當講到某處新知識時,往往需要停下來,將前續(xù)課程再講一遍,否則學生無法理解新的知識,這樣就降低了教學的效率。
課前回顧的時間,一般以3~8分鐘為宜。課前回顧的形式可以多樣化,如講解課后作業(yè)、回顧概念、提問等。筆者認為應根據(jù)當天課程與前續(xù)課程的關(guān)系,采取合適的方式。各種方式結(jié)合使用,提高課前回顧的效率。
三、“計算機視覺”課程講解——案例教學
案例教學已經(jīng)成功地應用于數(shù)學、計算機科學等領(lǐng)域的教學。通過案例,學生可以很快地掌握相應的概念、算法的步驟等,從而提高教師講解部分的效率。[4]例如,在講解馬爾科夫隨機場時,筆者通過案例式教學,將馬爾科夫隨機場用一個生活中的例子來向?qū)W生解釋。首先,將馬爾科夫隨機場分解成兩個重要的概念,分別是隨機場與馬爾科夫性,然后將它們對應到例子中,幫助學生理解。
隨機場包含兩個要素:位置(site)和相空間(phase space)。當給每一個“位置”中按照某種分布隨機賦予“相空間”的一個值之后,其全體就叫做隨機場(如圖2(a))。[5]這個概念非常抽象,難以理解。筆者應用案例式教學,拿莊稼地來打比方?!拔恢谩焙帽仁且划€畝農(nóng)田,“相空間”好比是種的各種莊稼。給不同的地種上不同的莊稼,就好比給隨機場的每個“位置”,賦予“相空間”里不同的值。所以,可以形象地理解隨機場就是在哪塊地里種什么莊稼的布局(如圖2(b))。
馬爾科夫性指的是一個隨機變量序列按時間先后順序依次排開時,第N+1時刻的分布特性,與N時刻以前的隨機變量的取值無關(guān)。為了更直觀地理解馬爾科夫性,筆者仍然拿莊稼地打比方,如果任何一塊地里種的莊稼的種類僅僅與它鄰近的地里種的莊稼的種類有關(guān),與其他地方的莊稼的種類無關(guān),這種性質(zhì)就是馬爾科夫性。
符合上述兩個特征,那么這些地里種的莊稼的集合,就是一個馬爾科夫隨機場。通過案例式教學,筆者發(fā)現(xiàn)可以加深加快學生對課程內(nèi)容的理解,提高教師講解環(huán)節(jié)的效率。
四、課后小結(jié)
課后小結(jié)指的是一堂課將要結(jié)束時,教師對本堂課進行一個簡短的總結(jié)。許多成功的教師都會在其教學中堅持課后小結(jié)這個環(huán)節(jié),給學生一個總體的印象,以幫助學生消化本次課程的內(nèi)容。
研討式教學教師講解部分的課后小結(jié)與普通教學方式應有所區(qū)別。筆者認為這主要是因為通過課后小結(jié)可以將本次課程所講內(nèi)容與學生的研討環(huán)節(jié)結(jié)合起來,而不僅僅是對內(nèi)容進行簡單的總結(jié)。
為了達到課后小結(jié)使本次課程內(nèi)容與學生探討環(huán)節(jié)建立聯(lián)系的目的,筆者在教學中常采用如下方式:首先,像普通教學方式一樣,總結(jié)本次課程內(nèi)容;然后,在此基礎(chǔ)上,拋出若干問題,這些問題,不需要學生馬上解答,而是留給學生課后思考,提供他們選擇研討主題的素材;最后,介紹其他在本次課程中沒有涉及到的前沿知識、方法與理論,拓寬學生的視野,從而增加學生選擇探討主題的覆蓋面。
通過應用這種方式,筆者發(fā)現(xiàn)學生的思維更開闊,在探討環(huán)節(jié),學生往往可以選擇一些比較新穎的主題(例如視頻中不動點的檢測等),而不僅僅局限于教師所講內(nèi)容,從而提高了研討式教學的效果。
五、結(jié)論
在“計算機視覺”課程中引入研討式教學,通過總體設計規(guī)劃好整門課程內(nèi)容,課堂講解注意采用回顧—案例—小結(jié)的方式,筆者對如何上好研討式教學教師講解這部分課進行了個人經(jīng)驗的總結(jié)。通過本次教學改革,筆者體會到如果要提高教學效果,一定要注意教師講解與學生探討兩個環(huán)節(jié)的緊密結(jié)合。
參考文獻:
[1]侯婉瑩.我國研究型大學本科生科研研究[D].濟南:山東大學,
2009.
[2]張晴,李騰,韋艷,等.研討式教學模式的理論研究[J].中國科技縱橫,2011,(10).
中圖分類號:TP391.41 文獻標識碼:A文章編號:1009-3044(2007)04-11102-03
1 引言
基于案例推理(case-base reasoning)是人工智能中正不斷發(fā)展的一項重要推理技術(shù)?;诎咐评砼c類比推理方法相似,案例推理將舊經(jīng)驗或教訓轉(zhuǎn)換為知識,出現(xiàn)新問題時,首先查找以前是否有相似的案例,并用相似案例解決新問題。如果沒遇到相似案例的,經(jīng)過推理后解決新問題的方法,又會成為新的案例或新經(jīng)驗,下一次再遇到相同問題時,就可以復用這些案例或經(jīng)驗。
這與人遇到問題時,首先會用經(jīng)驗思考解決問題的方式相似,這也是解決問題較好的方法?;诎咐评響糜诠I(yè)產(chǎn)品檢測或故障診斷時具有以下特點:
CBR智能化程度較高。利用案例中隱含的難以規(guī)則化的知識,以輔助規(guī)則推理的不足,提高故障診斷系統(tǒng)的智能化程度。
CBR較好解決“知識獲取”的瓶頸。CBR知識表示以案例為基礎(chǔ),案例的獲取比規(guī)則獲取要容易,大大簡化知識獲取的過。
CBR求解效率較高。是對過去的求解結(jié)果進行復用,而不是再次從頭開始推導,可以提高對新問題的求解效率。
CBR求解的質(zhì)量較高。CBR以過去求解成功或失敗的經(jīng)歷,可以指導當前求解時該怎樣走向成功或避開失敗。
CBR持續(xù)不斷的學習能力,使得它可以適應于將來問題的解決。
所以基于案例推理方法正不斷應用在產(chǎn)品質(zhì)量檢測和設備故障診斷方面,并取得較好的經(jīng)濟效益。為了產(chǎn)品檢測和設備故障診斷中,更為智能化,更容易實現(xiàn)現(xiàn)場檢測和診斷,計算機視覺技術(shù)起到很大的作用。
計算機視覺是研究用計算機來模擬人和生物的視覺系統(tǒng)功能的技術(shù)學科,使計算機具有感知周圍視覺世界的能力。通過計算機視覺,進行圖像的獲取預處理、圖像分割與特征抽取、識別與分類、三維信息理解、景物描述、圖像解釋,讓計算機具有對周圍世界的空間物體進行傳感、抽象、判斷的能力,從而達到識別、理解的目的。
計算機視覺隨著科學技術(shù)發(fā)展,特別計算機技術(shù)、通信技術(shù)、圖像采集技術(shù)、傳感器技術(shù)等,以及神經(jīng)網(wǎng)絡理論、模糊數(shù)學理論、小波的分析理論等計算機視覺理論的不斷發(fā)展和日趨成熟,使計算機視覺從上世紀60年代開始興起發(fā)展到現(xiàn)在,取得快速發(fā)展,已經(jīng)從簡單圖像質(zhì)量處理發(fā)展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉(zhuǎn)向運動,由二維轉(zhuǎn)向三維,并主要著眼于對圖像的識別和理解上,也使計算機視覺的應用領(lǐng)域更為廣泛,為案例推理中運用計算機視覺打下基礎(chǔ)。
2 案例推理系統(tǒng)的主要關(guān)鍵技術(shù)
(1)案例的表示與組織
案例的表示與組織即是如何抽取案例的特征變量,并以一定的結(jié)構(gòu)在計算機中組織存儲。如何將信息抽取出特征變量,選擇什么語言描述案例和選擇什么內(nèi)容存放在案例中,案例按什么組織結(jié)構(gòu)存放在存儲器中,這關(guān)系到基于案例推理方法的效率,而且對于案例數(shù)量越來越多,結(jié)構(gòu)十分復雜的案例庫,尤其重要。
(2)案例的索引與檢索
案例的索引與檢索即是為了查找最佳相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫中檢索并選擇潛在可用相似案例。后面的工作能否發(fā)揮出應有的作用,很大程度上依賴于這一階段得到的案例質(zhì)量的高低,因此這一步非常關(guān)鍵。
(3)案例的復用和調(diào)整
案例的復用即是如何根據(jù)舊案例得出新解,涉及到找出案例與新問題之間的不同之處,案例中的哪些部分可以用于新問題,哪些部分不適合應用于新問題的解決。而復用還分案例的結(jié)果復用,案例的求解方法復用。
(4)案例的學習
案例的學習即是將新解添加到案例庫中,擴充案例庫的案例種類與數(shù)量,這過程也是知識獲取。此過程涉及選取哪些信息保留,以及如何把新案例有機集成到案例庫中,包括如何存儲,如何建立索引等等。
針對案例推理的關(guān)鍵技術(shù),根據(jù)檢測和故障診斷系統(tǒng)的特點,計算機視覺主要解決如何將產(chǎn)品圖像輸入系統(tǒng),如何將產(chǎn)品圖像特征進行抽取和描述,如何區(qū)別產(chǎn)品不同之處。以便案例推理系統(tǒng)進行案例建模,確立案例的表示形成和案例相似度的計算。本文主要從計算機視覺如何運用在案例推理系統(tǒng)進行探討。
3 產(chǎn)品輸入系統(tǒng)
產(chǎn)品輸入系統(tǒng)在不同產(chǎn)品類型和生產(chǎn)環(huán)境可能有不同之處,主要應有傳感器單元和圖像采集單元。如圖1。
圖1 產(chǎn)品輸入系統(tǒng)結(jié)構(gòu)
傳感器單元主要判斷是否有產(chǎn)品存在,是否需要進行圖像采集,是否繼續(xù)下一個產(chǎn)品圖像的采集。這簡單傳感器可使用光電開關(guān),配合光源,當產(chǎn)品經(jīng)過時,產(chǎn)品遮擋住光源,使光電開關(guān)產(chǎn)生一個0值,而沒有產(chǎn)品經(jīng)過時,光電開關(guān)產(chǎn)生相反的1值,系統(tǒng)通過判斷光電開關(guān)的值,從而判斷是否有產(chǎn)品。
圖像采集單元簡單地說是將產(chǎn)品拍攝并形成數(shù)字化圖像,主要包括光源、反射鏡、CCD相機和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機主要是拍攝設備。圖像采集卡主要是將圖像數(shù)字化。通過傳感器判斷有產(chǎn)品后,光源發(fā)出的光均勻地照在被測件上,CCD相機拍攝,拍攝圖像經(jīng)過圖像采集卡數(shù)字化后輸入存儲設備。存儲設備即為計算機硬盤。存放原始圖像、數(shù)據(jù)、處理結(jié)果等。
這是案例推理系統(tǒng)的原始數(shù)據(jù),是圖像處理、圖像特征抽取描述的基礎(chǔ)。
4 圖像處理
在案例推理系統(tǒng)中,需要對案例的組織和案例建模,案例的組織即案例的表示,相對計算機而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區(qū)別其它圖像,具有唯一性。同時,又能完整地表示該圖像。所以案例的表示要體現(xiàn)案例的完整性、唯一性、操作容易性。
圖像中有顏色區(qū)別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說圖像內(nèi)部包含表示的本質(zhì),即圖像的描述。根據(jù)圖像特點,確立圖像案例的表示,以圖像的像素、圖像的數(shù)字化外觀、圖像物體的數(shù)字組成等屬性。這需要對產(chǎn)品輸入的原始圖像進行處理。
在計算機視覺技術(shù)中,對原始圖像主要進行圖像增強、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內(nèi)容。經(jīng)過這些處理后,輸出圖像的質(zhì)量得到相當程度的改善,既改善了圖像的視覺效果,又便于計算機對圖像進行分析、處理和識別。具體工作流程如圖2所示:
圖2 計算機視覺的任務與工作流程
圖像預處理是將產(chǎn)品的數(shù)字圖像輸入計算機后,首先要進行圖像的預處理,主要完成對圖像噪聲的消除以及零件的邊緣提取。預處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。
圖像二值化處理主將灰度圖形二值化的關(guān)鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據(jù)灰度直方圖中兩峰之間的谷值作為閾值來分割目標和背景。
圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實際成像過程中因成像設備和環(huán)境所造成的圖像失真,提取有用信息。
圖像邊緣提取是為了將圖像中有意義的對象與其背景分開,并使之具有某種指定的數(shù)學或符號表達形式,使計算機能夠理解對象的具體含義,檢測出邊緣的圖像就可以進行特征提取和形狀分析了。可采用多種算法,如采用Sobel算子提取邊緣。
圖像預處理是為下一步的特征描述打基礎(chǔ),預處理的好壞直接影響案例推理的結(jié)果和檢測診斷的效率。
特征提取是對圖像進行描述,是案例建模關(guān)鍵,案例建模是根據(jù)案例組織要求抽取圖像特征,是建立案例索引和檢索的關(guān)鍵。如果圖像沒有特征,就談不上進行檢索。圖像特征可通過圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產(chǎn)品、產(chǎn)品形狀大小、產(chǎn)品顏色,產(chǎn)品有什么缺陷、產(chǎn)品缺陷在什么位置等特征,根據(jù)這些圖像特征進行描述,形成計算機中屬性值,并從數(shù)據(jù)庫查找相應信息資料,從而確定產(chǎn)品之間的關(guān)系,相似度,也就是案例推理的方向。
5 系統(tǒng)的檢索
根據(jù)案例推理原理和相應算法,建立案例推理系統(tǒng)模型,如圖3所示。
圖3 案例推理系統(tǒng)
對話系統(tǒng):完成人機交互、問題描述、結(jié)果顯示和系統(tǒng)總控制。
案例庫系統(tǒng):由案例庫及案例庫管理系統(tǒng)組成。
數(shù)據(jù)析取系統(tǒng):對各種已有的源數(shù)據(jù)庫的數(shù)據(jù)通過轉(zhuǎn)換而形成所需的數(shù)據(jù)。
多庫協(xié)同器:根據(jù)問題求解的需要,按照一定的數(shù)據(jù)抽取策略,完成問題求解過程中對模型庫系統(tǒng)、方法庫系統(tǒng)、知識庫系統(tǒng)和數(shù)據(jù)庫系統(tǒng)等資源的調(diào)度與協(xié)調(diào)。
知識庫系統(tǒng):由產(chǎn)生式規(guī)則組成,這些知識包括專家經(jīng)驗和以規(guī)則形式表示的有關(guān)知識,也可以是數(shù)據(jù)挖掘結(jié)論,支持案例檢索、案例分析、案例調(diào)整等。 模型庫系統(tǒng):由模型庫、算法庫、模型庫管理系統(tǒng)組成。完成模型識別和調(diào)用,并把結(jié)果綜合,送入對話系統(tǒng)顯示,作為補充信息供案例檢索、調(diào)整使用。
數(shù)據(jù)庫系統(tǒng):存放待決策支持的所有問題,并完成其維護與查詢等功能。
由于系統(tǒng)主要應用產(chǎn)品的現(xiàn)場實時檢測監(jiān)控或故障診斷,所以系統(tǒng)的檢索時,也必須輸入檢索值,即輸入現(xiàn)場產(chǎn)品的圖像,在通過產(chǎn)品預處理、圖像的二值化、分割和邊界處理后,進行圖像特征描述,根據(jù)圖像描述進行分類識別。根據(jù)案例推理的算法檢索案例庫中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度最大作為結(jié)果,并將案例的解輸出,給相關(guān)控制系統(tǒng)進行決策。如產(chǎn)品質(zhì)量檢測,確定產(chǎn)品質(zhì)量是否合格,是否有不合格產(chǎn)品,不合格產(chǎn)品是什么原因造成,故障源是什么,如何解決和排除故障,等等。
6 結(jié)論
案例推理方法有效地解決計算機視覺技術(shù)中圖像檢索問題。對提高圖像檢索的效率和準確度提供了平臺。
計算機視覺技術(shù)也為案例推理系統(tǒng)實現(xiàn)產(chǎn)品現(xiàn)場實時檢測、監(jiān)控、診斷提供技術(shù)支持。計算機視覺技術(shù)現(xiàn)場的數(shù)據(jù)采集、處理為案例推理打好基礎(chǔ)。
兩者的結(jié)合設計的系統(tǒng)適用范圍很廣,只要產(chǎn)品需要進行質(zhì)量檢測、監(jiān)控,或設備需要進行故障診斷和維護,都可以適用。
系統(tǒng)提供的實時檢測、監(jiān)控和診斷功能,提高企業(yè)的生產(chǎn)效益,降低了生產(chǎn)成本。
參考文獻:
[1](美)桑肯(Sonka,M).圖像處理分析與機器視覺[M].人民郵電出版社.
[2]王宏等譯.計算機視覺[M].電子工業(yè)出版社.
[3]蔡建榮.自然場景下成熟水果的計算機視覺識別[J].農(nóng)業(yè)機械,36(2):61-64.
[4]王宇輝.基于計算機視覺的錐體零件尺寸在線檢測算法[J].重型機械,2005,2:4-6
[5]駱志堅.基于計算機視覺檢測技術(shù)自動計數(shù)系統(tǒng)的研究與應用[J].儀表技術(shù)與傳感器,2005,3:41-43.
[6]左小德.貼近度分析法在案例庫推理中的應用[J],南大學學報(自然科學版),1997,18(1):21-26.
中圖分類號:G643.2 文獻標識碼:A DOI:10.16400/ki.kjdkz.2016.03.015
Research and Practice on Course Group of Pattern Analysis and
Visual Processing for Graduated Students
SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi
(College of Computer Science and Technology, Nanjing University of
Aeronautics and Astronautics, Nanjing, Jiangsu 210016)
Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.
Key words pattern analysis; computer vision; teaching reform
1 背景
我校模式分析與智能計算研究所師資團隊是江蘇省“青藍工程”創(chuàng)新團隊,主要研究領(lǐng)域包括智能數(shù)據(jù)分析、圖像處理和機器視覺等方向,承擔研究生和本科生的模式識別、機器學習、數(shù)據(jù)挖掘、智能信息檢索、數(shù)字圖像處理、計算機視覺等課程的教學任務。以往的教學過程中雖然積累了豐富的教學經(jīng)驗,但當前新知識不斷涌現(xiàn)、新技術(shù)發(fā)展迅猛,對模式分析與視覺處理課程群的知識體系、實踐體系改進提出了新的挑戰(zhàn)。
近年來,國內(nèi)外高校在該類課程教學上,已涌現(xiàn)出眾多新理念、新方法。Coursera聯(lián)合創(chuàng)始人Andrew Ng推出的機器學習課程,開啟了教育領(lǐng)域的MOOC時代,引領(lǐng)了教育教學方法的新革命。①深圳大學、②江蘇科技大學③分別進行了基于CDIO工程教育理念的計算機視覺課程教學改革實踐,實現(xiàn)多層次項目設計的教學模式改革,講座式、討論式、實踐式教學方法的探索。國防科技大學④在計算機視覺課程中引入研討式教學模式,通過案例教學、小組研討的方式來替代傳統(tǒng)的教學方式。華中科技大學⑤從教學內(nèi)容國際化、教學方式國際化、教學成果國際化三個方面開展了計算機視覺課程的國際化建設。另外,也有高校進行了圖像工程課程群建設,⑥基于圖像分析與計算機視覺應用課程結(jié)合的項目協(xié)同創(chuàng)新能力培養(yǎng)實踐。⑦
在分析上述國內(nèi)外高校該類課程改革的基礎(chǔ)上,我們重點以模式分析與視覺處理課程群的實踐教學體系改革為切入點,優(yōu)化師資隊伍結(jié)構(gòu),梳理課程群知識體系,優(yōu)化課程授課模式,完善課程群實踐體系,改革實踐考核模式,實現(xiàn)學生國際化視野、理論聯(lián)系實際、工程實踐和創(chuàng)新能力全面提升的目標。
2 模式分析與視覺處理課程群特點
模式分析與視覺處理課程群涵蓋了模式識別、機器學習、數(shù)據(jù)挖掘、數(shù)字圖像處理、計算機視覺等多門課程。該類課程存在以下特點。
(1)該類課程屬于多學科交叉,涉及的知識面既廣又深。由于該方向涉及計算機科學與技術(shù)、應用數(shù)學、自動化、電子科學與技術(shù)、信息工程等多學科內(nèi)容,而學生在大學本科階段很難學習和了解如此多的知識模塊,這對研究生階段學習來說,具有相當大的挑戰(zhàn)。同時,對于每個知識模塊,所要求的數(shù)學基礎(chǔ)較高,理論具有相當?shù)纳疃?,理解和掌握不容易?/p>
(2)該類課程既重視扎實的基礎(chǔ)理論,也強調(diào)良好的工程實踐能力。該類課程的基礎(chǔ)理論教學一直受到各高校的重視。隨著近年來產(chǎn)業(yè)界的迅猛發(fā)展,計算機視覺應用層出不窮,對學生的工程實踐也提出了更高要求,需要能夠在系統(tǒng)層次上有整體認知,同時要能對各功能模塊進行優(yōu)化,提升系統(tǒng)的整體性能。
(3)該類課程所面向的選修學生面廣。該類課程既是多學科交叉,也面向計算機應用、電子科學與技術(shù)、自動化、應用數(shù)學等不同研究方向、不同水平層次的研究生開設。這對課堂教學和實驗實踐也帶來更大挑戰(zhàn)。
3 模式分析與視覺處理課程群改革舉措
針對上述分析的課程群特點,我們重點以實踐體系改革為突破口,通過優(yōu)化師資隊伍結(jié)構(gòu),梳理課程群知識體系,優(yōu)化課程授課模式,完善課程群實踐體系,改革實踐考核模式等舉措,實現(xiàn)學生國際化視野、理論聯(lián)系實際、工程實踐和創(chuàng)新能力全面提升的目標。
3.1 師資隊伍結(jié)構(gòu)優(yōu)化
為了學生能夠適應模式分析與視覺處理產(chǎn)業(yè)的快速發(fā)展,在課程群建設過程中更強調(diào)學生的工程實踐和創(chuàng)新能力培養(yǎng)。這首先對師資隊伍結(jié)構(gòu)提出了新的要求。
近年來,課程教學團隊引進海內(nèi)外具有深厚理論功底和較強工程能力的高水平師資4名,大大充實了機器學習、數(shù)據(jù)挖掘、圖像處理等課程的教學力量。對于現(xiàn)有教師隊伍,鼓勵教師跟產(chǎn)業(yè)一線企業(yè)廣泛合作,目前已與華為、中興等企業(yè)在視頻檢索、智能交通視覺處理等方面開展了實質(zhì)合作。這些來源于產(chǎn)業(yè)界的高質(zhì)量課題對科研和教學起到了良好的促進作用。
與此同時,通過研究生工作站、企業(yè)短期實習等渠道,鼓勵企業(yè)高級研發(fā)人員參與到學生實踐能力培養(yǎng)環(huán)節(jié)中,將實際項目進行適當切分或提煉,實現(xiàn)該類課程實踐環(huán)節(jié)的模塊化、專題化訓練。
綜上,通過引培并舉,優(yōu)化校內(nèi)師資隊伍結(jié)構(gòu);通過校企合作,積極吸引企業(yè)師資參與。良好的師資隊伍為該類課程的實踐體系改革提供了有力支撐。
3.2 課程群知識體系梳理與授課模式改革
模式識別、機器學習、數(shù)據(jù)挖掘、智能信息檢索、數(shù)字圖像處理、計算機視覺等課程既有一定的邏輯關(guān)系,也存在相互交叉的混雜關(guān)系。一般認為,模式識別、機器學習是模式分析與視覺處理領(lǐng)域的基礎(chǔ)理論課程,數(shù)據(jù)挖掘是建立在模式識別、機器學習和數(shù)據(jù)庫基礎(chǔ)上的應用類課程,智能信息檢索則是數(shù)據(jù)挖掘基礎(chǔ)上更為具體的應用實現(xiàn)。數(shù)字圖像處理為計算機視覺課程提供了基礎(chǔ)支撐,計算機視覺則是在綜合利用模式識別、機器學習、數(shù)字圖像處理、數(shù)據(jù)挖掘等知識模塊基礎(chǔ)上面向應用的系統(tǒng)實現(xiàn)。但是,這些課程也存在著知識點的交叉或重復。例如,模式識別和機器學習中都有貝葉斯參數(shù)估計、支持向量機模型等知識點,但視角和側(cè)重點有所不同;圖像處理、計算機視覺中都有顏色模型、成像模型等知識點,也同時存在與模式識別、機器學習交叉的知識點。
我們針對來自不同研究領(lǐng)域的學生群體,對該課程群的知識點進行系統(tǒng)梳理,既避免知識點的重復講授,也防止重要知識點的缺漏。課程教師集體討論,形成每門課程的核心知識集,和針對不同研究領(lǐng)域的選講知識集。學生在學習課程時,在掌握核心知識集的基礎(chǔ)上,結(jié)合自己的研究方向選擇相關(guān)的選講知識集學習。
在課程教材和參考書的選擇上,注重挑選國際上有影響力的教材。例如,模式識別的參考書為Richard O. Duda等人編著的Pattern Classification;機器學習的參考書為Tom M. Mitchell編著的Machine Learning和Christopher M. Bishop編著的Pattern Recognition and Machine Learning;數(shù)據(jù)挖掘的參考書為Jiawei Han等人編著的Data Mining:Concepts and Techniques;數(shù)字圖像處理的參考書為K. R. Castleman編著的Digital Image Processing;計算機視覺的參考書為D. A. Foryth編著的Computer Vision: A Modern Approach和Richard Szeliski編著的Computer Vision: Alogrithms and Applications。這些教材已被國內(nèi)外著名大學普遍采用。同時,每門課程都提供相關(guān)的國內(nèi)外頂級會議和期刊的列表,供學生課后追蹤研究領(lǐng)域的熱點問題。
在課堂授課環(huán)節(jié)上,注意采用靈活多樣的授課方式。對于核心基礎(chǔ)知識模塊,以教師講授為主,同時提供國內(nèi)外該類課程的熱門MOOC網(wǎng)址給學生參考。對于選講知識模塊,鼓勵學生事先結(jié)合各自研究方向有目的自學,在學生報告的基礎(chǔ)上進行課堂討論方式進行。充分發(fā)揮學生學習的主體作用,也便于教師了解學生的水平和學習狀況。
除此以外,不定期邀請國內(nèi)外著名學者來校做學術(shù)報告,讓學生充分了解該研究領(lǐng)域的最新前沿動態(tài),并就熱點問題進行專題討論。
3.3 課程群實踐體系完善與考核方式改革
工程實踐和創(chuàng)新能力的培養(yǎng)是該課程群改革的重要目標。我們在上述師資隊伍結(jié)構(gòu)優(yōu)化、課程群知識體系梳理與授課模式改革的基礎(chǔ)上,著力進行課程群實踐體系的改革與完善。我們通過多層次菜單式的實驗項目選擇、項目牽引的創(chuàng)新能力訓練、學生綜合研究能力的全面考查等方面來實現(xiàn)。
首先,整合和優(yōu)化課程群實踐內(nèi)容,實現(xiàn)多層次菜單式靈活選擇。根據(jù)各研究領(lǐng)域的要求進行靈活搭配,根據(jù)學生個體的能力與水平選擇適當規(guī)模和難度的實踐內(nèi)容,通過課程內(nèi)的基礎(chǔ)實驗、課程間的綜合實驗、課程群的創(chuàng)新實驗來選擇和組合,如圖1所示。
圖1 多層次菜單式實驗內(nèi)容示意圖
基礎(chǔ)型實驗內(nèi)容主要是各課程核心知識點的實驗驗證,主要包括模式識別,機器學習,數(shù)據(jù)挖掘,圖像處理與分析,計算機視覺等課程的實驗。要求選課學生對這些基礎(chǔ)實驗必做,打下良好的研究基礎(chǔ)。
綜合探索型實驗在基礎(chǔ)型實驗基礎(chǔ)上,既有單門課程內(nèi)總的綜合實驗,也有課程間知識的綜合應用。主要分為兩大塊,包括模式分析與機器學習方向的綜合實驗,以及圖像處理與機器視覺方向的綜合實驗。實驗目的主要是針對這兩大塊方向重點知識的綜合分析和比較,能夠熟練掌握和靈活應用。例如模式分析、機器學習、數(shù)據(jù)挖掘等方向都用到的線性判別分析、支持向量機、均值聚類等內(nèi)容;圖像處理與機器視覺中的圖像特征抽取、視覺系統(tǒng)選型、目標檢測、特定平臺的算法優(yōu)化等內(nèi)容。學生可根據(jù)各自研究方向有目的的選擇兩塊綜合實驗的大部分內(nèi)容。
在綜合型實驗基礎(chǔ)上,該課程群通過若干創(chuàng)新型實驗來檢驗學生理論知識掌握程度和實踐方法應用能力,為后續(xù)的研究課題開展打下良好的科研素養(yǎng)。主要內(nèi)容包括人臉識別、二維條碼識別、車輛屬性識別、智能視覺監(jiān)控、以及企業(yè)來源的關(guān)鍵技術(shù)等。這些項目實踐既涉及用到圖像處理與機器視覺的內(nèi)容,也涉及模式分析與機器學習方向的知識。并且需要學生在綜合運用相關(guān)知識的基礎(chǔ)上有創(chuàng)新能力。
其次,重視各類項目牽引的創(chuàng)新能力訓練。一方面,鼓勵教師從國家自然科學基金、企業(yè)合作項目等研究中提煉出問題規(guī)模和難度適中的訓練項目,作為課程群的綜合能力訓練項目。另一方面,鼓勵學生參加挑戰(zhàn)杯、全國研究生智慧城市技術(shù)與創(chuàng)意設計大賽等各類具有挑戰(zhàn)性的競賽項目,以賽代練,提升學生的工程實踐和創(chuàng)新能力。同時,也鼓勵學生利用百度、微軟等相關(guān)研究領(lǐng)域的企業(yè)實習機會,參與產(chǎn)品一線的工程實踐能力訓練。
再次,注重考核環(huán)節(jié),實現(xiàn)科研素養(yǎng)和實踐能力的全面考查。只有嚴格、公平、公正的考核,才能保證實驗實踐的質(zhì)量和水平,才能提升學生的科研素養(yǎng)和實踐能力。我們主要在手段、方式方法上進行了改進。在題目選擇上,根據(jù)學生個體水平和研究領(lǐng)域要求的差異,在選題上有適當?shù)碾y易區(qū)分度,讓每位學生都有鍛煉和提升的機會;在考核方式上,采用結(jié)題書面報告來檢驗學術(shù)論文的寫作能力,采用程序演示檢驗系統(tǒng)的設計與實現(xiàn)水平,采用上臺匯報的方式檢驗學生的表達能力,多管齊下全面檢查學生的綜合科研素養(yǎng);在考核成績評定上,采用現(xiàn)場教師和學生共同評分的方式,公平合理;最后,通過網(wǎng)站展示、發(fā)表學術(shù)小論文、專利、軟件著作權(quán)等方式展示和公開優(yōu)秀成果,激發(fā)學生的學習熱情,并由此形成積累,有利于學生實驗實踐氛圍的傳承。
4 結(jié)語
本文在分析國內(nèi)外高校模式分析與視覺處理類課程群改革現(xiàn)狀的基礎(chǔ)上,以學生國際化視野、理論聯(lián)系實際、工程實踐和創(chuàng)新能力全面提升為目標,重點開展了師資隊伍結(jié)構(gòu)優(yōu)化、課程群知識體系梳理、課程授課模式改革、課程群實踐體系完善和實踐考核模式改革等工作,取得了良好的效果,并為校內(nèi)其他課程群的教學改革作為示范推廣。
注釋
① https:///learn/machine-learning/
② 郭小勤,曹廣忠.計算機視覺課程的CDIO教學改革實踐.理工高教研究,2010.29(5):98-100,148.
③ 史金龍,白素琴,龐林斌,錢強.研究生機器視覺課程的CDIO教學改革實踐.計算機教育,2013.9:40-43.
④ 陳芳林,劉亞東,沈輝.在《計算機視覺》課程中引入研討式教學模式.當代教育理論與實踐,2013.5(7):112-114.
計算機視覺行業(yè)規(guī)模將進一步擴大
iiMedia Research(艾媒咨詢)數(shù)據(jù)顯示,2016年中國人工智能產(chǎn)業(yè)規(guī)模已突破100億元,以43.3%的增長率高速增長,預計2017年產(chǎn)業(yè)規(guī)模將以51.2%的增長率達到152.1億元,并于2019年增長至344.3億元。
艾媒咨詢分析師認為,中國人工智能產(chǎn)業(yè)起步相對較晚,隨著科技、制造等業(yè)界巨頭公司的布局深入,人工智能產(chǎn)業(yè)的規(guī)模將進一步擴大。計算機視覺作為人工智能的子領(lǐng)域,其發(fā)展和應用也很大程度受到人工智能核心技術(shù)的影響。未來,作為人工智能子領(lǐng)域的計算機視覺產(chǎn)業(yè)規(guī)模也會相應擴大。
計算機視覺用戶市場有待挖掘
iiMedia Research(艾媒咨詢)數(shù)據(jù)顯示,2017上半年網(wǎng)民對于計算機視覺行業(yè)整體了解程度還不深,智能識別貼圖應用以63.8%的了解比例名列各領(lǐng)域之首,其余領(lǐng)域網(wǎng)民了解比例均未超過五成。艾媒咨詢分析師認為,計算機視覺行業(yè)作為新興行業(yè),其概念還未深入大眾群體,大眾對于其作用了解程度不深,未來計算機視覺行業(yè)用戶市場開發(fā)潛力較大。
計算機視覺整體滲透率低
iiMedia Research(艾媒咨詢)數(shù)據(jù)顯示,2017上半年網(wǎng)民中,有四成用戶使用過圖搜索功能。還有六成用戶仍未使用過圖搜索功能。圖搜在技術(shù)計算機視覺領(lǐng)域中已經(jīng)發(fā)展比較成熟,然而在網(wǎng)民種的滲透率仍不高。艾媒咨詢分析師認為,計算機視覺作為新興技術(shù),其投入實際應用時間較短,且技術(shù)依托的平臺種類和數(shù)量都較少,用戶市場培養(yǎng)還需時間。
圖搜功能獲用戶認可
iiMedia Research(艾媒咨詢)數(shù)據(jù)顯示,在對2017上半年使用過“圖搜”功能的網(wǎng)民準確率感知調(diào)研中,將近七成的用戶對“圖搜”功能的準確率給予肯定?!皥D搜”技術(shù)已經(jīng)較為成熟,正在逐漸將便利帶到用戶生活中,未來隨著“圖搜”功能進一步在各應用中擴張,其區(qū)別于傳統(tǒng)搜索的優(yōu)勢將會更明顯被用戶感知。
2017上半年網(wǎng)民圖搜索場景分布
iiMedia Research(艾媒咨詢)數(shù)據(jù)顯示,2017上半年圖搜網(wǎng)民中,69.6%的用戶在搜索引擎中使用圖搜功能,網(wǎng)購場景下使用圖搜功能的用戶占比53.5%。艾媒咨詢分析師認為,搜索引擎直接應用了圖搜功能,發(fā)展較早,故用戶基礎(chǔ)較扎實,其余領(lǐng)域中,網(wǎng)購圖搜變現(xiàn)能力最強,是廠商優(yōu)先合作的重點領(lǐng)域。
邊看邊買用戶市場潛力較大
iiMedia Research(艾媒咨詢)數(shù)據(jù)顯示,2017上半年邊看邊買網(wǎng)民滲透率僅有11.9%,而在未嘗試過人群中,有意愿進行嘗試的人群超過六成。艾媒咨詢分析師認為,明星經(jīng)濟拉動下,同款銷售具有宣傳效應加成。邊看邊買技術(shù)一方面可以加強視頻門戶的變現(xiàn)能力,一方面作為流量入口能夠為電商平臺導入流量,且對于消費者來說,智能匹配同款可以減少其搜索篩選的時間成本,未來市場有較大發(fā)展?jié)摿Α?/p>
實名制機器認證部分取代人工 未來規(guī)??礉q
iiMedia Research(艾媒咨詢)數(shù)據(jù)顯示,2017上半年機器實名制認證網(wǎng)民滲透率為43.6%,有超一半用戶未使用過機器實名制認證功能。隨著計算機視覺技術(shù)發(fā)展,在廣州、上海等城市已經(jīng)開始使用機器實名制認證部分或全部代替人工認證,以減少人工成本,釋放勞動密集產(chǎn)業(yè)用工壓力。艾媒咨詢分析師認為,隨著時間檢驗和技術(shù)進一步成熟,機器實名制會進一步向中小城市滲透,未來網(wǎng)點鋪設規(guī)模有望進一步擴大。
機器認證效率獲用戶認可
iiMedia Research(艾媒咨詢)數(shù)據(jù)顯示,2017上半年使用過機器實名制認證的網(wǎng)民中,82.6%的用戶表示機器實名制認證加快了驗證流程。艾媒咨詢分析師認為,計算機視覺精準快速無主觀性的特點和實名制認證流程要求相匹配,在技術(shù)比較成熟的情況下,能夠提高驗證效率,緩解鐵路站點因人工驗證慢導致的擁擠、乘客等候過久等現(xiàn)象。此技術(shù)在中國各鐵路站點會慢慢滲透,應用規(guī)模有望擴大。
個人信息泄露成為用戶刷臉支付最大顧慮
iiMedia Research(艾媒咨詢)數(shù)據(jù)顯示,2017上半年了解刷臉支付的網(wǎng)民中,59.0%認為個人信息泄露是刷臉支付最大隱患。識別不準確和使用渠道不暢通分別以57.6%和41.9%位列第二和第三名。
艾媒咨詢分析師認為,作為個人信息比較敏感的金融支付領(lǐng)域,用戶對于信息安全重視度相較其他領(lǐng)域更高,而2017年初315晚會對刷臉支付泄露個人信息隱患的點名,無疑為刷臉支付規(guī)模擴張設置障礙,加強用戶信息保障能力,獲取用戶對于技術(shù)安全的信任是刷臉支付未來重點發(fā)力方向。另外,由于計算機視覺概念未在大眾群體中普及,其規(guī)模化需依托場景搭建,故使用渠道暢通也可以助力加快行業(yè)規(guī)?;M程。
精確性+場景化:C端市場打開方式
iiMedia Research(艾媒咨詢)數(shù)據(jù)顯示,2017上半年中國網(wǎng)民對于計算機視覺行業(yè)的愿景分布中,準確率更高以64.3%的關(guān)注度成為用戶最期待改進方向,使用更加方便和保障信息安全也是用戶重點關(guān)注問題。艾媒咨詢分析師認為,行業(yè)發(fā)展初期,用戶對概念理解程度不高,易產(chǎn)生“不易”使用的印象而不愿進行嘗試,未來商家可嘗試提供裝備完全的硬件設備和解決方案,并嘗試豐富使用場景,讓計算機視覺更易被廣泛網(wǎng)民接受。
表面缺陷檢測以及特征提取,所涉及的范圍是非常廣泛的,包括了鐵軌表面缺陷、帶鋼表面缺陷以及織物表面缺陷等。因此加強對產(chǎn)品的表面缺陷提取以及質(zhì)量檢測顯得尤為重要,目前基于計算機視覺的構(gòu)件缺陷檢測系統(tǒng)已經(jīng)受到國內(nèi)外研究人員的重視,如何更好地將計算機視覺技術(shù)引入到產(chǎn)品表面質(zhì)量缺陷檢測中去是未來發(fā)展的重點。筆者將在下文中就此展開詳細的闡述。
1.計算機視覺的基本工作原理
1.1系統(tǒng)結(jié)構(gòu)
計算機視覺是一項涉及范圍廣泛的技術(shù),他通過圖像采集裝置將檢測目標轉(zhuǎn)化為圖像信號,再經(jīng)過專門性的額圖像處理系統(tǒng)最終生成具體的表面特征。具體來講在圖像處理環(huán)節(jié)米旭濤根據(jù)圖像的具體像素以及圖像分布和顏色、亮度、飽和度等進行目標提取,再比照系統(tǒng)預設的參照值得出最終的檢測結(jié)果,例如尺寸大小、顏色等師傅偶合格。計算機視覺處理系統(tǒng)包括了光源、鏡頭、計算機以及圖像采集裝置和處理系統(tǒng)等,這些系統(tǒng)綜合組成共同推動了計算機視覺系統(tǒng)的正常穩(wěn)定運行。
1.2計算機視覺硬件設計
計算機視覺系統(tǒng)的硬件平臺包括了照明系統(tǒng)、鏡頭相機以及圖像采集裝置和工控機四個部分,這四個部分缺一不可,共同組成了整個計算機視覺系統(tǒng)。
1.2.1照明系統(tǒng)
照明系統(tǒng)是整個計算機視覺系統(tǒng)的關(guān)鍵,尤其是在光源和照明方案的配合上更是直接影響了整個系統(tǒng)運行的成敗。因此在照明方案的制定以及光源的選擇上應該盡可能的突出物體特征參量,綜合考慮對比度以及亮度等因素,將計算機視覺系統(tǒng)的光源與照明方案相匹配,選擇需要的幾何形狀以及均勻度等,同時還需要結(jié)合被檢測物體的表面特征幾何形狀。針對構(gòu)件表面缺陷的照明方案,筆者認為應該選擇功率相對較大的LED光源,用低角度的方式進行照明。
1.2.2相機鏡頭
相機系統(tǒng)是成像的關(guān)鍵,因此在相機鏡頭的選擇上應該適用于具體的構(gòu)件。一般來說相機鏡頭包括了兩方面內(nèi)容,一是線掃,二是面掃。通過二者的綜合運用實現(xiàn)更好地成像效果。
1.2.3圖像采集卡
圖像采集卡主要是指在計算機視覺系統(tǒng)中位于圖像裁剪機設備和圖像處理設備之間的重要接口。是成像的中間環(huán)節(jié),發(fā)揮著不可或缺的作用。
2.基于計算機視覺的構(gòu)件表面缺陷特征提取
基于計算機視覺的構(gòu)件表面缺陷特征提取可以分為為三個重要部分,分別是圖像預處理部分:主要是指針對構(gòu)件進行區(qū)域的定位,將非構(gòu)件的部分移出計算機視覺的缺陷提取技術(shù)中去,從而降低了后續(xù)工作的工作難度;其次是進行缺陷定位,主要是指通過特定的技術(shù)和算法將缺陷從結(jié)果當中直接分離出來。第三部分是缺陷特征的提取,也是系統(tǒng)處理的結(jié)果部分,是通過計算缺陷的程度以及缺陷大小,從而為后期的構(gòu)件維護提供參考依據(jù)。具體來說,這三個部分的操作主要體現(xiàn)在以下幾個方面:
2.1區(qū)域定位
區(qū)域定位是減少構(gòu)件處理和選擇時間的關(guān)鍵,能夠大大提高構(gòu)件缺陷提取的效率。構(gòu)件的表面的基本特征和大致集合框架提取是區(qū)域定位和的第一步,要將計算機區(qū)域定位和缺陷提取結(jié)合起來,更好地實現(xiàn)缺陷分析。要做好構(gòu)件的區(qū)域定位首先需要明確構(gòu)件的基本種類和特征:一是根據(jù)構(gòu)件的重用方式來說,可以分為白匣子、灰匣子、黑匣子從構(gòu)件的使用范圍來看又可以分為通用構(gòu)件和專用構(gòu)件;根據(jù)構(gòu)件的粒度的大小可以分為小。中大三種不同粒度的構(gòu)件;再次是從構(gòu)件的功能上來看可以分為系統(tǒng)構(gòu)件、支撐構(gòu)件以及領(lǐng)域構(gòu)件三個部分。四是從構(gòu)件的基本結(jié)構(gòu)特征來看可以分為原子構(gòu)件以及組合構(gòu)件。最后從構(gòu)件的狀態(tài)來說,又可以分為動態(tài)和靜態(tài)構(gòu)件。因此從不同種類的構(gòu)件進行區(qū)域定位為視覺系統(tǒng)正常運行創(chuàng)造了優(yōu)良的條件。
2.2缺陷提取
在進行缺陷提取的過程中,難免會受到客觀的環(huán)境影響,比如噪聲、溫度以及濕度等對圖像處理的結(jié)果產(chǎn)生影響,因此需要對區(qū)域定位中產(chǎn)生的區(qū)域進行濾波處理,然后再采用閾值分割的辦法進行缺陷提取。具體操作步驟如下所示:
(1)計算出成像中的最小最大灰度值,并且設置初始閾值。
(2)根據(jù)閾值,結(jié)合圖像的分割目標,將圖像分割成為目標和背景兩個部分,求導出平均灰度值。
(3)再根據(jù)新的平均灰度值計算出新的閾值。
(4)觀察閾值的初始值與新閾值之間的關(guān)系,如歌二者相等則整個計算過程就結(jié)束,如果不相等,則就需要進一步計算。
通過閾值計算得出啊的最佳閾值分割效果圖,能夠進行初步的缺陷預判,但是初步預判當中還存在較多的不確定因素,主要包括兩類,一是在邊緣部分出現(xiàn)的細小毛刺,由于與缺陷的距離較近,因此在初步缺陷提取中容易形成誤判、再次是在構(gòu)件表面有一些非常細小的缺陷,這些缺陷的影響較小,不會對構(gòu)件的性能造成影響,因此在進行缺陷提取的過程中需要將這兩個因素排除在外,具體主要是指采用圖像形態(tài)學中開運算和閉運算,從而達到對構(gòu)件中的明了細節(jié)和暗色細節(jié)的過濾。具體來說缺陷的分割提取采用的是Sobel算子。主要是利用了圖像像素點的上下左右灰度加權(quán)算法,對構(gòu)件表面的缺陷進行檢測。再采用二值圖像邊界跟蹤法,將缺陷從構(gòu)件圖像中分離出來。
2.3缺陷特征提取
缺陷特征提取,又可以稱之為缺陷的定量計算和定性過程,是將前期所得的數(shù)據(jù)結(jié)果以更加直觀的形式展現(xiàn)出來,通過對比指標參數(shù)判斷構(gòu)件的表面質(zhì)量是否合格,符合基本的生產(chǎn)標準。一般來說常用的表示缺陷特征的標準有以下幾種:
(1)周長:周長是對缺陷的邊界長度的描述,在圖像特征上顯示則是指構(gòu)件成像上的缺陷區(qū)域的邊界像素數(shù)量。
(2)面積:面積相對于周長能夠更加直觀地反映整體缺陷的大小,它是缺陷區(qū)域中的像素的總數(shù),因此更高體現(xiàn)缺陷的影響規(guī)模。
(3)致密性:這是一個相對專業(yè)的缺陷指標概念主要是指每平方面積上的平方周倉,是一個雙單位描述指標。
(4)區(qū)域的質(zhì)心:區(qū)域質(zhì)心是描述缺陷的影響關(guān)鍵也就是缺陷區(qū)域內(nèi)的核心區(qū)域,是對整個區(qū)域的核心描述。
(5)最小外接矩形。
3.結(jié)語
綜上所述,構(gòu)件表面缺陷直接影響構(gòu)件的最終使用效果,構(gòu)件表面缺陷的檢測應用領(lǐng)域也逐漸廣泛,而計算機視覺技術(shù)在檢測缺陷中的優(yōu)越性更體現(xiàn)了基于計算機視覺的構(gòu)件表面缺陷特征提取的研究價值。本文主要針對構(gòu)件表面缺陷的檢測,綜合計算機視覺技術(shù)提出了具體的檢測方法和檢測工作原理,通過對表面缺陷的檢測,力圖提高構(gòu)件的整體質(zhì)量。
【參考文獻】
[1]陳黎,黃心漢,王敏,何永輝,龔世強.帶鋼缺陷圖像的自動閾值分割研究[J].計算機工程與應用,2002,(07).
中圖分類號:TP391 文獻標識碼:A 文章編號:1671-7597(2014)07-0001-01
隨著科學技術(shù)的快速發(fā)展,計算機技術(shù)也得到了飛速的發(fā)展。將計算機技術(shù)應用于人類的視覺系統(tǒng),并輔助人們觀察到一些眼睛難以看到的東西,已經(jīng)逐漸成為一門大家所熱捧和追逐的技術(shù)。隨著人們對視覺傳感器技術(shù)越來越多的探索,人們也逐漸實現(xiàn)了古代時想擁有千里眼的夢想。目前,人們已經(jīng)把視覺傳感器技術(shù)和計算機技術(shù)良好的結(jié)合在一起,并把這些技術(shù)應用到食品、建筑、醫(yī)藥、電子、航天航空等眾多領(lǐng)域當中。而該項技術(shù)的快速發(fā)展,也幫助人們解決了一些日常工作當中人類視覺存在盲區(qū)的問題,保證了人們工作過程的安全。視覺技術(shù)與IT技術(shù)的完美結(jié)合使得人們的生活變得更加便利,讓人們親身體會到了IT技術(shù)給人們生活帶來的便捷。
1 雙目立體視覺概述
雙目立體視覺又稱雙目視覺技術(shù),是目前計算機視覺應用領(lǐng)域的重要研究內(nèi)容。雙目立體視覺控制系統(tǒng)的組成因其采用的原理和應用功能的不同,組成也都各不相同。
雙目立體視覺的實現(xiàn)原理是基于人眼的視網(wǎng)膜看物體的特性,從兩個不同的方向來觀看同一個物體的不同角度,從而實現(xiàn)清楚的了解到物體的圖像的目的。雙目立體視覺從不同的角度獲得物體的投影信息,并根據(jù)匹配的結(jié)果,獲取同一個物體不同偏差位置的信息。最后在依據(jù)三角測量技術(shù),根據(jù)已經(jīng)獲得的這些偏差信息從而獲得這些不同點對應的距離信息,并最終獲得這些實際物體的具體坐標位置信息。
視差測距技術(shù)告訴我們,要清楚的觀察到一個物體的全貌,需要兩個觀察物從不同的方向,或者固定一個觀察物,移動另外一個觀察物的方式,以達到拍攝同一個物體的目的。根據(jù)同一個物體在兩個觀察物當中的位置偏差,從而確定該物體的三維信息。一般來說,雙目立體視覺的組成包括:圖像獲取設備、圖像預處理設備、攝像機標定設備、立體匹配設備、根據(jù)二維信息實現(xiàn)三維重構(gòu)設備等五個重要設備。
2 雙目立體視覺技術(shù)的原理
立體畫又可以稱之為三維立體畫,是一種人們可以從三維立體圖中獲取二維平面圖信息的技術(shù)。三維立體圖表面看似毫無規(guī)則,但是假如通過一些特殊的技術(shù)或者通過合理的觀察手段和觀察設備,就可以看到一組秩序井然的美妙圖片。
三維立體圖是一組重復的二維圖片有序的堆積積累而成,因此可以呈現(xiàn)出立體效果。人體觀察物體的原理大致如下:當人類通過左右眼觀察所在的空間平面的時候,這些平面圖都只是一些毫無秩序的圖片。而當左右眼重新聚焦或者在觀察畫面的時候呈現(xiàn)一定的層次感,則人類的左右眼觀察到的一組重復案在經(jīng)過人體識別以后,這些畫面之間將存在一定的距離差異,從而在腦中生成立體感。
雙目立體視覺技術(shù)正是基于以上的原理,從兩個不同的方向去觀察物體,并獲得目標圖像的信息,并經(jīng)過一定的處理獲得三維重建的物體立體信息的技術(shù)。
雙目立體視覺在計算機技術(shù)中實現(xiàn)三維重建的大致流程
如下。
1)攝像機定位,并通過單片機計算得到要獲取圖像信息需要的外部的參數(shù)的大概值,并根據(jù)這些參數(shù)值設定攝像機。
2)用設定參數(shù)的攝像機拍攝目標場景的畫面,并采集這些畫面的二維圖的信息。
3)通過計算機技術(shù)實現(xiàn)雙目匹配,并判定采集畫面中的二維圖像中的不同點之間的對應關(guān)系。
4)在第三步中若得到兩組二維圖像的關(guān)系是稠密的時候,則生成三維視差圖。如果不是則進一步采集圖片信息。
5)根據(jù)得到的視差圖最終實現(xiàn)場景的三維圖形的重建。
3 雙目立體匹配技術(shù)的研究難點和未來的發(fā)展方向
盡管目前有很多學者都投身到雙目立體匹配技術(shù)的研究和開發(fā)當中,直至目前為止也解決了很多關(guān)于視覺理論當中存在的很多缺陷問題。但是視覺問題是一個復雜且難以解決的問題,特別是在雙目立體匹配問題方面更是困難重重。立體匹配技術(shù)的難點已經(jīng)成為限制將雙目技術(shù)應用到計算機技術(shù)當中的重要瓶頸。
立體匹配的主要手段就是找到計算機采集到兩幅和多副圖片的中像素的對應關(guān)系,然后根據(jù)這些像素關(guān)系判定并生成三維重建圖。但是二維圖像的匹配存在層層困難,主要體現(xiàn)在以下幾個方面。
1)由于視角的問題或者觀察物體存在遮擋問題,導致采集回來的圖片信息存在盲點,這樣子更難找到圖片的匹配區(qū)域。
2)場景中的一些深度不連續(xù)的區(qū)域大都處在場景當中的邊界位置,這些位置容易出現(xiàn)像素不高,邊界不清晰等問題,這些問題也給圖像匹配帶了很多困擾。
3)場景當中的低紋理的圖片匹配特征和匹配關(guān)系較少,而且該位置的每個像素點極為相似。假如只是通過簡單的像素相似性檢測的話,會檢測到很多匹配結(jié)果,而這些匹配結(jié)果當中有一大部分是錯誤的。這樣子的結(jié)果勢必會導致最終的圖像匹配正確率極為低下。
從以上的分析,我們可以看出立體匹配技術(shù)存在很多技術(shù)上的難點,這些都在很大程度上限制雙目立體匹配技術(shù)在計算機當中的應用發(fā)展。如何才能設計出有效、準確、快速、通用性強的立體匹配算法將會是以后雙目立體匹配計算發(fā)展的重要方向。也只有通過設計出一套行之有效的立體匹配算法才能使得雙目立體匹配技術(shù)在計算機視覺當中得到廣泛的應用。
4 結(jié)束語
人們通過眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立體信息,分辨出觀察物的廣度和深度,以及物體的遠近。因此人類視覺感知系統(tǒng)就是一個雙目的立體感知系統(tǒng)。本文講述的計算機中的雙目立體匹配技術(shù)正是基于人眼視覺觀察物體的原理,通過雙目立體視覺原理,對計算機采集獲得兩幅二維圖像的信息進行分析,并結(jié)合計算機的分析,最終獲得同人類眼睛一樣觀察到物體三維表面信息的目的。雙目立體匹配技術(shù)與計算機技術(shù)的完美結(jié)合幫助人們可以更加輕易的獲得物體的信息。希望在不久的將來,可以將該項技術(shù)應用于人類的視網(wǎng)膜當中,以幫助一些視網(wǎng)膜存在問題的人們,讓他們重新感受到光明,感受世間的溫暖。
參考文獻
[1]高文,陳熙霖.計算機視覺算法與系統(tǒng)原理[M].北京:清華大學出版社,2002.
[2]明祖衡.雙目立體視覺測距算法研究[M].北京:北京理工大學,2008.
[3]劉昌,郭立,李敬文,劉俊,楊福榮,羅鋒.一種優(yōu)于SAD的匹配準則及其快速算法[J].電路與系統(tǒng)學報,2007,12(4):137-14.