發(fā)布時間:2022-05-02 09:37:29
開篇:寫作不僅是一種記錄,更是一種創(chuàng)造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的1篇計算機視覺論文,希望這些內(nèi)容能成為您創(chuàng)作過程中的良師益友,陪伴您不斷探索和進(jìn)步。
1計算機視覺技術(shù)概述
1.1自動化程度高
計算機視覺可以實現(xiàn)對農(nóng)產(chǎn)品的多個外形和內(nèi)在品質(zhì)指標(biāo)進(jìn)行同時檢測分析,可以進(jìn)行整體識別、增強對目標(biāo)識別的準(zhǔn)確性。
1.2實現(xiàn)無損檢測
由于計算機視覺技術(shù)對農(nóng)產(chǎn)品的識別是通過掃描、攝像,而不需要直接接觸,可以減少對所檢測食品的傷害。
1.3穩(wěn)定的檢測精度
設(shè)計的運行程序確定后,計算機視覺技術(shù)的識別功能就會具有統(tǒng)一的識別標(biāo)準(zhǔn),具有穩(wěn)定的檢測精度,避免了人工識別和檢測時主觀因素所造成的差異。
2計算機視覺技術(shù)在食品檢測中的應(yīng)用
20世紀(jì)70年代初,學(xué)者開始研究計算機視覺技術(shù)在食品工業(yè)中的應(yīng)用,近幾十年電子技術(shù)得到快速發(fā)展,計算機視覺技術(shù)也越來越成熟。國內(nèi)外學(xué)者在研究計算機視覺技術(shù)在食品工業(yè)中的應(yīng)用方面主要集中在該技術(shù)對果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識別、內(nèi)部無損檢測等方面。國內(nèi)有關(guān)計算機視覺技術(shù)在食品業(yè)中的應(yīng)用研究起始于90年代,比國外發(fā)達(dá)國家晚20多年,但是發(fā)展很快。
2.1計算機視覺技術(shù)在果蔬分級中的應(yīng)用研究
計算機視覺技術(shù)在食品檢測中的應(yīng)用研究相當(dāng)廣泛,從外部直徑、成熟度的檢測到內(nèi)部腐爛程度的檢測都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計算機算法計算水果的半徑,進(jìn)而得出果蔬的最大直徑。研究表明,該算法不僅降低了計算量而且提高了計算精度,此方法用于水果分級的誤差不超過2mm,高于國際水果分級標(biāo)準(zhǔn)所規(guī)定的5mm分類標(biāo)準(zhǔn)差,可在工業(yè)生產(chǎn)中很好應(yīng)用。李慶中[5]也利用圖像的缺陷分割算法研究了計算機視覺技術(shù)在蘋果檢測與分級中的應(yīng)用,結(jié)果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎(chǔ),結(jié)合模糊聚類知識利用計算機視覺技術(shù)來檢測蘋果缺陷域,檢測不僅快速而且結(jié)果精確。劉禾等[7]通過研究認(rèn)為蘋果的表面缺陷可以利用計算機視覺技術(shù)進(jìn)行檢測,計算機視覺技術(shù)還可以將蘋果按照檢測結(jié)果進(jìn)行分級,把檢測過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級的重要特征之一,應(yīng)義斌等[8]通過計算機視覺技術(shù)、圖象處理技術(shù)、傅立葉描述子的方法來描述和識別果形以及有無果柄,其識別率達(dá)到90%。楊秀坤等[9]綜合運用計算機視覺技術(shù)、遺傳算法、多層前饋神經(jīng)網(wǎng)絡(luò)系統(tǒng),實現(xiàn)了具有精確度高、靈活性強和速度快等優(yōu)點的蘋果成熟度自動判別。陳育彥等[10]采用半導(dǎo)體激光技術(shù)、計算機視覺技術(shù)和圖像分析技術(shù)相結(jié)合的方法檢測蘋果表面的機械損傷和果實內(nèi)部的腐爛情況,初步驗證了計算機視覺技術(shù)檢測蘋果表面的損傷和內(nèi)部腐爛是可行的。馮斌等[11]通過計算機視覺技術(shù)對水果圖像的邊緣進(jìn)行檢測,然后確定水果的大小用以水果分級。試驗表明,該方法比傳統(tǒng)的檢測方法速度快、準(zhǔn)確率高,適用于計算機視覺的實時檢測。朱偉[12]在模糊顏色的基礎(chǔ)上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對西紅柿的缺陷進(jìn)行分割,結(jié)果顯示準(zhǔn)確率高達(dá)96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實可滴定酸含量以及糖分含量之間的相關(guān)性,然而根據(jù)相關(guān)性,樣品檢測的正確識別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個方向獲取蘋果的圖像,并通過計算機自動分析圖像數(shù)據(jù),對蘋果的外徑、體積、以及圓形度等參數(shù)進(jìn)行處理,與人工檢測相比,計算機視覺技術(shù)具有檢測效率高,檢測標(biāo)準(zhǔn)統(tǒng)一性好等優(yōu)點。Blasco.J[15]通過計算機視覺技術(shù)分析柑橘果皮的缺陷,進(jìn)而對其在線分級,正確率約為95%。趙廣華等[16]人綜合計算機視覺識別系統(tǒng)、輸送轉(zhuǎn)換系統(tǒng)、輸送翻轉(zhuǎn)系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實時監(jiān)測、品質(zhì)動態(tài)的智能分級系統(tǒng),能夠很好地實現(xiàn)蘋果分級。王江楓等[17]建立了芒果重量與攝影圖像的相互關(guān)系,應(yīng)用計算機視覺技術(shù)檢測桂香芒果和紫花芒果的重量和果面損傷,按重量分級其準(zhǔn)確率均為92%,按果面損傷分級的準(zhǔn)確率分別為76%和80%。
2.2計算機視覺技術(shù)在禽蛋檢測中的應(yīng)用研究
禽蛋企業(yè)在生產(chǎn)過程中,產(chǎn)品的分級、品質(zhì)檢測主要采用人工方法,不僅需要大量的物力人力,而且存在勞動強度大、人為誤差大、工作效率低等缺點,計算機視覺技術(shù)可以很好的解決這類產(chǎn)品工業(yè)生產(chǎn)中存在的困擾。歐陽靜怡等[18]利用計算機視覺技術(shù)來檢測雞蛋蛋殼裂紋,利用攝像機獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術(shù),獲得裂紋形狀并判斷,試驗結(jié)果表明,計算機視覺技術(shù)對雞蛋蛋殼裂紋的檢測準(zhǔn)確率高達(dá)98%。汪俊德等[19]以計算機視覺技術(shù)為基礎(chǔ),設(shè)計出一套雙黃雞蛋檢測系統(tǒng)。該系統(tǒng)獲取蛋黃指數(shù)、蛋黃特征和蛋形尺寸等特征,和設(shè)計的數(shù)學(xué)模型對比來實現(xiàn)雙黃雞蛋的檢測和識別,檢測準(zhǔn)確率高達(dá)95%。鄭麗敏等[20]人通過高分辨率的數(shù)字?jǐn)z像頭獲取雞蛋圖像,根據(jù)圖像特征建立數(shù)學(xué)模型來預(yù)測雞蛋的新鮮度和貯藏期,結(jié)果表明,計算機視覺技術(shù)對雞蛋的新鮮度、貯藏期進(jìn)行預(yù)測的結(jié)果準(zhǔn)確率為94%。潘磊慶等[21]通過計算機視覺技術(shù)和聲學(xué)響應(yīng)信息技術(shù)相結(jié)合的方法檢測裂紋雞蛋,其檢測準(zhǔn)確率達(dá)到98%。MertensK等[22]人基于計算機視覺技術(shù)研發(fā)了雞蛋的分級檢測系統(tǒng),該系統(tǒng)識別帶污漬雞蛋的正確率高達(dá)99%。
2.3計算機視覺技術(shù)在檢測食品中微生物含量的應(yīng)用研究
計算機技術(shù)和圖像處理技術(shù)在綜合學(xué)科中的應(yīng)用得到快速發(fā)展,在微生物快速檢測中的應(yīng)用也越來越多,主要是針對微生物微菌落的處理。食品工業(yè)中計算機視覺技術(shù)在微生物檢測方面的研究和應(yīng)用以研究單個細(xì)胞為主,并在個體細(xì)胞的研究上取得了一定的進(jìn)展。殷涌光等[23]以顏色特征分辨技術(shù)為基礎(chǔ),設(shè)計了一套應(yīng)用計算機視覺技術(shù)快速定量檢測食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測結(jié)果與傳統(tǒng)方法的檢測結(jié)果具有很好的相關(guān)性,但與傳統(tǒng)方法相比,可以節(jié)省5d時間,檢測時間在18h以內(nèi),并且能夠有效提高產(chǎn)品品質(zhì)。Lawless等[24]人等時間段測定培養(yǎng)基上的細(xì)胞密度,然后通過計算機技術(shù)建立時間和細(xì)胞密度之間的動態(tài)關(guān)聯(lián),利用該關(guān)聯(lián)可以預(yù)測和自動檢測微生物的生長情況,如通過計算機控制自動定量采集檢測對象,然后分析菌落的邊緣形態(tài),根據(jù)菌落的邊緣形態(tài)計算機可以顯示被檢測菌落的具體位置,并且根據(jù)動態(tài)關(guān)聯(lián)計算機視覺系統(tǒng)可以同時處理多個不同的樣品。郭培源等[25]人對計算機視覺技術(shù)用于豬肉的分級進(jìn)行了研究,結(jié)果顯示計算機視覺技術(shù)在識別豬肉表面微生物數(shù)量上與國標(biāo)方法檢測的結(jié)果顯著相關(guān),該技術(shù)可以有效地計算微生物的數(shù)量。Bayraktar.B等[26]人采用計算機視覺技術(shù)、光散射技術(shù)(BARDOT)和模式識別技術(shù)相結(jié)合的方法來快速檢測李斯特菌,在獲取該菌菌落中的形態(tài)特征有,對圖像進(jìn)行分析處理達(dá)到對該菌的分類識別。殷涌光等[27]人綜合利用計算機視覺、活體染色、人工神經(jīng)網(wǎng)絡(luò)、圖像處理等技術(shù),用分辨率為520萬像素的數(shù)字?jǐn)z像機拍攝細(xì)菌內(nèi)部的染色效果,并結(jié)合新的圖像處理算法,對細(xì)菌形態(tài)學(xué)的8個特征參數(shù)進(jìn)行檢測,檢測結(jié)果與傳統(tǒng)檢測結(jié)果顯著相關(guān)(相關(guān)系數(shù)R=0.9987),和傳統(tǒng)檢測方法相比該方法具有操作簡單、快速、結(jié)果準(zhǔn)確、適合現(xiàn)場快速檢測等特點。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征和微生物數(shù)量進(jìn)行識別,并以此作為衡量乳制品質(zhì)量是否達(dá)標(biāo)的依據(jù),并對產(chǎn)品進(jìn)行分級。
2.4計算機視覺技術(shù)在其他食品產(chǎn)業(yè)中的應(yīng)用研究
里紅杰等[30]通過提取貝類和蝦類等海產(chǎn)品的形狀、尺寸、紋理、顏色等外形特征,對照數(shù)學(xué)模型,采用數(shù)字圖像處理技術(shù)、計算機識別技術(shù)實現(xiàn)了對貝類和蝦類等海產(chǎn)品的無損檢測和自動化分類、分級和質(zhì)量評估,并通過實例詳細(xì)闡述了該技術(shù)的實現(xiàn)方法,證實了此項技術(shù)的有效性。計算機視覺技術(shù)還可以檢驗玉米粒形和玉米種子質(zhì)量、識別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運用計算機視覺技術(shù)對圖像進(jìn)行分析評估,毛葉棗可食率的評估結(jié)果與運用物理方法測得的結(jié)果平均誤差僅為1.47%,因此得出結(jié)論:計算機視覺技術(shù)可以應(yīng)用于毛葉棗的自動分級。GokmenV等[33-34]通過對薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數(shù)來研究薯片中丙烯酰胺的含量和褐變率的關(guān)系,結(jié)果顯示兩項參數(shù)相關(guān)性為0.989,從而可以應(yīng)用計算機視覺技術(shù)來預(yù)測加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應(yīng)用。韓仲志等[35]人拍攝和掃描11類花生籽粒,每類100顆不同等級的花生籽粒的正反面圖像,利用計算機視覺技術(shù)對花生內(nèi)部和外部采集圖像,并通過圖像對其外在品質(zhì)和內(nèi)在品質(zhì)進(jìn)行分析,并建立相應(yīng)的數(shù)學(xué)模型,該技術(shù)在對待檢樣品進(jìn)行分級檢測時的正確率高達(dá)92%。另外,郭培源等[36]人以國家標(biāo)準(zhǔn)為依據(jù),通過數(shù)字?jǐn)z像技術(shù)獲取豬肉的細(xì)菌菌斑面積、脂肪細(xì)胞數(shù)、顏色特征值以及氨氣等品質(zhì)指標(biāo)來實現(xiàn)豬肉新鮮程度的分級辨認(rèn)。
3展望
新技術(shù)的研究與應(yīng)用必然伴隨著坎坷,從70年代初計算機視覺技術(shù)在食品工業(yè)中進(jìn)行應(yīng)用開始,就遇到了很多問題。計算機視覺技術(shù)在食品工業(yè)中的研究及應(yīng)用主要存在以下幾方面的問題。
3.1檢測指標(biāo)有限
計算機視覺技術(shù)在檢測食品單一指標(biāo)或者以一個指標(biāo)作為分級標(biāo)準(zhǔn)進(jìn)行分級時具有理想效果,但以同一食品的多個指標(biāo)共同作為分級標(biāo)準(zhǔn)進(jìn)行檢測分級,則分級結(jié)果誤差較大[37]。例如,Davenel等[38]通過計算機視覺對蘋果的大小、重量、外觀損傷進(jìn)行分析,但研究結(jié)果顯示,系統(tǒng)會把花萼和果梗標(biāo)記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復(fù)雜,造成分級誤差很大,分級正確率只有69%。Nozer[39-40]等以計算機視覺為主要技術(shù)手段,獲取水果的圖像,進(jìn)而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進(jìn)行分級,其正確率僅為85.1%。
3.2兼容性差
計算機視覺技術(shù)針對單一種類的果蔬分級檢測效果顯著,但是,同一套系統(tǒng)和設(shè)備很難用于其它種類的果蔬,甚至同一種類不同品種的農(nóng)產(chǎn)品也很難公用一套計算機視覺設(shè)備。Reyerzwiggelaar等[41]利用計算機視覺檢查杏和桃的損傷程度,發(fā)現(xiàn)其檢測桃子的準(zhǔn)確率顯著高于杏的。Majumdar.S等[42]利用計算機視覺技術(shù)區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識別正確率有明顯差異。
3.3檢測性能受環(huán)境制約
現(xiàn)階段的計算機視覺技術(shù)和配套的數(shù)學(xué)模型適用于簡單的環(huán)境,在復(fù)雜環(huán)境下工作時會產(chǎn)生較大的誤差。Plebe等[43]利用計算機視覺技術(shù)對果樹上的水果進(jìn)行識別定位,但研究發(fā)現(xiàn)由于光照條件以及周邊環(huán)境的影響,水果的識別和定位精度不高,不能滿足實際生產(chǎn)的需要。綜上所述,可看出國內(nèi)外學(xué)者對計算機視覺技術(shù)在食品工業(yè)中的應(yīng)用進(jìn)行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個學(xué)科,在研究和應(yīng)用的過程中,取得了較大的經(jīng)濟(jì)效益,也遇到了很多問題,在新的形勢下,計算機視覺技術(shù)和數(shù)碼拍攝、圖像處理、人工神經(jīng)網(wǎng)絡(luò),數(shù)學(xué)模型建設(shè)、微生物快速計量等高新技術(shù)相融合的綜合技術(shù)逐漸成為了各個領(lǐng)域?qū)W者的研究熱點,以計算機視覺為基礎(chǔ)的綜合技術(shù)也將在食品工業(yè)中發(fā)揮更加重要的作用。
作者:姚瑞玲 單位:四川工商職業(yè)技術(shù)學(xué)院
摘 要:針對跟隨路徑導(dǎo)引的移動機器人導(dǎo)航方式的靈活性較差、維護(hù)成本較高、功能單一的缺點,將計算機視覺用于移動機器人路徑識別。首先對視覺傳感器獲得的視頻圖像進(jìn)行處理,獲得有用的特征目標(biāo),實現(xiàn)機器人對當(dāng)前路徑信息的理解。然后調(diào)用直行或轉(zhuǎn)彎功能模塊對機器人進(jìn)行導(dǎo)航控制。實驗結(jié)果表明,該導(dǎo)航方式具有較好的實時性和魯棒性。
關(guān)鍵詞:計算機視覺;移動機器人;路徑識別;自主導(dǎo)航
現(xiàn)代機器人技術(shù)在人工智能、計算機技術(shù)和傳感器技術(shù)的推動下獲得了飛速發(fā)展,其中移動機器人因具有可移動性和自治能力,能適應(yīng)環(huán)境變化被廣泛用于物流、探測、服務(wù)等領(lǐng)域[14]。移動機器人的優(yōu)秀技術(shù)之一是導(dǎo)航技術(shù),特別是自主導(dǎo)航技術(shù)。由于環(huán)境的動態(tài)變化和不可預(yù)測性、機器人感知手段的不完備等原因,使得移動機器人的導(dǎo)航難度較大,一直是人們研究的重點[5]。
目前常用的一種導(dǎo)航方式是“跟隨路徑導(dǎo)引”[6],即機器人通過對能感知到某些外部的連續(xù)路徑參考信息做出相應(yīng)的反應(yīng)來導(dǎo)航。如在機器人運動路徑上敷設(shè)金屬導(dǎo)線或磁釘,通過檢測金屬導(dǎo)線或磁釘?shù)奶卣餍畔泶_定機器人的位置。從導(dǎo)航的角度看,這種方法的優(yōu)點是可靠性較高,但功能單一,如不能在行進(jìn)的同時對目標(biāo)進(jìn)行識別、避障,對環(huán)境的適應(yīng)能力較弱、靈活性較差、維護(hù)成本較高,因此限制了其在移動機器人中的應(yīng)用。
隨著計算機技術(shù)、數(shù)字圖像處理技術(shù)及圖像處理硬件的發(fā)展,基于計算機視覺的導(dǎo)航方式在機器人導(dǎo)航中得到廣泛關(guān)注[68]。在實際應(yīng)用中,只需要在路面上畫出路徑引導(dǎo)線,如同在公共交通道路上畫的引導(dǎo)線一樣,機器人就可以通過視覺進(jìn)行自主導(dǎo)航。相對于敷設(shè)金屬導(dǎo)線、磁釘?shù)确椒ǎ@種方法增強了系統(tǒng)的靈活性,降低了維護(hù)成本。視覺信息中包含有大量的數(shù)據(jù),要從中提取有用的信息,需要復(fù)雜的算法及耗時的計算。如何保證視覺導(dǎo)航系統(tǒng)在正確理解路徑信息的前提下仍具有較好的實時性和魯棒性,是該方法要解決的優(yōu)秀問題。
1 視覺導(dǎo)航系統(tǒng)構(gòu)成及工作過程
基于計算機視覺的移動機器人導(dǎo)航實驗系統(tǒng)的硬件部分由計算機、USB接口的攝像頭、LEGO實驗用機器人組成。軟件分為2部分,即圖像處理和機器人運動控制?;谝曈X導(dǎo)航的原始輸入圖像是連續(xù)的數(shù)字視頻圖像。系統(tǒng)工作時,圖像預(yù)處理模塊首先對原始的輸入圖像進(jìn)行縮小、邊緣檢測、二值化等預(yù)處理。其次利用哈夫變換提取出對機器人有用的路徑信息。最后,運動控制模塊根據(jù)識別的路徑信息,調(diào)用直行或轉(zhuǎn)彎功能模塊使機器人做相應(yīng)的移動。整個工作流程如圖1所示。
1.1 視覺導(dǎo)航的圖像預(yù)處理
目前圖像采集設(shè)備都具有較高的空間和灰度分辨率,精度高、數(shù)據(jù)量大。
實驗中的原始輸入圖像是USB攝像頭采集320×240像素的RGB格式圖像,最大幀數(shù)30幀/s。
圖像預(yù)處理的效果對后續(xù)哈夫變換檢測路徑信息的速度和準(zhǔn)確性有很大影響。對整幅圖像進(jìn)行抽取時計算量過大、也無必要,故先將彩色圖像轉(zhuǎn)換為灰度圖像,再將圖像的大小依據(jù)最近鄰域插值法原理[9]進(jìn)行縮小以節(jié)約后續(xù)計算時間。在實驗室環(huán)境下,經(jīng)測試,將原始圖像縮小到30%仍然能滿足需要,處理時間縮短了72%。
由于圖像傳感器從時間和空間上對介質(zhì)(光)采樣,其圖像質(zhì)量對現(xiàn)場的非均勻光場和其他干擾因素非常敏感,二值化時,不同光照條件下閾值的確定是一件比較困難的工作。目前常用的閾值選取方法有雙峰法、迭代法和 最大類間方差法[10]。從執(zhí)行時間和處理效果2方面考慮,對3種方法比較后(結(jié)果如表1所示),在優(yōu)先考慮實時性的前提下,選用雙峰法來求取閾值。在實驗室條件下,路徑環(huán)境相對理想,黑色引導(dǎo)線與背景反差較大。在灰度直方圖上,引導(dǎo)線和背景都形成高峰,對這2個峰值及谷底的求取也可簡化,使用灰度級的最大值和最小值代替2個峰值,那么這2個峰值的中間值即可作為谷底用作圖像的閾值。
地面的反光和陰影,以及不均勻的光照都會導(dǎo)致同一幅圖像的二值化效果表現(xiàn)出很大差別,圖2和圖3是對同一幅圖像在不同光照條件下二值化的結(jié)果,可以看到在光照條件2下會出現(xiàn)大量的黑點,這些黑點將嚴(yán)重影響提取路徑信息的速度并且可能導(dǎo)致錯誤的路徑信息。然而,相對于灰度、顏色特征,邊緣特征受光照影響較小[11]。為此,對縮小后的圖像先進(jìn)行引導(dǎo)線的邊緣檢測,邊緣檢測后圖像中引導(dǎo)線邊緣像素灰度的對比度得到增強,通過實驗確定合適的閾值,然后對圖像進(jìn)行二值化以提取路徑信息。
1.2 引導(dǎo)線角度檢測
2 視覺導(dǎo)航的機器人運動控制
機器人運動控制部分分為直行控制和轉(zhuǎn)彎控制2部分。
2.1 直行控制
如果哈夫變換的檢測結(jié)果表明是一條直線即機器人視野中只有1條主引導(dǎo)線時,則運行直行模塊。實際中有2種情況需要考慮:一是機器人的初始位置不一定正對引導(dǎo)線,二是在機器人的機電配置中,左右輪子的馬達(dá)運動不會絕對精確和對稱。這些會使機器人在運動中出現(xiàn)側(cè)偏。可采用下述方法進(jìn)行直行控制:根據(jù)引導(dǎo)線在圖像平面坐標(biāo)中的位置來判斷機器人的偏向。當(dāng)引導(dǎo)線位于圖像平面的左半邊,說明攝像頭的光軸與引導(dǎo)線不垂直且相對于引導(dǎo)線右偏,則命令機器人左轉(zhuǎn);當(dāng)引導(dǎo)線位于圖像平面的右半邊,說明攝像頭的光軸與引導(dǎo)線不垂直且相對于引導(dǎo)線左偏,則命令機器人右轉(zhuǎn);當(dāng)引導(dǎo)線在圖像平面兩邊均存在時,則命令機器人不偏轉(zhuǎn)繼續(xù)直行。機器人在前進(jìn)過程中,根據(jù)圖像平面中引導(dǎo)線位置不斷調(diào)整方位,以一定的轉(zhuǎn)動角度(轉(zhuǎn)動角度盡量小,這樣機器人的擺動幅度就會小)在直線路徑上行走。
2.2 轉(zhuǎn)彎控制
如果哈夫變換的檢測結(jié)果表明是兩條相互垂直的直線,即機器人的視野中出現(xiàn)轉(zhuǎn)彎路口,則開始運行轉(zhuǎn)彎模塊。
機器人需要在距轉(zhuǎn)角合適的距離處開始運行轉(zhuǎn)彎模塊,以保證機器人視野中始終具有引導(dǎo)線。如圖4所示,AB段表示攝像頭的縱向視野范圍,C點為轉(zhuǎn)角點,機器人需要知道自身在實際二維平面中相對于轉(zhuǎn)角點C的距離即BC段距離。由圖像信息獲得現(xiàn)實世界坐標(biāo)系中的參數(shù),即所謂三維重建,這需要對基于計算機視覺的移動機器人導(dǎo)航系統(tǒng)進(jìn)行攝像機標(biāo)定。
鑒于移動機器人識別的引導(dǎo)線在地面上這一限制條件,并且攝像頭固定在機器人上,可以選擇機器人坐標(biāo)系為世界坐標(biāo)系,即世界坐標(biāo)系與機器人同步移動。坐標(biāo)原點為標(biāo)定模板的左下角標(biāo)定點的中心,Zw軸垂直地面,XwYw平面即為地面。在該坐標(biāo)系下地面目標(biāo)的坐標(biāo)可以表示為(Xw,Yw,0),П甓模板由直徑5 mm、相距10 mm共72個圓點構(gòu)成,如圖5所示。
3 實驗結(jié)果及結(jié)論
實驗中選用的LEGO移動機器人,其運動速度為8.57 cm/s(指令設(shè)定Power=25 RPM)。導(dǎo)航場地中畫有寬1 cm的黑色引導(dǎo)線,實驗要求中機器人完全根據(jù)引導(dǎo)線自主運動。實驗中,識別1幀圖像并且機器人根據(jù)識別的路徑信息運行直行或轉(zhuǎn)彎模塊共需0.311 s,即機器人每處理1幀圖像移動2.67 cm。實驗室中的光照條件是機器人移動時的主要干擾,而銳利的引導(dǎo)線邊緣受光照影響較小,對這些干擾有較好的濾除作用。經(jīng)過在陰天白天、晴天白天以及開燈和不開燈的情況下、晚上開燈的情況下、遮蓋物位于攝像頭上方50 cm處形成陰影情況下,機器人能正確的沿引導(dǎo)線移動。同時,當(dāng)攝像頭視野范圍內(nèi)引導(dǎo)線消失即認(rèn)為出現(xiàn)障礙物,機器人能發(fā)出前方有障礙物的報警信息。
可見上面所述方法有較好的實時性和魯棒性有一定的通用性,使得該視覺導(dǎo)航方法具有一定的應(yīng)用價值。只要光照條件變化不是非常劇烈,在工廠、醫(yī)院、辦公樓等環(huán)境中,機器人根據(jù)路徑引導(dǎo)線可自主到達(dá)目的地。
當(dāng)然,由于移動機器人活動場景的復(fù)雜性和動態(tài)特性,以及視覺處理的復(fù)雜性,視覺導(dǎo)航還有很多需要解決的問題,例如當(dāng)導(dǎo)航場地出現(xiàn)較大面積的強烈反光、極暗的陰影時能否有效可靠的進(jìn)行移動機器人的導(dǎo)航控制,這需要進(jìn)一步研究。另外,如何將視覺系統(tǒng)與本系統(tǒng)機器人平臺中的超聲波傳感器、光電傳感器及聲音傳感器在空間、時間及數(shù)據(jù)上進(jìn)行融合以提高系統(tǒng)的適應(yīng)性和環(huán)境識別能力也是一個研究方向。
作者簡介
趙 瑜 女,1983年出生,陜西西安人,碩士研究生。主要研究方向為非接觸測量與可視化計算。
種蘭祥 男,1960年出生,陜西合陽人,西北大學(xué)信息科學(xué)與技術(shù)學(xué)院副教授,中國科學(xué)院西安光學(xué)精密儀器研究所博士研究生。主要從事非接觸測量、光電子技術(shù)和可視化計算方面的研究。
張萬緒 男,1964年出生,山西運城人,西北大學(xué)信息科學(xué)與技術(shù)學(xué)院副教授。主要研究方向為智能儀器儀表。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文
摘要:近年來,隨著計算機視覺技術(shù)與應(yīng)用的飛速發(fā)展,越來越多學(xué)生對這門課產(chǎn)生了濃厚的興趣。文章是對我院計算機視覺課程教學(xué)經(jīng)驗的總結(jié),討論我們在教學(xué)過程中遇到的一些具體問題,主要包括教學(xué)內(nèi)容和工程實例的選取、教學(xué)方法的幾個注意事項,期待與同行們進(jìn)行交流探討。
關(guān)鍵詞:計算機視覺;教學(xué)應(yīng)用;教學(xué)改革
計算機視覺是人工智能學(xué)科中的一門重要課程。隨著相關(guān)應(yīng)用在多個領(lǐng)域中的出現(xiàn),越來越多的學(xué)生開始對這門課產(chǎn)生了濃厚的興趣。如何讓學(xué)生能夠在整個課程中保持盎然的興趣,并為有志于深入研究計算機視覺的學(xué)生指明方向,成為我們教師首先應(yīng)注重的問題。
在實際的教學(xué)工作中,通過不斷摸索總結(jié),我們認(rèn)為,以實際應(yīng)用引導(dǎo)學(xué)生的學(xué)習(xí)興趣,既滿足了學(xué)生想了解計算機視覺實際應(yīng)用的需求,又加深了學(xué)生對于算法的理解,把算法放在一個實際應(yīng)用中,學(xué)生可以理解怎么用,為什么這么用。在這樣的目標(biāo)導(dǎo)引下,我們從選擇教材開始,準(zhǔn)備教學(xué)內(nèi)容(包括合理的應(yīng)用實例的選擇)、制作PPT、探索教學(xué)方法,形成了目前以實際應(yīng)用為主導(dǎo)的創(chuàng)新教學(xué)體系,非常受學(xué)生歡迎。在此,我們對這期間遇到的問題,解決方法、心得體會做一個總結(jié)和思考,希望能對同行有些許參考作用。
1選擇教材
在我們這個專業(yè),每年的上研率基本都保持在50%左右。在本專業(yè)的研究生階段,也開設(shè)了雙語教學(xué)的計算機視覺課程。另外,畢業(yè)后選擇參加工作的同學(xué)也基本都進(jìn)入和本專業(yè)非常相關(guān)的一些單位,所從事的工作,都是和在學(xué)校學(xué)習(xí)的知識密切相關(guān)。
因此,如何讓這門課程的教學(xué)既兼顧本科畢業(yè)就參加工作的那部分同學(xué),又兼顧繼續(xù)深造的學(xué)生的需求,也是在這門課程講授的過程中,需要特別注意的一個問題。對于本科畢業(yè)就要參加工作的同學(xué)而言,需要“廣度”,需要了解計算機視覺這門課在各個領(lǐng)域中的應(yīng)用,在實際中接觸到相關(guān)的項目或工作時,能夠知道去哪里可以找到自己需要的參考資料;而對于要進(jìn)一步深造的同學(xué)而言,則需要一定的“深度”,為研究生階段的研究打下基礎(chǔ)。
全盤考慮到這些學(xué)生畢業(yè)之后的去向,我們選擇了兩本教材。一本是賈云得教授編著,科學(xué)出版社于 2000年出版的《機器學(xué)習(xí)》[2],這是一部順應(yīng)了時代與教學(xué)發(fā)展要求的教材,對計算機視覺中的基本概念、基本算法、基本算法的應(yīng)用、經(jīng)典應(yīng)用進(jìn)行了由淺入深的介紹。內(nèi)容涵蓋了所有經(jīng)典的數(shù)字圖像處理與機器視覺方法,也對一些已經(jīng)得到非常好實際應(yīng)用的方法,如光流法等作了簡要介紹。另外還選擇了一本英文原版的計算機視覺的經(jīng)典著作,Ramesh Jain 教授等所著的《Machine Vision》[3],機械工業(yè)出版社于2003年出版。這是國內(nèi)外非常推崇的一本計算機視覺著作,該教材條理清晰,深入淺出,對計算機視覺的基本原理、算法、應(yīng)用的介紹非常詳盡。
在教學(xué)中,我們采用了英文的PPT,但主要用的教材是賈云得教授的《機器視覺》,這樣中英文對照講解,一方面加深學(xué)生對教學(xué)內(nèi)容的理解,另一方面也為學(xué)生今后閱讀專業(yè)的英文論文做了相應(yīng)準(zhǔn)備。
2教學(xué)內(nèi)容和工程實例的選取
2.1選取教學(xué)內(nèi)容
本課程之前,大學(xué)二年級的本科生已開設(shè)數(shù)字圖像處理課程,但所講的基本原理和算法都非常淺顯,所以在教學(xué)內(nèi)容的安排上,分為兩大部分:數(shù)字圖像處理部分和視覺部分。數(shù)字信號處理部分主要講解在視覺部分會用到的一些基本算法,為后面進(jìn)入計算機視覺部分打基礎(chǔ)。這部分約占總課時的1/3。視覺部分的課時也分為兩部分:算法講解與實例講解。在算法講解部分,對計算機視覺的基本算法、經(jīng)典算法都做了深入淺出的講解。實例部分則選擇了經(jīng)典的工業(yè)應(yīng)用,讓學(xué)生能夠?qū)λ鶎W(xué)算法進(jìn)一步加以理解。
2.2選取適當(dāng)?shù)墓こ虒嵗?
就計算機視覺的教學(xué)內(nèi)容而言,各個孤立的算法和方法對本科生來講,有些抽象不好理解。如果在教學(xué)上僅僅通過老師在課堂上的講解,很難讓學(xué)生深入地理解相關(guān)的教學(xué)內(nèi)容,而選擇一個觸手可及且簡單好理解的工程實例往往就會達(dá)到意想不到的教學(xué)結(jié)果,學(xué)生可以把課堂上所學(xué)的枯燥理論與現(xiàn)實中活生生的事物聯(lián)系起來,從而加深對教學(xué)內(nèi)容的理解。
通過反復(fù)比對、反復(fù)論證,我們選擇了在講解基本原理和算法之后,在課程結(jié)束前,專門留出課時講解手機制造這個例子。手機現(xiàn)在是人手一部,是這些年青學(xué)子再熟悉不過的事物了,通過對手機主板、手機鍵盤的制造過程的講解,把所學(xué)的算法都融合進(jìn)來,學(xué)生在覺得有趣的同時,不知不覺就加深了對所學(xué)算法的理解。
另外,在教學(xué)的過程中,我們還不斷穿插其他學(xué)生耳熟能詳?shù)膶嵗?如數(shù)碼相機原理中的一些算法的講解,我們和學(xué)生一起探討應(yīng)該怎么選擇數(shù)碼相機。再有,濾波器算法、在課堂上對Photoshop功能的演示,與所學(xué)算法關(guān)聯(lián)起來,學(xué)生都很容易理解接受。
3教學(xué)點滴
3.1點睛之筆
在第一節(jié)課的講述中,我們的重點不在于Marr理論,而是告訴學(xué)生:
人工智能就是要讓計算機像人一樣,能夠會聽、會看……
我們這門課程就是要讓計算機“會看”,要像人一樣會看。進(jìn)而展示給學(xué)生一些我們精心挑選的圖片,讓學(xué)生自己判斷,是不是自己的眼睛“騙了”自己,人眼和計算機看到的到底有什么不一樣。
每次講到這里,學(xué)生都會進(jìn)行熱烈的討論,每個人都有不同的看法,每個人都有自己的堅持,不知不覺中,對這門課就產(chǎn)生了濃厚的興趣,有了繼續(xù)深入學(xué)習(xí)下去的愿望。在課堂討論的最后,比較人眼對圖片的判斷以及計算機的判斷后,讓學(xué)生自己總結(jié)歸納,我們這門課到底要研究些什么,都有可能應(yīng)用在哪些方面,然后對爭議比較大的提議一一探討。每到這個時候,大家的積極性就都被激發(fā)出來,在不斷的爭論與思想碰撞中找出正確的結(jié)論。
3.2拿身邊的事物說“事”
計算機視覺課程的前半部分,多涉及到圖像處理的一些常見算法。在講授各種各樣的濾波器和算子時,并沒有針對各個濾波器和算子擺出一堆示例圖片,讓學(xué)生比較濾波前后的差異,從而很生硬地理解濾波器與算子的功能。取而代之的,我們首先以現(xiàn)在人手一臺的數(shù)碼相機為例提出問題,你為什么要選擇你手里的這臺數(shù)碼相機?當(dāng)初選這個品牌和型號時,你的考慮是什么?歷年學(xué)生的回答幾乎都是看網(wǎng)上測評,或者在網(wǎng)上看別人怎么說。這時列出我們收集到的各個品牌相機的測評報告,列出它們的優(yōu)缺點,然后引導(dǎo)學(xué)生去思考,例如這個品牌的相機的缺點是照片發(fā)灰,不是很鮮亮,而另一個品牌的相機則綠的特別綠,紅的特別紅,為什么?那么有可能是哪部分的算法不夠完善,為什么?
通過如此簡單的對比,學(xué)生的積極性被完全激發(fā)。原來,數(shù)碼相機這個幾乎人人都有,大家都熟悉的“玩具”竟然和自己在課堂上學(xué)到的知識這么密切相關(guān)。
再有,就是利用學(xué)生們都熟悉的PS(Photoshop),演示現(xiàn)在所謂的“完美證件照”是怎么來的。為什么可以把疙疙瘩瘩的臉部皮膚變得光滑?在PS中,你就是點了一下鼠標(biāo),其實在后臺,是加入了一個濾波器進(jìn)行了濾波。各種這樣的演示,學(xué)生都非常喜聞樂見。因為他們突然發(fā)現(xiàn),原來那些事物,和我自己接觸到這些看似枯燥的理論之間,還有這么深刻的聯(lián)系。
還有一個很受學(xué)生歡迎的例子就是對于“鼓形失真”的講解。我們的老師每次講到這里,都不會簡單告訴學(xué)生“鼓形失真”發(fā)生的原因是什么,應(yīng)該怎么解決?老師都會問學(xué)生,明星為什么都一窩蜂去減肥?現(xiàn)在的女明星為什么都要去弄個“錐子臉”?課堂上就會出現(xiàn)一個小高潮,男同學(xué)和女同學(xué)的看法各異,彼此之間開始爭論不休。此時再趁熱打鐵地問學(xué)生,如果拿著相機,離自己的鼻子一公分,會拍出什么樣的效果?有學(xué)生開始拿出手機對著自己和別人開拍,有的學(xué)生開始頭頭是道地分析。每到這種學(xué)生都開始熱烈討論的時候,就可以適時引導(dǎo)學(xué)生往正確的方向去,讓他們自己找到正確的分析解決方法,往往這個時候,學(xué)生都會頗有成就感,對于問題的理解也會特別的深刻。
3.3選擇合適的實際應(yīng)用
在所有理論講解結(jié)束后,我們會留出2~4次課講述計算機視覺在工業(yè)上的應(yīng)用。這些年來,對于手機制造這樣一個工業(yè)應(yīng)用,非常受學(xué)生歡迎。正如“數(shù)碼相機”這個例子一樣,現(xiàn)在學(xué)生都是人手一部手機,是大家再熟悉不過的東西。這個例子涉及到了在前面理論講述中的大部分算法,如二值圖像的處理、模板匹配、高斯濾波器等。學(xué)生通過對這個工業(yè)應(yīng)用的理解,更進(jìn)一步加深了對算法的理解。
以講解手機鍵盤的制造過程為例,向?qū)W生提出和前面所講內(nèi)容相關(guān)的問題,引導(dǎo)學(xué)生自發(fā)思考,如為什么選擇模板匹配法,而不是采用其他更復(fù)雜更精確的方法等等。每到這個時候,課堂氣氛總是分外熱烈,學(xué)生各抒己見,在不斷爭論中,更進(jìn)一步加深對課本上枯燥理論的認(rèn)識。
在這里需要注意的問題是一定要一步一步提出問題,循循善誘,引導(dǎo)學(xué)生一層一層地深入思考。如果問題的答案過于“深藏不露”,則有可能觸發(fā)學(xué)生的抵觸情緒,無法繼續(xù)深入地思考。
4結(jié)語
通過多年的教學(xué)摸索,我們認(rèn)為,在計算機視覺課程的講述中,以實際應(yīng)用引導(dǎo)學(xué)生這樣的教學(xué)方法非??扇?而且也收到了很好的效果。另外,除了制定好的教學(xué)大綱,并選擇合適的教材外,根據(jù)學(xué)?,F(xiàn)在的時間情況,我們選擇了多媒體手段輔助教學(xué),充分利用Matlab和大屏幕投影等方方面面的優(yōu)勢,結(jié)合多種方法進(jìn)行教學(xué),對講好計算機視覺這門課,非常有益。
摘要:導(dǎo)航技術(shù)是移動機器人優(yōu)秀技術(shù),移動機器人又有多種導(dǎo)航方式,本文對各種導(dǎo)航方式進(jìn)行了分析比較,提出由于計算機視覺理論及算法的發(fā)展,又由于和激光、雷達(dá)和超聲在導(dǎo)航方面相比,視覺導(dǎo)航具有很多優(yōu)點,因此視覺導(dǎo)航被大量地采用。根據(jù)移動機器人是在導(dǎo)航過程中對圖像進(jìn)行處理,實時性差始終是一個非常棘手的問題,提出解決該問題的關(guān)鍵在于設(shè)計一種快速圖像處理方法。
關(guān)鍵詞:視覺導(dǎo)航;移動機器人;圖像處理
移動機器人是一種在復(fù)雜的環(huán)境下工作的具有自規(guī)劃、自組織、自適應(yīng)能力的機器人。移動機器人集人工智能、智能控制、信息處理、圖像處理、模式識別、檢測與轉(zhuǎn)換等專業(yè)技術(shù)為一體,跨計算機、自動控制、模式識別、智能控制等多學(xué)科,成為當(dāng)前智能機器人研究的熱點之一。
在移動機器人的運動過程中始終要解決的是自身的導(dǎo)航與定位問題,相關(guān)技術(shù)研究中,導(dǎo)航技術(shù)可以說是其優(yōu)秀技術(shù),也是其實現(xiàn)真正的智能化和完全的自主移動的關(guān)鍵技術(shù)。也就是DurrantWhyte提出的三個問題:(1)“我現(xiàn)在何處?”;(2)“我要往何處去?”;(3)“要如何到該處去?”[1] 其中問題(1)是移動機器人導(dǎo)航系統(tǒng)中的定位及跟蹤問題,問題(2)、(3)是移動機器人導(dǎo)航系統(tǒng)中路徑規(guī)劃問題。導(dǎo)航研究的目標(biāo)就是沒有人的干預(yù)下使機器人有目的地移動并完成特定任務(wù),進(jìn)行特定操作。機器人通過裝配的信息獲取手段,獲得外部環(huán)境信息,實現(xiàn)自我定位,判定自身狀態(tài),規(guī)劃并執(zhí)行下一步的動作。
移動機器人的導(dǎo)航方式分為:基于環(huán)境信息的地圖模型匹配導(dǎo)航;基于各種導(dǎo)航信號的路標(biāo)導(dǎo)航、視覺導(dǎo)航和味覺導(dǎo)航等[2]。
環(huán)境地圖模型匹配導(dǎo)航是機器人通過自身的各種傳感器,探測周圍環(huán)境,利用感知到的局部環(huán)境信息進(jìn)行局部地圖構(gòu)造,并與其內(nèi)部事先存儲的完整地圖進(jìn)行匹配。如兩模型相互匹配,機器人可確定自身的位置,并根據(jù)預(yù)先規(guī)劃的一條全局路線,采用路徑跟蹤和避障技術(shù),實現(xiàn)導(dǎo)航。它涉及環(huán)境地圖模型建造和模型匹配兩大問題。
路標(biāo)導(dǎo)航是事先將環(huán)境中的一些特殊景物作為路標(biāo),機器人在知道這些路標(biāo)在環(huán)境中的坐標(biāo)、形狀等特征的前提下,通過對路標(biāo)的探測來確定自身的位置。同時將全局路線分解成為路標(biāo)與路標(biāo)間的片段,不斷地對路標(biāo)探測來完成導(dǎo)航。根據(jù)路標(biāo)的不同,可分為人工路標(biāo)導(dǎo)航和自然路標(biāo)導(dǎo)航。人工路標(biāo)導(dǎo)航是機器人通過對人為放置的特殊標(biāo)志的識別實現(xiàn)導(dǎo)航,雖然比較容易實現(xiàn),但它人為地改變了機器人工作的環(huán)境。自然路標(biāo)導(dǎo)航不改變工作環(huán)境,是機器人通過對工作環(huán)境中的自然特征的識別完成導(dǎo)航,但路標(biāo)探測的穩(wěn)定性和魯棒性是研究的主要問題[3]。
視覺導(dǎo)航,計算機視覺具有信息量豐富,智能化水平高等優(yōu)點,近年來廣泛應(yīng)用于移動機器人的自主導(dǎo)航。視覺導(dǎo)航方式具有信號探測范圍廣,獲取信息完整等優(yōu)點,是移動機器人導(dǎo)航的一個主要發(fā)展方向[4]。目前國內(nèi)外主要采用在移動機器人上安裝車載攝像機的基于局部視覺的導(dǎo)航方式,如文獻(xiàn)[4]中所提及的:D.L.Boley等研制的移動機器人利用車載攝像機和較少的傳感器通過識別路標(biāo)進(jìn)行導(dǎo)航;A.Ohya等利用車載攝像機和超聲波傳感器研究了基于視覺導(dǎo)航系統(tǒng)中的避碰問題等。視覺導(dǎo)航中邊緣銳化、特征提取等圖像處理方法計算量大且實時性較差,解決該問題的關(guān)鍵在于設(shè)計一種快速的圖像處理方法或采取組合導(dǎo)航方式[4-5]。
味覺導(dǎo)航是通過機器人配備的化學(xué)傳感器感知氣味的濃度,根據(jù)氣味的濃度和氣流的方向來控制機器人的運動。由于氣味傳感器具有靈敏度高、響應(yīng)速度快以及魯棒性好等優(yōu)點,近年來許多研究人員在氣味導(dǎo)航技術(shù)上做了許多研究工作。但該項技術(shù)能夠真正應(yīng)用到實際環(huán)境中的卻很少,仍處于試驗研究階段。Figaro Engineering Inc.公司研制的氧化錫氣味傳感器,被廣泛用于氣味導(dǎo)航試驗。石英晶體微平衡氣味傳感器、導(dǎo)電聚合物氣味傳感器和一種模仿哺乳動物鼻子功能的電子鼻等用于移動機器人味覺導(dǎo)航的傳感器都處于試驗階段。目前的味覺導(dǎo)航試驗多采用將機器人起始點和目標(biāo)點之間用特殊的化學(xué)藥品,如酒精和樟腦丸等,引導(dǎo)出一條無碰氣味路徑,機器人根據(jù)不同的道路跟蹤算法,用氣味傳感器感知氣味的濃淡和氣味源的方向進(jìn)行機器人導(dǎo)航試驗。味覺導(dǎo)航的研究具有很好的研究價值,該種移動機器人可用來尋找化學(xué)藥品泄露源。
由于計算機視覺理論及算法的發(fā)展,又由于和激光、雷達(dá)和超聲在導(dǎo)航方面相比,視覺導(dǎo)航具有以下幾個優(yōu)點:首先,即使在丟棄了絕大部分的視覺信息后,所剩下的關(guān)于周圍環(huán)境的信息仍然比激光雷達(dá)和超聲更多更精確;其次,激光雷達(dá)和超聲的原理都是通過主動發(fā)射脈沖和接受反射脈沖來測距的,因此當(dāng)多個機器人同時工作時,相互之間可能產(chǎn)生干擾,而視覺由于是被動測量,因此多個機器人相互之間的干擾可以減少到最??;最后,激光雷達(dá)和超聲數(shù)據(jù)的采樣周期一般比攝像機長,不能及時對高速運動的機器人提供信息并作出規(guī)劃,因此視覺傳感器被大量地采用。目前移動機器人的導(dǎo)航大都采用基于視覺或有視覺參與的導(dǎo)航技術(shù)。最近二十年來,在未知或部分未知環(huán)境中,基于自然路標(biāo)導(dǎo)航與定位技術(shù)的研究;視覺導(dǎo)航中路標(biāo)的識別以及圖像處理的新型快速算法的研究成為了計算機視覺的主要研究方向。
視覺導(dǎo)航主要完成障礙物和路標(biāo)的探測及識別。國內(nèi)外應(yīng)用最多的是在機器人上安裝車載攝像機的基于局部視覺的導(dǎo)航方式。P.I.Corke等對有車載攝像機的移動機器人視覺閉環(huán)系統(tǒng)的研究表明,這種控制方法可以提高路徑跟蹤精度。從視覺圖像中識別道路是影響移動機器人導(dǎo)航性能的一個最重要因素。對于一般的圖像邊沿抽取而言,已有了許多方法,例如,局部數(shù)據(jù)的梯度法和二階微分法。Trahanias利用視覺探測路標(biāo)來完成機器人的導(dǎo)航。其中路標(biāo)不是預(yù)先定義的人工路標(biāo),而是在學(xué)習(xí)階段自動提取的自然路標(biāo)。在視覺導(dǎo)航中邊緣銳化、特征提取等圖像處理方法的計算量大,移動機器人是在運動中對圖像進(jìn)行處理,實時性差始終是一個非常棘手的問題。解決該問題的關(guān)鍵在于設(shè)計一種快速圖像處理方法。為了滿足速度的要求,基于統(tǒng)計計算的預(yù)值法被應(yīng)用于機器人的導(dǎo)航,但在實際應(yīng)用中發(fā)現(xiàn),它抑制噪聲的能力差,特別是預(yù)值的選取極大地依賴于環(huán)境,要想獲得理想的結(jié)果,僅在一幅圖像中的不同區(qū)域就要設(shè)置不同的預(yù)值。近些年,由于人工智能的發(fā)展,有很多好的算法被應(yīng)用到移動機器人的視覺導(dǎo)航中去。比如,根據(jù)導(dǎo)航圖像的特點采用邊緣提取結(jié)合HOUGH變換的方法和帶濾波窗的區(qū)域掃描的方法,經(jīng)過檢驗,這兩種算法都具有較好的實時性,對于直線形態(tài)的各類導(dǎo)航線以及對于已知半徑的弧形導(dǎo)航線具有較高的可靠性,以上算法目前對于分支較多的直線形態(tài)的導(dǎo)航線以及未知半徑的弧形導(dǎo)航線的效果不佳,這是今后努力的方向。
Stanley還提出了基于神經(jīng)網(wǎng)絡(luò)的機器人視覺導(dǎo)航技術(shù)。該技術(shù)中估算逆雅可比矩陣,并將圖像特征的變化與機器人的位置變化對應(yīng)起來,通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練來近似特征雅可比矩陣的逆陣。該技術(shù),通過提取幾何特征、平均壓縮、向量量化和主成分提取來簡化圖像處理,實現(xiàn)實時視覺導(dǎo)航。
綜上所述,移動機器人是在運動中對圖像進(jìn)行處理,實時性差始終是一個非常棘手的問題。解決該問題的關(guān)鍵在于設(shè)計一種快速圖像處理方法。將室內(nèi)地面作為機器人視覺導(dǎo)航的路標(biāo)。依據(jù)地面的顏色信息,將地面上沒有障礙物的區(qū)域識別并分割出來,機器人在可行走區(qū)域內(nèi)行走,這樣就可以實現(xiàn)機器人的自主導(dǎo)航。利用環(huán)境中地面的顏色特征,采用比較簡單的圖像處理算法分割彩色圖像,經(jīng)實驗證明可提高機器人導(dǎo)航的實時性、準(zhǔn)確性和魯棒性。
摘 要: 針對當(dāng)前視頻監(jiān)控進(jìn)行考試監(jiān)考的丟包率大和智能化程度不高的問題,在計算機視覺下進(jìn)行學(xué)生考試自動監(jiān)控系統(tǒng)優(yōu)化設(shè)計,提出一種基于視頻幀循環(huán)糾錯編碼的計算機視覺自動監(jiān)考系統(tǒng)設(shè)計方法。系統(tǒng)設(shè)計分為硬件和軟件部分,包括A/D電路、時鐘電路、視頻幀循環(huán)糾錯編碼電路、程序加載電路和輸出接口電路。實驗測試結(jié)果表明,該系統(tǒng)能有效降低監(jiān)考過程中的視頻丟包,提高監(jiān)考區(qū)域的視覺覆蓋度,系統(tǒng)集成性和智能性較高。
關(guān)鍵詞: 計算機視覺; 考試; 自動監(jiān)考; 視頻幀
0 引 言
隨著視頻圖像處理技術(shù)的發(fā)展,采用計算機視頻監(jiān)測方法進(jìn)行現(xiàn)場O控設(shè)計,提高對監(jiān)控區(qū)域的自動化識別和管理能力[1]。學(xué)生考試自動監(jiān)考系統(tǒng)是考試智能化管理系統(tǒng)的重要部分,采用計算機視覺分析方法進(jìn)行自動監(jiān)考,首先采用計算機視頻監(jiān)控方法進(jìn)行考試現(xiàn)場的實時視覺畫面采集,從而實現(xiàn)對考試現(xiàn)場的檢驗分析和指導(dǎo)。研究學(xué)生考試自動監(jiān)考系統(tǒng),在促進(jìn)智能化考試管理和提高考場監(jiān)考的管控能力方面具有積極重要意義[2],對學(xué)生考試自動監(jiān)考系統(tǒng)是建立在視頻圖像分析基礎(chǔ)上的,結(jié)合系統(tǒng)硬件設(shè)備設(shè)計和軟件開發(fā),采用計算機視覺分析方法進(jìn)行監(jiān)控現(xiàn)場的異常信息特征提取和分析,采用視頻幀循環(huán)糾錯編碼避免監(jiān)控過程中的丟包和誤碼失真。首先進(jìn)行系統(tǒng)的總體構(gòu)架分析,然后進(jìn)行監(jiān)考系統(tǒng)的硬件模塊化設(shè)計,最后進(jìn)行系統(tǒng)調(diào)試分析,得出有效性結(jié)論。
1 系統(tǒng)設(shè)計與實現(xiàn)
1.1 外圍器件選擇
根據(jù)上述設(shè)計思想和總體設(shè)計構(gòu)架,進(jìn)行基于計算機視覺的學(xué)生考試自動監(jiān)考系統(tǒng)的硬件模塊化設(shè)計,學(xué)生考試自動監(jiān)考系統(tǒng)的數(shù)據(jù)采集系統(tǒng)是整個系統(tǒng)的基礎(chǔ)。通過PCI橋接芯片與PC機進(jìn)行數(shù)據(jù)通信,采用PCI9054的LOCAL 總線設(shè)計方法,進(jìn)行數(shù)據(jù)特征采集,把學(xué)生考試監(jiān)考現(xiàn)場的視頻信息存儲到PCI總線上,在嵌入式RAM中對監(jiān)控視頻信息進(jìn)行收發(fā)轉(zhuǎn)換和視頻幀間編碼,基于視頻幀循環(huán)糾錯編碼方法進(jìn)行視頻糾錯。硬件設(shè)計主要包括如下幾個部分:學(xué)生考試監(jiān)考現(xiàn)場的視頻信息的DSP信號處理器、模擬信號預(yù)處理機、視頻信息的邏輯控制設(shè)備、外部I/O設(shè)備以及A/D設(shè)備和電源供電設(shè)備,用DSP控制A/D轉(zhuǎn)換FLASH寄存器寄存學(xué)生考試監(jiān)考現(xiàn)場的視頻視覺特征信息,同時DSP與PCI通信,DSP接收PCI總線的用戶信息,輸出多路視頻編碼到功率放大器。通過串行E2PROM進(jìn)行配置校驗,在C 模式下通過PCI總線送采樣數(shù)據(jù)或處理結(jié)果到PC機進(jìn)行監(jiān)考現(xiàn)場的監(jiān)控信息分析。
1.2 監(jiān)考系統(tǒng)的電路設(shè)計
根據(jù)上述總體設(shè)計要求,結(jié)合選擇的外圍器件,采用可編程DSP芯片ADSP?BF537作為優(yōu)秀處理芯片,進(jìn)行學(xué)生考試自動監(jiān)考系統(tǒng)的電路設(shè)計,主要包括了A/D電路、時鐘電路、視頻幀循環(huán)糾錯編碼電路、程序加載電路和輸出接口電路等,分別設(shè)計描述如下:
(1) A/D電路。學(xué)生考試監(jiān)考系統(tǒng)的A/D電路是實現(xiàn)對輸入視頻采集信息的數(shù)/模轉(zhuǎn)換,提供給計算機和DSP芯片可識別的原始計算機視覺信息,結(jié)合視頻幀循環(huán)糾錯編碼方法進(jìn)行可視化校對和視頻編碼。外部I/O設(shè)備包括A/D轉(zhuǎn)換器AD7864兩片,A/D電路的分辨率為12位,最大采樣頻率25 kHz,采用AD7864(以下簡稱7864)作為A/D芯片,它是4通道輸入、轉(zhuǎn)換速度1.65 μs的高性能AD芯片,自動監(jiān)考系統(tǒng)的A/D輸入電壓滿足:
采樣通道數(shù)由DSP數(shù)據(jù)總線dspD[3:0]控制[3],A4~A0和譯碼,利用信號作讀數(shù)標(biāo)志信號,得到A/D電路的接口硬件設(shè)計圖如圖1所示。
考慮到系統(tǒng)處理視頻傳輸信息的時間和讀數(shù)匹配問題,在進(jìn)行A/D設(shè)計中,需要考慮7864模擬輸入/輸出對應(yīng)碼表,見表1。
(2) 時鐘電路。時鐘電路執(zhí)行學(xué)生考試自動監(jiān)考系統(tǒng)的時鐘中斷控制功能[4],采用5409A 作為自動監(jiān)考系統(tǒng)的時鐘中斷的優(yōu)秀控制芯片,5409A有3個多通道緩沖串口McBSPs,提供串行A/D、D/A 設(shè)備以及其他的串行器件直接接口,本地總線支持復(fù)用/非復(fù)用的 32 位地址/數(shù)據(jù),包括 PCI 總線操作和LOCAL總線操作,PC9054 內(nèi)部CI9054的LOCAL 總線與PCI總線通過異步操作實現(xiàn)兩個 DMA數(shù)據(jù)的串行接口輸入和輸出。時鐘電路的引腳設(shè)計如圖2所示。
(3) 視頻幀循環(huán)糾錯編碼電路。視頻幀循環(huán)糾錯編碼電路是整個系統(tǒng)設(shè)計的優(yōu)秀模塊,視頻幀循環(huán)糾錯編碼通過Emulator由JTAG(Joint Test Action Group)口下載到DSP中運行,在IEEE 1149.1標(biāo)準(zhǔn)協(xié)議下進(jìn)行 5409A芯片外圍器件的操作測試,芯片采用4通道高性能運放,帶寬為10 MHz。使用ADUM1201進(jìn)行幀同步信號設(shè)計[5],選擇Motorola 公司高性能 MPC850/86作為自動監(jiān)考系統(tǒng)的三維特征分析模塊,從外部16位存儲器讀取監(jiān)測視頻圖像的編碼特征,引出雙排的14腳插針外接上拉或下拉電阻,選擇引腳、時鐘信號輸入引腳,數(shù)據(jù)總線LD 9054與應(yīng)用電路連接,以串行E2PROM的配置電路作為I/O 初始化控制寄存器模塊單元,直接從地址0x20000000執(zhí)行16位打包模式實現(xiàn)視頻糾錯編碼,得到視頻幀循環(huán)糾錯編碼電路設(shè)計如圖3所示。
(4) 程序加載電路。選擇Motorola 公司高性能 MPC850/86作為學(xué)生考試自動監(jiān)考的可視化校驗視覺分析的程序加載電路的優(yōu)秀處理芯片。在程序加載電路中,采用可編程邏輯芯片PLC進(jìn)行圖像信息分析,在程序加載中,從外部16位存儲器直接執(zhí)行16位打包模式,引導(dǎo)ROM配置異步存儲器空間,通過連續(xù)讀取0x00字節(jié)的個數(shù)來確定學(xué)生考試自動監(jiān)考系統(tǒng)的SPI存儲器的片選[6],程序加載電路設(shè)計如圖4所示。
圖4中,在VCC和地之間并聯(lián)1個電容,滿足程序加載電路的可編程的硬件寫保護(hù)和片內(nèi)的偶然性的寫保護(hù)功能。
(5) 輸出接口電路。輸出接口電路設(shè)計中,通過JTAG接口訪問CPU的內(nèi)部寄存器,通過串行E2PROM進(jìn)行配置校驗。使用JTAG仿真器執(zhí)行12通道DMA異步串行口設(shè)計,采用分立元件構(gòu)成串口復(fù)位電路,降低DSP的能耗。開關(guān)頻率也可在0~1間調(diào)節(jié),內(nèi)核電壓在0.8~1.2 V間調(diào)整,內(nèi)核電源通過10 和0.1 電容濾波,以減少電源噪聲。實時時鐘電源與I/O電源采取分別供電策略,綜上分析,得到輸出接口電路見圖5。
在上述進(jìn)行系統(tǒng)的硬件模塊化設(shè)計的基礎(chǔ)上,進(jìn)行系統(tǒng)集成設(shè)計與軟件開發(fā)。
2 實驗測試分析
對上述學(xué)生考試自動監(jiān)考系統(tǒng)進(jìn)行軟件開發(fā)和系統(tǒng)調(diào)試分析。件開發(fā)建立在CCS 2.20開發(fā)平臺下,借助于 LabWindows/CVI,C/C++開發(fā)計算機視覺下的圖像和視頻信息處理程序。根據(jù)編寫的PCI卡驅(qū)動程序進(jìn)行視頻信息采樣和監(jiān)考系統(tǒng)的原始數(shù)據(jù)采集,得到學(xué)生考試自動監(jiān)考的視頻采集分析界面如圖6所示。
從圖6可見,采用本文設(shè)計的考試自動監(jiān)考系統(tǒng),能有效實現(xiàn)計算機視覺下的監(jiān)考視頻信息傳輸。為了定量測試系統(tǒng)的性能,圖7給出了不同方法進(jìn)行監(jiān)考視覺分析的視頻丟包率對比結(jié)果,從圖7得知,該系統(tǒng)能有效降低監(jiān)考過程中的視頻丟包,從而提高監(jiān)考區(qū)域的視覺覆蓋度。
3 結(jié) 語
本文提出一種基于視頻幀循環(huán)糾錯編碼的計算機視覺自動監(jiān)考系統(tǒng)設(shè)計方法。系統(tǒng)設(shè)計分為硬件和軟件部分,首先進(jìn)行了學(xué)生考試自動監(jiān)考系統(tǒng)的總體設(shè)計構(gòu)架分析和功能指標(biāo)描述;然后以ADSP?BF537并行微處理芯片為優(yōu)秀進(jìn)行監(jiān)考系統(tǒng)的硬件設(shè)計,包括A/D電路、時鐘電路、視頻幀循環(huán)糾錯編碼電路、程序加載電路和輸出接口電路;最后在Visual DSP++集成開發(fā)環(huán)境中進(jìn)行自動監(jiān)考系統(tǒng)的軟件開發(fā)設(shè)計,結(jié)合視頻幀循環(huán)糾錯編碼進(jìn)行程序加載,實現(xiàn)計算機視覺下的自動監(jiān)考。實驗測試結(jié)果表明,該系統(tǒng)能有效降低監(jiān)考過程中的視頻丟包,提高了監(jiān)考區(qū)域的視覺覆蓋度,具有優(yōu)越性能。
摘 要 對基于計算機視覺的疲勞駕駛檢測領(lǐng)域的專利申請趨勢、專利申請產(chǎn)出國和申請人分布進(jìn)行了統(tǒng)計分析,重點針對基于人眼、基于人臉、基于嘴巴的疲勞駕駛檢測這三個技術(shù)分支的發(fā)展脈絡(luò)進(jìn)行了梳理,并對基于計算機視覺的疲勞駕駛檢測的發(fā)展趨勢進(jìn)行了分析。
關(guān)鍵詞 疲勞駕駛 人眼、人臉 嘴巴 專利
0引言
造成交通事故的原因25%-30%產(chǎn)生于疲勞駕駛,因此疲勞駕駛已成為誘發(fā)交通事故的重要因素。國內(nèi)外專家和學(xué)者針對疲勞駕駛的檢測開展了大量的研究工作,目前研究的重心主要集中在基于計算機視覺的疲勞駕駛檢測,因此對基于計算機視覺的疲勞駕駛檢測的相關(guān)專利進(jìn)行分析尤為必要。
1基于計算機視覺的疲勞駕駛檢測專利申請數(shù)據(jù)分析
1.1全球?qū)@暾埩口厔?
從圖1可以看出,基于計算機視覺的疲勞駕駛檢測專利申請量從1990-2001年間處于技術(shù)研發(fā)初期,專利申請量相對較少。從2002年開始該領(lǐng)域的專利申請量逐漸呈現(xiàn)持續(xù)增長趨勢,并在2014年達(dá)到最大值153件。由此可知,隨著疲勞駕駛的增多,人們對疲勞駕駛的檢測也越來越重視,相應(yīng)的研究也正不斷增加。基于此,在今后的一段時間內(nèi),相關(guān)的專利申請量有望繼續(xù)保持。
1.2專利申請產(chǎn)出地區(qū)分布
目前各領(lǐng)域的專利申請量主要集中在中國、美國、韓國、日本和歐洲,通過對該領(lǐng)域在中國、美國、韓國、日本和歐洲的專利申請量進(jìn)行統(tǒng)計分析發(fā)現(xiàn),中國的申請量以48%的占比雄居第一,其他幾個地區(qū)的申請量相差不大,具體如圖2所示。
1.3在華專利申請量變化趨勢
圖3為1990年至2014年基于計算機視覺的疲勞駕駛檢測在華的申請量變化趨勢圖,由該圖可以看出,1990-2002年是技術(shù)的萌芽期,在2003年以后申請量才呈現(xiàn)逐年增長的趨勢,并且在2012年-2014年將均維持在較高的申請量。因此,該領(lǐng)域國內(nèi)雖然起步較晚,但是最近幾年申請量相對其他地區(qū)卻具有壓制性的優(yōu)勢。
1.4在華主要申請人分析
圖4展示了在華主要申請人的申請量份額,主要以科研院所和大型汽車企業(yè)為主,其中吉利汽車公司以領(lǐng)先優(yōu)勢排名第一。
2主要技術(shù)分支的專利申請分析
基于計算機視覺的疲勞駕駛檢測的主要技術(shù)分支有:基于人眼的駕駛疲勞檢測、基于人臉的駕駛疲勞檢測、基于嘴巴的疲勞檢測。下面從三個技術(shù)分支的發(fā)展概況、三個技術(shù)分支的主要工作原理及重點專利等方面進(jìn)行分析。
2.1全球?qū)@暾堉饕夹g(shù)分支的申請量趨勢圖
由圖6可知,近年來基于人眼和人臉的駕駛疲勞檢測的申請量呈現(xiàn)較快增長,申請量也較基于嘴巴的疲勞檢測的申請量大,體現(xiàn)了該領(lǐng)域近年來的發(fā)展趨勢,并體現(xiàn)出基于人眼和人臉的駕駛疲勞檢測的技術(shù)分支發(fā)展已較為成熟。三個技術(shù)分支在2006年之前,申請量的差別不大且數(shù)量均較小,顯示出在2006年以前三個分支的區(qū)別并不明顯,發(fā)展也較為緩慢,這說明基于計算機視覺的疲勞駕駛檢測也是近10年才興起的一項技術(shù),它依賴于圖像處理技術(shù)的發(fā)展水平。
2.2在華專利申請主要技術(shù)分支的申請量趨勢圖
由圖7可知,三個技術(shù)分支在2006年以前均只有零星的申請量,這與該領(lǐng)域在全球的發(fā)展情況相符合,基于人眼的疲勞駕駛檢測在華申請量自2006年以來呈現(xiàn)穩(wěn)步增長,且近年來申請量最大?;谌四樀钠隈{駛檢測申請量雖小于基于人眼的疲勞駕駛檢測,但近年來的申請量也呈現(xiàn)出穩(wěn)步增長的勢頭。然而,基于嘴巴的疲勞駕駛檢測雖有增長趨勢,但申請量一直都較小。由此可知,在國內(nèi)疲勞駕駛的檢測主要是采用人眼檢測和人臉檢測,這兩個分支是國內(nèi)的研究的熱門,也是今后國內(nèi)在該領(lǐng)域的發(fā)展趨勢。
3結(jié)語
通過對基于計算機視覺的疲勞駕駛檢測專利的申請量的總體分析,以及基于人眼、基于人臉、基于嘴巴三個技術(shù)分支的申請量趨勢分析可知,基于計算機視覺的疲勞駕駛檢測在近10年取得了較快發(fā)展,這與計算機圖像處理技術(shù)的發(fā)展密不可分;同時,科研院所作為該領(lǐng)域研究的主體,應(yīng)加強與中小企業(yè)的合作。國內(nèi)疲勞駕駛的檢測研究主要集中在人眼檢測和人臉檢測,這兩個分支是國內(nèi)的研究的熱門,同時,基于人眼的疲勞檢測其發(fā)展方向明確,后續(xù)發(fā)展將集中在眼睛定位算法的研究上,并且定位精度將越來越高,越來越滿足實際的要求。
摘 要: 為了提高視頻圖像中手指特征識別的精度和速度,提出一種基于矩形模板的動態(tài)閾值算法。該算法采用矩形模板平滑圖像,用灰度閾值法提取目標(biāo)邊緣,實現(xiàn)對手指特征的準(zhǔn)確識別。Matlab仿真結(jié)果表明,該算法受環(huán)境噪聲影響較小,能清晰準(zhǔn)確地分割出手指邊緣。在FPGA平臺上設(shè)計了一套基于計算機視覺的手指特征識別系統(tǒng),并對該系統(tǒng)的實時性、手指識別精度等性能進(jìn)行了測試。測試結(jié)果表明,該系統(tǒng)的運行速度與攝像頭攝取圖像的速度基本同步,可滿足系統(tǒng)對實時性要求。系統(tǒng)對手指位置識別的坐標(biāo)偏差約為3個像素,基本滿足系統(tǒng)對識別精度的要求。
關(guān)鍵詞: 計算機視覺; 手指特征識別; 動態(tài)閾值算法; 矩形模版
S著科學(xué)技術(shù)的飛速發(fā)展,人與計算機之間的交互活動越來越密切,并逐漸成為人們?nèi)粘I畹闹匾M成部分。傳統(tǒng)觸摸屏是現(xiàn)階段一種最常見,也是最重要的人機交互方式,其是通過一種附加在顯示器表面的透明介質(zhì),依賴使用者的手指觸摸該介質(zhì)來實現(xiàn)對計算機的輸入控制[1?2]。目前,這種觸摸屏技術(shù)已經(jīng)相當(dāng)成熟,但是,技術(shù)上不容易做到大尺寸,且成本相對較高,也易于破損。為了突破傳統(tǒng)觸摸屏這種人機交互方式的局限,把任何成像平面變成可用手指進(jìn)行交互的系統(tǒng),本文提出了一種基于計算機視覺的手指特征識別算法,并在FPGA平臺上建立了一套基于計算機視覺的手指特征識別硬件系統(tǒng)。這種基于計算機視覺的手指特征識別方法可為基于視覺的人機互動提供一種新的技術(shù)解決途徑。其與傳統(tǒng)觸摸屏的區(qū)別在于,不需要在成像屏幕上安裝任何特殊介質(zhì),使用壽命得到大幅延長,應(yīng)用范圍有了很大擴展。
1 圖像采集平臺
本文所采用的圖像采集平臺如圖1所示,在任何與計算機連接的顯示設(shè)備(如投影屏幕、等離子電視等)的左上角、右上角安裝兩個攝像頭,通過這兩個攝像頭便可確定手指在屏幕上的二維坐標(biāo)信息(x1,x2)。然后,將此坐標(biāo)點傳至計算機,并與Windows系統(tǒng)的鼠標(biāo)程序關(guān)聯(lián)即可實現(xiàn)人機交互功能。圖2是圖像采集平臺的側(cè)視圖。其中虛線框表示攝像頭視野中系統(tǒng)需要處理的區(qū)域,即手指出現(xiàn)的區(qū)域。
2 手指特征識別算法及仿真
在系統(tǒng)實現(xiàn)過程中,如何從攝像頭所拍攝的畫面中準(zhǔn)確地識別并提取出手指信息是其難點之一。在目前的圖像處理技術(shù)中,用于識別背景圖案中目標(biāo)物體的算法很多,本文在分析基于色彩聚類的膚色識別算法的基礎(chǔ)上,結(jié)合課題特殊需求,提出一種基于矩形模板的動態(tài)閾值算法,并在Matlab中對上述算法的處理效果進(jìn)行了仿真。
從圖像采集平臺可以看出,本系統(tǒng)只關(guān)心距屏幕很近的小視野內(nèi)是否出現(xiàn)區(qū)別于背景的目標(biāo)物體。因此,只需從攝像頭拍攝的圖像當(dāng)中截取一部分,如圖3中的小矩形框所示。
2.1 基于色彩聚類的膚色識別算法
膚色是人體區(qū)別于其他物體的一個重要特征,人體膚色特征不受位置、角度、大小等因素影響,具有較強的穩(wěn)定性。因此,本文首先選定基于色彩聚類的膚色提取識別算法進(jìn)行研究。在色彩聚類方法中,Anil K.Jain的Cb,Cr橢圓聚類方法最為典型[3?4]。采用非線性分段膚色分割得到的膚色區(qū)域在Cb,Cr空間中近似于橢圓,如下:
由圖5可知,利用該算法分割手指信息的效果尚可,能從比較友好的環(huán)境中迅速準(zhǔn)確地識別出手指信息。圖6為利用橢圓聚類膚色分割算法對從圖像采集平臺讀取圖像的手指識別效果??梢姡撍惴ㄔ谄胀ōh(huán)境下對手指的識別效果良好。但當(dāng)屏幕上的顏色影響手指膚色時,該算法的識別能力就會有所降低??梢?,該算法對皮膚顏色的純度要求較高,適用范圍受限。圖7為屏幕出現(xiàn)大面積藍(lán)色時對手指識別造成的影響效果。
2.2 基于正方形模板的動態(tài)閾值算法
基于正方形模板的動態(tài)閾值算法,即采用灰度閾值法,用正方形模板平滑圖像[5?6]。圖8(a)是3×3模板動態(tài)閾值算法平滑圖像的過程。
應(yīng)用基于3×3模板的動態(tài)閾值算法對原圖4進(jìn)行邊緣提取的仿真效果如圖9(a)所示??梢?,應(yīng)用3×3模板可以提取出目標(biāo)物體的邊緣,但不夠清晰。雖然可以通過增大模板取得比較理想的效果(圖9(b)為采用基于101×101模板的動態(tài)閾值算法的處理效果),但會使計算量劇增,同時也縮小了模板所能完全覆蓋的范圍,使圖像邊緣產(chǎn)生無效的白色區(qū)域。
2.3 基于矩形模板的動態(tài)閾值算法
根據(jù)課題實際需要,即所要處理的目標(biāo)區(qū)域為長方形窄條區(qū)域(如圖3所示),本文提出一種基于矩形模板的動態(tài)閾值算法。該算法與基于正方形模板算法的區(qū)別在于,平滑圖像時所用的模板為窄條形,如3×5模板,3×15模板,3×41模板等。圖8(b)是3×9模板動態(tài)閾值算法平滑圖像的過程。
圖10給出了采用基于3×9模板、3×14模板、3×81模板、3×101模板動態(tài)閾值算法對原圖4進(jìn)行手部邊緣提取的仿真效果。由仿真效果可知,基于矩形模板的動態(tài)閾值算法在模板取值為3×9的情況下,便能夠清晰提取出目標(biāo)物體的邊緣。而且,隨著模板取值的增加,目標(biāo)物體邊緣的提取效果更加清晰準(zhǔn)確。與基于正方形模板的動態(tài)閾值算法相比,基于矩形模板的動態(tài)閾值算法計算量較小,節(jié)約了系統(tǒng)的計算資源。
3 基于FPGA的手指特征識別算法的系統(tǒng)測試
為了驗證本文所提出的基于矩形模板的動態(tài)閾值算法能否滿足屏幕交互系統(tǒng)的整體要求,本文通過編寫軟件程序在FPGA開發(fā)板上對這種算法進(jìn)行了硬件實現(xiàn)和系統(tǒng)測試。
3.1 硬件實現(xiàn)
本文所采用的硬件實現(xiàn)系統(tǒng)主要是基于美國Altera公司生產(chǎn)的型號為EFA?CY1C12的“紅色颶風(fēng)”(Red Cyclone)系列FPGA開發(fā)板,并另外集成了用Ommvison公司的型號為OV9655的CMOS數(shù)字?jǐn)z像頭,以及ISSI公司的型號為IS61LV25616AL的SRAM存儲器[7?10]。最終搭建的硬件系統(tǒng)如圖11所示。
3.2 系統(tǒng)測試
本文主要對系統(tǒng)的實時性、手指提取精度、資源占用情況等影響系統(tǒng)運行的重要技術(shù)指標(biāo)進(jìn)行了測試。
(1) 實時性
OV9655攝像頭在1 280×1 024分辨率下,能提供15 f/s的圖像采集速率,課題所設(shè)計的軟件程序可以在一幀圖像的處理時間內(nèi)完成了數(shù)據(jù)的采集、手指邊緣的識別等運算,實現(xiàn)了系統(tǒng)執(zhí)行速度與攝像頭拍攝速度的同步,達(dá)到了系統(tǒng)對實時性要求。
(2) 手指識別精度
由于課題在軟件設(shè)計過程中編入了圖像采集防抖動處理程序,提高了圖像采集的穩(wěn)定性,也提高了手指識別的精度。經(jīng)過測試,本系統(tǒng)得到的手指位置信息的坐標(biāo)偏差為3個像素,基本滿足大屏幕交互系統(tǒng)對識別精度的需求。
(3) 資源占用情況
從Quartus Ⅱ的編譯報告中可以看出,本系統(tǒng)的軟件運行已占用FPGA的9 702個邏輯單元,占邏輯單元總數(shù)的80%。可見,該硬件系統(tǒng)的FPGA運算資源基本能滿足系統(tǒng)的實際需要。
4 結(jié) 語
本文通過對基于矩形模板的動態(tài)閾值算法的研究和基于FPGA的手指特征識別硬件系統(tǒng)的實現(xiàn),建立了一套基于計算機視覺的手指特征識別系統(tǒng)。該算法受環(huán)境噪聲影響較小,能清晰準(zhǔn)確地分割出手指邊緣,且隨著矩形模版取值的增大,算法的識別效果會更加良好。該系統(tǒng)的實時性、手指識別精度及資源占用情況均可滿足系統(tǒng)要求。這種基于計算機視覺的手指識別方法成本低、靈活性好,為基于視覺的人機交互提供了一種新的技術(shù)途徑。
摘 要截至目前,運動目標(biāo)跟蹤已經(jīng)歷經(jīng)了幾十年的發(fā)展研究,其作為當(dāng)前社會一項至關(guān)重要的先進(jìn)技術(shù),對于人們的日常工作生活以及社會經(jīng)濟(jì)、軍事政治等其他各領(lǐng)域均有著積極的幫助作用。特別是在計算機視覺技術(shù)逐漸發(fā)展成熟的今天,運動目標(biāo)跟蹤與計算機視覺技術(shù)的融合程度也越來越高。基于此,本文將選擇當(dāng)前比較常見的一種目標(biāo)跟蹤算法即Kalman filter算法,并以運動的人臉作為跟蹤目標(biāo),著重圍繞基于計算機視覺的運動目標(biāo)跟蹤算法進(jìn)行簡要分析研究。
【關(guān)鍵詞】計算機視覺 運動目標(biāo) 跟蹤算法
在計算機等現(xiàn)代科學(xué)技術(shù)尚未出現(xiàn)以前,人們在獲取外界信息時往往主要依賴視覺,而在我國計算機技術(shù)水平不斷發(fā)展提升的背景之下,計算機視覺技術(shù)的出現(xiàn)使得人類肉眼視覺得到了進(jìn)一步的發(fā)展延伸,尤其是在各種傳感器技術(shù)的幫助之下,使得人們能夠?qū)Ρ3诌\動狀態(tài)的目標(biāo)進(jìn)行實時跟蹤,從而準(zhǔn)確掌握目標(biāo)的具體形態(tài)屬性。在此背景之下,本文將運動目標(biāo)設(shè)定為運動的人臉,通過探究基于計算機視覺的運動目標(biāo)跟蹤算法,希望能夠為相關(guān)研究人員提供相關(guān)參考和幫助。
1 Kalman filter目標(biāo)跟蹤算法的簡要概述
Kalman filter目標(biāo)跟蹤算法是當(dāng)前眾多跟蹤算法當(dāng)中使用范圍較廣、使用頻率比較集中的一種跟蹤算法,這一算法最早可以追溯至上個世紀(jì)六十年代,人們通過將濾波理論與狀態(tài)空間模型相集合,從而得到的一種遞推估計的算法也就是卡爾曼濾波理論。其通過利用上一時刻獲取的預(yù)估值以及當(dāng)下獲取的實際觀測值,在信號與噪聲狀態(tài)空間模型當(dāng)中不斷更新狀態(tài)變量,進(jìn)而順利完成估計預(yù)測并獲得當(dāng)前時刻估計預(yù)測值。經(jīng)過不斷的發(fā)展,在計算機圖像處理以及其他運動目標(biāo)跟蹤當(dāng)中經(jīng)常會使用Kalman filter算法。如果在k時刻系統(tǒng)下的狀態(tài)向量用xk表示,那么在t0時刻下初始化的狀態(tài)預(yù)測方程為;在tk時刻下更新系統(tǒng)狀態(tài)的具體方程為
,其中Hk、Zk分別表示測量矩陣m×n維以及轉(zhuǎn)移矩陣n×n維的狀態(tài)向量。但在跟蹤計算機視覺運動目標(biāo)譬如說視頻目標(biāo)時,由于相鄰的兩幀視頻圖像本身時間間隔非常短,因此目標(biāo)在這一時間內(nèi)難以發(fā)生明顯的運動狀態(tài)變化,此時我們可以通過將此間隔時間設(shè)定為單位時間,同時目標(biāo)在單位時間內(nèi)一直保持勻速運動狀態(tài),這時我們可以得到一個狀態(tài)轉(zhuǎn)移矩陣且
,定義系統(tǒng)觀測矩陣即為
,定義噪聲Wk以及Vk協(xié)方差矩陣則可以分別用
和表示。
如果在濾波器在經(jīng)過若干次卡爾曼濾波后仍然能夠恢復(fù)至原始狀態(tài),則其具有較好的穩(wěn)定性,但如果在進(jìn)行運動目標(biāo)跟蹤實驗的過程當(dāng)中,對于處于運動狀態(tài)的被跟蹤目標(biāo),一旦出現(xiàn)遮擋行為則將在第一時間內(nèi)暫停估計參數(shù),并將這一參數(shù)估計值直接代入到狀態(tài)方程當(dāng)中,使得運動目標(biāo)無論是否被遮擋均可以對其進(jìn)行精確跟蹤。
2 基于計算機視覺的運動目標(biāo)跟蹤算法
2.1 建立顏色概率模型
顏色囊括了諸多的信息量光柱點,尤其是在人類的視覺世界從本質(zhì)上來說也是一種用過感知自然界色彩以及明暗變化的世界,因此人們可以通過使用三基色原理獲得RGB顏色空間??紤]到顏色與計算機視覺場景當(dāng)中各個場景和目標(biāo)之間有著緊密的關(guān)系,同時不同于目標(biāo)的大小、形態(tài)等其他視覺特征,顏色特征鮮少會受到包括觀察視角等在內(nèi)各因素的干擾影響,從某種角度上來說基于顏色特征的運動目標(biāo)具有較好的穩(wěn)定性。為了能夠保障目標(biāo)跟蹤既穩(wěn)定又迅速,需要選擇合適的顏色特征,否則將極有可能導(dǎo)致出現(xiàn)跟蹤失敗。在這一環(huán)節(jié)當(dāng)中人們通常使用的是RGB顏色空間以及HSI顏色空間,但由于二者均具有一定的局限性,因此本文在對人臉特征尤其是顏色特征進(jìn)行選取時,選擇了rgI顏色直方圖的方法,在解決兩N顏色空間自身缺陷的同時,盡量避免目標(biāo)人臉運動位置以及尺寸等變化因素對目標(biāo)追蹤造成的干擾影響。在rgI顏色直方圖當(dāng)中其中R、G、B就是RGB顏色空間當(dāng)中的三原色,r、g、I有著相同的取值范圍即在0到1之間。保持間隔相等的情況下劃分L值即可得到rgI顏色直方圖。雖然rgI顏色直方圖與物體相對應(yīng),但如果目標(biāo)只是位置以及尺寸等出現(xiàn)變化,rgI顏色直方圖并不會受到任何實質(zhì)性影響,因此在理想情況下,利用rgI顏色直方圖能夠?qū)σ曨l圖像中不同運動位置以及不同尺寸的人臉進(jìn)行目標(biāo)追蹤。
2.2 跟蹤算法
運動目標(biāo)的不斷變化將會使得模板圖像隨之發(fā)生相應(yīng)變化,因此需要不斷更新模板圖像才能夠有效完成對運動目標(biāo)的連續(xù)跟蹤,本文在對運動目標(biāo)的實際運動范圍進(jìn)行預(yù)測過程中選擇使用卡爾曼濾波,之后利用rgI顏色直方圖在預(yù)測運動范圍之內(nèi)搜索和匹配相應(yīng)目標(biāo),從而通過此舉獲得與目標(biāo)模板有著最小歐式距離的區(qū)域,在此過程當(dāng)中存在一個特定閾值T,如果兩者的歐氏距離在進(jìn)行相減時差值沒有超過這個特定閾值,那么此時該區(qū)域就是運動目標(biāo)所在的實際位置,利用在這一區(qū)域當(dāng)中的rgI顏色直方圖并將其充當(dāng)下一幀運動目標(biāo)的匹配模板,在不斷重復(fù)的過程中模板能夠?qū)崿F(xiàn)不間斷地更新。由于相鄰的兩幀視頻圖像之間,時間間隔并不長,因此目標(biāo)人臉在極短的時間間隔當(dāng)中基本上不會出現(xiàn)突然變化,此時我們可以認(rèn)為運動目標(biāo)人臉的運動連續(xù)性比較強,此時利用公式
可以進(jìn)行歐式距離的計算并用以衡量匹配的模板。其中匹配區(qū)域和模板的rgI顏色直方圖分別用l和l'表示,而rgI顏色直方圖中的維數(shù)則用n進(jìn)行表示。根據(jù)相關(guān)視頻圖像顯示,通過不斷更新模板確實可以對目標(biāo)運動人臉進(jìn)行實時跟蹤顯示。
3 結(jié)束語
總而言之,本文通過選擇當(dāng)前比較常見的目標(biāo)跟蹤算法即Kalman filter算法,利用卡爾曼濾波以及rgI顏色直方圖完成對運動人臉的跟蹤。事實證明,Kalman filter算法確實能夠在對各目標(biāo)之間的干擾進(jìn)行明確區(qū)分的基礎(chǔ)之上,準(zhǔn)確描述運動人臉目標(biāo),從而較好地跟蹤運動目標(biāo),但由于人臉之間本身存在一定的相似性,因此本文只是對理想狀態(tài)下的運動人臉進(jìn)行跟蹤實驗,日后還需要對計算機視覺技術(shù)和Kalman filter算法進(jìn)行進(jìn)一步優(yōu)化以妥善解決多人臉目標(biāo)以及相似性問題。
作者單位
重慶電子工程職業(yè)學(xué)院軟件學(xué)院 重慶市 401331
摘要:計算機視覺在人工智能學(xué)科占據(jù)重要地位,為自主移動機器人視覺導(dǎo)航做了深厚的理論鋪墊?;谟嬎銠C視覺的自主導(dǎo)航與路徑規(guī)劃是自主移動機器人研究的關(guān)鍵技術(shù),計算機視覺室內(nèi)導(dǎo)航技術(shù)主要分為3類:第一類是環(huán)境地圖事先已知;第二類是同時定位與地圖構(gòu)建(simultaneouslocalization andmapping,SLAM);第三類是不依賴環(huán)境地圖。詳細(xì)闡述了每種導(dǎo)航模型和技術(shù)方法,探討了基于計算機視覺導(dǎo)航的最新技術(shù)進(jìn)展,總結(jié)了目前國內(nèi)外計算機視覺導(dǎo)航的研究進(jìn)展。
關(guān)鍵詞:計算機視覺;地圖匹配;SLAM;機器人導(dǎo)航;路徑規(guī)劃
1概述
計算機視覺在人工智能學(xué)科占據(jù)重要地位,為自主移動機器人視覺導(dǎo)航做了深厚的理論鋪墊。目前,機器人導(dǎo)航技術(shù)有很多種,傳感器導(dǎo)航技術(shù)如里程計、激光雷達(dá)、超聲波、紅外線、微波雷達(dá)、陀螺儀、指南針、速度、加速度計或觸覺等得到了普遍應(yīng)用,與上述非計算機視覺導(dǎo)航技術(shù)相比較,計算機視覺導(dǎo)航技術(shù)如人眼般具有靈敏度高且可捕獲的信息量大以及成本低等優(yōu)點。由于室內(nèi)相對室外空間比較狹小且內(nèi)部環(huán)境復(fù)雜,所以普通移動機器人在作業(yè)過程中,完成躲避眼前障礙物、自主導(dǎo)航以及為自身找出一條可行路徑等一系列操作會相對比較困難。計算機視覺導(dǎo)航技術(shù)可利用本身的攝像頭獲得室內(nèi)周圍的環(huán)境信息,實時對其周身的場景進(jìn)行快速反饋,對視野前方障礙物進(jìn)行快速識別和檢測,從而確定一條高效的可行的安全路徑。本文對計算機視覺導(dǎo)航技術(shù)進(jìn)行分類研究,主要分為3類:第一類是環(huán)境地圖事先已知,提前對外界環(huán)境特征進(jìn)行提取和處理,建立全局地圖,并將地圖信息存儲在機器人內(nèi)存數(shù)據(jù)庫中,在導(dǎo)航的時候?qū)崟r進(jìn)行地圖匹配;第二類是同時定位與地圖構(gòu)建,移動機器人在自身位置不確定的情況下根據(jù)自身的攝像頭獲取周圍未知環(huán)境信息,在作業(yè)時逐步構(gòu)建周圍的環(huán)境地圖,根據(jù)構(gòu)建的增量式地圖自主實時定位和導(dǎo)航;第三類是不依賴環(huán)境地圖,自主移動機器人不需要依賴任何的環(huán)境地圖,其在作業(yè)活動時的可行區(qū)域主要取決于攝像頭實時識別和檢測的環(huán)境相對信息。
2環(huán)境地圖的表示方法
目前,計算機視覺導(dǎo)航技術(shù)多采用柵格地圖、幾何地圖、拓?fù)涞貓D和混合地圖構(gòu)建環(huán)境地圖信息。
2.1柵格地圖
柵格地圖,將柵格圖像考慮為一矩形,均分為一系列柵格單元,將每個柵格單元賦予一個平均概率值,并利用傳感信息估計每個單元內(nèi)部內(nèi)存障礙物的概率。構(gòu)建柵格地圖的優(yōu)點是其地圖表達(dá)形式直觀,創(chuàng)建和維護(hù)比較容易;但當(dāng)劃分的柵格單元數(shù)量不斷增多時,實時性就會慢慢變差;當(dāng)劃分的柵格單元越大時,環(huán)境地圖的分辨率越低。
2.2幾何地圖
幾何地圖利用幾何特征如點、直線、平面等來構(gòu)成環(huán)境主要框架,需要知道這些特征在環(huán)境中信息的具體位置,所以幾何地圖通常使用其對應(yīng)的三維空間坐標(biāo)來表示。幾何地圖構(gòu)建過程相對簡單,保留了室內(nèi)環(huán)境的各種重要信息,是基于計算機視覺的定位與地圖構(gòu)建算法中最常用的一種表示方式。但是為了完成環(huán)境的建模需要標(biāo)記大量的特征,從而計算量也非常的大,降低了實時性,其重建的地圖也容易出現(xiàn)與全局不一致的情況。
2.3拓?fù)涞貓D
拓?fù)涞貓D用許多節(jié)點和連接這些節(jié)點的曲線來表示環(huán)境信息。其中,每個節(jié)點相對應(yīng)真實環(huán)境中的特征點(如門角、窗戶、椅子、桌子角及拐角等),而節(jié)點之間的曲線表示兩個節(jié)點對應(yīng)的地點是相聯(lián)通的。拓?fù)涞貓D把環(huán)境信息表上在一線圖上,不需要精確表示不同節(jié)點間的地理位置關(guān)系,圖像較為抽象,表示起來方便且簡單。機器人首先識別這些節(jié)點進(jìn)而根據(jù)識別的節(jié)點選擇節(jié)點與節(jié)點間的曲線作為可作業(yè)的路徑。
2.4混合地圖
混合地圖主要包括3種形式:柵格一幾何地圖、幾何一拓?fù)涞貓D以及柵格一拓?fù)涞貓D?;旌系貓D采用多種地圖表示,可結(jié)合多種地圖的優(yōu)勢,與單一的地圖表示相比更具有靈活性、準(zhǔn)確性和魯棒性,但其不同類別的地圖結(jié)合起來管理會比較復(fù)雜,難以協(xié)調(diào),增加了地圖構(gòu)建的難度。文獻(xiàn)針對室內(nèi)環(huán)境所建立的模型分為全局拓?fù)浜途植繋缀伪硎霾糠?,整體環(huán)境通過拓?fù)涔?jié)點串連起來,維護(hù)了整體環(huán)境表述的全局一致性;而以每個拓?fù)涔?jié)點為優(yōu)秀所采用的幾何表述則可確保局部精確定位的實現(xiàn),這樣建立的幾何一拓?fù)浠旌檄h(huán)境模型可將二者的優(yōu)勢都表現(xiàn)出來,使得移動機器人定位和地圖構(gòu)建同時進(jìn)行,實現(xiàn)容易。
3基于計算機視覺的室內(nèi)導(dǎo)航
基于計算機視覺的室內(nèi)導(dǎo)航技術(shù)可利用攝像頭捕獲機器人周圍環(huán)境的全部信息,對其周身的場景進(jìn)行反饋,對障礙物進(jìn)行快速識別和檢測,從而確定一條高效的可行的安全路徑。本文將計算機視覺室內(nèi)導(dǎo)航技術(shù)主要分為3類:第一類是環(huán)境地圖事先已知;第二類是定位與地圖構(gòu)建同時進(jìn)行;第三類是不依賴環(huán)境地圖。
3.1環(huán)境地圖事先已知
提前對外界環(huán)境特征進(jìn)行提取和處理,建立全局地圖,并將地圖信息存儲在機器人內(nèi)存數(shù)據(jù)庫中,在導(dǎo)航的時候?qū)崟r進(jìn)行地圖匹配,即預(yù)存環(huán)境地圖。在環(huán)境地圖事先已知的導(dǎo)航中,路標(biāo)信息保存在計算機內(nèi)存的數(shù)據(jù)庫中,視覺系統(tǒng)中心利用圖像特征直接或間接向移動機器人提供一系列路標(biāo)信息,一旦路標(biāo)被確定后,通過匹配觀察到的圖像和所期望圖像,機器人借助地圖實現(xiàn)自身精確定位和導(dǎo)航。該導(dǎo)航技術(shù)過程可分為以下步驟:
a)圖像獲?。簲z像頭獲取其周圍的視頻圖像;
b)路標(biāo)識別及檢測:利用相關(guān)圖像處理算法對圖像進(jìn)行一系列預(yù)處理如進(jìn)行邊緣檢測和提取、平滑、濾波、區(qū)域分割;
c)路標(biāo)匹配標(biāo)志:在觀察到的圖像和所期望圖像之間進(jìn)行匹配,搜索現(xiàn)有的路標(biāo)數(shù)據(jù)庫進(jìn)行標(biāo)志路標(biāo);
d)位置計算:當(dāng)有特征點進(jìn)行匹配時,視覺系統(tǒng)會根據(jù)數(shù)據(jù)庫中的路標(biāo)位置進(jìn)行自身精確定位和導(dǎo)航。
在基于計算機視覺的地圖匹配定位過程中,主要有2種地圖匹配較為典型。
①已知起點,已知地圖。這種條件下的定位稱為局部定位,采用的是一種相對定位的方法,如圖1所示為其位姿估計過程,這種情況目前導(dǎo)航技術(shù)研究得最多。
②不知起點,已知地圖。這種條件下的定位稱為全局定位。當(dāng)機器人需要重置時,通常使用這種定位方法來檢索機器人的當(dāng)前位置(即姿態(tài)初始化)。常用的輔助方法是在環(huán)境中添加一些人造信標(biāo),如無線收發(fā)器,幾何信標(biāo),條碼技術(shù),紅外或超聲波接收系統(tǒng)進(jìn)行位置識別,利用視覺系統(tǒng)識別自然標(biāo)志,自主定位。
3.2定位與地圖構(gòu)建同時進(jìn)行
不知起點,不知地圖。SLAM技術(shù)最早由Smith等人于1986年提出,移動機器人在自身位置不確定的情況下根據(jù)自身的攝像頭獲取周圍未知環(huán)境信息,在作業(yè)時逐步構(gòu)建周圍的環(huán)境地圖,根據(jù)構(gòu)建的增量式地圖自主實時定位和導(dǎo)航。在日后的導(dǎo)航研究中,混合地圖中的幾何一拓?fù)浠旌檄h(huán)境模型被得到廣泛應(yīng)用,主要用來解決SLAM問題。
2003年,在解決SLAM技術(shù)難題上,Arras等人采用基于Kalman濾波器和最鄰近(nearest neighbor)匹配策略的隨機地圖創(chuàng)建方法。下面是該算法步驟:
a)數(shù)據(jù)采集:首先初始化系統(tǒng),從攝像頭傳感器采集距離數(shù)據(jù);
b)狀態(tài)預(yù)測:視覺系統(tǒng)預(yù)測機器人運動狀態(tài),實時返回新位姿信息和協(xié)方差矩陣,預(yù)測地圖;
c)觀測:從原始捕獲的信息中提取主要特征信息并將此信息返回給局部地圖;
d)測量預(yù)測:預(yù)測機器人當(dāng)前位姿的全局地圖;
e)位置匹配:應(yīng)用最鄰近濾波器匹配局部地圖中的觀測點和預(yù)測點;
f)估計:使用擴展Kalman濾波器更新地圖;
g)創(chuàng)建:將非相關(guān)的觀測點加入地圖,對機器人返回增量式地圖;
h)輸出地圖。
制約機器人視覺系統(tǒng)性能的重要因素是信息實時處理的計算復(fù)雜度和處理效率,SLAM算法需要在地圖密度與計算效率之間取得權(quán)衡。
3.3無環(huán)境地圖
在這類系統(tǒng)中,機器人不需要依賴任何的環(huán)境地圖信息,機器人的活動取決于其當(dāng)時識別和提取出來的環(huán)境信息,這些環(huán)境信息可能是桌子、椅子和門等,不需要知道這些環(huán)境元素的絕對位置。無環(huán)境地圖的導(dǎo)航技術(shù)典型的技術(shù)有3大類:基于光流的導(dǎo)航技術(shù)、基于外觀信息的導(dǎo)航技術(shù)、基于目標(biāo)識別的導(dǎo)航技術(shù)和基于目標(biāo)跟蹤的導(dǎo)航技術(shù)。
3.3.1基于光流的導(dǎo)航技術(shù)
光流是三維空間運動物體在觀測成像面上的像素運動的瞬時速度,也是圖像亮度的運動信息描述。光流法計算最初是由Horn和Schunck于1981年提出的,其利用二維速度場與灰度,引入光流約束方程,得到光流計算的基本算法。光流計算基于物體移動的光學(xué)特性提出了2個假設(shè):①運動物體的灰度在很短的間隔時間內(nèi)保持不變;②給定鄰域內(nèi)的速度向量場變化是緩慢的。如Santos-Victor等人研發(fā)了一種基于光流的robee視覺系統(tǒng),該系統(tǒng)模擬了蜜蜂的視覺行為。在robee視覺系統(tǒng)中,使用單獨的雙目視覺方法來模擬蜜蜂的中心反射(Centering Reflex):當(dāng)機器人移動到走廊兩側(cè)的墻壁中心時,左眼捕獲場景的瞬時速度與右眼捕獲場景的瞬時速度是相同的,幾乎沒有差別,那么機器人就可以知道他們在走廊的中心。如果眼睛兩側(cè)的眼睛的瞬時變化速度不同,則機器人移動到較慢的速度。在自動機器人導(dǎo)航的實現(xiàn)中,基于這個想法是測量攝像機捕獲圖像場景瞬時速度差異。這種導(dǎo)航技術(shù)只能用于室內(nèi)單通道直走道導(dǎo)航,不能引導(dǎo)機器人改變方向,具有一定的局限性。
3.3.2基于外觀信息的導(dǎo)航技術(shù)
基于外觀的機器人導(dǎo)航方法,不需要構(gòu)建真實的地圖導(dǎo)航,機器人通過自身所攜帶的攝像頭和傳感器感知周圍目標(biāo)的外觀信息進(jìn)行自主定位和導(dǎo)航。其中,所述的外觀信息多為目標(biāo)信息的顏色、亮度、形狀、空間大小和物理紋路等。機器人在導(dǎo)航時存儲連續(xù)視頻幀的環(huán)境圖像信息,并將連續(xù)視頻幀與控制指令相關(guān)聯(lián),從而再執(zhí)行指令規(guī)劃有效路徑到達(dá)目的地。
3.3.3基于目標(biāo)識別導(dǎo)航技術(shù)
為了達(dá)到目標(biāo)點或是識別目標(biāo),機器人很多時候只能獲取少量的圖像信息。Kim等人提出了一種用符號代替導(dǎo)航各個位置的賦值方法。該賦值方法中,機器人執(zhí)行命令如“去窗邊”“去你后面的椅子旁”等。這樣,通過相關(guān)的符號命令,機器人自動識別并建立路標(biāo),通過符號指令到達(dá)目標(biāo)點。例如“去你后面的椅子旁”,這樣的命令就是告訴機器人路標(biāo)是椅子、路徑向后。該導(dǎo)航技術(shù)的難點在于目標(biāo)是否可以準(zhǔn)確實時識別路標(biāo)。第一,識別大量不同類別的物體,室內(nèi)環(huán)境有許多不同類別的物體,需要將它們組織到一個在給定的容易搜索圖像數(shù)據(jù)結(jié)構(gòu)中去,起到容易識別是用什么度量來區(qū)分物體;第二,識別大量不同背景下的物體,一個合適的物體表達(dá)式有助于將圖像組織成片斷,而這些片斷來自于物體的種類且與物體無關(guān)的;第三,在抽象層次上識別物體,機器人可以不需要在看到一個具體的杯子之前便能知道它是一個杯子,相關(guān)程序能夠類似的物體進(jìn)行識別和區(qū)分。
3.3.4基于目標(biāo)跟蹤的導(dǎo)航技術(shù)
基于目標(biāo)跟蹤的導(dǎo)航技術(shù),為機器人構(gòu)造一個虛擬地圖,機器人通過攝像頭獲取連續(xù)的視頻序列確定一個跟蹤的目標(biāo),為了達(dá)到對目標(biāo)的精確定位和實時跟蹤,可以利用粒子濾波算法對需要跟蹤的目標(biāo)進(jìn)行建模?;诹W訛V波的目標(biāo)跟蹤主要包含四個階段,分別是初始化目標(biāo)區(qū)域,概率轉(zhuǎn)移,目標(biāo)區(qū)域權(quán)重計算,目標(biāo)區(qū)域重采樣。在機器人導(dǎo)航之前,通過視頻序列的當(dāng)前幾幀標(biāo)注機器人所需要跟蹤的目標(biāo),在導(dǎo)航時,機器人通過連續(xù)的視頻幀感知周圍的待跟蹤目標(biāo),同時對所需要跟蹤的目標(biāo)散播粒子,當(dāng)獲取的視頻幀對目標(biāo)區(qū)域重采樣后足以讓機器人確定所需要跟蹤的目標(biāo)時,機器人通過確定的目標(biāo)為自己規(guī)劃最有效的路徑到達(dá)目的地。獲取視頻序列目標(biāo)跟蹤是算機視覺領(lǐng)域中的重要分支,它在工業(yè)生產(chǎn)、交通導(dǎo)航、國防建設(shè)、航空導(dǎo)航等各個領(lǐng)域有著廣泛的應(yīng)用。
4結(jié)論
本文對近三十年來基于計算機視覺的室內(nèi)自主式移動機器人導(dǎo)航技術(shù)進(jìn)行了詳細(xì)的分類介紹,對于移動機器人是否需要地圖匹配的導(dǎo)航系統(tǒng)進(jìn)行了詳細(xì)的綜述。目前,在做導(dǎo)航和面向任務(wù)的決策時,自主機器人尚未能夠準(zhǔn)確地綜合考慮真實環(huán)境空間中的各種不確定性,當(dāng)路徑前方突然出現(xiàn)動態(tài)場景變化、目標(biāo)運動、遮檔障礙物時便會顯得一無所措,無法及時把握室內(nèi)環(huán)境變化的動態(tài)信息進(jìn)行實時導(dǎo)航,而這將是未來計算機視覺研究的一大難點和熱點。所以,室內(nèi)自主移動機器人仍在發(fā)展中,還有很多的問題值得研究和探索,現(xiàn)有的機器人大多數(shù)都需要人為定期去進(jìn)行清理和維護(hù),直到今天還沒有產(chǎn)生一臺真正意義上完全自主的移動機器人。
摘要:隨著科技的不斷發(fā)展,計算機視覺技術(shù)的發(fā)展越來越迅速,它的研究和應(yīng)用范圍不斷的擴大,已經(jīng)涉及到制造業(yè)、農(nóng)業(yè)、醫(yī)療診斷以及軍事領(lǐng)域。本文通過對計算機視覺技術(shù)在圖書館工作應(yīng)用中的探討,了解計算機視覺技術(shù)在圖書館實行的效果。
關(guān)鍵詞:計算機;視覺技術(shù);圖書館;應(yīng)用探討
引言
俗話說“書是人類進(jìn)步的階梯”,各大高校以及各大城市都建有圖書館,圖書館可以滿足人們對各種知識的需求,因此對圖書館的管理工作也是十分重要。如今科技不斷的發(fā)展,計算機視覺技術(shù)被運用到圖書館管理中。計算機視覺是用攝影機和電腦來代替人眼進(jìn)行檢測、監(jiān)控、識別和測量等的機器視覺,它能夠?qū)κ占瘉淼膱D片和視頻進(jìn)行處理,然后獲得相應(yīng)的三維信息。計算機視覺是一門綜合性的學(xué)科也是一個富有挑戰(zhàn)性的領(lǐng)域,它已經(jīng)被應(yīng)用到各個領(lǐng)域中,它的重要性不言而喻。
一、計算機視覺技術(shù)的特點
(一)檢測范圍廣泛
人眼的檢測范圍畢竟有限,有些細(xì)微的方面人眼是檢測不到的,比如紅外線、超聲波等,但是計算機視覺技術(shù)卻是可以檢測到人眼所檢測不到的范圍。計算機視覺技術(shù)可以將紅外線和超聲波處理成圖像呈現(xiàn)出來,它的檢測范圍十分廣泛而且是不加選擇的進(jìn)行檢測,可以說它的使用大大拓展了人眼的視野。
(二)檢測安全可靠
我們都知道電子產(chǎn)品如果接觸使用必然是會受到一定輻射的,但是計算機視覺與以往的檢測機器不同,它是不需要與被測者進(jìn)行接觸的,觀測者和被測者都是十分安全不會受到絲毫損傷的,而且它在使用的過程中并不會像人眼一樣感到疲憊,它可以一直進(jìn)行高效率的工作,因此對其檢測結(jié)果也是十分的可靠的。
二、視覺技術(shù)在圖書館工作中的應(yīng)用分析
(一)圖書剔舊和修補
圖書館是人們知識的殿堂,是思想文化知識不斷擴展的地方,因此圖書館的剔舊是一項十分重要的工作。圖書館的空間畢竟有限,一些相對陳舊而利用率較低的參考文獻(xiàn)是需要不定期的進(jìn)行篩選的,這些資料通常都是表面發(fā)黃、布滿灰塵和封面破舊等,而圖書館的剔舊工作大多是由工作人員親自到書庫中進(jìn)行挑選,這樣不僅工作量大、耗時長還有可能會存在遺漏的現(xiàn)象,而且資料上的灰塵也會給工作人員的身體健康帶來影響。
圖書館會收藏一些珍貴的古籍和字畫,但是時間一長,受到溫度、濕度等的影響會造成古籍和字畫表面發(fā)黃、紙張變脆甚至?xí)霈F(xiàn)蟲眼,這時候就需要對古籍字畫進(jìn)行修補工作。這項工作大多由工作人員親力親為,會給工作人員帶來一定的健康影響,如果使用計算機視覺技術(shù)代替人們來進(jìn)行工作,會大大減少工作人員的工作強度,同時也保證了工作效率。
(二)管理職工人員
圖書館中職工人員的正常有序的工作是保證圖書館正常運行的關(guān)鍵之處,在進(jìn)行圖書館職工人員的管理上可以引用計算機視覺技術(shù)。以往的職工簽到可能會出現(xiàn)代簽現(xiàn)象,而計算機視覺技術(shù)可以采用圖像視覺處理技術(shù)對職員進(jìn)行磁卡、眼膜、人臉識別等進(jìn)行簽到,杜絕了以往簽到工作所存在的弊端。同時,在圖書館工作處理中,計算機視覺技術(shù)也可以幫助職工人員處理一些難題,讓圖書館工作能夠有序高效的進(jìn)行。
(三)監(jiān)控檢測系統(tǒng)
如今圖書館的書籍是完全向人們開放的,人們可以自由進(jìn)行借閱,以往的人工檢測會造成猜疑和尷尬,也會加大圖書館管理人員與讀者之間的磨擦。計算機視覺技術(shù)的使用可以全自動化進(jìn)行監(jiān)控和檢測,避免了以往人工監(jiān)測所出現(xiàn)的問題。圖書館的書籍借閱管理工作異常重要,計算機視覺技術(shù)可以全程自動化進(jìn)行高效工作,可以進(jìn)行無人看管檢測讀者進(jìn)出攜帶書籍文獻(xiàn)和借閱空間的監(jiān)控等,大大提高了工作效率,讓圖書館的借閱工作順利有序的進(jìn)行。
三、視覺技術(shù)在圖書館工作中的應(yīng)用問題的研究
(一)循序漸進(jìn)的結(jié)合
計算機視覺作為一個新興技術(shù),雖然已經(jīng)被運用到各個領(lǐng)域內(nèi),但是在引進(jìn)入圖書館的管理中,如果想要快速的取代傳統(tǒng)的管理模式,無論是工作人員還是工作理念都不可能及時接受這種改變的。新技術(shù)的融入必須要循序漸進(jìn),找到與傳統(tǒng)的管理模式的結(jié)合點,然后進(jìn)行慢慢磨合,達(dá)到與傳統(tǒng)相結(jié)合的效果,這樣人們才能夠接受一種新技術(shù)的使用,不僅提高了工作效率減輕了工作人員的工作負(fù)擔(dān),也能夠更好的發(fā)揮出計算機視覺技術(shù)的真正作用。
(二)提高專業(yè)人員的業(yè)務(wù)水平
新的技術(shù)需要新的業(yè)務(wù)水平來支持,如果沒有相應(yīng)的業(yè)務(wù)水平是沒有辦法發(fā)揮出新技術(shù)應(yīng)有的作用。計算機視覺技術(shù)通過計算機成像系統(tǒng)來代替人類的視覺感官,能夠自主適應(yīng)環(huán)境、自主工作的能力。計算機視覺技術(shù)在不斷的更新中,它的使用功能也是越來越多,操作方法越來越復(fù)雜,這時就需要圖書館的工作人員對計算機視覺技術(shù)有細(xì)的了解,能夠熟練操作和運用計算機視覺技術(shù)。圖書館管理階層應(yīng)該組織工作人員進(jìn)行培訓(xùn)工作,讓他們接收新的知識掌握新的技術(shù),不斷的提高圖書館工作人員的業(yè)務(wù)水平,才能夠保證圖書館工作高效進(jìn)行。
(三)讀者素質(zhì)和應(yīng)用手段的提高
現(xiàn)代化圖書館要想實現(xiàn)工作和服務(wù)的全面自動化,就需要有現(xiàn)代化技術(shù)的支持,計算機視覺技術(shù)的引用雖然是一個現(xiàn)代化技術(shù)的支持,但是如今僅停留在生物特征的識別領(lǐng)域。比如圖書館如今普遍有門禁系統(tǒng),這也僅停留在計數(shù)功能和監(jiān)控可沖消磁條的識別和認(rèn)定上,如果有些讀者素質(zhì)不高故意去掉這些生物識別,圖書館的門禁系統(tǒng)就沒有辦法阻止這些讀者的進(jìn)入進(jìn)出。因此,提高讀者的素質(zhì)和計算機視覺技術(shù)的應(yīng)用手段,才能夠保證計算機視覺技術(shù)在圖書館被廣泛的進(jìn)行使用。
結(jié)束語
計算機視覺技術(shù)作為新興的綜合性技術(shù),被運用到工業(yè)、農(nóng)業(yè)、醫(yī)學(xué)、軍事、體育等各個領(lǐng)域,它的出現(xiàn)代替了人類去完成不可能的工作,開拓了人類的視野,提高了工作效率和深度,讓人類從不適應(yīng)的工作環(huán)境中解放出來。計算機視覺被稱為自動化的眼睛,對周圍的空間物體有著傳感、抽象、判斷的能力,它能夠從根本上改變?nèi)藗兊乃季S方式。
雖然如今計算機視覺技術(shù)在圖書館的應(yīng)用中僅處于初始層面,但是每項新的技術(shù)的引用不都是循序漸進(jìn)需要一個過渡時段嗎?計算機視覺技術(shù)雖然進(jìn)入了瓶頸時期,但是相信在不斷的提高和完善下,一定會突破瓶頸期進(jìn)入到迅猛發(fā)展的時期。計算機視覺技術(shù)的提高,能夠讓圖書館更好的發(fā)揮其作用,讓人們能夠更快更方便的利用圖書館汲取不同的知識,同時也能夠加快學(xué)術(shù)的發(fā)展和社會的進(jìn)步。
摘 要近代測量使用的方法基本上人工測量,但人工測量無法一次性達(dá)到設(shè)計要求的精度,就需要進(jìn)行多次的測量再進(jìn)行手工計算,求取接近設(shè)計要求的數(shù)值。這樣做的弊端在于:需要大量的人力且無法精準(zhǔn)的達(dá)到設(shè)計要求精度,對于這種問題在現(xiàn)代測量中出現(xiàn)了計算機視覺精密測量,這種方法集快速、精準(zhǔn)、智能等優(yōu)勢于一體,在測量中受到了更多的追捧及廣泛的使用。
【關(guān)鍵詞】精密測量 計算機視覺圖像 關(guān)鍵技術(shù)
在現(xiàn)代城市的建設(shè)中離不開測量的運用,對于測量而言需要精確的數(shù)值來表達(dá)建筑物、地形地貌等特征及高度。在以往的測量中無法精準(zhǔn)的進(jìn)行計算及在施工中無法精準(zhǔn)的達(dá)到設(shè)計要求。本文就計算機視覺圖像精密測量進(jìn)行分析,并對其關(guān)鍵技術(shù)做以簡析。
1 概論
1.1 什么是計算機視覺圖像精密測量
計算機視覺精密測量從定義上來講是一種新型的、非接觸性測量。它是集計算機視覺技術(shù)、圖像處理技術(shù)及測量技術(shù)于一體的高精度測量技術(shù),且將光學(xué)測量的技術(shù)融入當(dāng)中。這樣讓它具備了快速、精準(zhǔn)、智能等方面的優(yōu)勢及特性。這種測量方法在現(xiàn)代測量中被廣泛使用。
1.2 計算機視覺圖像精密測量的工作原理
計算機視覺圖像精密測量的工作原理類似于測量儀器中的全站儀。它們具有相同的特點及特性,主要還是通過微電腦進(jìn)行快速的計算處理得到使用者需要的測量數(shù)據(jù)。其原理簡單分為以下幾步:
(1)對被測量物體進(jìn)行圖像掃描,在對圖像進(jìn)行掃描時需注意外借環(huán)境及光線因素,特別注意光線對于儀器掃描的影響。
(2)形成比例的原始圖,在對于物體進(jìn)行掃描后得到與現(xiàn)實原狀相同的圖像,在個步驟與相機的拍照原理幾乎相同。
(3)提取特征,通過微電子計算機對掃描形成的原始圖進(jìn)行特征的提取,在設(shè)置程序后,儀器會自動進(jìn)行相應(yīng)特征部分的關(guān)鍵提取。
(4)分類整理,對圖像特征進(jìn)行有效的分類整理,主要對于操作人員所需求的數(shù)據(jù)進(jìn)行整理分類。
(5)形成數(shù)據(jù)文件,在完成以上四個步驟后微計算機會對于整理分類出的特征進(jìn)行數(shù)據(jù)分析存儲。對于計算機視覺圖像精密測量的工作原理就進(jìn)行以上分析。
1.3 主要影響
從施工測量及測繪角度分析,對于計算機視覺圖像精密測量的影響在于環(huán)境的影響。其主要分為地形影響和氣候影響。地形影響對于計算機視覺圖像精密測量是有限的,基本對于計算機視覺圖像精密測量的影響不是很大,但還是存在一定的影響。主要體現(xiàn)在遮擋物對于掃描成像的影響,如果掃描成像質(zhì)量較差,會直接影響到對于特征物的提取及數(shù)據(jù)的準(zhǔn)確性。還存在氣候影響,氣候影響的因素主要在于大風(fēng)及光線影響。大風(fēng)對于掃描儀器的穩(wěn)定性具有一定的考驗,如有稍微抖動就會出現(xiàn)誤差不能準(zhǔn)確的進(jìn)行精密測量。光線的影響在于光照的強度上,主要還是表現(xiàn)在基礎(chǔ)的成像,成像結(jié)果會直接導(dǎo)致數(shù)據(jù)結(jié)果的準(zhǔn)確性。
2 計算機視覺圖像精密測量下的關(guān)鍵技術(shù)
計算機視覺圖像精密測量下的關(guān)鍵技術(shù)主要分為以下幾種:
2.1 自動進(jìn)行數(shù)據(jù)存儲
在對計算機視覺圖像精密測量的原理分析,參照計算機視覺圖像精密測量的工作原理,對設(shè)備的質(zhì)量要求很高,計算機視覺圖像精密測量儀器主要還是通過計算機來進(jìn)行數(shù)據(jù)的計算處理,如果遇到計算機系統(tǒng)老舊或處理數(shù)據(jù)量較大,會導(dǎo)致計算機系統(tǒng)崩潰,導(dǎo)致計算結(jié)果無法進(jìn)行正常的存儲。為了避免這種情況的發(fā)生,需要對于測量成果技術(shù)進(jìn)行有效的存儲。將測量數(shù)據(jù)成果存儲在固定、安全的存儲媒介中,保證數(shù)據(jù)的安全性。如果遇到計算機系統(tǒng)崩潰等無法正常運行的情況時,應(yīng)及時將數(shù)據(jù)進(jìn)行備份存儲,快速還原數(shù)據(jù)。在對于前期測量數(shù)據(jù)再次進(jìn)行測量或多次測量,系統(tǒng)會對于這些數(shù)據(jù)進(jìn)行統(tǒng)一對比,如果出現(xiàn)多次測量結(jié)果有所出入,系統(tǒng)會進(jìn)行提示。這樣就可以避免數(shù)據(jù)存在較大的誤差。
2.2 減小誤差概率
在進(jìn)行計算機視覺圖像精密測量時往往會出現(xiàn)誤差,而導(dǎo)致這些誤差的原因主要存在于操作人員與機器系統(tǒng)故障,在進(jìn)行操作前操作員應(yīng)對于儀器進(jìn)行系統(tǒng)性的檢查,再次使用儀器中的自檢系統(tǒng),保證儀器的硬件與軟件的正常運行,如果硬軟件出現(xiàn)問題會導(dǎo)致測量精度的誤差,從而影響工作的進(jìn)度。人員操作也會導(dǎo)致誤差,人員操作的誤差在某些方面來說是不可避免的。這主要是對操作人員工作的熟練程度的一種考驗,主要是對于儀器的架設(shè)及觀測的方式。減少人員操作中的誤差,就要做好人員的技術(shù)技能培訓(xùn)工作。讓操作人員有過硬過強的操作技術(shù),在這些基礎(chǔ)上再建立完善的體制制度。利用多方面進(jìn)行全面控制誤差。
2.3 方便便攜
在科學(xué)技術(shù)發(fā)展的今天我們在生活當(dāng)中運用到東西逐漸在形狀、外觀上發(fā)生巨大的變大。近年來,對于各種儀器設(shè)備的便攜性提出了很高的要求,在計算機視覺圖像精密測量中對設(shè)備的外形體積要求、系統(tǒng)要求更為重要,其主要在于人員方便攜帶可在大范圍及野外進(jìn)行測量,不受環(huán)境等特殊情況的限制。
3 計算機視覺圖像精密測量發(fā)展趨勢
目前我國國民經(jīng)濟(jì)快速發(fā)展,我們對于精密測量的要求越來越來高,特別是近年我國科技技術(shù)的快速發(fā)展及需要,很多工程及工業(yè)方面已經(jīng)超出我們所能測試的范圍。在這樣的前景下,我們對于計算機視覺圖像精密測量的發(fā)展趨勢進(jìn)行一個預(yù)估,其主要發(fā)展趨勢有以下幾方面:
3.1 測量精度
在我們?nèi)粘I钪?,我們常用的長度單位基本在毫米級別,但在現(xiàn)在生活中,毫米級別已經(jīng)不能滿足工業(yè)方面的要求,如航天航空方面。所以提高測量精度也是計算機視覺圖像精密測量發(fā)展趨勢的重要方向,主要在于提高測量精度,在向微米級及納米級別發(fā)展,同時提高成像圖像方面的分辨率,進(jìn)而達(dá)到我們預(yù)測的目的。
3.2 圖像技術(shù)
計算機的普遍對于各行各業(yè)的發(fā)展都具有時代性的意義,在計算機視覺圖像精密測量中運用圖像技術(shù)也是非常重要的,在提高圖像處理技術(shù)做以提高。同時工程方面遙感測量的技術(shù)也是對于精密測量的一種推廣。
4 結(jié)束語
在科技發(fā)展的現(xiàn)在,測量是生活中不可缺少的一部分,測量同時也影響著我們的衣食住行,在測量技術(shù)中加入計算機視覺圖像技術(shù)是對測量技術(shù)的一種革新。在融入這種技術(shù)后,我相信在未來的工業(yè)及航天事業(yè)中計算機視覺圖像技g能發(fā)揮出最大限度的作用,為改變?nèi)藗兊纳钭龀鼋艹龅呢暙I(xiàn)。
作者單位
常州信息職業(yè)技術(shù)學(xué)院 江蘇省常州市 213164
隨著計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,計算機已深入到社會的各個領(lǐng)域,并深刻的改變?nèi)藗兊墓ぷ鳌W(xué)習(xí)和生活方式。信息的獲取、分析、處理、、應(yīng)用能力已經(jīng)成為社會中人們的一個必備的技能。多媒體技術(shù)也在發(fā)生著日新月異的變化,包括這多媒體技術(shù)的基本概念、圖像、音頻、視頻、動畫的常用處理工具等。其中人臉檢測與識別技術(shù)在計算機視覺方面也是尤為重要的,人臉檢測與識別技術(shù)主要是用于身份信息的識別,也可以用來對個人的隱私信息通過識別來進(jìn)行保護(hù)。
誕生于20世紀(jì)40年代的電子計算機是人類最偉大的發(fā)明之一。并且一直以飛快的速度發(fā)展著。進(jìn)入21世紀(jì)的現(xiàn)代社會,計算機已經(jīng)進(jìn)入各個行業(yè),并成為各行業(yè)必不可少的工具。如今的計算機發(fā)展的更加智能化,就如今來說,人們最什么事情都非常重視信息,人類和社會的發(fā)展,時刻都離不開信息。計算機如今重視的方面就是對信息的閱讀和控制,人臉檢測與識別技術(shù)也是應(yīng)運而生。
人臉識別的論述
人臉識別是人類視覺中的一大特色,因為能對身邊的人進(jìn)行識別,才不會對身邊的信息進(jìn)行混淆,簡單來說,根據(jù)人臉可以對人的年齡,性別進(jìn)行初步判斷。隨著計算機技術(shù)的智能化,計算機業(yè)已經(jīng)通過視覺能進(jìn)行人臉的識別。其中在對人臉識別的同時進(jìn)行有關(guān)信息的收集、識別、提取、變換、存儲、傳遞、處理、檢索、檢測、分析和利用等技術(shù)。如今人臉識別已經(jīng)應(yīng)用于很多的領(lǐng)域,但是要人臉檢測與識別是需要基于本來已經(jīng)收集和整理的信息本庫才能進(jìn)行。再加上現(xiàn)在計算機技術(shù)雖然已經(jīng)接近成熟,然而在人臉識別方面的表情傳達(dá)出什么信息還是無從下手進(jìn)行編程和設(shè)計。所以,基于計算機視覺的人臉檢測與識別技術(shù)還是會有很廣的發(fā)展空間,再加上人臉識別還可以維護(hù)人們的財產(chǎn)安全和隱私保護(hù),必然會引起社會各界人士的廣泛關(guān)注。
從19世紀(jì)末開始就已經(jīng)有人對人臉識別進(jìn)行了研究,因為當(dāng)時沒有先進(jìn)的科學(xué)技術(shù)做后盾,所以經(jīng)過了數(shù)百年的研究仍然沒有什么顯著的進(jìn)展和成果。直到20世紀(jì)90年代人臉識別才成立了自己的學(xué)科,在加上當(dāng)時的科技發(fā)展水平已經(jīng)達(dá)到了不錯的水平,人臉識別這個學(xué)科得到了快速的發(fā)展。如今,我國的計算機技術(shù)也已經(jīng)居于世界的前列,我國也已經(jīng)擁有比較完善的一套東方面孔的人臉數(shù)據(jù)庫。
人臉識別在發(fā)展過程中大概經(jīng)歷了三個階段:第一階段就是對人臉特征進(jìn)行整理,整理出所需要的數(shù)據(jù)庫,并且應(yīng)用當(dāng)時的計算機技術(shù)做出一套質(zhì)量不錯的人臉灰度模型,這個階段的識別工作全部由操作人員來完成;第二階段比第一階段要先進(jìn),有了基礎(chǔ)人機互交,將人臉的特征經(jīng)過多維度的矢量在模型上表示出來,并也可以設(shè)計出一套人臉識別的系統(tǒng),這個階段的識別不再是僅僅依靠操作人員,而是操作者和計算機一起完成;第三個階段是計算機智能識別的最高峰,一切操作和識別都依靠機器全自動化進(jìn)行,在人臉識別過程中也不再是每臺計算機都需要完成一整套的工作,也實現(xiàn)了計算機與計算機之間的互聯(lián),多臺計算機一起完成人臉識別的過程,都人力也是一種解放。
積極踐行人臉檢測識別技術(shù)
人臉檢測識別技術(shù)是計算機實現(xiàn)智能化特征后的又一重要發(fā)展方向之一,它已經(jīng)在世界范圍內(nèi)得到了廣泛的普及與應(yīng)用。人們可以通過人臉識別來進(jìn)行定位,來起到保護(hù)人們財產(chǎn)安全的作用,通過人臉識別來抵制社會中的造假率,之前曾經(jīng)有一些不法分子利用假身份來做損害公共利益和侵犯人們隱私權(quán)的事情,有了人臉識別讓不法分子沒有可乘之機,也應(yīng)用人臉識別來對財務(wù)密碼進(jìn)行聯(lián)系,起到對人們的財產(chǎn)有絕對的保護(hù)作用,對社會的安定何嘗不是一項有意義的發(fā)明。
人臉識別一直是計算機智能化發(fā)展過程中的一個重要領(lǐng)域,因為人臉的識別與檢測是一個很難做到完善的項目,由于人類的面部表情豐富,要對人類的面部表情做出判斷和分析會存在一定的困難。再加上人臉識別的過程中,每個獨立存在的個體都有一張專屬于自己的臉。它的輪廓沒有明顯的特征界限,同時對眼、鼻子、嘴等器官在臉上的分布情況也沒有明確的界限,這就使得對人臉識別來進(jìn)行算法設(shè)計有一定的困難,所以只有通過輪廓特征來進(jìn)行初步的判斷,分辯出各種器官,再根據(jù)器官來完成人臉的分布情況設(shè)計灰度模型的完成工作。
隨著紅外光的可利用率提高,也應(yīng)用到了人臉識別的領(lǐng)域,在人臉識別過程中也加入不同光的效果來識別人臉,使得如今的人臉識別的準(zhǔn)確度有了明顯的提高。但是光的效果是不可控的,在環(huán)境不適宜和用戶不配合的情況下,利用紅外光技術(shù)來進(jìn)行人臉識別又會將準(zhǔn)確度拉到很低的成度。因此,在人臉檢測與識別方面仍然有一些尚未解決的問題,值得人們關(guān)注和探索。
科學(xué)的進(jìn)步、時代的進(jìn)步,必將給發(fā)展賦予新的內(nèi)容。這個社會已經(jīng)成為了一個信息化社會,信息化代表了一種信息技術(shù)被高度重視,信息資源被高度共享,從而使得人的智力和潛力以及社會物質(zhì)資源潛力被充分發(fā)揮。在這個信息化社會中最重要的就是信息。個人信息已經(jīng)成為在社會中必備的物質(zhì)。如此看來信息的保護(hù)也成為了發(fā)展的頭等大事,基于計算機視覺的人臉檢測與識別技術(shù)也有了發(fā)展的獨特性,它的獨特性由這個時代所決定。
人類正在進(jìn)入后信息時代,計算機越來越廣泛地進(jìn)入到幾乎所有的科技和生活領(lǐng)域?,F(xiàn)代計算機具有強大的功能和運行速度,但與人腦相比,其智能化程度仍有待提高。如何讓計算機具有類人腦的學(xué)習(xí)與分析能力,擁有“視覺”“聽覺”,并可通過“思考”與人類溝通交流,是當(dāng)今世界計算機視覺研究領(lǐng)域各國科學(xué)家不斷追求和探索的目標(biāo)。
計算機視覺是人工智能領(lǐng)域的優(yōu)秀之一,其研究的終極目標(biāo)是讓機器具有人一樣的視覺功能。西安交通大學(xué)電子與信息工程學(xué)院楊國安教授在計算機視覺領(lǐng)域沉心研究多年,為計算機視覺的發(fā)展提供了豐富的理論基礎(chǔ)。
“西安交通大學(xué)鄭南寧院士是圖像處理、計算機視覺和模式識別領(lǐng)域的國際知名專家,是他2001年把我從日本引進(jìn)回來的。”這是楊國安選擇計算機視覺和圖像處理領(lǐng)域的契機。在該領(lǐng)域,楊國安主要研究新型的小波變換、多尺度幾何分析和壓縮感知理論,對這些最前沿的理論進(jìn)一步地改進(jìn),以提高圖像分析與理解的能力、計算機視覺模型的精度、大數(shù)據(jù)的模式分類的效率以及互聯(lián)網(wǎng)圖像檢索的正確識別率。
留學(xué)回國后,楊國安在鄭南寧院士團(tuán)隊參與完成了多項國家項目,包括國家自然科學(xué)基金創(chuàng)新研究群體項目“智能化視覺信息處理理論與實現(xiàn)技術(shù)”,國家自然科學(xué)基金重點項目“高效可伸縮視頻編解碼基礎(chǔ)理論與方法研究”,國家重點基礎(chǔ)研究發(fā)展計劃項目“視覺信息環(huán)境感知與識別關(guān)鍵技術(shù)”,國家科技支撐計劃項目“數(shù)字媒體內(nèi)容互通共用關(guān)鍵技術(shù)”,國家高技術(shù)研究發(fā)展計劃項目“基于離散小波變換的JPEG2000圖像處理及場景數(shù)據(jù)實時傳輸”等。其中,在國家科技支撐計劃項目中,楊國安取得國家發(fā)明專利“一種分布式多格式數(shù)字視頻轉(zhuǎn)碼結(jié)構(gòu)設(shè)計方法”的正式授權(quán)。該項專利開發(fā)出了一種分布式多格式數(shù)字視頻轉(zhuǎn)碼結(jié)構(gòu)設(shè)計新方法:對源視頻文件解復(fù)用后將視頻進(jìn)行快速無縫分割,通過動態(tài)調(diào)度程序,將視頻片段以及音頻文件發(fā)送到各個轉(zhuǎn)碼計算機上進(jìn)行快速多格式轉(zhuǎn)碼,在輸入某一種格式的視頻后只需解碼一次,便能輸出多種格式的碼流,并且能對輸出碼流進(jìn)行很好的碼率控制,最后收集轉(zhuǎn)碼后的視頻片段進(jìn)行無縫拼接并與轉(zhuǎn)碼后的音頻文件復(fù)用。該項專利不僅改善了像素域級聯(lián)轉(zhuǎn)碼器的轉(zhuǎn)碼效率,也增強了視頻轉(zhuǎn)碼后的質(zhì)量,并在我國相關(guān)電視廠家得到實際應(yīng)用,取得了良好的社會和經(jīng)濟(jì)效益。
目前,罟安正在主持國家自然科學(xué)基金項目“基于生物視覺稀疏編碼特性和顯著性特征的多尺度幾何分析紋理模型研究”。他介紹說,今后的研究重點將是進(jìn)一步研究基于多尺度幾何分析和脈沖耦合神經(jīng)網(wǎng)絡(luò)的生物視覺模型,并將其應(yīng)用到大數(shù)據(jù)的模式識別以及互聯(lián)網(wǎng)圖像檢索上。
學(xué)術(shù)方面,楊國安有木哿Γ砥礪前行。他長期兼任IEEE Transactionson Signal ProcessingENeural Networks等世界頂級期刊的通信評審專家,并在IEEE,Elsevier和springer等知名期刊和國際會議上發(fā)表SCI和EI收錄論文30余篇,其中SCI收錄8篇,EI收錄21篇,取得國家專利2項,出版“十一五”至“十三五”規(guī)劃教材各1部,為碩士和博士研究生開設(shè)課程,培養(yǎng)碩士研究生和博士研究生30余名,2016年2月又培養(yǎng)出交通大學(xué)歷史上第一位日本博士留學(xué)生。
在科研的世界里,只有腳踏實地,持續(xù)奮斗與攀登,才可能收獲點點星光。在20余年的研究工作中,楊國安亦是如此勉勵自己,不斷創(chuàng)新,突破傳統(tǒng)。相信在未來,他一定能收獲一片屬于他的星空。