前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計(jì)算機(jī)立體視覺(jué)技術(shù)主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:雙目視覺(jué);匹配算法;計(jì)算機(jī)視覺(jué);立體匹配;相位一致性
1.計(jì)算機(jī)視覺(jué)系統(tǒng)分析研究
1.1計(jì)算機(jī)視覺(jué)技術(shù)及雙目立體視覺(jué)
計(jì)算機(jī)視覺(jué)是通過(guò)計(jì)算機(jī)技術(shù)實(shí)現(xiàn)對(duì)視覺(jué)信息處理的整個(gè)過(guò)程,是一門新的學(xué)科。視覺(jué)是人們認(rèn)知事物的重要途徑,視覺(jué)是人們對(duì)視覺(jué)信息獲取、處理和存儲(chǔ)的過(guò)程。隨著計(jì)算機(jī)技術(shù)的發(fā)展,信號(hào)處理技術(shù)的應(yīng)用,人們通過(guò)照相機(jī)來(lái)把實(shí)際的事物拍攝下來(lái)轉(zhuǎn)變?yōu)閿?shù)字信息,并通過(guò)計(jì)算機(jī)信號(hào)處理技術(shù)隊(duì)獲取的視覺(jué)信號(hào)進(jìn)行處理。計(jì)算機(jī)視覺(jué)技術(shù)對(duì)圖像的處理分為獲取圖像、特征抽象選取、事物識(shí)別及分類和對(duì)三維信息的理解。獲取圖像主要是通過(guò)攝像機(jī)和紅外線等技術(shù)對(duì)周圍視覺(jué)事物進(jìn)行獲取,并通過(guò)計(jì)算得到和真實(shí)事物相應(yīng)的二維圖像,二維圖像主要是數(shù)字圖像。計(jì)算機(jī)視覺(jué)系統(tǒng)的最基本的功能是數(shù)字圖像的獲取??梢钥闯鲇?jì)算機(jī)視覺(jué)研究最基本內(nèi)容是三維場(chǎng)景距離信息的獲取。在計(jì)算機(jī)被動(dòng)測(cè)量距離方法中,有一種重要的距離感知技術(shù)叫作雙目立體視覺(jué)。雙目立體視覺(jué)技術(shù)是其他計(jì)算機(jī)視覺(jué)技術(shù)無(wú)法取代的一種技術(shù),對(duì)雙目立體視覺(jué)技術(shù)的研究在計(jì)算機(jī)視覺(jué)技術(shù)和工程應(yīng)用方面都是非常重要的。
1.2計(jì)算機(jī)視覺(jué)理論框架
第一個(gè)視覺(jué)系統(tǒng)理論框架的提出是以信息處理為基礎(chǔ),綜合了圖像處理和神經(jīng)生理學(xué)等研究?jī)?nèi)容而建立的。這個(gè)視覺(jué)系統(tǒng)理論框架是計(jì)算機(jī)視覺(jué)系統(tǒng)的基本框架,與計(jì)算機(jī)視覺(jué)技術(shù)有著密切的關(guān)系。視覺(jué)系統(tǒng)的研究是以信息處理為基礎(chǔ)的,從理論層次、算法層次和硬件層次3個(gè)層次進(jìn)行研究。計(jì)算機(jī)理論層次主要是表達(dá)系統(tǒng)各個(gè)部分計(jì)算的目的和方法,對(duì)視覺(jué)系統(tǒng)的輸入和輸出進(jìn)行規(guī)定,輸入作為二維圖像,輸出是以二維圖像為基礎(chǔ)建立起來(lái)的三維物體,視覺(jué)系統(tǒng)的目的就是對(duì)三維物體進(jìn)行分析和識(shí)別,通過(guò)計(jì)算對(duì)二維物置和形狀進(jìn)行重新建立。算法層次對(duì)計(jì)算機(jī)規(guī)定的目標(biāo)進(jìn)行計(jì)算,算法和計(jì)算機(jī)表達(dá)有關(guān),不同的表達(dá)可以通過(guò)不同的算法進(jìn)行實(shí)現(xiàn),在計(jì)算機(jī)理論的層次上,算法和表達(dá)比計(jì)算機(jī)理論的層次要低。硬件層次是通過(guò)硬件來(lái)實(shí)現(xiàn)算法的一種表達(dá)方法。計(jì)算機(jī)理論層次在計(jì)算機(jī)信息處理中時(shí)最高的層次,取決于計(jì)算機(jī)的本質(zhì)是解決計(jì)算機(jī)的自身問(wèn)題,不是取決于計(jì)算問(wèn)題的計(jì)算機(jī)硬件。要更好地對(duì)計(jì)算機(jī)系統(tǒng)和框架進(jìn)行理解最好的方法就是要區(qū)分3個(gè)不同的層次,計(jì)算機(jī)理論的含義和主要解決的問(wèn)題是計(jì)算機(jī)的目的,表達(dá)算法含義和主要解決的問(wèn)題是實(shí)現(xiàn)計(jì)算理論的方法和輸入輸出的表達(dá),硬件的實(shí)現(xiàn)的含義和主要解決的問(wèn)題是如何在物理上對(duì)表達(dá)和算法進(jìn)行實(shí)現(xiàn)。計(jì)算機(jī)視覺(jué)處理的可以分為3個(gè)階段,對(duì)視覺(jué)信息的處理過(guò)程從最初的二維圖像的原始數(shù)據(jù),到三維環(huán)境的表達(dá)。第一階段基元圖的構(gòu)成,基元圖是用來(lái)表示二維圖像中的重要信息,主要是圖像中亮度變化位置及其幾何分布和組織結(jié)構(gòu),圖像中每點(diǎn)的亮度值包括零交叉、斑點(diǎn)、端點(diǎn)和不連續(xù)點(diǎn)、邊緣等。第二階段2.5維圖描述,在以觀測(cè)者為中心的坐標(biāo)中,表示可見表面的方向、深度值和不連續(xù)的輪廓,基元是局部表面朝向離觀測(cè)者的距離深度上的不連續(xù)點(diǎn)表面朝向的不連續(xù)點(diǎn)。第三階段三維模型表示,在以物體為中心的坐標(biāo)系中,有由體積單元和面積單元構(gòu)成的模塊化多層次表示,描述形狀及其空間組織形式,分層次組成若干三維模型,每個(gè)三維模型都是在幾個(gè)軸線空間的基礎(chǔ)上構(gòu)成的,所有體積單元或面積形狀基元都附著在軸線上。視覺(jué)理論框架圖如圖1所示。
2.基于計(jì)算機(jī)的視覺(jué)立體匹配算法研究
視覺(jué)立體匹配算法是基于人類視覺(jué)系統(tǒng)的一種計(jì)算機(jī)算法。立體匹配算法作為計(jì)算機(jī)立體視覺(jué)問(wèn)題研究的重點(diǎn),快速地實(shí)現(xiàn)圖像對(duì)應(yīng)點(diǎn)的匹配來(lái)獲得視差圖是當(dāng)今研究的熱點(diǎn)問(wèn)題。立體視覺(jué)匹配算法根據(jù)基元匹配的不同可以分為相位匹配、區(qū)域匹配和特征匹配3種,其中區(qū)域匹配算法可以減少計(jì)算負(fù)擔(dān),區(qū)域匹配算法實(shí)時(shí)性高,應(yīng)用前景廣闊。計(jì)算機(jī)立體視覺(jué)通過(guò)對(duì)人的雙眼進(jìn)行模仿,在雙眼的立體感知中獲得信息,從攝像機(jī)拍攝的圖像中獲取物體的三維深度信息,這就是深度圖的獲取,把深度圖經(jīng)過(guò)處理得到三維空間信息數(shù)據(jù),二維圖像到三維空間實(shí)現(xiàn)轉(zhuǎn)換。深度的獲取在雙目立體成像視覺(jué)系統(tǒng)中分為兩步,首先在雙目立體圖像與圖像之間建立點(diǎn)對(duì)點(diǎn)的對(duì)象關(guān)系,雙目立體視覺(jué)算法研究的重點(diǎn)問(wèn)題是解決對(duì)應(yīng)點(diǎn)之間的匹配問(wèn)題。其次以對(duì)應(yīng)點(diǎn)之間的視差為依據(jù)對(duì)深度值進(jìn)行計(jì)算。雙目成像是獲取同一場(chǎng)景中兩幅不同的圖像,兩個(gè)單目成像模型構(gòu)成一個(gè)雙目成像模型。雙目成像示意圖如圖2所示。系統(tǒng)的基線B是兩個(gè)鏡頭中心的連接線,空間點(diǎn)w(z,y,z)作為世界坐標(biāo)的值由(x1,y1)與(x2,y2)進(jìn)行確定,如果攝像機(jī)的坐標(biāo)位置和空間點(diǎn)w世界坐標(biāo)的位置重合,圖像平面和世界坐標(biāo)軸xY的平面就是平行的。如果兩個(gè)攝像機(jī)在坐標(biāo)系統(tǒng)中的原點(diǎn)不同但是它們的光軸平行,那么雙目成像計(jì)算人們可以看圖3所示,圖3表示的是兩個(gè)攝像頭連線在平臺(tái)xY的示意。
立體視覺(jué)的成像過(guò)程是成像的逆過(guò)程,具有一定的不確定性。大量的數(shù)據(jù)信息在從三維影像向二維圖像進(jìn)行投影的過(guò)程會(huì)出現(xiàn)丟失的現(xiàn)象,所以視覺(jué)系統(tǒng)要通過(guò)自然的約束條件才能保證獲取正確的解。這些約束條件在減少匹配的計(jì)算量方面可以提供有利的幫助。針對(duì)基于區(qū)域匹配快速算法,還可以應(yīng)用基于視差梯度的匹配算法,這種匹配算法應(yīng)用較大的搜索范圍在邊緣的特征點(diǎn)上進(jìn)行搜索,采用視差梯度在非邊緣區(qū)減少搜索范圍。應(yīng)用計(jì)算機(jī)視覺(jué)立體匹配算法可以減少成像匹配時(shí)間,大大提高了工作效率。計(jì)算機(jī)立體匹配算法征點(diǎn)的提取是算法的關(guān)鍵問(wèn)題,今后的研究方向重點(diǎn)是對(duì)有效特征點(diǎn)提取方法的研究。
關(guān)鍵詞:雙目立體視覺(jué)計(jì)算機(jī)視覺(jué)立體匹配攝像機(jī)標(biāo)定特征提取
雙目立體視覺(jué)是計(jì)算機(jī)視覺(jué)的一個(gè)重要分支,即由不同位置的兩臺(tái)或者一臺(tái)攝像機(jī)(CCD)經(jīng)過(guò)移動(dòng)或旋轉(zhuǎn)拍攝同一幅場(chǎng)景,通過(guò)計(jì)算空間點(diǎn)在兩幅國(guó)像中的視差,獲得該點(diǎn)的三維坐標(biāo)值。80年代美國(guó)麻省理工學(xué)院人工智能實(shí)驗(yàn)室的Marr提出了一種視覺(jué)計(jì)算理論并應(yīng)用在雙睛匹配上,使兩張有視差的平面圖產(chǎn)生在深度的立體圖形,奠定了雙目立體視覺(jué)發(fā)展理論基礎(chǔ)。相比其他類的體視方法,如透鏡板三維成像、投影式三維顯示、全息照相術(shù)等,雙目本視直接模擬人類雙眼處理景物的方式,可靠簡(jiǎn)便,在許多領(lǐng)域均極具應(yīng)用價(jià)值,如微操作系統(tǒng)的位姿檢測(cè)與控制、機(jī)器人導(dǎo)航與航測(cè)、三維測(cè)量學(xué)及虛擬現(xiàn)實(shí)等。
1雙目體視的技術(shù)特點(diǎn)
雙目標(biāo)視技術(shù)的實(shí)現(xiàn)可分為以下步驟:圖像獲取、攝像機(jī)標(biāo)定、特征提取、圖像匹配和三維重建,下面依次介紹各個(gè)步驟的實(shí)現(xiàn)方法和技術(shù)特點(diǎn)。
1.1圖像獲取
雙目體視的圖像獲取是由不同位置的兩臺(tái)或者一臺(tái)攝像機(jī)(CCD)經(jīng)過(guò)移動(dòng)或旋轉(zhuǎn)拍攝同一幅場(chǎng)景,獲取立體圖像對(duì)。其針孔模型如圖1。假定攝像機(jī)C1與C2的角距和內(nèi)部參數(shù)都相等,兩攝像機(jī)的光軸互相平行,二維成像平面X1O1Y1和X2O2Y2重合,P1與P2分別是空間點(diǎn)P在C1與C2上的成像點(diǎn)。但一般情況下,針孔模型兩個(gè)攝像機(jī)的內(nèi)部參數(shù)不可能完成相同,攝像機(jī)安裝時(shí)無(wú)法看到光軸和成像平面,故實(shí)際中難以應(yīng)用。
上海交大在理論上對(duì)會(huì)攝式雙目體視系統(tǒng)的測(cè)量精度與系統(tǒng)結(jié)構(gòu)參數(shù)之間的關(guān)系作了詳盡分析,并通過(guò)試驗(yàn)指出,對(duì)某一特定點(diǎn)進(jìn)行三角測(cè)量。該點(diǎn)測(cè)量誤差與兩CCD光軸夾角是一復(fù)雜的函數(shù)關(guān)系;若兩攝像頭光軸夾角一定,則被測(cè)坐標(biāo)與攝像頭坐標(biāo)系之間距離越大,測(cè)量得到點(diǎn)距離的誤差就越大。在滿足測(cè)量范圍的前提下,應(yīng)選擇兩CCD之間夾角在50℃~80℃之間。
1.2攝像機(jī)的標(biāo)定
對(duì)雙目體視而言,CCD攝像機(jī)、數(shù)碼相機(jī)是利用計(jì)算機(jī)技術(shù)對(duì)物理世界進(jìn)行重建前的基本測(cè)量工具,對(duì)它們的標(biāo)定是實(shí)現(xiàn)立體視覺(jué)基本而又關(guān)鍵的一步。通常先采用單攝像機(jī)的標(biāo)定方法,分別得到兩個(gè)攝像機(jī)的內(nèi)、外參數(shù);再通過(guò)同一世界坐標(biāo)中的一組定標(biāo)點(diǎn)來(lái)建立兩個(gè)攝像機(jī)之間的位置關(guān)系。目前常用的單攝像機(jī)標(biāo)定方法主要有:
(1)攝影測(cè)量學(xué)的傳統(tǒng)設(shè)備標(biāo)定法。利用至少17個(gè)參數(shù)描述攝像機(jī)與三維物體空間的結(jié)束關(guān)系,計(jì)算量非常大。
(2)直接線性變換性。涉及的參數(shù)少、便于計(jì)算。
(3)透視變換短陣法。從透視變換的角度來(lái)建立攝像機(jī)的成像模型,無(wú)需初始值,可進(jìn)行實(shí)時(shí)計(jì)算。
(4)相機(jī)標(biāo)定的兩步法。首先采用透視短陣變換的方法求解線性系統(tǒng)的攝像機(jī)參數(shù),再以求得的參數(shù)為初始值,考慮畸變因素,利用最優(yōu)化方法求得非線性解,標(biāo)定精度較高。
(5)雙平面標(biāo)定法。
在雙攝像機(jī)標(biāo)定中,需要精確的外部參數(shù)。由于結(jié)構(gòu)配置很難準(zhǔn)確,兩個(gè)攝像機(jī)的距離和視角受到限制,一般都需要至少6個(gè)以上(建議取10個(gè)以上)的已知世界坐標(biāo)點(diǎn),才能得到比較滿意的參數(shù)矩陣,所以實(shí)際測(cè)量過(guò)程不但復(fù)雜,而且效果并不一定理想,大大地限制了其應(yīng)用范圍。此外雙攝像機(jī)標(biāo)定還需考慮鏡頭的非線性校正、測(cè)量范圍和精度的問(wèn)題,目前戶外的應(yīng)用還有少。
上海大學(xué)通信與信息工程學(xué)院提出了基于神經(jīng)網(wǎng)絡(luò)的雙目立體視覺(jué)攝像機(jī)標(biāo)定方法。首先對(duì)攝像機(jī)進(jìn)行線性標(biāo)定,然后通過(guò)網(wǎng)絡(luò)訓(xùn)練建立起三維空間點(diǎn)位置補(bǔ)償?shù)亩鄬忧梆伾窠?jīng)網(wǎng)絡(luò)模型。此方法對(duì)雙目立體視覺(jué)攝像機(jī)的標(biāo)定具有較好的通用性,但是精確測(cè)量控制點(diǎn)的世界坐標(biāo)和圖像坐標(biāo)是一項(xiàng)嚴(yán)格的工作。因此神經(jīng)網(wǎng)絡(luò)中訓(xùn)練樣本集的獲得非常困難。
1.3特征點(diǎn)提取
立體像對(duì)中需要撮的特征點(diǎn)應(yīng)滿足以下要求:與傳感器類型及抽取特征所用技術(shù)等相適應(yīng);具有足夠的魯棒性和一致性。需要說(shuō)明的是:在進(jìn)行特征點(diǎn)像的坐標(biāo)提取前,需對(duì)獲取的圖像進(jìn)行預(yù)處理。因?yàn)樵趫D像獲取過(guò)程中,存在一系列的噪聲源,通過(guò)此處理可顯著改進(jìn)圖像質(zhì)量,使圖像征點(diǎn)更加突出。
1.4立體匹配
立體匹配是雙目體視中最關(guān)系、困難的一步。與普通的圖像配準(zhǔn)不同,立體像對(duì)之間的差異是由攝像時(shí)觀察點(diǎn)的不同引起的,而不是由其它如景物本身的變化、運(yùn)動(dòng)所引起的。根據(jù)匹配基元的不同,立體匹配可分為區(qū)域匹配、特征匹配和相位匹配三大類。
區(qū)域匹配算法的實(shí)質(zhì)是利用局部窗口之間灰度信息的相關(guān)程度,它在變化平緩且細(xì)節(jié)豐富的地方可以達(dá)到較高的精度。但該算法的匹配窗大小難以選擇,通常借助于窗口形狀技術(shù)來(lái)改善視差不連續(xù)處的匹配;其次是計(jì)算量大、速度慢,采取由粗至精分級(jí)匹配策略能大大減少搜索空間的大小,與匹配窗大小無(wú)關(guān)的互相關(guān)運(yùn)算能顯著提高運(yùn)算速度。
特片匹配不直接依賴于灰度,具有較強(qiáng)的抗干擾性,計(jì)算量小,速度快。但也同樣存一些不足:特征在圖像中的稀疏性決定特征匹配只能得到稀疏的視差場(chǎng);特征的撮和定位過(guò)程直接影響匹配結(jié)果的精確度。改善辦法是將特征匹配的魯棒性和區(qū)域匹配的致密性充分結(jié)合,利用對(duì)高頻噪聲不敏感的模型來(lái)提取和定位特征。
相位匹配是近二十年才發(fā)展起來(lái)的一類匹配算法。相位作為匹配基元,本身反映信號(hào)的結(jié)構(gòu)信息,對(duì)圖像的高頻噪聲有很好的抑制作用,適于并行處理,能獲得亞像素級(jí)精度的致密視差。但存在相位奇點(diǎn)和相位卷繞的問(wèn)題,需加入自適應(yīng)濾波器解決。
1.5三維重建
在得到空間任一點(diǎn)在兩個(gè)圖像中的對(duì)應(yīng)坐標(biāo)和兩攝像機(jī)參數(shù)矩陣的條件下,即可進(jìn)行空間點(diǎn)的重建。通過(guò)建立以該點(diǎn)的世界坐標(biāo)為未知數(shù)的4個(gè)線性方程,可以用最小二乘法求解得該點(diǎn)的世界坐標(biāo)。實(shí)際重建通常采用外極線結(jié)束法。空間瞇、兩攝像機(jī)的光心這三點(diǎn)組成的平面分別與兩個(gè)成像平面的交線稱為該空間點(diǎn)在這兩個(gè)成像平面中的極線。一旦兩攝像機(jī)的內(nèi)外參數(shù)確定,就可通過(guò)兩個(gè)成像平面上的極線的約束關(guān)系建立對(duì)應(yīng)點(diǎn)之間的關(guān)系,并由此聯(lián)立方程,求得圖像點(diǎn)的世界坐標(biāo)值。對(duì)圖像的全像素的三維重建目前僅能針對(duì)某一具體目標(biāo),計(jì)算量大且效果不明顯。
2雙目體視的最新應(yīng)用
2.1國(guó)外研究動(dòng)態(tài)
雙目體視目前主要應(yīng)用于四個(gè)領(lǐng)域:機(jī)器人導(dǎo)航、微操作系統(tǒng)的參數(shù)檢測(cè)、三維測(cè)量和虛擬現(xiàn)實(shí)。
日本大阪大學(xué)自適應(yīng)機(jī)械系統(tǒng)研究院研制了一種自適應(yīng)雙目視覺(jué)伺服系統(tǒng),利用雙目體視的原理,如每幅圖像中相對(duì)靜止的三個(gè)標(biāo)志為參考,實(shí)時(shí)計(jì)算目標(biāo)圖像的雅可比短陣,從而預(yù)測(cè)出目標(biāo)下一步運(yùn)動(dòng)方向,實(shí)現(xiàn)了對(duì)動(dòng)方式未知的目標(biāo)的自適應(yīng)跟蹤。該系統(tǒng)僅要求兩幅圖像中都有靜止的參考標(biāo)志,無(wú)需攝像機(jī)參數(shù)。而傳統(tǒng)的視覺(jué)跟蹤伺服系統(tǒng)需事先知道攝像機(jī)的運(yùn)動(dòng)、光學(xué)等參數(shù)和目標(biāo)的運(yùn)動(dòng)方式。
日本奈良科技大學(xué)信息科學(xué)學(xué)院提出了一種基于雙目立體視覺(jué)的增強(qiáng)現(xiàn)實(shí)系統(tǒng)(AR)注冊(cè)方法,通過(guò)動(dòng)態(tài)修正特征點(diǎn)的位置提高注冊(cè)精度。該系統(tǒng)將單攝像機(jī)注冊(cè)(MR)與立體視覺(jué)注冊(cè)(SR)相結(jié)合,利用MR和三個(gè)標(biāo)志點(diǎn)算出特征點(diǎn)在每個(gè)圖像上的二維坐標(biāo)和誤差,利用SR和圖像對(duì)計(jì)算出特征點(diǎn)的三維位置總誤差,反復(fù)修正特征點(diǎn)在圖像對(duì)上的二維坐標(biāo),直至三維總誤差小于某個(gè)閾值。該方法比僅使用MR或SR方法大大提高了AR系統(tǒng)注冊(cè)深度和精度。實(shí)驗(yàn)結(jié)果如圖2,白板上三角開的三頂點(diǎn)被作為單攝像機(jī)標(biāo)定的特征點(diǎn),三個(gè)三角形上的模型為虛擬場(chǎng)景,烏龜是真實(shí)場(chǎng)景,可見基本上難以區(qū)分出虛擬場(chǎng)景(恐龍)和現(xiàn)實(shí)場(chǎng)景(烏龜)。
日本東京大學(xué)將實(shí)時(shí)雙目立體視覺(jué)和機(jī)器人整體姿態(tài)信息集成,開發(fā)了仿真機(jī)器人動(dòng)態(tài)行長(zhǎng)導(dǎo)航系統(tǒng)。該系統(tǒng)實(shí)現(xiàn)分兩個(gè)步驟:首先,利用平面分割算法分離所拍攝圖像對(duì)中的地面與障礙物,再結(jié)合機(jī)器人身體姿態(tài)的信息,將圖像從攝像機(jī)的二維平面坐標(biāo)系轉(zhuǎn)換到描述軀體姿態(tài)的世界坐標(biāo)系,建立機(jī)器人周圍區(qū)域的地圖;基次根據(jù)實(shí)時(shí)建立的地圖進(jìn)行障礙物檢測(cè),從而確定機(jī)器人的行走方向。
日本岡山大學(xué)使用立體顯微鏡、兩個(gè)CCD攝像頭、微操作器等研制了使用立體顯微鏡控制微操作器的視覺(jué)反饋系統(tǒng),用于對(duì)細(xì)胞進(jìn)行操作,對(duì)鐘子進(jìn)行基因注射和微裝配等。
麻省理工學(xué)院計(jì)算機(jī)系統(tǒng)提出了一種新的用于智能交通工具的傳感器融合方式,由雷達(dá)系統(tǒng)提供目標(biāo)深度的大致范圍,利用雙目立體視覺(jué)提供粗略的目標(biāo)深度信息,結(jié)合改進(jìn)的圖像分割算法,能夠在高速環(huán)境下對(duì)視頻圖像中的目標(biāo)位置進(jìn)行分割,而傳統(tǒng)的目標(biāo)分割算法難以在高速實(shí)時(shí)環(huán)境中得到令人滿意的結(jié)果,系統(tǒng)框圖如圖3。
華盛頓大學(xué)與微軟公司合作為火星衛(wèi)星“探測(cè)者”號(hào)研制了寬基線立體視覺(jué)系統(tǒng),使“探測(cè)者”號(hào)能夠在火星上對(duì)其即將跨越的幾千米內(nèi)的地形進(jìn)行精確的定位玫導(dǎo)航。系統(tǒng)使用同一個(gè)攝像機(jī)在“探測(cè)者”的不同位置上拍攝圖像對(duì),拍攝間距越大,基線越寬,能觀測(cè)到越遠(yuǎn)的地貌。系統(tǒng)采用非線性優(yōu)化得到兩次拍攝圖像時(shí)攝像機(jī)的相對(duì)準(zhǔn)確的位置,利用魯棒性強(qiáng)的最大似然概率法結(jié)合高效的立體搜索進(jìn)行圖像匹配,得到亞像素精度的視差,并根據(jù)此視差計(jì)算圖像對(duì)中各點(diǎn)的三維坐標(biāo)。相比傳統(tǒng)的體視系統(tǒng),能夠更精確地繪制“探測(cè)者”號(hào)周圍的地貌和以更高的精度觀測(cè)到更遠(yuǎn)的地形。
2.2國(guó)內(nèi)研究動(dòng)態(tài)
浙江大學(xué)機(jī)械系統(tǒng)完全利用透視成像原理,采用雙目體視方法實(shí)現(xiàn)了對(duì)多自由度機(jī)械裝置的動(dòng)態(tài)、精確位姿檢測(cè),僅需從兩幅對(duì)應(yīng)圖像中抽取必要的特征點(diǎn)的三維坐標(biāo),信息量少,處理速度快,尤其適于動(dòng)態(tài)情況。與手眼系統(tǒng)相比,被測(cè)物的運(yùn)動(dòng)對(duì)攝像機(jī)沒(méi)有影響,且不需知道被測(cè)物的運(yùn)動(dòng)先驗(yàn)知識(shí)和限制條件,有利于提高檢測(cè)精度。
東南大學(xué)電子工程系基于雙目立體視覺(jué),提出了一種灰度相關(guān)多峰值視差絕對(duì)值極小化立體匹配新方法,可對(duì)三維不規(guī)則物體(偏轉(zhuǎn)線圈)的三維空間坐標(biāo)進(jìn)行非接觸精密測(cè)量。
哈工大采用異構(gòu)雙目活動(dòng)視覺(jué)系統(tǒng)實(shí)現(xiàn)了全自主足球機(jī)器人導(dǎo)航。將一個(gè)固定攝像機(jī)和一個(gè)可以水平旋轉(zhuǎn)的攝像機(jī),分別安裝在機(jī)器人的頂部和中下部,可以同時(shí)監(jiān)視不同方位視點(diǎn),體現(xiàn)出比人類視覺(jué)優(yōu)越的一面。通過(guò)合理的資源分配及協(xié)調(diào)機(jī)制,使機(jī)器人在視野范圍、測(cè)跟精度及處理速度方面達(dá)到最佳匹配。雙目協(xié)調(diào)技術(shù)可使機(jī)器人同時(shí)捕捉多個(gè)有效目標(biāo),觀測(cè)相遇目標(biāo)時(shí)通過(guò)數(shù)據(jù)融合,也可提高測(cè)量精度。在實(shí)際比賽中其他傳感器失效的情況下,僅僅依靠雙目協(xié)調(diào)仍然可以實(shí)現(xiàn)全自主足球機(jī)器人導(dǎo)航。
火星863計(jì)劃課題“人體三維尺寸的非接觸測(cè)量”,采用“雙視點(diǎn)投影光柵三維測(cè)量”原理,由雙攝像機(jī)獲取圖像對(duì),通過(guò)計(jì)算機(jī)進(jìn)行圖像數(shù)據(jù)處理,不僅可以獲取服裝設(shè)計(jì)所需的特征尺寸,還可根據(jù)需要獲取人體圖像上任意一點(diǎn)的三維坐標(biāo)。該系統(tǒng)已通過(guò)中國(guó)人民總后勤部軍需部鑒定??蛇_(dá)到的技術(shù)指標(biāo)為:數(shù)據(jù)采集時(shí)間小于5s/人;提供身高、胸圍、腰圍、臀圍等圍度的測(cè)量精度不低于1.0cm。
3雙目體視的發(fā)展方向
就又目立體視覺(jué)技術(shù)的發(fā)展現(xiàn)狀而言,要構(gòu)造出類似于人眼的通用雙目立體視覺(jué)系統(tǒng),還有很長(zhǎng)的路要走,進(jìn)一步的研究方向可歸納如下:
(1)如何建立更有效的雙目體視模型,能更充分地反映立體視覺(jué)不確定性的本質(zhì)屬性,為匹配提供更多的約束信息,降低立體匹配的難度。
(2)探索新的適用于全面立體視覺(jué)的計(jì)算理論和匹配策略,選擇有效的匹配準(zhǔn)則和算法結(jié)構(gòu),以解決存在灰度失真、幾何畸變(透視、旋轉(zhuǎn)、縮放等)、噪聲干擾、特殊結(jié)構(gòu)(平坦匹域、重復(fù)相似結(jié)構(gòu)等)及遮掩景物的匹配問(wèn)題;
(3)算法向并行化發(fā)展,提高速度,減少運(yùn)算量,增強(qiáng)系統(tǒng)的實(shí)用性。
關(guān)鍵詞:雙目立體視覺(jué);立體匹配;光流
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-7712 (2013) 20-0000-02
一、引言
雙目立體視覺(jué)在機(jī)器人導(dǎo)航、微操作系統(tǒng)的參數(shù)檢測(cè)、三維測(cè)量和虛擬現(xiàn)實(shí)等領(lǐng)域都有廣泛的應(yīng)用,它是計(jì)算機(jī)視覺(jué)的一個(gè)重要分支。它主要是由不同位置的左右兩個(gè)攝像機(jī)同時(shí)獲得同一場(chǎng)景的兩幅圖,通過(guò)計(jì)算空間點(diǎn)在兩幅圖像中的視差,獲得該點(diǎn)的三維信息。立體匹配算法的目的就是找出左右圖像對(duì)中的匹配點(diǎn),進(jìn)而獲得距離信息,其基本原理就是從兩個(gè)視點(diǎn)同時(shí)觀察同一景物以獲取立體像對(duì),并匹配出相應(yīng)像點(diǎn),從而計(jì)算出視差并獲得三維信息。
考慮到光流這種運(yùn)動(dòng)速度,不僅包含了二維瞬時(shí)速度場(chǎng),還可以反映可見點(diǎn)的三維速度矢量在成像表面得投影,提出了一種融合光流的立體匹配算法。該方法在基于區(qū)域相關(guān)匹配的基礎(chǔ)上,求取左右運(yùn)動(dòng)目標(biāo)的光流,用光流作為一種外加限制條件進(jìn)行立體匹配。首先分別求取左右圖像序列中垂直和水平方向上的光流,然后通過(guò)對(duì)右圖像序列中候選點(diǎn)的光流的計(jì)算與左圖像序列中的種子點(diǎn)進(jìn)行匹配,進(jìn)而提高了匹配的精度和準(zhǔn)確度;而且該算法只選用邊緣點(diǎn)進(jìn)行匹配,這樣簡(jiǎn)化了運(yùn)算,提高了算法的運(yùn)行速度。
二、求取光流
三、實(shí)驗(yàn)
圖1顯示了在連續(xù)時(shí)間幀里獲得的兩對(duì)立體圖像對(duì),圖2顯示了在50幀時(shí)邊緣檢測(cè)結(jié)果。然后用這兩幅圖像中的邊緣點(diǎn)作為種子點(diǎn)在第二個(gè)立體圖像對(duì)(也就是下一幀)中尋找相關(guān)點(diǎn),這樣就可以在連續(xù)的圖像序列中進(jìn)行相關(guān)性研究。圖3中給出了光流的計(jì)算,把每個(gè)邊緣點(diǎn)的光流都分解為水平(X)和垂直(Y)方向的位移,其中(a),(b)圖顯示了左右圖像的水平位移,而(c),(d)顯示了垂直位移。
采用融入光流的匹配方法,不僅測(cè)量了互相關(guān)系數(shù),還測(cè)量了待估計(jì)的兩點(diǎn)水平及垂直位移,這樣就可以避免光照和攝像機(jī)本身移動(dòng)的問(wèn)題。視差圖反應(yīng)的是目標(biāo)離攝像機(jī)的遠(yuǎn)近,離攝像機(jī)越近,視差越大,表現(xiàn)在灰度圖中越亮,反之,離攝像機(jī)越遠(yuǎn),視差越小,表現(xiàn)在灰度圖中越暗。圖4中的(a),(b)分別為沒(méi)有融合光流和融合光流之后的視差圖,從圖中可以明顯的發(fā)現(xiàn),沒(méi)有融合的視差圖中有很多地方出現(xiàn)誤匹配,而融合光流之后的視差圖更為清晰,消除了偽匹配點(diǎn)。
四、總結(jié)
本文通過(guò)對(duì)傳統(tǒng)匹配算法的分析,提出了一種融合光流的立體匹配算法,該算法是在區(qū)域相關(guān)立體匹配的基礎(chǔ)上附加上了光流作為限制條件,使得匹配更為準(zhǔn)確迅速。實(shí)驗(yàn)結(jié)果表明了該算法的有效性,不僅縮小了匹配搜索空間,提高了匹配的速度與準(zhǔn)確度,而且可以有效的克服光照等外部環(huán)境的干擾,消除誤匹配點(diǎn)。
參考文獻(xiàn):
[1]劉金頌.雙目立體視覺(jué)中的攝像機(jī)標(biāo)定技術(shù)研究[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(6).
[2]梁元月.基于雙目立體視覺(jué)的工件識(shí)別定位方法研究[D].西安理工大學(xué),2008.
[3]白明,莊嚴(yán),王偉.雙目立體匹配算法研究與進(jìn)展[J].控制與決策,2008.
關(guān)鍵詞:手勢(shì)識(shí)別;3D視覺(jué);DSP
DOI: 10.3969/j.issn.1005-5517.2012.9.003
隨著觸摸屏技術(shù)的不斷推廣,用戶已經(jīng)適應(yīng)并逐漸熟悉了與機(jī)器的互動(dòng)?,F(xiàn)在,人機(jī)互動(dòng)技術(shù)已邁上了更高的臺(tái)階,進(jìn)入了手勢(shì)識(shí)別時(shí)代,不過(guò)這也并不是一帆風(fēng)順的。手勢(shì)識(shí)別現(xiàn)已在娛樂(lè)及游戲市場(chǎng)出現(xiàn),然而這種技術(shù)將對(duì)我們的日常生活產(chǎn)生怎樣的影響呢?不妨假想一下,有人坐在沙發(fā)上,只需一揮手就能操控?zé)艄夂碗娨?,或者汽車自?dòng)檢測(cè)附近是否有行人。隨著手勢(shì)識(shí)別技術(shù)支持人機(jī)互動(dòng)的不斷深入發(fā)展,這些及其它功能將很快得以實(shí)現(xiàn)。手勢(shì)識(shí)別技術(shù)長(zhǎng)期以來(lái)一直采用 2D 視覺(jué)進(jìn)行研究,但隨著 3D 傳感器技術(shù)的出現(xiàn),其應(yīng)用將日益廣泛并多樣化。
2D視覺(jué)的局限
計(jì)算機(jī)視覺(jué)技術(shù)一直在努力向堪比人類智慧的智能方向發(fā)展,以更好地了解場(chǎng)景。如果不能解釋周圍的世界,計(jì)算機(jī)就無(wú)法與人實(shí)現(xiàn)自然交流對(duì)接。計(jì)算機(jī)在了解周圍場(chǎng)景方面面臨的主要問(wèn)題包括細(xì)分、對(duì)象表征、機(jī)器學(xué)習(xí)與識(shí)別等。由于 2D 場(chǎng)景表征本身存在局限性,手勢(shì)識(shí)別系統(tǒng)必須應(yīng)用其它各種提示信息才能得到包含更有用信息的更好結(jié)果。在可能性信息包含整個(gè)身體跟蹤時(shí),盡管將多種提示信息整合在一起,單靠 2D 表征也很難獲得超越手勢(shì)識(shí)別的任何信息。
“z”(深度)創(chuàng)新
向 3D 視覺(jué)及手勢(shì)識(shí)別發(fā)展過(guò)程中的挑戰(zhàn)一直都是第三坐標(biāo) —z 軸坐標(biāo)的獲取。人眼能看到 3D 對(duì)象,能自然識(shí)別 (x,y,z) 坐標(biāo)軸,從而能夠看到一切事物,而后大腦能夠以 3D 影像的形式表達(dá)這些坐標(biāo)軸。機(jī)器無(wú)法獲得 3D 視覺(jué)的一大挑戰(zhàn)就在于影像分析技術(shù)。目前有 3 種應(yīng)對(duì) 3D 采集問(wèn)題的常見解決方案,每種方案都有其獨(dú)特的功能與特定的用途。這三種方案分別為:立體視覺(jué)、結(jié)構(gòu)光模式以及渡越時(shí)間 (TOF)。有了這些技術(shù)提供的 3D 影像輸出,就可實(shí)現(xiàn)手勢(shì)識(shí)別技術(shù)。
立體視覺(jué)
立體視覺(jué)系統(tǒng)可能是最為人所熟知的 3D 采集系統(tǒng)。該系統(tǒng)使用 2 個(gè)攝像機(jī)獲得左右立體影像,該影像有些輕微偏移,與人眼同序。計(jì)算機(jī)通過(guò)比較這兩個(gè)影像,就可獲得對(duì)應(yīng)于影像中物移的不同影像。該不同影像或地圖可以是彩色的,也可以為灰階,具體取決于特定系統(tǒng)的需求。立體視覺(jué)系統(tǒng)目前通常用于 3D 電影,能帶來(lái)低成本而又震撼人心的娛樂(lè)體驗(yàn)。
結(jié)構(gòu)光模式
結(jié)構(gòu)光模式可用來(lái)測(cè)量或掃描3D 對(duì)象。在該類系統(tǒng)中,可在整個(gè)對(duì)象上照射結(jié)構(gòu)光模式,光模式可使用激光照明干擾創(chuàng)建,也可使用投影影像創(chuàng)建。使用類似于立體視覺(jué)系統(tǒng)的攝像機(jī),有助于結(jié)構(gòu)光模式系統(tǒng)獲得對(duì)象的 3D 坐標(biāo)。此外,單個(gè) 2D 攝像機(jī)系統(tǒng)也可用來(lái)測(cè)量任何單條的移位,然后通過(guò)軟件分析獲得坐標(biāo)。無(wú)論使用什么系統(tǒng),都可使用坐標(biāo)來(lái)創(chuàng)建對(duì)象外形的數(shù)字 3D 圖形。
渡越時(shí)間 (TOF)
渡越時(shí)間 (TOF) 傳感器是一種相對(duì)較新的深度信息系統(tǒng)。TOF 系統(tǒng)是一種光雷達(dá) (LIDAR) 系統(tǒng),同樣可從發(fā)射極向?qū)ο蟀l(fā)射光脈沖。接收器則可通過(guò)計(jì)算光脈沖從發(fā)射器到對(duì)象,再以像素格式返回到接收器的運(yùn)行時(shí)間來(lái)確定被測(cè)量對(duì)象的距離。
TOF 系統(tǒng)不是掃描儀,因?yàn)槠洳恢С贮c(diǎn)對(duì)點(diǎn)測(cè)量。TOF 系統(tǒng)可同時(shí)獲得整個(gè)場(chǎng)景,確定 3D 范圍影像。利用測(cè)量得到的對(duì)象坐標(biāo)可創(chuàng)建 3D 影像,并可用于機(jī)器人、制造、醫(yī)療技術(shù)以及數(shù)碼攝影等領(lǐng)域的設(shè)備控制。
實(shí)施 TOF 系統(tǒng)所需的半導(dǎo)體器件現(xiàn)已開始供貨。目前的器件支持實(shí)現(xiàn) TOF 系統(tǒng)所需的處理性能、速度與帶寬。
3D 視覺(jué)技術(shù)的比較
不同的應(yīng)用或市場(chǎng)適用于不同的3D 視覺(jué)技術(shù)。圖 1 顯示了不同 3D 視覺(jué)技術(shù)的比較及其相關(guān)響應(yīng)時(shí)間、軟件復(fù)雜性、成本及準(zhǔn)確性的相對(duì)優(yōu)缺點(diǎn)。
立體視覺(jué)技術(shù)需要極高的軟件復(fù)雜性才能獲得高精度3D 深度數(shù)據(jù),其通??赏ㄟ^(guò)數(shù)字信號(hào)處理器(DSP) 或多內(nèi)核標(biāo)量處理器進(jìn)行處理。立體視覺(jué)系統(tǒng)支持小巧的外形與低成本,是移動(dòng)電話等消費(fèi)類設(shè)備的良好選擇。不過(guò),立體視覺(jué)系統(tǒng)的精確度與響應(yīng)時(shí)間不及其它技術(shù),因此對(duì)于制造質(zhì)量控制系統(tǒng)等要求高精度的系統(tǒng)來(lái)說(shuō)不太理想。
結(jié)構(gòu)光技術(shù)是包括 3D 計(jì)算機(jī)輔助設(shè)計(jì) (CAD) 系統(tǒng)在內(nèi)的 3D 對(duì)象掃描的良好解決方案。這些系統(tǒng)的相關(guān)軟件復(fù)雜性可通過(guò)硬接線邏輯解決(如 ASIC 與 FPGA 等),其需要高昂的開發(fā)及材料成本。此外,該計(jì)算復(fù)雜性還可導(dǎo)致較慢的響應(yīng)時(shí)間。在實(shí)現(xiàn)微觀層面上的高精度方面,結(jié)構(gòu)光模式技術(shù)優(yōu)于其它 3D 視覺(jué)技術(shù)。
TOF 系統(tǒng)取得了性能與成本的平衡,非常適用于需要快速響應(yīng)時(shí)間的制造與消費(fèi)類電子設(shè)備等應(yīng)用領(lǐng)域的設(shè)備控制。TOF 系統(tǒng)軟件復(fù)雜程度通常較低,不過(guò)這些系統(tǒng)需要昂貴的照明部件(LED、激光二極管)以及高速接口相關(guān)部件(快速 ADC、快速串行/并行接口、快速 PWM 驅(qū)動(dòng)器),這將提升材料成本。圖 1 顯示了這三種 3D 傳感器技術(shù)的對(duì)比情況。
圖1 3D 視覺(jué)技術(shù)對(duì)比
“z”(深度)如何影響人機(jī)界面
隨著“z”坐標(biāo)的加入,顯示與影像更接近自然,更貼近人類。人們?cè)陲@示屏上能看到人眼從周邊環(huán)境所看到的逼真事物。增加這第三維坐標(biāo)改變了可使用的顯示與應(yīng)用類型。
顯示
立體顯示屏
立體顯示屏通常需要用戶佩戴3D 眼鏡。這種顯示屏為左右眼提供不同的影像,兩眼看到的影像不同,讓大腦誤以為看到了 3D 影像。這種顯示屏目前廣泛用于眾多 3D 電視與3D 電影院。
多視點(diǎn)顯示屏
多視點(diǎn)顯視屏不同于立體顯示屏,無(wú)需佩戴特殊眼鏡。這些顯示屏可同時(shí)投射多個(gè)影像,每個(gè)影像稍微有些位移,形成適當(dāng)?shù)慕嵌?,讓用戶可在每個(gè)視點(diǎn)角度看到相同對(duì)象的不同投射影像。這些顯示屏支持全息攝影效果,在不久的將來(lái)將實(shí)現(xiàn)全新的3D 體驗(yàn)。
檢測(cè)與應(yīng)用
處理并顯示“z”坐標(biāo)的功能將實(shí)現(xiàn)全新的應(yīng)用,其中包括游戲、制造控制、安全、互動(dòng)數(shù)字標(biāo)牌、遠(yuǎn)程醫(yī)療、汽車以及機(jī)器人視覺(jué)等。圖 2是身體骨架與深度映射傳感技術(shù)所支持的某些應(yīng)用領(lǐng)域視圖。
人類手勢(shì)識(shí)別(消費(fèi)類)
人類手勢(shì)識(shí)別是一項(xiàng)深受歡迎的新技術(shù),可為游戲、消費(fèi)類以及移動(dòng)產(chǎn)品帶來(lái)新的輸入方式。用戶能夠以極其自然、直觀的方法與設(shè)備進(jìn)行互動(dòng),從而可促進(jìn)產(chǎn)品推廣。這些人類手勢(shì)識(shí)別產(chǎn)品包括從 160 x 120 像素到640 x 480 像素,30 到60 fps 的各種分辨率的3D 數(shù)據(jù)。原始數(shù)據(jù)到z深度解析、雙手跟蹤以及全身跟蹤等軟件模塊需要數(shù)字信號(hào)處理器 (DSP)對(duì) 3D 數(shù)據(jù)進(jìn)行高效快速處理,才能實(shí)現(xiàn)實(shí)時(shí)游戲與跟蹤。
工業(yè)
工業(yè)與制造傳感器等大多數(shù) 3D視覺(jué)工業(yè)應(yīng)用都采用至少 1 像素至數(shù)100k 像素的影像系統(tǒng)。3D 影像可使用 DSP 技術(shù)進(jìn)行控制分析,確定制造瑕疵或者從部件集中選擇正確的部件。
互動(dòng)數(shù)字標(biāo)牌(精確定位的市場(chǎng)營(yíng)銷工具)
每天我們都在遭受廣告的轟炸,無(wú)論是看電視、開車還是在機(jī)場(chǎng)登機(jī)都是如此。有了互動(dòng)數(shù)字標(biāo)牌,企業(yè)就可通過(guò)精確定位的市場(chǎng)營(yíng)銷工具提供適合每位消費(fèi)者的內(nèi)容。例如,有人走過(guò)一個(gè)數(shù)字標(biāo)牌,標(biāo)牌上可能就會(huì)馬上顯示額外的消息確認(rèn)該客戶。如果客戶停下來(lái)閱讀信息,該標(biāo)牌可能會(huì)理解為客戶對(duì)產(chǎn)品感興趣,并提供更有針對(duì)性的消息。麥克風(fēng)則將讓廣告牌檢測(cè)并識(shí)別關(guān)鍵短語(yǔ),進(jìn)一步精確定位所提供的消息。
這些互動(dòng)數(shù)字標(biāo)牌系統(tǒng)將需要3D 傳感器進(jìn)行全面的身體跟蹤,2D傳感器進(jìn)行面部識(shí)別,并需要麥克風(fēng)進(jìn)行語(yǔ)音識(shí)別。這些系統(tǒng)的軟件將運(yùn)行在更高級(jí)的 DSP 及通用處理器(GPP) 上,不但可實(shí)現(xiàn)面部識(shí)別、全面的身體跟蹤以及 Flash 媒體播放器等應(yīng)用,而且還可提供諸如 MPEG4視頻解碼等功能。
醫(yī)療(無(wú)故障虛擬/遠(yuǎn)程護(hù)理)
3D 視覺(jué)將為醫(yī)療領(lǐng)域帶來(lái)前所未有的全新應(yīng)用。醫(yī)生無(wú)需跟患者共處一室就可問(wèn)診。遠(yuǎn)程虛擬護(hù)理采用高精度 3D 傳感器支持的醫(yī)學(xué)機(jī)器人視覺(jué)系統(tǒng),可確保為每一位患者提供最優(yōu)質(zhì)的醫(yī)療護(hù)理,無(wú)論他們身處何方。
汽車(安全)
近期,汽車應(yīng)用在交通信號(hào)、車道以及障礙檢測(cè)方面使用 2D 傳感器技術(shù)取得了長(zhǎng)足發(fā)展。隨著 3D 傳感技術(shù)的到來(lái),3D 傳感器的“z”數(shù)據(jù)將大幅提升場(chǎng)景分析的可靠性。汽車通過(guò)使用 3D 視覺(jué)系統(tǒng),現(xiàn)已有了預(yù)防事故的新途徑,無(wú)論白天還是夜間都非常適用。采用 3D 傳感器,車輛能可靠檢測(cè)并解讀周邊環(huán)境,確定對(duì)象是否對(duì)車輛及車內(nèi)乘客構(gòu)成安全威脅。這些系統(tǒng)要求軟硬件支持 3D 視覺(jué)系統(tǒng),并需要密集型 DSP 及 GPP處理性能在極短時(shí)間內(nèi)解讀 3D 圖形,避免事故。
視頻會(huì)議
視覺(jué)會(huì)議技術(shù)經(jīng)過(guò)多年發(fā)展,已經(jīng)從間斷脫節(jié)傳輸影像發(fā)展成當(dāng)前的高清系統(tǒng)。未來(lái)增強(qiáng)型視頻會(huì)議將充分發(fā)揮 3D 傳感器的優(yōu)勢(shì),提供更真實(shí)、更具互動(dòng)性的視頻會(huì)議體驗(yàn)。該增強(qiáng)型視頻會(huì)議系統(tǒng)具有集成型2D 傳感器以及 3D 傳感器及麥克風(fēng)組合,將能夠與其它增強(qiáng)型系統(tǒng)連接,實(shí)現(xiàn)高質(zhì)量的視頻處理、面部識(shí)別、3D 影像、噪聲消除以及內(nèi)容播放器(Flash 等)等應(yīng)用。隨著這種密集型音視頻處理需求的出現(xiàn),需要具備最佳性能及外設(shè)組合的 DSP。
圖2 3D 視覺(jué)正在為各個(gè)市場(chǎng)帶來(lái)全新的應(yīng)用
圖3 2D 與 3D 攝像機(jī)系統(tǒng)的數(shù)據(jù)路徑
技術(shù)處理步驟
對(duì)許多應(yīng)用而言,需要同時(shí)具備 2D 和 3D 攝像機(jī)系統(tǒng)才能充分實(shí)現(xiàn)應(yīng)用技術(shù)。圖 3 顯示了這些系統(tǒng)的基本數(shù)據(jù)路徑。從傳感器獲取數(shù)據(jù),然后進(jìn)行視覺(jué)分析,這并不像數(shù)據(jù)路徑示意圖看上去那么簡(jiǎn)單。具體而言,TOF 傳感器需要的帶寬相當(dāng)于 2D 傳感器的 16 倍之多,這可導(dǎo)致高輸入/輸出 (I/O) 問(wèn)題。另一個(gè)瓶頸則存在于原始 3D 數(shù)據(jù)向 3D 點(diǎn)云轉(zhuǎn)換的處理過(guò)程中。通過(guò)正確的軟硬件組合解決這些問(wèn)題,對(duì)于手勢(shì)識(shí)別及 3D 的成功應(yīng)用至關(guān)重要。當(dāng)前數(shù)據(jù)路徑可通過(guò) DSP/GPP 處理器組合加上分立式模擬組件及軟件庫(kù)實(shí)現(xiàn)。
3D 視覺(jué)嵌入式系統(tǒng)的挑戰(zhàn)
輸入挑戰(zhàn)
如前所述,輸入帶寬限制對(duì) 3D視覺(jué)嵌入式系統(tǒng)提出了極大的挑戰(zhàn)。此外,輸入接口也沒(méi)有標(biāo)準(zhǔn)化。設(shè)計(jì)人員可為 2D 傳感器與通用外部存儲(chǔ)器接口選擇采用不同的輸入選項(xiàng),其中包括串行與并行接口。在支持最佳帶寬的標(biāo)準(zhǔn)輸入接口出現(xiàn)之前,設(shè)計(jì)人員只能使用現(xiàn)有的接口。
兩種不同的處理器架構(gòu)
圖 3 所示的 3D 深度映射處理可分為兩類:一是以數(shù)據(jù)為中心的視覺(jué)專用處理,二是應(yīng)用上層處理。以數(shù)據(jù)為中心的視覺(jué)專用處理需要處理器架構(gòu)能夠執(zhí)行單指令多數(shù)據(jù) (SIMD) 快速浮點(diǎn)乘法及加法運(yùn)算,以及快速搜索算法。DSP 是快速可靠執(zhí)行這種處理功能的完美選擇。對(duì)于應(yīng)用上層處理而言,高級(jí)操作系統(tǒng) (OS) 及協(xié)議棧則可提供任何應(yīng)用上層所需的必要特性集。
根據(jù)兩種處理器架構(gòu)要求,提供高數(shù)據(jù)速率 I/O GPP+DSP+SIMD 處理器的片上系統(tǒng) (SOC) 非常適合 3D 視覺(jué)處理,其可支持必要的數(shù)據(jù)及應(yīng)用上層處理。
缺乏標(biāo)準(zhǔn)中間件
3D 視覺(jué)處理領(lǐng)域的中間件是多種來(lái)源的眾多不同組件的整合,包括開源(如 OpenCV)與專有商業(yè)源等。商業(yè)庫(kù)主要針對(duì)身體跟蹤應(yīng)用,這是一種特定的 3D 視覺(jué)應(yīng)用。目前尚未開發(fā)出針對(duì)所有不同 3D 視覺(jué)應(yīng)用標(biāo)準(zhǔn)化的中間件接口。
“z”(深度)之后會(huì)有什么精彩?
關(guān)鍵詞:虛擬現(xiàn)實(shí)技術(shù) 虛擬環(huán)境 計(jì)算機(jī)發(fā)展 新型計(jì)算機(jī)
計(jì)算機(jī)技術(shù)的不斷發(fā)展與應(yīng)用方面的不斷提高使得虛擬現(xiàn)實(shí)技術(shù)也相應(yīng)同步地快速發(fā)展。尤其是計(jì)算機(jī)的發(fā)展將趨向超高速、超小型、平行處理和智能化,量子、光子、分子和納米計(jì)算機(jī)將具有感知、思考、判斷、學(xué)習(xí)及一定的自然語(yǔ)言能力,使計(jì)算機(jī)進(jìn)入人工智能時(shí)代。這種新型計(jì)算機(jī)將推動(dòng)新一輪計(jì)算技術(shù)革命,更加帶動(dòng)虛擬現(xiàn)實(shí)技術(shù)的快速發(fā)展,對(duì)人類社會(huì)的發(fā)展產(chǎn)生深遠(yuǎn)的影響。
1 虛擬現(xiàn)實(shí)技術(shù)概述
虛擬現(xiàn)實(shí)(Virtual Reality,簡(jiǎn)稱VR)是近年來(lái)出現(xiàn)的高新技術(shù),也稱靈境技術(shù)或人工環(huán)境。該技術(shù)集成了計(jì)算機(jī)圖形(CG)技術(shù)、計(jì)算機(jī)仿真技術(shù)、人工智能、傳感技術(shù)、顯示技術(shù)、網(wǎng)絡(luò)并行處理等技術(shù)的最新發(fā)展成果,是一種由計(jì)算機(jī)技術(shù)輔助生成的高技術(shù)模擬系統(tǒng)。
虛擬現(xiàn)實(shí)技術(shù)的發(fā)展與應(yīng)用離不開計(jì)算機(jī)技術(shù)的發(fā)展,兩者是相輔相成的關(guān)系,如果要正確認(rèn)識(shí)和剖析并把握虛擬現(xiàn)實(shí)技術(shù)的應(yīng)用與發(fā)展,就必須深入研究計(jì)算機(jī)技術(shù)的變化與發(fā)展趨勢(shì),這樣才能有利于我們未來(lái)更好的掌握與應(yīng)用虛擬現(xiàn)實(shí)技術(shù)。
2 計(jì)算機(jī)技術(shù)在虛擬現(xiàn)實(shí)技術(shù)的應(yīng)用
自從1944年世界上第一臺(tái)電子計(jì)算機(jī)誕生以來(lái),計(jì)算機(jī)技術(shù)迅猛發(fā)展,傳統(tǒng)計(jì)算機(jī)的性能受到挑戰(zhàn),開始從基本原理上尋找計(jì)算機(jī)發(fā)展的突破口,新型計(jì)算機(jī)的研發(fā)應(yīng)運(yùn)而生,計(jì)算機(jī)技術(shù)的發(fā)展將趨向超高速、超小型、并行處理和智能化。專家預(yù)計(jì)虛擬現(xiàn)實(shí)技術(shù)也會(huì)因此得到迅速發(fā)展。尤其是三維計(jì)算機(jī)圖形學(xué)技術(shù)、采用多種功能傳感器的交互式接口技術(shù)和高清晰度顯示技術(shù)在虛擬現(xiàn)實(shí)的應(yīng)用中起著重要作用。此外,智能化的超級(jí)計(jì)算機(jī)和新型高性能計(jì)算機(jī)不斷發(fā)展。這會(huì)更有利于虛擬現(xiàn)實(shí)技術(shù)方面的快速發(fā)展。虛擬現(xiàn)實(shí)技術(shù)通過(guò)計(jì)算機(jī)對(duì)復(fù)雜數(shù)據(jù)進(jìn)行可視化操作以及實(shí)時(shí)交互的環(huán)境。與傳統(tǒng)的計(jì)算機(jī)人-機(jī)界面(如鍵盤、鼠標(biāo)器、圖形用戶界面以及流行的Windows等)相比,虛擬現(xiàn)實(shí)無(wú)論在技術(shù)上還是思想上都有質(zhì)的飛躍。
3 虛擬現(xiàn)實(shí)系統(tǒng)的技術(shù)特點(diǎn)
3.1 虛擬現(xiàn)實(shí)有效地建立虛擬環(huán)境主要集中在兩個(gè)方面,一是虛擬環(huán)境能夠精確表示物體的狀態(tài)模型,二是環(huán)境的可視化及渲染。
3.2 虛擬現(xiàn)實(shí)僅是計(jì)算機(jī)系統(tǒng)設(shè)置的一個(gè)近似客觀存在的環(huán)境,它是硬件、軟件和設(shè)備的有機(jī)組合。
3.3 用戶可通過(guò)自身的技能以6個(gè)自由度在這個(gè)仿真環(huán)境里進(jìn)行交互操作。
3.4 虛擬現(xiàn)實(shí)的關(guān)鍵是傳感技術(shù)。
3.5 虛擬現(xiàn)實(shí)離不開視覺(jué)和聽覺(jué)的新型可感知?jiǎng)討B(tài)數(shù)據(jù)庫(kù)技術(shù),并需結(jié)合高速的動(dòng)態(tài)數(shù)據(jù)庫(kù)檢索技術(shù)。
3.6 虛擬現(xiàn)實(shí)不僅是計(jì)算機(jī)圖形學(xué)或計(jì)算機(jī)成像生成的一幅畫面,更重要的是人們可以通過(guò)計(jì)算機(jī)和各種人機(jī)界面與機(jī)交互,并在精神感覺(jué)上進(jìn)入環(huán)境。它需要結(jié)合人工智能,模糊邏輯和神經(jīng)元技術(shù)。
4 虛擬現(xiàn)實(shí)硬件設(shè)備與軟件技術(shù)和計(jì)算機(jī)技術(shù)的融合
在虛擬現(xiàn)實(shí)系統(tǒng)中,硬件設(shè)備主要由3個(gè)部分組成:輸入設(shè)備、輸出設(shè)備、虛擬世界生成設(shè)備。此外系統(tǒng)還需要虛擬現(xiàn)實(shí)的相關(guān)技術(shù)。
4.1 虛擬現(xiàn)實(shí)的輸入設(shè)備。有關(guān)虛擬現(xiàn)實(shí)系統(tǒng)的輸入設(shè)備主要分為兩大類:一類是基于自然的交互設(shè)備,用于對(duì)虛擬世界信息的輸入;另一類是三維定位跟蹤設(shè)備,主要用于對(duì)輸入設(shè)備在三維空間中的位置進(jìn)行判定,并送入虛擬現(xiàn)實(shí)系統(tǒng)中。虛擬世界與人進(jìn)行自然交互的實(shí)現(xiàn)形式很多,有基于語(yǔ)音的、基于手的等多種形式,如數(shù)據(jù)手套、數(shù)據(jù)衣、三維控制器、三維掃描儀等。手是我們與外界進(jìn)行物理接觸及意識(shí)表達(dá)的最主要媒介,在人機(jī)交互設(shè)備中也是如此。基于手的自然交互形式最為常見,相應(yīng)的數(shù)字化設(shè)備很多,在這類產(chǎn)品中最為常用的就是數(shù)據(jù)手套。
4.2 虛擬現(xiàn)實(shí)的輸出設(shè)備。人置身于虛擬世界中,要體會(huì)到沉浸的感覺(jué),必須讓虛擬世界能模擬人在現(xiàn)實(shí)世界中的多種感受,如視覺(jué)、聽覺(jué)、觸覺(jué)、力覺(jué)、痛感、味覺(jué)、嗅覺(jué)等?;谀壳暗募夹g(shù)水平,成熟和相對(duì)成熟的感知信息的產(chǎn)生和檢測(cè)技術(shù)僅有視覺(jué)、聽覺(jué)和觸覺(jué)(力覺(jué))3種。感知設(shè)備的作用是將虛擬世界中各種感知信號(hào)轉(zhuǎn)變?yōu)槿怂芙邮艿亩嗤ǖ来碳ば盘?hào),現(xiàn)在主要應(yīng)用的有基于視覺(jué)、聽覺(jué)和力覺(jué)感知的設(shè)備,基于味覺(jué)、嗅覺(jué)等的設(shè)備有待開發(fā)研究。
4.3 虛擬現(xiàn)實(shí)的生成設(shè)備。在虛擬現(xiàn)實(shí)系統(tǒng)中,計(jì)算機(jī)是虛擬世界的主要生成設(shè)備,所以有人稱之為“虛擬現(xiàn)實(shí)引擎”,它首先創(chuàng)建出虛擬世界的場(chǎng)景,同時(shí)還必須實(shí)時(shí)響應(yīng)用戶各種方式的輸入。
通常虛擬世界生成設(shè)備主要分為基于高性能個(gè)人計(jì)算機(jī)、基于高性能圖形工作站、高度并行的計(jì)算機(jī)系統(tǒng)和基于分布式計(jì)算機(jī)的虛擬現(xiàn)實(shí)系統(tǒng)四大類。
4.4 虛擬現(xiàn)實(shí)的相關(guān)技術(shù)。虛擬現(xiàn)實(shí)系統(tǒng)的目標(biāo)是由計(jì)算機(jī)生成虛擬世界,用戶可以與之進(jìn)行視覺(jué)、聽覺(jué)、觸覺(jué)、嗅覺(jué)、味覺(jué)等全方位的交互,并且虛擬現(xiàn)實(shí)系統(tǒng)能進(jìn)行實(shí)時(shí)響應(yīng)。要實(shí)現(xiàn)這種目標(biāo),除了需要有一些專業(yè)的硬件設(shè)備外,還必須有較多的相關(guān)技術(shù)及軟件加以保證,特別是在現(xiàn)階段計(jì)算機(jī)的運(yùn)行速度還達(dá)不到虛擬現(xiàn)實(shí)系統(tǒng)所需要求的情況下,相關(guān)技術(shù)就顯得更加重要。虛擬現(xiàn)實(shí)的相關(guān)技術(shù)主要有立體視覺(jué)顯示技術(shù)、環(huán)境建模技術(shù)、真實(shí)感實(shí)時(shí)繪制技術(shù)、三維虛擬聲音的實(shí)現(xiàn)技術(shù)、自然交互與傳感技術(shù)等等。
4.4.1 立體視覺(jué)顯示技術(shù)。人類從客觀世界獲得的信息的80%以上來(lái)自視覺(jué),視覺(jué)信息的獲取是人類感知外部世界、獲取信息的最主要的傳感通道,視覺(jué)通道成為多感知的虛擬現(xiàn)實(shí)系統(tǒng)中最重要的環(huán)節(jié)。
在視覺(jué)顯示技術(shù)中,實(shí)現(xiàn)立體顯示技術(shù)是較為復(fù)雜與關(guān)鍵的,立體視覺(jué)顯示技術(shù)是虛擬現(xiàn)實(shí)的重要支撐技術(shù)。
4.4.2 環(huán)境建模技術(shù)。在虛擬現(xiàn)實(shí)系統(tǒng)中,營(yíng)造的虛擬環(huán)境是它的核心內(nèi)容,要建立虛擬環(huán)境,首先要建模,然后在其基礎(chǔ)上再進(jìn)行實(shí)時(shí)繪制、立體顯示,形成一個(gè)虛擬的世界。虛擬環(huán)境建模的目的在于獲取實(shí)際三維環(huán)境的三維數(shù)據(jù),并根據(jù)其應(yīng)用的需要,利用獲取的三維數(shù)據(jù)建立相應(yīng)的虛擬環(huán)境模型。只有設(shè)計(jì)出反映研究對(duì)象的真實(shí)有效的模型,虛擬現(xiàn)實(shí)系統(tǒng)才有可信度。在虛擬現(xiàn)實(shí)系統(tǒng)中,環(huán)境建模應(yīng)該包括有基于視覺(jué)、聽覺(jué)、觸覺(jué)、力覺(jué)、味覺(jué)等多種感覺(jué)通道的建模。但基于目前的技術(shù)水平,常見的是三維視覺(jué)建模和三維聽覺(jué)建模。而在當(dāng)前應(yīng)用中,環(huán)境建模一般主要是三維視覺(jué)建模,這方面的理論也較為成熟。
4.4.3 真實(shí)感實(shí)時(shí)繪制技術(shù)。要實(shí)現(xiàn)虛擬現(xiàn)實(shí)系統(tǒng)中的虛擬世界,僅有立體顯示技術(shù)是遠(yuǎn)遠(yuǎn)不夠的,虛擬現(xiàn)實(shí)中還有真實(shí)感與實(shí)時(shí)性的要求,也就是說(shuō)虛擬世界的產(chǎn)生不僅需要真實(shí)的立體感,而且虛擬世界還必須實(shí)時(shí)生成,這就必須要采用真實(shí)感實(shí)時(shí)繪制技術(shù)。所謂真實(shí)感繪制是指在計(jì)算機(jī)中重現(xiàn)真實(shí)世界場(chǎng)景的過(guò)程。真實(shí)感繪制的主要任務(wù)是要模擬真實(shí)物體的物理屬性,即物體的形狀、光學(xué)性質(zhì)、表面的紋理和粗糙程度,以及物體間的相對(duì)位置、遮擋關(guān)系等等。
4.4.4 三維虛擬聲音的實(shí)現(xiàn)技術(shù)。在虛擬現(xiàn)實(shí)系統(tǒng)中加入與視覺(jué)并行的三維虛擬聲音,一方面可以在很大程度上增強(qiáng)用戶在虛擬世界中的沉浸感和交互性,另一方面也可以減弱大腦對(duì)于視覺(jué)的依賴性,降低沉浸感對(duì)視覺(jué)信息的要求,使用戶能從既有視覺(jué)感受又有聽覺(jué)感受的環(huán)境中獲得更多的信息。
5 總結(jié)
能看到虛擬現(xiàn)實(shí)技術(shù)對(duì)計(jì)算機(jī)技術(shù)的聯(lián)系性非常緊密,并且虛擬現(xiàn)實(shí)技術(shù)對(duì)計(jì)算機(jī)設(shè)備的應(yīng)用分類也越來(lái)越具體,越來(lái)越廣泛。相應(yīng)的計(jì)算機(jī)設(shè)備也應(yīng)用到虛擬現(xiàn)實(shí)技術(shù)的對(duì)應(yīng)環(huán)節(jié)上。虛擬現(xiàn)實(shí)技術(shù)是一個(gè)極具潛力的前沿研究方向,是面向21世紀(jì)的重要技術(shù)之一。它在理論,軟硬件環(huán)境的研究方面依賴于多種技術(shù)的綜合,其中有很多技術(shù)有待完善??梢灶A(yù)見,隨著技術(shù)的發(fā)展,虛擬現(xiàn)實(shí)技術(shù)及其應(yīng)用會(huì)越來(lái)越廣泛。
參考文獻(xiàn):
[1]陳浩磊,鄒湘軍,陳燕,劉天湖.虛擬現(xiàn)實(shí)技術(shù)的最新發(fā)展與展望[J].中國(guó)科技論文在線,2011.
[2]王延汀.談?wù)劰庾佑?jì)算機(jī).現(xiàn)代物理知識(shí),2004,(16).
[3]陳連水,袁鳳輝,鄧放.分子計(jì)算機(jī).分子信息學(xué),2005,(3).
毫無(wú)疑問(wèn),聽覺(jué)和視覺(jué)是最容易被欺騙的。這兩種感覺(jué)通過(guò)接收信息時(shí)的微小區(qū)別來(lái)判斷信息的來(lái)源與圖像,而且感受器很小,容易被虛擬的信息覆蓋。
我們通過(guò)兩只耳朵分別接收到聲音的時(shí)間差和音量,由此判斷發(fā)聲物的方位和距離,精確的錄制手段和一套高保真音響足可以讓人們身臨其境?,F(xiàn)在計(jì)算機(jī)軟件控制的音響效果已經(jīng)可以達(dá)到讓人滿意的程度,每次在電腦游戲中轉(zhuǎn)身,聲音的來(lái)源都會(huì)馬上隨之改變。有些歌曲在立體環(huán)繞的效果下讓你能聽到仿佛帶著氣息的呢喃或是飄渺悠遠(yuǎn)的吟唱。
視覺(jué)也是類似的,要呈現(xiàn)立體的視覺(jué)效果,只需要讓兩眼接收到的圖像有輕微不同即可。近年幾部3D大片讓我們?cè)谟霸褐心軌蚩吹缴砼R其境的逼真畫面,類似的設(shè)備也已經(jīng)出現(xiàn)在電腦上,現(xiàn)在3D有線數(shù)字電視也在試行中了。還有更簡(jiǎn)單的辦法:我們可以在兩眼前分別架一塊屏幕,只要屏幕的分辨率夠高、計(jì)算機(jī)的處理能力夠強(qiáng),我們就可以享受完美的立體視覺(jué)體驗(yàn)。聽上去好像挺酷的吧?
這些其實(shí)都只是小兒科一事實(shí)上,這樣的系統(tǒng)已經(jīng)有很多了。軍隊(duì)用這種系統(tǒng)訓(xùn)練飛行員,醫(yī)療機(jī)構(gòu)用它們來(lái)展示人體內(nèi)部的細(xì)微構(gòu)造,博物館用它來(lái)為參觀者提示藏品的歷史,工廠用它們來(lái)幫助設(shè)計(jì)新產(chǎn)品。
與聽覺(jué)和視覺(jué)相比,虛擬嗅覺(jué)和味覺(jué)會(huì)更麻煩一些。我們的嗅覺(jué)和味覺(jué)需要外界實(shí)體的刺激——而非僅僅是信息。嗅覺(jué)是因?yàn)楸乔焕锏男嵊X(jué)細(xì)胞捕捉到了氣味分子,而味覺(jué)則來(lái)源于舌頭上的味蕾與食物分子的接觸。我們不可能通過(guò)數(shù)字技術(shù)虛擬出一個(gè)食物送到嘴邊。2004年,日本開發(fā)出了一種虛擬嗅覺(jué)系統(tǒng)。它的原理和噴墨打印機(jī)類似,在8個(gè)小瓶子中分別裝有8種會(huì)散發(fā)出不同水果香味的液體。當(dāng)使用者帶上特制的手套,在虛擬環(huán)境中拿起某種水果并送到鼻尖時(shí),安裝在手套指尖的微小噴頭就會(huì)釋放出那種水果的味道。我們的嗅覺(jué)世界并不是只由8種水果香氣構(gòu)成的,而且也并非只有用手抓住湊近才能聞到。
2009年,英國(guó)約克大學(xué)和華威大學(xué)了一臺(tái)頭盔式虛擬現(xiàn)實(shí)設(shè)備,不僅提供嗅覺(jué),還可以提供味覺(jué)。這個(gè)叫做“虛擬繭”的裝備構(gòu)成了迄今為止最全面的體驗(yàn)系統(tǒng)。兩個(gè)鏡片式的高清顯示器帶來(lái)立體視覺(jué),一套高保真立體聲耳機(jī)讓你如同身在其境,能夠吹出熱風(fēng)和冷風(fēng)的風(fēng)扇讓你冷暖自知,一套嗅覺(jué)模擬器,還有一個(gè)連接著導(dǎo)管的可以放在嘴里的海綿球,海綿球后連著味覺(jué)發(fā)生器的導(dǎo)管,它會(huì)釋放出帶有5種味道的液體,舔一舔海綿球就能嘗到。雖然這種方式與口感并不雅觀和怡人,但畢竟好過(guò)沒(méi)有。雖然舌頭上不同區(qū)域?qū)τ谖兜赖拿舾谐潭炔煌@種方式也無(wú)法讓人的牙齒感受到那些食品帶來(lái)的感覺(jué),而且嘴里塞進(jìn)一個(gè)海綿球肯定會(huì)影響說(shuō)話,但是我們目前還沒(méi)有比這更好的辦法來(lái)模擬味覺(jué)。不過(guò)至少這些英國(guó)的研究者很貼心,他們提供的5種味道意包含了肉味,這應(yīng)該會(huì)讓受試者感到愉悅吧。
戴上這套頭盔會(huì)讓使用者看起來(lái)像未來(lái)戰(zhàn)士或者宇航員,更不要說(shuō)除此之外還有一副遍布傳感器和動(dòng)力裝置的手套一它可以讓使用者在虛擬環(huán)境中摸到“現(xiàn)實(shí)”。使用觸覺(jué)感受器來(lái)虛擬現(xiàn)實(shí)的想法很早就有了,微軟創(chuàng)始人比爾·蓋茨在他1995年的那本暢銷書《未來(lái)之路》中,認(rèn)為將來(lái)可能會(huì)出現(xiàn)一種遍布著傳感器的緊身衣,可以讓人們體驗(yàn)完美的虛擬觸覺(jué)。但是蓋茨的這種夢(mèng)想,也許還需要十年甚至更長(zhǎng)的時(shí)間才會(huì)實(shí)現(xiàn)。原因很簡(jiǎn)單:人的觸覺(jué)感受器實(shí)在是太多,如果要精確模擬觸覺(jué)的話,所需要的處理能力和動(dòng)力裝置的數(shù)量都相當(dāng)驚人。比如,遍布在我們?nèi)砥つw下的數(shù)十萬(wàn)個(gè)天然感受器可以感受冷覺(jué)、熱覺(jué)、痛覺(jué)、壓力感等不同的感覺(jué),這使得蓋茨的緊身衣在現(xiàn)今階段看起來(lái)還只是科幻。
關(guān)鍵詞: 立體視頻資源 鏡頭 場(chǎng)景 關(guān)鍵幀
1.引言
隨著多媒體技術(shù)的快速發(fā)展,立體視頻逐漸融入人們的日常生活中,應(yīng)用領(lǐng)域不斷擴(kuò)大,已經(jīng)廣泛應(yīng)用于軍事、醫(yī)療、虛擬現(xiàn)實(shí)、教育科研等領(lǐng)域,尤其是教育領(lǐng)域的應(yīng)用不斷增加,同時(shí)產(chǎn)生大量立體視頻資源。常見的立體視頻以雙目立體視頻為主,通常采用雙路分離、左右合成、上下合成等格式表示,并通過(guò)紅藍(lán)或者偏光等形式顯示和觀看。隨著立體視頻資源的增多,立體視頻資源存儲(chǔ)入庫(kù)成為亟待解決的問(wèn)題。本文主要解決雙目立體視頻的存儲(chǔ)入庫(kù)。
2.立體視頻的本質(zhì)特征
立體視頻幀的本質(zhì)特征是視頻幀本身所蘊(yùn)含的特征信息,包括視頻幀的顏色特征、紋理特征、形狀特征、視差特征、深度特征,等等。
顏色特征是數(shù)字圖像領(lǐng)域中應(yīng)用最廣的特征之一,提取圖像的顏色特征分為三步:選取顏色空間、顏色區(qū)間量化、相似性計(jì)算。顏色空間是一種通過(guò)特殊規(guī)則加以說(shuō)明的顏色集合體,數(shù)字圖像上幾乎任何一種顏色都能在顏色空間找到對(duì)應(yīng)的點(diǎn),常用的顏色空間:RGB顏色空間,HSV顏色空間,YUV顏色空間。紋理特征是一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的視覺(jué)特征,是物體表面特性,例如高山、小橋、石頭、衣服等都有各自的紋理特征。紋理特征包含物體表面結(jié)構(gòu)組織排列的重要信息及其與周圍環(huán)境的聯(lián)系。形狀特征是指一個(gè)物體的外部輪廓,與顏色特征和紋理特征相比,形狀特征在描述立體視頻內(nèi)容時(shí)更具有語(yǔ)義含義。形狀特征首先需要對(duì)圖像分割,把對(duì)象提取出來(lái),再用各種方法進(jìn)行匹配測(cè)量。對(duì)于形狀特征的描述方法有:邊界特征法、傅里葉形狀描述法、集合參數(shù)法、最小生成樹等[1]。
與2D視頻相比,立體視頻增加了視差和深度特征。立體電影的制作就是利用了雙目視差的原理。在拍攝時(shí),使用兩臺(tái)攝像機(jī)相距幾厘米同時(shí)進(jìn)行拍攝。放映時(shí),把兩個(gè)影像同時(shí)放映在屏幕上,觀眾戴上立體眼鏡使左右兩眼的像落在視網(wǎng)膜上的非對(duì)應(yīng)點(diǎn),并產(chǎn)生一定的差異,從而產(chǎn)生立體視覺(jué)。
雙目視差是指兩眼注視外界物體時(shí),兩個(gè)視網(wǎng)膜上視像之間的差異。距離和深度知覺(jué),主要依賴雙目視差,它是形成立體視覺(jué)的最重要的依據(jù)。人的雙眼結(jié)構(gòu)相同,雙眼間的距離大約是6.5cm,當(dāng)人們觀看三維物體時(shí),物體投射在左右眼睛上的像并不完全落在視網(wǎng)膜上的對(duì)應(yīng)區(qū)域,左眼看物體的左邊多一些,右眼看物體的右邊多一些,三維物體在雙眼視網(wǎng)膜上的像就存在差異,稱為雙目視[2]。深度信息反映了所拍攝物體到相機(jī)的距離,獲得深度信息的方式有兩種;第一種是通過(guò)拍攝儀器直接獲得,但通過(guò)這種方式獲得的深度信息往往分辨率低,并且需要很大的計(jì)算復(fù)雜度,對(duì)硬件設(shè)備要求很高,一般情況下難以達(dá)到實(shí)時(shí)拍攝的需求。第二種深度信息的獲取是靠幾何學(xué)知識(shí),利用已知參數(shù)的攝像機(jī)拍攝出的雙目視頻,利用立體匹配計(jì)算出視差后,反推視頻對(duì)象的深度信息[2]。隨著立體匹配技術(shù)的不斷完善,現(xiàn)在已形成許多各具特色的匹配算法。已有算法根據(jù)匹配準(zhǔn)則的不同,大致可以分為兩大類:一類是局部匹配算法;另一類是全局匹配算法。全局匹配算法與局部匹配算法相比,匹配準(zhǔn)確性較高,可以獲得較高精度的稠密視差圖,但是往往計(jì)算量大、耗時(shí)比較長(zhǎng)、不易于硬件實(shí)現(xiàn),無(wú)法應(yīng)用于實(shí)時(shí)系統(tǒng)??傊瑑深惲Ⅲw匹配算法各有優(yōu)缺點(diǎn),適用于不同的情況和空間場(chǎng)景[3]。
3.建立立體視頻存儲(chǔ)入庫(kù)模型
視頻結(jié)構(gòu)一般分為視頻、場(chǎng)景、鏡頭、視頻幀四個(gè)層次[4]。本文主要對(duì)立體視頻資源的鏡頭、場(chǎng)景、關(guān)鍵幀三個(gè)方面進(jìn)行研究,建立立體視頻資源存儲(chǔ)入庫(kù)模型。
3.1立體視頻鏡頭分解存儲(chǔ)入庫(kù)
鏡頭是由時(shí)間上連續(xù)的幀構(gòu)成,同一個(gè)鏡頭內(nèi)的內(nèi)容具有一致性。通過(guò)判斷連續(xù)幀之間的差異確定鏡頭的邊界。根據(jù)鏡頭邊界的不同,可分鏡頭的突變和鏡頭的漸變。鏡頭突變是指一個(gè)鏡頭內(nèi)容的變化發(fā)生在單個(gè)視頻幀上。鏡頭漸變是指相鄰的兩個(gè)鏡頭的變換是逐漸完成的,在鏡頭切換的時(shí)候加入編輯特效,達(dá)到視覺(jué)上平滑過(guò)渡的效果。根據(jù)編輯特效的不同,鏡頭的漸變可以分為淡入(fade in)、淡出(fade out )、溶解(dissolve)、擦拭(wipe)等不同類型。淡入是指畫面亮度不斷增強(qiáng);淡出是指畫面亮度慢慢變暗最終消失;溶解是指鏡頭的幀逐漸變淡退出;擦拭是指后一個(gè)鏡頭的畫面慢慢代替前面的一個(gè)鏡頭的畫面。
目前立體視頻鏡頭分割算法大多是基于2D視頻的,立體視頻鏡頭分割算法還不成熟,2D視頻的鏡頭邊界檢測(cè)算法主要分為兩大類:基于像素域的方法和基于壓縮域的方法。像素域中鏡頭邊界檢測(cè)方法主要利用時(shí)空域中的顏色、紋理、形狀等特征進(jìn)行檢測(cè)。像素域中的算法主要有像素比較法,基于直方圖的方法,塊匹配法,基于邊緣的方法。由于現(xiàn)在大多數(shù)視頻序列以壓縮格式存儲(chǔ),對(duì)這些壓縮形式的視頻流直接進(jìn)行邊界檢測(cè),節(jié)省大量解壓縮時(shí)間。目前壓縮域中的主要有基于DCT系數(shù)的方法,基于小波變化的方法,時(shí)空分析法。
雖然2D視頻的鏡頭分割算法能完成立體視頻資源存儲(chǔ)入庫(kù)的預(yù)處理工作,但是運(yùn)用2D視頻鏡頭分割算法處理雙目立體視頻時(shí),檢測(cè)結(jié)果往往存在一定誤差,并且不能很好地檢測(cè)鏡頭漸變的完整邊界變化,在2D視頻的鏡頭分割算法的基礎(chǔ)上,提取立體視頻的深度特征,進(jìn)行鏡頭邊界檢測(cè),從而提高鏡頭邊界的檢測(cè)精度,實(shí)現(xiàn)對(duì)立體視頻的鏡頭準(zhǔn)的確分割?;诹Ⅲw視頻鏡頭分割算法,對(duì)立體視頻資源存儲(chǔ)入庫(kù)。
3.2立體視頻場(chǎng)景分解存儲(chǔ)入庫(kù)
場(chǎng)景是由連續(xù)鏡頭組成的視頻片段,是表達(dá)一個(gè)完整情節(jié)的邏輯故事單元。
立體視頻場(chǎng)景分割,以鏡頭作為研究對(duì)象,根據(jù)鏡頭的內(nèi)容相關(guān)性和時(shí)間上的鄰近性把相似的鏡頭劃分到同一場(chǎng)景中,這樣一段視頻被分割成若干個(gè)有意義的邏輯故事單元。
目前立體視頻場(chǎng)景分割算法大多是基于2D視頻的,立體視頻場(chǎng)景分割算法還不成熟。大體上通過(guò)提取鏡頭的視覺(jué)特征,把內(nèi)容相關(guān)時(shí)間相近的鏡頭聚類成一個(gè)場(chǎng)景,或者綜合視覺(jué)信息和聽覺(jué)信息劃分場(chǎng)景[5]。
與傳統(tǒng)的2D視頻場(chǎng)景分割不同,立體視頻利用立體視頻鏡頭分割算法的結(jié)果,結(jié)合立體視頻顏色特征、紋理等本質(zhì)特征,通過(guò)鏡頭聚類,檢測(cè)場(chǎng)景邊界,利用立體視頻的深度特征,實(shí)現(xiàn)對(duì)場(chǎng)景的準(zhǔn)確分割,基于立體視頻場(chǎng)景分割算法,對(duì)立體視頻資源存儲(chǔ)入庫(kù)。
3.3立體視頻關(guān)鍵幀分解存儲(chǔ)入庫(kù)
幀是立體視頻的基本組成單位,立體視頻的每一幀都可以看成空間上獨(dú)立、時(shí)間上相關(guān)的靜止圖像??臻g上獨(dú)立體現(xiàn)在立體視頻的每一幀都可以進(jìn)行分析處理,時(shí)間上相關(guān)體現(xiàn)在時(shí)間軸上相鄰的幀一般會(huì)有內(nèi)容上的相似性。
由于立體視頻中,幀的數(shù)量巨大,可以用關(guān)鍵幀描述鏡頭和場(chǎng)景。這樣既充分描述了視頻內(nèi)容,又減少了冗余信息。關(guān)鍵幀就是能描述立體視頻內(nèi)容主要的幀。根據(jù)立體視頻結(jié)構(gòu)的復(fù)雜程度,關(guān)鍵幀可以由一幀或者多個(gè)幀組成。
目前立體視頻關(guān)鍵幀提取算法主要是:基于鏡頭邊界提取關(guān)鍵幀,基于運(yùn)動(dòng)分析提取關(guān)鍵幀,基于圖像信息提取關(guān)鍵幀,基于鏡頭活動(dòng)性提取關(guān)鍵幀,基于聚類的方法提起關(guān)鍵幀。
Zhang,Wu[6]等人依據(jù)幀間的顯著變化來(lái)為2D視頻選擇多個(gè)關(guān)鍵幀,首先把鏡頭的第一幀作為關(guān)鍵幀,然后計(jì)算前一個(gè)關(guān)鍵幀與剩余幀之差,如果差值大于某一閾值,則再選取一個(gè)關(guān)鍵幀。與2D視頻不同,立體視頻依據(jù)幀間的顯著變化,再加上立體視頻的深度信息構(gòu)建相鄰幀差,實(shí)現(xiàn)對(duì)關(guān)鍵幀的準(zhǔn)確提取,基于立體視頻關(guān)鍵幀提取算法,對(duì)立體視頻資源存儲(chǔ)入庫(kù)。
4.結(jié)語(yǔ)
在2D視頻的鏡頭分割算法上基礎(chǔ)上,增加立體視頻的深度特征,得出立體視頻鏡頭分割算法,進(jìn)而研究出立體視頻場(chǎng)景分割算法和關(guān)鍵幀提取算法,從鏡頭、場(chǎng)景、關(guān)鍵幀三個(gè)方面實(shí)現(xiàn)對(duì)立體視頻資源高效的管理及利用。對(duì)立體視頻資源存儲(chǔ)入庫(kù)的同時(shí),增加了立體視頻素材,緩解了立體視頻資源匱乏的現(xiàn)狀。
參考文獻(xiàn):
[1]印勇,侯海珍.基于直方圖幀差的自適應(yīng)鏡頭分割算法[J].計(jì)算機(jī)工程與應(yīng)用,2010,09:186-189.
[2]王波.雙目視差的立體視覺(jué)及其在技術(shù)課程教育中的應(yīng)用[D].浙江工業(yè)大學(xué),2012.
[3]楊志榮.雙目視覺(jué)立體匹配方法和遮擋問(wèn)題研究[D].燕山大學(xué),2010.
[4]Yong Rui,Huang,T.S,Mehrotra, S, “Exploring video structure beyond the shots,”in Multimedia Computing and Systems,1998. Proceedings. IEEE International Conference on,vol,no, pp.237-240,28 Jun-1 Jul 1998.
[5]王旭軍.視頻場(chǎng)景分割方法研究[D].重慶大學(xué),2010.
目前,電腦上實(shí)現(xiàn)3D技術(shù)的投入不算貴,而且獲取3D片源和3D游戲相對(duì)容易。所以,有不少用戶都想購(gòu)買一款3D顯示器,率先實(shí)現(xiàn)3D家庭娛樂(lè)。市面上的3D顯示器已經(jīng)有很多型號(hào),但是3D技術(shù)復(fù)雜多樣,優(yōu)缺點(diǎn)不一,快門的、偏光的、NVIDIA的、AMD的、軟件的、硬件的……如何選擇一款合適的3D顯示器?各種3D技術(shù)之間在顯示效果上有什么區(qū)別?對(duì)硬件有什么樣的需求?就讓《微型計(jì)算機(jī)》評(píng)測(cè)室來(lái)做一次小白鼠,把市面上不同類型的3D顯示器都感受一番,為你帶來(lái)最真實(shí)的測(cè)試體驗(yàn)。
3D顯示器的原理
要深入了解3D顯示器,我們首先應(yīng)該從原理入手了解立體圖像在人眼中是如何形成的。人眼能夠感受三維立體世界的主要原因就是因?yàn)槿搜塾须p眼視差。用兩只眼睛去觀察世界,因?yàn)閹缀喂鈱W(xué)投影到人兩只眼睛的距離不同、角度不同,會(huì)造成不同的視差。視差圖像在腦部區(qū)域融合,就產(chǎn)生了生理立體視覺(jué),能夠感知客觀事物的深度。傳統(tǒng)顯示設(shè)備上顯示的二維圖像無(wú)論是在左眼還是在右眼所形成的圖像是一樣的,雖然我們也能判斷圖像中物體、人物的距離關(guān)系,但是這是由心理立體視覺(jué)形成的,主要通過(guò)遮擋、陰影、幾何透視和結(jié)構(gòu)極差等因素來(lái)判斷。真正能夠形成生理立體視覺(jué)的主要因素,還是雙眼的視差信息。
在了解了立體圖像在人眼中形成的主要原因后,我們就能夠明白3D顯示器為什么能神奇地在二維平面上模擬出三維的圖像了。3D顯示器想辦法在平面上同時(shí)顯示有視差的兩幅畫面,然后通過(guò)技術(shù)手段對(duì)兩個(gè)畫面的內(nèi)容進(jìn)行過(guò)濾,讓左眼應(yīng)該看到的畫面進(jìn)入左眼,右眼應(yīng)該看到的畫面進(jìn)入右眼,就能在人的大腦中組合出一幅有視差的立體圖像了。那么,用什么樣的方式對(duì)左右眼的畫面分別進(jìn)行過(guò)濾,就是3D顯示器的核心技術(shù)。
目前,市場(chǎng)上主流的3D顯示器根據(jù)原理分為快門式和偏光式(偏振式)兩種。
快門式3D顯示器是一種主動(dòng)式3D技術(shù),它的3D成像原理是讓顯示器的刷新率從60Hz提升到120Hz,然后讓左右眼畫面隔幀連續(xù)顯示,通過(guò)紅外信號(hào)發(fā)射器同步快門式3D眼鏡的左右液晶鏡片開關(guān),輪流遮擋左右眼的畫面,讓兩眼看到不同的畫面。如此遮擋后的單眼畫面幀率同樣為每秒60幀,而且保證了原始分辨率不下降。
快門式3D顯示器
畫面畫質(zhì)無(wú)損失,保持全高清分辨率。
亮度降低嚴(yán)重、有閃爍感、在3D游戲中性能會(huì)下降。
快門式3D顯示器原理示意圖
左眼看到的圖像信息
右眼看到的圖像信息
人眼看物體有明顯視差,然后通過(guò)視差產(chǎn)生立體感。
偏光式3D顯示器
畫面不閃爍、顯示器和眼鏡的成
本低。
畫面分辨率會(huì)降低、畫面可能會(huì)有抽絲感,文字顯示質(zhì)量受影響。
偏光式3D顯示器原理示意圖
偏光式屬于被動(dòng)式3D技術(shù)。它的3D成像原理是利用光線有“振動(dòng)方向”的特質(zhì),通過(guò)顯示器上的偏光膜將圖像進(jìn)行分解。使顯示器在正常顯示狀態(tài)下所顯示的單一畫面分解為垂直向偏光光、水平向偏光光兩個(gè)獨(dú)立的畫面,而使用者戴上左右分別采用不同偏光方向的偏光鏡片后,就能使雙眼分別看到不同的畫面并傳遞給大腦,進(jìn)而形成3D影像。
其實(shí)我們使用的普通顯示器也可以實(shí)現(xiàn)3D立體播放,通過(guò)色分法,將左右眼畫面分成紅藍(lán)、紅綠兩種畫面,然后通過(guò)對(duì)應(yīng)的紅藍(lán)、紅綠眼鏡過(guò)濾。只是這種3D畫面毫無(wú)色彩可言,不適合商用。而以上介紹的快門式和偏光式3D技術(shù)則是目前市場(chǎng)上3D顯示器所使用的主流技術(shù),但是這些技術(shù)仍然還不夠成熟,所以優(yōu)缺點(diǎn)都非常明顯。
3D顯示器方案解析
目前快門式3D顯示器主要集中在兩種方案上,一種是NVIDIA的3D Vision方案,另一種是AMD的HD3D方案,兩種方案都需要搭配各家的顯卡、120Hz顯示器和快門式眼鏡。支持NVIDIA方案的顯示器品牌和型號(hào)眾多,眼鏡單獨(dú)購(gòu)買方便。支持AMD HD3D方案的快門式顯示器也很多,它們除了需要AMD顯卡之外,還需要安裝TriDef 3D軟件,該軟件也是除了3D Vision之外的其他3D顯示器必須安裝的。
而偏光式3D顯示器主要是由LG Display提供面板,搭配偏光眼鏡,對(duì)顯卡類型沒(méi)有要求,但是在使用過(guò)程中也需要TriDef 3D軟件的支持。以上這些類型的3D顯示器對(duì)圖像的分時(shí)處理都是由視頻發(fā)射端完成,比如由電腦完成?,F(xiàn)在有一些3D顯示器安裝有3D處理芯片,即使接收的是2D圖像,也可以一鍵處理為3D圖像。這種類型的3D顯示器既有快門式,也有偏光式,在本次測(cè)試中我們都會(huì)一一介紹。
測(cè)試目的
液晶顯示器的3D化是目前日益同質(zhì)化的顯示器市場(chǎng)中,廠商找尋差異化發(fā)展的一條重要道路。但在簡(jiǎn)簡(jiǎn)單單的“3D”二字的背后,卻有著兩種實(shí)現(xiàn)技術(shù),三類解決方案,更有通過(guò)顯示器內(nèi)置芯片實(shí)現(xiàn)3D的方案穿插其中,讓消費(fèi)者在選購(gòu)時(shí)無(wú)所適從。為了讓讀者能從紛繁復(fù)雜的3D顯示器市場(chǎng)中,了解各種方案各自的優(yōu)勢(shì)、劣勢(shì),找到適合自己的產(chǎn)品,《微型計(jì)算機(jī)》評(píng)測(cè)室特地組織了此次涵蓋市面上所有三種解決方案的3D顯示器的無(wú)差別體驗(yàn)。每類解決方案選擇三款最具代表性的產(chǎn)品,從尺寸、功能等方面涵蓋每類方案下具備差異化的產(chǎn)品,務(wù)求將目前市面上所有典型類型的3D顯示器收羅齊全。
測(cè)試方法
三種3D顯示方案,九款3D顯示器,讀者最關(guān)心它們什么?這是《微型計(jì)算機(jī)》評(píng)測(cè)室在測(cè)試前最先考慮的問(wèn)題。最終,我們找到了游戲這一關(guān)鍵詞。哪種方案對(duì)游戲的兼容性最好?哪種方案在游戲中的畫質(zhì)更出色,立體感更強(qiáng)?這是許多人在看到3D顯示器時(shí),最先想到的問(wèn)題。因此我們確定了以游戲體驗(yàn)為主,輔以客觀性能測(cè)試的評(píng)測(cè)方法。據(jù)此我們?cè)O(shè)置了包括3D游戲兼容性、3D游戲畫質(zhì)、3D游戲立體感等在內(nèi)的體驗(yàn)項(xiàng)目,選擇的游戲以熱門FPS游戲?yàn)橹?,包括《?zhàn)地3》、《使命召喚8》,同時(shí)加入不同類型的游戲,比如受眾眾多的《FIFIA 11》,賽車類游戲《DIRT 3》。而針對(duì)讀者一直很關(guān)心的不同解決方案的3D顯示器,在戴上眼鏡后畫面亮度的衰減,我們也加入其中。
由于NVIDIA和AMD的方案分別只支持自家顯卡,所以我們?cè)诖罱ㄆ脚_(tái)時(shí)分別選擇了GeForce GTX 580和Radeon HD 6950兩款顯卡。客觀性能測(cè)試則通過(guò)價(jià)值十幾萬(wàn)元的美能達(dá)CS-200分光色度儀進(jìn)行測(cè)試,保證各項(xiàng)數(shù)值的準(zhǔn)確性。
測(cè)試項(xiàng)目
3D立體感/3D游戲兼容性/3D游戲負(fù)載需求
3D畫質(zhì)優(yōu)劣/3D方案價(jià)格對(duì)比
PS3藍(lán)光輸入兼容性
亮度
對(duì)比度
亮度不均勻性
NTSC色域范圍
測(cè)試工具
柯尼卡美能達(dá)CS-200分光色度儀
ColorFacts Test Patterns
測(cè)試環(huán)境
密閉的影音實(shí)驗(yàn)室
殊途同歸 三種3D顯示方案
NVIDIA 3D Vision
作為最早推廣主動(dòng)式快門技術(shù)的NVIDIA,其3D Vision已經(jīng)推出了兩代。就技術(shù)而言,它們并無(wú)不同,因?yàn)闊o(wú)論是第一代還是第二代3D Vision眼鏡,都能在任何一臺(tái)支持3D Vision技術(shù)的顯示器(內(nèi)置接收器或USB接口的外置接收器)上正常工作。它們的區(qū)別主要在于眼鏡的設(shè)計(jì)。第二代眼鏡的鏡片面積增大了20%,透光性更好,更適合27英寸的大尺寸3D顯示器。另外3D Vision 2還帶來(lái)了“3D LightBoost”畫質(zhì)增強(qiáng)技術(shù),3D LightBoost技術(shù)號(hào)稱可將3D圖像的亮度提高最多一倍。所以要識(shí)別產(chǎn)品是第一代還是第二代很簡(jiǎn)單,一是看眼鏡,二是看顯示器是否具有3D LightBoost功能。而只憑接收器內(nèi)置與否是不能作為判別標(biāo)準(zhǔn)的。
組建3D Vision的3D顯示平臺(tái),首先需要一臺(tái)支持3D Vision的120Hz顯示器,還必須使用NVIDIA的顯卡,而且需要GeForce 8系列及以上系列的顯卡。系統(tǒng)方面,雖然使用Windows XP的游戲玩家已經(jīng)不多,不過(guò)還是提醒一下,3D Vision只支持Windows Vista和Windows 7。最后,還必須采用24針的DVI-D Dual-Link或者HDMI接口連接PC。下面以華碩VG27H為例展示3D Vision的安裝過(guò)程。
1.用24針的DV I-D Dual-Link線連接顯卡和顯示器(平時(shí)常見的18針DVI線是不行的)。
2.安裝最新的NVIDIA驅(qū)動(dòng)程序,重啟后在桌面點(diǎn)擊右鍵,進(jìn)入NVIDIA控制面板,在右側(cè)菜單欄中選擇“設(shè)置3D立體視覺(jué)”。
3.點(diǎn)擊“啟用3D立體視覺(jué)”,第一次運(yùn)行會(huì)自動(dòng)進(jìn)入“設(shè)置向?qū)А?,系統(tǒng)會(huì)檢測(cè)你的設(shè)備連接情況,讓你選擇游戲環(huán)境,指導(dǎo)你打開眼鏡以及測(cè)試硬件設(shè)置。
關(guān)鍵詞:面形檢測(cè); 圖像預(yù)處理; 區(qū)域立體匹配; 面形實(shí)驗(yàn)
中圖分類號(hào): TN 247 文獻(xiàn)標(biāo)志碼: A doi: 10.3969/j.issn.10055630.2015.05.005
Abstract:The projection method, that is a method of 3D surface profile detection based on the combination of linear structured light scanning measurement and stereoscopic vision measurement, can detect the surface profile of optical component online quickly and accurately. In this paper,an image processing algorithm is presented including preprocessing, areabased stereo matching, curve fitting and surface characterization testing, to recover the surface profile model of optical component. The results of the experiments show that this method can reconstruct the threedimensional exterior characteristics of the optical component truly and accurately. Therefore, the research is feasible and has research value.
Keywords: surface characterization inspection; image preprocessing; areabased stereo matching; surface characterization experiment
引 言
在光學(xué)儀器制造領(lǐng)域中,準(zhǔn)確地檢測(cè)和評(píng)定光學(xué)元件面形對(duì)提高光學(xué)元件加工表面的質(zhì)量,研究光學(xué)元件表面的幾何特性,探究光學(xué)元件的使用性能等都有著至關(guān)重要的意義。依據(jù)透鏡面形檢測(cè)理論,搭建實(shí)驗(yàn)平臺(tái)并利用MATLAB和VC++軟件進(jìn)行重建模擬。
1 測(cè)量原理
本文采用基于投影的檢測(cè)方法[14],原理如圖1所示,線結(jié)構(gòu)光垂直入射被測(cè)光學(xué)元件表面形成全反射,立體視覺(jué)系統(tǒng)采集多組線結(jié)構(gòu)光全反射圖片,通過(guò)MATLAB及VC++軟件對(duì)原始圖片進(jìn)行圖像處理,進(jìn)而重建光學(xué)元件的三維面形,算法流程如圖2所示。
2 圖像預(yù)處理
由于受到外界環(huán)境,人為因素的多種干擾和限制,實(shí)驗(yàn)采集到的原始圖片并不能直接應(yīng)用,需要進(jìn)行圖像濾波和直方圖均衡化處理,目的是為了去除噪聲影響和平衡圖像對(duì)的亮度差異。濾波后的圖像對(duì)如圖3所示,直方圖均衡化的圖像對(duì)如圖4所示。
3 基于區(qū)域的立體匹配分析
3.1 匹配原理
本文采用區(qū)域立體匹配[57],原理如圖5所示。假設(shè)一個(gè)像素點(diǎn)的鄰域像素點(diǎn)和該點(diǎn)具有相同的視差,在基準(zhǔn)圖左圖上選擇一點(diǎn)P(x,y)作為待匹配點(diǎn),以該點(diǎn)的像素坐標(biāo)作為中心點(diǎn),選擇尺寸大小為W×W匹配窗口,此時(shí)在右圖中以d為搜索范圍計(jì)算同一極線上P(x,y)與P′(x+i,y)(i=1,2,…,d)的相似度,P′(x+i,y)(i=1,2,…,d)中的每個(gè)點(diǎn)跟P(x,y)一樣都要?jiǎng)?chuàng)建一個(gè)大小為W×W的像素鄰域,計(jì)算左右兩幅圖像中窗口包含的灰度值之間的相似性差異,用相關(guān)函數(shù)來(lái)表示,當(dāng)兩幅圖像的一致性度量達(dá)到最大值,就認(rèn)為與點(diǎn)P(x,y)匹配成功,匹配過(guò)程如圖6所示。
實(shí)驗(yàn)選取9×9的匹配窗口,采用TSUKUBA提供的立體圖像對(duì)來(lái)分析這三種不同算子得到視差圖的差異。如圖7(a)、(b)所示為原始圖像對(duì),輸出的理想視差圖如圖7(c)所示,不同算子得到的視差圖如圖7(d)、(e)、(f)所示。將不同算子得到的視差圖與理想視差圖進(jìn)行比較可知,SAD算子得到的視差圖精確度略高于SSD算子和NCC算子,且該算子匹配速度較快,故本文實(shí)驗(yàn)選用SAD算子進(jìn)行立體匹配實(shí)驗(yàn)。
3.3 匹配窗口分析
較為常用的區(qū)域立體匹配窗口有5×5、7×7、9×9、11×11。匹配窗口越小得到的視差圖細(xì)節(jié)輪廓越清晰,但同時(shí)產(chǎn)生的雜點(diǎn)較多,在視覺(jué)上有破碎感;匹配窗口越大得到的視差圖整體平滑性較好,但細(xì)節(jié)輪廓較模糊。
實(shí)驗(yàn)選取SAD算子,仍然采用TSUKUBA提供的立體圖像對(duì)來(lái)分析不同匹配窗口得到視差圖的差異,如圖8(a)、(b)、(c)、(d)所示。
由圖8可知,匹配窗口越大,獲得視差圖的細(xì)節(jié)和邊緣越模糊,但同時(shí)虛假匹配點(diǎn)產(chǎn)生的越少,圖像也越平滑。因此,實(shí)驗(yàn)選用9×9的匹配窗口。
3.4 透鏡區(qū)域立體匹配實(shí)驗(yàn)
本文采用的是平行雙目視覺(jué)系統(tǒng),所以基于區(qū)域的立體匹配過(guò)程只需在左右兩幅圖的同一水平位置上去尋找相應(yīng)的匹配點(diǎn)即可。匹配過(guò)程選用SAD算子和9×9匹配窗口進(jìn)行,圖9為經(jīng)過(guò)圖像處理的視差圖。
4 曲線擬合
用單一像素提取視差圖中圓環(huán)的坐標(biāo)點(diǎn),通過(guò)最小二乘法對(duì)這些坐標(biāo)點(diǎn)進(jìn)行圓擬合獲得圓心坐標(biāo)以及圓半徑,擬合結(jié)果如圖10所示。為了方便進(jìn)行三角剖分,還需要將圖10中的擬合圖進(jìn)行疊加,疊加結(jié)果如圖11所示。
5 光學(xué)元件面形實(shí)驗(yàn)
5.1 光學(xué)元件三維模型重建實(shí)驗(yàn)
在曲線擬合過(guò)程中,已用單一像素提取了視差圖中圓環(huán)和曲線的多個(gè)二維平面坐標(biāo)點(diǎn),為了真實(shí)還原透鏡面形,還需進(jìn)行三維空間坐標(biāo)點(diǎn)的計(jì)算,由于本文搭建的實(shí)驗(yàn)平臺(tái)是平行放置的雙目立體視覺(jué)系統(tǒng),故采用平行雙目立體視覺(jué)系統(tǒng)的三維空間點(diǎn)坐標(biāo)計(jì)算方法[8]來(lái)進(jìn)行二維平面坐標(biāo)點(diǎn)到三維空間坐標(biāo)點(diǎn)的轉(zhuǎn)化。
將得到的三維空間離散坐標(biāo)點(diǎn)進(jìn)行Delaunay 標(biāo)準(zhǔn)的BowyerWatson三角剖分算法[910]來(lái)實(shí)現(xiàn)透鏡的三維面形還原,剖分過(guò)程如圖12所示,并在VC++環(huán)境中使用OpenGL庫(kù),繪出了三維立體透鏡模型圖像如圖13所示。如圖14給出了在MATLAB環(huán)境中還原出來(lái)的透鏡表面的微觀情況。
5.2 Taylor Hobson輪廓儀實(shí)驗(yàn)
Taylor Hobso輪廓儀是通過(guò)儀器的觸針在被測(cè)物表面滑移來(lái)進(jìn)行檢測(cè)的,可以直接按某種評(píng)定標(biāo)準(zhǔn)讀數(shù)或描繪出表面輪廓曲線的形狀,通過(guò)Taylor Hobso輪廓儀檢測(cè)該透鏡,其一維面形圖如圖15所示,透鏡輪廓圖如圖16所示。
5.3 ZYGO干涉儀實(shí)驗(yàn)
ZYGO干涉儀是目前非接觸式檢測(cè)光學(xué)元件面形較為成熟的實(shí)驗(yàn)儀器,能夠還原被測(cè)光學(xué)元件的一維及三維面形圖,可計(jì)算出光學(xué)元件表面最大波峰值與最小波谷值之差的PV值和均方根誤差(RMS)值,其強(qiáng)度圖如圖17所示,一維面形圖如圖18所示,三維面形圖如圖19所示。
5.4 實(shí)驗(yàn)結(jié)果及結(jié)論
投影法實(shí)驗(yàn)對(duì)口徑14 mm,曲率半徑13 mm的球面鏡進(jìn)行的檢測(cè),通過(guò)VC++環(huán)境進(jìn)行三角剖分,得到了透鏡面形的立體三維圖形,同時(shí)利用MATLAB軟件還原出透鏡表面的微觀情況,并計(jì)算出評(píng)價(jià)透鏡表面面形的重要參數(shù)――PV值和RMS值。
Taylor Hobso輪廓儀和ZYGO干涉儀檢測(cè)光學(xué)元件面形的技術(shù)在現(xiàn)階段來(lái)說(shuō)已經(jīng)比較成熟,所以將投影法的檢測(cè)結(jié)果與這兩種檢測(cè)儀的檢測(cè)結(jié)果比較即可驗(yàn)證該檢測(cè)方法的可行性。如表1所示可知,投影法與Taylor Hobso輪廓儀、ZYGO干
涉儀的檢測(cè)結(jié)果中,PV值及RMS值之差約為0.01 μm,對(duì)于一個(gè)口徑較小的透鏡來(lái)說(shuō),這樣的結(jié)果是較為理想的,其結(jié)果與Taylor Hobso輪廓儀、ZYGO干涉儀的檢測(cè)結(jié)果精度較為接近,這樣就驗(yàn)證了結(jié)構(gòu)光投影法檢測(cè)光學(xué)元件的方法是可以滿足通常的檢測(cè)要求,具有一定的可行性。
6 結(jié) 論
本文提出的投影法光學(xué)元件面形檢測(cè)技術(shù),克服了傳統(tǒng)檢測(cè)方法中對(duì)外界環(huán)境要求嚴(yán)格的諸多不足之處。實(shí)驗(yàn)顯示,該方法能夠檢測(cè)還原光學(xué)元件三維外貌特性,但后期仍需進(jìn)一步優(yōu)化圖像處理算法,提高檢測(cè)精度。
參考文獻(xiàn):
[1]孫國(guó)強(qiáng),許增樸.用于產(chǎn)品造型設(shè)計(jì)的三維反求測(cè)量系統(tǒng)的研究[D].天津:天津科技大學(xué),2007.
[2]王曉林,陳偉民,黃尚廉.光切法三維輪廓測(cè)量的原理及其應(yīng)用[J].光學(xué)技術(shù),1997,3(2):3943.
[3]陳江.二目立體視覺(jué)測(cè)量系統(tǒng)關(guān)鍵技術(shù)研究[D].南京:南京航空航天大學(xué),2006.
[4]高文,陳熙霖.計(jì)算機(jī)視覺(jué)―算法與系統(tǒng)原理[M].北京:清華大學(xué)出版社,1999.
[5]達(dá)飛鵬,蓋紹彥.光柵投影三維精密測(cè)量[M].北京:科學(xué)出版社,2011.
[6]HIRSCHMULLER H.Improvements in realtime correlationbased stereo vision[J].IEEE Workshop on Stereo and MultiBaseline Vision.2001,141148.
[7]劉瑜,劉纏牢,蘇海.一種基于結(jié)構(gòu)光雙目視覺(jué)的特征匹配算法研究[J].光學(xué)儀器,2014,36(2):161166.
[8]何勇.雙目視覺(jué)的車輛場(chǎng)景三維重建方法研究及應(yīng)用[D].合肥:合肥工業(yè)大學(xué),2009.
級(jí)別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:北大期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)