投稿策略

期刊推薦

雜志分類

首頁學(xué)術(shù)雜志科普訂閱 SCI期刊投稿經(jīng)驗期刊咨詢文秘服務(wù) 論著出書出版社

首頁 > 精品范文 > 視覺算法培訓(xùn)

視覺算法培訓(xùn)模板(10篇)

時間：2023-12-26 10:29:09

導(dǎo)言：作為寫作愛好者，不可錯過為您精心挑選的10篇視覺算法培訓(xùn)，它們將為您的寫作提供全新的視角，我們衷心期待您的閱讀，并希望這些內(nèi)容能為您提供靈感和參考。

視覺算法培訓(xùn)

篇1

0 引言

隨著車流量的增加,大量交通信號設(shè)施等因素使駕駛員的視覺環(huán)境變得更加復(fù)雜。在這種復(fù)雜的駕駛環(huán)境中,會嚴(yán)重影響駕駛員的視覺,易于發(fā)生交通事故。因此,駕駛員需集中駕駛保持對交通環(huán)境的認(rèn)知以及理解處理后的視覺信息。擁堵的車輛和行人形成一個高度復(fù)雜的交通環(huán)境,為了行車安全，需要提供更多的視覺處理信息。

1、駕駛行為的視覺特性研究

視覺在“人-車-路”系統(tǒng)中起著關(guān)鍵性作用并在很大程度上影響著駕駛員的決定。對駕駛行為進(jìn)行分析及基于實時視覺分析被稱為EAP系統(tǒng)進(jìn)行研究。此系統(tǒng)針對駕駛員行為進(jìn)行分析并收集同步實用的可嵌入信息,如眼動方向、軌跡跟蹤等。

在此框架中,提出了一個便于分析聚焦面積的司機(jī)駕駛情況,憑借區(qū)域和興趣進(jìn)行自動檢測的新方法。目的是跟蹤工作自動存儲的視頻區(qū)域(ROI)。這里主要研究基于一個最新研發(fā)實時可視化分析工具叫Eye Access Pilot(EAP)系統(tǒng)。這是一種新一代眼動跟蹤分析且不受駕駛員干擾的EAP視覺系統(tǒng)。它是基于圖像處理和數(shù)值算法的實時系統(tǒng),目的是來確定駕駛員眼角度。為了設(shè)計一個能顯示駕駛員行為的預(yù)測模型,眼動與駕駛員的行為相關(guān)性非常重要,能夠?qū)崿F(xiàn)對駕駛員準(zhǔn)確變更車道。EAP視覺系統(tǒng)使用圖像處理技術(shù),尤其是應(yīng)用數(shù)值算法來確定在多種實際駕駛條件下的駕駛員眼睛方位。

用于單眼視覺場景自動感興趣區(qū)域跟蹤已付諸實施。采用固定在駕駛艙的模型具有一定的穩(wěn)定型,這些模式并不干擾駕駛員行為。應(yīng)用更具識別能力的模式以增強(qiáng)精確度的研究正在研究中。通過相關(guān)和定性不同駕駛員視覺行為的研究,結(jié)果通過EAP視覺系統(tǒng)獲得 ,尤其是自動ROI跟蹤,可量化參數(shù)如軌道與視知覺,被認(rèn)為是認(rèn)知模型的主要輸入。

2、視覺-眼動系統(tǒng)在交通方面的應(yīng)用

2.1 使交通信息傳遞更準(zhǔn)確

一些學(xué)者測量了交通標(biāo)志在不同速度下的可視性和駕駛員的識別能力，還有人則測試了交通標(biāo)志的燈光亮度對用戶和駕駛員反應(yīng)時間的影響。目前對交通標(biāo)志的研究大多還局限在對標(biāo)志外觀尺寸、顏色搭配及設(shè)施結(jié)構(gòu)等方面,較少有從駕駛員在駕駛過程中自身特征如眼部運(yùn)動特征的角度來研究。因此我們注重從駕駛員的角度出發(fā)，研究駕駛員在行車過程中的眼部運(yùn)動特征和視認(rèn)特性以及兩者間的聯(lián)系，完善交通標(biāo)志的設(shè)計設(shè)置，更好地發(fā)揮交通標(biāo)志的作用。

2.2 修正道路口通行能力

目前通常以飽和度法計算交叉口的通行能力,涉及到的飽和流率模型將道路要素,交通要素,周邊要素作為其主要影響因素，而忽視了駕駛員因素的影響。事實上，交叉通流率處于不同水平時，駕駛員的視覺特性也會發(fā)生變化，當(dāng)交叉通流率增大時，駕駛員的視覺特性由穩(wěn)定變?yōu)椴环€(wěn)定。應(yīng)用駕駛員在交叉口不同交通流率水平下的視覺-眼動特性參數(shù)，對飽和流率模能力而不是交叉口本身特性所決定的最大通行能力。只有交叉口的設(shè)計考慮了駕駛員因素找出趨于駕駛員行車安全的最大通行能力，設(shè)計方案的實施效果才能真正得到改善。

3、結(jié)語

當(dāng)前視覺-眼動系統(tǒng)在交通方面的研究還主要是使用國外的儀器設(shè)備。隨著眼動儀智能化的進(jìn)一步發(fā)展，硬件的小型化、低成本，眼動在交通方面的應(yīng)用研究將會越來越廣泛，眼動研究與對駕駛員的研究結(jié)合將會更為緊密。根據(jù)駕駛員的視覺特性，在今后的駕駛培訓(xùn)工作中應(yīng)該重視駕駛?cè)嗽谝曈X方面的特性，對目前的駕駛培訓(xùn)工作加以改進(jìn)，提高駕駛?cè)艘曈X信息獲取能力，從而減少駕駛?cè)税l(fā)生交通事故的可能性，減少交通安全隱患，提高交通安全。

參考文獻(xiàn)：

[1]鄧鑄.眼動心理學(xué)的理論技術(shù)及應(yīng)用研究[J].南京師大學(xué)報,社會科學(xué)版,2005,1

[2]馬勇，郭應(yīng)時.基于眼動分析的汽車駕駛員視覺搜索模式研究[D].長安大學(xué):交通運(yùn)輸規(guī)劃與管理,2006,5

篇2

中圖分類號： TN27?34； TM417 文獻(xiàn)標(biāo)識碼： A 文章編號： 1004?373X（2017）01?0140?05

Abstract： The virtual reality technology developed rapidly， and has been widely used in many fields， but the traditional CAVE system is difficult to promote and popularize due to the large floor space， high cost and difficult installation and adjustment， therefore， the research and development of the portable CAVE system has great significance to the popularization and development of the virtual reality technology. According to the features of the portable CAVE system， the visual optical system was designed， the distortion correction of the projected image and random dot stereogram generation algorithm are studied， and the close range stereoscopic display system based on visual optical system adjustment was built. The subjective evaluation experiment of the visual comfort degree was designed and implemented to explore the relationship between the visual fatigue degree and parallax caused by the close range display. The visual comfort degree of the stereoscopic display system based on visual optical system was assessed. This technology provides a reference foundation for the study of the portable CAVE system， and has a certain practical significance to the development of the virtual reality technology and the study of the stereoscopic visual comfort degree.

Keywords： virtual reality； binocular disparity； close range display； visual comfort degree

0 引言

近年恚虛擬現(xiàn)實技術(shù)發(fā)展迅速，已經(jīng)被廣泛應(yīng)用于軍事訓(xùn)練、醫(yī)學(xué)實習(xí)、娛樂游戲等諸多領(lǐng)域。傳統(tǒng)的虛擬現(xiàn)實顯示系統(tǒng)雖然技術(shù)成熟，但存在一些弊端，因此便攜式CAVE系統(tǒng)的概念應(yīng)運(yùn)而生。本文搭建了近距立體顯示原型系統(tǒng)，通過主觀實驗，探究了便攜式CAVE系統(tǒng)中雙目視差的感知深度和單眼聚焦感知深度的差異，以及用戶可接受的視覺舒適范圍，對基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)的視覺舒適度進(jìn)行評估。

1 立體視覺舒適度的評估方法

1.1 刺激方法的選擇

為了避免視差的時間積累效應(yīng)，實驗采用雙刺激連續(xù)分級法。為控制實驗過程中產(chǎn)生的習(xí)慣誤差，不同視差的立體圖按照隨機(jī)序列交替呈現(xiàn)，且各視差出現(xiàn)的次數(shù)相等，整個序列中在前在后的機(jī)會相等。

實驗的具體刺激方法是：將波紋中心在零視差處的刺激物記為基準(zhǔn)圖波紋中心在其他位置的刺激物記為待評估圖每次施測依次顯示三個刺激物，其順序為或者其目的是強(qiáng)迫用戶改變雙眼的輻輳角度。每個刺激物顯示1.5 s，三個刺激物共顯示4.5 s，不同視差的待評估圖像隨機(jī)出現(xiàn)。被試者要獨(dú)立地進(jìn)行觀測，選出其中一個與其他兩個波動方向不同的刺激物，并對該過程的視覺舒適度進(jìn)行主觀評分。同一組圖像需隨機(jī)顯示兩次以便對評分結(jié)果進(jìn)行一致性檢查。

1.2 反應(yīng)指標(biāo)的選擇

反應(yīng)指標(biāo)的選擇應(yīng)依據(jù)以下原則：

（1）無害性。所選取的反應(yīng)指標(biāo)不應(yīng)對被試者產(chǎn)生身體傷害，同時不能對被試者產(chǎn)生負(fù)面心理影響，阻礙實驗的繼續(xù)進(jìn)行。

（2）無干擾性。所選取的反應(yīng)指標(biāo)在測量過程中不能干擾被試者正常觀看圖像。

（3）敏感性。所選反應(yīng)指標(biāo)應(yīng)該能夠有效地反應(yīng)出視覺舒適度和視覺疲勞程度。

根據(jù)分析，實驗主要采用主觀評估方法對視覺舒適度進(jìn)行研究。主觀評價方法更適用于對視覺舒適度進(jìn)行綜合評價。舒適度的主觀評價方法[1]主要是讓被試者在觀看立體圖像前后根據(jù)自身的視覺狀況填寫問卷，并對問卷的結(jié)果進(jìn)行統(tǒng)計分析。

1.3 主觀量表設(shè)計方法

主觀量是指用戶對客觀刺激產(chǎn)生的主觀度量，又稱心理量[2]。在視覺實驗中，主觀評估方法需對被試者心理量進(jìn)行測量。主觀實驗中的心理度量表主要包括：強(qiáng)迫選擇度量表、圖示度量表和數(shù)值度量表。

（1）強(qiáng)迫選擇度量表。強(qiáng)迫選擇度量表是在主觀評估實驗時主試者提供一些對立相反的詞語讓被試者做出選擇。強(qiáng)迫選擇度量表可以避免被試者受到他人的影響，但可能會使被試者產(chǎn)生抵觸情緒，因為大多數(shù)人不愿意讓自己處于兩難選擇的境地。

（2）圖示度量表。圖示度量表好比一個溫度計，通常用一條直線表示，直線兩端具有相反程度的詞語。這條直線可以是水平的，也可以是垂直的。實驗中被試者需在直線上做標(biāo)記，實驗后主試者用標(biāo)尺對標(biāo)記進(jìn)行度量，將它轉(zhuǎn)換成數(shù)字并進(jìn)行統(tǒng)計。圖示度量表的數(shù)據(jù)統(tǒng)計工作較為復(fù)雜和繁瑣，本文實驗的數(shù)據(jù)量巨大，因此圖示度量表并不適用。

（3）數(shù)值度量表。在數(shù)值度量表中，被試者根據(jù)事先定義的數(shù)字等級進(jìn)行評定，一般為7級評分或5級評分。在視覺舒適度研究中，可設(shè)計度量表如下：非常舒適、舒適、一般、不舒適、非常不舒適。設(shè)定等級分值時可以考慮“非常不舒適”為-2分，“不舒適”為-1分，“一般”為0分，“舒適”為1分，“非常舒適”為2分；也可以考慮“非常不舒適”為1分，“不舒適”為2分，“一般”為3分，“舒適”為4分，“非常舒適”為5分。通常情況下不管哪種處理和分析得到的結(jié)果是等效的。

本文實驗為了使被試者容易理解，考慮一般人的思維模式，將數(shù)值度量表等級設(shè)計為：“非常舒適”為1分，“舒適”為2分，“一般”為3分，“不舒適”為4分，“極不舒適”為5分。舒適度量表如表1所示。

2 近距立體顯示實驗系統(tǒng)

2.1 目視光學(xué)系統(tǒng)

在便攜式CAVE系統(tǒng)中，需要利用目視光學(xué)系統(tǒng)調(diào)節(jié)用戶眼睛的調(diào)節(jié)距離，使人眼不再聚焦于屏幕上。本文實驗的目的是研究經(jīng)過目視光學(xué)系統(tǒng)調(diào)節(jié)后的單眼調(diào)節(jié)距離和雙眼輻輳距離的差異對用戶視覺舒適度的影響。實驗中需通過改變目視光學(xué)系統(tǒng)的屈光度來改變被試者單眼的調(diào)節(jié)距離?？紤]到人眼作為自然界的最高級光學(xué)接收系統(tǒng)，具有極強(qiáng)的自我適應(yīng)和調(diào)節(jié)能力，因此，本系統(tǒng)選用單片式目鏡即可滿足基本的成像要求。

2.2 隨機(jī)點立體圖的生成

隨機(jī)點立體圖像對的生成算法如下：

設(shè)基面為視差面為

（1）將基面沿縱方向均分成塊，左邊第一塊區(qū)域為原始區(qū)，其余各塊區(qū)域均為重復(fù)區(qū)域。重復(fù)間距為d必須小于瞳距。

（2）在原始區(qū)內(nèi)畫一個隨機(jī)點

（3）令得到一新的點如果點在面內(nèi)，則令如果點不在面內(nèi)，則令然后在處畫出這個新點。

（4）重復(fù)上述步驟（2）、步驟（3），直到圖面上布滿適當(dāng)密度的隨機(jī)點為止。

2.3 投影圖像的畸變矯正

本系統(tǒng)應(yīng)采用側(cè)投影的方式，在這種情況下投影圖像會產(chǎn)生畸變，應(yīng)進(jìn)行投影圖像的畸變矯正。進(jìn)行投影圖像的畸變矯正的模型是將真實投影機(jī)的投影圖像變換為虛擬投影機(jī)的投影圖像，從而恢復(fù)原始圖像[5]。其基本過程是：根據(jù)透視變換原理，先計算出投影機(jī)圖像平面到投影平面的單映矩陣，再將投影機(jī)圖像平面上的所有像素點乘以這個單映矩陣后進(jìn)行顯示，那么屏幕上獲得的圖像就是校正后的圖像。

3 近距立體顯示系統(tǒng)的舒適度評估實驗

3.1 實驗?zāi)康募霸?/p>

本實驗的主要目的是研究基于目視光學(xué)系統(tǒng)調(diào)節(jié)的近距立體顯示系統(tǒng)中單眼感知深度（調(diào)節(jié)距離）和雙眼感知深度（輻輳距離）[5]的差異對用戶視覺舒適度的影響。

由式（8）可知，當(dāng)眼睛到屏幕的距離和瞳距一定時，通過改變立體圖像對的水平視差可以改變被試者的雙眼感知深度（輻輳距離）。

3.2 被試者篩選及培訓(xùn)

篩選工具：數(shù)字化立體視覺檢查圖（立體視覺檢查卡、立體視銳度檢查卡）、瞳距測量尺。

本實驗被試者的篩選流程如下：

第一步：詢問被試者眼部的健康狀況、有無色盲、是否做過眼部手術(shù)、是否有眼部病史，如結(jié)膜炎、眼眶骨折等，篩選出眼睛健康且無病史的被試者。

第二步：進(jìn)行立體視覺測試，檢查被試者的雙目立體視覺是否正常，排除立體盲。

第三步：對立體視覺正常的被試者進(jìn)行立體視銳度測試，篩選出立體視銳度小于60 arcmin的被試者。

第四步：對被試者的年齡、性別、視力、瞳距、有無主觀實驗經(jīng)驗、是否從事立體視覺相關(guān)工作等基本信息進(jìn)行記錄[6]。

榱吮苊獗皇哉哂捎誆皇煜な笛榱鞒毯筒僮鞴程而影響實驗結(jié)果的準(zhǔn)確性，實驗前需對被試者進(jìn)行相關(guān)培訓(xùn)和模擬練習(xí)。

首先，采用無偏向性的語氣向被試者講解實驗?zāi)康?、評價類型、評價等級和時間限制等內(nèi)容，使被試者正確透徹地理解評判標(biāo)準(zhǔn)，并向被試者展示舒適度明顯不同的若干立體圖像示例。

然后，讓被試者進(jìn)行模擬練習(xí)，模擬練習(xí)的內(nèi)容與正式的實驗過程類似。被試者連續(xù)觀看三組立體圖像后，用選擇器輸入差異圖像的編號并對該組立體圖像引起的視疲勞程度進(jìn)行評分，練習(xí)時間為3 min。

培訓(xùn)完成后，被試者即可進(jìn)行正式的主觀視覺舒適度評價實驗。

3.3 實驗過程

實驗1：探究近距顯示引起的視覺疲勞與視差的關(guān)系

被試者佩戴屈光度為0的目視光學(xué)系統(tǒng)，在距離屏幕0.6 m的位置觀察隨機(jī)出現(xiàn)的立體圖像，并進(jìn)行視覺任務(wù)測試和主觀舒適度評分。實驗1設(shè)定刺激物的中心到被試者的距離（輻輳距離）分別為0.79 m，0.94 m，1.15 m，1.50 m，2.14 m，3.75 m，且隨機(jī)出現(xiàn)。調(diào)節(jié)距離為0.6 m。

實驗1共進(jìn)行36組小測試。每組測試會連續(xù)出現(xiàn)3幅立體圖像，被試者雙眼融像[7]后，可看到立體圖像出現(xiàn)正弦波紋的效果，被試者需選出一個與其他兩個正弦波動方向不同的立體圖像，利用選擇器將它的編號輸入到主機(jī)系統(tǒng)中。然后對該組小測試產(chǎn)生的視覺疲勞癥狀進(jìn)行主觀評分。

時間安排及流程：三種位置（1，2，3）×6種輻輳距離（0.79 m，0.94 m，1.15 m，1.50 m，2.14 m，3.75 m）×2種顯示序列（B?Xi?B或Xi?B?Xi）=36次施測，每次施測時間為1 min×36次=36 min。

實驗2：探究基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體視覺舒適度

被試者隨機(jī)佩戴屈光度分別為的目視光學(xué)系統(tǒng)，在距離屏幕0.6 m的位置依次進(jìn)行3個亞組的實驗，實驗2中設(shè)定刺激物的中心到被試者的距離（輻輳距離）分別為0.79 m，0.94 m，1.15 m，1.50 m，2.14 m，且隨機(jī)出現(xiàn)。人眼的調(diào)節(jié)距離分別為1.09 m，1.50 m，2.40 m。

實驗2中每個亞組各進(jìn)行30組小測試。每組測試會連續(xù)出現(xiàn)3幅立體圖像，被試者雙眼融像后，可以看到立體圖像出現(xiàn)正弦波紋的效果，被試者需選出一個與其他兩個正弦波動方向不同的立體圖像，利用選擇器將它的編號輸入主機(jī)中，然后對該組小測試產(chǎn)生的視覺疲勞癥狀進(jìn)行主觀評分。

時間安排及流程：3種透鏡度數(shù)×3種位置（1，2，3）×5種輻輳距離（0.79 m，0.94 m，1.15 m，1.50 m，2.14 m）×2種顯示序列（B?Xi?B或Xi?B?Xi）=90次施測，每次施測調(diào)節(jié)時間為1 min×90+15 min間隔休息×2=120 min。

3.4 實驗結(jié)果分析

（1）近距顯示引起的視覺疲勞與視差絕對值[8]呈正相關(guān)

將實驗1中24個被試者的舒適度主觀評分根據(jù)不同的輻輳距離進(jìn)行均值統(tǒng)計。當(dāng)視差取絕對值時，視差絕對值和視覺舒適度主觀評分值經(jīng)過線性擬合后得到兩者的關(guān)系模型為：

視差絕對值和視覺舒適度主觀評分值的線性相關(guān)度為具體見圖2。實驗結(jié)果表明，視覺舒適度的主觀評分與視差值呈線性關(guān)系，也就是說，對于近距立體顯示單眼聚焦和雙眼輻輳的不一致性所引起的視覺疲勞與立體視差值成正比關(guān)系。單眼聚焦和雙眼輻輳的差異越大，產(chǎn)生的視疲勞程度越大，這個結(jié)果與大部分研究結(jié)果相一致。

（2）主觀舒適度與理論值的符合度基本一致

將實驗2中24個被試者的視覺舒適度主觀評分根據(jù)不同的輻輳距離和調(diào)節(jié)距離進(jìn)行均值統(tǒng)計，并將每個亞組的理論舒適度和實驗獲得的主觀舒適度進(jìn)行比較。

目視光學(xué)系統(tǒng)的屈光度為0.75D，1.00D，1.25D的實驗結(jié)果，如圖3～圖5所示。

實驗結(jié)果表明，當(dāng)調(diào)節(jié)距離一定時，分別為1.09 m，1.5 m，2.4 m，由輻輳距離的改變引起的視疲勞癥狀與理論計算得到的結(jié)果在總趨勢上大體一致。在基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)中，輻輳距離越小，符合度越好。在相同視差條件下，經(jīng)過目視光學(xué)系統(tǒng)調(diào)節(jié)后產(chǎn)生更大的不適感。

（3）視差舒適度曲線

將實驗2中三個亞組的所有情況的視差值與主觀舒適度評分進(jìn)行綜合統(tǒng)計，繪制舒適度曲線如圖6所示。

實驗結(jié)果表明，基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)中，視差絕對值越小，視覺舒適度越高。在同等視差條件下，非交叉視差的舒適度優(yōu)于交叉視差。與傳統(tǒng)立體顯示設(shè)備相比，舒適視域向非交叉視差方向偏移。

4 結(jié) 論

本文在充分了解雙目立體視覺原理、視差型立體顯示技術(shù)原理、立體顯示引起視覺疲勞的根本原因等理論知識的基礎(chǔ)上，搭建近距虛擬現(xiàn)實顯示系統(tǒng)原型作為實驗系統(tǒng)，設(shè)計實驗研究了基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)的視覺舒適度問題。對虛擬現(xiàn)實技術(shù)的發(fā)展和立體視覺舒適度的研究具有一定的實際意義。

參考文獻(xiàn)

[1] 張英靜，李素梅，衛(wèi)津津，等.立體圖像質(zhì)量的主觀評價方案[J].光子學(xué)報，2012，41（5）：602?607.

[2] KIM D， CHOI S， SOHN K. Visual comfort enhancement for stereoscopic video based on binocular fusion characteristics [J]. IEEE transactions on circuits and systems for video technology， 2013， 23（3）： 482?487.

[3] 王飛，王晨升，劉曉杰.立體顯示技術(shù)的原理、體視因素和術(shù)語[J].工程圖學(xué)學(xué)報，2010（5）：69?73.

[4] 李志永.立體視覺基礎(chǔ)[J].現(xiàn)代電影技術(shù)，2011（1）：52?55.

[5] 顧郁蓮，蔡宣平.計算機(jī)立體視圖繪制技術(shù)[J].國防科技參考，1998，19（1）：63?70.

篇3

1引言

增強(qiáng)現(xiàn)實技術(shù)AR（Augmented Reality）是在虛擬現(xiàn)實VR技術(shù)（Virtual Reality）的基礎(chǔ)上發(fā)展起來的典型的交叉學(xué)科，具有十分廣泛的研究和應(yīng)用范圍，涉及到諸多技術(shù)領(lǐng)域，如計算機(jī)圖形和圖像處理、人機(jī)界面交互設(shè)計、移動計算、計算機(jī)網(wǎng)絡(luò)技術(shù)、信號處理技術(shù)、以及新型顯示器和傳感器的設(shè)計等。

與傳統(tǒng)虛擬現(xiàn)實技術(shù)所要達(dá)到的完全沉浸的效果不同，AR將計算機(jī)生成的虛擬影像實時準(zhǔn)確地疊加在實景對象上，從而允許用戶使用實景對象與虛擬的影像進(jìn)行實時無縫交互。AR技術(shù)需具有3方面的特點：（1）真實與虛擬圖像的結(jié)合，（2）實時互動，（3）根據(jù)實景物理對象對虛擬影像進(jìn)行定位。由于增強(qiáng)現(xiàn)實具有將真實場景同虛擬物體加以融合并實現(xiàn)實時交互的特性，能夠增強(qiáng)用戶對現(xiàn)實環(huán)境的理解和認(rèn)知。

本文首先討論增強(qiáng)現(xiàn)實系統(tǒng)的總體架構(gòu)，在此基礎(chǔ)上著重論述增強(qiáng)顯示的關(guān)鍵技術(shù)，即：顯示技術(shù)、跟蹤注冊技術(shù)、相關(guān)方法及其各自的特性，在本文的最后，對增強(qiáng)現(xiàn)實應(yīng)用和未來趨勢概要地作出總結(jié)。

2增加現(xiàn)實系統(tǒng)架構(gòu)

增強(qiáng)現(xiàn)實的整體系統(tǒng)通常由場景采集、跟蹤注冊、虛擬場景發(fā)生器、虛實合成、顯示系統(tǒng)和人機(jī)交互界面等多個子系統(tǒng)構(gòu)成，如圖1所示。

增強(qiáng)現(xiàn)實系統(tǒng)中，通過處理現(xiàn)實實景的圖像建立起實景空間，根據(jù)跟蹤注冊技術(shù)確定攝像機(jī)的姿態(tài)以及虛擬圖像的空間定位，虛擬圖像與實景圖像通過配準(zhǔn)排列，合成未虛實融合的增強(qiáng)現(xiàn)實環(huán)境，這個環(huán)境再輸入到顯示系統(tǒng)呈現(xiàn)給用戶，最后用戶通過交互設(shè)備與場景環(huán)境進(jìn)行互動。其中，讓虛實準(zhǔn)確結(jié)合的注冊步驟非常關(guān)鍵，和最后的顯示輸出端一起，決定了用戶對增強(qiáng)現(xiàn)實環(huán)境的最終感知效果，

3增強(qiáng)現(xiàn)實系統(tǒng)的顯示技術(shù)

增強(qiáng)現(xiàn)實系統(tǒng)的能夠利用融合計算機(jī)視覺、顯示技術(shù)、多傳感器等技術(shù)對真實場景進(jìn)行擴(kuò)展和增強(qiáng)，根據(jù)Eitoku提出的標(biāo)準(zhǔn)，AR的顯示裝置的設(shè)計應(yīng)該有4個準(zhǔn)則：（1）虛擬信息與現(xiàn)實世界共存；（2）支持協(xié)同工作；（3）不給用戶增加特殊儀器的負(fù)擔(dān)用戶；（4）支持顯示自然的三維圖像。主要集中在3種類型：透視式的頭部佩戴顯示器，基于投影顯示器和手持式顯示器。

3.1頭部配戴顯示設(shè)備

透視式HMDS通過光學(xué)或視頻技術(shù)，使用戶看到將虛擬物體與現(xiàn)實實景融合后的場景。這類顯示器又可分為光學(xué)透視OST（Optical See Through）和視頻透視VST（Video See Through）的HMD。

用戶通過OST HMD可以直接看到現(xiàn)實實景與虛擬信息疊加融合后的場景。例如Google正式的眼鏡項目“Google Glass”，這款眼鏡集智能手機(jī)、GPS、相機(jī)于一身，所有的信息都能即時展現(xiàn)在眼前，比以往的設(shè)計頭盔式顯示器更小更薄的頭部佩戴裝置。

OST HMD對真實環(huán)境幾-乎無損顯示。用戶獲得的信息比較可靠全面，對真實環(huán)境與虛擬圖像融合匹配的精確度要求較高。首先由攝像機(jī)攝取實景圖像，然后將生成的信息或虛擬影像圖像疊加在攝像機(jī)視頻上，通過顯示系統(tǒng)呈現(xiàn)給用戶。VST HMD的優(yōu)點在于較好地處理諸如被遮擋場景、色彩強(qiáng)度等問題，以保持真實場景與虛擬圖像的一致性。

3.2投影顯示設(shè)備

基于投影技術(shù)的顯示，不需要用戶佩戴設(shè)備，對用戶的體驗保持最低限度的侵?jǐn)_。現(xiàn)有多種投影顯示技術(shù)，將圖像信息直接投射到真實物體的表面，通常是在固定的物體的表面。投影設(shè)備同時能夠?qū)D像投影到更大范圍的環(huán)境中。

投影顯示設(shè)備更加適合室內(nèi)增強(qiáng)現(xiàn)實環(huán)境，生成圖像的焦點不隨用戶視角的改變而改變。投影顯示設(shè)備與固定的跟蹤定位設(shè)備相配合，將虛擬物體投影到真實世界中的相應(yīng)位置。例如大眾研究集團(tuán)與大眾服務(wù)學(xué)院聯(lián)合開發(fā)的投影式增強(qiáng)現(xiàn)實系統(tǒng)，可用于新車型的開發(fā)與技術(shù)創(chuàng)新的培訓(xùn)。

3.3手持顯示設(shè)備（Hand Held Device）

手持設(shè)備的增強(qiáng)現(xiàn)實應(yīng)用不需要額外的設(shè)備和應(yīng)用程序的能力，對用戶體驗沒有侵?jǐn)_，易于攜帶和高度移動自由度等優(yōu)點，廣泛為社會所接受，因此經(jīng)常被用于在廣告，教育和培訓(xùn)吸引用戶注意的重要設(shè)備。

Layer App是典型的智能手機(jī)上的增強(qiáng)現(xiàn)實應(yīng)用程序之一。用戶在指定的位置，使用手機(jī)內(nèi)置羅盤以確定鏡頭所指的方向，在手機(jī)顯示屏上即可顯示出場景中的細(xì)節(jié)信息，當(dāng)用戶平移其設(shè)備的攝像頭左右，屏幕上會填充不同的景點信息，包括快速通道的可用性，景點的描述等等。

4增強(qiáng)現(xiàn)實系統(tǒng)的跟蹤注冊技術(shù)

跟蹤是指跟蹤3D空間中的一點或幾點的3D坐標(biāo)與6DOF的姿態(tài)信息，注冊即是虛擬物體和真實場景在三維空間中位置的一致性，即在空間上的整合，跟蹤注冊是一個持續(xù)的動態(tài)過程。跟蹤注冊是增強(qiáng)現(xiàn)實系統(tǒng)中的緊密相關(guān)的關(guān)鍵技術(shù)。目前廣泛應(yīng)用的注冊跟蹤技術(shù)可以分為3類：基于傳感器的注冊跟蹤技術(shù)、基于視覺的跟蹤注冊技術(shù)、和基于傳感器與實際的混合跟蹤注冊技術(shù)。

4.1基于傳感器的跟蹤注冊

基于傳感器的跟蹤注冊技術(shù)，首先記錄實際場景中用戶的方向和位置，在便保持虛擬空間和真實空間連續(xù)性的基礎(chǔ)上，實現(xiàn)虛擬對象與實際場景的精確配準(zhǔn)融合。常用的傳感器技術(shù)主要有：磁場（magnetic）跟蹤注冊、聲學(xué)（acoustic）跟蹤注冊、光學(xué)（ortic）跟蹤注冊、慣性（inertial）跟蹤注冊。

磁場跟蹤注冊系統(tǒng)，由控制器、磁場發(fā)射器和接收器組成，利用磁場相關(guān)的參數(shù)，從而確定用戶的位置和方位。例如徐彤等設(shè)計的六自由度電磁跟蹤系統(tǒng)。

聲學(xué)跟蹤注冊系統(tǒng)包括超聲波發(fā)射器、接收器、和處理單元。利用同一聲源到達(dá)不同地點或者不同聲源的超聲波到達(dá)同一地點的時間差、聲壓差等參數(shù)進(jìn)行跟蹤注冊。超聲波跟蹤注冊系統(tǒng)成本低，抗電磁干擾能力強(qiáng)，但是非常容易受周圍環(huán)境的噪聲、溫度、濕度以及遮擋問題的影響。

光學(xué)跟蹤注冊系統(tǒng)使用感光設(shè)備，接受發(fā)光元件產(chǎn)生的光線，用以測量目標(biāo)的方位。該類系統(tǒng)的精度高，不受噪聲和電磁場影響。主要缺點是易受視線和遮擋的影響，而且設(shè)備昂貴。

慣性跟蹤注冊系統(tǒng)使用慣性傳感器，獲取用戶或攝像機(jī)的運(yùn)動方向和姿態(tài)，獲取攝像機(jī)的運(yùn)動位置和速度。使用慣性跟蹤注冊技術(shù)存在著漂移和誤差累計，因此精度不高，必須與其他注冊跟蹤技術(shù)聯(lián)合使用，才能達(dá)到較高的精度。

基于傳感器的跟蹤注冊系統(tǒng)，可以記錄真實場景中用戶的方向和位置，在此基礎(chǔ)上保持虛擬空間和真實空間的連續(xù)性，實現(xiàn)精確配準(zhǔn)與虛實圖像的融合。

4.2基于視覺（vision-Based）的跟蹤注冊

基于視覺的跟蹤注冊基于視覺跟蹤的跟蹤注冊則不需要使用傳感器設(shè)備，由于硬件成本相對低廉，而受到越來越多地關(guān)注。

基于視覺的跟蹤注冊過程為：首先根據(jù)攝像機(jī)攝入的圖像或視頻流進(jìn)行處理，檢測圖像中目標(biāo)物體的特征，并欲與預(yù)存的場景圖像的特征進(jìn)行匹配。若匹配成功，通過圖像特征可以獲得攝像鏡頭的單應(yīng)性矩陣，據(jù)此可以計算出攝像鏡頭相對于場景中物體的位置及姿態(tài)。跟蹤注冊主要是基于標(biāo)識的跟蹤和無標(biāo)識的跟蹤。

基于標(biāo)識的跟蹤注冊技術(shù)，由于標(biāo)識是人工放置，由此根據(jù)計算機(jī)視覺中的透視投影算法，即可獲取攝像機(jī)相對于標(biāo)識的轉(zhuǎn)換矩陣，從而獲得注冊信息。目前基于標(biāo)識的跟蹤注冊系統(tǒng)，已有ARToolKit，ARTag等。ARToolKit較為適用小規(guī)模的應(yīng)用，而ARTag在處理較大規(guī)模的應(yīng)用時則處理速度更快?；跇?biāo)識的跟蹤注冊計算復(fù)雜度較低，具有較好的精確性，但同時也易受遮擋的影響。

無標(biāo)識跟蹤注冊技術(shù)，又稱為基于自然特征點的注冊跟蹤技術(shù)，是直接利用場景中存在并且容易識別的實景物體的自然特征，提取識別的基準(zhǔn)點。經(jīng)典的算法有Ferns算法、SURF算法、和SIFT算法。在手持設(shè)備上運(yùn)用時，由于真實的場景往往比較復(fù)雜無標(biāo)識跟蹤注冊的計算量較大，實時性較差。

4.3混合跟蹤注冊技術(shù)

混合跟蹤注冊是指在同一增強(qiáng)現(xiàn)實系統(tǒng)中采用兩種以上的跟蹤注冊，以實現(xiàn)各種跟蹤注冊的優(yōu)勢互補(bǔ)?；趥鞲衅鞯母欁约夹g(shù)跟蹤需要較為昂貴的硬件設(shè)備，易受外部環(huán)境變化的影響，但是實時性好，魯棒性高。基于標(biāo)識的跟蹤注冊的主要性能特點是精度高，實時性較差。把這兩種注冊跟蹤技術(shù)相結(jié)合，則可以綜合各自的優(yōu)點，彌補(bǔ)各自的缺點，使其成為一個魯棒性較強(qiáng)、實時性較好、精度較高并且受外界干擾較小的綜合跟蹤注冊系統(tǒng)。例如Azuma等在1998年提出的將GPS、視覺跟蹤注冊技術(shù)和慣性傳感器三種技術(shù)綜合戶外增強(qiáng)現(xiàn)實系統(tǒng)。

篇4

中圖分類號：G642

文獻(xiàn)標(biāo)識碼：B

文章編號：1672-5913(2008)02-0095-05

1引言

隨著計算機(jī)網(wǎng)絡(luò)和虛擬現(xiàn)實技術(shù)的發(fā)展，現(xiàn)代遠(yuǎn)程教育引發(fā)了一場深刻的教育模式和教育觀念的變革。傳統(tǒng)的文字、幻燈、實物模型的教學(xué)方式已不能滿足教育變革的要求，如何把枯燥的學(xué)習(xí)對象構(gòu)造成三維可視化的、所見即所得的學(xué)習(xí)教具和學(xué)習(xí)培訓(xùn)環(huán)境，成了教育信息領(lǐng)域努力追求的目標(biāo)之一。

本文開發(fā)的遠(yuǎn)程交互式三維仿真課件編輯平臺是在對OSG(Open Scene Graph)進(jìn)行功能擴(kuò)展與大幅度改造后的一個易于快速定做仿真課件的平臺。該平臺將三維仿真設(shè)計、實時渲染瀏覽和遠(yuǎn)程網(wǎng)絡(luò)壓縮等功能融為一體，使用戶可以針對教學(xué)重點、難點，方便快捷地制作出三維仿真教具和實物模型，用于形象教學(xué)和交互式趣味教學(xué)。

該平臺通過標(biāo)準(zhǔn)化設(shè)計把一些知名的開源軟件和引擎融為一體，如Open Scene Graph(OSG)、Open Dynamics Engine(ODE)、Character Animation Library(CAL3D)、OpenGL等。通過對這些底層模塊進(jìn)行隱藏封裝、模塊整合等技術(shù)開發(fā)，繼承與發(fā)展了各類引擎所具有的先進(jìn)特性。不但仿真效果的真實性大大提高，而且能直接處理大量模型數(shù)據(jù)，使高質(zhì)量的三維畫面在遠(yuǎn)程交互中能快速傳輸，為廣大師生展現(xiàn)了全方位的、真實的學(xué)習(xí)對象和學(xué)習(xí)環(huán)境。

2總體功能結(jié)構(gòu)

遠(yuǎn)程交互式三維仿真課件編輯平臺由3dsmax建模及輸出模塊、場景編輯器模塊、仿真數(shù)據(jù)庫管理模塊、仿真算法模塊、VR仿真內(nèi)容系統(tǒng)模塊、流體動力學(xué)粒子系統(tǒng)仿真模塊、網(wǎng)絡(luò)仿真及通訊模塊、多通道視覺仿真模塊、各類仿真特效模塊、OCX控件二次開發(fā)包模塊等功能模塊組成，如圖1所示。

2.13dsmax建模及輸出模塊

在仿真項目的制作過程中，明確需求并確定計劃后，首先要面對的工作就是仿真場景的構(gòu)建。該模塊支持對Multigen openflight等多種文件格式的導(dǎo)入，且能對輸入的場景自動優(yōu)化。用戶不但可以在場景中建立新的幾何物體，而且能創(chuàng)建自己的實時圖庫，可以隨時入庫和調(diào)用。此外，模塊還支持MAX的視圖操作功能，用戶可對模型進(jìn)行平移、旋轉(zhuǎn)、縮放等操作，建模模塊如圖2所示。

仿真項目的場景構(gòu)建完畢后，可以通過這個模塊向原來內(nèi)容相對比較單一的幾何體賦予仿真需要的各種屬性，諸如LOD、switch節(jié)點、碰撞、物理屬性等。此外用戶還可以對各節(jié)點進(jìn)行增加、刪除、重命名等操作，或者改變節(jié)點的Group關(guān)系。同時該模塊提供對形體、光源和相機(jī)的直接操作，以及真實感屬性的編輯，極大地提高了虛擬世界的真實度。如圖3所示。

2.3仿真核心工作模塊

這個模塊是仿真系統(tǒng)的工作核心，主要處理一些內(nèi)核的仿真任務(wù)的調(diào)度，各個任務(wù)之間的結(jié)構(gòu)是基于事件驅(qū)動的結(jié)構(gòu)關(guān)系。模塊初始化時會建立一個動態(tài)的事件列表，并按時間的先后順序確定任務(wù)的優(yōu)先級。當(dāng)某個事件被觸發(fā)時，核心工作模塊就會通過消息機(jī)制激活所有的與該事件相關(guān)的過程或函數(shù)，協(xié)調(diào)各仿真模塊共同工作。它主要調(diào)度以下幾個模塊：

Ø 仿真數(shù)據(jù)庫管理模塊

數(shù)據(jù)庫是與仿真緊密聯(lián)系的一個部分，很多仿真數(shù)據(jù)的讀入及保存都必須通過數(shù)據(jù)庫進(jìn)行。該模塊在內(nèi)核中保留了最基本但功能又非常強(qiáng)大的數(shù)據(jù)庫處理能力，通過這個模塊，可以處理海量的數(shù)據(jù)。當(dāng)數(shù)據(jù)量大而導(dǎo)致內(nèi)存不夠時，這個模塊會通過一套內(nèi)置的虛擬內(nèi)存系統(tǒng)將硬盤與物理內(nèi)存進(jìn)行動態(tài)交換，并且對大型場景進(jìn)行動態(tài)加載。

該模塊的另一作用是將各種插件式開發(fā)的.dll功能增強(qiáng)模塊作為一個數(shù)據(jù)庫進(jìn)行動態(tài)管理。這樣如果用戶或者軟件研發(fā)者需要增加額外的系統(tǒng)功能，只需要編寫一個.dll插件，再在這個數(shù)據(jù)庫系統(tǒng)中進(jìn)行一次注冊，然后就會在下次系統(tǒng)啟動時自動加載。

Ø 仿真算法模塊

無論在數(shù)值仿真或者視覺仿真領(lǐng)域，都會面臨著許多的仿真算法。這個模塊提供了一些仿真領(lǐng)域中最常見或者使用頻率最高的算法。用戶不用重復(fù)編寫常用算法，只需要調(diào)用幾個現(xiàn)成的函數(shù)就能解決常見問題。

Ø 流體動力學(xué)粒子系統(tǒng)仿真模塊

在軍事或者其他常見領(lǐng)域的仿真中，粒子系統(tǒng)是種常見的現(xiàn)象，如輪船開動時的尾跡、飛機(jī)航行時的尾跡與煙霧等。在粒子系統(tǒng)仿真模塊中，大量的粒子圖元集合在一起，通過其屬性的變化表現(xiàn)物體的物理特性，用以進(jìn)行不規(guī)則物體的模擬。用戶可以通過定義粒子的形狀、大小、生存期、位置、速度、加速度、顏色、透明度等屬性來實現(xiàn)對各種煙霧、火焰、閃光等現(xiàn)象的模擬。如圖4所示。

Ø 各類仿真特效模塊

在自然界中存在著很多的自然現(xiàn)象，如下雨、下雪、水面的反射、有陽光或者燈光時的鏡頭光暈等等各種效果。該模塊支持以上提到的各種特效，令仿真的效果栩栩如生。如圖5所示。

Ø 網(wǎng)絡(luò)仿真及網(wǎng)絡(luò)通訊模塊

該模塊支持內(nèi)部網(wǎng)與互聯(lián)網(wǎng)方式演示。當(dāng)互聯(lián)網(wǎng)因帶寬受限以及客戶機(jī)配置未能達(dá)到基本要求時，可采用降低圖形質(zhì)量的方法進(jìn)行傳輸。內(nèi)部教學(xué)網(wǎng)絡(luò)則可以不受限制，便于集中培訓(xùn)教學(xué)與虛擬實踐。該模塊還設(shè)置了分級權(quán)限使用，給不同身份的用戶授予不同的權(quán)限，便于系統(tǒng)管理。

Ø 多通道視覺仿真模塊

在一般的視景仿真系統(tǒng)中，通常采用單視覺通道來顯示三維圖形。單視覺通道只能顯示一個視野，而利用多通道視覺仿真系統(tǒng)就可以得到更廣闊的視角效果，增強(qiáng)了“沉浸”感。

該模塊提供了獲取當(dāng)前視角的函數(shù)，且支持水平和垂直視角自動匹配的功能。在視點位置、方向以及遠(yuǎn)近裁剪面的距離確定后，系統(tǒng)還可自動完成視景體的裁剪。

2.4VR仿真內(nèi)容系統(tǒng)模塊

該模塊可將仿真課件成獨(dú)立的exe文件，且所有必需的庫文件與資源均打包在內(nèi)，用戶可自行設(shè)計圖形界面，便于分發(fā)與保密。打包后的可執(zhí)行文件在運(yùn)行時支持用戶的交互式瀏覽，用戶可以根據(jù)需要選擇自動播放或單步操作，方便教學(xué)與虛擬裝配。

2.5OCX控件二次開發(fā)包模塊

交互式三維仿真課件的開發(fā)一直被認(rèn)為是一項復(fù)雜的工作，因為涉及到C語言、OpenGL、Direct3D等基礎(chǔ)開發(fā)工具的應(yīng)用，這無疑降低了開發(fā)效率，延長了開發(fā)周期。因此這一模塊引入了與各類開發(fā)平臺掛接和無縫植入的快速虛擬現(xiàn)實開發(fā)工具3DVR OCX，通過此可編程控件OCX，用戶可以輕松做出實用的仿真課件，極大地提高了開發(fā)工作的效率。如圖6所示。

3關(guān)鍵技術(shù)研究

3.1場景圖

內(nèi)核采用場景圖SG(Scene Graph)結(jié)構(gòu)，通過場景圖把各場景及其屬性組織成一棵場景樹。場景圖中的根結(jié)點表的是整個三維場景，子結(jié)點表示場景中每個對象的位置信息、動畫設(shè)置以及邏輯關(guān)系等屬性，葉子結(jié)點則代表物理對象本身、可拉伸的幾何模型和材質(zhì)屬性。

采用這種樹狀組織結(jié)構(gòu)可以大大縮減剔除的執(zhí)行時間。當(dāng)父結(jié)點對象被遮擋或處于觀察區(qū)域以外時，父結(jié)點就被設(shè)置為不可見，位于父結(jié)點以下的所有子結(jié)點對象也都是不可見的，這樣就無需再比較子結(jié)點對象的空間邊界，避免了重復(fù)執(zhí)行對多個對象物體的剔除處理，從而加快了場景渲染的速度。例如，要剔除一座大樓時，只需計算這座大樓的空間邊界是否在觀察區(qū)域內(nèi)，而大樓的門、窗等對象因為屬于大樓對象的子結(jié)點，就無需再判斷其空間邊界，從而縮短了剔除的執(zhí)行時間。

此外，場景圖結(jié)構(gòu)還使得動畫設(shè)置變得更加靈活。當(dāng)我們要對一輛汽車設(shè)置平移動畫時，只需對汽車這個結(jié)點設(shè)置移動的相關(guān)參數(shù)，處于子結(jié)點位置的車輪、車門等對象就無需再進(jìn)行重復(fù)設(shè)置。如果用戶只要求車輪做旋轉(zhuǎn)動畫或者車門做開門動畫時，只要查找到對應(yīng)結(jié)點，設(shè)置動畫參數(shù)即可。由此可見，對于一個包含有多個對象的三維場景，這種樹狀結(jié)構(gòu)有效地簡化了動畫設(shè)置的操作過程。

場景圖結(jié)構(gòu)中還集中了對各個對象的狀態(tài)管理。場景圖中的每個對象都有一個指向狀態(tài)集的指針，這個狀態(tài)集中包含了顏色、紋理、燈光、透明度等信息。對處在同一層的對象，首先歸納出它們的相似狀態(tài)，并設(shè)置狀態(tài)指針指向同一個狀態(tài)集。例如，圖7中坦克的炮塔和基座同處在場景圖的第二層，所以狀態(tài)都設(shè)置為迷彩色。這種狀態(tài)管理方式可以簡化狀態(tài)設(shè)置的過程。當(dāng)對象狀態(tài)發(fā)生改變時，我們只需先按照廣度優(yōu)先的順序遍歷場景樹，查找到對象后，將狀態(tài)集中的屬性進(jìn)行一次更改，則同層的所有對象狀態(tài)都會發(fā)生改變。當(dāng)場景中的圖形對象達(dá)到成百上千時，這種狀態(tài)管理方式的優(yōu)勢就會更加明顯。

3.2OpenGL著色語言

內(nèi)置了對GLSL(OpenGL Shading Language，OpenGL著色語言)的支持，突破了OpenGL傳統(tǒng)渲染模型的固定功能性。用戶可以自定義渲染管線的處理過程，實現(xiàn)頂點著色和片斷著色，從而繪制出更豐富的紋理，模擬更真實的自然景象。同時該技術(shù)是直接對顯卡編程，源代碼在OpenGL內(nèi)部編譯，不占用CPU資源，因此在處理三維圖形的實時渲染方面顯示了強(qiáng)大的優(yōu)勢。

具體的實現(xiàn)過程是，當(dāng)處理圖形渲染任務(wù)時，首先調(diào)用OpenGL的一個API函數(shù)glCreateShader來創(chuàng)建著色器(shader)，同時在OpenGL的驅(qū)動程序中為著色器分配數(shù)據(jù)結(jié)構(gòu)。著色器通過獲取當(dāng)前OpenGL中的狀態(tài)信息(如位置、顏色、法線等)進(jìn)行投影變換、坐標(biāo)轉(zhuǎn)換、顏色計算等操作，然后調(diào)用glShaderSource命令將著色器代碼傳遞給OpenGL驅(qū)動程序，用glCompileShader命令將代碼編譯成機(jī)器語言，并以二進(jìn)制文件的格式傳遞給顯示硬件。該方法不依賴顯示硬件的匯編語言接口，突破了圖形硬件在匯編語言接口上的諸多限制，有效地提高了圖形渲染的效率。

4實例研究

三維仿真課件可以模擬各種真實的空間和實體，能展現(xiàn)那些在傳統(tǒng)教學(xué)中無法實現(xiàn)的教學(xué)效果，如一些危險的或是耗資巨大的實驗。尤其在工科教學(xué)中，許多知識點抽象難懂，成為了教學(xué)中的難點。

目前使用遠(yuǎn)程交互式三維仿真課件編輯平臺已經(jīng)開發(fā)了很多直接面向應(yīng)用的精品課件，使用該系統(tǒng)開發(fā)的“千斤頂?shù)慕M裝與工作原理”課件在實際教學(xué)中已收到良好的效果，如圖8所示。該課件主要用于培訓(xùn)千斤頂?shù)慕M裝與拆卸，課件中所展示的千斤頂?shù)母鱾€零部件，都是與實際大小相符的三維模型，且零件表面按實物材質(zhì)仿真，教師和學(xué)生可以旋轉(zhuǎn)任意視角觀看設(shè)備的外形、細(xì)節(jié)部分和整體外觀。課件中設(shè)置有整體或局部零件的工作動態(tài)演示，用戶可以選擇自動播放設(shè)備零部件拆分和組裝演示，也可以進(jìn)行手動單步拆分與組裝。其中自動演示過程是可控的，用戶可隨時中止或重播動畫。這種交互方式不但增強(qiáng)了裝配過程的直觀性，也提高了學(xué)生的動手能力。為了加強(qiáng)學(xué)生對千斤頂工作原理的理解，課件中還增加了整體和局部零部件的工作動態(tài)演示，任何零部件只要用鼠標(biāo)點擊，其應(yīng)有的工作動態(tài)、工作原理和裝配方式就能自動展示出來，同時還配有零部件的詳細(xì)參數(shù)信息、文字說明與二維設(shè)計圖。

“千斤頂?shù)慕M裝與工作原理”課件以其強(qiáng)大的交互功能、簡便直觀的操作方法以及實時的三維表現(xiàn)能力得到了廣大師生的一致贊同，也推動了三維仿真課件在教學(xué)一線的普及。

5結(jié)束語

遠(yuǎn)程交互式三維仿真課件編輯平臺是針對教學(xué)重點、難點的培訓(xùn)而開發(fā)的集三維仿真設(shè)計、實時功能渲染瀏覽和遠(yuǎn)程網(wǎng)絡(luò)壓縮于一體的仿真系統(tǒng)設(shè)計開發(fā)包。

該設(shè)計平臺的成功開發(fā)將解決教育領(lǐng)域重點、難點課程的仿真教學(xué)課件的制作難題，完善了教育領(lǐng)域遠(yuǎn)程教學(xué)平臺的建設(shè)，并節(jié)約教學(xué)培訓(xùn)設(shè)備的巨大開銷。我們相信，在未來的教育領(lǐng)域中，遠(yuǎn)程交互式三維仿真課件編輯平臺將為信息時代的教育發(fā)展注入新的活力。

收稿日期：2007-10

參考文獻(xiàn)

[1] 項慨. Java3D應(yīng)用于現(xiàn)代遠(yuǎn)程教育的關(guān)鍵技術(shù)[J]. 教育信息化,2006,(10).

[2] 劉少華. 虛擬仿真引擎及其在三維飛行再現(xiàn)中的應(yīng)用[D]. 國防科技大學(xué),2004,(12).

[3] 趙春霞,張艷,戰(zhàn)守義. 基于粒子系統(tǒng)方法的三維火焰模擬[J]. 計算機(jī)工程與應(yīng)用,2004,(2).

[4] 陶唐飛,韓崇昭. 視景仿真系統(tǒng)光學(xué)視覺通道技術(shù)研究與實現(xiàn)[J]. 系統(tǒng)仿真學(xué)報,2004,(4).

作者簡介

篇5

中圖分類號：TP15文獻(xiàn)標(biāo)識碼：A 文章編號：1009-3044(2011)17-4152-03

Three Dimensional Terrain Modeling Method with Creator Software Based on the ASTER Remote Sensing Data

TAO Hai-jun1, YANG Jing2, YE Xiao-jun1

(1.Artillery Academy.PLA, Hefei 230031, China; 2.Anhui Sanlian University, Hefei 230001, China)

Abstract: Large area real terrain modeling is the key technology in developing Visual simulation system. This paper provides a terrain modeling method with Creator software based on the ASTER remote sensing satellite data, the GeoTIFF data format provided by ASTER is being converted to the USGS DEM data by using format Conversion techniques, the terrain model of some region is established through Creator terrain modeling technology, the three-dimensional model of real terrain is established practically and quickly.

Key words: ASTER; GeoTIFF data; DEM data; format conversion; creator terrain modeling

視景仿真是三維地形建模技術(shù)、圖形處理和圖像生成技術(shù)、立體影像和信息合成技術(shù)、計算機(jī)網(wǎng)絡(luò)技術(shù)、仿真技術(shù)等諸多高新技術(shù)的綜合應(yīng)用，在很多領(lǐng)域如軍事訓(xùn)練、城市規(guī)劃、健康醫(yī)療、教育培訓(xùn)等方面都有著廣泛的應(yīng)用。大面積真實地形三維建模技術(shù)是實時視景仿真系統(tǒng)開發(fā)的關(guān)鍵技術(shù)之一，是近年來視景仿真領(lǐng)域研究的熱點。能獲取真實、準(zhǔn)確地表述地形起伏特征的地形數(shù)據(jù)源是進(jìn)行大面積真實地形三維建模的前提條件，地形數(shù)據(jù)源主要是指建立數(shù)字高程模型(Digital Elevation Model，DEM)用到的高程數(shù)據(jù)，獲取方法主要有以下幾種：1）采用大地測量的方法直接從地形上測出高程；2）利用航空攝影測量照片，采用數(shù)字高程判斷儀從兩張對應(yīng)的照片上讀取高程；3）利用遙感衛(wèi)星星載設(shè)備獲取地形高程數(shù)據(jù)；4）從小比例尺等高線地圖上讀取高程數(shù)據(jù)；5）從現(xiàn)有的地理信息系統(tǒng)提取所需區(qū)域的地形高程數(shù)據(jù)[1]。其中利用遙感地形數(shù)據(jù)源進(jìn)行大面積地形三維建模是目前地形建模的主要方法之一，本文重點研究基于ASTER遙感數(shù)據(jù)的Creator三維地形建模過程、方法和技巧。

1 ASTER遙感地形數(shù)據(jù)源精度解析

ASTER(Advanced Spaceborne Thermal Emission and Reflection Radiometer)是美國航空航天局(NASA)與日本國際經(jīng)貿(mào)商業(yè)部(METI)合作的高分辨率衛(wèi)星成像設(shè)備，于1999年12月搭載NASA的EOS-AM1(Terra)平臺升空，目地是獲取地球表面溫度、輻射、反射和高程數(shù)據(jù)，研究生物圈、水圈、巖石圈和大氣層之間的互動反應(yīng)，解決土地利用與覆蓋、自然災(zāi)害（火山噴發(fā)、水災(zāi)、森林火災(zāi)、地震和風(fēng)暴）、短期天氣變動、水文等方面的問題。ASTER有可見光和近紅外區(qū)(VNIR)三個波段，在短波紅外區(qū)(SWIR)有六個波段，在熱紅外區(qū)(TIR)有五個波段，它們的地面分辨率分別是15m、30m、90m。

2009年，美國航空航天局(NASA)官方網(wǎng)站提供了ASTER的最新全球遙感數(shù)據(jù)，該數(shù)據(jù)源采用的是GeoTIFF數(shù)據(jù)格式的DEM數(shù)據(jù)（簡稱ASTER GDEM），ASTER遙感數(shù)據(jù)記錄的地域非常廣闊，覆蓋范圍從北緯83度到南緯83度，除了部分極地區(qū)域，覆蓋絕大部分的地球區(qū)域。每個ASTER GDEM地形文件包含1度×1度的范圍，用一個3601×3601像素的TIFF圖片來記錄地形信息，采樣精度達(dá)到了30米，海拔精度為7-14米，基本滿足普通三維地形建模的數(shù)據(jù)精度要求[2]。

2 ASTER遙感數(shù)據(jù)格式轉(zhuǎn)換技術(shù)

ASTER遙感數(shù)據(jù)采用GeoTIFF(Geographic Tagged Image File Format)存儲格式，GeoTIFF是TIFF (Tag Image File Format)圖像文件格式的擴(kuò)展。TIFF (Tag Image File Format)圖像文件是圖形圖像處理中常用的格式之一，其圖像格式復(fù)雜，但由于它對圖像信息的存放靈活多變，可以支持很多色彩系統(tǒng)，而且獨(dú)立于操作系統(tǒng)，因此得到了廣泛應(yīng)用。在各種地理信息系統(tǒng)、攝影測量與遙感等應(yīng)用中，要求圖像具有地理編碼信息，如圖像所在的坐標(biāo)系、比例尺、圖像上點的坐標(biāo)、經(jīng)緯度、長度單位及角度單位等等。對于存儲和讀取這些信息，純TIFF格式的圖像文件很難做到，而GeoTIFF作為TIFF的一種擴(kuò)展，在TIFF的基礎(chǔ)上定義了一些GeoTag（地理標(biāo)簽），對各種坐標(biāo)系統(tǒng)、橢球基準(zhǔn)、投影信息等進(jìn)行定義和存儲，使圖像數(shù)據(jù)和地理數(shù)據(jù)存儲在同一圖像文件中，這樣就為開發(fā)人員制作和使用帶有地理信息的圖像提供了方便途徑[3]。

目前可用于進(jìn)行三維地形建模的開發(fā)軟件很多，比如3DS MAX、Auto CAD、Maya、MultiGen Creator等，使用的開發(fā)環(huán)境不同，所需要的數(shù)據(jù)源格式也不相同。筆者選用MultiGen-Paradigm公司開發(fā)的Creator軟件進(jìn)行三維地形開發(fā)，使用該軟件建立模型，可以在滿足實時性的前提下，生成面向仿真的、逼真度高的大面積地形。然而ASTER GDEM格式的DEM地形數(shù)據(jù)文件不能直接在MultiGen Creator中使用，必須首先將ASTER GDEM格式的地形數(shù)據(jù)文件轉(zhuǎn)換成MultiGen Creator支持的USGS DEM(U.S.Geological Survey Digital Elevation Models)格式或者DTED格式，然后利用Creator地形格式轉(zhuǎn)換模塊生成MultiGen Creator專用的數(shù)字高程數(shù)據(jù)(Digital Elevation Data，DED)格式文件，上述格式轉(zhuǎn)換的過程是三維地形生成的重要環(huán)節(jié)，該轉(zhuǎn)換過程可用圖1所示的流程圖進(jìn)行描述。

轉(zhuǎn)換步驟為：

1）應(yīng)用Global Mapper軟件提取ASTER GDEM數(shù)據(jù)文件中的地形數(shù)據(jù)信息，其中每個采樣點用(經(jīng)度，緯度、高程)表示，Global Mapper會完成數(shù)據(jù)二維可視化圖像和3D模型的顯示。如圖2所示繪制的是北緯37度、東經(jīng)117度附近地域的ASTER GDEM格式的數(shù)字高程模型。

2）在File菜單下選取Export Raster and Elevation Data項，在二級子菜單中選擇Export DEM Command菜單項輸出USGS DEM數(shù)據(jù)格式或者選擇Export DTED command菜單項輸出DTED數(shù)據(jù)格式。

3）在Options屬性頁中設(shè)定經(jīng)緯度方向的格網(wǎng)間距，在提取范圍屬性頁中設(shè)定地形數(shù)據(jù)的經(jīng)緯度范圍，生成采樣點的經(jīng)緯度高程信息。

4）打開Multigen Creator，借助Creator平臺的Terrain模塊的DED Builder 工具，將DEM格式文件生成Creator專用的高程數(shù)據(jù)格式文件(DED)，如圖3所示將USGS DEM數(shù)據(jù)格式轉(zhuǎn)化為DED數(shù)據(jù)格式。

圖2 Global Mapper繪制的GDEM數(shù)字高程模型圖3USGS DEM數(shù)據(jù)格式轉(zhuǎn)換成DED格式

3 Creator三維地形生成技術(shù)

根據(jù)仿真任務(wù)的不同需求，應(yīng)建立不同分辨率的三維地形，比如飛行仿真需要大范圍的地形，實時性要求高，但對地形細(xì)節(jié)要求不高，而基于地面的車輛駕駛和徒步行走的仿真，需要較高的分辨率，但是地形的使用范圍較小，開發(fā)人員需要結(jié)合其仿真任務(wù)需求靈活設(shè)置不同的參數(shù)。進(jìn)行Creator三維地形的建模的關(guān)鍵內(nèi)容是地形的LOD（層次細(xì)節(jié)）、投影方式、建模算法等參數(shù)的選取與設(shè)置。

3.1 層次細(xì)節(jié)模型參數(shù)設(shè)置

層次細(xì)節(jié)模型（Level of Details，LOD）技術(shù)的思想是在不影響畫面視覺效果的條件下，通過逐次簡化景物的表面細(xì)節(jié)來減少場景的幾何復(fù)雜度，其目的是提高繪制算法的效率，增加仿真的實時性。例如，若有許多可見面在屏幕上的投影小于一個像素，則完全可以合并這些可見面而對畫面的視覺效果沒有任何影響。該技術(shù)通常對每一原始多面體模型建立幾個不同逼近精度的幾何模型，與原模型相比，每個模型均保留了一定層次的細(xì)節(jié)。由于LOD算法要涉及到動態(tài)細(xì)分或規(guī)并三角網(wǎng)，所以運(yùn)用LOD算法時，常采用規(guī)則網(wǎng)格進(jìn)行地形建模。如圖4所示在Creator中設(shè)置LOD 為3層。

3.2 設(shè)置投影方式

Creator提供五種地圖投影方式：Flat Earth、Trapezoidal、Lambert Conic Conformal、UTM和Geocentric。Flat Earth在原點使用緯度，得到調(diào)整每個x值的單收斂因子，生成一個矩形的地形；Trapezoidal是一種方位角映射，在中心點最精確，離中心點越遠(yuǎn)越扭曲；Lambert Conic Conformal使用兩條標(biāo)準(zhǔn)緯線，在北緯84°和南緯80°的中間最精確，距離兩極越近越扭曲；UTM使用旋轉(zhuǎn)90°的柱面圓柱投影，在經(jīng)度上將地球分為六個區(qū)域，沿著中央子午線最精確，越遠(yuǎn)離子午線越扭曲；Geocentric方式使用圓形地球映射，Z軸以地球中心為起點通過北極。我國地處中緯度地區(qū)，適合采用斜軸方位投影。選擇Trapezoidal地圖投影方式，較好地保持了地形的輪廓形狀和地理位置，使等變形線與制圖區(qū)域的輪廓基本一致，減少了變形，提高了精度。如圖5所示設(shè)置投影方式為Trapezoidal地圖投影方式。

3.3 建模算法

用Creator將數(shù)字高程數(shù)據(jù)轉(zhuǎn)換成地形時，可以選擇四種轉(zhuǎn)換算法，分別是Polymesh、Delaunay、CAT和TCT四種算法。

Polymesh轉(zhuǎn)換算法主要適用于BSP進(jìn)行遮擋計算的實時系統(tǒng)?；舅枷胧牵ㄟ^在原數(shù)字高程數(shù)據(jù)文件中對高程信息進(jìn)行有規(guī)律的采用，從而獲取地形多邊形頂點坐標(biāo)，創(chuàng)建矩形網(wǎng)絡(luò)的地形數(shù)據(jù)庫。

Delaunay轉(zhuǎn)換算法是一種基于Delaunay三角網(wǎng)的地形生成算法，主要適用于使用Z-buffering進(jìn)行遮擋計算的實時系統(tǒng)。與Polymesh算法相比，生成相同精度的系統(tǒng)模型，使用Delaunay算法的地形模型中包含的多邊形數(shù)量較少。使用Delaunay算法時，數(shù)字高程數(shù)據(jù)中的每個高程點都會被采樣，而且會從最低的LOD地形模型生成，較低LOD模型中的多邊形頂點會被合并到較高的LOD地形模型中，以保證LOD地形之間的平滑過度。

TCT（Terrain Culture Triangulation）轉(zhuǎn)換算法相當(dāng)于一種限制性的Delaunay算法。當(dāng)使用TCT算法生成的地形時只能有一個單獨(dú)的LOD，而且只能用于批處理地形轉(zhuǎn)換中。

CAT（Continuous Adaptive Terrain）轉(zhuǎn)換算法是一種改進(jìn)型Delaunay轉(zhuǎn)換算法，該算法提高了相鄰LOD地形之間的平滑過渡，可以有效避免由Polymesh和Delaunay算法生成的多LOD地形模型轉(zhuǎn)換的視覺跳躍現(xiàn)象。

本文選擇Delaunay三角剖分算法，因為，與規(guī)則網(wǎng)格算法(Polymesh)相比，生成相同精度的地形模型，使用Delaunay轉(zhuǎn)換算法的地形數(shù)據(jù)庫中包含的多邊形數(shù)量較少。

3.4 紋理貼圖

根據(jù)地形模型的LOD數(shù)量，將每張圖片調(diào)整為相應(yīng)數(shù)量和精度的分辨率，將它們加載到Creator的紋理調(diào)板，并定義為地形紋理，設(shè)置紋理圖片的紋理坐標(biāo)和地圖投影方式。

紋理坐標(biāo)必須對應(yīng)于地形模型的面積范圍和坐標(biāo)位置，地圖投影方式則必須和對應(yīng)地形模型的設(shè)置一致。然后通過Terrain/Batch GeoPut菜單命令，為對應(yīng)的LOD地塊模型映射紋理。

圖6 生成的不含紋理的三維模型圖7 加入紋理映射后的三維模型

3.5 測試地形并進(jìn)一步優(yōu)化

整個三維地形生成完畢后，將其導(dǎo)入視景驅(qū)動環(huán)境下，在計算機(jī)仿真硬件平臺上，通過視點變換、其它仿真應(yīng)用添加、網(wǎng)絡(luò)連接等多個綜合測試環(huán)節(jié)，觀察場景運(yùn)行的實時性和逼真度。地形模型數(shù)據(jù)庫的生成是一個需要反復(fù)試驗的過程，需要反復(fù)地優(yōu)化參數(shù)、完善模型，在實時性與逼真性之間進(jìn)行平衡，合理設(shè)置轉(zhuǎn)換參數(shù)，最終達(dá)到最好的仿真效果[4]。

4 結(jié)論

本文采用我國東經(jīng)117度～117.5度，北緯37度～37.5度地域的ASTER GDEM數(shù)據(jù)及其衛(wèi)星遙感圖像作為原始數(shù)據(jù)和地表紋理圖像，地球橢球模型選擇美國的WGS-84地球橢球模型，地形轉(zhuǎn)換選用Delaunay地形算法，地形模型的LOD數(shù)目設(shè)為3，根據(jù)地形模型的LOD數(shù)量，將每張地表紋理圖片調(diào)整為256×256、128×128、64×64像素三種分辨率，映射到不同LOD分辨率的模型。最后生成的三維地形模型的范圍約為48×56km2，共259200個面，地形效果圖如圖7所示。通過仿真程序測試，利用ASTER遙感數(shù)據(jù)生成的大面積三維地形達(dá)到了精細(xì)度高、真實感強(qiáng)、實時性好的仿真要求。

參考文獻(xiàn)：

[1] 王貴林,姚鑫.ASTER立體像對提取山地DEM精度研究[J].礦山測量,2008(6):34-35.

[2] 程博,劉少峰,楊巍然.Terra衛(wèi)星ASTER數(shù)據(jù)的特點與應(yīng)用[J].華東地質(zhì)學(xué)院學(xué)報,2003(3):15-16.

篇6

美國暢銷書作者、發(fā)明家雷.庫茲韋爾（Ray.Kurzweil）在《奇點臨近》一書中為人工智能的出現(xiàn)設(shè)定了三個條件：強(qiáng)大的計算能力、海量的知識儲備，最后還需要教會計算機(jī)擁有認(rèn)知能力，通過機(jī)器學(xué)習(xí)技術(shù)讓計算機(jī)不斷的自行進(jìn)化。

前兩者已經(jīng)實現(xiàn)。第三點，如何讓機(jī)器擁有認(rèn)知能力是AI極客們關(guān)注的重點。

機(jī)器學(xué)習(xí)是人工智能的核心。機(jī)器學(xué)習(xí)將教會計算機(jī)認(rèn)識現(xiàn)實世界，知道自然界的日升日落、陰晴圓缺，并能理解人類的行為和語言。機(jī)器學(xué)習(xí)的常用領(lǐng)域包括數(shù)據(jù)挖掘、視覺理解、語音識別和自然語言處理等方面。我們采訪了數(shù)位科技公司高層、新銳創(chuàng)業(yè)者，他們有一個共同的身份―國內(nèi)從事機(jī)器學(xué)習(xí)的應(yīng)用和研發(fā)的專家。他們講述了中國人工智能發(fā)展的現(xiàn)狀，而一旦科技出現(xiàn)新突破，也預(yù)示著新一輪的商業(yè)變革。先知

坐在記者對面，臉龐消瘦的陳運(yùn)文笑得有些靦腆，言語卻充滿自信，“很多事情都是可以預(yù)測的”。

陳運(yùn)文是國內(nèi)大數(shù)據(jù)方面的專家，曾任百度核心技術(shù)研發(fā)工程師和盛大文學(xué)首席數(shù)據(jù)官?，F(xiàn)在他是個創(chuàng)業(yè)者，達(dá)觀數(shù)據(jù)創(chuàng)始人兼CEO。他為公司新入職的同事下發(fā)了一套題――如何預(yù)測泰坦尼克號上的幸存者。整套題通過獲取泰坦尼克號上所有乘客的真實信息，包括性別、年齡、職業(yè)、票價、艙位等，然后編寫程序來預(yù)測這2000余名乘員中哪些人最終得以生還。

在陳運(yùn)文眼里，將所有信息加以綜合挖掘，就能夠推演出最終的答案―“705名生還者都可以準(zhǔn)確預(yù)測?！?/p>

預(yù)測這樣的事件只是數(shù)據(jù)挖掘的一個案例，對于極客而言，只要給他們足夠的信息，這個世界就沒有意外和偶然。

現(xiàn)在，陳運(yùn)文用自己的技術(shù)幫助企業(yè)進(jìn)行商業(yè)決策。雖然只成立不到半年，但這個隱藏在張江天之驕子公寓里的創(chuàng)業(yè)公司已經(jīng)獲得真格基金和盛大網(wǎng)絡(luò)創(chuàng)始人陳大年的投資。

陳運(yùn)文將第一批客戶瞄準(zhǔn)為自媒體人，通過數(shù)據(jù)分析，為自媒體提供可以引發(fā)熱議的話題，并告訴這些作者，什么人喜愛看他們的文章、會關(guān)注什么話題。

讓機(jī)器自己學(xué)會分析信息早就在商業(yè)行為中廣泛存在。在百度工作期間，陳運(yùn)文負(fù)責(zé)搜索引擎的核心算法研究，主要“為用戶提供最有價值的信息”。工作的難點不在于搜索信息，而在于讓機(jī)器認(rèn)知用戶的搜索意圖。

用戶經(jīng)常會在搜索框中輸入“口語詞匯或者模糊的語句”，服務(wù)器要從人們的搜索語句中判斷真正的需求。陳運(yùn)文就需要設(shè)計算法讓搜索引擎理解用戶的語義，從數(shù)百億的網(wǎng)頁中迅速找到對用戶最有價值的結(jié)果。這種“算法”就屬于人工智能。百度每天的搜索有數(shù)十億次，每當(dāng)陳運(yùn)文改進(jìn)了算法都能看到用戶點擊的滿意度在上升。

今天這種依靠數(shù)據(jù)挖掘技術(shù)來提高企業(yè)運(yùn)作效率的方法變得更常見，業(yè)內(nèi)將其稱為“商業(yè)智能”（Business Intelligence）技術(shù)。陳運(yùn)文計劃將這種技術(shù)在云端運(yùn)用，另一些同類公司則將這種技術(shù)直接運(yùn)用在軟件上。2010年在美國納斯達(dá)克上市的Qlik公司就是商業(yè)智能軟件的代表企業(yè)。他們的QlikView軟件為用戶提供“可視化”的大數(shù)據(jù)服務(wù)。

“我們的軟件可以理解數(shù)據(jù)，挖掘數(shù)據(jù)并將其用更直觀的方式展現(xiàn)給客戶，以幫助管理層做出決策。” Qlik亞太區(qū)制造業(yè)和高科技市場開發(fā)總監(jiān)Jeremy Sim對《財經(jīng)天下》周刊表述。

這些帶有“預(yù)測”功能的軟件已經(jīng)在服務(wù)并改變?nèi)藗兊纳睿热绺鶕?jù)顧客的購買信息QlikView會提示便利店店長，售貨架上的麥片不應(yīng)該和面包擺在一起，雖然它們都是早餐食品，但如果將麥片和酸奶擺在一起，銷售數(shù)字會更好看。此類預(yù)測還進(jìn)一步提醒物流部門，盡量地在頭天晚上補(bǔ)足麥片和酸奶貨源。這類商業(yè)智能的應(yīng)用滲入所有人的生活，以這家公司為例，他們已經(jīng)在全球100多個國家招徠了3.8萬企業(yè)客戶，間接服務(wù)人群上千萬。

未來這些帶有“智力”的系統(tǒng)將會更多的出現(xiàn)在電商、醫(yī)療、教育、金融等領(lǐng)域。“比如隨著智能手環(huán)的增加，會有更多的健康數(shù)據(jù)被采集，那么我們會提供健康預(yù)警、治療方案推薦等服務(wù)?！标愡\(yùn)文說?，F(xiàn)在只是大數(shù)據(jù)挖掘的初級階段，人工智能時代也才剛剛開啟。視覺理解，打造機(jī)器之目

2014年6月，比爾?蓋茨訪華，除了見政商要員外，他還專門造訪了一家剛成立一年的創(chuàng)業(yè)公司―格靈深瞳。對于這家初創(chuàng)公司，比爾蓋茨留下了兩句后來被廣泛引用的評語“This is very cool”和“IT界的下一個大事件是計算機(jī)視覺（computer vision）與深度學(xué)習(xí)（deep learning）的結(jié)合”。

格靈深瞳就是這樣一個結(jié)合了計算機(jī)視覺和深度學(xué)習(xí)為一身的酷公司。創(chuàng)始人趙勇是致力于視覺理解的知名極客，雖然他本人并不喜歡這個稱謂。

“極客（Geek）在英文里形容書呆子，只會做技術(shù)不通世事，但我覺得我是一個懂技術(shù)的正常人?！彼麑Α敦斀?jīng)天下》周刊說。

趙勇專攻計算機(jī)視覺和運(yùn)算影像學(xué)，2009年入職谷歌總部研究院任資深研究員，是谷歌眼鏡項目的骨干?！拔覀儓F(tuán)隊負(fù)責(zé)谷歌眼鏡的場景識別技術(shù)，利用谷歌街景來判斷使用者所處的位置。”簡單地說就是將谷歌眼鏡捕獲的圖像和谷歌街景做比對，然后快速地定位用戶所處位置和周邊信息。谷歌眼鏡可以在500毫米之內(nèi)將用戶的位置精確到米級別。趙勇說谷歌眼鏡并不是“進(jìn)化的產(chǎn)品，而是從無到有的突破”。

2013年初，趙勇回國創(chuàng)業(yè)成立格靈深瞳，并在三個月后拿到真格基金和聯(lián)創(chuàng)策源的聯(lián)合天使投資，同年6月格靈深瞳又拿到紅杉資本 A 輪高達(dá)數(shù)千萬美元的投資。

業(yè)內(nèi)傳播著投資人爭論其未來估值的段子，據(jù)說某次飯局上真格基金的徐小平、紅杉資本的沈南鵬和聯(lián)創(chuàng)策源的馮波討論格靈深瞳的未來估值，徐小平認(rèn)為起碼5000億美元，而沈南鵬認(rèn)為1000億美元，最后馮波折中地認(rèn)為3000億美元。而現(xiàn)在中國電商巨頭阿里巴巴的市值還不到1900億美元。

受到比爾?蓋茨和投資人如此追捧的原因在于趙勇的研究方向―計算機(jī)視覺，這是機(jī)器學(xué)習(xí)中極為復(fù)雜的領(lǐng)域。

將趙勇和陳運(yùn)一個對比就可以看出他們研究方向的不同。趙勇認(rèn)為數(shù)據(jù)挖掘是讓計算機(jī)理解“結(jié)構(gòu)化信息”，結(jié)構(gòu)化指那些人工制作的成型的信息數(shù)據(jù)，例如一句話一段文字或者一份表格。但計算機(jī)視覺需要讓機(jī)器理解飄過鏡頭的一片樹葉，或者悄悄走過的一只貓。

陳運(yùn)文對此也做了比較，他認(rèn)為數(shù)據(jù)挖掘更多的是處理文本信息，而文字是具象的表達(dá)，機(jī)器看到漢字“貓”或者英文“cat”就可以理解這是一種動物，但圖片是抽象信息，給計算機(jī)看一張貓的圖片，讓它去理解貓的概念非常困難。

所以當(dāng)2012年6月谷歌X實驗室宣布他們研發(fā)的“谷歌大腦”通過百萬張圖片的學(xué)習(xí)后可以識別“貓”的時候，全世界都為之震驚。這意味著谷歌培養(yǎng)的這個“孩子”具備視覺理解的能力可以“看圖說話”了。而參與“谷歌大腦”研發(fā)的吳恩達(dá)博士（Andrew Ng）也因為這個項目被譽(yù)為“谷歌大腦之父”，成為機(jī)器學(xué)習(xí)領(lǐng)域最權(quán)威的學(xué)者。

為了建造“谷歌大腦”，吳恩達(dá)使用了神經(jīng)網(wǎng)絡(luò)系統(tǒng)，他們連接了1.6萬片處理器創(chuàng)造了一個擁有10億多條連接的神經(jīng)網(wǎng)絡(luò)，并逐步地培訓(xùn)這個系統(tǒng)，直到它擁有識圖的能力。

現(xiàn)在，趙勇做的事情與此類似。

他通過影像設(shè)備捕捉實時畫面，讓計算機(jī)識別這個真實世界，更為直接的說法或許是―趙勇正在研制“機(jī)器人之眼”。

像谷歌一樣，想讓計算機(jī)能識別圖像，趙勇也需要制作一個“深度神經(jīng)網(wǎng)絡(luò)”系統(tǒng)。

在人腦中有大約1000億個神經(jīng)元，神經(jīng)元通過神經(jīng)突出連接在一起就變成了一個神經(jīng)網(wǎng)絡(luò)，人們思考問題的時候這些神經(jīng)網(wǎng)絡(luò)相互激發(fā)，最終產(chǎn)生決策?，F(xiàn)在極客們用計算機(jī)來模擬這個過程，用計算程序建立起龐大的計算元素，這些程序運(yùn)算的結(jié)果通過網(wǎng)絡(luò)互為交換互相影響，最終產(chǎn)生結(jié)果，這就是初級的人工神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)層級越多規(guī)模越大，其“聰明程度”就越高，學(xué)習(xí)的能力就越強(qiáng)。

要培養(yǎng)這樣一個會“識圖的孩子”，趙勇除了要建立這樣一套龐大的神經(jīng)網(wǎng)絡(luò)之外，還需要不停訓(xùn)練這個網(wǎng)絡(luò)。

“可以將神經(jīng)網(wǎng)絡(luò)當(dāng)成一個黑盒子，我在里面設(shè)定了一些基本參數(shù)，隨后不停的往里面輸入數(shù)據(jù)、圖片來訓(xùn)練它，通過這種大量的訓(xùn)練，黑盒子里面參數(shù)的連接會越來越緊密，整個網(wǎng)絡(luò)也會越來越聰明，最終變成一個可以識別圖片的智能系統(tǒng)。”

嚴(yán)格地說，人工智能不是人類設(shè)計出來的，而是人類訓(xùn)練出來的。即便是趙勇這樣的創(chuàng)建者也無法知道這些神經(jīng)網(wǎng)絡(luò)到底如何相互作用相互影響，并最終形成自己的智能系統(tǒng)。他能做的只是“選擇輸入數(shù)據(jù)，控制訓(xùn)練方向”。

依舊以老師教育孩子做比喻，雖然趙勇這個老師不知道孩子是怎么理解圖片，識別這個世界的，但他可以控制教學(xué)的內(nèi)容，讓這個孩子朝某個方面學(xué)習(xí)。

趙勇花費(fèi)了兩年時間才為格靈深瞳培養(yǎng)出自己的“孩子”，并將這些有“識圖能力”的人工智能設(shè)備應(yīng)用到安防監(jiān)控和汽車識別方面。

去年格靈深瞳推出了名為“目”的行為分析儀，這是一個包含軟硬件于一體的智能監(jiān)控產(chǎn)品?！澳俊睍崟r監(jiān)控場景內(nèi)的情況，發(fā)覺異常就立刻報警或者提醒工作人員注意。而在另一個名為“威目”的產(chǎn)品中，格靈深瞳做到了車輛識別，他們訓(xùn)練系統(tǒng)辨識超過5000種車輛，這幾乎涵蓋了地球上所有的汽車類型。這種能力為警方辦案提供了幫助，警方可以用“以圖搜圖”的方式讓“威目”提供他們需要的視頻資料。“警方提供一張汽車照片，威目在識別照片之后可以從交通錄像中找出該車的行動軌跡?！背酥?，該系統(tǒng)還可以搜索“結(jié)構(gòu)化信息”，例如在系統(tǒng)中輸入2004年生產(chǎn)車牌中含有5這個數(shù)字的紅色奧迪A4汽車，“威目”就會在資料中截取相關(guān)的圖像或者視頻，而此前這些工作都需要人工完成。

如果計算機(jī)視覺技術(shù)以這樣的速度繼續(xù)，或許用不了幾年，當(dāng)我們站在攝像頭前時，計算機(jī)會在屏幕上敲出那句讓人激動的言語―“I see you .” 造物者

“谷歌大腦之父”吳恩達(dá)在完成了“認(rèn)貓”創(chuàng)舉兩年后離開了谷歌，加盟了百度，任職百度首席科學(xué)家并負(fù)責(zé)“百度大腦”的研發(fā)。

說服吳恩達(dá)做此決定的是他的好友，現(xiàn)任地平線機(jī)器人技術(shù)CEO的余凱。

余凱是國際知名的機(jī)器學(xué)習(xí)專家，他牽頭成立的百度深度學(xué)習(xí)研究院是國內(nèi)第一個研究深度神經(jīng)網(wǎng)絡(luò)的研究機(jī)構(gòu)，加盟百度時被李彥宏稱為“鎮(zhèn)院之寶”。

“深度網(wǎng)絡(luò)學(xué)概起始于2006年，當(dāng)時主要有5個機(jī)構(gòu)從事這方面的研究，分別是多倫多大學(xué)、紐約大學(xué)、美國的NEC實驗室、斯坦福大學(xué)和蒙特利爾大學(xué)，而我當(dāng)時在NEC實驗室工作。”余凱說。有段時間他還在斯坦福大學(xué)執(zhí)教《人工智能概論》。他領(lǐng)導(dǎo)的團(tuán)隊在深度學(xué)習(xí)、圖像識別、文本挖掘、多媒體檢索、視頻監(jiān)控，人機(jī)交互等機(jī)器學(xué)習(xí)領(lǐng)域都有建樹。

去年余凱離開百度，在中關(guān)村的創(chuàng)富大廈租賃辦公室成立地平線機(jī)器人技術(shù)。成立僅4個月，這家公司就迎來了首輪投資，投資方包括晨興資本、高瓴資本、紅杉資本、金沙江創(chuàng)投等多家機(jī)構(gòu)。

比起商業(yè)上的追求，余凱更想用技術(shù)改變世界―為萬物裝上人工智能的大腦，讓它們變成擁有智能思維的機(jī)器人。

在余凱看來，他在百度的工作主要是在“云端”搭建人工智能深度神經(jīng)網(wǎng)絡(luò)，其服務(wù)主要體現(xiàn)在“為用戶提供更智能的互聯(lián)網(wǎng)服務(wù)”，他希望通過人工智能技術(shù)應(yīng)用到物理世界中，讓人們的生活變得更方便和簡單?！艾F(xiàn)在很多電器都采用軟件結(jié)合互聯(lián)網(wǎng)操控，我希望未來都可以實現(xiàn)本地人工智能操控?！?/p>

他準(zhǔn)備讓汽車、空調(diào)、冰箱、微波爐等上千種產(chǎn)品或設(shè)備都具有從感知到?jīng)Q策的能力。比如用戶進(jìn)入房間時空調(diào)就可以感知人的位置和體溫自動開機(jī)送風(fēng)，并追隨人的移動而改變送風(fēng)方向；冰箱則會讀取存儲食物的信息，及時提醒用戶食用或補(bǔ)充。

余凱利用深度神經(jīng)網(wǎng)絡(luò)算法來搭建他的人工智能框架。他將這種人工智能系統(tǒng)描述成“類似于安卓的智能硬件的大腦平臺”，這個系統(tǒng)可以安裝在不同的產(chǎn)品中。

他“改造萬物”的計劃先從家居產(chǎn)品和汽車兩個方面著手。地平線機(jī)器人技術(shù)研發(fā)了針對這兩個行業(yè)的人工智能操作系統(tǒng)。家居方面的基于深度神經(jīng)網(wǎng)絡(luò)的操作系統(tǒng)名為“安徒生”，汽車的則稱為“雨果”。

現(xiàn)在 “安徒生”已經(jīng)入駐家電產(chǎn)品，在剛剛過去的上海家博會展上，地平線機(jī)器人和某國內(nèi)知名家電廠商合作的兩款智能產(chǎn)品面世參展?！艾F(xiàn)在業(yè)界最大的智能家居廠商都是我們的客戶，我們向他們提供算法操作系統(tǒng)，并告訴他們?nèi)绾闻渲糜布O(shè)備，就像安卓向手機(jī)廠商提供參考設(shè)計一樣。”

下一步余凱準(zhǔn)備讓“雨果”進(jìn)入汽車自動駕駛領(lǐng)域，在安裝了傳感器、處理器和雨果大腦平臺后，汽車可以成為提供無人駕駛或智能駕駛的新型交通工具。

“定義萬物智能的大腦，這還要花很長時間，但是我覺得一步一步往那邊靠近?！?余凱知道地平線機(jī)器人的征程漫漫，但對于AlphaGo對戰(zhàn)李世石這樣的人機(jī)大戰(zhàn)新聞他卻無比篤定?！百惽皫缀跛袑＜叶颊f這次機(jī)器贏不了，但我在接受網(wǎng)易采訪的時候就公開預(yù)測機(jī)器會贏，因為我了解AlphaGo的算法?！?/p>

陳運(yùn)文也表達(dá)了相同的猜測。3月9日下午，陳運(yùn)文就興奮地預(yù)測AlphaGo能夠獲勝，那時首爾的李世石剛在棋盤上落下自己的第一枚黑子。

篇7

新數(shù)據(jù)源分析將打破傳統(tǒng)商業(yè)模式

以司機(jī)保險為例，遠(yuǎn)程信息處理技術(shù)的廣泛應(yīng)用意味著基于保險精算表格的共享風(fēng)險模式的終結(jié)，因為司機(jī)這個群體從整個人口中消失了，保險是基于對實際駕駛行為的分析來進(jìn)行收費(fèi)。醫(yī)療保險據(jù)此也不會太遠(yuǎn)，而且這可能正成為公共醫(yī)療系統(tǒng)的現(xiàn)實――重新將精力集中在主動式的醫(yī)療保健而不是被動地響應(yīng)疾病的治療。進(jìn)一步的，越來越多的像審計師這樣的白領(lǐng)正期待分析自動化時代的到來。這是腦力勞動機(jī)械化的一個邏輯延續(xù)――我們已經(jīng)忘記了不久前“電腦”和“計算器”還曾是人們的職位名稱。

決策者將廣泛使用共享、沉浸式的分析體驗

BI的發(fā)展一直專注在小型設(shè)備上，但是現(xiàn)在將轉(zhuǎn)為專注于非常大（像一面墻那么大）的觸屏設(shè)備上。這使得整個團(tuán)隊可以共同對數(shù)據(jù)進(jìn)行實時探索并由此做出決策。在2015年，有39%的人表示，影響決策制定的三大原因之一是與同事的意見不一致，而到2021年，我們所有人都會一起在數(shù)據(jù)中工作。

BI將會支持更廣泛、完全的人類學(xué)習(xí)模式

2015年，數(shù)據(jù)得以可視化。但并不是所有使用數(shù)據(jù)的人都能夠獲得同等的視覺導(dǎo)向。人類運(yùn)用個體的感官輸入進(jìn)行學(xué)習(xí)，這通常有三種模式――聽覺型、閱讀型以及視覺型或動態(tài)型。

到2021年，商業(yè)智能將利用信息傳遞手段使用所有學(xué)習(xí)模式，比如對于聽覺型的學(xué)習(xí)者，會自動生成口頭或書面的敘述形式來描述所選數(shù)據(jù)的形狀或者圖表內(nèi)容。與此類似，3D打印圖表繪制對于動態(tài)型的學(xué)習(xí)者而言無疑是扮演了一個重要角色，這使他們能夠親身感受到誰工作得最好。當(dāng)然，對于視覺導(dǎo)向的學(xué)習(xí)者來說，他們面臨的選擇將會增加，利用大量高分辨率顯示器實現(xiàn)大量數(shù)據(jù)集的展現(xiàn)甚至虛擬現(xiàn)實的體驗。

對數(shù)據(jù)的解讀能力將大大提高

毫無疑問，在未來五年里，人們對各種形式的數(shù)據(jù)可視化將更為熟悉，將會更容易從圖表中讀取和利用其中的深刻洞見。（這與人們對電影的解讀非常相似。隨著時間的推移，人們逐漸熟悉膠片的“語言”并把對電影的解讀作為人類的第二天性）也許更重要的是，教育系統(tǒng)將會加入更多商業(yè)分析和其他課程。領(lǐng)先的公司將會對員工進(jìn)行數(shù)據(jù)讀寫能力的培訓(xùn)，因為他們意識到員工的數(shù)據(jù)解讀能力將為企業(yè)增加競爭優(yōu)勢。當(dāng)然，更多有數(shù)據(jù)學(xué)習(xí)經(jīng)驗的人對于數(shù)據(jù)的要求也會更多。

個人分析能力成為基本要求

我們看到的一些自我量化的行動也許現(xiàn)在看來非常讓人厭惡，但是隨著服務(wù)和設(shè)備產(chǎn)生更多的數(shù)據(jù)，這些行為很快就會成為一種慣例。因為，這些對“我的數(shù)據(jù)”進(jìn)行個人分析會成為自我改善的一種方式。

不僅如此，人們還會越來越多的在家庭生活以及社交生活（無論是地理上的還是興趣分享上的）中使用分析。對于軟件供應(yīng)商來說，這是一個有趣的暗示，它代表了另一個消費(fèi)趨勢，個人喜好終將會導(dǎo)致“攜帶個人化的分析工具”時代的到來。

更多人將會利用預(yù)測分析

雖然許多企業(yè)都會安排一些人做更為復(fù)雜的統(tǒng)計預(yù)測，但是這并不普遍。行業(yè)分析師的數(shù)據(jù)顯示，僅不到20%的人在廣泛使用預(yù)測分析（作為他們BI項目的一部分）。要克服這一障礙有兩個至關(guān)重要的驅(qū)動力。首先是使用技術(shù)，通過自動向他們展示未來趨勢來推動那些非統(tǒng)計專業(yè)的人士使用預(yù)測分析工具。比如，使用最佳模式來預(yù)測三個時期的支出情況的線形圖，用敘述的形式告訴用戶，KPI將會在某個日子掉落到一個不可接受的范圍，或者在分析應(yīng)用里使用蒙特卡羅模擬算法。第二個驅(qū)動力是讓工具變得更廣泛可用，從而支持預(yù)測性模型。過去，技術(shù)和知識是不對稱地分布在少數(shù)專家手中的。到2021年，這種持續(xù)還不到20年（通過開源R統(tǒng)計語言）的現(xiàn)象就將會完成古騰堡為了寫作所做的統(tǒng)計概率分析。

分析歷史數(shù)據(jù)變得更簡單

數(shù)據(jù)存儲花費(fèi)的急劇下降意味著，到2021年，各機(jī)構(gòu)將擁有可訪問的可讀形式的數(shù)據(jù)（沒有磁帶備份），可以及時回溯。這將實現(xiàn)算法識別和深度模式的分析，分析過去的數(shù)據(jù)，證明分析周期超過經(jīng)濟(jì)周期是有用的。這還將幫助機(jī)構(gòu)不要重蹈覆轍。以上次經(jīng)濟(jì)蕭條為例，由于數(shù)據(jù)已經(jīng)無法回溯，企業(yè)因此不能學(xué)到教訓(xùn)，這在2021年就不會發(fā)生了。

智能決策自動化（IDA）將隨著機(jī)器更智能而采用更多商務(wù)決策

在2016年，IDA只能處理簡單的戰(zhàn)術(shù)（例如單個客戶/狀態(tài)）決策，但是由于AI在學(xué)習(xí)和模型中的應(yīng)用更為廣泛，IDA將會有更廣泛的選擇而不僅僅是決策樹形圖的展現(xiàn)。像谷歌這樣的先行者讓它的機(jī)器學(xué)習(xí)軟件（TensorFlow）開源化的舉措，只會增加AI在決策中的使用，但這是有局限性的。

更多機(jī)構(gòu)將會進(jìn)行決策回顧

根據(jù)Qlik收集的數(shù)據(jù)顯示，2015年只有23%的機(jī)構(gòu)會例行查看商務(wù)決策的結(jié)果。鑒于此，投入BI的理由常常是“提高決策能力”。到2021年，更多機(jī)構(gòu)將會塑造更多決策。“決策”因此也會成為BI元數(shù)據(jù)類型，因此也是可以分析的。我們可以看到機(jī)構(gòu)是否做出了正確的決策，輸入和輸出是什么，或許還可以看到哪個團(tuán)隊做出了最佳決策。

混合的啟發(fā)式/算法管理以及決策制定將會在一些機(jī)構(gòu)內(nèi)形成

理想的管理團(tuán)隊能夠匯集人們學(xué)習(xí)經(jīng)驗中的積極元素，并通過啟發(fā)式的決策以及算法計算表達(dá)出來。這讓每一個會議桌前的人都可以發(fā)聲。這是主觀和客觀的混合體――試想柯克船長和斯波克博士――依據(jù)數(shù)據(jù)和其他內(nèi)容一起做出決策。到了2021年，這種混合的情況將會以自動生成的數(shù)據(jù)故事的形式來啟發(fā)和延展人們的觀點，除了這以外誰知道還會發(fā)生什么呢？由電腦產(chǎn)生出來的阿凡達(dá)可展現(xiàn)數(shù)據(jù)和提供輸入語言，這應(yīng)該不斷太牽強(qiáng)。

以上僅是筆者對BI未來的幾點預(yù)測，當(dāng)然也可能過于樂觀或過于消極，其未來發(fā)展趨勢或許也會因外部突發(fā)事件而帶來變化。

相關(guān)鏈接

建立科學(xué)決策分析模型

第一步，為數(shù)據(jù)驅(qū)動決策打下基礎(chǔ)。企業(yè)需要將各類數(shù)據(jù)源連接在一起，以便每個業(yè)務(wù)團(tuán)隊都可在語境中查看數(shù)據(jù)，這個過程應(yīng)確保每個人都能基于同一組數(shù)據(jù)開展業(yè)務(wù)。

篇8

【中圖分類號】G434【文獻(xiàn)標(biāo)識碼】B【論文編號】1009―8097(2010)04―0120―03

引言

在國際上,VR與仿真技術(shù)非常普遍與成熟。在遠(yuǎn)程協(xié)作的分布式VR與仿真系統(tǒng)方面,他們制定了一系列標(biāo)準(zhǔn)、協(xié)議和算法。在國外虛擬環(huán)境中的協(xié)同式訓(xùn)練系統(tǒng)也有研究,比較有代表性的是SecuReVi系統(tǒng),它是利用MASCARET模型設(shè)計的虛擬環(huán)境中多人協(xié)同滅火的消防員訓(xùn)練系統(tǒng),還有些遠(yuǎn)程醫(yī)療手術(shù)協(xié)作訓(xùn)練系統(tǒng),這些系統(tǒng)多數(shù)是在研究階段,成型產(chǎn)品極為少數(shù)。和一些發(fā)達(dá)國家相比,我國協(xié)同VR與仿真技術(shù)還有一定的差距,其應(yīng)用也主要集中在軍事院校和研究所,也取得了一定研究成果[1][2],特別是在分布式VR與仿真領(lǐng)域里,國內(nèi)在這方面的研究也有所開展[3][4]。

由于教育培訓(xùn)軟件的應(yīng)用長期局限于平面的文字及圖像表述,即使近年來動態(tài)圖形圖像表現(xiàn)形式大大提高了內(nèi)容的表現(xiàn)效果,但仍無法真正滿足人類視覺、聽覺……甚至是感覺上的認(rèn)同效應(yīng)。因此,當(dāng)前傳統(tǒng)的CBT(計算機(jī)支持的教育培訓(xùn)體系,Computer Based Training)訓(xùn)練方式已在一定程度上無法滿足高科技培訓(xùn)的需要,基于計算機(jī)虛擬現(xiàn)實仿真技術(shù)的協(xié)同式訓(xùn)練系統(tǒng)將視景仿真和協(xié)同工作的概念引入CBT中,它拋棄了傳統(tǒng)的訓(xùn)練必須在真實的環(huán)境和場地下進(jìn)行的觀念;同時也克服了傳統(tǒng)訓(xùn)練無法模擬某些現(xiàn)場環(huán)境的缺陷,如飛機(jī)上、地鐵中、商廈里等,它使受訓(xùn)人員不用再冒著一定的危險、不用再在投入巨額的設(shè)備購買和場地布置的情況下就能參加訓(xùn)練。通過應(yīng)用現(xiàn)代化的虛擬現(xiàn)實技術(shù)進(jìn)行協(xié)同式訓(xùn)練系統(tǒng)的研發(fā),將克服實際場地演練的諸多不足,不僅花費(fèi)小,對環(huán)境沒有污染,而且沒有危險,是未來技能培訓(xùn)的主要手段之一[5][6]。系統(tǒng)在各種高危領(lǐng)域和應(yīng)急處理場合有著廣泛的應(yīng)用,可應(yīng)用于工廠企業(yè)、航空、地鐵公司、社區(qū)、商店等大型場所的應(yīng)急訓(xùn)練;還可用于部隊演習(xí);學(xué)校、研究所大型實驗;網(wǎng)絡(luò)游戲;遠(yuǎn)程醫(yī)療等。該系統(tǒng)的研究將推動計算機(jī)虛擬現(xiàn)實仿真技術(shù)的發(fā)展,促進(jìn)了計算機(jī)科學(xué)在現(xiàn)實生活中的應(yīng)用。本文以航空客艙乘務(wù)員應(yīng)急處理訓(xùn)練為例,介紹基于虛擬現(xiàn)實的協(xié)同訓(xùn)練系統(tǒng)的設(shè)計過程、原理及關(guān)鍵技術(shù)的實現(xiàn)。

一系統(tǒng)描述

基于虛擬現(xiàn)實的協(xié)同訓(xùn)練系統(tǒng)是一個綜合應(yīng)用虛擬現(xiàn)實技術(shù)、網(wǎng)絡(luò)通信技術(shù)、三維圖形圖像技術(shù)和數(shù)據(jù)庫技術(shù)設(shè)計和開發(fā)的一個虛擬仿真訓(xùn)練軟件,具有在虛擬仿真環(huán)境中進(jìn)行多用戶協(xié)同操作和基于知識庫的智能評判功能特點。系統(tǒng)利用三維技術(shù)構(gòu)建各種虛擬訓(xùn)練場景(如飛機(jī)、地鐵等),多個用戶在這樣的虛擬仿真環(huán)境中,通過網(wǎng)絡(luò)進(jìn)行文字和語音的通信、相互合作完成一個訓(xùn)練任務(wù)。同時,系統(tǒng)提供任務(wù)的知識庫進(jìn)行操作過程的正確性判斷和提示,并詳細(xì)記錄各個用戶操作過程,提供專家進(jìn)行評判(如圖1所示)。系統(tǒng)采用了視景仿真、多用戶協(xié)同、知識庫與匹配策略的技術(shù),并在訓(xùn)練過程中具有多感知性、實時性、互操作性以及真實臨場性的特征,可廣泛應(yīng)用于特定環(huán)境下一個團(tuán)隊通過相互配合,相互協(xié)作來有效地完成訓(xùn)練任務(wù)

在此系統(tǒng)基礎(chǔ)上,加入具體應(yīng)用的環(huán)境(3D場景),利用系統(tǒng)接口和核心功能設(shè)計具體應(yīng)用的驅(qū)動模塊,形成具體應(yīng)用的系統(tǒng)。如進(jìn)行飛機(jī)客艙火災(zāi)應(yīng)急處理訓(xùn)練,系統(tǒng)將裝入一個飛機(jī)機(jī)艙的場景和訓(xùn)練角色,多人通過網(wǎng)絡(luò)、視景等多種交互方式協(xié)同地進(jìn)行飛機(jī)客艙火災(zāi)應(yīng)急處理,形成了某一特定應(yīng)用的協(xié)同式訓(xùn)練的應(yīng)用系統(tǒng)。

基于虛擬現(xiàn)實的協(xié)同訓(xùn)練系統(tǒng)主要有如下應(yīng)用特點:

1 基于虛擬現(xiàn)實的協(xié)同式訓(xùn)練系統(tǒng),通過模擬現(xiàn)場的實際情況,從而提高實際操作人員對各種實際環(huán)境的協(xié)同處理能力。系統(tǒng)尤其適合于模擬高危領(lǐng)域的操作訓(xùn)練,如火災(zāi)、地震、防恐等;

2 克服了傳統(tǒng)訓(xùn)練中實景再現(xiàn)困難、場地特殊、人員調(diào)度復(fù)雜等環(huán)境因素,適合機(jī)、地鐵、鬧市、商住大廈等情況較復(fù)雜地區(qū)的訓(xùn)練模擬;

3 降低對人員財物等的安全威脅,也便于人員時間上的安排與調(diào)度,減少人力、財力等各方開支,并且間接性地減少了對周圍環(huán)境的污染。適合于要求團(tuán)隊組員同時在現(xiàn)場進(jìn)行協(xié)同訓(xùn)練的場合,如遠(yuǎn)程醫(yī)療專家合診、網(wǎng)絡(luò)游戲;

4 利用計算機(jī)手段,實現(xiàn)訓(xùn)練模擬,運(yùn)用多媒體的實現(xiàn)方式,提高人員訓(xùn)練熱情和整體訓(xùn)練效果,因而也適用于原理或操作較枯燥的訓(xùn)練內(nèi)容,如學(xué)校、研究所等實驗仿真。

二系統(tǒng)實現(xiàn)原理

整個系統(tǒng)實現(xiàn)由三層結(jié)構(gòu)組成(如圖2所示)。底層是操作系統(tǒng)與開發(fā)API組成的支撐環(huán)境,中間層是由核心程序與接口組成的系統(tǒng)平臺,頂層是三維場景模型與系統(tǒng)功能驅(qū)動組成的應(yīng)用程序。

系統(tǒng)平臺主要由三維場景子系統(tǒng)、協(xié)同通信子系統(tǒng)和訓(xùn)練管理子系統(tǒng)組成。其主要特點:將多用戶協(xié)同處理計算機(jī)模擬的理念,具體應(yīng)用到行業(yè)技能訓(xùn)練的領(lǐng)域中,并在訓(xùn)練過程中,采用了視景仿真、協(xié)同、知識庫的技術(shù)。

(1) 三維場景子系統(tǒng)

三維場景子系統(tǒng)是用三維造型來模擬現(xiàn)實訓(xùn)練環(huán)境的一種實時渲染圖形系統(tǒng)。系統(tǒng)完成的主要模塊有模型導(dǎo)入、運(yùn)動仿真、場景設(shè)置、碰撞檢測等。

模型導(dǎo)入利用功能強(qiáng)大的三維造型軟件,如3DS Max,MAYA制作三維模型,紋理以及動畫等,然后輸入至訓(xùn)練場景中,具體包括:3D對象導(dǎo)入、角色導(dǎo)入、動畫導(dǎo)入、材質(zhì)和紋理的設(shè)置、坐標(biāo)設(shè)置、比例變換等等。運(yùn)動仿真是對場景中人和物體運(yùn)動的一種數(shù)學(xué)物理描述以及控制,它包括各種運(yùn)動類型,如走、跑、轉(zhuǎn)身、站立、蹲下、取物等等。場景設(shè)置主要是提供改變某些場景的參數(shù),改善視覺效果,便于觀察和響應(yīng)不同的訓(xùn)練要求,具體包括:燈光設(shè)置、視角設(shè)置、環(huán)境設(shè)置、特殊效果設(shè)置(如火,煙霧)、聲音設(shè)置、紋理材質(zhì)設(shè)置、動態(tài)對象的位置、方向和比例設(shè)置、坐標(biāo)設(shè)置等等。碰撞檢測主要是防止物體間的相互干涉以及作為某些事件的觸發(fā)器,由檢測類型和檢測算法二大部分組成。檢測類型主要有視線范圍檢測(LOS line-of-sight)、三腳架法(TRIPOD)、凸塊檢測方法(BUMP)。LOS、TRIPOD、BUMP的算法主要是加入按一定規(guī)則分布的線段矢量,計算與干涉物體的交點,距離,方向以及設(shè)置回調(diào)函數(shù)。

(2) 同步通信子系統(tǒng)

協(xié)作通信系統(tǒng)完成的功能由語音通信、場景同步通信二大部分組成。

語音通信主要提供學(xué)員之間相互協(xié)調(diào)聯(lián)絡(luò)的通信平臺,也是協(xié)同訓(xùn)練中對講、交談等的語音工具。

這里語音通信部分主要采用點對點(也可組播)的語音通信,是針對一個點實現(xiàn)話音的實時采集、處理、播放,同時可與其它點進(jìn)行可靠的網(wǎng)絡(luò)語音數(shù)據(jù)傳送和接收。對于前者,采用Windows MDK的低層音頻服務(wù),因為低層音頻服務(wù)中的回調(diào)機(jī)制為我們提供了音頻數(shù)據(jù),設(shè)備驅(qū)動程序控制音頻設(shè)備在后成錄音和放音的具體操作,通過回調(diào)機(jī)制,我們又可以檢測到什么時候用完一個數(shù)據(jù)塊,并及時傳送下一個數(shù)據(jù)塊,從而保證了聲音的連續(xù),有了這種單機(jī)上的實時采集、回放功能后,接下來的工作就是在網(wǎng)絡(luò)上傳送語音數(shù)據(jù)。在點對點網(wǎng)絡(luò)傳輸方面,選擇基于無連接的UDP協(xié)議,UDP用戶數(shù)據(jù)報協(xié)議能夠向若干臺目標(biāo)計算機(jī)發(fā)送數(shù)據(jù),接收發(fā)自若干個源計算機(jī)的數(shù)據(jù)。在采集話音回放之前,一方面將自己的語音傳給網(wǎng)絡(luò),另一方面接收網(wǎng)絡(luò)傳來的語音,具體是利用Windows Socket API實現(xiàn)的。

場景同步通信主要提供多用戶之間場景一致的功能,它由服務(wù)器、會話、用戶、網(wǎng)絡(luò)消息和分布式對象組成。

多用戶服務(wù)器是基于客戶/服務(wù)器技術(shù),所有用戶之間的通信必須通過服務(wù)器。一個用戶與其他用戶交互必須連接到一個會話上,一個用戶同時只能連接一個會話,并且只能與連接到同一會話的用戶通信。用戶有二個參數(shù),一是用戶名,二是用戶ID,一個客戶在連接或產(chǎn)生會話前必須設(shè)置用戶名。網(wǎng)絡(luò)消息是用戶之間通信的主要方法,這個消息類似窗口消息,可以在消息中附帶數(shù)據(jù)。分布式對象是另一個用戶間傳送信息的機(jī)制,它相關(guān)于場景中某一個實體,且按照一定規(guī)則分布到所有用戶機(jī)上,分布式對象是類的一個實例,它有自己的屬性,需要時可以通過網(wǎng)絡(luò)通信來更新。同步通信技術(shù)借鑒了國外的DIS(分布式交互系統(tǒng))和HLA(高層架構(gòu))等技術(shù)。

(3) 訓(xùn)練管理子系統(tǒng)

訓(xùn)練管理系統(tǒng)主要是用于處理訓(xùn)練相關(guān)的信息,它完成的功能有訓(xùn)練知識庫、實時跟蹤記錄、沖突解決機(jī)制等。

訓(xùn)練知識庫主要包括訓(xùn)練數(shù)據(jù)庫、訓(xùn)練規(guī)則和匹配策略。訓(xùn)練數(shù)據(jù)庫主要有學(xué)員信息、課程信息、訓(xùn)練信息等等。訓(xùn)練規(guī)則主要有角色定義與分配規(guī)則、評判規(guī)則、記分規(guī)則,其中評判規(guī)則包括動作執(zhí)行者、動作間的關(guān)系、施加對象以及次數(shù)等等。匹配策略主要是有序無序的匹配、規(guī)則樹的遍歷。

實時跟蹤記錄實際上是對學(xué)員的操作流進(jìn)行管理的一個模塊,它主要有觸發(fā)事件、操作信息收集、發(fā)送與接收(操作信息)和記錄器組成。

沖突解決機(jī)制主要是多學(xué)員在協(xié)同訓(xùn)練中發(fā)生操作沖突時的一種消除機(jī)制。其中簡單的方法是加鎖解鎖、延時的方法,比較高級的有優(yōu)先級和擁有權(quán)的處理。

三系統(tǒng)應(yīng)用示例

客艙火災(zāi)應(yīng)急處理訓(xùn)練是利用協(xié)同訓(xùn)練平臺開發(fā)的一個應(yīng)用實例,主要是在模擬飛機(jī)機(jī)艙內(nèi)協(xié)作完成滅火訓(xùn)練任務(wù)。這個訓(xùn)練任務(wù)描述如下:

客機(jī)平穩(wěn)而正常地行駛著,乘客們安靜地享受著舒適的空中之旅,艙內(nèi)的乘務(wù)員出現(xiàn)在各自的位置上,此時,公共信息廣播:此次航班由上海飛往北京,祝各位旅客旅途愉快。30秒后,前工作區(qū)的學(xué)員看到屬于她的信息窗顯示:附近有怪異的煙味,請速核查。并且她看到絲絲煙霧飄散。該學(xué)員先去查核哪里發(fā)生火情,確定是在壁櫥的衣帽間,用手試探門的涼熱,其信息窗口顯示兩級溫度信息:門是涼的/門很燙手;該學(xué)員使用話機(jī)通知乘務(wù)長,并請求附近的乘務(wù)員速帶滅火器材來協(xié)助,本人去駕駛艙拿應(yīng)急斧,取來應(yīng)急斧,在門上開一個小洞,來支援的乘務(wù)員拿海倫滅火器來了,對著洞口噴滅火劑,直至火滅,開門檢查燃燒物,防止死灰復(fù)燃。最后把火災(zāi)的處理結(jié)果報告乘務(wù)長,由乘務(wù)長報告給機(jī)長。

該應(yīng)用實例包括一個三維實例場景和一個實例驅(qū)動模型。三維實例場景就是飛機(jī)機(jī)艙、火、煙霧、角色及其他設(shè)施,驅(qū)動模型是具體應(yīng)用的情節(jié)腳本,由滅火操作、協(xié)作規(guī)則、評判規(guī)則等許多事件構(gòu)成的。應(yīng)用實例系統(tǒng)主要界面如圖3所示。

四結(jié)束語

在網(wǎng)絡(luò)環(huán)境和多用戶視景交互的支持下,人們可以通過交互設(shè)備,利用聽覺、視覺、觸覺在虛擬的環(huán)境中協(xié)作完成訓(xùn)練任務(wù),從而形成一套具有“視景”和“協(xié)同”特色的訓(xùn)練軟件。本文主要描述了一個基于虛擬現(xiàn)實的多用戶協(xié)同訓(xùn)練系統(tǒng)的結(jié)構(gòu)設(shè)計、技術(shù)架構(gòu)、網(wǎng)絡(luò)通信和應(yīng)用示例。隨著基于虛擬現(xiàn)實技術(shù)的CBT系統(tǒng)正在逐步取代過去單機(jī)、單一任務(wù)的CBT系統(tǒng),將給計算機(jī)培訓(xùn)提供一種嶄新的系統(tǒng)訓(xùn)練方式,能使許多特殊場合的訓(xùn)練變得非常方便,同時極大提高培訓(xùn)的效果。本系統(tǒng)中設(shè)計的技術(shù)和方法希望對于其他分布式訓(xùn)練系統(tǒng)的開發(fā)具有借鑒作用。

參考文獻(xiàn)

[1] 龐津津,戴述賈.分布式系統(tǒng)仿真技術(shù)研究及其實現(xiàn)[J].火力與指揮控制, 2001,(1): 37-40.

[2] 洪津,張萬軍,謝慶華,陳明宏,王永健.虛擬維修訓(xùn)練系統(tǒng)發(fā)展綜述及其關(guān)鍵技術(shù)探討[J].理工大學(xué)學(xué)報(自然科學(xué)版),2000,(1):63-67.

[3] 王潤崗,花傳杰,唐科群,王艾萍.坦克車炮長協(xié)同訓(xùn)練仿真系統(tǒng)設(shè)計與實現(xiàn)[J].火力與指揮控制, 2008,(9):112-114.

[4] 袁海波,劉厚泉,吳雪峰.虛擬場景動態(tài)交互式可視化的研究[J].電腦與信息技術(shù),2008,(6):7-9.

篇9

實踐課程配套教材建設(shè)(1)2008年出版了《可編程邏輯器件應(yīng)用實踐》教材;(2)2009年編寫的《EDA技術(shù)與實驗》作為國家級“十一五”規(guī)劃教材。該書修訂版被列為校“十二五”規(guī)劃教材，側(cè)重FPGA設(shè)計理論及數(shù)字信號處理算法硬件實現(xiàn)上;(3)新編《EDA/SOPC應(yīng)用實踐》被列入校“十二五”規(guī)劃教材。該教材針對應(yīng)用型研究生的培養(yǎng)引入大量工程設(shè)計實例。

應(yīng)用型實踐教學(xué)基地的建設(shè)

我校電子設(shè)計自動化實踐教學(xué)基地，2006年在教育部研究生創(chuàng)新基地建設(shè)資金的資助下初步建成。現(xiàn)有的25套計算機(jī)和30套康芯EDA/SOPC實驗箱，可以完成基本的電子設(shè)計自動化實驗。近年來，我們在原來基礎(chǔ)平臺的基礎(chǔ)上，購置了Altera公司DE2-70實驗板，建立了面向電氣工程、控制工程、通信工程及儀器科學(xué)與技術(shù)領(lǐng)域電子設(shè)計自動化實驗平臺。該平臺包括基于FPGA的電機(jī)閉環(huán)控制實驗平臺、基于SOPC的特征物體跟蹤系統(tǒng)實驗平臺、基于SOPC的遠(yuǎn)程監(jiān)控圖像系統(tǒng)實驗平臺及基于FPGA的數(shù)據(jù)采集實驗平臺。上述四個實驗平臺可以完成下列實驗內(nèi)容。

1基于SOPC的特征物體跟蹤系統(tǒng)實驗特征物體的識別追蹤包括對目標(biāo)實現(xiàn)追蹤，它是機(jī)器視覺、視頻雷達(dá)和視覺導(dǎo)航的必要組成部分。這種追蹤系統(tǒng)可以用于球類比賽中追蹤拍攝球的運(yùn)動，在公共場所的監(jiān)控設(shè)備中自動鎖定疑犯并報警，在博物館等場所中鎖定特定藏品在其位移超過閾值后給出警示，在運(yùn)動中拍攝運(yùn)動或靜止物體(如航拍)中保持圖像穩(wěn)定，某些特定區(qū)域在有運(yùn)動物體進(jìn)入時監(jiān)控系統(tǒng)產(chǎn)生報警信號并對進(jìn)入監(jiān)控區(qū)域的物體進(jìn)行跟蹤(例如交通檢測系統(tǒng)和某些監(jiān)控防護(hù)系統(tǒng))等?；赟OPC實驗箱的特征的物體跟蹤系統(tǒng)實驗原理如下:攝像頭完成圖像采集，將圖像數(shù)據(jù)傳輸給DE2開發(fā)板，由FPGA中的攝像頭接口邏輯對圖像預(yù)處理，再由NiosII執(zhí)行識別算法和控制算法，識別特征物體，并輸出控制信號給兩個伺服電機(jī)來調(diào)整攝像頭方向，同時由VGA顯示接口將捕捉到的圖像在顯示器上顯示出來。

2基于FPGA的步進(jìn)電機(jī)細(xì)分控制實驗本實驗是一種以FPGA為核心的新型集成式三相混合式步進(jìn)電機(jī)驅(qū)動系統(tǒng)。采用正弦波細(xì)分驅(qū)動方案，以速度誤差最小原則進(jìn)行了最佳細(xì)分等級自動切換設(shè)計。該實驗將控制器和驅(qū)動器全部集成在單一的FPGA芯片上。

3基于FPGA的遠(yuǎn)程監(jiān)控機(jī)器人實驗本系統(tǒng)在DE2開發(fā)板上構(gòu)建了一個Web服務(wù)器，可以通過網(wǎng)絡(luò)實時觀察監(jiān)控場所，并通過網(wǎng)絡(luò)控制隨意移動以實現(xiàn)全方位監(jiān)控。該實驗包括圖像的實時采集、壓縮，無線傳輸、Internet網(wǎng)絡(luò)和GPRS無線網(wǎng)絡(luò)向終端服務(wù)器傳輸圖像數(shù)據(jù)等模塊。

4基于FPGA的桌面彈球屏幕保護(hù)程序?qū)嶒炘搶嶒炌ㄟ^FPGA芯片嵌入的程序可以控制計算機(jī)顯示屏上的小球運(yùn)動，還可以控制小球的尺寸。學(xué)生通過該實驗可以掌握VGA顯示的原理和視頻D/A轉(zhuǎn)換的原理及控制時序等內(nèi)容。本實驗的創(chuàng)意來自美國伊利諾伊州立大學(xué)香檳分校的數(shù)字系統(tǒng)課程ECE385的教學(xué)內(nèi)容。該應(yīng)用研究型實驗覆蓋了控制、電氣、計算機(jī)和通信等多個學(xué)科內(nèi)容。此外，2009年我們在實驗平臺上自行了設(shè)計一款性價比高且便于攜帶的電子設(shè)計自動化實驗箱。該實驗箱發(fā)放給學(xué)生，使他們在業(yè)余時間利用該實驗箱學(xué)習(xí)電子設(shè)計自動化知識，并完成面向?qū)嶋H應(yīng)用的設(shè)計任務(wù)。本實驗箱的原理框圖如圖1所示，目前已在電子技術(shù)課程設(shè)計課程中使用。

與企業(yè)聯(lián)合建立培訓(xùn)基地

篇10

中圖分類號：TM文獻(xiàn)標(biāo)識碼:B

1．變電設(shè)備檢修仿真系統(tǒng)的主要功能及模塊

1.1．主要功能

構(gòu)建變電設(shè)備虛擬場景需要運(yùn)用到數(shù)字化建模（即建立設(shè)備的正常、異常、故障和缺陷等三維實體模型）技術(shù)，模型建立質(zhì)量和數(shù)量直接關(guān)系到整個系統(tǒng)的優(yōu)劣，本系統(tǒng)中對變電站的所有一次設(shè)備如變壓器、斷路器、隔離開關(guān)、互感器、電抗器、電容器等建立了模型，由此形成了設(shè)備建模庫，設(shè)備庫還可對各設(shè)備正常和非正常（缺陷）狀態(tài)的具體細(xì)節(jié)進(jìn)行描述。仿真系統(tǒng)要求能在計算機(jī)上動態(tài)模擬變電設(shè)備安裝和檢修過程，并實現(xiàn)人機(jī)交互裝配，直觀和準(zhǔn)確地表達(dá)其內(nèi)部結(jié)構(gòu)、各零部件空間關(guān)系，零部件瀏覽和分析、變電設(shè)備缺陷仿真、檢修人員技能綜合測試以及自動評分等等。系統(tǒng)的主要功能如圖1所示。

圖1變電設(shè)備仿真檢修系統(tǒng)的主要功能

變電設(shè)備檢修仿真系統(tǒng)采用多媒體、三維圖像仿真，集圖片、圖像、圖形、視頻、文字等為一體，整個變壓器動態(tài)裝配過程均以3D形式投影在大屏幕上，逼真地再現(xiàn)變電站現(xiàn)場設(shè)備的動作過程和設(shè)備運(yùn)行狀態(tài)。

本檢修仿真系統(tǒng)基于DirectX9.0c來構(gòu)建3D圖形引擎，開發(fā)虛擬現(xiàn)實仿真系統(tǒng)，通過MFC處理系統(tǒng)用戶界面，視景平臺、動態(tài)裝配仿真、零部件數(shù)字化建模、零部件缺陷仿真、檢修技能測試等核心內(nèi)容都是用C++來實現(xiàn)。

1.2.功能模塊

變電檢修仿真中心通過VR平臺，按照仿真數(shù)據(jù)倉庫中檢修仿真算法，分設(shè)備類型、生產(chǎn)廠家、型號建立變電設(shè)備樣本模型庫；模擬各類設(shè)備的常見故障和解決方案；分常規(guī)檢修和故障檢修兩種方式模擬變電設(shè)備的檢修過程。仿真中心通過算法接口和輸入輸出接口接收用戶控制命令和返回結(jié)果數(shù)據(jù)。

檢修訓(xùn)練中心提供人機(jī)交互環(huán)境，用戶使用各類終端設(shè)備（鼠標(biāo)鍵盤等），通過輸入輸出接口在虛擬現(xiàn)實的界面發(fā)出各類檢修操作命令，并通過算法接口與檢修仿真中心進(jìn)行數(shù)據(jù)交互，完成各類訓(xùn)練動作的執(zhí)行。為檢修人員的培訓(xùn)提供演示和交互操作兩種培訓(xùn)方式。

管理監(jiān)控中心完成各類設(shè)備部件劃分、部件邏輯關(guān)系及其拆裝順序定義和維護(hù)；故障知識庫中故障現(xiàn)象、故障原因、檢修推薦方案的定義和維護(hù)；依照《作業(yè)指導(dǎo)書》以及《現(xiàn)場作業(yè)工序工藝標(biāo)準(zhǔn)卡》等技術(shù)標(biāo)準(zhǔn)對檢修流程進(jìn)行設(shè)定或變更重組；并完成培訓(xùn)檔案建立、培訓(xùn)題庫建立、培訓(xùn)過程監(jiān)視控制、培訓(xùn)過程回放、培訓(xùn)考核評估以及培訓(xùn)各類績效指標(biāo)的統(tǒng)計分析。它通過各類算法接口在VR平臺上完成對變電檢修仿真中心各類仿真模型的管理以及與變電檢修控制中心培訓(xùn)管理人員的命令、指令、數(shù)據(jù)交互。

2.故障分析功能

2.1.故障信息

系統(tǒng)通過在線監(jiān)測系統(tǒng)以及狀態(tài)檢修系統(tǒng)的聯(lián)機(jī)分析，對故障的信息提供從故障的設(shè)備及其故障部件、部位的外部現(xiàn)象、到故障的變化過程、再到故障相關(guān)各類數(shù)據(jù)的全方位支持，為故障的分析和診斷提供從表面到數(shù)據(jù)的支持。

如變壓器過熱性故障，系統(tǒng)除了從設(shè)備模型給出溫度計的讀數(shù)外，還可以提供一個連續(xù)時間段溫度的變化情況，并且通過在線監(jiān)測系統(tǒng)提供各時刻對應(yīng)油中C2H6、C2H4、H2、C2H2，CO、CO2等氣體含量數(shù)據(jù)。

2.1.故障診斷及檢修方法

系統(tǒng)根據(jù)故障信息，結(jié)合狀態(tài)檢修系統(tǒng)、生產(chǎn)管理系統(tǒng)、在線監(jiān)測系統(tǒng)的綜合分析情況，給出故障的可能原因以及對應(yīng)的檢修對策指導(dǎo)。如變壓器過熱性故障，當(dāng)存在C2H6、C2H4增長較快，可能有H2和C2H2，CO和CO2增長不明顯的現(xiàn)象，導(dǎo)致該故障的原因可能就是變壓器鐵心短路，在系統(tǒng)圖形界面上就會輸出鐵心短路的外部狀況。用戶可以點擊相應(yīng)的檢修策略指導(dǎo)，系統(tǒng)會采用動畫及互動的方式提供處理鐵心短路情況的典型檢修方法。

3．變電設(shè)備仿真檢修系統(tǒng)的特征模型

在變電設(shè)備仿真檢修系統(tǒng)總體設(shè)計初步完成后，即可進(jìn)行特征模型設(shè)計。根據(jù)已經(jīng)確定的方案和主要數(shù)據(jù)，按技術(shù)任務(wù)要求進(jìn)行。變電設(shè)備的內(nèi)部結(jié)構(gòu)復(fù)雜，零部件多為不規(guī)則幾何體，要實現(xiàn)虛擬的裝配過程必須先對基本的零件建立三維數(shù)字模型。裝配之前要進(jìn)行總體規(guī)劃，確定各級子裝配和各零件的合理安裝順序。還要結(jié)合變電站的實際安裝程序來安排虛擬場景中各零件或子裝配的裝配順序。

以變壓器為例說明，本仿真系統(tǒng)將變壓器整體結(jié)構(gòu)劃分為六部分：總裝、油箱、絕緣、引線、鐵心、線圈，各部分通過相應(yīng)的構(gòu)件連接起來，其主體結(jié)構(gòu)劃分如圖2所示。

圖2變壓器結(jié)構(gòu)特征模型

變壓器型號用于描述實體的幾何形狀，是造型中最主要的信息之一。主要參數(shù)包含變壓器的額定電壓，額定容量，連接組別，窗體的長、寬、高等信息。部件間的裝配特征用于表達(dá)變壓器結(jié)構(gòu)的裝配關(guān)系以及在裝配過程中所需信息。構(gòu)件間關(guān)系具有油箱、絕緣、引線、鐵心、線圈等結(jié)構(gòu)間的安裝定位關(guān)系等。

4．基于虛擬現(xiàn)實的動態(tài)仿真流程

為了便于清楚地觀察裝配體結(jié)構(gòu)及裝配順序，需要增加與虛擬世界的交互功能。而動畫給了人們一個巨大的空間。用戶在進(jìn)入裝配場景后，在任意位置點擊鼠標(biāo)，動態(tài)裝配過程即呈現(xiàn)在窗口中。基于虛擬現(xiàn)實技術(shù)實現(xiàn)動畫的流程如圖3。

5．系統(tǒng)實現(xiàn)技術(shù)方案

5.1．系統(tǒng)拓?fù)浣Y(jié)構(gòu)

本系統(tǒng)采用B/S的體系結(jié)構(gòu)，系統(tǒng)的核心包含一個業(yè)務(wù)主機(jī)（包括應(yīng)用服務(wù)器和WEB服務(wù)器的功能）和一個數(shù)據(jù)庫服務(wù)器，包含若干客戶機(jī)、網(wǎng)絡(luò)設(shè)備等等。

客戶機(jī)中包括教員機(jī)和學(xué)員機(jī)，教員機(jī)通過與業(yè)務(wù)主機(jī)的交互完成對學(xué)員機(jī)下達(dá)各類控制命令，學(xué)員機(jī)接收并完成這些任務(wù)，同時操作過程同樣通過與業(yè)務(wù)主機(jī)的交互進(jìn)行數(shù)據(jù)和邏輯的通信。

5.2．平臺軟件

操作系統(tǒng)：根據(jù)實際選用的虛擬現(xiàn)實技術(shù)平臺選用對應(yīng)的操作系統(tǒng)。

數(shù)據(jù)庫系統(tǒng)：本項目數(shù)據(jù)庫系統(tǒng)有IBM DB2、Oarcle和MS SQL Server2005三種選擇，建議本系統(tǒng)采用Oarcle 9i數(shù)據(jù)庫。用于提供高效、海量的數(shù)據(jù)存儲，建立數(shù)據(jù)倉庫為虛擬現(xiàn)實技術(shù)的實現(xiàn)和數(shù)據(jù)分析提供基礎(chǔ)。

中間件軟件：采用JBoss中間件，用于提供web服務(wù)。

商業(yè)智能平臺：報表工具采用eclipse birt；OLAP工

具采用mondrian，提供數(shù)據(jù)統(tǒng)計、分析和報表圖標(biāo)展現(xiàn)功能。

ETL工具：采用oracle ODI。用于完成與其他電力信息系統(tǒng)的數(shù)據(jù)同步。

5.3．虛擬現(xiàn)實技術(shù)

虛擬現(xiàn)實技術(shù)（Virtual Reality），又稱靈境技術(shù)，是90年代為科學(xué)界和工程界所關(guān)注的技術(shù)。它的興起，為人機(jī)交互界面的發(fā)展開創(chuàng)了新的研究領(lǐng)域；為智能工程的應(yīng)用提供了新的界面工具；為各類工程的大規(guī)模的數(shù)據(jù)可視化提供了新的描述方法。這種技術(shù)的特點在于，計算機(jī)產(chǎn)生一種人為虛擬的環(huán)境，這種虛擬的環(huán)境是通過計算機(jī)圖形構(gòu)成的三度空間，或是把其它現(xiàn)實環(huán)境編制到計算機(jī)中去產(chǎn)生逼真的"虛擬環(huán)境"，從而使得用戶在視覺上產(chǎn)生一種沉浸于虛擬環(huán)境的感覺。這種技術(shù)的應(yīng)用，改進(jìn)了人們利用計算機(jī)進(jìn)行多工程數(shù)據(jù)處理的方式，尤其在需要對大量抽象數(shù)據(jù)進(jìn)行處理時；同時，它在許多不同領(lǐng)域的應(yīng)用，可以帶來巨大的經(jīng)濟(jì)效益。

虛擬現(xiàn)實系統(tǒng)主要由以下模塊構(gòu)成

①檢測模塊：檢測用戶的操作命令，并通過傳感器模塊作用于虛擬環(huán)境。②反饋模塊：接受來自傳感器模塊信息，為用戶提供實時反饋。③傳感器模塊：一方面接受來自用戶的操作命令，并將其作用于虛擬環(huán)境；另一方面將操作后產(chǎn)生的結(jié)果以各種反饋的形式提供給用戶。④控制模塊：對傳感器進(jìn)行控制，使其對用戶、虛擬環(huán)境和現(xiàn)實世界產(chǎn)生作用。⑤建模模塊：獲取現(xiàn)實世界組成部分的三維表示，并由此構(gòu)成對應(yīng)的虛擬環(huán)境。

虛擬現(xiàn)實系統(tǒng)開發(fā)平臺的核心是引擎，它具有四個方面的接口，分別是算法接口、模型貼圖輸入接口、硬件輔助設(shè)備接口和硬件主設(shè)備接口。虛擬現(xiàn)實系統(tǒng)開發(fā)平臺通過這些底層接口向所有上層軟件提供強(qiáng)大的功能支持。

6．?dāng)?shù)據(jù)存儲及整合技術(shù)

6.1．?dāng)?shù)據(jù)存儲

建立物理數(shù)據(jù)倉庫的存儲；提供集中的數(shù)據(jù)倉庫管理界面來控制、監(jiān)測和管理數(shù)據(jù)倉庫的操作；為主題分析和決策支持應(yīng)用提供快速、準(zhǔn)確的數(shù)據(jù)服務(wù)。

6.2．?dāng)?shù)據(jù)整合

ETL：包括數(shù)據(jù)采集、清洗、轉(zhuǎn)換、匯總、加載，數(shù)據(jù)加載到數(shù)據(jù)倉庫中；建立數(shù)據(jù)倉庫元數(shù)據(jù)中心存儲；Webservice：通過XML交換數(shù)據(jù)，使系統(tǒng)之間即可靠的交換數(shù)據(jù)，又降低了系統(tǒng)之間的耦合程度。

6.3．?dāng)?shù)據(jù)倉庫管理

包括元數(shù)據(jù)管理、ETL管理、數(shù)據(jù)復(fù)制與備份管理、數(shù)據(jù)安全管理等等

7．?dāng)?shù)據(jù)分析技術(shù)

7.1．?dāng)?shù)學(xué)建模、數(shù)據(jù)挖掘

采用三比值法、TD圖法、電研法、神經(jīng)網(wǎng)絡(luò)算法等有效的診斷算法進(jìn)行故障診斷；利用時間序列神經(jīng)網(wǎng)絡(luò)模型的非線性映射能力和學(xué)習(xí)能力來預(yù)測設(shè)備的檢修狀態(tài)；

7.2．商務(wù)智能平臺

提供包括面向主題的數(shù)據(jù)集市、即席查詢、多維分析、企業(yè)日常報表、Dashboard等各種商務(wù)智能分析工具；提供一個面向主題的可擴(kuò)展的應(yīng)用分析環(huán)境；高效、靈活的查詢、報告、聯(lián)機(jī)分析處理以及預(yù)測功能。

7.3．業(yè)務(wù)優(yōu)化平臺

通過商業(yè)智能平臺的多維分析應(yīng)用、預(yù)測分析和OLAP應(yīng)用來支持檢修流程優(yōu)化等生產(chǎn)管理應(yīng)用。

8．結(jié)束語

變電設(shè)備檢修仿真系統(tǒng)的應(yīng)用，不但可提高變電檢修人員的技能水平、工作效率，同時縮短檢修時間和快速恢復(fù)設(shè)備送電提供了有力保障。

相關(guān)范文

伊人色婷婷综在合线亚洲,亚洲欧洲免费视频,亚洲午夜视频在线观看,最新国产成人盗摄精品视频,日韩激情视频在线观看,97公开免费视频,成人激情视频在线观看,成人免费淫片视频男直播,青草青草久热精品视频99

投稿策略

視覺算法培訓(xùn)模板(10篇)

篇1

篇2

篇3

篇4

篇5

篇6

篇7

篇8

篇9

篇10

視覺設(shè)計論文

視覺傳達(dá)論文

視覺傳達(dá)設(shè)計論文

視覺傳播研究

上海視覺

影像視覺

中華眼視光學(xué)與視覺科學(xué)