【導讀】強大的電腦芯片、高效的紅外LED以及新型的攝像傳感器,讓先前復雜的眼動追蹤系統如今能夠適應消費類電子應用的各種需要。借助這些系統,電子設備可以檢測用戶的眼球運動,從而識別用戶的下一步意圖。結合現有的輸入方法,眼動追蹤開啟了豐富的直觀人機交互新體驗。
幾十年來,鍵盤和鼠標一直是我們操控電腦的傳統工具。隨著智能手機、平板電腦等移動設備的誕生,人們需要借助新技術來與這類沒有配備鍵盤和鼠標的微型計算機進行有效交流。由此,觸摸屏成為了一項關鍵技術,使得這些電子產品更加友好。而語音識別技術的加入,則使其更為直觀。
先知先覺的設備
隨著物聯網的普及,我們需要交互的電子設備的數量也將與日俱增。智能家居便是一個典型示例,聲控恒溫器已開始運用其中。未來,我們還可以直接與機器人進行交互。除交互式工業(yè)機器人之外,家庭助理機器人和醫(yī)療助理機器人也在研發(fā)當中。而今,設備可以通過觸摸屏接收指令,也可以通過內置式耳機收聽指令。借助眼動追蹤系統,它們還能檢測到用戶正在注視的對象,從而預測用戶的下一步意圖。這將為直觀的人機交互開啟無限可能。
在很多領域,眼動追蹤的硬件條件已然具備
眼動追蹤系統可以檢測人的眼球運動以及注視方向。起初,人們開發(fā)眼動追蹤系統是出于市場調研、行為分析和合用性研究的目的。此外,在幫助那些雙手無法操作電腦的用戶方面,它們的應用已有一段時間。其中許多系統使用紅外光照射用戶眼睛,并通過攝像機獲取圖像,然后根據圖像數據計算眼球運動。因此,這些系統需要特制的高質量攝像機、光源和軟件,有時還需要加裝硬件加速器來處理海量的圖像數據。
而今天,借助極其強大的芯片、緊湊型攝像傳感器和新型的大功率LED,可以將眼動追蹤功能集成到智能手機等電子設備上。其實,許多電子設備上都搭載了攝像傳感器和紅外光源,只不過它們是用來實現面部識別、虹膜識別等其他功能。因此,接下來需要有的就是一款合適的軟件,來將眼動追蹤作為一個附加功能加以集成。
發(fā)展現狀
目前,各個領域均在開發(fā)各種創(chuàng)新概念,意在促進眼動追蹤用作一種新型的人機接口。在具有眼動追蹤功能的智能手機和平板電腦的屏幕上,已經可以通過視線接觸激活圖標或移動游戲人物。具有眼動追蹤功能的游戲電腦能使玩家在游戲場景中更為身臨其境。在一些系統中,玩家可以通過眼球動作控制游戲人物的視角,而無需使用鼠標或觸控板。眼動追蹤同樣也可以用于常規(guī)電腦,如通過眼球動作實現文檔滾動查看。
此外,在智能家居行業(yè),有多種方式可以通過眼動追蹤技術與各種設備進行交互。例如,具有眼動追蹤功能的智能電視已經問世。汽車領域也已提出這些系統的潛在應用,其中的一個典型示例便是駕駛員活動助理系統,它可以監(jiān)測駕駛員的眼球活動,從而及時檢測到疲勞駕駛的信號。眼動追蹤功能也可以用于監(jiān)測駕駛員的注視方向,從而確定其正專注前方路況還是注意力分散。這類信息將有助于避免道路上出現緊急情況。
圖1:視線接觸激活圖標。眼動追蹤結合現有的輸入功能,開啟了全新的電子設備操控方式。
消費類電子產業(yè)的眼動追蹤系統
上述應用中的新型眼動追蹤系統基于紅外LED(IRED)和高分辨率攝像傳感器而設計,它們分別用于照射人眼和記錄眼球反射的光線。然后,由圖像處理算法根據這些原始數據計算瞳孔的位置(圖2),再由專用軟件利用屏幕等參照物的位置信息確定用戶所注視的具體位置。不管眼睛是什么顏色,尤其是在黑暗中或屏幕背光非常明亮時,紅外照明均可以確保虹膜與瞳孔之間所需的對比度。
圖2:眼動追蹤系統使用紅外光照射人眼,并利用攝像傳感器捕捉圖像。所捕捉的圖像數據用于確定瞳孔的位置,并用來計算用戶注視的方向。
這些系統目前的最遠探測距離是一米。智能手機和平板電腦的工作距離通常在30cm左右,而臺式電腦則通常在60cm左右。屏幕分辨率與眼睛的光柵尺寸相對應,平板電腦約為1cm,電腦則約為2cm。所用紅外LED的數量以及發(fā)射器和攝像頭的具體排列取決于應用的類型,即工作距離的長短和覆蓋面積的大小。此外,設置還會因所采用的眼動追蹤軟件而有所不同,這是因為幾何設計也要看各種算法能否可靠地檢測瞳孔的轉向。一般而言,發(fā)射器和攝像傳感器需要按特定角度進行布局,彼此之間需保持一定距離,以避免收到眼鏡的眩光或者光線從眼球到傳感器的直接反射。距離越大,信號質量越好,用戶與設備間最佳距離的選擇空間就越靈活。。
用于眼動追蹤系統的紅外LED
不同于大多數需要使用特定波長的虹膜掃描儀,眼動追蹤系統可以在較寬的光譜范圍內運行。通常,這些系統需要借助現有的虹膜掃描或面部識別系統,并搭配波長為850nm或810nm的IRED。人眼可感知到波長為850nm的IRED所發(fā)出的微弱紅外光。許多眼動追蹤解決方案制造商更傾向于采用940nm的IRED,因為裸眼看不到這種光。然而,940nm設計現在還存在弊端:目前通用的攝像傳感器針對可見光進行了優(yōu)化,但在紅外光譜范圍內靈敏度則較低。波長為940nm時,靈敏度降低十分明顯(圖3),因此需要增強紅外照射,以達到與850nm光源一樣的信號強度。鑒于紅外照明的廣泛應用,攝像頭制造商正在研發(fā)紅外靈敏度高的新版本。
圖3:在850nm和940nm之間時,針對可見光優(yōu)化過的標準攝像傳感器的靈敏度大幅度下降。配備940nm IRED的眼動追蹤系統的優(yōu)勢在于它幾乎不會被人眼所感知。大多數情況下,需要使用更高的工作電流來補償下降的信號水平。
理想狀態(tài)下,雙眼應位于攝像傳感器的捕捉區(qū)域內。整個眼球需被均勻照射,這一點很重要。所需紅外光照射強度取決于工作距離,即便對于移動設備,也可能需要數瓦的功率。為盡量減少大工作電流下的熱輸出,發(fā)射器是在脈沖模式下工作。盡管如此,熱管理仍是設計重點之一,在更輕薄的智能手機和平板電腦中尤為如此。因此,IRED效率是除光輸出外的另一個重要因素。效率越高,產生的熱就越少。
針對這類應用,歐司朗特別開發(fā)了Oslon Black系列產品,其中,SFH 4715A的光電效率達到創(chuàng)紀錄的48%。這款850nm發(fā)射器在1A工作電流下的典型光輸出為770mW,是目前此工作電流下效率最高的IRED。如果需要,還可以采用納米堆疊技術,在一顆芯片上提供兩個發(fā)射中心,堆疊布置,從而獲得更高的輸出。工作電流為1A時,SFH 4715AS的典型光輸出為1340mW。它提供90度和150度發(fā)射角兩種版本,涵蓋許多不同的設計。Oslon Black版本在1A工作電流下光輸出為990mW,是理想的940nm光源。
圖4:Oslon Black SFH 4715AS的波長為850nm,是迄今為止功率最大的IRED。工作電流為1A時,其發(fā)光功率為1340mW。得益于其纖薄的外形,其不僅能安裝在最新的智能手機中,還可以用于下一代設備。
Oslon Black的一個特性是其器件高度僅為2.3mm,因此它不僅適用于今天的智能手機,也適用于下一代更為纖薄的電子設備。
像其他紅外光源應用一樣,眼動追蹤系統必須符合人眼安全標準。普通用戶接觸的紅外輻射量相對較低。然而,技術人員近距離觀看紅外光源時需留意風險。眼動追蹤系統上關聯有一個接近傳感器,可確保在這種情況下IRED能自動關閉。有關光學系統安全設計的詳細信息,可參閱《歐司朗人眼安全應用注釋》等文獻。
我們周圍有太多復雜的電子設備,需要有新的技術來實現直觀的人機交互。紅外照明和攝像傳感器為交互技術奠定了良好的基礎,使設備能“看到”用戶并理解他們的意圖。眼動追蹤示例展示了如何在硬件基礎上通過軟件方案實現新的交互類型。硬件組件的創(chuàng)新也正驅動著這一發(fā)展。例如,采用波長為940nm的光源便是其中一種發(fā)展趨勢。因此,歐司朗也在不斷擴展在人臉識別、眼動追蹤等應用方面的產品組合。
本文轉載自電子技術設計,作者:Christoph Goeltner,歐司朗(OSRAM)光電半導體產品經理。
推薦閱讀: