❶ 手勢識別用什麼圖像特徵提取演算法
《基於計算機視覺的手勢識別研究》中提到了多尺度模型,輪頃它就是採用此模型提取手勢的指尖的數量和位中山置,將指尖和掌心連線,採用距離公式計算各指尖到掌心的距離,再採用反餘弦公式計算各指尖與掌心連線間的夾角,將距離和夾角作為選擇的特徵。對於靜態手勢識別而言,邊緣信息是比較常用的特徵。中采賣桐中用的HDC提取關鍵點的識別演算法,基於用八方向鄰域搜索法提取出手勢圖像的邊緣,把圖像的邊緣看成一條曲線,然後對曲線進行處理。
❷ 手勢輸入方式的手勢識別
手勢識別作為三維輸入的實質是識別出用戶通過手灶襪粗勢運動表隱鎮達自己的意圖。顯然這是一個模式識
別問題,但又不完全相同。目前手勢識別的圖象分類演算法很多,如Martin 採用句法模式識別方法[13 ] ,
Sun 採用模板匹配和查表的方法[14 ] ,Quek 使用貝葉斯分類器,Su 等人採用組合神經網路[15 ] ,Huang 等
人採用Hopfield 神經網路法,Boehm 等人使好喚用SOM 法[16 ] ,Kin 採用模糊神經網路識別手勢。從模式識
別的角度來看,不論是使用數據手套,還是攝像機來輸入手勢,不論手勢的表示方法如何,不論採用什麼
樣的特徵提取,都可以採用同樣方法來識別手勢。本文介紹傳統幾何學識別法和通過數據手套輸入手
勢的神經網路識別法。
❸ 手勢輸入方式的手勢識別的原理
手勢是指在人的意識支配下,人手作出的各類動作,如手指彎曲、伸展和手在空間的運動等,可以是
收稿日期: 2000 - 05 - 15
基金項目: 行業基金項目(院編96311)
作者簡介: 曾芬芳(1940 - ) ,女,湖南益陽人,華東船舶工業學院教授。
執行某項任務,也可以是與人的交流,以表達某種含義或意圖。基於手勢識別的三維交互輸入技術,常
用的有基於數據手套的和基於視覺(如攝象機) 的手勢識別。
人手有20 多個關節,其手勢十分復雜,在VR(Virtual Reality) 中的交互過程,需分析手勢的形成並
識別其含義。如用戶以自然方式抓取環境中的物體,同時還可以對用戶產生相關的感知反饋,如對具有
力反饋的手套,就能使人感知到抓取的物體的重量,對有觸覺反饋的手套,能感知到用戶所碰到的物體
的質感,如毛毯有多粗糙等。所以計算機要能對人手運動的靈活、復雜的手勢進行識別是一項艱難而又
十分有意義的任務。
手勢的分類早在40 年代,心理學家Quek[7 ] . ,Pavlovic[8 ]等人從人機介面的角度對手勢進行研究,
按其功能分為:
手的運動
無意識的手運動
有意識的手運動(手勢
交流手勢
表動作
表符號(手語)
引用手語(如表示數字)
情態手勢
執行任務(如抓握錘) 手勢不但由骨胳肌肉驅動,而且還受人的信念、意識的驅使,它涉及到人的思維活動的高級行為。
人機交互的研究目的之一是使機器對人類用戶更方便,從用戶產生手勢到系統「感知」手勢的過程[9 ]如
圖1 所示。
圖1 系統「感知」手勢的過程
Fig. 1 Process of sensing gesture by the system
手的運動,是手勢的表現形式。用戶的操作
意圖是用戶要完成任務的內爛陸容, 即用戶心理活
動(概念手勢) G ,經過運動控制(變換) ,用手勢
運動H 表達。由經感受設備(變換Thi) 將手的
運動H 變換為系統的輸入信息I ,所以從G到I
的映射過程為:
Tgh : G → H , 即H > Tgh ( G)
Thi : H → I , 即I > Thi ( H)
Tgi : G → I , 即I > Thi ( Tgh ( G) ) > Tgi ( G)
其中, Tgh 為人體運動控制傳送函數; Thi為輸入設備傳送函數。
手勢識別的任務就是從系統輸入I 推斷、確定用戶意圖G ,顯然是以上映射的逆過程。即
G = T- 1
gi ( I) ( 1 )
H = T- 1
hi ( I) ( 2 )
G = T- 1
gh ( H) ( 3 )
其中, T- 1
gi , T- 1
hi , T- 1
gh 是Tgi , Thi , Tgh 的逆變換。
所以手勢識別可以採用H = T- 1
hi ( I) 時輸入信息I ,得到手的運動H ,再由G = T- 1
gh ( H) 手勢的表
示推斷用戶手勢的概念意圖運梁,也可直接從G = T- 1
gi ( I) 求得概念手勢G。
手勢識別分為靜態手勢和動態手勢的識別,目前的研究大都是在線靜態手勢識別,如Lee 研究的就
是靜態孤立手勢[10 ] 。動態手勢識別難度大,一般採用關鍵幀方法,記錄每個手勢的始和終狀態及飢悄頃手勢的
運動軌跡,然後用內插演算法重建幀,但仍需給予限制,如Davis研究的動態手勢識別就規定開始時手必須
朝上等。 手勢的語法信息是通過手的構形、手的運動變化來傳遞。為了
給用戶提供必要的視覺反饋信息, 使其在交互過程中看到自己的手
(圖2 是用3DSMAX 繪制) ,同時也為了分析交互過程中手和虛擬對
象之間的相互作用關系,必須建立手幾何模型和運動學模型。 人手是一個多肢節系統, 由27 塊骨骼組成, 可看成由4 個相鄰
手指、一個大拇指和手掌組成, 每個手指由指段和關節組成。因此手
是一種由關節相連的結構, 隨著關節運動, 手的形狀在不斷變化。這
種變化可以通過指段和關節的狀態空間位置的變化來描述[11 ] 。
每一個手指( Ⅱ - Ⅴ) 具有四個自由度,其中手指的
基部(MP) 有兩個自由度,彎曲和旋轉,手指的中間關節處(PIP)
和末端關節處(DIP) 分別各有一個自由度,主要是彎曲運動。大拇
指除了與其他四個手指一樣具有四個自由度外, 還有一個外展運
動,所以大拇指具有五個自由度(拇指和手掌之間的一節也可不考
慮) 。外加手掌的前後左右運動二個自由度。所以手運動總共具有
23 個自由度,即狀態空間為23 維。
從上述的分析可知,除大拇指外每個手指都具有四個自由度,
從而可以建立一條鏈,以協調手指的機構及運動。整個手可以以手掌為基礎鏈接五個手指( Ⅰ - Ⅴ) ,在
指段MP 上鏈接指段PIP ,再鏈接指段DIP ,每條鏈可以獲取四個參數。從而五個手指以手掌為根節點構
成一個樹型結構,樹中的每一個節點代表一個關節,關節通過指段具有相互關聯的運動特性。
212 手勢的輸入
手勢的輸入是實現手勢交互的前提。它要求能夠有效地跟蹤手的運動, 又要方便用戶手的運動, 既
要求准確確定手的位置、方位、手指彎曲角度,又要求對手的運動限制很少。就目前而言, 手勢的輸入有
基於數據手套的和基於視覺(攝象機) 等兩種方式。
21211 基於數據手套的手勢輸入
基於數據手套的手勢輸入[12 ] ,是根據戴在手上的具有位置跟蹤器的數據手套利用光纖直接測量手
指彎曲和手的位置來實現手勢輸入的。本文使用5DT 公司生產的不帶位置跟蹤器的5th Glove 右手數據
手套,每個手指中間關節有一個感測器用於測量手指的平均屈伸度,在手腕部位還有一個2 軸傾斜感測
器測量手的轉動(繞Z 軸旋轉) 和傾斜(繞X 軸旋轉) 兩個角度,以探測手的上下擺動和旋轉。該手套共
帶有七個感測器,因此同一時刻只能讀出七個角度值。5th Glove 還提供命令、報告數據、連續數據、模擬
滑鼠等工作方式,可定義一指、二指和三指( Z 軸) 等手勢來控制虛擬手的飛行、視點、運動速度等。
5th Glove 數據手套通過串列介面與微機連接在一起,以傳送手運動信號,從而控制手動作。它能將
用戶手的姿勢(手勢) 轉化為計算機可讀的數據, 因而使手去抓取或推動虛擬物體。人手在運動過程中
會碰撞物體,所以在系統中,虛擬手的交互操作除了實現抓取和釋放物體等功能外, 還需實現了碰撞的
檢測。
21212 基於視覺的手勢輸入
基於視覺的手勢輸入是採用攝象機捕獲手勢圖象,再利用計算機視覺技術對捕獲的圖象進行分析,
提取手勢圖象特徵,從而實現手勢的輸入。這種方法使用戶手的運動受限制較少,同時用戶還可以直接
看到手的圖象。基於視覺的輸入所輸入的原始數據是手的圖象,採用重建三維模型來構建手勢圖象,調
節模型參數如手指彎曲角度的夾角等,以合成手的三維圖形。根據手生成的圖形和已獲得的手圖象匹
配,所得到的模型參數就構成了手勢。1995 年,Lee J intae 和Kunii Tosiyasv l. 研究用立體圖像數據自動
分析三維手勢[4 ] 。它用攝像機拍攝手的運動圖像,使用輪廓提取邊界特徵進行識別的方法,成功地提
取27 個交互作用手參數,實現了三維手勢的重構。其實早在1981 年, Kroeger 採用兩個攝象機實現了
一個獲取手勢的系統,它通過用戶的手在與滑鼠墊一般大小的「鏡象盒」的3D 空間中來完成交互。兩
個鏡子被放在大約與前平面成45 度角的位置上,兩個鏡子代替單個鏡子產生了一個虛擬視點,加上兩
垂直平面上的兩個攝象機共三個視點相交成直角,以提供給用戶一個確定的工作空間,在這個空間內允
許用戶與計算機交互。
❹ pytorch手勢識別訓練數據比8:2怎麼理解
在PyTorch中進行手勢識別的訓練,8:2是指將所有的訓練數據分成兩部分,其中80%的數據用於訓練模型,另外20%用於驗證和測試,也稱為驗證集和測試集。
這個比例的選擇是由實際需求和數據情況來決定的,通常80:20的比例可以在很多情況下達到較好的訓練效攔吵塵果,同時也可以在驗證集和測試集中測試模型的泛化能力。
比如,如果數據集的樣本數量充足,比例可能會更大,如90:10或95:5,以增加模型的訓練量和驗證集的可靠性。相反地,如果數據很少,比碰培例可能會更小,如70:30,以充分利用有限的數據簡禪並減少測試集的誤差。
總之,選擇訓練數據比例的目的是能夠充分利用數據訓練模型,同時評估模型的泛化能力和可靠性。
❺ 科目一必考的交警手勢圖,特別容易混淆,教你正確辨別不做錯
科目一考題沒人能夠預估,但是總有幾種題目肯定會考到,比如限速、交通手勢等,那在這些題目裡面還特別容易記混淆,做錯題目的比比皆是,那這裡面必考的交警手勢圖一共有八種,很多學員會搞錯,本文就教你如何快速記憶每個手勢圖的特點,然後在考試中就能辨別出正確答案。記住這些交警手勢圖不單純的是可以保證自己考核通過,在之後開車中,也是需要掌握的一個知識。一起來看看吧!❻ 如何給手勢識別控制智能車加攝像頭
給手勢識別控制智能車加攝像頭需要以下步驟:
1. 選擇合適的絕遲備攝並毀像頭:根據自己的需求和預算,選擇一款適合的攝像頭。可以考慮使用USB介面或者WiFi連接的網路攝像頭。
2. 連接到智能車上:將選好的攝像頭連接到智能車上。如果是USB介面,可以通過OTG線連接;如果是WiFi連接,則需要在智能車中添加一個無線網卡,並與網路攝像頭進行配對。
3. 安裝驅動程序:安裝相應的驅動程序和軟體,以便於電腦或者手機等設備可以識別並操作這個新加入的設備。
4. 編寫代碼實現手勢識別控制功能:利用編程語言(如Python、C++等)編寫代碼,在原有基礎上增加手勢識別控制功能。具體實現方式包括調用OpenCV庫進行圖形處理、使用機器學習演算法訓練模型來實現手勢分類等。
5. 測試和優化:完成以上步驟後,進行測試並不斷優化代碼,確保系統穩定性和用戶體驗。
總之,在給手勢識別控制智能車加入攝像頭時需要注意硬體兼容性、軟體驅動支持以及編程技術等方面問題,並且要經過多次測試才可達到理想效果。旦弊