Google reāllaika roku izsekošanas algoritms izmanto viedtālruni, lai uzlabotu zīmju valodas atpazīšanu

Tech / Google reāllaika roku izsekošanas algoritms izmanto viedtālruni, lai uzlabotu zīmju valodas atpazīšanu 2 minūtes lasīts Reāllaika roku izsekošana

Reāllaika roku izsekošana



Zīmju valodu lieto miljoniem cilvēku visā pasaulē. Pētnieki ir strādājuši, lai izveidotu tehnoloģijas, kas spēj saprast žestus un automātiski pārveidot tos cilvēkiem saprotamā valodā. Tomēr šādi projekti nav guvuši milzīgus panākumus precizitātes ziņā.

Google nesen ir izstrādājis algoritmu, ko var izmantot reāllaika roku izsekošanai. Inteliģentā sistēma izmanto mašīnmācīšanos, lai izveidotu rokas karti. Karte tiek veidota ar kameras vai viedtālruņa palīdzību. Mēs nevaram noliegt faktu, ka lielākajai daļai sistēmu neizdodas precīzi notvert ātras roku kustības. Šajā pētījumā Google ir īpaši pievērsies šai problēmai. Interesanti, ka tie ir ierobežojuši datu apjomu, kuru iepriekš apstrādāja algoritmi.



Kā darbojas reāllaika roku izsekošana?

Lielākā daļa esošo projektu tulko zīmju valodu, nosakot visas rokas lielumu un pozīciju. Ar šo pētījumu. pētnieki ir novērsuši nepieciešamību apstrādāt taisnstūra formas dažādos izmēros. Google sistēma tikai atpazīst plaukstu, kas ir kvadrātveida. Otrkārt, tiek veikts atsevišķs pirkstu analīzes process.



Google

Roku žesti



Pētnieki izmantoja ap 30.000 roku attēlus, lai apmācītu mašīnmācīšanās algoritmu. Šie attēli tika uzņemti dažādos apgaismojuma apstākļos un pozās. Pēc tam sistēma nosaka žestu, salīdzinot rokas pozu un zināmu vienību sarakstu, piemēram, bumbu vai laimi. Google apraksta žestu atpazīšanu a emuāra ziņa .

Tad mēs kartē pirkstu stāvokļu kopu uz iepriekš noteiktu žestu kopu. Šī vienkāršā, tomēr efektīvā tehnika ļauj mums saprātīgi kvalitatīvi novērtēt pamata statiskos žestus. Esošais cauruļvads atbalsta skaitīšanas žestus no vairākām kultūrām, piem. Amerikāņu, eiropiešu un ķīniešu valodas, kā arī dažādas rokas zīmes, tostarp “Thumb up”, aizvērta dūri, “OK”, “Rock” un “Spiderman”.

Galīgais rokas izsekošanas algoritms nodrošina vismodernākos rezultātus tā ātruma un precizitātes ziņā. Algoritms palaišanai izmanto MediaPipe ietvaru. Šī tehnika, šķiet, ir liels progress zīmju valodas jomā. Lai gan joprojām ir daudz iespēju uzlabot. lai labāk izprastu zīmju valodu. Ikviens var paplašināt šo darbu, lai sasniegtu labākus rezultātus, izmantojot sejas izteiksmes un abas rokas.



Lai gan no Google nav neviena vārda, pastāv iespēja, ka Google var uzlabot šo reāllaika roku izsekošanas tehnoloģiju, lai to izmantotu savos produktos. Tikmēr, ja vēlaties spēlēt ar kodu, tas tā ir publiski pieejams vietnē GitHub .

Tagi google