Гоогле-ов алгоритам за ручно праћење у реалном времену користи паметни телефон за побољшање препознавања знаковног језика

Тецх / Гоогле-ов алгоритам за ручно праћење у реалном времену користи паметни телефон за побољшање препознавања знаковног језика 2 минута читања Праћење руку у реалном времену

Праћење руку у реалном времену



Знаковни језик користе милиони људи широм света. Истраживачи раде на стварању технологија које могу да разумеју гесте и аутоматски их претворе у језик разумљив човеку. Међутим, такви пројекти нису постигли огроман успех у погледу тачности.

Гоогле је недавно развио алгоритам који се може користити за праћење руку у реалном времену. Интелигентни систем користи машинско учење за стварање мапе руке. Мапа се креира уз помоћ камере или паметног телефона. Не можемо порећи чињеницу да већина система не успева тачно да ухвати брзе покрете руку. Гоогле се посебно позабавио овим проблемом у овом истраживању. Занимљиво је да су ограничили количину података коју су алгоритми претходно обрађивали.



Како функционише праћење руку у реалном времену?

Већина постојећих пројеката преводи знаковни језик откривањем величине и положаја комплетне руке. Овим истраживањем. истраживачи су елиминисали потребу за руковањем правоугаоним облицима различитих величина. Гоогле-ов систем само препознаје длан квадратног облика. Друго, ради се засебан поступак анализе прстију.



Гоогле

Покретима руку



Истраживачи су користили око 30.000 слика руку за обуку алгоритма машинског учења. Ове слике су снимљене у различитим условима осветљења и пози. Потом систем детектује гест поређењем позе руке и листе познатих ентитета као што су лопта или срећа. Гоогле описује препознавање геста у а блог пост .

Затим скуп стања прстију мапирамо у скуп унапред дефинисаних геста. Ова директна, а ефикасна техника омогућава нам да проценимо основне статичке покрете са разумним квалитетом. Постојећи цевовод подржава бројање гестова из више култура, нпр. Амерички, европски и кинески, као и разни ручни знакови, укључујући „Палац горе“, затворену шаку, „ОК“, „Роцк“ и „Спидерман“.

Коначни алгоритам за праћење руку даје најсавременије резултате у погледу брзине и тачности. Алгоритам користи МедиаПипе фрамеворк за покретање. Ова техника изгледа као велики напредак у домену знаковног језика. Иако још увек има пуно простора за побољшање. ради бољег разумевања знаковног језика. Свако може проширити овај рад тако да користи изразе лица и обе руке како би постигао боље резултате.



Иако од Гоогле-а нема вести, постоји могућност да Гоогле може да побољша ову технологију праћења руку у реалном времену како би је користио у својим производима. У међувремену, ако се желите поиграти са кодом, јесте јавно доступан на ГитХуб-у .

Ознаке гоогле