פשוט, מדויק ויעיל: שיפור האופן שבו מחשבים מזהים תנועות ידיים: זיהוי תנועות ידיים אופטי רואה שיפורים ברמת הדיוק והמורכבות עם אלגוריתם חדש

Share on facebook
Share on twitter
Share on linkedin
Share on telegram
Share on whatsapp
Share on email
פרסומת
X-ray_Promo1


בסרט שובר קופות המדע הבדיוני משנת 2002 דו"ח מיעוט, דמותו של טום קרוז ג'ון אנדרטון משתמש בידיו, העטורות בכפפות מיוחדות, כדי להתממשק עם מסך המחשב השקוף שלו בגודל הקיר. המחשב מזהה את המחוות שלו כדי להגדיל, להתקרב ולהחליק. למרות שהחזון העתידני הזה לאינטראקציה בין מחשב לאדם הוא כיום בן 20 שנה, בני האדם של היום עדיין מתממשקים עם מחשבים באמצעות עכבר, מקלדת, שלט רחוק או מסך מגע קטן. עם זאת, מאמצים רבים הוקדשו על ידי חוקרים כדי לפתוח צורות תקשורת טבעיות יותר מבלי לדרוש מגע בין המשתמש למכשיר. פקודות קוליות הן דוגמה בולטת שמצאו את דרכן לסמארטפונים מודרניים ולעוזרים וירטואליים, ומאפשרות לנו לקיים אינטראקציה ולשלוט במכשירים באמצעות דיבור.

תנועות ידיים מהוות אמצעי חשוב נוסף של תקשורת אנושית שניתן לאמץ לאינטראקציות בין אדם למחשב. ההתקדמות האחרונה במערכות מצלמה, ניתוח תמונה ולמידת מכונה הפכה זיהוי מחוות מבוסס אופטי לאופציה אטרקטיבית יותר ברוב ההקשרים מאשר גישות הנשענות על חיישנים לבישים או כפפות נתונים, כפי שהשתמשו בו על ידי אנדרטון ב. דו"ח מיעוט. עם זאת, השיטות הנוכחיות מעכבות על ידי מגוון מגבלות, כולל מורכבות חישובית גבוהה, מהירות נמוכה, דיוק גרוע או מספר נמוך של מחוות ניתנות לזיהוי. כדי להתמודד עם הבעיות הללו, צוות בראשות Zhiyi Yu מאוניברסיטת Sun Yat-sen, סין, פיתח לאחרונה אלגוריתם חדש לזיהוי מחוות ידיים שמאזן טוב בין מורכבות, דיוק וישימות. כמפורט בעיתון שלהם, שפורסם ב- כתב עת להדמיה אלקטרונית, הצוות אימץ אסטרטגיות חדשניות כדי להתגבר על אתגרים מרכזיים ולממש אלגוריתם שניתן ליישם בקלות במכשירים ברמת הצרכן.

אחד המאפיינים העיקריים של האלגוריתם הוא התאמה לסוגי ידיים שונים. האלגוריתם מנסה תחילה לסווג את סוג היד של המשתמש כדקה, רגילה או רחבה בהתבסס על שלוש מדידות המסבירות את הקשר בין רוחב כף היד, אורך כף היד ואורך האצבע. אם הסיווג הזה מצליח, השלבים הבאים בתהליך זיהוי תנועות היד משווים רק את תנועת הקלט עם דגימות מאוחסנות מאותו סוג יד. "אלגוריתמים פשוטים מסורתיים נוטים לסבול משיעורי זיהוי נמוכים מכיוון שהם אינם יכולים להתמודד עם סוגי ידיים שונים. על ידי סיווג תחילה של מחוות הקלט לפי סוג יד ולאחר מכן שימוש בספריות לדוגמה התואמות לסוג זה, נוכל לשפר את קצב הזיהוי הכולל עם משאב כמעט זניח. צריכה", מסביר יו.

היבט מרכזי נוסף בשיטת הצוות הוא השימוש ב"פיצ'ר קיצור" לביצוע שלב זיהוי מוקדם. בעוד שאלגוריתם הזיהוי מסוגל לזהות מחוות קלט מתוך תשע מחוות אפשריות, השוואת כל התכונות של מחוות הקלט עם אלו של הדגימות המאוחסנות עבור כל המחוות האפשריות תהיה גוזלת זמן רב. כדי לפתור בעיה זו, שלב הזיהוי המקדים מחשב יחס בין שטח היד כדי לבחור את שלוש המחוות הסבירות ביותר מבין התשע האפשריות. תכונה פשוטה זו מספיקה כדי לצמצם את מספר המחוות המועמדות לשלוש, מהן המחווה הסופית נקבעת באמצעות מיצוי תכונה הרבה יותר מורכבת וברמת דיוק גבוהה המבוססת על "רגעי Hu invariant moments". יו אומר, "שלב הזיהוי המקדים של מחוות לא רק מפחית את מספר החישובים ומשאבי החומרה הנדרשים אלא גם משפר את מהירות הזיהוי מבלי לפגוע בדיוק."

הצוות בדק את האלגוריתם שלהם הן במעבד PC מסחרי והן בפלטפורמת FPGA באמצעות מצלמת USB. היו להם 40 מתנדבים לבצע את תשע תנועות הידיים מספר פעמים כדי לבנות את ספריית הדוגמאות, ועוד 40 מתנדבים כדי לקבוע את הדיוק של המערכת. בסך הכל, התוצאות הראו שהגישה המוצעת יכולה לזהות מחוות ידיים בזמן אמת עם דיוק העולה על 93%, גם אם תמונות מחוות הקלט היו מסובבות, מתורגמות או מוגדלות. לדברי החוקרים, העבודה העתידית תתמקד בשיפור ביצועי האלגוריתם בתנאי ברק גרועים ובהגדלת מספר המחוות האפשריות.

לזיהוי מחוות יש תחומי יישום מבטיחים רבים והוא יכול לסלול את הדרך לדרכים חדשות לשליטה במכשירים אלקטרוניים. מהפכה באינטראקציה בין אדם למחשב עשויה להיות קרובה!

מקור הסיפור:

חומרים המסופק על ידי SPIE – החברה הבינלאומית לאופטיקה ופוטוניקה. הערה: ניתן לערוך את התוכן לפי הסגנון והאורך.

.



קישור לכתבת המקור – 2021-12-27 22:44:26

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn
Share on telegram
Telegram
Share on whatsapp
WhatsApp
Share on email
Email
פרסומת
תכנון תשתיות רפואיות

עוד מתחומי האתר