Siri עשויה לשפר את הדיוק על ידי מיפוי החדר כפי שעושה HomePod

מחקר חדש מאוניברסיטת אפל וקרנגי מלון מתעמק כיצד מכשירים חכמים יכולים ללמוד על הסביבה שלהם כדי להבין טוב יותר בקשות על ידי ידיעה מתי ואיפה מדברים איתם.

אנשי אקדמיה מאפל, והמכון לאינטראקציה בין אדם למחשב של אוניברסיטת קרנגי מלון, פרסמו מאמר מחקר המתאר כיצד מכשירים כגוןסיריוHomePodניתן לשפר על ידי כך שהם יקשיבו לסביבתם. בעוד שמכשירי אפל רבים מאזינים, הם בפירוש מחכים לשמוע את השלב "היי, סירי", ומתעלמים מכל דבר אחר.

זה אותו דבר עם אלקסה, או לפחות זה בתיאוריה, אבל החוקרים האלה דוגלים בהקשבה אקטיבית של מכשירים חכמים כדי לקבוע פרטים על הסביבה שלהם - ומה אנשים עושים שם.

"תקשיב לומד," הם אומריםבנייר שלהם, "[היא] טכניקה לזיהוי פעילות שלומדת בהדרגה אירועים ספציפיים לסביבה פרוסה תוך מזעור עומס המשתמש."

נכון לעכשיו, HomePodsלהתאים אוטומטיתפלט האודיו שלהם כדי להתאים לסביבה ולמרחב שבו הם נמצאים. ואפל ישהגישו פטנטיםשיראו את HomePods עתידיים משתמשים במיקום של אנשים בחדר כדי להפנות אליהם אודיו.

הרעיון מאחורי המחקר של מאמר זה הוא שחיישנים דומים יכולים להאזין לצלילים ולזהות מהיכן הם מגיעים. לאחר מכן הוא יוכל לקבץ אותם כך, למשל, שיזהה באיזה כיוון מגיעים הצפצופים ממיקרוגל. הבנת ההקשר של היכן מישהו עומד ואיזה רעשים נשמעים מאילו כיוונים, יכולה לגרום לסירי להבין בקשות טוב יותר, או לנדב מידע.

"לדוגמה, המערכת יכולה לשאול שאילתת אישור: 'זה היה פעמון דלת?', שבה המשתמש משיב ב'כן'", נמשך. "ברגע שתיווצר תווית, המערכת יכולה להציע הודעות דחיפה ופעולות אחרות בכל פעם שהאירוע מתרחש שוב. אינטראקציה זו מקשרת בין תחומים פיזיים ודיגיטליים, ומאפשרת חוויות שיכולות להיות בעלות ערך עבור משתמשים כבדי שמיעה למשל."

בעוד שהעיתון מזכיר שוב ושוב באופן בלעדי את HomePods, הוא באמת עוסק בכל מכשיר עם מיקרופונים. זה מרמז שמכיוון שלכולנו יש עכשיו מספר הולך וגדל של מכשירים שמסוגלים להאזין, אז כבר יש לנו כלים לשפר את השליטה הקולית.

בסרטון המלווה את המאמר, החוקרים מדגימים כיצד האזנה כזו יכולה לשפר את הדיוק, וגם כיצד היא מוצלחת יותר מניסיונות קודמים לאמן מכשירים.

המאמר, "Automatic Class Discovery and One Shot Interactions for Acoustic Activity Recognition", מציע שמכשיר יוכל להאזין ברציפות, אם כי "לא נשמר אודיו גולמי במכשיר או בענן". זה ממשיך לעשות זאת, יוצר למעשה תוויות או תגים המופעלים על ידי צלילים מסוימים, עד שזה בעצם נשמע מספיק.

"בסופו של דבר, המערכת הופכת בטוחה שאשכול נתונים מתעוררים הם צליל ייחודי, ובשלב זה הוא מבקש מ[משתמש] תווית בפעם הבאה שהוא מתרחש", מסביר העיתון. "המערכת שואלת: 'איזה צליל זה היה?', ו[המשתמש] עונה: 'זה הברז שלי'. ככל שעובר הזמן, המערכת יכולה להמשיך לבקש מליסה תוויות בצורה חכמה, ובכך לבנות לאט לאט ספרייה של אירועים מוכרים".

כמו גם כללי "איזה צליל זה היה?" סוג של שאלה, אולי הוא יוכל לנחש ולכן נסה לשאול שאלה ספציפית יותר. "המערכת עשויה לשאול: 'זה היה בלנדר?'", אומר העיתון. "במקרה שהמשתמש עונה: 'לא, זו הייתה מכונת הקפה שלי'".

בעוד המאמר עוסק בעיקר ביעילות של מכשיר ששואל את המשתמש שאלות כאלה, החוקרים מסבירים שהם גם ניסו מקרי שימוש ספציפיים. "בנינו אפליקציית רמקול חכם הממנפת את Listen Learner לתיוג אירועים אקוסטיים כדי לסייע בנגישות בבית.", נכתב.

אין עדיין אינדיקציה לכך שאפל או חברות אחרות שילבו את הרעיון הזה ברמקולים החכמים שלהם. במקום זאת, זה היה מבחן ממוקד לטווח קצר, ולצוות יש המלצות למחקר נוסף.

עם זאת, זה מבטיח מכיוון שהם מסיקים שהבדיקה הזו "מספקת רמות דיוק המתאימות למקרי שימוש נפוצים של זיהוי פעילות", ומקרבת את "החזון של אינטראקציות מודעות להקשר למציאות".

התעדכן בכל החדשות של אפל באמצעות האייפון, האייפד או ה-Mac שלך. אמור, "היי, סירי, שחק את AppleInsider Daily," - אוסמן את הקישור הזה- ותקבל עדכון מהיר ישירות מצוות AppleInsider.