שיפורים בדרך שבה סירי מזהה שמות של עסקים קטנים ונקודות עניין מקומיות נובעים מהשימוש במודלים של שפה המיועדים למיקומים ספציפיים, כך חושף ה-Machine Learning Journal של אפל, ועוזר לעוזרת הוירטואלית להבין שמות מקומיים למקומות סמוכים.
עוזרים וירטואליים כמו סירי מסוגלים להבין בקלות את שמם של עסקים ורשתות בולטים, כמו סופרמרקטים וזכיונות מסעדות,כותבצוות זיהוי הדיבור של Siri, עם שאילתות הנוגעות לעסקים פחות מוכרים או אזוריים הנוטים לספק תוצאות פחות מדויקות. במערכות זיהוי דיבור אוטומטי (ASR), הצוות מציין שזהו "צוואר בקבוק ידוע של ביצועים" לדיוק, כאשר אלה שנמצאים בהמשך הזנב הארוך של התפלגות תדרים פחות יזהו בצורה נכונה.
אפל ניסתה לשפר זאת עבור Siri על ידי התחשבות במיקום המשתמש בשאילתות. יהיו גם שני סוגים שונים של מודל בשימוש, כאשר מודל שפה כללי (LM) פועל לצד מודל שפה מבוסס מיקום גיאוגרפי (Geo-LM), כאשר האחרון הופך שימושי יותר אם המשתמש נמצא באזור הכיסוי שלו.
מערכות ASR מורכבות בדרך כלל משני מרכיבים, המורכבים ממודל אקוסטי המנתח את תכונות הדיבור לצד מודל השפה המנתח את השימוש במילה. אפל ציינה שהמערכת לא ייצגה בצורה מספקת מילים ושמות עבור נקודות עניין מקומיות ואופן הגייתן, כאשר השמות והשילובים המעורפלים יותר מופיעים גם בתדירות נמוכה מאוד בנתוני האימונים של LM.
התדירות הנמוכה פירושה שב-LM כללי, יש סיכוי נמוך יותר ששם העסק המקומי ייקלט בהשוואה למיקום, מילה או ביטוי אחרים.
בפתרון של אפל, היא הגדירה מספר אזורים גיאוגרפיים המכסים את רוב ארצות הברית, ויצרה Geo-LM לכל אזור. גרסאות מקומיות אלו משמשות בהתאם למיקום המשתמש, אם כי אם המשתמש נמצא מחוץ לכל האזורים המוגדרים או ששירותי המיקום מושבתים, נעשה שימוש ב-LM הכללי במקום זאת.
ישנם 169 אזורי Geo-LM עבור ארה"ב, בהתבסס עלאזורים סטטיסטיים משולביםמוגדר על ידי לשכת מפקד האוכלוסין האמריקאית, המכסה כ-80 אחוז מהאוכלוסייה. כל אזור מורכב מ"אזורי מטרופולינים סמוכים הקשורים כלכלית וחברתית", נמדד על פי דפוסי נסיעה.
בבדיקות של אפל, לא היה שינוי ממשי בדייקנות עבור שאילתות כלליות, אך הייתה הפחתת שגיאות יחסית של 18.7 אחוזים עבור חיפושים מבוססי נקודות עניין בין שימוש כללי ב-LM ו-Geo-LM. במבחני נקודת עניין בשמונה אזורי מטרופולין בארה"ב, הפחתת השגיאות היחסית בין LM כללית ל-Geo-LM גדלה, כאשר הגרסה המקומית השיגה ביצועים טובים יותר בין 41.9 אחוזים ל-48.4 אחוזים.
אפל מציעה שבגלל ההשפעה המוגבלת על מהירות המערכת, לכיסוי האזורי של Geo-LM עדיין יש מקום לשיפור, אבל מודל שפה כללי יהיה כאן כדי להישאר. "חיוני להמשיך לספק Geo-LM גלובלי בנוסף ל-LMs אזורי", כותבת אפל, "כדי ש-ASR תוכל לטפל בשאילתות ובמקרים למרחקים ארוכים עם משתמשים הממוקמים מחוץ לאזורים נתמכים".
הרחבה בינלאומית של התוכנית עלולה להתרחש גם לשפות שאינן אנגלית אמריקאית, כאשר אפל מציינת "השיטה והמערכת המוצעות כאן אינן תלויות שפה".
לאפל יש עוד דרך לעבור כדי להגיע לרמת הדיוק של גוגל עבור עוזרים וירטואליים. אמבחן קבוצתי ביוליגילתה ש-Siri שיפרה את הדיוק שלה בצורה ניכרת בשנה האחרונה ל-78.5 אחוזים, כמו גם הגדילה את הבנת השאילתות שלה לקרוב ל-100 אחוז, אך במסגרת אותו מבחן, Google Assistant השיגה דיוק של 85.5 אחוז.