אפל שוקלת מצב לא מקוון עבור Siri שיכול לעבד קול באופן מקומי באייפון

אפל רוצה ש-Siri תהפוך שימושית יותר למשתמשים כשהם לא מחוברים לאינטרנט, כולל אפשרות של מצב לא מקוון שאינו מסתמך על שרת אחורי שיסייע בזיהוי קולי או בביצוע המשימה הנדרשת, כזו שתבוצע כולה ב- המכשיר של המשתמש.

הדרךסיריבדרך כלל עובד זה שהוא מקשיב לפקודה של המשתמש כאשר מתבקש, שולח נתוני דיבור אנונימיים שהתקבלו לשרתים של אפל, תחילה ממיר מאודיו לטקסט רגיל, ואז מפרש את הפקודה ושולח את התוצאה חזרה לאייפון או אייפד של המשתמש. תהליך ביצוע זיהוי דיבור הוא אינטנסיבי, והוא מוריד מהמכשירים לשרתים של אפל מכיוון שהוא לא בהכרח מסוגל להתבצע על פריט כמו אייפון.

במקרה של סירי, ההסתמכות על שרתים פירושה שהעוזר הוירטואלי אינו זמין אם אין צורה כלשהי של חיבור לאינטרנט, אם כי ההנחיה "היי סירי" עדיין תפעיל את השירות, ולו רק כדי להציג את ההודעה הלא מקוונת . לפי אבקשת פטנט של אפלהגשה שפורסמה ביום חמישי עבור "עוזר אישי לא מקוון", דברים עשויים להשתנות בעתיד.

במקום להתחבר לשרתים של אפל, התיוק מצביע על כך שהעיבוד והאימות של דיבור לטקסט יכולים להתרחש במכשיר עצמו. כששמע את המשתמש מגיש בקשה, המכשיר המדובר יוכל לקבוע את המשימה באמצעות עיבוד שפה טבעית, לבדוק אם המשימה המבוקשת כפי שהוא שומע אותה היא שימושית, ואז לבצע אותה.

אפל מציעה להשתמש במערכת מובנית של מודולים לטיפול בשאילתות עוזר דיגיטלי שאינן מתחברות לעולם החיצון. אוסף המודולים כולל אלמנטים לסינתזת דיבור, עיבוד דיאלוג, המרת אלפבית פונטי המבוסס על אוצר מילים ברירת מחדל ונתונים שנוצרו על ידי המשתמש, ומודול עיבוד שפה טבעית, בין היתר.

בהתאם למילים המוכרות ולמבנה השאילתה, העוזר הדיגיטלי הלא מקוון יוכל לבצע מספר משימות מוגדרות מראש המאוחסנות במודול עיבוד זרימת המשימות או מודול עיבוד השירות. שתי החנויות הללו מכילות מודלים למשימות נפוצות, כגון הגדרת טיימר או השמעת שיר שנשמר במכשיר, כאשר דגם המשימות המתאים מתבצע בהתאם לבקשה.

דיאגרמת בקשת פטנט של אפל המציגה מודולים בתוך עוזר דיגיטלי

כחלק מההגשה, אפל אכן מציעה שימוש במנגנוני למידת מכונה לביצוע סוגים ספציפיים של משימות, כולל עיבוד שפה טבעית. מערכות כאלה יוכלו להבין מידע הקשרי, מה שהופך אותן לשימושיות ביותר לקביעת מה המשתמש רוצה מכמות מוגבלת של נתונים במכשיר, מבלי לגשת לאינטרנט.

אפילו עם העיבוד במכשיר לשימוש לא מקוון, המערכת המוצעת עדיין תוכל להיכנס לאינטרנט אם חיבור זמין, מה שגורם לאותה מערכת לעבוד בשתי דרכים שונות בהתאם לקישוריות הזמינה.

גישה לעיבוד מקומי ומרוחק תספק גם לעוזר הדיגיטלי שתי פרשנויות אפשריות לדיבור של המשתמש. במקרים כאלה, המערכת תקבע ציון שימושיות עבור הפרשנות המעובדת המקומית וכן את זה של הגרסה המעובדת באינטרנט, ותבצע את המשימה על סמך איזה משני התהליכים קיבל ציון גבוה יותר.

זה ייתן למעשה לעוזר אפשרות גיבוי, מה שמאפשר להשתמש בעיבוד מבוסס השרת כפירוש חלופי אם העיבוד המבוצע באופן מקומי על הבקשה מגיע עם תוצאה בלתי שמישה. במקרה שגרסת השרת תפוגג או לא תהיה זמינה, הגרסה המקומית עדיין זמינה לשימוש עבור המשימה.

בדרך כלל אפל מגישה פטנטים רבים על בסיס שבועי, ולמרות שהמושגים המתוארים מצביעים על תחומים שבהם יש לאפל עניין, הם אינם ערובים שמערכות כאלה ייכללו במוצרים העתידיים של החברה.

במקרה של Siri לא מקוון, זה נראה די סביר עבור אפל ללכת בדרך זו. בהשקות האייפון האחרונות שלו, המעבד מסדרת A כלל את Neural Engine, שנועד לבצע משימות אינטנסיביות מבחינה חישובית כגון אימות Face ID והפעלת תכונות הקשורות לצילום, אך ניתן להשתמש בו גם למשימות המשתמשות בלמידה חישובית. .

בהתחשב בכוחו של הדור השנימנוע עצביבשימוש במהדורות iPhone 2018, זה בהחלט אפשרי עבור Siri לא מקוון לנצל את הכוח הזמינות ויכולות למידת מכונה כדי לבצע עיבוד לא מקוון.

מצב לא מקוון הוא לא הדרך היחידה שבה אפל יכולה לשפר את Siri, מכיוון שהיא עבדה על מספר מושגים שונים כדי לשפר את העוזר הדיגיטלי. פטנט אחד באוקטובר מסביר כיצד סירי יכלה לזהות משתמשים ספציפיים לפי "הדפס קולי," כאשר אפל גם בוחנת לאפשר תמיכה מרובת משתמשים עם תגובות מותאמות אישית.

סירי כבר קיבלה כמה שיפורים הקשורים ליכולות הזיהוי שלה, כוללדגמי קול גיאוגרפייםכדי לסייע בשאילתות אזוריות ומוזרויות שפה מקומיות. גלוי יותר לצרכנים הוא ההקדמה שלקיצורי דרך של סיריב-iOS 12, המאפשר למשתמשים לבצע פקודות Siri האישיות שלהם.

התעדכן בכל החדשות של אפל באמצעות האייפון, האייפד או ה-Mac שלך. אמור, "היי, סירי, שחק את AppleInsider Daily," - אוסמן את הקישור הזה- ותקבל עדכון מהיר ישירות מצוות AppleInsider.