אפל AIמחקר חושף מודל שיהפוך את מתן הפקודות לסירי למהיר ויעיל יותר על ידי המרת כל הקשר נתון לטקסט, שקל יותר לנתח אותו באמצעות מודל שפה גדולה.
מחקר בינה מלאכותית באפל שומרמתפרסםכאשר החברה ניגשת להשקה פומבית של יוזמות הבינה המלאכותית שלה ביוני במהלךWWDC. עד כה התפרסמו מגוון מחקרים, כולל אכלי אנימציית תמונה.
ההעיתון האחרוןהיהמשותף לראשונהעַל יְדֵיVentureBeat. המאמר מפרט משהו שנקרא ReALM - Reference Resolution As Language Modeling.
קבלת תוכנית מחשב לבצע משימה המבוססת על קלט שפה מעורפל, כמו האופן שבו משתמש יכול לומר "זה" או "זה", נקראת רזולוציית התייחסות. זו בעיה מורכבת לפתרון מכיוון שמחשבים לא יכולים לפרש תמונות כמו שבני אדם יכולים, אבל ייתכן שאפל מצאה רזולוציה יעילה באמצעות LLMs.
כשמדברים עם עוזרים חכמות כמוסירי, משתמשים עשויים להפנות לכל מספר של מידע הקשרי שיש לקיים איתו אינטראקציה, כגון משימות רקע, נתונים בתצוגה וישויות אחרות שאינן שיחות. שיטות הניתוח המסורתיות מסתמכות על דגמים גדולים להפליא וחומרי עזר כמו תמונות, אך אפל ייעלה את הגישה על ידי המרת הכל לטקסט.
אפל גילתה שדגמי ה-ReALM הקטנים ביותר שלה פעלו בדומה ל-GPT-4 עם הרבה פחות פרמטרים, ולכן מתאימים יותר לשימוש במכשיר. הגדלת הפרמטרים המשמשים ב-ReALM גרמה לו להתעלות משמעותית על GPT-4.
אחת הסיבות לשיפור הביצועים הזה היא ההסתמכות של GPT-4 על ניתוח תמונות כדי להבין מידע על המסך. חלק גדול מנתוני אימון התמונות בנויים על דימויים טבעיים, לא על דפי אינטרנט מבוססי קוד מלאכותיים מלאים בטקסט, כך ש-OCR ישיר פחות יעיל.
ייצוגים של נתוני לכידת מסך כטקסט. מקור: מחקר אפל
המרת תמונה לטקסט מאפשרת ל-ReALM לדלג על הצורך בפרמטרים מתקדמים של זיהוי תמונה, ובכך להפוך אותה לקטן ויעילה יותר. אפל גם נמנעת מבעיות עם הזיות על ידי הכללת היכולת להגביל פענוח או להשתמש בעיבוד פשוט לאחר.
לדוגמה, אם אתה גולש באתר ומחליט שאתה רוצה להתקשר לעסק, פשוט לומר "התקשר לעסק" מחייב את סירי לנתח למה אתה מתכוון בהתחשב בהקשר. הוא יוכל "לראות" שיש מספר טלפון בדף המסומן כמספר העסק ולהתקשר אליו ללא הנחיה נוספת של המשתמש.
אפל פועלת לשחרור אאסטרטגיית AI מקיפהבמהלך WWDC 2024. חלקםהשמועות מעידותהחברה תסתמך על דגמים קטנים יותר במכשיר השומרים על פרטיות ואבטחה,תוך כדי רישויתכניות LLM של חברות אחרות לעיבוד מחוץ למכשיר השנוי יותר במחלוקת מלאים בחידות אתיות.