חוקרי אפל פתחו בשיטה רב-מודאלית חדשה לאימון מהיר של מודלים של שפה גדולה (LLM) שיכולה לאפשר למידת מכונה גמישה וחזקה יותר ומערכות מסוג "AI".
אעבודת מחקרשפרסמה החברה לאתר המחקר arxiv.org מוקדם יותר השבוע חשף כי אפל השתמשה במה שהיא מכנה "שילוב זהיר" של כיתוב תמונה, תמונה-טקסט משולבת ונתוני טקסט בלבד כדי להכשיר LLMs. השילוב של נתונים חזותיים ושפה אפשרו למודלים להתמודד עם משימות כמו כיתוב חכם של תמונות או להסיק משמעויות בשפה טבעית.
במסגרת המחקר, נקבע כי לבחירת מקודד התמונה ולרזולוציית התמונות שהוא מעבד יש השפעה גדולה על הביצועים, יותר מאשר עיצוב מחבר שפת ראייה.
באחד המקרים, באמצעות מודל MM1 של 30 מיליארד פרמטרים, נמצא שיש יכולות למידה חזקות בתוך הקשר. הגילוי אומר שהוא יכול לבצע חשיבה מרובת שלבים על פני מספר תמונות עם מעט הנחיות של "שרשרת מחשבה".
לְפִיVenturebeat, אפל ממשיכההמסורת שלהשל להיות "עוקב מהיר" ולא "מוביל ראשון" בכל הנוגע לטכנולוגיות פורצות דרך. מנכ"לטים קוקלאחרונה הודה שהחברה מוציאה מיליארד דולר בשנה על שילוב "AI" בטכנולוגיות הקיימות שלה.
קוק אמר שהחברה תשתף "פרטים על העבודה השוטפת שלנו בבינה מלאכותית בהמשך השנה". אפל צפויה לפרסם כמה הודעות על ההתקדמות שלה בשעהWWDCביוני הזה.
החברה היא גם וגםלהתעדכןלמתחרים בשימוש בטכנולוגיות הקשורות לבינה מלאכותית. היא גם מפתחת שיטות שישמרו על פרטיות המשתמש תוך הגדלת יכולות למידת המכונה הקיימות שלה.
הדאגה האחרונה לפרטיות ואבטחה לא הייתה מאפיין של שירותים קיימים מסוג "צ'טבוט", ומגבירה את האתגר עבור אפל.
העניין של אפל באימון רב-מודלים של רשתות עצביות הביא לביצועים עדכניים, המאפשרים חשיבה מרובת שלבים. זה מצביע על כך שהחברה מצאה דרך לקידום מהיר של יכולות למידת מכונה וכן להעניק להן יכולות "מודיעין" מתקדמות.