אפל פרסמה בשבוע שעבר את עבודת המחקר המלומדת הראשונה שלה, מאמר המכסה שיטות לשיפור ההכרה במערכות ראייה ממוחשבת, מסמן כיוון חדש לחברה הסודית באופן מסורתי.
המאמר, שכותרתו "למידה מתמונות מדומות ובלתי מפוקחות באמצעות אימון יריב", הוגש לסקירהבאמצע נובמברלפני שראה פרסום דרך ספריית אוניברסיטת קורנל ב-22 בדצמבר.
המאמר של אפל מגיעפחות מחודשלאחר שהחברה אמרה שהיא לא תמנע עוד מעובדים לפרסם מחקרים הנוגעים לבינה מלאכותית.
זוהה על ידיפורבס ביום שני, הראשון במאמרי המחקר הציבוריים של אפל מתאר טכניקות לאימון אלגוריתמי ראייה ממוחשבת לזיהוי עצמים באמצעות תמונות סינתטיות, או שנוצרו על ידי מחשב.
בהשוואה למודלים של אימון המבוססים אך ורק על תמונות מהעולם האמיתי, אלו הממנפים נתונים סינתטיים הם לרוב יעילים יותר מכיוון שתמונות שנוצרו על ידי מחשב מסומנות בדרך כלל. לדוגמה, תמונה סינתטית של עין או יד מסומנת ככזו, בעוד שתמונות בעולם האמיתי המתארות חומר דומה אינן ידועות לאלגוריתם ולכן צריכות להיות מתוארות על ידי מפעיל אנושי.
עם זאת, כפי שציינה אפל, הסתמכות מלאה על תמונות מדומה עשויה להניב תוצאות לא משביעות רצון, מכיוון שלעתים תוכן שנוצר על ידי מחשב אינו ריאלי מספיק כדי לספק ערכת למידה מדויקת. כדי לעזור לגשר על הפער, אפל מציעה מערכת של חידוד הפלט של סימולטור באמצעות "למידה מדומה+ללא פיקוח".
בפועל, הטעם הספציפי הזה של לימוד S+U משלב נתוני תמונה אמיתיים ללא תווית עם תמונות סינתטיות מוערות. הטכניקה מבוססת במידה רבה על רשתות יריבות גנרטיביות (GANs), אשר חלהשניים מתחריםרשתות עצביות - מחולל ומפלה - זו מול זו כדי להבחין טוב יותר בנתונים שנוצרו מנתונים אמיתיים. התפתחות די עדכנית, יש לתהליךראה הצלחהביצירת תמונות "רזולוציית-על" פוטוריאליסטיות.
אף על פי שלא בהכרח מקדמת טכנולוגיה צרכנית עתידית, מעניין לציין שאפל בחרה ליישם את ה-GAN המתוקן שלה להערכת הערכת המבט והתנוחת הידיים. בנוסף, החברה אומרת שהיא מקווה להעביר יום אחד את למידת S+U מעבר לתמונות סטטיות לקלט וידאו.
מאמר המחקר הציבורי הראשון של אפל נכתב על ידי מומחה חזוןאשיש שריווסטבהוצוות מהנדסים כולל Tomas Pfister, Oncel Tuzel, Wenda Wang, Russ Webb ומנהל המחקר של אפל, ג'וש סוסקינד. יש לציין, סוסקינד הודיעה על העניין החדש של אפל בעיסוקים מדעיים מוקדם יותר החודש, מהלך שלדעתם יסייע למאמצי גיוס עתידיים.