כיצד העדכונים של Gemini ושל OpenAI משחקים באסטרטגיית ה-AI של אפל

גוגל ו-OpenAI הכריזו על עדכונים משמעותיים עבור דגמי ותכונות הבינה המלאכותית שלהן, ויצרו תחרות רבה יותר עבור אפל לפני כןWWDC.

ביום שני, OpenAI הכריזה על דגם GPT-4o AI החדשני שלה ודגם חדש לגמרימקהאפליקציה, בעוד ש-Google הציגה שיפורים משמעותיים בתוכנת Gemini שלה ביום שלישי. שתי החברות הציגו מגוון תכונות יוצאות דופן, מה שהפך את השוק לתחרותי עוד יותר כתוצאה מכך.

בעוד אפל לכאורה נקלעה הרחק מאחור שלהAI מאמצים, שותפות עם Google או OpenAI יכולה להתגלות כדרך קלה להציע תכונות בינה מלאכותית גנרטיבית לבסיס המשתמשים שלה. לְפָחוֹתהשמועות מעידותזה דרך שאפל מוכנה לקחת.

OpenAI הציגה לאחרונה את אGPT-4o, גרסה רב-מודאלית חדשה של מודל GPT AI של החברה המכילה יכולות משופרות בעיבוד סוגי קלט שונים.

שלא כמו קודמיו, GPT-4o יוכל להשתמש ברשת עצבית אחת לעיבוד אודיו, תמונות וטקסט, ומציע מודלים של שיפורים משמעותיים כתוצאה מכך. עליות במהירות ובעיבוד השפה הושמעו גם במהלך ההכרזה על המוצר.

ה-GPT-4o של OpenAI יוכל להבין ולהעביר רגשות. במהלך האירוע האחרון של החברה, חברי הצוות הדגימו זאת בכך שביקשו מהדוגמנית לנתח הבעות פנים ולקבוע את הרגשות הספציפיים שהמשתמש מביע.

ChatGPT של OpenAI זמין כעת באופן רשמי ב-macOS

עם תכונת Voice Mode המשופרת, המספקת פלט אודיו בצורה של דיבור, GPT-4o יכול להתאים את גוון הקול שלו, מה שהופך אותו לרובוטי יותר או טבעי יותר בהתאם לבקשת המשתמש.

לחברה יש גםהושקיישום שולחן עבודה חדש עבור ChatGPT, זמין ב-macOS, והציג API חדש למפתחים. GPT-4o יהיה זמין למשתמשים בתהליך השקה הדרגתי,

עדכוני Gemini של גוגל

גוגל, בשעה שלוכנס מפתחי I/Oביום שלישי, חשפה מספר שיפורים לדגם ה-Gemini שלה. Google Gemini החדש והמשופר יוכל להבין קלט משתמש מורכב יותר, תמונות תוך התחשבות בהקשר מאחוריהן.

Google Gemini הוא כלי AI מחולל

תוכנת הבינה המלאכותית תכלול יכולות מודעות חדשות להקשר, כלומר היא יכולה לראות הכל על המסך, בין אם זה PDF, סרטון או סדרה של הודעות טקסט. תאומים יוכלו לאסוף מידע ולהפיק פלט, אבל רק במכשירי אנדרואיד נבחרים.

עם האפשרות החדשה של מעגל לחיפוש, למשל, המשתמשים יוכלו לבחור אובייקטים בודדים בתוך תמונה ולקבל באופן מיידי תוצאות חיפוש של Google על האובייקט האמור.

תכונה נוספת הזמינה בלעדית באנדרואיד תספק למשתמשים אפשרות לנתח סרטוני YouTube וקובצי PDF באמצעות Gemini Advanced. עם השירות בתשלום, המשתמשים יוכלו לשאול שאלות ספציפיות, ויקבלו תשובות שנלקחו מתוכן הסרטון או ה-PDF האמור.

ה-Gemini המעודכן של גוגל יוכל לסכם שיחות ארוכות ולבודד מידע מרכזי ממסמכים, תמונות וסרטונים, כל אלו אמורים להועיל מאוד למשתמשי הקצה שלו. אפל מחפשת תכונות דומות באמצעות המוצרים שלה.

מה שאנחנו יודעים על אסטרטגיית ה-AI של אפל עד כה

אפל נמצאת מאחורי המתחרים במידה ניכרת בכל הנוגע להצעות הבינה המלאכותית שלה, אבל כל זה עשוי להשתנות בקרוב מאוד עם ההכרזה שלiOS 18בתחילת יוני.

במשך יותר משנה, אפל עובדת על מודל השפה הגדול (LLM) הפנימי שלה הידוע בשםאייאקס. עם תוכנת הבינה המלאכותית הגנרטיבית שלה, החברה שואפת להציע תכונות חדשות הדומות לאלו שהוכרזו על ידי גוגל ו-OpenAI בתחילת מאי.

כחלק מהדחיפה האחרונה שלה בינה מלאכותית, אפל צפויה להציג מספר תכונות המונעות בינה מלאכותית על פני מערכות ההפעלה החדשות שלה. ניתוח מסמכים ודפי אינטרנט,סיכום טקסט, כיתוב תמונה ויצירת תגובות נמצאים כולם בתהליך.

החברה מבקשת להטמיע טכנולוגיית AI גנרטיבית במבחר הקיים של יישומי מערכות הליבה שלה. כתוצאה מכך, אפליקציות כמוהערות,ספארי, הודעות, דואר,סיריו-Spotlight Search כולם צפויים לקבל שיפורים התומכים ב-AI בצורה כזו או אחרת.

Ajax LLM של אפל ישפר את Safari, Spotlight ו-Messages

עם זאת, במונחים של פונקציונליות בפועל, יש גבולות למה שאפל הצליחה להשיג. הAI במכשירהמודל בבדיקה מסוגל רק לניתוח טקסט ראשוני ויצירת תגובה בסיסית במכשיר.

תכונות מתקדמות יותר יחייבו לכאורה עיבוד מבוסס ענן, וזו הסיבה שאפל, לפי הדיווחים, מחפשת ליצור הסדר רישוי עם OpenAI. זה יאפשר לאפל להציע מגוון שיפורים הקשורים לבינה מלאכותית שהדגמים שלה במכשיר אינם יכולים לאפשר.

אשמועה נפרדתטוען שאפל רוצה ליצור "חנות האפליקציות של AI" דרכם יוכלו המשתמשים לרכוש אפליקציות ומוצרים בנושא AI מחברות אחרות. זה ייתן, בתיאוריה, למשתמשים אפשרות להשתמש בגרסאות בתשלום של מוצרים, כמו Gemini Advanced.

נקבל הבנה טובה יותר של מאמצי הבינה המלאכותית של אפל בקרוב, כמו החברהצפויהציג את תכונות הבינה המלאכותית הגנרטיביות החדשות שלה בכנס המפתחים העולמי השנתי שלה ב-10 ביוני.