ה-AI של אפל מתאמן על מיילים שלא נכתבו מעולם

חברת Apple מצאה פתרון יצירתי כדי לאמן את מודל ה-LLM שלה באמצעות דאטה סינתטי ובכך לשמור על פרטיות המשתמשים שלה

ניב גילינסקי
16.4.25

תמונה: Pixabay

ענקית הטכנולוגיה Apple, שמדגישה תמיד עד כמה היא מעוניינת לשמור על פרטיות המשתמשים שלה, מצאה פתרון מקורי לבעיה מוכרת: איך מאמנים מודל שפה מתקדם כשאתה מתעקש לא לגעת במידע האישי של אותם המשתמשים? פשוט: אתה ממציא מידע במקום.

לפי עדכון שפרסמה אפל באתר המחקר שלה, היא החלה להשתמש בדאטה סינתטי (כלומר, הודעות דוא"ל שלא נכתבו על ידי בני אדם אלא על ידי מחשב) כדי לאמן את מודל ה-LLM שלה במוצרי Apple Intelligence. כן – זה אומר שהמייל הבא שתראו מסוכם באייפון, כנראה נולד בשיחת חולין בין שני מודלים בשעה 03:00 לפנות בוקר.

במקום לסרוק מיילים אמיתיים (כמו ש… לא נזכיר שמות), אפל מייצרת הודעות מדומות כמו: "רוצה לשחק טניס מחר ב־11:30?" ואז מריצה אותן ב-LLM שיוצר גרסאות שונות של אותו מייל. כל ההודעות עוברות המרה למבנים מתמטיים (embeddings), ואז מושוות, תוך שמירה על פרטיות, להודעות אמיתיות של משתמשים שבחרו לשתף נתוני אנליטיקה מהמכשיר.

הטריק פה הוא שימוש ב־differential privacy, טכניקה שמאפשרת לאפל ללמוד את המבנה של הדוא"ל בלי לראות אף שורה ממנו בפועל. כמו לקרוא בין השורות, בלי לפתוח את המעטפה. אפל רוצה לשחק במגרש של הבינה המלאכותית אבל בלי לשבור את חוקי המשחק שהיא עצמה כתבה על פרטיות. זה בניגוד לגישות של מתחרות כמו Meta, שהודיעה לאחרונה שתאמן את המודלים שלה על תוכן שהמשתמשים באירופה מעלים – אלא אם הם יבקשו במפורש שלא.

לאפל אין דאטה לשתות – אז היא מייצרת דאטה משלה. נשמע קצת כמו להקים מסעדה עם אוכל מהמדפסת התלת־ממדית, אבל לפחות זה אורגני מבחינה אתית.

ומה החיסרון?

דאטה סינתטי אולי נשמע כמו משהו נקי יחסית, אבל היא מגיעה עם בעיות משלה: הדאטה עלולה להיות מוטה, חסרת גיוון, פחות מדויקת ובואו נגיד את האמת המודל שלך לא באמת לומד לדבר "כמו בני אדם" אם הוא כל הזמן רק מדבר עם עצמו.

וזה גם לא מונע את כל החששות: אפל אמנם מתעקשת שהיא לא אוספת את המיילים שלכם, אבל כולנו יודעים שלפעמים מודלים אוהבים "לזכור בטעות" יותר ממה שתכננתם.

בשורה התחתונה, אפל הולכת על כל הקופה: פרטיות עד הסוף, גם אם זה אומר שה־AI שלה יישמע לפעמים קצת כמו רובוט שנולד בחדר נקי. היא כבר מיישמת את זה באפליקציית המייל שבגרסת הבטא, ואולי זו רק ההתחלה.

משרות פתוחות

קטגוריות

זה המקום להכיר את החברות, המשרדים וכל מי שעושה את ההייטק בישראל (ויש גם מלא משרות פתוחות!) #תוכן מקודם