הפיילוטים לא מתרוממים? זה לא אתם – זה הדאטה
למה פרויקטי GenAI נתקעים בשלב הפיילוט ואיך תבנו תשתית נתונים שתיקח אתכם לשלב הבא? ארבעה מהלכים שיעזרו לארגונים לשפר את מוכנות הדאטה ולהטמיע פתרונות בקנה מידה רחב
נוצר באמצעות AI
אנחנו לא צריכים לספר לכם שוב על איך GenAI עומד לעזור לחברות להמציא את עצמן מחדש, נכון? ייעול פעילות, מתן חוויות לקוח טובות יותר והנעת צמיחה הם מושגים שבתור אנשי IT בארגונים כנראה כבר שמעתם יומם ולילה.
למרות ההתלהבות הרבה, ארגונים רבים מתקשים להרחיב פיילוטים מבוססי GenAI לפתרונות בהיקף רחב. יש לכך מגוון סיבות, אבל כרגע נתמקד בעובדה שלרוב הארגונים פשוט אין עדיין מוכנות נתונים גבוהה – כלומר היכולת לארגן, לנקות, לקשר ולהנגיש מידע בצורה שמאפשרת למערכות GenAI לפעול בצורה מדויקת ובטוחה. כיצד השתנה האופן שבו ארגונים תופסים ומנהלים נתונים כיום, מה הופך את ניהול הדאטה למשימה אסטרטגית ולא רק תשתיתית ואילו צעדים יכולים לאפשר לארגונים לשפר את מוכנות הדאטה שלהם כדי לעבור מפיילוטים להטמעה רחבת היקף? הנה כמה צירים מרכזיים שיעזרו לכם לקדם את מוכנות הדאטה לעידן החדש.
1. נתונים שהם בבעלות הקניינית של הארגון
בינה מלאכותית נוטה להיות שימושית ביותר כאשר היא מופעלת על נתונים קנייניים של חברה, שכן כך ניתן לקבל תובנות בעלות ערך גבוה יותר בהקשרי לקוחות, מוצרים, פעילות החברה ועוד. אך על אף ערכם הרב חברות מתקשות ללכוד ולרתום אותם לטובת יישום מוצלח.
חברות נדרשות להעמיק את הגישה לניהול הדאטה בהקשרים של מוצרי דאטה (data products), ולא בהקשרי צורך עסקי ספציפי. כלומר, הן נדרשות לנקוט גישה מונחית ערך וחוצה מקרי שימוש, ולא להתייחס לכך כפרויקט דאטה ייעודי לצורך עסקי כלשהו. בשנים האחרונות, בשל התפתחות רגולציה ומגבלות בשיתוף מידע צד שלישי, חברות נדרשו להסתמך יותר על נתונים קנייניים ונתוני שותפים. גישה מונחית ערך לנתונים מאפשרת למצוא את האיזון הנכון בין נתונים קנייניים לנתונים שאינם קנייניים בעת פריסת פתרונות GenAI.
דוגמה טובה אפשר למצוא אצל BBVA – גוף פיננסי בין לאומי שבנה פלטפורמת נתונים הוליסטית שמנהלת את כלל הנתונים הבנקאיים והחוץ בנקאיים, ומספקת לכל היחידות העסקיות בעולם גישה ישירה לעיבוד נתונים וניתוח תובנות, בדגש על מאפייני התנהגות הלקוח. התוצאה הייתה התרחבות מהצעת שירותים דיגיטליים פיננסיים פשוטים לפיתוח ולמכירה של מוצרי דיגיטליים חדשים. למשל היא פיתחה מוצר בשם BBVA Valor שמספק למשתמשים הערכה של מחירי רכישה או שכירות מומלצים לנכס ספציפי, ואיפשר לה לקדם מכירת משכנתאות ללקוחות וללא לקוחות. בזכות כך שניים מתוך שלושה לקוחות שהשתמשו בו גם רכשו משכנתא.
רוצים לקבל את הניולזטר השבועי של ITtime? הירשמו כאן
2. נתונים לא מובנים עם פוטנציאל לא מנוצל
נתוני חברות נוטים להיות מובנים (structured data) המתבססים על ניהול הקשרים (קונטקסט) בצורה טכנית באמצעות סכמות שונות. לעומת זאת, נתונים לא מובנים (הכוללים פורמטים כמו טקסט, תמונות, אודיו ווידאו) עשירים במידע קונטקסטואלי באופן מובנה. זו הסיבה שלסוג נתונים זה יש פוטנציאל כה רב: הם מספקים ייצוג אמיתי ולא מסונן של מידע הנוגע לפעילויות מגוונות בחברה. כך, הערך האמיתי מגיע כאשר הפתרונות משלבים נתונים מובנים עם נתונים לא מובנים, שמוסיפים את ההקשר הדרוש לתקשורת אנושית הקריטית בפתרונות GenAI.
נתונים לא מובנים, לדוגמה, מכילים סיגנלים מגוונים (למשל אפילו טון דיבור) המספקים יכולת "תחושה" והבנה קונטקסטואלית טובה יותר, וכך מאפשרים אינטראקציות עשירות בהרבה בין אנשים לכלי הבינה המלאכותית היוצרת.
כדי לנצל את הפוטנציאל של נתונים לא מובנים, חברות יידרשו להשקיע בארכיטקטורה ובמודל תפעול הדרושים ליצירה, לשימוש ולניהול של מוצרי הנתונים שלהן. לדוגמה, יצירת שכבה סמנטית יכולה לעזור לחברה לארגן ולהגדיר את הנתונים שלה מול מושגים עסקיים, באופן שמקל על אנשים ועל בינה מלאכותית להבין ולהשתמש בנותנים באופן נכון.
לחברת קמעונאות, נניח, יש כנראה מערך נתונים עצום של אינטראקציות עם לקוחות, רישומי מכירות ופרטי מוצרים. היא יכולה לאחסן את הנתונים הגולמיים שלה בדאטה בייס, אבל עדיין יהיה קשה לפרש אותם, ודאי אם יש צורך פונקציונלי ספציפי. יצירה של שכבה סמנטית וניהול הנתונים גם בהקשר העסקי שלהם (למשל כיצד ציוני שביעות רצון הלקוחות קשורים לנפחי מכירות), יקלו על פתרונות בינה מלאכותית למצוא את הנתונים הנכונים ויסייעו לנתח מגמות ולבצע תחזיות מדויקות באמצעות שפה טבעית.

נוצר באמצעות AI
3. ניהול נתונים סינתטיים
ככל שהמשימה או הפלט מורכבים יותר, כך נדרשים יותר נתונים – הן בכמות והן באיכות – לטובת בניית הפתרון. הבעיה היא שנוכח שני האתגרים הקודמים יש מחסור הולך וגובר במערכי נתונים ייעודיים, כך שנתונים סינתטיים – שנוצרים על ידי אלגוריתמים, במקום כאלו הנאספים מאירועים אמיתיים – הופכים לפתרון נפוץ ומאפשרים לחקור תרחישים מרובים, ללא העלויות נרחבות שכרוכות באיסוף נתונים בגישה המסורתית.
אפל למשל משתמשת בדאטה סינתטי כדי לאמן את מודל ה-LLM שלה במוצרי Apple Intelligence. במקום לסרוק מיילים אמיתיים, היא מייצרת הודעות מדומות כמו: "רוצה לשחק טניס מחר ב־11:30?" ואז מריצה אותן ב-LLM שיוצר גרסאות שונות של אותו מייל. כל ההודעות עוברות המרה למבנים מתמטיים (embeddings), ואז מושוות, תוך שמירה על פרטיות, להודעות אמיתיות של משתמשים שבחרו לשתף נתוני אנליטיקה מהמכשיר.
דרך נוספת היא תאומים דיגיטליים המבוססים על מידע סינטטי לצד ידע מקצועי, שמאפשרים לבצע סימולציה של תרחישים אפשריים כדי לנתח השלכות של השפעות שונות. בחברה שמתפעלת למשל מחסן אוטומטי, תאומים דיגיטליים ידמו פעולות מחסן כך שבמקרים של אירועי אמת העובדים יוכלו לדעת כיצד להתמודד על בסיס חיזוי והמלצה של התאום הדיגיטלי. שיטה זו סוללת את הדרך לסוכני בינה מלאכותית יצירתיים שיכולים לחקור, לתכנן ולהמליץ על דרך פעולה.
נתונים סינתטיים נותנים מענה במקרים של מידע חסוי, כמו רשומות רפואיות, ומאפשרים לאמן מודלים במידע סינתטי תוך הגנה על פרטיות המטופלים. בנוסף, כאשר תקנות דורשות אחסון נתונים לתקופות ארוכות, שמירת עותקים של נתונים סינתטיים (במקום המקור) מפחיתה את הנזק במקרה של מתקפת סייבר או פריצת נתונים אחרת. אך חשוב לשים לב שחייבים לאזן בין כמות ואיכות כדי להפיק את המרב מנתונים סינתטיים.
כל עדכוני ה-IT, תשתית וטכנולוגיה בערוץ הטלגרם של ITtime
4. ניהול מחזור חיי הנתונים
אחת הבעיות הכי כואבות בניהול דאטה נמצאת ממש בלב העניינים, בשרשרת האספקה של המידע. מהשלב שבו אוספים אותו, דרך עיבוד, שימוש עסקי (רצוי בזמן אמת), תחזוקה וכל מה שקשור למשילות.
בשנים האחרונות, גם מידע מובנה – כזה שמסודר בטבלאות ופורמטים ברורים – הצליח לעכב תובנות עסקיות בימים ושבועות. אבל כאן מגיע הטוויסט: רוב הדאטה בארגונים בכלל לא מובנה. יותר מ-80% מהמידע פשוט לא יושב על מבנה אחיד, וזה הופך את כל הסיפור של ניהול מחזור החיים שלו לאתגר כפול ומכופל. במיוחד כשמנסים להכניס לשם פתרונות מבוססי GenAI.
אבל פה בדיוק GenAI פורחת. היא יודעת לקחת גם דאטה "מבולגן", לאנדקס אותו, לסרוק מטא-דאטה, למפות ישויות עסקיות, לבנות קשרים בין מקורות מידע שונים ולהפוך את כל זה לתשתית ידע חכמה שמייצרת תובנות בזמן אמת. וזה לא משנה אם מדובר במסמכים, טבלאות, תמחורים, מדיניות או פריסת מוקדים גיאוגרפיים.
דוגמה מצוינת היא BMW – החברה בנתה מוח ארגוני שמחבר מידע מזמנות לקוחות, עץ מוצר, מסמכי מדיניות, זמינות חלפים ועוד – הכל, גם מובנה וגם לא מובנה – לטובת קבלת החלטות מהירה, מדויקת וחכמה.
ד"ר שאול לוי מנהל את תחום הדאטה ו-AI בחברת Accenture ומרצה באקדמיה על טרנספורמציה מבוססת טכנולוגיות מתקדמות. שירת בעבר כראש ענף מערכות מידע בצה"ל