בינה מלאכותית רעבה לנתונים, האם תשתיות IT יכולות לעמוד בקצב?

כולם רצים אחרי מודלים חדשים, אבל הקרב האמיתי מתרחש בתשתית. האם הנתונים שלנו בכלל מוכנים ל-AI?

אושרי אביטן
30.11.25

תמונה: dreamstime

מהמוקד הטלפוני ועד לרצפת הייצור, כל ארגון בוחן כיום כיצד ניתן למנף את הבינה המלאכותית לשיפור חווית הלקוח, חסכון והתייעלות והצתת חדשנות. אך כאשר ארגונים מעמידים את היעדים הללו במבחן, הם נאבקים לעתים קרובות עם קושי לדעת כיצד ניתן ליישם AI בצורה נכונה, עלויות גבוהות מדי ביחס לתוצאות ובעיות תשתית.

בניגוד לתפיסה הרווחת, נקודות החולשה אינן רק מודלים של שפה (LLMs) לא בשלים. הם נעוצים באופן שבו ארגונים אוספים, צוברים, מאחסנים ומזינים נתונים ליישומי הבינה המלאכותית שלהם, או יותר מדי חברות עדיין משתמשות בתשתית רשת שנבנתה לפני הופעתו של ChatGPT כדי להכין נתונים למודלים של בינה מלאכותית, וזה לא עובד.

ארגונים ממשיכים לסבול מאותן נקודות: מערך אחסון לא מספק, השהיה שגורמת לאיטיות, דרישות אבטחה ועוד. כתוצאה מכך, למרות עשרות מיליארדי הדולרים שהושקעו בבינה מלאכותית גנרטיבית, 95% מהארגונים מדווחים על בעיה במדידת החזר ההשקעה, ורק 5% מהפיילוטים מגיעים לפרודקשן, כך מצא מחקר שנערך לאחרונה ב-MIT. המספרים הללו חושפים כמה מעט חברות באמת מבינות את הנתונים שלהן; היכן נמצאים הנתונים שלהם, יש בהם ולמי יש גישה אליהם. להלן כמה מכאבי הראש העיקריים בניהול נתונים, המשמשים לצרכי בינה מלאכותית.

אחסון תחת מתח ונתונים לא מובנים

תשתית האחסון היא אחת הבעיות הדחופות ביותר כדי להבטיח אפשרות להפעיל למודלים של בינה מלאכותית. מערכות אחסון מדור קודם לא נבנו להתמודד עם מערכי הנתונים העצומים והלא מובנים שמזינים בינה מלאכותית גנרטיבית, והרחבתם מעלה לעתים קרובות את העלויות. ארגונים מוציאים כסף רב כדי להרחיב את הקיבולת, אך עדיין מתקשים להעביר נתונים לצורה שמישה במהירות.

ניהול נתונים בסביבות ענן וריבוי עננים היברידיות הוא אתגר שהולך ונעשה חריף יותר עם עלייתם של יישומי AI ונתונים ארגוניים. המידע הלא מובנה הוא אחד מן הגורמים העיקריים לצווארי בקבוק וכאשר הנתונים משתנים ונוספים כל הזמן האתגר הולך ונהיה קשה וגוזל זמן.

תמונה: dreamstime

השהייה ואבטחת מידע יוצרים כאבי ראש

השהייה (Latency) גם היא  נקודת כאב, שלעתים קרובות מחמירה על ידי התפשטות והתרחבות היקף הנתונים הארגוניים. העברת נתונים בין מערכות או שיתופם עם גורמים נוספים מוסיפה לאיטיות. ללא תשומת לב מדוקדקת למיקום הנתונים וכיצד הם נעים, ארגונים משלמים את המחיר בביצועים איטיים יותר ובעלויות גבוהות יותר.

אבטחת מידע עלולה גם היא לפגוע בביצועים. חומות אש, שכבות הצפנה, בדיקות זהות וכלים למניעת אובדן נתונים מהווים גורמי עיכוב  נוספים לזרימות נתונים. פתרונות עם אבטחה ותאימות מובנים יכולים לעזור להפחית בעיות ביצועים כאלה.

יכולת צפייה: לראות זה לדעת

יכולת לצפות בנתונים המוזנים למערכות, אשר הופכים למידע ותובנות, מסתמנת כגורם מכריע עבור AI. כלי ניטור מסורתיים נבנו עבור יישומים סטטיים, ולא מערכות אדפטיביות שמשנות התנהגות על סמך קלט נתונים ותפוקות הסתברותיות. כדי לגרום לבינה מלאכותית לעבוד, ארגונים זקוקים לנראות לגבי האופן שבו הנתונים זורמים והאם הם מתאימים לשימוש. אם אי אפשר יכול לצפות בנתונים אי אפשר לדעת אם הם מדויקים, מעודכנים או זמינים עבור הבינה המלאכותית.

המתנה לנתונים מושלמים היא מלכודת

למרות הנאמר לעיל, חשוב לומר דבר חשוב: יותר מדי חברות נותנות לדאגות בנושא איכות הנתונים לעכב את תוכניות הבינה המלאכותית שלהן. הנתונים לעולם לא יהיו ללא רבב ובהקשר זה מומלץ להשתמש בבינה מלאכותית עצמה כדי לעזור לשפר אותם.

על מנת להתמודד עם האתגרים שהוזכרו לעיל מומלץ שארגונים יבצעו פעולות כגון:

רשימות מלאי נתונים – ערכו רשימת מלאי של הנתונים. קטלגו נתונים מובנים ולא מובנים, יחד עם המטא-נתונים המתארים אותם, כך שהארגון יידע מה יש לו, היכן נמצאים הנתונים וכיצד הם מקושרים ליעדים העסקיים.

שמרו נתונים במערכת אחת – ארגונים רבים מפרידים בין מקומות שונים בהם שמורים הנתונים, ומאלצים נתונים לעבור בין מערכות. כל העברה מוסיפה השהיה ועלויות. הפעלת עומסי עבודה בענן או השרת שבהם הנתונים כבר שוכנים מפחיתה את החיכוך ומשפרת את הביצועים.

תכננו גמישות – אמצו תקנים פתוחים וגישות מודולריות להחלפת רכיבים בהתאם להתפתחות הצרכים.

הבהרת שכבת השאילתה – במידת האפשר, השתמשו בכלי שאילתות קטנים ומהירים יותר במקום להעמיד מסדי נתונים כבדים עבור כל משימה.

מדידת ערך – בחנו Use Cases והצלחתם עם מדדים ברורים. אם יוזמה כלשהי חוסכת זמן או מפחיתה את נפח האחסון, תעדו את המהלך על מנת להצדיק השקעות נוספות בעתיד.

אחסון מאוחד – נתונים לא מובנים גדלים באופן אקספוננציאלי ותשתית אחסון מדור קודם פוגעת ביעילות, בשימוש בניתוח וביכולת לייצר רווחים מתובנות נתונים.

מערכת אחסון מאוחד מוגדרת תוכנה – Software Defined Storage מסייעת לספק נתונים לבינה מלאכותית במהירות וביעילות רבה יותר על ידי איחוד נתונים בפלטפורמה אחת. בנוסף לכך, אחסון מאוחד מאפשר להתרחב באופן פשוט יותר בין סביבות שונות.

מבט קדימה

כדי להצליח עם בינה מלאכותית ארגונית מאוד קריטי להתייחס לשינוע והעברת נתונים כיכולת ליבה. בעוד שבחירת מודלי הבינה המלאכותית הנכונים חשובה, היכולת לנהל אחסון, השהייה ויכולת צפייה בנתונים בקנה מידה גדול היא מה שמפריד בין 5% שרואים ערך לבין 95% שלא.

עבור מנהלי IT, המשמעות לתעדף זרימת נתונים ואמינות על פני רדיפה אחר מודלים ניסיוניים. ללא השינוי הזה, ההבטחה של AI תישאר מחוץ להישג יד.


אושרי אביטן הוא מהנדס מערכות בכיר בנוטניקס

משרות פתוחות

קטגוריות

זה המקום להכיר את החברות, המשרדים וכל מי שעושה את ההייטק בישראל (ויש גם מלא משרות פתוחות!) #תוכן מקודם