IBM משיקה את Granite 3.2: מודל שפה "רזה" למשימות ארגוניות

החידוש המרכזי הוא מודל ויזואלי לחילוץ מידע מתרשימים וטבלאות, שאת הפיתוח שלו הוביל צוות חוקרים מחיפה, ואפשרות שליטה על מודל ההיסק

מערכת ITtime
3.3.25

מודל ויזואלי שפותח על ידי צוות מחקר משותף של IBM בחיפה וניו יורק. תמונה: dreamstime

IBM הציגה בסוף השבוע את Granite 3.2, הדור החדש במשפחת מודלי השפה Granite בגרסאות של 2 ו-8 מיליארד פרמטרים. המהלך מבטא את המשך האסטרטגיה של IBM לפיתוח מודלים קומפקטיים שמאפשרים לארגונים לפתח פתרונות AI מותאמים על בסיס מידע פנים-ארגוני, עם דגש על סטנדרטים גבוהים של אבטחה.

מודל ויזואלי לניתוח מסמכים ארגוניים בהובלה ישראלית

החידוש המרכזי בדור החדש הוא Granite Vision, מודל ויזואלי שפותח על ידי צוות מחקר משותף של IBM בחיפה וניו יורק. המודל מתמחה בחילוץ מידע מתרשימים, טבלאות והדמיות נתונים במסמכים ארגוניים – תחום שבו מודלים רבים נתקלים בקשיים.

בחברה סבורים שמודלי שפה רב-מודאליים (multi-modal) המאומנים על טקסט ותמונות ומסוגלים להפיק ביעילות ובדיוק רב סיכומים של דפי טקסט, מתקשים "להבין את התמונה הגדולה" מנתונים גרפיים בטבלה או תרשים, שאנו בני האדם נעזרים בהם כדי להמחיש כמות גדולה של נתונים ופרמטרים.

לפי בדיקות ביצועים שפרסמה IBM, מודל Granite Vision מציג תוצאות טובות יותר ממודלים גדולים יותר כמו Llama 3.2 11B ו-Pixtral 12B. היכולת לנתח מסמכים חזותיים כמו קבלות, טפסים ותרשימים יכולה לשמש לאוטומציה של משימות חוזרות במחלקות תפעול ושירות.

המודל מבוסס על Granite עם 2 מיליארד פרמטרים וכולל:

– חלון הקשר של 128 אלף טוקנים
– אימון על 13.7 מיליון עמודי מסמכים ארגוניים
– 4.2 מיליון תמונות לאימון
– 80.3 מיליון זוגות שאלות-תשובות למסמכים ו-16.3 מיליון לתמונות טבעיות

אופטימיזציה של ביצועים

תכונה חדשה היא מנגנון ההיסק הנשלט, מה ש-IBM מכנה "שרשרת מחשבה". המנגנון מאפשר למודל לפתור בעיות מורכבות באופן שיטתי, אך משום שהוא דורש משאבי מחשוב נוספים כעת IBM מאפשרת להפעיל או להשבית את המנגנון בהתאם למורכבות המשימה. כך ארגונים יכולים לאזן בין ביצועים לעלויות תפעול, ולפעול בצורה טובה יותר במסגרת האילוצים העסקיים.

בהתאם למדיניות הקוד הפתוח של IBM, כל דגמי Granite 3.2 זמינים בפלטפורמת Hugging Face תחת רישיון Apache 2.0. החבילה כוללת גם את Granite Guardian 3.2, כלי הגנה שמשפר את זיהוי הסיכונים בהנחיות ובתגובות. מנהלי IT יכולים לשקול את הטמעת מודלי Granite 3.2 עבור משימות הדורשות ניתוח מסמכים, כשההבטחה המרכזית היא שילוב של ביצועים טובים עם דרישות חומרה מתונות יותר בהשוואה למודלים גדולים אחרים.

משרות פתוחות

אולי פיספסת

קטגוריות

זה המקום להכיר את החברות, המשרדים וכל מי שעושה את ההייטק בישראל (ויש גם מלא משרות פתוחות!) #תוכן מקודם