ב-DeepSeek רצו להיפרד מאנבידיה וזה נגמר בדחיית המודל החדש
על פי דיווח חדש, חברת ה-AI הסינית ניסתה לאמן את המודל הבא שלה עם מעבדי Huawei אך נאלצה לחזור ל-Nvidia לאחר סדרה של תקלות בשלב אימון המודל

תמונה: Dreamstime
בזמן שבסין מנסים לדחוף את חברות הטכנולוגיה המקומיות להפסיק לקנות מעבדים של אנבידיה ולעבור לפתרונות מתוצרת בית, מגיע מקרה שממחיש למה זה לא כל כך פשוט. חברת ה-AI הסינית DeepSeek נאלצה לדחות את השקת המודל החדש שלה, אחרי שלא הצליחה לאמן אותו עם השבבים של Huawei.
לפי דיווח ב-Financial Times, הרשויות בסין דחפו את DeepSeek להשתמש במעבד ה-Ascend של Huawei במקום באלו של אנבידיה ואף האיצו את מאמציהן לאחר השקת דגם R1 בינואר. אבל כשעברו לפתח את דגם R2, בחברה נתקלו בבעיות טכניות שלא אפשרו לבצע אימון מלא על מעבדי Huawei.
גם כשהצוות של Huawei הגיע פיזית למשרדים של DeepSeek כדי לנסות לפתור את הבעיה, זה פשוט לא עבד. בסוף הם נשברו, חזרו למעבדים של Nvidia עבור שלב האימון, והשאירו את אלו של Huawei רק לשלב ההסקה (Inference).
כל עדכוני ה-IT, תשתית וטכנולוגיה בערוץ הטלגרם של ITtime
פשוט לא עמדו בעומס
וזה לב העניין: אימון מודל AI הוא חיה אחרת לגמרי מהסקה. זה לא רק כוח עיבוד, אלא גם קישוריות בין מעבדים, ניהול זיכרון חכם ותמיכה במערכות תוכנה בוגרות. ה-Ascend אולי בסדר להסקה, אבל כשהעומס כבד הם קרסו.
הסיפור של דיפסיק הוא דוגמא נוספת ללחץ ההולך וגובר מצד בייג’ינג לגרום לחברות מקומיות לנטוש את מעבדי אנבידיה, ובמיוחד את הדגם H20, שבו היא חושדת שהושתלו "דלתות אחוריות". המטרה: להעדיף חלופות מקומיות כמו Huawei במסגרת מאמץ רחב יותר להשיג עצמאות טכנולוגית. אלא שהמקרה של DeepSeek מראה שכשמדובר ב-AI ברמה הגבוהה ביותר, החזון הזה הרבה יותר מורכב לביצוע.
וכל זה קורה בשבוע שבו נשיא ארה"ב לשעבר, דונלד טראמפ, הודיע שהוא מוכן לאשר מכירת Blackwell לשוק הסיני, אבל בתנאי שיותאמו ויציגו ביצועים חתוכים בחצי. אם המהלך הזה יצא לפועל, סין תקבל מעבדים שיכולים להפעיל חלק מהמודלים המתקדמים, אבל גם תזכורת חדה לכך שבמירוץ ה-AI היא עדיין תלויה בארצות הברית כדי להתקדם לשלבים הבאים.