אנבידיה מזהירה: מתקפה חדשה פוגעת ישירות ב-GPU's

בפעם הראשונה זוהתה מתקפת RowHammer שמסוגלת לשבש את פעילות המעבדים הגרפיים של Nvidia ולהוריד את רמת הדיוק של מודלי AI לפחות מאחוז בודד

ניב גילינסקי
14.7.25

מנכ"ל ומייסד אנבידיה, ג'נסן הואנג (צילום באדיבות NVIDIA)

מתקפת RowHammer, אחת מתקיפות החומרה הידועות ביותר של העשור האחרון, מגיעה לראשונה אל כרטיסי המסך (GPU) של ענקית הטכנולוגיה NVIDIA. בהודעה שפורסמה על ידי החברה בסוף השבוע, היא קוראת למשתמשים להפעיל את מנגנון תיקון השגיאות ECC כהגנה מיידית.

RowHammer, שהפכה לפופולרית בעשור האחרון, היא טכניקת תקיפה שמנצלת תופעה פיזיקלית בזיכרון DRAM: כאשר גישה חוזרת ונשנית לאותה שורת זיכרון מתבצעת במהירות גבוהה, עלול להיווצר שיבוש חשמלי שגורם להפיכת ביטים (Bit Flips) בתאים סמוכים גם מבלי לגשת אליהם ישירות.

מחסלת את הדיוק של מודלי ה-AI

הגרסה החדשה של התקיפה, שכונתה GPUHammer, היא הפעם הראשונה בה הוכחה מתקפת RowHammer מוצלחת על כרטיסי GPU של NVIDIA, כולל דגמים מתקדמים כמו A6000 עם זיכרון GDDR6. המתקפה מאפשרת לתוקפים לשבש מידע בזיכרון ה־GPU של משתמשים אחרים, גם ללא גישה ישירה אליהם. חוקרים מאוניברסיטת טורונטו מצאו כי תוצאה חמורה במיוחד של המתקפה היא פגיעה ביכולות של מודלים מבוססי בינה מלאכותית: במקרים שנבדקו, מודלים ירדו מדיוק של 80% לפחות מ־1%, כתוצאה מהשפעה על זיכרון המודל עצמו.

לפי דיווח של The Hacker News, המתקפה מצליחה לגרום לשיבושים גם בכרטיסים שמוגנים באמצעות מנגנונים כמו Target Row Refresh (TRR). אחת הסיבות לחשיפה הזו היא העובדה שכרטיסי GPU לרוב אינם כוללים בקרות שגיאה כמו ECC, מה שמשאיר את זיכרון ה־GPU חשוף במיוחד לתקיפות חומרה מהסוג הזה.


כל עדכוני ה-IT, תשתית וטכנולוגיה בערוץ הטלגרם של ITtime


התקיפה מצטרפת לגל הולך וגדל של איומים תשתיתיים על מודלי AI בהם תוקפים משפיעים על קלטים, תהליכים פנימיים או פרמטרים בזיכרון, כדי לשבש תוצאות או להשיג שליטה מבלי שיבחינו בהם. ב־NVIDIA ממליצים להפעיל את ECC לפחות בשרתים המיועדים לאימון או בהרצות רגישות, כדי לצמצם את ההשפעה על הביצועים. ניתן לעקוב אחר תקלות או ניסיונות תקיפה דרך יומני השגיאות של GPU (/var/log/syslog או dmesg), שם מתועדים תיקונים שבוצעו בזכות ECC.

כרטיסים חדשים כמו NVIDIA H100 ו־RTX 5090 אינם חשופים למתקפה בזכות ECC מובנה ברמת השבב. עם זאת, החוקרים מציינים כי הפעלת ECC עלולה לגרום לירידה של עד 10% בביצועי חיזוי (Inference) במעבדי A6000, ולצמצם את נפח הזיכרון ב־6.25%.

משרות פתוחות

קטגוריות

זה המקום להכיר את החברות, המשרדים וכל מי שעושה את ההייטק בישראל (ויש גם מלא משרות פתוחות!) #תוכן מקודם