מערכות AI נכנסו לתחרות סייבר – וגברו על רוב המתחרים
מערכות AI הצליחו לגבור על רוב המתחרים בשתי תחרויות סייבר פומביות ולעקוף אלפי צוותים

תמונה: pexels
בעוד מנהלי אבטחת מידע מודים שאין להם עדיין מענה אמיתי לאיומי סייבר מבוססי בינה מלאכותית, מחקר חדש שפורסם השבוע מציג הדגמה פומבית ליכולות ההתקפיות של מערכות AI – והמסר שעולה ממנו הוא, לכל הפחות, מטריד: ה-AI לא רק הדביק את הפער, אלא כבר יכול לעקוף את רוב בני האדם ביכולות הפריצה שלו. ולמרות זאת יש גם מקום להרגיע: בלא מעט תחומים, ה-AI עדיין נמצא הרחק מאחור, אבל הפער בהחלט יכול להצטמצם.
במחקר שפורסם השבוע, תיארו החוקרים כיצד שילבו מערכות בינה מלאכותית בשתי תחרויות CTF ('תפוס את הדגל'). בתחרות הראשונה, שהתמקדה במבחן ישיר בין AI לבני אדם, הצליחו ארבע מתוך שישה צוותי AI להשתחל ל־5% העליונים מתוך 400 צוותים שהשתתפו. בתחרות השנייה, בה השתתפו 18,000 משתתפים שחולקו ל-8,000 צוותים, הגיע אחד מצוותי ה־AI ל־10% העליונים, תוך שהוא עוקף כ־7,200 קבוצות אנושיות.
מתחרים לכל דבר
התחרויות עצמן כללו אתגרי סייבר מסוג "Jeopardy-style CTF", פורמט בו כל משימה היא עצמאית, וכל פתרון מניב "דגל" שמעניק ניקוד. האתגרים כיסו מגוון תחומים מעשיים בעולמות הסייבר, בהם פריצת אפליקציות, הנדסה לאחור, ניתוח בינארי, הצפנה, ועוד. בתחרות הראשונה, שהתמקדה בעימות ישיר בין AI לבני אדם, הופיעו האתגרים בפורמט אחיד לכולם והביצועים נמדדו על פי כמות הדגלים שנאספו, מהירות הפתרון ודירוג יחסי בטבלה.
המסלולים של סוכני ה־AI נבנו כך שיקבלו בדיוק את אותם אתגרים כמו הצוותים האנושיים, מבלי סיוע חיצוני בזמן אמת. החוקרים הדגישו כי המערכות לא הופעלו בסימולציה אלא השתתפו בפועל, בתנאי אמת, בזירות הפתוחות של Hack The Box, פלטפורמה מוכרת לאימון והסמכה בתחום הסייבר, מול צוותים אנושיים מתחרים. בניגוד למחקרים קודמים שהתבצעו במעבדה או באמצעות אתגרים מותאמים, כאן הופיעו המערכות לצד בני אדם על לוח התחרות הפומבי, ונמדדו באותם תנאים. בסיום, חלק מצוותי ה-AI גם זכו בפרסים כספיים בסך של 7,500 דולר, בדומה למתמודדים האנושיים.

תמונה: צילום מסך מתוך המחקר של Artem Petrov & Dmitrii Volkov
באמצעות השוואה למדדים קיימים של זמן פתרון לאתגר, כמו אלו של METR (מוסד המודד את אורך הזמן לפתרון משימות עבור מומחי סייבר אנושיים), נמצא כי חלק מהמערכות הצליחו לפתור אתגרים שנחשבים לקשים במיוחד: משימות שמדורגות ככאלו שדורשות עד שעה שלמה לפתרון על ידי האקר מנוסה, נפתרו לעיתים תוך דקות בודדות על ידי ה-AI. הביצועים האלה מרשימים במיוחד לנוכח העובדה שכל אחד מהסוכנים נבנה תוך ימים ספורים בלבד ולא כפרויקט ארוך־טווח של חברות ענק, אלא כחלק ממאמץ מחקרי ממוקד.
הממצאים הגיעו בזמן שבו 75% ממנהלי האבטחה ברחבי העולם מעידים כי "סייבר מבוסס AI" יכול לעקוף את ההגנות שלהם והמחקר הזה רק מחזק את החשש: מערכות שנבנו תוך ימים ספורים בלבד הצליחו לפצח אתגרים שדורשים מהאקר אנושי מנוסה שעה שלמה.
יכולת טכנולוגית מול תחכום אנושי
אבל רגע לפני שזורקים את הניירות באוויר ובורחים הביתה להתחבא, יש גם מקום להירגע. אז נכון, במשימות שמבוססות על תבניות חוזרות, פרצות מוכרות או צורך בהרצה אוטומטית של קוד, ה־AI הבריק. המערכות הצליחו לזהות פגיעויות, לפרוץ אליהן ולדווח על כך בצורה מובנית, לעיתים מהר יותר מכל משתתף אנושי. על פי החוקרים, הסוכנים פעלו על בסיס מודולים שפתיים מודרניים דוגמת GPT בשילוב כלי סייבר קוד פתוח, כשהם לומדים את הסביבה תוך כדי תנועה.
אבל לצד ההצלחה, המחקר גם הציג את מגבלות ה־AI: משימות פתוחות מדי או כאלה שדורשות יצירתיות מחשבתית הצליחו להכשיל את הסוכנים. במקרים שבהם היה צריך לפרש לוגים מורכבים, לבצע עקיפה יצירתית של מגבלות גישה או לזהות הקשרים לא צפויים, דווקא המתחרים האנושיים הם אלו שעקפו את ה-AI.
כל עדכוני ה-IT, תשתית וטכנולוגיה בערוץ הטלגרם של ITtime
המערכות, כך נראה, עדיין סובלות מ"התעקשות שגויה": כשהן בוחרות גישה שגויה לפתרון הן מתקשות לנטוש אותה, גם כשברור שהיא לא עובדת. במילים אחרות, הן יודעות "מה לעשות" כל עוד הכללים ברורים אבל לא יודעות מתי כדאי לעצור ולחשב מסלול מחדש.
המחקר גם הציע מודל הערכה חדש ליכולות AI בתחום הסייבר: תחרויות פתוחות עם פרסים שמאפשרות להעריך יכולות באופן שקוף ומדוד, ולא רק בתוך קוד סגור במעבדות מחקר. לפי החוקרים, ככל שיותר תחרויות יאפשרו ל-AI לקחת חלק, כך נבין טוב יותר את הפערים, את הקצב שבו הן משתפרות, ובעיקר נראה בשטח את מה שהן עדיין לא יודעות לעשות.
אז האם בפעם הבאה מערכת AI תגיע למקום ראשון? יכול מאוד להיות שכן. אבל לפחות נכון לעכשיו, ההאקרים האנושיים, או לפחות המובילים שבהם, עדיין במשחק.