סטימצקי פתחה במבצע מיוחד – עומס הגולשים הפיל את האתר

קמפיין בזק של רשת הספרים גרם ללקוחות הנלהבים להסתער על האתר עד שקרס, כפי שקרה ב-2019. כך תוודאו שלכם זה לא יקרה

ניב גילינסקי
14:05

תמונה: Unsplash

רשת הספרים סטימצקי יצאה בשבוע שעבר במבצע מיוחד: כל הספרים באתר ב-35 שקלים בלבד. הקמפיין המקדים ברשתות החברתיות רץ שעות ספורות לפני פתיחת המבצע, שנמשך משעות אחר הצהריים ועד חצות. לרוע מזלם של חלק מהגולשים הנלהבים, רגעי השיא של המבצע הפכו לאכזבה, כשניסו להיכנס לאתר בשעות העומס וגילו שקרס, בעוד מי שכן הצליח להיכנס לפני התקלה, לא הצליח תמיד להשלים את הליך הרכישה.

עבור סטימצקי, אחת מרשתות הספרים הגדולות והמוכרות ביותר בישראל, לא מדובר בפעם הראשונה שהאתר קורס ברגע האמת. בקיץ 2019 הכריזה הרשת על מבצע לזמן מוגבל בו כל הספרים באתר יימכרו ב-20 שקלים. גם אז האתר קרס והשאיר את הלקוחות מבולבלים. אז מיהרה הרשת להגיב בהארכת המבצע והענקת הטבות מיוחדות למי שלא הצליח לממש את המבצע. בתגובה מסרה אז החברה כי לא ציפתה לכמות כל כך גדולה של כניסות "וכתוצאה מכך האתר קרס". כעת, שש שנים לאחר מכן ובחגיגות עשר השנים לאתר האונליין של הרשת, ההיסטוריה חזרה על עצמה.

כמו לעשות ארוחה גדולה, אבל לא לקנות מצרכים

המקרה של סטימצקי הוא דוגמה קלאסית לעומס תעבורה חריג ומהיר, מצב שבו האתר מקבל פרץ כניסות בזמן קצר, הרבה מעבר ליכולת התשתית הרגילה ומוביל לקריסת האתר. זה יכול לקרות בגלל מבצע חד פעמי של רשת ספרים, או באתר אוניברסיטאי ביום הרשמה לקורסים או בפתיחה של מכירת כרטיסים להופעה מבוקשת. במקרים מסוימים, התופעה מזכירה במבנה שלה מתקפת DOS או DDOS, אבל המקור לטראפיק הוא גולשים רגילים ולאו דווקא האקרים. כדי להבין איך אפשר להיערך לאירועים כאלה ואיפה הרבה עסקים נופלים בדרך, שוחחנו עם מאיר גרינברג, IT and Security manager ומומחה בליווי ארגונים במצבי עומס ותקלות תשתית.

"הדבר הראשון שצריך לשאול כשהאתר נופל בגלל עומס גולשים, כמו שאנחנו מניחים שקרה במקרה של סטימצקי מכיוון שלא דווח על תקיפת סייבר נגדם, הוא האם המבצע תוקשר לאנשי ה-IT והאבטחה, כדי שיכינו את התשתית לכמות הגולשים הגבוהה שאמורה להגיע?", מסביר גרינברג. לדבריו, הסיטואציה דומה לארוחת חג אליה מוזמנת כל המשפחה המורחבת, אבל שוכחים לעדכן את מי שאחראי על הבישולים, "מן הסתם, כשצופים עומס חריג צריך להיערך אחרת" הוא אומר.

לדברי גרינברג, אם המקרה תוקשר לצוותים הרלוונטיים, הם היו צריכים לבצע אנליזה על מבצעים קודמים שערכו בחנות האינטרנטית כדי להבין מה הצפי שלהם לגידול בתנועה באתר: "יכול מאוד להיות שהם העריכו שיהיה פיק של כמה שעות אבל טעו בהערכת הגודל האמיתי שלו".

כשמתכוננים למבצע מסדר גודל שכזה, כל רכיב במערכת שמושפע מהתעבורה החריגה צריך להיבדק וזה לא משנה אם מדובר ברשת ספרים, חנות לכלי בית או אפילו ChatGPT. אחרי הכל, גם כשאפל משיקה גרסת iOS חדשה נתקלים לא פעם המשתמשים באיטיות ותורים. וזו אפל הגדולה: "תמיד צריך לוודא שרוחב הפס מספיק ושיש תשתית גמישה שתקלוט את התנועה החריגה. בנוסף חשוב לוודא מראש את זמן התגובה של המערכת – האם מחכים שהאתר ייפול ואז מגלים את הבעיה, או שהמערכת מתריעה כשהיא מגיעה לקיבולת כמעט מקסימלית? איתור מוקדם, שמאפשר פעולה מונעת לקריסה, יכול לעשות את כל ההבדל".


כל עדכוני ה-IT, תשתית וטכנולוגיה בערוץ הטלגרם של ITtime


אל תתנו ללקוחות לגלות לבד

מה זה אומר להיות "מוכנים" מבחינה טכנית?
"כל רכיב במערכת שיכול להיות מושפע מהתעבורה צריך להיבדק. זה נכון לסטימצקי, וזה נכון גם לשירות הרשמה לקורסים או אפילו ל-ChatGPT. במקרה של סטימצקי לא צריך GPUים בכמות של OpenAI, אבל כן צריך לוודא שרוחב הפס מספיק ושיש תשתית גמישה לקלוט את הפיק. מעבר לזה, חשוב לחשוב על זמן התגובה: האם מחכים שהאתר ייפול כדי לגלות את הבעיה, או מזהים כשהמערכת ב-80-90% עומס? איתור מוקדם מאפשר לפעול לפני הקריסה".

כאמור, מי שדיווחו על נפילת האתר בעת המבצע היו דווקא הגולשות והגולשים בחשבונות הסושיאל של הרשת. עם זאת, כיאה לחובבי ספרים, התגובות לא התלהמו או הידרדרו לשפה לא נאותה, אבל חוסר שביעות הרצון היה מודגש. אם לשפוט על פי התגובות, חלק מהלקוחות חוו את התקלה עוד בשלב הכניסה לאתר שנמנעה מהם, אבל מי שכבר הצליחו להיכנס, גילו כי הם לא יכולים להשלים את הרכישה. על כך גרינברג טוען כי "הפער בין לגלות את התקלה לבד ולדווח עליה מיידית, לבין לתת ללקוחות שלך לגלות אותה לבד, הוא משמעותי. הודעה ללקוחות יכולה למנוע סנטימנט שלילי ולתת להם להבין שיש מי שרואה אותם".

תמונה: צילום מסך מתוך אינסטגרם.

"בנוסף, בסטימצקי חייבים לקיים הפקת לקחים מהאירוע. לבדוק כמה ניסיונות כניסה היו לאתר מרגע שקרס ועד שחזר למשל, כדי להבין את ההפסד העסקי שלהם מהתקלה. הם גם יהיו חייבים להבין איך להיערך למבצע הבא כך שהטעות לא תחזור".

פנינו לרשת סטימצקי בבקשה להתייחסות לאירוע, וביקשנו לדעת האם המהלך תואם מראש עם צוותי ה-IT והאבטחה, אילו צעדים ננקטו להכנת האתר לעומס, מה היה זמן התגובה לקריסה, והאם התקלה השפיעה גם על מערכות נוספות. כמו כן, שאלנו האם בוצעה הפקת לקחים וכיצד זוהתה התקלה בפועל. תגובתם לא התקבלה עד למועד פרסום הכתבה ותובא לכשתתקבל.

משרות פתוחות

קטגוריות

זה המקום להכיר את החברות, המשרדים וכל מי שעושה את ההייטק בישראל (ויש גם מלא משרות פתוחות!) #תוכן מקודם