גם ענקים קורסים: התקלות המביכות שגרמו לגייטס, ג'ובס וגוגל להסמיק

בתור אנשי IT תקלות הן שגרה, ולא משנה אם המחשב תקוע או שיש סתימה בכיור. זה לא נעים להתמודד עם הלחץ ובטח לא לגלות שהכל קרה בגללכם, אבל גם לגדולים זה קורה ואפשר גם ללמוד משהו מהן

כתב אורח
21.11.24

תמונה: dreamstime

מאת מאיר גרינברג 

בתור אנשי IT לרוב אתם תרגישו לא מוערכים מספיק. כשהכל עובד, מי צריך אותנו? וכשמשהו לא עובד, אפילו אם אין לנו קשר לזה, עדיין באים אלינו ראשונים להתלונן (מי מכם לא קיבל קריאה על בעיה במכונת קפה? נזילה בכיור…).

העבודה במחלקת IT היא עמוסה רוב היום, אבל במקרה של תקלות – שתמיד מגיעות פתאום – הלחץ יכול להקפיא. פתאום מערכת Prod לא עובדת באמצע היום והעובדים מחפשים אותנו בכל ערוצי התקשורת וצפצופים נשמעים מכל מקום – Slack, Teams, Zoom, Whatsapp, יונת דואר, גביעי אשל מחוברים בחוט. העבודה של כולם הכי הכי דחופה, החברה מפסידה המון כסף על כל דקת השבתה כזו ואתם רק צריכים כמה דקות שקט בשביל להבין מה קרה ולפתור את זה. ואז מגיע החלק הכי כואב: אתם מגלים שאתם אשמים בתקלה.

אני בטוח שגם לכם יש עשרות סיפורים, כאלה שחוויתם בעצמכם או סיפורים של קולגות, על איך דבר קטן גרם להשבתה גדולה. שינוי קטן ב-SCCM שגרם לכמה אלפי מחשבי Windows לעבור הפעלה מחדש באמצע היום (וכבר חשבו שמדובר במתקפת סייבר על החברה), כיבוי לא מסודר לאחסון ראשי שגרם למחיקה של המון מידע,  לשכוח לכבות Resource באחד העננים ולהקפיץ את החשבונית החודשית בכמה עשרות אלפי דולרים. נראה לי שכבר הבנתם את הקונספט.

ברור שלא תמיד הכל חלק, זה נכון לכל מקצוע וזה נכון גם לגבי הטובים ביותר, והמשותף הוא שהתקלות תמיד, אבל תמיד, קורות בזמן הכי פחות מתאים.

אם היה לכם שבוע לא טוב, עשיתם פדיחה גדולה או סתם בא לכם להתנחם שזה לא רק אצלכם, הנה שלוש התקלות של הגדולים ביותר, כאלה שכולם ראו אבל רק מעטים עוד זוכרים.

ה-BSOD של ביל גייטס

ב-1998 ביל גייטס הגדול השיק את המערכת החדשנית Windows 98. זה היה אירוע שללא ספק הראה שמיקרוסופט חזק על המפה, שהיא כאן בשביל להישאר ושמערכת ההפעלה החדשה תהיה השימושית ביותר לשנים הקרובות. גייטס ואחד המהנדסים בחברה חיברו את המערכת, הקהל היה כולו במתח לראות את הפלא החדש, ואז הופיע BSOD: Blue Screen Of Death, כלומר קריסה מלאה של מערכת ההפעלה שהשיק:

הקהל צחק והריע לזוג הנבוך, וגייטס הוסיף: that must be why we're not shipping Windows 98 yet. אני יודע מה אתם חושבים עכשיו – נו ברור, הרי זה הפיצ'ר הכי חשוב של ווינדוס; מאז ומתמיד היו קריסות בווינדוס, בלינוקס או באפל זה לא היה קורה. אז זהו שגם זה כבר קרה.

סטיב ג'ובס לא הצליח להתחבר ל-Wi-Fi

ממשיכים במסע שלנו בזמן וצועדים ל-2010. iPhone 4 היה ללא ספק מכשיר פורץ דרך שהביא איתו מספר בשורות לחובבי אפל, כולל Face Time בפעם הראשונה. הוא הושק על במה ענקית של כנס ה-WWDC היוקרתי שנערך בסן פרנסיסקו. במהלך ההשקה, סטיב ג׳ובס הגדול ניסה להציג את הפיצ׳רים החדשים שדורשים חיבור לאינטרנט, אבל הרשת לא זזה.

"אני לא בטוח שאצליח להראות לכם הרבה היום", אמר אז ג'ובס לקהל, "אני מצטער חברים אני לא יודע מה קורה. למישהו יש הצעות?".

המצב היה כל כך קיצוני שג'ובס המשיך בפרזנטיה והציג פיצ'רים אחרים במשך 20 דקות, בתקווה שעד שיסיים אנשי ה-IT באולם יצליחו לחבר אותו לרשת והוא יוכל סוף סוף להציג את הפיצ'ר המדהים של פייסטיים. אנשי ה-IT של אפל בדקו את המצב וראו שיש בחדר 570 מכשירים שמחוברים ל-Wi-Fi. "אנחנו לא יכולים להתמודד עם זה", אמר ג'ובס, ״אם אתם רוצים לראות את הדמו, כבו את הלפטופים שלכם, כבו את כל המכשירים מבוססי ה-WiFi והניחו אותם על הרצפה בבקשה״. כך לאחר כ-30 דקות הוא הצליח להתקשר ולהציג לעולם בפעם הראשונה את שיחת הפייסטיים.

ג'מיני לקח את הזמן

אוקי, כל אלה קרו לפני המון זמן, הטכנולוגיה מתקדמת ממש מהר וב-2024 דברים כאלה לא יכולים לקרות יותר. אז זהו שלא – אולי חיבור לאינטרנט הוא בעיה שקל לפתור, אבל AI הביאה איתה בעיות חדשות לחלוטין.

התחרות בתחום הבינה המלאכותית הייתה בשיאה לאחרונה. מודלים חדשים יצאו לשוק, והשוק אימץ אותם בידיים רחבות. בדצמבר שנה שעברה, באיחור משהו אחרי שיצאו המודלים של OpenAI, Antropic ומטא למשל, גוגל הגדולה הציגה את מנוע הבינה המלאכותית שלה – Gemini. דויד ציטרון, מנהל מוצר בכיר בגוגל, הציג את המוצר שאמור להציג אותה כחדשנית וכמתחרה ראויה בתחום החדש.

הוא צילם מודעה של הופעה, ביקש מג'מיני לבדוק אם הוא פנוי באותו היום להופעה והסביר שהמנוע בודק את היומן וייתן לו את התשובות, אבל – הדמו נכשל. פעמיים ברצף. לפחות הפעם השלישית הצליחה לו.

התקלה הראשונה שלי

עכשיו אני רוצה לדבר רגע על החיים האמיתיים, בסוף אנחנו לא חיים בדמו ובהצגות. אמנם אני לא סטיב ג'ובס, אבל גם אני למדתי משהו חשוב מתקלה שקרתה לי בתחילת הדרך.

בעבודה הראשונה שלי אחרי הצבא, אי שם בשנת 2016, התחלתי ללמוד PowerShell. אני אפילו כבר לא זוכר מה בדיוק ניסיתי לעשות אז, אבל כשהרצתי את זה ״הזזתי״ את כל האובייקטים של מערכת ה-VPN שהייתה אז באותה חברה ל-OU שונה, מה שגרם לכך שמחלקה שלמה לא הייתה יכולה להתחבר מרחוק לארגון.

הטלפון צלצל בלי הפסקה, קריאות נפתחו בלי סוף, דפיקות על הדלת בכל שנייה של עובדים ששואלים למה חברי הצוות שלהם לא יכולים להתחבר. למזלי, חברי הצוות שלי עזרו לי לטפל במקרה ו״להפוך״ את הסקריפט כך שיחזיר את האובייקטים.

היום זה נראה לי משהו שיכול לקרות ואין מה להתרגש מזה, אבל בתור ילד בן 21 זו הייתה חוויה מאוד לא נעימה שהשפיעה ועיצבה את הדרך המקצועית שלי. למדתי כמה דברים חשובים מהמקרה הזה, דברים שעד היום אני מקפיד לשים לב אליהם:

לפני שינוי כלשהו, לא משנה כמה תמים הוא נראה, קחו גיבוי עדכני של המערכת שעליה אתם עובדים.

– רצוי, עד כמה שניתן, לעשות את הדברים קודם בסביבת Test

– תתעדו את כלל הצעדים שאתם עושים

– לפני כל שינוי גדול, תכינו לעצמכם תכנית חזרה לאחור מסודרת (Rollback plan)

– המעשים שלכם משפיעים על כל הארגון, תקשרו את השינוי לגורמים רלוונטיים שעשויים להיות מושפעים

– מכל תהליך – בין שהצליח ובין שהתפקשש – בצעו תהליך הפקת לקחים

– דעו וזכרו שתקלות קורות לכולם. נסו להישאר רגועים ולנהל את הסיטואציה, הרוגע שלכם ישפיע על הלקוחות ועל המהירות שבה תפתרו את הבעיה.

הכותב הוא Global IT Manager @XM Cyber

 

משרות פתוחות

אולי פיספסת

Geektime INSIDER

זה המקום להכיר את החברות, המשרדים וכל מי שעושה את ההייטק בישראל (ויש גם מלא משרות פתוחות!) #תוכן מקודם