כונני HDD קשוחים משחשבתם: נתונים חדשים מטילים ספק במדיניות ה-Refresh בארגונים
דוח חדש של חברת גיבוי הענן Backblaze מראה שהטכנולוגיה התבגרה ויש לזה השפעה על ה-TCO של מערך האחסון כולו

תמונה: dreamstime
בעשור האחרון נדמה היה שכונני ה-SSD ידחקו סופית את הכוננים הקשיחים המסורתיים (HDD): הם מהירים, שקטים ונטולי חלקים נעים. זה אמור היה להיות סוף עידן. אבל המציאות בשטח – בעיקר בתשתיות אחסון של פטה-בייטים – מורכבת בהרבה: נתונים חדשים מראים שכוננים קשיחים חיים היום יותר, נכשלים פחות וממשיכים להיות עמוד תווך מרכזי בגלל יחס עלות-נפח שאין לו תחליף. הטכנולוגיה התבגרה, ויש לזה השפעה ישירה על התקציב שלכם.
"עקומת האמבטיה" כבר לא רלוונטית?
המודל התיאורטי של "עקומת האמבטיה" – כשלים מוקדמים, יציבות ואז קפיצה חדה בכישלונות אחרי 5 שנים – הוא בסיס של כל איש IT ושל מדיניות Refresh Cycle בארגון, וכעת יש מי שמערער עליה. Backblaze, חברת גיבוי ענן המנטרת את הכוננים 24/7, מפרסמת ניתוח מפורט שמבוסס על ניטור רציף של יותר מ-317 אלף כוננים פעילים ומציגה מגמה ברורה: שיעור הכשל השנתי (AFR) נשאר נמוך לאורך שנים רבות.
על פי הדוח, שיעור הכשל הכולל בצי שלהם ירד מכ-1.5% לפני חמש שנים לכ-0.9%, כמעט אפסי, כיום. אבל הנתון המשמעותי ביותר הוא שה-AFR נשמר נמוך באופן מפתיע גם בגיל מתקדם. כוננים שהיו אמורים להיכשל בקצב דו-ספרתי אחרי 7 שנים, מציגים היום AFR של פחות מחמישה אחוזים, ולפעמים אף נמוך יותר. במילים אחרות, הפער בסיכון בין כונן בן 5 לכונן בן 8 כבר לא מצדיק החלפה מיידית.
כל עדכוני ה-IT, תשתית וטכנולוגיה בערוץ הטלגרם של ITtime
מה עומד מאחורי השיפור הזה? בחברה מסמנים שני גורמים קריטיים.
הדור החדש יודע לטפל בעצמו: היצרניות הגדולות (Seagate, WD, Toshiba) שיפרו דרמטית את טכנולוגיות הייצור. הבקרים (Controllers) חכמים בהרבה, אלגוריתמי תיקון השגיאות יעילים בהרבה וחיישני הטמפרטורה והרעידות מאפשרים בקרה אגרסיבית יותר על עומסי עבודה בזמן אמת.
סביבת העבודה משתפרת: בניגוד לעבר, מרכזי נתונים מודרניים (ובארגונים גדולים גם חדרי שרתים מקומיים) מספקים סביבה יציבה מאוד: טמפרטורה קבועה ומדויקת, זרימת אוויר אחידה ושיכוך רעידות. סביבה יציבה פוגעת פחות בחיים המכניים של הכונן. בנוסף, השימוש הנרחב במערכות ניטור מתקדמות (מבוססות AI או ML) מאפשר לזהות מראש כוננים שמתחילים לזייף ולהחליפם לפני קריסה מלאה.

מקור: Blackblaze
חוזרים לתקציב?
היכולת להאריך את מחזור החיים של כונני HDD משנה את Total Cost of Ownership (TCO) של מערך האחסון כולו. אם ניתן לדחות את מדיניות ה-Refresh בשנתיים-שלוש, החיסכון בהוצאות רכישת חומרה חדשה (CapEx) הוא משמעותי ביותר. מעבר לכך, בעולם של פטה-בייטים, שבו ה-SSD עדיין יקר פי כמה לטרבייט, האמינות של ה-HDD מאפשרת לארגונים גדולים (ענן, סטרימינג, ממשל) להשתמש בהם לאחסון ארוך טווח ופחות נגיש, שם יחס העלות-נפח מנצח כל טכנולוגיה אחרת.
אבל חשוב לזכור: הנתונים הללו נכונים לסביבה מנוטרת ואופטימלית (כמו דאטה סנטר). בחדר שרתים של ארגון קטן או בסביבת עבודה עם תנאים פחות יציבים, התמונה עשויה להיות שונה. אבל עדיין יש פה מסקנה חשובה למנהלי IT: תפסיקו להחליף כוננים רק בגלל שהגיעו לגיל 5.
האמינות של היום מחייבת מדיניות שמבוססת על ניתוח פנימי וניטור דקדקני של ביצועי הכוננים שלכם. זה כולל שימוש יעיל בנתוני SMART וניתוח טרנדים של פרמטרים חריגים, יחד עם בדיקות קריאה תקופתיות יזומות. גם כונן שמחזיק שמונה שנים עלול לקרוס ביום אחד, ולכן האמינות הגוברת לא מבטלת את הצורך בגיבוי כפול ובאסטרטגיית התאוששות מאסון (DR). השילוב הנכון הוא להשתמש ב-HDD אמינים וזולים לאחסון המאסיבי (Tier-2/3), ולשמור את ה-SSD המהירים לעומס העבודה הקריטי (Tier-0/1).