ניהול תקלות (Incident Management)

ידע הוא כוח, וכאשר מדובר במתן מענה מקצועי ומהיר, ידע הוא זמן, וזמן כידוע, שווה הרבה כסף. הנה כמה טיפים שיעזרו לכם לחסוך זמן יקר.

זמן התיעוד

כל נציג שירות מתחיל יודע שאת מרבית התקלות ניתן למיין לספר מקרים בודדים שחוזרים על עצמם כל הזמן, ורק מקצתם הם ביזאריים ומורכבים ודורשים חקירה יסודית. עם זאת, בארגונים רבים אנו מוצאים כי למרות שפתרון התקלה הוא לרוב פשוט, משך התיעוד אורך זמן רב מדי והטכנאי מוצא את עצמו מתלבט פעם אחר פעם כיצד לבחור נכון את הרכיב התקול או את סיבת השורש, רמות הדחיפות וההשפעה הנכונות. הנה כמה המלצות שימושיות:

1. רשימות – יש לוודא שהרשימות (למשל: רשימת המערכות ורכיביהן) מתוכן בוחר הטכנאי הן עדכניות ומדויקות ובנויות בצורה שקל להתמצא בהן.

2. הדרכות – מומלץ לבצע הדרכת ריענון לטכנאים אחת לתקופה על אופן התיעוד המצופה (לדוגמה: יש להדגיש את ההבדל בין הרכיב התקול לבין סיבת השורש), כולל טיפים לשימוש יעיל (לדוגמה: יש לבחור קודם את המערכת, ואז לבחור מתוך רשימה מצומצמת יותר את הרכיב המדויק).

3. טבלת תיעוד – כדאי להכין טבלה פשוטה המסכמת את עשרת סוגי התקלות הנפוצים ביותר ואופן תיעודם (שורה לכל סוג תקלה, עמודה לכל שדה שנדרש להזין) ולהצמיד אותה לשולחן או ללוח, בסמוך לעמדת המחשב של הטכנאי. אחרי פעמים בודדות של שימוש בטבלה, הטכנאי כבר יזכור בעל פה את אופן התיעוד הנדרש. טבלה מסוג זה גם תמנע בלבול ותבטיח אחידות בתיעוד בין כל הטכנאים באותה מחלקה.

4. אוטומציה – מומלץ להסתייע בתהליכים אוטומטיים (למשל: תהליך אוטומטי שפותח תקלות על בסיס אירועים מתוך תשתית שו”ב) לתיעוד. מנגנון אוטומטי שכזה יכול לחסוך זמן תיעוד יקר ואף לשפר את רמת הדיוק (למשל: הזנת זמני הזיהוי והתקינות של תשתית שו”ב כבסיס לחישוב משך התקלה), כך שלעתים כל מה שנותר לטכנאי לעשות הוא לקבוע את סיבת השורש, לאחר שכל שאר הפרטים הטכניים כבר הוזנו על ידי המנגנון האוטומטי.

5. תבניות – במרכבית המערכות ניתן להגדיר תבניות לקריאות, שבהן כל השדות “הטכניים” למילוי כבר הוגדרו, ואז כל שנותר לטכנאי לעשות, הוא לזהות את מהי התבנית הנכונה להשתמש מה. לא ניתן להכין תבנית לכל מקרה קצה שיכול לצוץ, אך הכנת התבנית תסייע להתמודד את הרוב הגדול של המקרים, שכאמור חוזר על עצמו.

זמן הטיפול

זמן הטיפול בתקלה הוא יקר וכאשר מדובר בתקלות מורכבות אין תחליף למומחיות ולניסיון של הטכנאי. עם זאת, קיימות מספר דרכים בהן נוכל לקצר את זמן הטיפול, או לפחות לנהל נכון יותר את משאב הזמן:

1. מאגר תקלות ידועות (Known Error Database; KEDB) – מומלץ כי בהישג ידו של כל טכנאי יהיה מאגר ובו פירוט של כל התקלות הנפוצות, דרכי זיהוין, דרכי פתרונן ואף אופן התיעוד הרצוי שלהן. מאגר מעין זה יכול להיות כלי עזר רב עוצמה בתנאי שהוא נשמר עדכני. לשם כך מומלץ למנות את אחד הטכנאים או נציגי השירות הוותיקים שיהיו אחראים על תחזוקתו ולהגדירו כמנהל ידע (Knowledge Manager). בנוסף, מומלץ לשלב במסגרת כל פרויקט חדש שלב של עדכון המאגר על מנת להבטיח שלא נעשים שינויים במערכת או בתשתית הטכנולוגית מבלי לעדכן את המאגר כחלק מעדכון צוותי התמיכה. מומלץ כי המאגר יתממשק למערכת ניהול השירות, כך שכבר לפי הסימפטום (בתקלה/בעיה) או הקטגוריה (בבקשות), יוצעו לטכנאי פתרונות אפשריים ונהלי עבודה מתוך המאגר, ממוינים לפי תדירות השימוש בהם או לפי מספר הצפיות בהם.

2. מערכת ניהול תצורה (Configuration Management System; CMS) – מערכת זו משמשת כעין “מפה” טכנולוגית המאפשרת לכל טכנאי להתמצא בסבך המערכות והרכיבים ולזהות ולאבחן בקלות רבה יותר את הגורם לתקלה. מומלץ לשלב אותה בתוך מערכת ניהול השירות (Service Management system; SMS) כך שלפי פריט התצורה (Configuration Item) התקול תוצג מפת הקשרים שלו עם רכיבים נוספים, כך שניתן יהיה לדלג מרכיב לרכיב עד איתור הגורם המקורי. שילוב בין מערכת ניהול התצורה למערכת ניהול האירועים (Event Management System) יכול לסייע בקביעת עדיפות לאירועים ותקלות הנובעות מהם, שכן מערכת ניהול התצורה יכולה להכיל גם קשרים בין המערכות לשירותים השונים ויעד הזמן לטיפול (SLT) ייקבע בהתאם לאמנת השירות הקשורה לשירות המושפע מהרכיב התקול.

3. רובוטים – בעת האחרונה הולך ומתרבה השימוש במערכות אוטומציה שונות, שלא רק יודעות לזהות אירועים אלא גם לפתור אותם בעצמן על ידי אלגוריתם קבוע מראש. מערכות אחרות יכולות להציע מענה אוטומטי ללקוחות ולתפקד הלכה למעשה כ”נציג שירות וירטואלי” (על ידי אבחון הודעת שגיאה שעליה דיווח המשתמש). שימוש ברובוטים מעין אלו הולך ותופס כיום נתח הולך וגדל מנפח התקלות, כך שהדבר מותיר בידי הטכנאים ונציגי השירות את התקלות המורכבות יותר הדורשות יותר חשיבה. מגמה זו כבר משפיעה על תהליכי גיוס והכשרת כוח אדם בארגונים טכנולוגיים.

לסיכום, באמצעות שיטות שונות של ניהול הידע הטכנולוגי, תהליכים אוטומטיים ותשתית טכנולוגית מתאימה, ניתן לטפל ביותר תקלות ובקשות עם פחות טכנאים. עם זאת, יודגש כי לפי שיטת ITIL הדרך הטובה ביותר לחסוך זמן יקר היא למנוע מן התקלות להתרחש מלכתחילה, וזאת ניתן לעשות על ידי יישום נכון של תהליך ניהול הבעיות ותהליך ניהול השינויים.