אחת הדילמות המטרידות ביותר בתהליך ניהול התקלות (Incident Management) עוסקת בתיעוד רטרואקטיבי ואינה מוזכרת באופן רשמי בספרי שיטת ITIL. ככלל, השאיפה היא לתעד את התרחשות התקלות בזמן אמת, ועל סמך הנתונים הנרשמים בזמן אמת. דבר זה מאפשר גם אמינות גבוהה יותר של הנתונים, כי תיעוד אוחר של התקלות עלול להיות לא מדויק, הן בשל שכחה והן בשל האפשרות לטיוב מגמתי של הנתונים. השאלה המתעוררת היא: האם לאפשר תיעוד רטרואקטיבי, לאילו צוותים ובאילו מקרים?

דרישה לתעד זמני טיפול רטרואקטיבית יכולה לנבוע משיטות עבודה ייחודיות של צוותים טכניים מסוימים:

danbert מערכת ניהול אירועים (EMS) ללא ממשק – חלק מהצוותים המנהלים אירועים (Events) ומטפלים בתקלות (Incidents) בזמן אמת מתעדים את התקלה בעיכוב מסוים, מרגע שזוהתה על ידי מערכת ניהול האירועים (Event Management System). ודאי שזמני התחילה והסיום של התקלה המהימנים ביותר מקורם במערכת הניטור, אך בהיעדר ממשק המאפשר דיווח אוטומטי ישירות ממערכת ניהול האירועים (EMS) למערכת ניהול השירות (Service Management System), תמיד יתועדו התקלות באיחור מסוים.

danbert פעילות זמן אמת – ישנם צוותים טכניים שתכליתם ללוות פעילויות מיוחדות באופן צמוד ולתקן תקלות שמתעוררות במהלכן בזמן אמת, כך שאינם מסוגלים להקדיש תשומת לב גם לתיעוד התקלה.

danbert צוותים בשטח – ישנם צוותים שתפקידם לנוע בין אתרים שונים ולתקן תקלות בשטח, כאשר הגורם המשלח (חדר הבקרה) מצוי עימם בקשר טלפוני. בחלק מן הארגונים, אין באפשרות הטכנאים בשטח לתעד את התקלות בזמן אמת בשל שיקולים של אבטחת מידע, ועל כן הם נאלצים לעשות זאת רק בשובם למשרד.

במקרים אלו, ניתן ואף רצוי לאפשר לצוות לתעד תקלות באופן רטרואקטיבי, אך יש לעשות זאת במשנה זהירות, על מנת לשמור על אמינות הנתונים בכללותם. על כן, מתן האפשרות לתיעוד רטרואקטיבי צריך להיעשות תוך הקפדה על הכללים הבאים:

danbert ניהול הרשאות (Access Management) – יש לוודא כי רק לאותם צוותים שבאמת זקוקים לכך יתאפשר תיעוד רטרואקטיבי. הגבלה זו תוכל להבטיח שלא ייעשה שימוש ביכולת זו מעבר לדרוש.

danbert אימות נתונים – יש לאכוף תלויות בין השדות במסכים (לדוגמה: זמן תחילה חייב להיות מוקדם לסיום) ולקחת בחשבון מצבים שבהם רק חלק מן השדות הרטרואקטיביים הוזנו. זאת במטרה למנוע מצבים שבהם מערכת המדידה מחשבת משך תקלה שלילי. חשוב גם לעדכן את נוסחת חישוב משך תקלה ממוצע (MTTR/MTRS) לפי השדות הרטרואקטיביים.

danbert לוגים – תיעוד רטרואקטיבי יכול ליצור פערים בין חישוב משך התקלה הכולל, לבין משך השהייה של התקלה בצוות מסוים או בסטאטוס מסוים. אמנם בחישוב התקלה כולה יש להתחשב בשדות הרטרואקטיביים אולם חישוב משך השהייה של תקלה בצוות מסוים או בסטאטוס מסוים מבוסס בדרך כלל על הלוגים שנרשמים בזמן אמת (פעולות שינוי סטאטוס והעברות בין צוותים) ואותם לא ניתן לערוך רטרואקטיבית. זהו פער שצריך לקחת בחשבון.

danbert צורת דיווח – מומלץ כי לתקלות שתועדו רטרואקטיבית תוגדר צורת דיווח ייחודית, שמבדילה אותן מתקלות “רגילות”, כך שניתן יהיה לדעת בכל רגע בקלות מהו אחוז התקלות שמתועד באופן רטרואקטיבי. זהו נתון שצריך להכיר אותו ולהתחשב בו במסגרת מגבלות המדידה, כאשר מציגים מדדים בשגרות ניהוליות.