RootCoreAI
Kayıt, log ve alarmları analiz ederek olayları akıllıca gruplar.
Sistemdeki tüm kayıtları, logları ve alarmları analiz ederek ilişkili olayları akıllı şekilde gruplar; kök neden analizi yaparak sorunların çözümünü hızlandırır. Aday kök nedenleri açıklanabilir bir kanıt zinciriyle sunar, onaylanan bulguyu 'known error' olarak kaydeder ve kalıcı çözüm için değişiklik talebine zemin hazırlar.
Incident, alarm, log, change ve CMDB sinyallerini tek bir korelasyon çizelgesinde birleştirir.
Olası kök nedenleri güven yüzdesiyle sıralar, en yükseğin kanıt zincirini açıklanabilir biçimde sunar.
Onaylanan kök nedeni 'known error' olarak kaydeder ve kalıcı çözüm için değişiklik talebi açabilir.
Aktif kuyruk ortalaması 12.000 mesaja yakın seyrediyor — eşik bunun çok altında.
CHG-1102 (3 gün önce) bu parametreyi 5000 → 8000'e çıkardı, gerekçesi 'gürültü azaltma'.
Failover alarmı tam eşik anında 09:07'de tetiklendi ama yedek geçiş tetikleyici çalışmadı.
Aynı parametre ile son 7 günde 4 incident yaşandı (INC-2847 + 3 önceki).
Sahnede sentetik kurum ve kayıt verisi kullanılmıştır.
Olay, log, alarm, son değişiklik ve CMDB verisi 20 dakikalık pencere içinde sıralanır.
Sinyaller arası gecikme ve etki yönü modellenir, koreleli olanlar gruplanır.
Etkilenen varlık ve değişiklik geçmişi kullanılarak 3 olası kök neden çıkarılır.
Her aday için ölçüm, log ve geçmiş tekrar oranlarıyla beslenen 4-5 maddelik gerekçe sunulur.
INC-2847 yine posta kuyruğunda biriken mesajla başladı; alarm, log ve incident sinyalleri farklı ekranlardaydı, kimse 3 gün önce yapılmış CHG-1102 değişikliğiyle bağlantıyı kuramıyordu.
RootCoreAI 20 dakikalık pencerede 6 sinyali korele etti, kuyruk geçiş eşiğinin CHG-1102 sonrasında yanlış konfigüre edildiğini %87 güvenle çıkardı; gerekçeyi 4 maddelik kanıt zinciriyle yöneticiye sundu. Kök neden 'known error' olarak kaydedildi, CHG-1148 ile kalıcı çözüm planlandı. Aynı sorun bir daha tekrarlamadı.