Narzędzia do analizy wiarygodności systemów komputerowych

Od wielu lat Zakład Oprogramowania i Architektury Komputerów Instytutu Informatyki PW realizuje szereg prac naukowo badawczych w zakresie szeroko rozumianej wiarygodności  w systemach komputerowych (ang. dependable computing).

Dziedzina ta obejmuje przede wszystkim problematykę niezawodności, diagnostyki, bezpieczeństwa oraz detekcji i obsługi błędów (sprzętu i oprogramowania).  Zakład ma znaczące osiągnięcia w analizie efektów błędów, opracowywaniu metod ich identyfikacji oraz obsługi. W szczególności w latach 2010-2014 rozwinięto techniki symulacji błędów, metody monitorowania pracy systemów oraz analizy różnych rodzajów logów (zdarzeniowe systemowe i aplikacyjne oraz wydajnościowe).

Na bazie szeregu analiz opracowano oryginalne i efektywne narzędzia wspomagające ww. procesy. Na uwagę zasługują programowe symulatory (SWIFI) błędów pozwalające na wstrzykiwanie różnych klas błędów do rzeczywistych systemów oraz śledzenie propagacji ich efektów jak również ocenę jakości mechanizmów maskowania czy też tolerowania tych błędów.

Opracowane symulatory obejmują różne klasy systemów (wbudowane systemy czasu rzeczywistego, komputery ogólnego przeznaczenia) oraz techniki symulacji. Były praktycznie wykorzystane w kilku projektach (dla Samsung Polska oraz w projekcie współfinasowanym  przez UE w ramach Regionalnego Programu Operacyjnego). Warto podkreślić, że możliwości tych narzędzi są unikalne w skali krajowej i konkurencyjne na forum międzynarodowym.

Pewnym uzupełnieniem tych prac jest rozwinięcie technik monitorowania logów zdarzeniowych oraz wydajnościowych ukierunkowane na detekcję i predykcję awarii systemów. W tym zakresie opracowano szereg narzędzi oraz metod analizy, między innymi opartych na metodach  eksploracji tekstu oraz oryginalnych algorytmach analizy szeregów czasowych.

Rozwinięto algorytmy analizy parametrów wydajnościowych oraz ich korelacji z wybranymi dziennikami zdarzeniowymi jak również techniki badania ataków zewnętrznych. Efektywność tych metod była weryfikowana na różnych systemach, między innymi w ramach dużego projektu SYNAT (baza REPO) czy też projektu współfinasowanego przez Unię Europejską MAYDAY 2012 (współpraca z Politechniką Gdańską).

Istotną cechą ww. prac jest odniesienie ich do rzeczywistych i praktycznych problemów. Ponadto zdobyte doświadczenie i opracowane narzędzia zaowocowały stworzeniem środowiska do realizacji zaawanasowanych badań jak również prac doktorskich.

 

 

   

Środowisko pracy systemu FEETS oraz przykład wykrytej anomalii poprzez monitorowanie mocy procesora.