Prognozowanie jest kluczem do efektywnego zarządzania w wielu dziedzinach gospodarki a dokładne i dostarczone z odpowiednim wyprzedzeniem dane umożliwiają podejmowanie strategicznych decyzji w biznesie.
W naszym zespole na co dzień zajmujemy się tematem prognozowania. W tym celu wykorzystujemy jedno z naszych narzędzi – system Sygnity Forecast, który na podstawie zgromadzonych danych generuje prognozy zapotrzebowania na media (takie jak energia, gaz czy ciepło), wykorzystując do tego modele automatyczne klasy ARIMA, sieci neuronowe oraz modele machine learning.
W obecnej sytuacji postanowiliśmy jednak wykorzystać Sygnity Forecast i nasze doświadczenie w pracy z przedsiębiorstwami energetycznymi i przemysłowymi do czegoś innego – zaprognozowania, jak będzie wzrastać liczba potwierdzonych przypadków zachorowań na Covid-19 w Polsce.
Dane
Jedną z istotnych rzeczy w prognozowaniu są dane. Pandemia Covid-19 jest zjawiskiem niezwykle złożonym, na który wpływ ma dużo różnych czynników. Większość z nich jest trudno mierzalna (specyfika kulturowa, mobilność ludności, zastosowane restrykcje i poziom ich przestrzegania). Pozyskanie takich danych w wielu przypadkach, jeżeli w ogóle możliwe, jest bardzo czasochłonne.
Niniejsza analiza ma na celu przedstawienie możliwości wykorzystania systemu Sygnity Forecast do przeprowadzenia szybkiej analizy i wyznaczenia stosunkowo precyzyjnych prognoz, przy zachowaniu niskich kosztów i czasu potrzebnego na wykonanie takiej pracy w tak nietypowej sytuacji jak obecna.
Dlatego w podejściu do prognozowania wzrostu zachorowań postanowiliśmy wykorzystać podobieństwo krzywych zachorowań.
Do analizy wybraliśmy dane na temat skumulowanej liczby zachorowań na Covid-19 od dnia przekroczenia granicy 100 zachorowań w danym kraju. Na podstawie tych danych, przy wykorzystaniu autorskich algorytmów wyszukiwania zmiennych skorelowanych, wybraliśmy kraje o podobnej do Polski charakterystyce zachorowań w ciągu pierwszych 25 dni po przekroczeniu granicy 100 zakażeń. W różnych krajach mógł to być inny dzień. To jedno, proste kryterium pozwoliło nam szybko i efektywnie zidentyfikować kraje w podobnej do nas sytuacji bez wgłębiania się w specyfikę każdego z krajów. Pokazuje to poniższy wykres.