Artykuły
Narzędzia do analizy danych – porównanie pod kątem uniwersalnego zastosowania i ceny
Dane w dzisiejszych czasach są cenniejsze niż złoto. Coraz częściej możemy spotkać się z tym stwierdzeniem. Każdego dnia rejestrujemy i przetwarzamy ogromne ilości danych. Musimy jednak pamiętać, że same dane niewiele mówią o otaczającym nas świecie – musimy nauczyć się je odpowiednio interpretować i wyciągać wnioski. Każda organizacja, która w mniejszym lub większym stopniu przetwarza dane potrzebuje do tego odpowiednich narzędzi. Dzięki rozwojowi technologii chmurowych i ze względu na coraz większe znaczenie danych, pojawiają się nowe narzędzia, które umożliwiają ich przetwarzanie. Zdaniem ich twórców są one nie tylko atrakcyjne cenowo, ale też uniwersalne i mogą być z powodzeniem używane w każdej organizacji. Czy rzeczywiście tak jest? Postanowiliśmy sprawdzić to w poniższym artykule.
Skupiliśmy się głównie na narzędziach analitycznych umiejscowionych w chmurach publicznych: Microsoft – Azure, Amazon – AWS, Google – GCP i Oracle – OCI. Ze względu na dużą rozpiętość funkcjonalności skupiliśmy się na kilku wybranych;
- Połączenie bezpośrednio z bazami danych
- Wizualizacja danych
- Osadzanie raportów i wizualizacji
- Eksport danych z raportu do MS Excel
- Możliwość definicji cyklicznego generowania raportów i ich wysyłki pocztą elektroniczną email
Na tej podstawie wybraliśmy następujące narzędzia w poszczególnych chmurach:
- MS Azure – Power BI
- OCI – Oracle Analytics Cloud (OAC)
- AWS – QuickSight
- GCP – Data Studio i Looker
Przeprowadziliśmy również analizę kosztów dla scenariuszy referencyjnych dla jednego z najpopularniejszych narzędzi analitycznych niezależnych od chmury – Tableau. Chcieliśmy w ten sposób jeszcze lepiej ukazać skalę kosztów w poszczególnych chmurach.
Scenariusze referencyjne
W celu porównania kosztów używania usług analitycznych i raportowych zdefiniowaliśmy 6 scenariuszy, dla których następnie wykonane zostaną szacunkowe wyceny. Dodatkowo przeanalizowaliśmy każdą z 6 możliwości w dwóch opcjach – wykupienie licencji dla każdego użytkownika końcowego korzystającego z analityki lub wykupienie wspólnej puli licencji/pojemności, z której korzystać może dowolna liczba użytkowników.
Jako założenie ogólne dla wszystkich scenariuszy przyjęliśmy:
- Kursy walut:
- Opublikowane na stronie NBP z dnia 21.12.2021:
- 1 EUR = 4,6238
- 1 USD = 4,0937
- Opublikowane na stronie NBP z dnia 21.12.2021:
- Pojedynczy raport – zajmuje ok 10kB i liczy ok 120 rekordów
- Porównywalny jest miesięczny koszt utrzymania danego narzędzia w PLN.
Charakterystyka poszczególnych narzędzi
Microsoft Power BI
- Popularność
- Obszerna dokumentacja
- Bezpłatna aplikacja desktopowa
- Możliwość połączenia z pakietem MS Office
- Konieczność wykupienia pojemności Azure w scenariuszu osadzania analityki dla Klientów
- Wymagana droższa licencja dla twórców raportów tzw. „pixel perfect”
- Koszt pojemności Azure zależny od czasu włączenia a nie od wykonywanych operacji
Oracle Analytics Cloud
- Integracja z Oracle i bazami na bazie SQL
- Bezpłatna aplikacja desktopowa
- Bezpłatna aplikacja desktopowa
- Tańsze Oracle CPU
- Możliwość wykupienia pojemności Oracle w scenariuszu Bring Your Own Licence (BYOL)
- Wymagana droższa licencja dla twórców raportów tzw. „pixel perfect”
- Koszt pojemności Oracle zależny od czasu włączenia a nie od wykonywanych operacji
- Licencje wliczone w pojemność Oracle
- Stosunkowo drogie licencje Enterprise
Amazon QuickSight
- Integracja z bazami na bazie SQL
- Wykorzystanie liczone per sesja użytkownika – jak nie korzystasz to nie płacisz
- Niewielka maksymalna cena licencji na użytkownika – czytelnika
- Zniżki przy subskrypcji rocznej
- SPICE – bufor pamięciowy dla danych
- Wymagana droższa licencja dla twórców raportów tzw. „pixel perfect”
- Wymagana droższa licencja do osadzania analityki w aplikacjach zewnętrznych
Google Looker
- Integracje ze źródłami danych i personalizacja
- Dobry kontakt z konsultantami
- Mało dokumentacji, niezbędne wsparcie konsultantów Looker
- Bardzo wysoki koszt dostępu do platformy
- Wysokie koszty licencji dla dodatkowych użytkowników
Google Data Studio
- W pełni darmowy!
- Brak wbudowanego connectora do baz danych Oracle
- Brak możliwości konfiguracji tzw. Raportów „pixel perfect”
- Brak oficjalnego wsparcia Google
Google Data Studio + Skyvia Data Integration
- Stosunkowo niedrogie połączenie
- Obsługa wszystkich baz danych na bazie SQL
- Brak możliwości konfiguracji tzw. Raportów „pixel perfect”
- Brak oficjalnego wsparcia Google
Google Data Studio + Analytic Canvas
- Obsługa raportów tzw. „pixel perfect”
- Obsługa wszystkich baz danych na bazie SQL
- Stosunkowo drogie licencje dla dodatkowych użytkowników
Tableau
- Popularność
- Niezależny od chmury
- Możliwość wykorzystania własnej infrastruktury
- Mało dokumentacji, niezbędne wsparcie konsultantów Tableau
Porównanie kosztów realizacji poszczególnych scenariuszy w wybranych narzędziach:
Wnioski
Jak wynika z powyżej tabeli, niezależnie od wybranego scenariusza koszt implementacji Looker’a jest znacznie wyższy niż pozostałe rozwiązania. Z tego względu został wykluczony z dalszych analiz. Widzimy, że scenariusze zakładające wykorzystanie licencji zawierających mniej funkcjonalności są zdecydowanie tańsze. Najkorzystniej pod względem finansowym przedstawia się rozwiązanie na bazie Google Data Studio. Darmowa licencja zakłada również ograniczoną liczbę funkcjonalności. Przy większej liczbie użytkowników koszt platformy Oracle (OAC) w scenariuszu licencji na użytkownika staje się dużo droższy od konkurencji, przy czym jest to jedyna platforma, która pozwala zmniejszyć koszty pojemności, w przypadku, gdy posiadamy już licencje na OAC.
Koszty według poszczególnych scenariuszy
Analizie poddaliśmy sześć różnych scenariuszy z następującymi założeniami:
Scenariusz pierwszy
- średni ruch w tygodniu (50 użytkowników),
- średni ruch w weekendy (50 użytkowników),
- ograniczone funkcjonalności
- Najtańsza opcja – GCP podstawowa – 0 zł
- Najtańsza opcja poza GCP – AWS licencja na użytkownika – 1 142,14 zł
- Najdroższa opcja – GCP z licencją na użytkownika dla dodatku Analytic Canvas – 11 052,99 zł
- Średni koszt – 3 003,82 zł
- Mediana kosztu – 2 414,07 zł
Scenariusz drugi
- średni ruch w tygodniu (50 użytkowników),
- mały ruch w weekendy (25 użytkowników),
- ograniczone funkcjonalności
- Najtańsza opcja – GCP podstawowa – 0 zł
- Najtańsza opcja poza GCP – AWS licencja na użytkownika – 1 338,64 zł
- Najdroższa opcja – GCP z licencją na użytkownika dla dodatku Analytic Canvas – 11 454,17 zł
- Średni koszt – 3 036,94 zł
- Mediana kosztu – 2 400,86 zł
Scenariusz trzeci
- duży ruch w tygodniu (75 użytkowników),
- mały ruch w weekendy (25 użytkowników),
- lepsze funkcjonalności
- Najtańsza opcja – GCP podstawowa – 0 zł
- Najtańsza opcja poza GCP – AWS licencja na użytkownika – 3 528,77 zł
- Najdroższa opcja – OAC z licencją na użytkownika – 24 616,96 zł
- Średni koszt – 6 793,44 zł
- Mediana kosztu – 5 002,50 zł
Scenariusz czwarty
- duży ruch cały tydzień w godzinach roboczych (75 użytkowników),
- minimalny ruch poza godzinami roboczymi (10 użytkowników),
- lepsze funkcjonalności
- Najtańsza opcja – GCP podstawowa – 0 zł
- Najtańsza opcja poza GCP – AWS licencja na użytkownika – 3 389,58 zł
- Najdroższa opcja – OCI (OAC) z licencją na użytkownika – 24 616,96 zł
- Średni koszt – 7 637,17 zł
- Mediana kosztu – 4 891,97 zł
Scenariusz piąty
- mały ruch całą dobę (25 użytkowników),
- lepsze funkcjonalności
- Najtańsza opcja – GCP podstawowa – 0 zł
- Najtańsza opcja poza GCP – AWS licencja na użytkownika – 1 621,11 zł
- Najdroższa opcja – OCI (OAC) z licencją na użytkownika – 9 783,66 zł
- Średni koszt – 3 622,11 zł
- Mediana kosztu – 2 185,83 zł
Scenariusz szósty
- Bardzo duży ruch całą dobę (100 użytkowników),
- lepsze funkcjonalności,
- duży ruch cały tydzień,
- tylko licencje na użytkowników/sesje
- Najtańsza opcja – GCP podstawowa – 0 zł
- Najtańsza opcja poza GCP – AWS licencja na użytkownika – 4 552,19 zł
- Najdroższa opcja – OCI (OAC) z licencją na użytkownika – 32 822,62 zł
- Średni koszt – 9 061,26 zł
- Mediana kosztu – 5 970,66 zł
Podsumowanie scenariuszy
Scenariusze zakładające ograniczone funkcjonalności – 1 i 2 oraz z niewielką liczbą użytkowników wypadają korzystniej pod względem finansowym. Mediana kosztu to około 2 400 zł, a średnia kształtuje się na poziomie 3 220 zł. W przypadku bardziej rozbudowanych funkcjonalności cena wzrasta dwukrotnie. Mediana kosztów dla scenariuszy 3, 4 i 6 to 5 002,50 zł a średnia natomiast 7 830,62 zł.
Jeżeli przy wyborze narzędzia analitycznego kierujemy się ceną, najkorzystniejszym narzędziem okazuje się Google Data Studio. Nawet jeżeli rozbudujemy je o dodatki pozwalające na obsługę baz Oracle. Jeżeli jednak chcemy poszerzyć funkcjonalności GCP o wszystkie zalety Analytic Canvas udostępniając narzędzie wszystkim użytkownikom – takie rozwiązanie jest jednym z najdroższych w każdym scenariuszu.
Analizie poddaliśmy również koszty w poszczególnych narzędziach
Azure Power BI
- Najtańsza opcja – Scenariusz nr 1 – licencje na użytkownika –1 788,13 zł
- Najdroższa opcja – Scenariusz nr 4 –licencje na pojemność – 13 369,63 zł
- Średni koszt:
- Na użytkownika – 3 962,91 zł
- Na pojemność – 7 612,98 zł
- Mediana kosztu:
- Na użytkownika – 3 770,51 zł
- Na pojemność – 6 726,15 zł
W każdym scenariuszu wariant wykupienia osobnych licencji dla każdego użytkownika wydaje się korzystniejszy. Jednak, jeżeli chcemy wdrażać analitykę jako część zewnętrznych aplikacji – jako analityka osadzona – jesteśmy zobligowani do wariantu wykupienia dużo droższej pojemności Azure.
Oracle Analytics Cloud (OAC)
- Najtańsza opcja – Scenariusz nr 2 – licencje na pojemność – 1 866,54 zł
- Najdroższa opcja – Scenariusz nr 6 – licencje na użytkownika – 32 822,62 zł
- Średni koszt:
- Na użytkownika –16 389,55 zł
- Na pojemność – 5 911,42 zł
- Mediana kosztu:
- Na użytkownika – 17 200,31 zł
- Na pojemność – 5 701,38 zł
W przypadku analityki w chmurze Oracle w każdym porównywanym scenariuszu opcja na pojemność jest tańsza. Najwyraźniej jest to widoczne przy dużej liczbie użytkowników korzystających z droższych licencji.
AWS QuickSight
- Najtańsza opcja – Scenariusz nr 1 –licencje na użytkownika – 1 142,14 zł
- Najdroższa opcja – Scenariusz nr 6 – licencje na pojemność (tutaj – licencje dowolnie dysponowane) – 8 945,55 zł
- Średni koszt:
- Na użytkownika – 2 595,41 zł
- Na pojemność – 5 150,69 zł
- Mediana kosztu:
- Na użytkownika – 2 505,34 zł
- Na pojemność – 4 699,57 zł
W przypadku chmury AWS koszty są w większości zbliżone. W każdym scenariuszu bardziej opłacalną opcją jest wykupienie licencji dla każdego użytkownika korzystającego z analityki niż wykupienie pakietu licencji, którymi można dowolnie dysponować.
Google Data Studio
- Najtańsza opcja – każda implementacja czystego Google Data Studio bez dodatków
- Najdroższa opcja – Scenariusz nr 6 – implementacja GDS z licencją na Analytics Canvas dla każdego docelowego użytkownika – 21 483,74 zł
- Średni koszt:
- GDS –0 zł
- GDS + SDI – 912,90 zł
- GDS + AC pojemność (licencja tylko dla aplikacji) – 1 257,45 zł
- GDS + AC użytkownicy (licencja dla każdego użytkownika) – 13 861,27 zł
- Mediana kosztu:
- GDS – 0 zł
- GDS + SDI – 605,87 zł
- GDS + AC pojemność (licencja tylko dla aplikacji) – 1 224,02 zł
- GDS + AC użytkownicy (licencja dla każdego użytkownika) – 13 861,27 zł
Google Data Studio wydaje się z dalszym ciągu być najkorzystniejszą finansowo opcją. Jednak obsługa bazy danych Oracle wymaga dokupienia dodatkowego connectora, a raportowanie wg tzw. Raportów pixel perfect wymaga dodatkowych licencji, np. na Analytic Canvas. Przy założeniu, że wykupienie tych funkcjonalności jest niezbędne i wykorzystaniu ich przez dużą liczbę użytkowników może okazać się drogim rozwiązaniem.
Tableau
- Najtańsza opcja – Scenariusz nr 5 – licencje Server (własna infrastruktura) – 1 850,35 zł
- Najdroższa opcja – Scenariusz nr 6 – licencje Online (infrastruktura Tableau) – 6 599,04 zł
- Średni koszt:
- Server – 3 541,05 zł
- Online – 4 347,51 zł
- Mediana kosztu:
- Server – 3 549,24 zł
- Online – 4 357,74 zł
W przypadku Tableau koszty w ramach różnych scenariuszy są względnie stabilne i zależą mocno od liczby licencji dla użytkowników. Najwyraźniej pokazuje zestawienie scenariusza 5 i 6. Koszt w wersji licencji Server, jest niższy. Jednak w tej wersji to zamawiający jest odpowiedzialny za infrastrukturę, różnica nie jest tak znacząca, po uwzględnieniu dodatkowych kosztów było to nadal najatrakcyjniejsze rozwiązanie.
Podsumowanie wg narzędzi
Najtańszym narzędziem jest Google Data Studio nawet z implementacjami dodatkowych connectorów do baz Oracle. Po rozszerzeniu analityki w modelu dla każdego użytkownika jego atrakcyjność cenowa spada. Na kolejnym miejscu plasuje się AWS i Azure w modelu licencji na konkretnego użytkownika oraz Tableau. Chmury w scenariuszach wykupu określonych pojemności są droższymi opcjami, a najdrożej wychodzą koszty licencji na AC w GCP i OAC w OCI.
Miesięczny koszt utrzymania narzędzi analitycznych w zależności od scenariusza takiego narzędzia wahał się w przedziale od 0zł (GDS) aż do prawie 44 000 zł (Looker). W badanych przypadkach okazało się, że próg ok 1 500 zł miesięcznie jest minimalnym kosztem, który musimy ponieść, jeżeli chcemy jedno kompleksowe narzędzie analityczne. Darmowe narzędzia – jak Google Data Studio, oferują zdecydowanie mniej niż ich płatne odpowiedniki a dodatkowo mogą wymagać dodatkowej integracji z innymi narzędziami.
Przed podjęciem decyzji o wyborze narzędzi warto dokładnie przeanalizować potrzeby naszej organizacji i zestawić je z możliwościami dostępnych rozwiązań. Najkorzystniejszym rozwiązaniem jest kontakt z ekspertami Sygnity. Konsultacje z profesjonalnym doradcą pozwolą na dobranie narzędzia o funkcjonalnościach dopasowanych do indywidualnych potrzeb.