Jak zostać analitykiem danych?

artykuł aktualizowany w maju 2024

Analityk danych, z angielskiego data analyst, a w skrócie DA, to osoba zawodowo tłumacząca język danych na język biznesu. Zajmuje się ona wyciąganiem, przetwarzaniem, definiowaniem i interpretacją danych oraz tworzeniem rekomendacji na ich podstawie. Jest to niesamowicie rosnąca na popularności profesja, szybująca w przeróżnych rankingach jako zawód, na którego będzie jeszcze większe zapotrzebowanie w przyszłości. Wzrost ten jest powodowany przede wszystkim generowaniem coraz większej ilości danych, ale też zauważeniem przez firmy ich ogromnego potencjału oraz znaczącego rozwoju spółek z data-driven organization. Dzisiejszy post przedstawia jakie umiejętności trzeba posiadać, aby zostać DA (a jak interesuje was czym różni się analityk danych od data scientista to zapraszam do tego artykułu).

Kto może zostać analitykiem danych?

Każdy, kto:

  • nie nienawidził matematyki,
  • zna komunikacyjny angielski,
  • chce nim zostać.

 Nie nienawidził matematyki nie znaczy, że ją kochał. Można zostać analitykiem nie będąc orłem z matematyki. Naprawdę. Jeżeli twoje umiejętności liczenia nie plasują się na szarym końcu krzywej Gaussa (czyli z matematyką u Ciebie jest bardzo źle), to w zupełności wystarczy. Oczywiście będziesz w jakimś stopniu korzystał/a z królowej nauk, ale w większości przypadków będą to proste zagadnienia arytmetyczne typu mnożenie, dzielenie, wyliczanie średniej lub mediany. Nie będzie to mnożenie 4-cyfrowych liczb w pamięci czy pisanie od zera algorytmów uczenia maszynowego.

Angielski jest nam potrzebny do nauki, ponieważ 99% materiałów z których będziemy korzystać w trakcie nauki i pracy będzie w tym języku. Angielski jest zresztą językiem biznesu, więc ciężko będzie nam się odnaleźć na rynku pracy bez niego. Jeżeli nie czujesz się dobrze w tym języku, najlepsze co możesz zrobić dla twojej kariery w tym momencie to jego nauka. Angielski jest tak ważny, że popełniłam cały wpis na ten temat.

Co do punktu C to zakładam, że jest on oczywisty, ale mimo wszystko wymieniłam go, aby podkreślić, że jakakolwiek zmiana w naszym życiu wymaga od nas podjęcia jakiegoś wysiłku. W przypadku chęci zostania analitykiem główny wysiłek pójdzie w naukę rzeczy technicznych. Ale nie ma czym się martwić – nauki jest dużo mniej niż myślisz! To jest właśnie powód dlaczego to stanowisko jest tak atrakcyjne – bilans zysków i strat, czyli korzyści finansowe płynące z zatrudnienia vs wysiłek włożony w naukę jest mega korzystny. Podczas gdy wiele osób marzy o tym, żeby zostać programist(k)ą, uważam, że zdecydowanie lepszą opcją dla większości tych osób jest zostanie analitykiem. Wymaga to znacznie mniejszego nakładu pracy, a oferuje podobne korzyści – dużo ofert na rynku pracy, elastyczne warunki zatrudnienia oraz naprawdę dobre zarobki.

Mały dodatek na koniec: oprócz trzech wymienionych wyżej punktów najlepsi analitycy to osoby, które ekscytują się tym co robią – są ciekawi świata i zależności jakie znajdą w danych, otwarci na naukę i próbowanie nowych rozwiązań. Jeżeli zdecydowanie nie jesteś taką osobą, a w pracy szukasz raczej powtarzalności niż wyzwań, to być może warto sobie odpuścić już w tym momencie.

Must have – co trzeba umieć, aby zostać DA

1. Podstawowa wiedza o danych

Dość oczywista kwestia –  zajmując się zawodowo danymi musimy znać podstawowe pojęcia dotyczące danych: podział danych na numeryczne i kategorialne, pojęcia takie jak średnia, mediana, odchylenie standardowe, percentyle, outliery, rozkłady, itd.

Na szczęście tej wiedzy do przyswojenia nie jest niesamowicie dużo, zatem uważam, że nie musimy podejmować w tym celu osobnych kursów. Z większością tych rzeczy obeznacie się podczas kursów dotyczących Excela, SQL czy wizualizacji danych. Zatem lecimy dalej.

2. Arkusze Kalkulacyjne Excela (?)

Kontrowersyjny temat, ponieważ Excela jednocześnie musicie i nie musicie znać. Już spieszę z wyjaśnieniami. Jak wiadomo, firmy na excelu stoją – pracując jako analityk X (pod X podłóż jakiekolwiek słowo oprócz „danych”) prawdopodobnie większość twojej pracy opiera się na tym programie. Być może nawet jako analityk danych pracujesz na excelu. Oczywiście, w takim wypadku program ten staje się twoim głównym narzędziem pracy i musisz mu sprostać, aby spełnić swoje zawodowe obowiązki. Z drugiej strony uważam, że w dobrych firmach analitycy danych nie pracują na excelu (dlaczego wyjaśniam tutaj), a przynajmniej nie jest to ich główne narzędzie służące do codziennej pracy.

No to uczyć się czy się nie uczyć Excela?

Zależy. Jeżeli już jesteś w stanie używać excela w podstawowym zakresie (filtrowanie, sortowanie, proste formuły, funkcje vlookup czy match, tabele przestawne, wykresy), to ja bym mu nie poświęcała więcej czasu.

Z drugiej strony, jeżeli ikonka Excela przyprawia cię o dreszcze i zrobisz wszystko, byleby jej uniknąć, to może warto to zmienić. Tak zresztą było w moim przypadku – przed moją pierwszą pracą jako analityk pricingowy nie potrafiłam zrobić kompletnie NIC w Excelu i było mi z tego powodu strasznie wstyd. Z tego powodu zaczęłam swoją przygodę z nauką analizy od kursu z Excela i absolutnie tego nie żałuje. Stoi też pewnie za tym fakt, że znalazłam fantastyczny kurs na Courserze, który zaczyna się od kompletnych podstaw a kończy na zaawansowanych funkcjach, całkowicie wyczerpując możliwości tego narzędzia. Jest to chyba najlepszy kurs online, jaki robiłam w życiu, i nawet kilka lat po jego skończeniu niczego nie polecam z takim przekonaniem jak własnie jego.

A w sumie to po co w końcu ten Excel?

Sęk w tym, że czasem się przyda. Pracując jako DA nie używałam Excela do samej analizy per se, ale do zadań okołoanalizowych, np. sprawdzania czy wyciągnięte z baz dane mają sens i nie zawierają błędów (czyli coś co będziecie robić prawie codziennie).  Potrzebowałam do tego napisać proste formuły, zagregować dane (SUM, AVG) czy użyć funkcji typu VLOOKUP, MATCH, LEFT.

Zresztą jest coś naturalnego w zaczynaniu uczenia się analizy danych od Excela, ponieważ często jest to pierwszy program jaki używamy do jakiejkolwiek obróbki informacji. Jest on nam znany oraz rozumiemy mniej więcej jak składować w nim dane, przez co w prosty i przyjemny sposób możemy zacząć go używać i powoli budować na nim wiedzę jak postępować z danymi.

3. SQL

W tym punkcie dochodzimy do sedna umiejętności analityka danych. SQL, czyli strukturalny język zapytań (ang. structured query language) jest językiem służącym do komunikacji z bazą danych. Za jego pomocą pisze się tzw. queries (po polsku znane jako kwerendy), czyli zapytania do baz danych pozwalające na wypluciu z nich informacji, które nas interesują. SQL jest językiem ustrukturyzowanym, co znaczy, że mimo iż ma wiele odmian (MySQL, SQLite, PostgreSQL, itd.), są one do siebie na tyle podobne, że umiejąc programować w jednej z nich nie musimy specjalnie uczyć się kolejnej.  

SQL nie jest jak inne języki programowania, typu Python, gdzie możemy za pomocą kodu zaprogramować co nam się żywnie podoba i stworzyć całą aplikację. Służy on tylko i wyłącznie do kontaktu z bazą danych, przez co ma on jasno narzuconą strukturę oraz kolejność wykonywania działań. Te ograniczenia prowadzą nas do jego najlepszej cechy -> jest on dość prosty do nauki.

Zresztą w kilka zdań jestem w stanie opisać zasadę jego działania – musimy tylko zdefiniować co i skąd pobieramy, np. kod:

SELECT name, surname
FROM users
WHERE country = 'pl'

informuje bazę danych, że chcielibyśmy wyciągnąć imię i nazwisko (SELECT name, surname) z tabeli użytkowników (FROM users) od użytkowników z Polski (WHERE country = 'pl'). Każde nasze zapytanie będzie miało podobną formę – zawsze będzie część SELECT definiująca co chcemy pobrać oraz FROM określające z jakiej tabeli chcemy pobrać te dane. Filtrowanie za pomocą WHERE jest opcjonalne.

Jak pewnie poderzewacie, SELECT, FROM i WHERE to nie wszystko – ale uwierzcie mi, naprawdę zostaje niewiele więcej. Czyni to SQL bardzo prostym językiem, który jest w zasięgu nauki większości z was. Znowu wracając do bilansu zysku i strat (wysiłek włożony w naukę vs korzyści) osobiście uważam, że SQL jest najlepszą inwestycją na rynku pracy w obszarze data. Jest on prosty do nauki, a jego znajomość jest sama w sobie wystarczająca, aby zdobyć dobrze płatne stanowisko.

Jak się go nauczyć?

Tutaj niestety nie mam prostej odpowiedzi, tak jak to miało miejsce przy Excelu, ponieważ nie znam jednego kursu dobrze pokrywającego wszystkie zagadnienia. Sama musiałam zrobić kilka przeciętnych kursów, każdy omawiający sprawę z trochę innej strony i ćwiczyć na znalezionych przykładach. Dodatkowo uważam, że aby w pełni zrozumieć SQL należy pojąć podstawy relacyjnych baz danych, których często brakuje w dostępnych kursach. Dlatego przygotowałam na ten temat osobny post: Jak się nauczyć SQL?

4. Wizualizacja danych

Ludzki umysł nie jest zoptymalizowany, aby szybko wyciągać wnioski patrząc na numerki. Widząc wiersze z kwotami podsumowującymi jakieś wartości przypisane do miejscowości nie jesteśmy w stanie szybko ich uszeregować:

Jesteśmy za to w stanie to zrobić widząc kwoty na wykresie:

Od razu widzimy, że Szczecin jest na pierwszym miejscu, a Rzeszów i Lublin na samym końcu.

Ludzki mózg jest przystosowany do porównywania odległości między obiektami, dlatego wykresy słupkowe, mimo iż są nudne, to robią robotę. Z tego powodu wizualizacje, wykresy oraz dashboardy to kolejne po SQL najważniejsze narzędzie DA.

W przypadku nauki wizualizacji danych mówimy o dwóch rzeczach – o teorii i praktyce.

Jako teorię mam na myśli wiedzę jaki wykres jak użyć w jakiej sytuacji, aby służył określonym celom. Teoria to wiedza, że wykres liniowy powinien być używany tylko w przypadku, gdy X reprezentuje oś czasu. Albo, że mózg jest zoptymalizowany do rozpoznawania różnic między odległościami a z objętościami już tak dobrze sobie nie radzi, dlatego wykresy kołowe albo 3D to (zazwyczaj) zły pomysł. W większości przypadków teoria przychodzi wraz z praktyką, dlatego też na niej się skupimy.

Mówiąc o praktyce mam na myśli obsługę programów do wizualizacji danych, typu Tableau, Power BI, Looker itd. Programy te częściowo różnią się między sobą, ale mają też części wspólne. Power BI stał się w ostatnich latach najbardziej popularny, zaraz po nim jest Tableu, zatem polecam naukę tych programów. Jednak mimo wszystko nie jest powiedziane, że na pewno natrafimy akurat na nie w przyszłej pracy, naprawdę różne firmy korzystają z przeróżnych programów, dlatego uważam, że nie ma sensu na nadmiernym skupianiu się tylko na jednym z nich. Lepszym rozwiązaniem na początek jest skupienie się na ogólnej wiedzy dotyczącej obsługi tych programów i zasad dobrej wizualizacji, a na specjalizację oprogramowania przyjdzie czas. Z mojego doświadczenia wynika też, że najwięcej przynosi nam praktyka – dlatego też głównym celem jest przekonanie potencjalnego pracodawcy o jakimkolwiek doświadczeniu z tego typu oprogramowaniem, a ekspertem możemy zostać już po rozpoczęciu pracy. Proponuję zatem zrobić jakieś kursy o Power BI i Tableau, a następnie pobawić się trochę w robienie dashbordów.

Dodatkowe umiejętności techniczne

4 (może 3 poza Excelem) poprzednie punkty to must have. Ciężko mi sobie wyobrazić, że ktoś aplikuje na pozycję DA, a nigdy nie słyszał co to jest mediana, SQL lub dashboard. Istnieją jednak też dodatkowe aspekty z którymi można się spotkać w pracy analityka. Uważam, że aplikując na pierwszą pracę jako DA nie są one wymagane, ale warto mieć chociaż o nich pojęcie i wiedzieć w jakich sytuacjach je się stosuje.

– Testy A/B – z tymi testami jest tak, że albo firmy je namiętnie kochają, albo nie wiedzą o ich istnieniu. Testy to praktyczne wykorzystanie statystyki w biznesie. Pisałam o nich trochę więcej w poście „Jak analizować dane”. Typowym przykładem jest dzielenie klientów na dwie grupy, po czym wyświetlanie nowej funkcjonalności tylko jednej z grup. Następnie wykonuje się testy statystyczne aby sprawdzić czy zachowanie klientów różni się między grupami. Istnieje kilka aspektów technicznych testów A/B, ale najważniejsze jest, aby rozumieć po co się je robi i jak je zaprojektować (dwie grupy muszą istnieć w tym samym czasie). Podczas rekrutacji często pada pytanie np. jak zbadać czy nowa funkcja w aplikacji poprawia zaangażowanie. Ewentualnie gdy znajomość testów A/B jest wyszczególniona w ofercie pracy to można im poświęcić trochę więcej czasu.

– Python  – czasem spotkamy się ze stwierdzeniem w ofercie pracy „python is a plus”. Osobiście uważam, że równie dobrze można by wpisywać „quantum physics is a plus”, no bo przecież ani python ani fizyka kwantowa raczej nie zaszkodzą. Ale o tym co autor miał na myśli publikując ofertę pracy innym razem. Osobiście uważam, że python nie jest wymagany do znalezienia pierwszej pracy w branży, nawet w 2024 gdy konkurencja wśród juniorów jest ogromna. Żeby nie było – uważam, że dobry analityk na poziomie mid/senior potrafi zrobić prostą analizę za pomocą tego języka, ale spokojnie można wejść do branży z samym SQL. Dobrze jest jednak wiedzieć, że gdzie możliwości SQL się kończą tam powinien zawitać Python i być może rzucić oko na przykładową eksplorację danych w Pythonie znalezioną w internecie. A jeżeli dalej cię nie przekonałam, to zapraszam na cały post na ten temat: Nie zaczynaj od pythona.

Umiejętności miękkie

Praca analityka nie polega na zamknięciu się w piwnicy i klepaniu analiz. Robimy to wszystko aby biznes mógł wykorzystać tę wiedzę i podjąć właściwe decyzje oparte na danych. Z tego powodu zawód DA polega na ciągłym łączeniu wymagań biznesowych z technicznymi rozwiązaniami. Aby robić to dobrze, potrzeba szeregu umiejętności miękkich – dobrych zdolności komunikacyjnych, wiedzy biznesowej oraz umiejętności zarządzania projektami.

Komunikacja to naprawdę lwia część pracy analityka. Jest ona obecna na każdym etapie projektu – przed analizą musimy poznać dany problem biznesowy, w trakcie analizy często wyjaśnić szczegóły procesów lub doprecyzować definicje danych, a po analizie przedstawić nasze wyniki, nierzadko w formie mniej lub bardziej oficjalnej prezentacji. Aby dowieść projekt musimy mieć umiejętność słuchania i zadawania konkretnych pytań, pewność siebie przy odmawianiu narzucanych złych rozwiązań i proponowaniu tych optymalnych, umiejętność tłumaczenia języka technicznego dla nietechnicznych ludzi oraz podsumowywania i wyciągania najważniejszych wniosków. W dodatku, aby tego dokonać, musimy cały czas działać tłumacząc sobie z tyłu głowy język biznesu na język danych i vice versa, co wymaga naprawdę niezłych umiejętności biznesowych (i technicznych).

Aby jeszcze bardziej podkreślić znaczenie umiejętności miękkich – moim zdaniem różnica między pozycją juniora, mida i seniora polega w dużej mierze nie na różnicy w zdolnościach technicznych, ale właśnie w kompetencjach miękkich, na przykład w umiejętności zarządzania projektami. Junior to osoba potrzebująca dużo wsparcia od bardziej doświadczonych pracowników w rozmowie z ludźmi i nieumiejąca sama rozłożyć problem biznesowy na czynniki pierwsze. Senior to osoba niezależna, potrafiąca sama dogadać się ludźmi nietechnicznym, przetłumaczyć problem biznesowy na język techniczny, oraz tak zarządzać projektem, aby zakończył się on pomyślnym rozwiązaniem problemu.

Podsumowanie

Analityk danych to osoba łącząca biznes z technologią, która posiada szereg umiejętności technicznych oraz miękkich umożliwiając firmie podejmowanie decyzji na podstawie danych. Zdobycie umiejętności technicznych wymaga od nas tylko (i aż) chęci do nauki – istnieje dużo darmowych kursów i materiałów w internecie, które są w stanie efektywnie przekazać wiedzę wymaganą do rozpoczęcia pierwszej pracy. Zasadnicze umiejętności techniczne to :

  • ogólna wiedza o danych
  • obsługa arkuszy kalkulacyjnych Excela
  • znajomość języka zapytań SQL
  • znajomość programów do wizualizacji danych jak Power BI czy Tableau

Wymagane kompetencje miękkie to komunikacyjność, znajomość biznesu oraz sprawne prowadzenie projektów.

Do znalezienia pracy jako DA nie trzeba posiadać żadnych supermocy, w tym wybitnej wiedzy z matematyki. Nauka wymaganych umiejętności jest w zasięgu większości z nas, a na pewno jest dużo prostsza niż zostanie programist(k)ą.

Jeżeli chcecie by informowani o nowych postach oraz dostawać ekstra materiały dla subskrybentów, to zapraszam do zapisu do newslettera:

keywords: analityk danych, analityk danych co trzeba umieć, analityk danych jak zostać, analityk danych jak zacząć, analityk baz danych, analityk danych co to znaczy, co robi analityk danych, analityk danych co to, analityk danych kurs online, analityk baz danych jak zostać, analityk danych it, analityk danych it kurs online, analityk danych a programista, analityk danych czy warto, analityk danych kurs online, analityk danych zarobki, analityk danych praca, analityk danych praca, analityk danych staż, analityk danych studia, analityk danych bez doświadczenia, analityk danych a analityk biznesowy, analityk danych a data science, analityk danych bez doświadczenia, analityk danych co trzeba umieć, analityk danych co musi umieć, analityk danych ile zarabia, analityk danych junior, analityk danych obowiązki, analiza, analiza danych, analizowanie danych, big data, dane, data analyst, data science, excel, jak zostać analitykiem danych, jak zostać data scientist, kursy, kursy analizy danych, nauka excela, nauka programowania, nauka SQL, podyplomówka, power BI, przebranżowienie, przebranżowienie do IT, SQL, statystyka, tableau, testy AB, testy statystyczne, wizualizacja danych

12 thoughts on “Jak zostać analitykiem danych?”

  1. Pingback: Rozmowa rekrutacyjna – ogólne zasady – Crappy Data

  2. Pingback: Jak się nauczyć SQL? – Crappy Data

  3. Bardzo fajnie napisany post, który rozjaśnia dotąd obcy mi temat. Bardzo dziękuję za przybliżenie zawodu analityka danych, zachęciłaś do szukania dalej!

  4. Część, mam 3 lata doświadczenia jako programistka Java. Zastanawiam się nad analiza danych, bo w programowaniu ilość technologii w jednym projekcie jest dla mnie nie do ogarnięcia (jeden projekt to min kilkanaście technologii). Powiedz proszę jaka ścieżkę powinnam obrać w data science? I czy po podszkoleniu się z SQL (podstawy są) mam szanse na rozmowach i na jakie stanowisko.z góry dzięki.

    1. Cześć! Jeżeli podszkolisz SQL, a przy okazji ogarniesz jakiś program do wizualizacji to możesz celować w stanowisko analityk danych, zresztą od tego stanowiska polecam zaczynać. Jeżeli interesuje Cię data science, to tym się zajmują data scientistci, ale tam dochodzi dużo innych rzeczy, np. python i wiedza o ML, więc ja polecam jednak celować w analityka na początek

  5. Hej, dzięki za ten super pomocny artykuł, trochę mi rozjaśnił i może trochę uspokoił, że to do ogarnięcia wszystko. Mam pytanie, bo czasem widziałam gdzieś w ogłoszeniach, że VBA mile widziane itp. zastanawiam się czy warto temu poświęcać czas? Na razie uczę się SQL krok po kroku, podstawowe statystyczne pojęcia znam ze studiów, excel raczej dobrze ogarniam na takim średniozaawansowanym poziomie, i nie wiem czy powinnam uczyć się tego VBA czy lepiej poświęcić ten czas np. na program do wizualizacji? Przeglądając ogłoszenia wpadam trochę w panikę ile jest tych wymagań nawet na zwykłego juniora, zwłaszcza że nie jestem po studiach ścisłych wiec nie mam jak się wyróżnić…

    1. Dzięki wielkie! Ja nie polecam VBA, napisałam o tym cały artykuł: https://crappydata.pl/2022/01/dlaczego-excel-i-vba-sa-slabe/. Rzeczywiście, firmy na excelu stoją, więc VBA jest wspominane w ofertach, ale moim zdaniem excel i VBA to nie są profesjonalne narzędzia do analizy i lepiej jest od razu inwestować w lepsze narzędzia, bo będziesz miała szanse w lepszych firmach. Więc jak najbardziej celuj w naukę narzędzi do wizualizacji, a nie VBA.

      Co do wymagań – nie przejmuj się, wiem jak to wygląda na początku – ale to tylko tak wygląda, da się przez to przejść 🙂 Po pierwsze ważne jest, abyś wiedziała co jest minimum wejścia do branży i skupiła swoją naukę na tych rzeczach. Jak zaczniesz się uczyć niepotrzebnych rzeczy (np. za dużo informacji o bazach danych czy ETLach), to zmarnujesz czas, który możesz poświęcić na rzeczy istotne (np. silną naukę SQL). Po drugie, trzeba się nauczyć czytać oferty – a one zazwyczaj proszą o więcej niż potrzeba. Pisałam o tym na insta i na fb (https://www.facebook.com/crappydata/posts/153447583818734) – zazwyczaj liczą się umiejętności na samym początku liste, te zaznaczone jako „silnie wymagane”, „must have”, „dobra znajomość” itd. To wszystko co jest „na plus”, „warto mieć”, albo nawet na samym końcu to zazwyczaj liczy się w bardzo małym stopniu albo nie liczy się wcale.

      Ważne też jest, aby się sprzedać – mam artykuły o rekrutacji, mówię też dużo o tym na moim intagramie (https://instagram.com/crappydata) więc zapraszam.

      1. Dzięki za odpowiedź 🤗 obserwuję Cię już gdzie się da, bo Twój content działa na mnie motywująco i podbudowująco 😃

  6. Pingback: Czym zajmuje się DA, DS i MLE? – Crappy Data

  7. Dziękuję za ten wpis 🙂
    Z perspektywy osoby z zewnątrz, czyli spoza DA, jest ona niezastąpionym intro do świata analizy danych.

Leave a Comment

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *