Jak zostać analitykiem danych?

Analityk danych, z angielskiego data analyst, a w skrócie DA, to osoba zawodowo tłumacząca język danych na język biznesu. Zajmuje się ona wyciąganiem, przetwarzaniem, definiowaniem i interpretacją danych oraz tworzeniem rekomendacji na ich podstawie. Jest to niesamowicie rosnąca na popularności profesja, szybująca w przeróżnych rankingach jako zawód, na którego będzie jeszcze większe zapotrzebowanie w przyszłości. Wzrost ten jest powodowany przede wszystkim generowaniem coraz większej ilości danych, ale też zauważeniem przez firmy ich ogromnego potencjału oraz znaczącego rozwoju spółek z data-driven organization. Dzisiejszy post przedstawia jakie umiejętności trzeba posiadać, aby zostać DA.

Kto może zostać analitykiem danych?

Każdy, kto:

  • nie nienawidził matematyki,
  • zna komunikacyjny angielski,
  • chce nim zostać.

 Nie nienawidził matematyki nie znaczy, że ją kochał. Można zostać analitykiem nie będąc orłem z matematyki. Naprawdę. Jeżeli twoje umiejętności liczenia nie plasują się na szarym końcu krzywej Gaussa (czyt. z matematyką u Ciebie jest bardzo źle), to w zupełności wystarczy. Oczywiście będziesz w jakimś stopniu korzystał/a z królowej nauk, ale w większości przypadków będą to proste zagadnienia arytmetyczne typu mnożenie, dzielenie, wyliczanie średniej lub mediany. Nie będzie to mnożenie 4-cyfrowych liczb w pamięci czy pisanie od zera algorytmów uczenia maszynowego.

Angielski jest nam potrzebny do nauki, ponieważ 99% materiałów z których będziemy korzystać w trakcie nauki i pracy będzie w tym języku. Angielski jest zresztą językiem biznesu, więc ciężko będzie nam się odnaleźć na rynku pracy bez niego. Jeżeli nie czujesz się dobrze w tym języku, najlepsze co możesz zrobić dla twojej kariery w tym momencie to jego nauka.

Co do punktu C to zakładam, że jest on oczywisty, ale mimo wszystko wymieniłam go, aby podkreślić, że jakakolwiek zmiana w naszym życiu wymaga od nas podjęcia jakiegoś wysiłku. W przypadku chęci zostania analitykiem główny wysiłek pójdzie w naukę rzeczy technicznych. Ale nie ma czym się martwić – nauki jest dużo mniej niż myślisz! To jest właśnie powód dlaczego to stanowisko jest tak atrakcyjne – bilans zysków i strat, czyli korzyści finansowe płynące z zatrudnienia vs wysiłek włożony w naukę jest mega korzystny. Podczas gdy wiele osób marzy o tym, żeby zostać programist(k)ą, uważam, że zdecydowanie lepszą opcją dla większości tych osób jest zostanie analitykiem. Wymaga to znacznie mniejszego nakładu pracy, a oferuje podobne korzyści – dużo ofert na rynku pracy, elastyczne warunki zatrudnienia oraz naprawdę dobre zarobki.

Mały dodatek na koniec: oprócz trzech wymienionych wyżej punktów najlepsi analitycy to osoby, które jarają się tym co robią – są ciekawi świata i zależności jakie znajdą w danych, otwarci na naukę i próbowanie nowych rozwiązań. Jeżeli zdecydowanie nie jesteś taką osobą, a w pracy szukasz raczej powtarzalności niż wyzwań, to być może warto sobie odpuścić już w tym momencie.

Must have – co trzeba umieć, aby zostać DA

1. Podstawowa wiedza o danych

Dość oczywista kwestia –  zajmując się zawodowo danymi musimy znać podstawowe pojęcia dotyczące danych: podział danych na numeryczne i kategoryczne, pojęcia takie jak średnia, mediana, odchylenie standardowe, percentyle, outliery, rozkłady, itd.

Na szczęście wiedzy do przyswojenia jest na tyle mało, że nie musimy podejmować w tym celu osobnych kursów. Z większością tych rzeczy obeznacie się przy wstępie podczas kursów dotyczących Excela, SQL czy wizualizacji danych. Zatem lecimy dalej.

2. Excel (?)

Kontrowersyjny temat, ponieważ Excela jednocześnie musicie i nie musicie znać. Już spieszę z wyjaśnieniami. Jak wiadomo, firmy na excelu stoją – pracując jako analityk X (pod X podłóż jakiekolwiek słowo oprócz „danych”) prawdopodobnie większość twojej pracy opiera się na tym programie. Być może nawet jako analityk danych pracujesz na excelu. Oczywiście, w takim wypadku program ten staje się twoim głównym narzędziem pracy i musisz mu sprostać aby spełnić swoje zawodowe obowiązki. Z drugiej strony uważam, że w dobrych firmach analitycy danych nie pracują na excelu, a przynajmniej nie jest to ich główne narzędzie służące do codziennej pracy.

No to uczyć się czy się nie uczyć Excela?

Zależy. Jeżeli już jesteś w stanie używać excela w podstawowym zakresie (powiedzmy: filtrowanie, sortowanie, wpisywanie formuły, vlookup, wykresy), to ja bym mu nie poświęcała więcej czasu (no chyba, że jest to coś co cię kręci i szukasz pozycji z wymaganym Excelem, ale myślałam, że rozmawiamy o analityku danych).

Z drugiej strony, jeżeli ikonka Excela przyprawia cię o dreszcze i zrobisz wszystko, byleby jej uniknąć, to może warto to zmienić. Tak zresztą było w moim przypadku – przed moją pierwszą pracą jako analityk pricingowy nie potrafiłam zrobić kompletnie NIC w Excelu i było mi z tego powodu strasznie wstyd. Z tego powodu zaczęłam swoją przygodę z nauką analizy od kursu z Excela i absolutnie tego nie żałuje. Stoi też pewnie za tym fakt, że znalazłam fantastyczny kurs na Courserze, który zaczyna się od kompletnych podstaw a kończy na zaawansowanych funkcjach, całkowicie wyczerpując możliwości tego narzędzia. Jest to chyba najlepszy kurs online, jaki robiłam w życiu, i nawet kilka lat po jego skończeniu niczego nie polecam z takim przekonaniem jak jego.

A w sumie to po co w końcu ten Excel?

Sęk w tym, że czasem się przyda. Pracując jako DA nie używałam Excela do samej analizy per se, ale do zadań okołoanalizowych, np. sprawdzania czy wyciągnięte z baz dane mają sens i nie zawierają błędów (czyli coś co będziecie robić prawie codziennie).  Potrzebowałam do tego napisać proste formuły, zagregować dane (SUM, AVG) czy użyć funkcji typu VLOOKUP, MATCH, LEFT.

Zresztą jest coś naturalnego w zaczynaniu uczenia się analizy danych od Excela, ponieważ często jest to pierwszy program jaki używamy do jakiejkolwiek obróbki informacji. Jest on nam znany oraz rozumiemy mniej więcej jak składować w nim dane, przez co w prosty i przyjemny sposób możemy zacząć go używać i powoli budować na nim wiedzę jak postępować z danymi.

3. SQL

W tym punkcie dochodzimy do sedna umiejętności analityka danych. SQL, czyli strukturalny język zapytań (ang. structured query language) jest językiem służącym do komunikacji z bazą danych. Za jego pomocą pisze się tzw. queries (po polsku kwerendy, ale nie będę używała tej nazwy), czyli zapytania do baz danych pozwalające na wypluciu z nich informacji, które nas interesują. SQL jest językiem ustrukturyzowanym, co znaczy, że mimo iż ma wiele odmian (MySQL, SQLite, PostgreSQL), są one do siebie na tyle podobne, że umiejąc programować w jednej z nich nie musimy specjalnie uczyć się kolejnej.  

SQL nie jest jak inne języki programowania, typu Python, gdzie możemy za pomocą kodu zaprogramować co nam się żywnie podoba i stworzyć całą aplikację. Jako że służy on tylko i wyłącznie do kontaktu z bazą danych, ma on jasno narzuconą strukturę oraz kolejność wykonywania działań. Te ograniczenia prowadzą nas do jego najlepszej cechy -> jest on dość prosty do nauki.

Zresztą w kilka zdań jestem w stanie opisać zasadę jego działania – musimy tylko zdefiniować co i skąd pobieramy, np. kod:

SELECT name, surname
FROM users
WHERE country = 'pl'

informuje bazę danych, że chcielibyśmy wyciągnąć imię i nazwisko (SELECT name, surname) z tabeli użytkowników (FROM users) od użytkowników z Polski (WHERE country = 'pl'). Każde nasze zapytanie będzie miało podobną formę – zawsze będzie część SELECT definiująca co chcemy pobrać, oraz FROM określające z jakiej tabeli chcemy pobrać te dane. Filtrowanie za pomocą WHERE jest opcjonalne.

Pewnie już podejrzewacie, że SELECT, FROM i WHERE to nie wszystko – tak, macie rację, ale uwierzcie mi, że naprawdę zostaje niewiele więcej. Czyni to SQL bardzo prostym językiem, który jest w zasięgu nauki większości z was. Znowu wracając do bilansu zysku i strat (wysiłek włożony w naukę vs korzyści) osobiście uważam, że SQL jest najlepszą inwestycją na rynku pracy w obszarze data. Jest on prosty do nauki, a jego znajomość jest sama w sobie wystarczająca, aby zdobyć dobrze płatne stanowisko.

Jak się go nauczyć?

Tutaj niestety nie mam prostej odpowiedzi, tak jak to miało miejsce przy Excelu, ponieważ nie znam jednego kursu dobrze pokrywającego wszystkie zagadnienia. Sama musiałam zrobić kilka przeciętnych kursów, każdy omawiający sprawę z trochę innej strony i ćwiczyć na znalezionych przykładach. Dodatkowo uważam, że aby w pełni zrozumieć SQL należy pojąć podstawy relacyjnych baz danych, których często brakuje w dostępnych kursach. Dlatego przygotowałam na ten temat osobny post: Jak się nauczyć SQL?

4. Wizualizacja danych

Ludzki umysł nie jest zoptymalizowany, aby szybko wyciągać wnioski patrząc na numerki. Widząc wiersze z kwotami podsumowującymi jakieś wartości przypisane do miejscowości, nie jesteśmy w stanie szybko ich uszeregować:

Jesteśmy za to w stanie to zrobić widząc kwoty na wykresie:

Od razu widzimy, że Szczecin jest na pierwszym miejscu, a Rzeszów i Lublin na samym końcu.

Ludzki mózg jest przystosowany do porównywania odległości między obiektami, dlatego wykresy słupkowe, mimo iż nudne, to robią robotę. Z tego powodu wizualizacje, wykresy oraz dashboardy to kolejne po SQL najważniejsze narzędzie DA.

W przypadku nauki wizualizacji danych mówimy o dwóch rzeczach – o teorii i praktyce.

Jako teorię mam na myśli wiedzę, jaki wykres jak użyć w jakiej sytuacji, aby służył określonym celom. Teoria to wiedza, że wykres liniowy powinien być używany tylko w przypadku, gdy X reprezentuje oś czasu. Albo, że mimo iż mózg jest zoptymalizowany do rozpoznawania różnic między odległościami, to z objętościami już tak dobrze sobie nie radzi, dlatego wykresy kołowe albo 3D to (zazwyczaj) zły pomysł. W większości przypadków teoria przychodzi wraz z praktyką, dlatego też na niej się skupimy.

Mówiąc o praktyce mam na myśli obsługę programów do wizualizacji danych, typu Tableau, Power BI, Spotfire, Looker itd. Programy te częściowo różnią się między sobą, ale mają też części wspólne. Chociaż Tableau jest chyba najbardziej popularny, to nie jest powiedziane, że na pewno na niego natrafimy w przyszłej pracy – różne firmy korzystają z różnych programów, dlatego też nadmierna nauka tylko jednego z nich nie ma większego sensu. Zresztą znaczna część programów jest dość intuicyjna, także nauczymy się ich obsługi używając ich w firmie. Jedyny nasz cel to przekonanie potencjalnego pracodawcy o naszym doświadczeniu z tego typu oprogramowaniem. Dlatego ja proponuję zrobić 1 kurs, na przykład o Tableau, pobawić się trochę w robienie dashbordów i to powinno wystarczyć. Resztę potrzebnej wiedzy specjalistycznej wchłoniemy już w firmie.

Dodatkowe umiejętności techniczne

4 (może 3 poza Excelem) poprzednie punkty to must have. Ciężko mi sobie wyobrazić, że ktoś aplikuje na pozycję DA, a nigdy nie słyszał co to jest mediana, SQL lub dashboard. Istnieją jednak też dodatkowe aspekty, z którymi można się spotkać w pracy analityka. Uważam, że aplikując na pierwszą pracę jako DA absolutnie nie musisz się na nich znać, ale warto byłoby przynajmniej wiedzieć, że istnieją.

– Testy A/B – z tymi testami jest tak, że albo firmy je namiętnie kochają, albo nie wiedzą o ich istnieniu. Testy to praktyczne wykorzystanie statystyki w biznesie. Typowym przykładem jest dzielenie użytkowników strony internetowej na dwie grupy, po czym wyświetlanie nowej funkcjonalności na stronie tylko jednej z grup. Na końcu sprawdzamy różnice statystyczne między grupami, czyli czy grupa której pokazywano nową stronę reagowała w inny sposób. Jest to kwintesencja testów A/B, i w sumie niewiele więcej trzeba o nich wiedzieć. Ważne, aby o nich pamiętać na rekrutacji jak zostaniecie zapytaniena przykład jak zbadać czy nowa funkcja w aplikacji poprawia zaangażowanie. Ewentualnie, gdy znajomość testów A/B jest wyszczególniona w ofercie pracy, to można im poświęcić trochę więcej czasu.

– Python  – czasem spotkamy się ze stwierdzeniem w ofercie pracy „python is a plus”. Osobiście uważam, że równie dobrze można by wpisywać „quantum physics is a plus”, no bo przecież ani python ani fizyka kwantowa raczej nie zaszkodzą. Ale o tym co autor miał na myśli publikując ofertę pracy innym razem. Szukając swojej pierwszej pracy jako analityk danych nie musimy umieć programować w Pythonie. Żeby nie było – uważam, że dobry analityk potrafi zrobić prostą analizę za pomocą tego języka, ale spokojnie można się go zacząć uczyć już po rozpoczęciu swojej pierwszej pracy. Dobrze jest wiedzieć, że gdzie możliwości SQL się kończą tam powinien zawitać Python i być może rzucić oko na przykładową eksplorację danych w Pythonie znalezioną w internecie. Do rozpoczęcia naszej kariery jako DA tyle wystarczy.

Umiejętności miękkie

Praca analityka nie polega na zamknięciu się w piwnicy i klepaniu analiz. Robimy to wszystko po to, aby biznes mógł wykorzystać tę wiedzę i podjąć właściwe decyzje oparte na danych. Z tego powodu zawód DA polega na ciągłym łączeniu wymagań biznesowych z technicznymi rozwiązaniami. Aby robić to dobrze, potrzeba szeregu umiejętności miękkich – dobrych zdolności komunikacyjnych, wiedzy biznesowej oraz umiejętności zarządzania projektami.

Komunikacja to naprawdę lwia część pracy analityka. Gdy spytamy pierwszego lepszego DA spotkanego na naszej drodze, co było największym wyzwaniem w projekcie nad którymi ostatnio pracował/a, w większości przypadków wymieni on/a problemy komunikacyjne z ludźmi nietechnicznymi. Komunikacja jest obecna na każdym etapie projektu – przed analizą musimy poznać dany problem biznesowy, w trakcie analizy często wyjaśnić szczegóły procesów lub doprecyzować definicje danych, a po analizie przedstawić nasze wyniki, nierzadko w formie mniej lub bardziej oficjalnej prezentacji. Aby dowieść projekt, musimy mieć umiejętność słuchania i zadawania konkretnych pytań, pewność siebie przy odmawianiu narzucanych, złych rozwiązań i proponowaniu tych optymalnych, umiejętność tłumaczenia języka technicznego dla nietechnicznych ludzi, podsumowywania i wyciągania najważniejszych wniosków. W dodatku, aby tego dokonać, musimy cały czas działać tłumacząc sobie z tyłu głowy język biznesu na język danych i vice versa, co wymaga naprawdę niezłych umiejętności biznesowych (i technicznych).

Aby jeszcze bardziej podkreślić znaczenie umiejętności miękkich, wyjawię, że różnica między pozycją juniora, mida i seniora polega w dużej mierze nie na różnicy w zdolnościach technicznych, ale właśnie w kompetencjach miękkich, na przykład w zarządzaniu projektami. Junior to osoba potrzebująca dużo wsparcia od bardziej doświadczonych pracowników w rozmowie z ludźmi i nieumiejąca sama rozłożyć problem biznesowy na czynniki pierwsze. Senior to osoba niezależna, potrafiąca sama dogadać się ludźmi nietechnicznym, przetłumaczyć problem biznesowy na język techniczny, oraz tak zarządzać projektem, aby zakończył się on pomyślnym rozwiązaniem problemu.

Podsumowanie

Analityk danych to osoba łącząca biznes z technologią, która posiada szereg umiejętności technicznych oraz miękkich umożliwiając firmie podejmowanie decyzji na podstawie danych. Zdobycie umiejętności technicznych wymaga od nas tylko (i aż) chęci do nauki – istnieje dużo darmowych kursów i materiałów w internecie, które są w stanie efektywnie przekazać wiedzę wymaganą do rozpoczęcia pierwszej pracy. Zasadnicze umiejętności techniczne to :

  • ogólna wiedza o danych
  • obsługa programu Excel
  • znajomość języka zapytań SQL
  • znajomość programów do wizualizacji danych, np. Tableau

Wymagane kompetencje miękkie to komunikacyjność, smykałka do biznesu oraz sprawne prowadzenie projektów. Umiejętności te w dużej mierze przyjdą wraz z praktyką.

Do znalezienia pracy jako DA nie trzeba posiadać żadnych supermocy, w tym wybitnej wiedzy z matematyki. Nauka wymaganych umiejętności jest w zasięgu większości z nas, dlatego aby zostać analitykiem danych wystarczy tylko chcieć. 

Jeżeli chcecie by informowani o nowych postach oraz dostawać ekstra materiały dla subskrybentów, to zapraszam do zapisu do newslettera:

11 thoughts on “Jak zostać analitykiem danych?”

  1. Pingback: Rozmowa rekrutacyjna – ogólne zasady – Crappy Data

  2. Pingback: Jak się nauczyć SQL? – Crappy Data

  3. Bardzo fajnie napisany post, który rozjaśnia dotąd obcy mi temat. Bardzo dziękuję za przybliżenie zawodu analityka danych, zachęciłaś do szukania dalej!

  4. Część, mam 3 lata doświadczenia jako programistka Java. Zastanawiam się nad analiza danych, bo w programowaniu ilość technologii w jednym projekcie jest dla mnie nie do ogarnięcia (jeden projekt to min kilkanaście technologii). Powiedz proszę jaka ścieżkę powinnam obrać w data science? I czy po podszkoleniu się z SQL (podstawy są) mam szanse na rozmowach i na jakie stanowisko.z góry dzięki.

    1. Cześć! Jeżeli podszkolisz SQL, a przy okazji ogarniesz jakiś program do wizualizacji to możesz celować w stanowisko analityk danych, zresztą od tego stanowiska polecam zaczynać. Jeżeli interesuje Cię data science, to tym się zajmują data scientistci, ale tam dochodzi dużo innych rzeczy, np. python i wiedza o ML, więc ja polecam jednak celować w analityka na początek

  5. Hej, dzięki za ten super pomocny artykuł, trochę mi rozjaśnił i może trochę uspokoił, że to do ogarnięcia wszystko. Mam pytanie, bo czasem widziałam gdzieś w ogłoszeniach, że VBA mile widziane itp. zastanawiam się czy warto temu poświęcać czas? Na razie uczę się SQL krok po kroku, podstawowe statystyczne pojęcia znam ze studiów, excel raczej dobrze ogarniam na takim średniozaawansowanym poziomie, i nie wiem czy powinnam uczyć się tego VBA czy lepiej poświęcić ten czas np. na program do wizualizacji? Przeglądając ogłoszenia wpadam trochę w panikę ile jest tych wymagań nawet na zwykłego juniora, zwłaszcza że nie jestem po studiach ścisłych wiec nie mam jak się wyróżnić…

    1. Dzięki wielkie! Ja nie polecam VBA, napisałam o tym cały artykuł: https://crappydata.pl/2022/01/dlaczego-excel-i-vba-sa-slabe/. Rzeczywiście, firmy na excelu stoją, więc VBA jest wspominane w ofertach, ale moim zdaniem excel i VBA to nie są profesjonalne narzędzia do analizy i lepiej jest od razu inwestować w lepsze narzędzia, bo będziesz miała szanse w lepszych firmach. Więc jak najbardziej celuj w naukę narzędzi do wizualizacji, a nie VBA.

      Co do wymagań – nie przejmuj się, wiem jak to wygląda na początku – ale to tylko tak wygląda, da się przez to przejść 🙂 Po pierwsze ważne jest, abyś wiedziała co jest minimum wejścia do branży i skupiła swoją naukę na tych rzeczach. Jak zaczniesz się uczyć niepotrzebnych rzeczy (np. za dużo informacji o bazach danych czy ETLach), to zmarnujesz czas, który możesz poświęcić na rzeczy istotne (np. silną naukę SQL). Po drugie, trzeba się nauczyć czytać oferty – a one zazwyczaj proszą o więcej niż potrzeba. Pisałam o tym na insta i na fb (https://www.facebook.com/crappydata/posts/153447583818734) – zazwyczaj liczą się umiejętności na samym początku liste, te zaznaczone jako „silnie wymagane”, „must have”, „dobra znajomość” itd. To wszystko co jest „na plus”, „warto mieć”, albo nawet na samym końcu to zazwyczaj liczy się w bardzo małym stopniu albo nie liczy się wcale.

      Ważne też jest, aby się sprzedać – mam artykuły o rekrutacji, mówię też dużo o tym na moim intagramie (https://instagram.com/crappydata) więc zapraszam.

      1. Dzięki za odpowiedź 🤗 obserwuję Cię już gdzie się da, bo Twój content działa na mnie motywująco i podbudowująco 😃

  6. Pingback: Czym zajmuje się DA, DS i MLE? – Crappy Data

Comments are closed.