Popis online kurzu Zpracování dat v Pythonu
K tomu, abychom uměli z dat získat užitečné informace, je potřebujeme správně vyčistit a zpracovat. Tato schopnost je velice důležitá pro každého datového analytika či datového vědce a vy ji můžete získat v tomto kurzu! Naučíte se jak seskupovat a agregovat data, spojit různé tabulky do jednoho celku, transformovat data podle vašich potřeb, upravovat textové údaje a vyřešit chybějící hodnoty v datasetu.
Víme, že nejlépe se člověk naučí nové dovednosti jejich praktikováním, a proto je pro vás připraveno 5 praktických programovacích cvičení v Jupyter noteboocích s úkoly a vysvětleními jednotlivých konceptů.
Co se v kurzu Zpracování dat v Pythonu naučíte
Celkový obsah kurzu je 1 a půl hodiny. Prostředí, ve kterém budete během kurzu programovat se nazývá Jupyter notebooky s Pythonem. Ke zpracování dat budeme používat Python knihovnu pandas, která je základním nástrojem každého datového analytika. Níže je uveden seznam oblastí, kterým se v kurzu věnujeme:
- “Agregace dat”: Abychom našim datům lépe porozuměli, naučíme se je správně seskupovat a agregovat pomocí různých statistik. Ukážeme si techniky, pomocí kterých umíme zjistit, například, kolik zákazníků navštívilo náš obchod každý den nebo které produkty jsou nejprodávanější. Pomocí funkcí jako jsou groupby a agg si vytvoříme sety, které můžeme efektivně analyzovat i vizualizovat.
- “Slučování dat”: Data se častokrát nacházejí v separátních tabulkách. Například v jedné tabulce máme osobní údaje zákazníků, ve druhé jejich objednávky z e-shopu. Chceme-li tato data analyzovat, potřebujeme tabulky spojit. V této části si tedy vysvětlíme různé typy spojení tabulek jako jsou merge a join pro vytvoření komplexnějšího datasetu, které bude obsahovat všechna potřebná data pro podrobnou analýzu.
- “Transformování dat”: V této kapitole se naučíte, jak můžeme transformovat data pomocí funkcí jako jsou map, apply a lambda. Tyto techniky nám umožní přizpůsobit data přesně podle našich potřeb.
- „Práce s textovými daty“: Práce s textovými daty může být složitá a vyžaduje speciální techniky pro jejich správné zpracování. V této části se naučíte metody pro upravování a čištění textových dat jako je odstranění problémových neviditelných znaků, oddělení textů či nahrazení určitých slov novými.
- “Práce s chybějícími hodnotami”: Chybějící hodnoty nám mohou způsobovat problémy při analýze dat. Proto se naučíme jak identifikovat standardní i nestandardní chybějící data. Následně se podíváme na různé metody, jak tyto hodnoty z datasetu odstranit nebo nahradit konstantní či vypočtenou hodnotou.
Pro koho je kurz Zpracování dat v Pythonu vhodný?
Kurz Zpracování dat v Pythonu je ideální pro každého, kdo chce získat praktické dovednosti ve zpracování a analýze dat pomocí Pythonu. Pro úspěšné absolvování tohoto kurzu se prosím ujistěte, že splňujete následující požadavky:
- máte znalost o základních statistických metodách jako počítání průměru, minima, maxima nebo směrodatné odchylky,
- máte základní znalosti práce v Pythonu,
- máte základní znalosti práce s pandas knihovnou, jako jsou základní operace a manipulace dataframes,
- máte základní znalosti práce s numpy knihovnou.
Pokud nemáte výše uvedené znalosti a zkušenosti, doporučujeme si nejprve projít náš úvodní kurz do Pythonu s názvem „Úvod do Pythonu pro Data Science“, ve kterém se naučíte potřebné základy.
Co po kurzu dokážete a co si odnesete?
Data jsou všude kolem nás, bez ohledu na to, v jakém odvětví pracujete nebo byste chtěli pracovat. Schopnost efektivně upravovat a analyzovat data je jednou z nejdůležitějších a nejžádanějších dovedností. Online kurz Zpracování dat v Pythonu vás naučí, jak data upravit do podoby vhodné pro jejich analýzu a získávání užitečných informací.
Co je potřeba k absolvování kurzu Zpracování dat v Pythonu?
- Vlastní laptop. Firemní laptop může způsobovat problémy, například, při přístupech na Google Drive prostředí nebo při instalaci knihoven.
- Základní znalost angličtiny: Minimální pasivní znalost na úrovni čtení textu jelikož pro knihovny, o kterých se budeme učit jsou vytvořeny dokumentace v anglickém jazyce. Všechny video tutoriály jsou však ve slovenském jazyce.
- Stabilní internetové připojení. Pro sledování video lekcí či práci na cvičeních je internetové připojení neustále zapotřebí.
- Aktualizovaný internetový prohlížeč Google Chrome, Microsoft Edge nebo Mozilla Firefox.
- (doporučeno) Google účet. S Jupyter notebooky doporučujeme pracovat v prostředí Google Colaboratory. V případě, že Google účet nemáte a ani si jej nechcete zakládat, bude k dispozici druhá alternativa pro lokální práci s Jupyter notebooky.
Co vše s kurzem Zpracování dat v Pythonu získáte
- 5 Jupyter notebooků, ve kterých si nejen prakticky vyzkoušíte jednotlivé koncepty, ale můžete je používat jako osobní referenci ve vašem (budoucím) zaměstnání,
- video tutoriály o Zpracování dat v Pythonu,
- certifikát o absolvování online kurzu Zpracování dat v Pythonu,
- garance vrácení peněz do 14 dnů v případě nespokojenosti s kurzem.