Popis online kurzu Umění datové vizualizace v Pythonu
Využití deskriptivních statistik, jako je průměr nebo medián, nám může poskytnout cenné informace o našich datech. Nicméně, pokud data vizualizujeme, můžeme odhalit trendy a vztahy, které by jinak zůstaly před námi skryty. V tomto kurzu se tedy naučíte jak data efektivně vizualizovat.
Začneme tím, co je vlastně vizualizace dat a proč je důležitá. Následně se zaměříme na základy, jako je rozdělení datasetu na typy atributů, které umíme vizualizovat a využití estetických prvků. V rámci vizualizačních technik se dozvíte principy tvorby dobré vizualizace a jednoduché postupy pro tvorbu efektivních grafů. Kurz také pokrývá přístupy a strategie pro správnou interpretaci vizualizací, důležitost barev či barevných škál a identifikování vizuálních zkreslení, které se ve vizualizacích může nacházet.
V kurzu získáte praktické dovednosti s knihovnami pandas, Seaborn a Matplotlib, pomocí kterých budeme vytvářet vizualizace numerických a kategorických sloupců.
Víme, že nejlépe se člověk naučí nové dovednosti jejich praktikováním, a proto je pro vás připraveno 6 praktických programovacích cvičení v Jupyter noteboocích s úkoly a vysvětleními jednotlivých konceptů.
Co se v kurzu Umění datové vizualizace v Pythonu naučíte?
Celkový obsah kurzu je . Prostředí, ve kterém budete během kurzu programovat se nazývá Jupyter notebooky s Pythonem. Níže je uveden seznam oblastí, kterým se v kurzu věnujeme:
- Úvod do vizualizace dat: V úvodní kapitole se podíváme na to, co přesně vizualizace dat je a proč vlastně data vizualizujeme.
- Základy vizualizace dat: V této kapitole si ukážeme, jak rozdělit dataset na základní typy atributů vhodné pro vizualizaci. Představíme si 6 základních estetických prvků, z nichž sestávají standardizované typy vizualizací a naučíme se, které kombinace estetických prvků a typů atributů fungují nejlépe.
- Vizualizace s pandas: Knihovna pandas je opravdu skvělým pomocníkem pro zpracování a analýzu dat. Poskytuje však i různé jednoduché a přímočaré metody, pomocí kterých umíme snadno vizualizovat data. V praktickém Jupyter notebooku si ukážeme, jak vytvořit line plot, histogram či bar plot.
- Vizualizační techniky: V této části kurzu si představíme principy tvorby dobré vizualizace. Ukážeme si konkrétní typ vizualizace, která obsahuje řadu užitečných deskriptivních statistik. Také se naučíme jednoduchý postup, který nám pomůže vytvářet naše vizualizace.
- Univariate vizualizace se Seaborn: Naučíte se pracovat s knihovnou Seaborn, pomocí které umíme vytvářet efektivní a vizuálně atraktivní grafy. V praktickém Jupyter notebooku si ukážeme, jak vytvořit tvz. univariate (1-dimenzionální) vizualizace numerických a kategorických dat. Budeme vytvářet standardizované vizualizace jako jsou swarm plot, violin plot, strip plot či count plot.
- Pokročilé vizualizační techniky: I když máme k dispozici větší množství estetických prvků vizualizace, řekneme si kterým z nich bychom měli věnovat větší pozornost. Ukážeme si kdy je vhodné vizualizovat jen náhodný vzorek z našich pozorování a také jak se vyhnout umělému zkreslování efektů, které se v našich datech přirozeně nacházejí.
- Bivariate vizualizace se Seaborn: V dalším praktickém Jupyter notebooku se přesuneme k tvz. bivariate (2-dimenzionálním) vizualizacím, které nám umožňují analyzovat vztah mezi 2 sloupci. Ukážeme si také další typy vizualizací jako jsou relplot, scatter plot, regplot či heatmap.
- Přístupy, strategie a úvahy: Některé nástroje pro vizualizaci dat nám umožňují extrapolovat z dostupných dat - měli bychom však být opatrní při pořizování závěrů z takových vizualizací. Promluvíme si io barvách ve vizualizacích ao využívání různých barevných škál. Představíme si několik dodatečných principů, které bychom měli zvážit při tvorbě vizualizaci a vysvětlíme si, proč bychom měli být opatrní při seskupování dat pro vizualizace.
- Nejistota ve vizualizacích: Vizualizace vytváříme ze vzorku dat. Pokud chceme z tohoto vzorku, a tedy z naší vizualizace, zobecňovat na celou populaci, je vhodné ak nejistotu tohoto kroku v ní vyjádříme.
- Vizualizace jako Data Science model: Zjistíte také jako opravdu dobrá vizualizace dokáže vyřešit problémy, kterým čelíme.
Multivariate vizualizace se Seaborn: V tomto Jupyter notebooku se podíváme na tzv. multivariaté vizualizace, ve kterých zobrazujeme 3 a více sloupců. Vysvětlíme si, jak vytvářet komplexní vizualizace, ve kterých můžeme analyzovat různé kategorie dat či vztahy mezi více sloupci.
- Vizualizace pomocí knihovny Matplotlib: V praktickém Jupyter notebooku uvidíte, jak můžeme kontrolovat nastavení každého elementu vizualizace pomocí knihovny Matplotlib.
- První pohled na data: V tomto bonusovém Jupyter notebooku budete zkoumat, analyzovat a vizualizovat data a pokusíte se najít odpovědi na různé dotazy.
Vizuální zkreslení: V této kapitole si ukážeme několik typů zkreslení, která se ve vizualizacích mohou objevit. Naučíte se, jak tato zkreslení rozpoznat a jak se jim vyhnout.
Pro koho je kurz Umění datové vizualizace v Pythonu vhodný?
Pro úspěšné absolvování tohoto kurzu se prosím ujistěte, že splňujete následující požadavky:
- máte předchozí zkušenosti s programováním v Pythonu, konkrétně znalost práce s knihovnami numpy a pandas,
- máte znalost o základních statistických metodách jako počítání průměru, minima, maxima nebo směrodatné odchylky.
Co po kurzu dokážete a co si odnesete?
- Schopnost vizualizovat data pomocí tří klíčových Python knihoven: pandas, Seaborn a Matplotlib. Naučíte se vytvářet různé typy vizualizací, od základních až po komplexní o budete umět používat techniky pro vytváření univariate, bivariate a multivariate vizualizací pro efektivní analyzování dat a získání hodnotných informací.
- Hluboké znalosti o principech a strategiích tvorby dobrých a správných vizualizací. Díky těmto znalostem budete umět vytvářet vizualizace, které jsou nejen esteticky hezké, ale také přesné a spolehlivé.
Co je potřebné pro absolvování kurzu Umění datové vizualizace v Pythonu?
- Vlastní laptop. Firemní laptop může způsobovat problémy, například, při přístupech na Google Drive prostředí nebo při instalaci knihoven.
- Základní znalost angličtiny: Minimální pasivní znalost na úrovni čtení textu jelikož pro knihovny, o kterých se budeme učit jsou vytvořeny dokumentace v anglickém jazyce. Všechny video tutoriály jsou však ve slovenském jazyce.
- Stabilní internetové připojení. Pro sledování video lekcí či práci na cvičeních je internetové připojení neustále zapotřebí.
- Aktualizovaný internetový prohlížeč Google Chrome, Microsoft Edge nebo Mozilla Firefox.
- (doporučeno) Google účet. S Jupyter notebooky doporučujeme pracovat v prostředí Google Colaboratory. V případě, že Google účet nemáte a ani si jej nechcete zakládat, bude k dispozici druhá alternativa pro lokální práci s Jupyter notebooky.
Co všechno s kurzem Umění datové vizualizace v Pythonu získáte?
-
6 Jupyter notebooků, ve kterých si nejen prakticky vyzkoušíte jednotlivé koncepty, ale můžete je používat jako osobní referenci ve vašem (budoucím) zaměstnání
-
videotutoriály o Vizualizaci dat v Pythonu
- moderované diskusní fórum, ve kterém na vaše dotazy odpovídá autor kurzu Róbert Barcík,
-
certifikát o absolvování online kurzu Umění datové vizualizace v Pythonu
-
garance vrácení peněz do 14 dnů v případě nespokojenosti s kurzem.