Popis kurzu Pokročilý Machine Learning v Pythonu
Chceš posunout své dovednosti v Machine Learningu na úroveň profesionála? Tento kurz tě tam dostane! Kurz Pokročilý Machine Learning v Pythonu je navržen pro každého, kdo už ovládá základy, ale chce se naučit používat techniky, které v praxi využívají ti nejlepší data scientisté na světě.
V dnešním světě údajů už nestačí umět napsat jednoduchý lineární model. Firmy hledají odborníky, kteří rozumějí pokročilým algoritmům, dokáží optimalizovat modely pro produkční prostředí a řeší reálné business problémy s measuritelným dopadem. Tento kurz ti dává přesně ty dovednosti, po kterých nejvíce volají zaměstnavatelé.
Co se v kurzu Pokročilý Machine Learning v Pythonu naučíte?
1. Distance-based learning: Algoritmy založené na měření vzdáleností
Zamysleli jste se někdy, jak Netflix ví, jaký film vám doporučit, nebo jak e-shop navrhne produkty, které vás okamžitě zaujmou? Odpověď se skrývá v Distance-based learningu. V kurzu se naučíš jak vytvářet a používat algoritmy založené na měření vzdáleností, které jsou základem mnoha moderních aplikací, od personalizace obsahu až po odhalování podvodných transakcí. Ukážeme si standardní řešení i pokročilé a kreativní přístupy, které ti umožní zvládnout jakýkoli dataset, se kterým se setkáš.
2. Nevybalancovaná data
Nevybalancovaná data potkáš v praxi téměř všude. A přestože se na první pohled nemusí zdát jako velký problém, mohou mít opravdu negativní vliv na tvůj prediktivní model. V této kapitole si nejprve přesně ukážeme, v čem spočívá jejich nebezpečí a proč se při nich nemůžeme spoléhat na běžné metriky, jako je přesnost (accuracy). Následně se podíváme na dvě konkrétní řešení, kterými jsou Oversampling a Undersampling.
3. Ensemble modely
V poslední kapitole se naučíš používat Ensemble modely, přičemž začneme s Bagging přístupem, který nabízí extrémně robustní modely, odolné i vůči drobným změnám v datech. Detailně se podíváme na nejpopulárnější algoritmy jako je například ExtraTrees Ensemble, který je ideální pro většinu standardních problémů. V rámci unsupervised learningu si ukážeme použití algoritmu Isolation Forest.
Dále přejdeme k Boostingu, kdy se modely učí z chyb předchozích modelů. Budeme se věnovat moderním a v praxi využívaným algoritmům jako jsou XGBoost, LightGBM a CatBoost.
Kurz završíme technikou Stacking, kdy budeme kombinovat několik typů modelů a jejich výsledky zkombinujeme pomocí speciálního “meta-modelu”. Projdeme si základní přístupy jako Soft Voting, ale také pokročilé implementace jako Stacked generalization, Deep Ensemble modely nebo Model Distillation.
Pro koho je tento kurz vhodný?
Kurz Pokročilý Machine Learning v Pythonu je určen pro každého, kdo už má základy Machine Learningu a chce se posunout na profesionální úroveň. Je ideální pro:
-
Studenty a absolventy s teoretickými vědomostmi, kteří chtějí získat praktické dovednosti pro řešení reálných problémů.
-
Junior Data Scientisty, kteří chtějí překonat časté výzvy v praxi, jako jsou nevybalancovaná data nebo komplexní smíšené datasety.
-
Analytiky a programátory, kteří chtějí rozšířit své dovednosti a začít budovat robustní a spolehlivé prediktivní modely, které jsou využitelné v reálném světě.
Tento kurz doporučujeme zejména pro absolventy našeho kurzu "Machine Learning v Pythonu", kde získali pevný základ v oblasti tvorby prediktivních modelů, zpracování dat a základních metrik vyhodnocování modelů.
Co po kurzu dokážete a co si odnesete?
Po absolvování kurzu budete vědět:
- Navrhovat a implementovat distance-based modely
- Identifikovat a efektivně řešit problém nevybalancovaných dat, který často způsobuje nespolehlivé predikce v reálných projektech.
- Používat Oversampling a Undersampling techniky
- Vytvářet a aplikovat ensemble modely jako ExtraTrees a rozumět, kdy je tento přístup vhodný
- Ovládat pokročilé boosting algoritmy (XGBoost, LightGBM a CatBoost), které patří k nejpoužívanějším v průmyslu.
- Kombinovat vícero modelů pomocí Stackingu a využívat techniky jako Soft Voting, Stacked generalization či Dynamic Ensembles.
- Implementovat moderní koncepty jako Deep Ensembles, Snapshot Ensembling a Model Distillation, což jsou metody využívané ve špičkovém výzkumu i v praxi.
Co je zapotřebí k absolvování kurzu?
- Základní znalost angličtiny: Minimální pasivní znalost na úrovni čtení textu jelikož pro knihovny, o kterých se budeme učit jsou vytvořeny dokumentace v anglickém jazyce. Všechny video tutoriály jsou však ve slovenském jazyce.
- Stabilní internetové připojení.
- Aktualizovaný internetový prohlížeč Google Chrome, Microsoft Edge nebo Mozilla Firefox.
Co všechno dostanete?
-
3 Jupyter notebooky, ve kterých si nejen prakticky vyzkoušíte jednotlivé koncepty, ale můžete je používat jako osobní referenci ve vašem (budoucím) zaměstnání
-
video tutoriály o Pokročilém Machine Learningu v Pythonu
-
certifikát o absolvování online kurzu Pokročilý Machine Learning v Pythonu
-
moderované diskusní fórum, ve kterém na vaše dotazy odpovídá autor kurzu Róbert Barcík,
-
garance vrácení peněz do 14 dnů v případě nespokojenosti s kurzem