Popis online kurzu Pokročilé vytváření atributů pro Machine Learning v Pythonu
Kurz Pokročilé vytváření atributů pro Machine Learning v Pythonu je určen pro ty, kteří se chtějí v oblasti přípravy dat pro strojní učení posunout na vyšší úroveň. Zaměřujeme se v něm na pokročilé techniky transformace dat, které výrazně zlepšují výkonnost prediktivních modelů.
Kurz je ideálním pokračováním pro absolventy našich kurzů Machine Learning v Pythonu a Vytváření atributů pro Machine Learning v Pythonu, nebo pro všechny, kteří již mají základní zkušenosti s tvorbou atributů a základy strojového učení.
Co se v kurzu Pokročilé vytváření atributů pro Machine Learning v Pythonu naučíte
Celkový obsah kurzu je rozdělen do tří hlavních částí: Kategorické atributy, Numerické atributy a Ostatní atributy. Každá část přináší praktické, pokročilé techniky, které si společně vysvětlíme na konkrétních příkladech v Pythonu.
Kategorické atributy
Na začátku kurzu se vrátíme k základním metodám enkódování kategorických dat, které již znáte, a na které budeme následně navazovat.
Naučíte se:
- Enkódování pomocí sumární statistiky, kde kategorie nahradíme statistickými vlastnostmi ze vstupního atributu.
- Základní Target Encoding, tedy nahrazování kategorií očekávanou hodnotou cílové proměnné.
- Weight of Evidence (WoE) a Leave-one-out Encoding, dvě pokročilé techniky využívané hlavně ve finančnictví a risk modelování.
- Použití CatBoost Encoderu, který kombinuje výhody více přístupů.
- Feature Cross, tedy tvorbu interakcí mezi kategorickými atributy, což může výrazně zlepšit schopnosti modelů zachytit komplexní vzory v datech.
- V bonusové sekci si ukážeme také méně tradiční metody jako String Similarity Encoding, Binary Encoding, Hashing Encoder, Polynomial Encoding nebo Helmert Encoding.
Tyto techniky vám umožní pracovat s kategorickými daty mnohem flexibilněji a efektivněji.
Numerické atributy
Ve druhé části kurzu se věnujeme numerickým datům a jejich pokročilé transformaci.
Naučíte se:
- Stabilizovat rozptyl numerických dat, aby modely lépe generalizovaly.
- Používat polynomy a splines, které jsou specifické pro zlepšování výkonu lineárních modelů.
- Diskretizovat numerické atributy - měnit číselná data na kategorie tam, kde je to výhodné.
- Vytvářet interakce mezi numerickými atributy, čímž rozšíříme prostor modelu pro zachytávání složitých vztahů.
- A na závěr této části si vysvětlíme techniky na redukci dimenzionality, které vám pomohou zjednodušit model a zlepšit jeho výkonnost.
Ostatní atributy
V poslední části kurzu se zaměříme na speciální typy atributů a techniky.
Naučíte se:
- Tvorbu cyklických atributů, které jsou nezbytné například při práci s daty obsahujícími časové nebo sezónní prvky (měsíce, dny v týdnu apod.).
- Vyjadřovat extrémnost pozorování, což vám umožní efektivně pracovat s anomáliemi a specifickými datovými body.
- V praktických doporučeních na závěr kurzu si shrneme, kdy které techniky využít a jak je správně aplikovat.
Pro koho je kurz Pokročilé vytváření atributů pro Machine Learning v Pythonu vhodný
Tento kurz je určen pro všechny, kteří již ovládají základy Machine Learningu a Vytváření atributů pro Machine Learning
Kurz je ideální pro datové analytiky, datové vědce, Machine Learning inženýry a všechny pokročilé uživatele Pythonu, kteří se chtějí naučit, jak z dostupných dat vytvořit ještě silnější atributy pro modelování.
Co po kurzu dokážete a co si odnesete?
- Budete umět enkódovat kategorická data pomocí pokročilých technik, která se využívají v reálném světě.
- Zvládnete efektivně vytvářet a kombinovat numerické atributy pro zlepšení výkonnosti modelů.
- Naučíte se detekovat cyklické vzory a správně je zpracovat.
- Budete ovládat techniky ke snížení počtu atributů bez ztráty výkonnosti modelu.
- Budete umět správně vyhodnotit, které metody jsou vhodné pro různé typy problémů.
Kurz vám poskytne praktické dovednosti, které jsou okamžitě aplikovatelné v reálných Data Science projektech.
Má kurz Pokročilé vytváření atributů pro Machine Learning v Pythonu vstupní požadavky?
Pro úspěšné absolvování tohoto kurzu byste měli:
- zvládat práci v Jupyter noteboocích,
- ovládat knihovny pandas a numpy,
- mít základní znalosti statistiky a strojového učení,
- znát základní techniky vytváření atributů (feature engineering).
Pokud tyto znalosti zatím nemáte, můžete je získat v našich kurzech: Machine Learning v Pythonu a Vytváření atributů pro Machine Learning v Pythonu.
Co je zapotřebí k absolvování kurzu?
- Základní znalost angličtiny: Minimální pasivní znalost na úrovni čtení textu protože praktický Jupyter notebook i dokumentace jsou v anglickém jazyce. Všechny video tutoriály jsou však v českém jazyce.
- Stabilní internetové připojení. Pro sledování video lekcí či práci na cvičeních je internetové připojení neustále zapotřebí.
- Aktualizovaný internetový prohlížeč Google Chrome, Microsoft Edge nebo Mozilla Firefox.
Co všechno s kurzem Pokročilé vytváření atributů pro Machine Learning v Pythonu získáte
- Rozsáhlý, praktický Jupyter notebook, ve kterém si nejen prakticky vyzkoušíte jednotlivé koncepty, ale můžete jej používat jako osobní referenci ve vašem (budoucím) zaměstnání,
- video tutoriály o Pokročilém vytváření atributů pro Machine Learning v Pythonu
- moderované diskusní fórum, ve kterém na vaše dotazy odpovídá autor kurzu Róbert Barcík,
- certifikát o absolvování online kurzu Pokročilé vytváření atributů pro Machine Learning v Pythonu
- garance vrácení peněz do 14 dnů v případě nespokojenosti s kurzem.