Pokročilé vytváření atributů pro Machine Learning v Pythonu

2h 29min
Čas
17
Kapitol
Programování
Kategorie
-
Hodnocení
Pokročilý
Level
slovenský
Jazyk kurzu

Popis online kurzu Pokročilé vytváření atributů pro Machine Learning v Pythonu

Kurz Pokročilé vytváření atributů pro Machine Learning v Pythonu je určen pro ty, kteří se chtějí v oblasti přípravy dat pro strojní učení posunout na vyšší úroveň. Zaměřujeme se v něm na pokročilé techniky transformace dat, které výrazně zlepšují výkonnost prediktivních modelů.

Kurz je ideálním pokračováním pro absolventy našich kurzů Machine Learning v Pythonu a Vytváření atributů pro Machine Learning v Pythonu, nebo pro všechny, kteří již mají základní zkušenosti s tvorbou atributů a základy strojového učení.

Co se v kurzu Pokročilé vytváření atributů pro Machine Learning v Pythonu naučíte


Celkový obsah kurzu je rozdělen do tří hlavních částí: Kategorické atributy, Numerické atributy a Ostatní atributy. Každá část přináší praktické, pokročilé techniky, které si společně vysvětlíme na konkrétních příkladech v Pythonu.

Kategorické atributy


Na začátku kurzu se vrátíme k základním metodám enkódování kategorických dat, které již znáte, a na které budeme následně navazovat.

Naučíte se:
  • Enkódování pomocí sumární statistiky, kde kategorie nahradíme statistickými vlastnostmi ze vstupního atributu.
  • Základní Target Encoding, tedy nahrazování kategorií očekávanou hodnotou cílové proměnné.
  • Weight of Evidence (WoE) a Leave-one-out Encoding, dvě pokročilé techniky využívané hlavně ve finančnictví a risk modelování.
  • Použití CatBoost Encoderu, který kombinuje výhody více přístupů.
  • Feature Cross, tedy tvorbu interakcí mezi kategorickými atributy, což může výrazně zlepšit schopnosti modelů zachytit komplexní vzory v datech.
  • V bonusové sekci si ukážeme také méně tradiční metody jako String Similarity Encoding, Binary Encoding, Hashing Encoder, Polynomial Encoding nebo Helmert Encoding.

Tyto techniky vám umožní pracovat s kategorickými daty mnohem flexibilněji a efektivněji.

Numerické atributy


Ve druhé části kurzu se věnujeme numerickým datům a jejich pokročilé transformaci.

Naučíte se:
  • Stabilizovat rozptyl numerických dat, aby modely lépe generalizovaly.
  • Používat polynomy a splines, které jsou specifické pro zlepšování výkonu lineárních modelů.
  • Diskretizovat numerické atributy - měnit číselná data na kategorie tam, kde je to výhodné.
  • Vytvářet interakce mezi numerickými atributy, čímž rozšíříme prostor modelu pro zachytávání složitých vztahů.
  • A na závěr této části si vysvětlíme techniky na redukci dimenzionality, které vám pomohou zjednodušit model a zlepšit jeho výkonnost.

Ostatní atributy


V poslední části kurzu se zaměříme na speciální typy atributů a techniky.

Naučíte se:
  • Tvorbu cyklických atributů, které jsou nezbytné například při práci s daty obsahujícími časové nebo sezónní prvky (měsíce, dny v týdnu apod.).
  • Vyjadřovat extrémnost pozorování, což vám umožní efektivně pracovat s anomáliemi a specifickými datovými body.
  • V praktických doporučeních na závěr kurzu si shrneme, kdy které techniky využít a jak je správně aplikovat.

Pro koho je kurz Pokročilé vytváření atributů pro Machine Learning v Pythonu vhodný


Tento kurz je určen pro všechny, kteří již ovládají základy Machine Learningu a Vytváření atributů pro Machine Learning

Kurz je ideální pro datové analytiky, datové vědce, Machine Learning inženýry a všechny pokročilé uživatele Pythonu, kteří se chtějí naučit, jak z dostupných dat vytvořit ještě silnější atributy pro modelování.

Co po kurzu dokážete a co si odnesete?


  • Budete umět enkódovat kategorická data pomocí pokročilých technik, která se využívají v reálném světě.
  • Zvládnete efektivně vytvářet a kombinovat numerické atributy pro zlepšení výkonnosti modelů.
  • Naučíte se detekovat cyklické vzory a správně je zpracovat.
  • Budete ovládat techniky ke snížení počtu atributů bez ztráty výkonnosti modelu.
  • Budete umět správně vyhodnotit, které metody jsou vhodné pro různé typy problémů.

Kurz vám poskytne praktické dovednosti, které jsou okamžitě aplikovatelné v reálných Data Science projektech.

Má kurz Pokročilé vytváření atributů pro Machine Learning v Pythonu vstupní požadavky?


Pro úspěšné absolvování tohoto kurzu byste měli:

  • zvládat práci v Jupyter noteboocích,
  • ovládat knihovny pandas a numpy,
  • mít základní znalosti statistiky a strojového učení,
  • znát základní techniky vytváření atributů (feature engineering).

Pokud tyto znalosti zatím nemáte, můžete je získat v našich kurzech: Machine Learning v Pythonu a Vytváření atributů pro Machine Learning v Pythonu.

Co je zapotřebí k absolvování kurzu?

  • Základní znalost angličtiny: Minimální pasivní znalost na úrovni čtení textu protože praktický Jupyter notebook i dokumentace jsou v anglickém jazyce. Všechny video tutoriály jsou však v českém jazyce.
  • Stabilní internetové připojení. Pro sledování video lekcí či práci na cvičeních je internetové připojení neustále zapotřebí.
  • Aktualizovaný internetový prohlížeč Google Chrome, Microsoft Edge nebo Mozilla Firefox.

Co všechno s kurzem Pokročilé vytváření atributů pro Machine Learning v Pythonu získáte

  • Rozsáhlý, praktický Jupyter notebook, ve kterém si nejen prakticky vyzkoušíte jednotlivé koncepty, ale můžete jej používat jako osobní referenci ve vašem (budoucím) zaměstnání,
  • video tutoriály o Pokročilém vytváření atributů pro Machine Learning v Pythonu
  • moderované diskusní fórum, ve kterém na vaše dotazy odpovídá autor kurzu Róbert Barcík,
  • certifikát o absolvování online kurzu Pokročilé vytváření atributů pro Machine Learning v Pythonu
  • garance vrácení peněz do 14 dnů v případě nespokojenosti s kurzem.

Seznam kapitol

Vitajte v kurze!
Úvod do kurzu
Dostupné pouze po zakoupení přístupu
Materiály na stiahnutie
Dostupné pouze po zakoupení přístupu
Kategorické atribúty
Dôležité zopakovanie si základných metód
Dostupné pouze po zakoupení přístupu
Enkódovanie cez sumárnu štatistiku vstupu
Dostupné pouze po zakoupení přístupu
Target Encoding - najzákladnejšia forma
Dostupné pouze po zakoupení přístupu
Metódy “Weight of Evidence” a Leave-one-out Encoding
Dostupné pouze po zakoupení přístupu
Transformer CatBoost Encoder
Dostupné pouze po zakoupení přístupu
Feature Cross - Interakcie kategorických atribútov
Dostupné pouze po zakoupení přístupu
Bonusové metódy na enkódovanie
Dostupné pouze po zakoupení přístupu
Numerické atribúty
Stabilizovanie rozptylu
Dostupné pouze po zakoupení přístupu
Techniky špecifické pre linárne modely: Polynomials a Splines
Dostupné pouze po zakoupení přístupu
Diskretizácia
Dostupné pouze po zakoupení přístupu
Interakcie numerických atribútov
Dostupné pouze po zakoupení přístupu
Redukcia dimenzionality
Dostupné pouze po zakoupení přístupu
Ostatné atribúty
Cyklické atribúty
Dostupné pouze po zakoupení přístupu
Vyjadrenie extrémnosti pozorovania
Dostupné pouze po zakoupení přístupu
Praktické odporúčania
Dostupné pouze po zakoupení přístupu

Podívej se i na tyto kurzy

12 Online kurzů
1 Příspěvků