Přihlas se na jednu z našich akademií a posuň se vpřed! Začínáme v září!
Více info

Machine Learning v Pythone

10h
Čas
87
Kapitol
Programování
Kategorie
-
Hodnocení
Pokročilý
Level
slovenský
Jazyk kurzu

Popis kurzu Machine Learning v Pythone

Jsou data scientisté kouzelníci když tvrdí, že dokážou předpovědět budoucnost? To rozhodně ne. :) Jednoduše vidí ve svém okolí “funkci” a odhadnou ji pomocí prediktivního modelu. Například, sesbírají data o počasí a pomocí nich předpovídají kolik lidí se rozhodne pořídit si zmrzlinu následující den.

V tomto kurzu se naučíte vytvářet prediktivní modely pomocí strojového učení (machine learning)! Po absolvování kurzu budete vědět vše potřebné k vybrání vhodného prediktivního modelu, jeho správné vytvoření a vyhodnocení jeho úspěšnosti.

Víme, že nejlépe se člověk naučí nové dovednosti jejich praktikováním, a proto je pro vás připraveno 15 praktických programovacích cvičení v Jupyter noteboocích s úkoly a vysvětleními jednotlivých konceptů.

Co se v kurzu Machine Learning v Pythonu naučíte

Celkový obsah kurzu je 9 hodin. Prostředí, ve kterém budete během kurzu programovat se nazývá Jupyter notebooky s Pythonem. Níže je uveden seznam oblastí, kterým se v kurzu věnujeme:

  • "Prvotní (baseline) model": Na začátku si řekneme, co vás v kurzu čeká a rovnou začneme is učením! Ukážeme si základní baseline model, kterým můžeme začít prediktivní modelování.
  • Evaluace modelu a kompozitní kód”: Vytvoříme si náš první prediktivní model a povíme si o různých metrikách, pomocí kterých hodnotíme jeho předpovědi. Také se naučíme psát profesionální kód, který se používá v reálném světě.
  • Rozhodovací stromy a tuning hyperparametrů“: V této části se naučíte o modelu s názvem „rozhodovací strom“, který dokáže předpovědět mezi dvěma cílovými kategoriemi. Pro zlepšení výkonnosti modelu se naučíme kontrolovat nastavení, takzvané hyperparametry.
  • Náhodný les a kNN algoritmus“: Když jsme se již naučili jak funguje „rozhodovací strom“, můžeme na našich znalostech stavět a posunout se k modelu „náhodného lesa“, který se běžně používá v praxi. Také si ukážeme model s názvem kNN, který k vytvoření předpovědí využívá algoritmus "nejbližších sousedů" a jeho bratra - rNN model.
  • Lineární regrese“: Touto částí přecházíme do oblasti lineárních modelů. Naučíme se o jednom z nejdůležitějších modelů s názvem lineární regrese, pomocí které vytvoříme předpovědi a budeme pozorovat, jaký efekt mají vstupní data na vytvořenou předpověď.
  • Regularizované modely”: V této části se naučíme o 3 regularizovaných modelech, které jsou variacemi lineární regrese: Lasso, Ridge a Elastic Net. Tyto modely jsou velmi užitečné, například, v regulovaných prostředích jako je bankovnictví nebo pojišťovnictví.
  • Logistická regrese“: Dalším z lineárních modelů je logistická regrese, která dokáže předpovědět dvě nebo více cílových kategorií. Ukážeme si také jak použít výstupy z tohoto modelu. Shrneme si také předpoklady lineárních modelů, které nám mohou pomoci zlepšit výkonnost modelu.
  • Clustering-shlukování”: V této části se naučíme o modelech kMeans a DBSCAN, které fungují na principu “shlukování dat” s podobnými vlastnostmi a na základě těchto skupin vytvářejí předpovědi.
  • Redukce dimenzionality a detekce anomálií”: Vysvětlíme si, jak fungují algoritmy, které redukují dimenzionalitu vstupních dat. Také si ukážeme, jak nám machine learning pomáhá pro detekování anomálií v datech.

Pro koho je kurz Machine Learning v Pythonu vhodný 

Začněme pomyslným "strašákem" - matematikou. Mnoho lidí má z modelů strojního učení a umělé inteligence příliš velký respekt. Mají pocit, že musí skvěle zvládat matematiku, aby tyto modely mohly pochopit a používat. Tuto obavu ovšem vůbec nemusíte mít. :) Všechny metody v kurzu budou vysvětlovány velmi intuitivní a vizuální. V kurzu se nachází minimum různých matematických zápisů a rovnic. Během kurzu nahlédneme „pod kapotu“ různých modelů a metod a pochopíme jak fungují i ​​bez komplexních matematických zápisů. Zároveň si však povíme o všech důležitých předpokladech, které musíme splnit, aby se v našem modelu něco nezkazilo.

Kurz je přímým pokračováním našeho kurzu Vytváření atributů pro Machine Learning v Pythonu, ve kterém učíme o správné přípravě dat pro machine learning modely. Doporučujeme tedy nejprve absolvovat tento kurz, abyste získali potřebné základy práce se scikit-learn knihovnou. Kromě toho se prosím ujistěte, že splňujete vstupní požadavky popsané níže:

  • zvládáte práci s Jupyter notebooky,
  • dokážete pracovat s knihovnou pandas a zpracovávat v ní data,
  • víte co jsou Numpy pole a zvládáte základní operace s nimi,
  • máte základní konceptuální přehled o světě Data Science a přístupech změny dat na
  • hodnotné informace (popis, objevování, inference, prediktivní modelování),
  • zvládáte středoškolskou matematiku a základy deskriptivní statistiky (průměr, medián, modus, variabilita, atd.).

Co po kurzu dokážete a co si odnesete?

V posledních letech firmy nabízejí mnoho pozic s názvem „Data Scientist“. Obvyklým požadavkem je schopnost aplikovat prediktivní modelování v Pythonu. Přesně tuto schopnost získáte v kurzu. Absolventi tohoto kurzu často fungují na pozici „Junior Data Scientist“, případně jsou v roli „experimentátorů“. Experimentují s různými daty ve firmách a vytvářejí jednoduché prototypy modelů strojního učení. Pokud se nějaký z těchto experimentů vydaří, začnou spolupracovat se zkušenějšími data scientisty na vytvoření kompletního produktu datové vědy z jejich časného prototypu.

Z kurzu si odnesete praktické zkušenosti s vytvářením modelů strojního učení nad strukturovanými daty. Budete vědět, jak fungují algoritmy prediktivních modelů a ovládat různé evaluační techniky na základě použitého modelu.

V případě, že směřujete v budoucnosti do Data Science pozice, která vyžaduje i práci se zpracováním obrázků a textu pomocí machine learningu, můžete přímo pokračovat do dalšího kurzu s názvem “Neuronové sítě, machine learning pro text a obrázky”.

Co je potřeba k absolvování kurzu Machine Learning v Pythonu

  • Vlastní laptop. Firemní laptop může způsobovat problémy, například, při přístupech na Google Drive prostředí nebo při instalaci knihoven.
  • Základní znalost angličtiny: Minimální pasivní znalost na úrovni čtení textu jelikož pro knihovny, o kterých se budeme učit jsou vytvořeny dokumentace v anglickém jazyce. Všechny video tutoriály jsou však ve slovenském jazyce.
  • Stabilní internetové připojení. Pro sledování video lekcí či práci na cvičeních je internetové připojení neustále zapotřebí.
  • Aktualizovaný internetový prohlížeč Google Chrome, Microsoft Edge nebo Mozilla Firefox.
  • (doporučeno) Google účet. S Jupyter notebooky doporučujeme pracovat v prostředí Google Colaboratory. V případě, že Google účet nemáte a ani si jej nechcete zakládat, bude k dispozici druhá alternativa pro lokální práci s Jupyter notebooky.

Co všechno s kurzem Machine Learning v Pythonu získáte

  • 15 Jupyter notebooků, ve kterých si nejen prakticky vyzkoušíte jednotlivé koncepty, ale můžete je používat jako osobní referenci ve vašem (budoucím) zaměstnání,
  • video tutoriály o Machine Learningu v Pythonu,
  • moderované diskusní fórum, ve kterém na vaše dotazy odpovídá autor kurzu Róbert Barcík,
  • certifikát o absolvování online kurzu Machine Learning v Pythonu,
  • garance vrácení peněz do 14 dnů v případě nespokojenosti s kurzem.

Seznam kapitol

Vitajte v kurze!
O tomto kurze
Dostupné pouze po zakoupení přístupu
Nastavovanie prostredia a materiály na stiahnutie
Dostupné pouze po zakoupení přístupu
1. Prvotný (baseline) model
Vitajte v kapitole!
Dostupné pouze po zakoupení přístupu
Základná intuícia prvotného modelu
Dostupné pouze po zakoupení přístupu
Dummy classifier a Dummy regressor
Dostupné pouze po zakoupení přístupu
Baseline model založený na heuristike
Dostupné pouze po zakoupení přístupu
2. Evaluácia modelu
Vitajte v kapitole!
Dostupné pouze po zakoupení přístupu
Tréningové, zadržané a produkčné dáta
Dostupné pouze po zakoupení přístupu
Krížová validácia (cross validation)
Dostupné pouze po zakoupení přístupu
Obšírna intuícia
Dostupné pouze po zakoupení přístupu
Vypočítanie CV metrík
Dostupné pouze po zakoupení přístupu
Iterátory pre krížovú validáciu
Dostupné pouze po zakoupení přístupu
Vyhodnotenie klasifikačného modelu
Dostupné pouze po zakoupení přístupu
Vyhodnotenie regresného modelu
Dostupné pouze po zakoupení přístupu
Je náš model dostatočné dobrý?
Dostupné pouze po zakoupení přístupu
3. Prahové hodnoty a krivky
Prahové hodnoty a krivky
Dostupné pouze po zakoupení přístupu
4. Kompozitný kód
Vitajte v kapitole!
Dostupné pouze po zakoupení přístupu
ColumnTransformer
Dostupné pouze po zakoupení přístupu
Vyberanie atribútov v ColumnTransformeri
Dostupné pouze po zakoupení přístupu
Pipeline
Dostupné pouze po zakoupení přístupu
Komplexnejšie kompozity
Dostupné pouze po zakoupení přístupu
5. Tuning hyperparametrov
Vitajte v kapitole!
Dostupné pouze po zakoupení přístupu
Hyperparameter grid
Dostupné pouze po zakoupení přístupu
Odhadovanie času hľadania
Dostupné pouze po zakoupení přístupu
Kompozity a tuning hyperparametrov
Dostupné pouze po zakoupení přístupu
6. Rozhodovací strom (Decision Tree)
Vitajte v kapitole!
Dostupné pouze po zakoupení přístupu
Úvod do rozhodovacích stromov
Dostupné pouze po zakoupení přístupu
Predikovanie pomocou rozhodovacieho stromu
Dostupné pouze po zakoupení přístupu
Rozhodovacie stromy pre regresné problémy
Dostupné pouze po zakoupení přístupu
Hyperparametre rozhodovacích stromov
Dostupné pouze po zakoupení přístupu
7. Náhodný les (Random Forest)
Vitajte v kapitole!
Dostupné pouze po zakoupení přístupu
Prístup ensemble modelov
Dostupné pouze po zakoupení přístupu
Hyperparametre náhodného lesa
Dostupné pouze po zakoupení přístupu
Dôležitosť atribútov v náhodnom lese
Dostupné pouze po zakoupení přístupu
8. Algoritmy založené na meraní vzdialenosti
Vitajte v kapitole!
Dostupné pouze po zakoupení přístupu
Intuícia modelov založených na vzdialenosti
Dostupné pouze po zakoupení přístupu
kNN (k-Nearest Neighbors) algoritmus
Dostupné pouze po zakoupení přístupu
Rôzne spôsoby merania vzdialenosti
Dostupné pouze po zakoupení přístupu
rNN (Radius-nearest Neighbors) algoritmus
Dostupné pouze po zakoupení přístupu
9. Základy nevybalansovaných dát
Nevybalansované dáta
Dostupné pouze po zakoupení přístupu
10. Lineárna regresia
Úvod do lineárnych modelov
Dostupné pouze po zakoupení přístupu
Uvedenie do problému
Dostupné pouze po zakoupení přístupu
Viacnásobná lineárna regresia
Dostupné pouze po zakoupení přístupu
Chyby lineárnej regresie
Dostupné pouze po zakoupení přístupu
Regresné metriky
Dostupné pouze po zakoupení přístupu
Trénovanie lineárnej regresie
Dostupné pouze po zakoupení přístupu
Odľahlé hodnoty (outliers)
Dostupné pouze po zakoupení přístupu
Interpretácia lineárnej regresie a ako interpretovať prienik
Dostupné pouze po zakoupení přístupu
Interpretácia sklonu jednoduchej lineárnej regresie
Dostupné pouze po zakoupení přístupu
Interpretácia sklonu vo viacnásobnej lineárnej regresii
Dostupné pouze po zakoupení přístupu
Porovnávanie vplyvu vstupných premenných na výstup
Dostupné pouze po zakoupení přístupu
Interpretácia koeficientov kategorických premenných
Dostupné pouze po zakoupení přístupu
Interpretácia premenných v modeli so zmiešanými typmi premenných
Dostupné pouze po zakoupení přístupu
Zhrnutie
Dostupné pouze po zakoupení přístupu
11. Regularizované lineárne modely
Polynomiálna regresia
Dostupné pouze po zakoupení přístupu
Kolinearita - polynomiálna regresia
Dostupné pouze po zakoupení přístupu
Kolinearita - dummy pasca
Dostupné pouze po zakoupení přístupu
Pretrénovanie / podtrénovanie
Dostupné pouze po zakoupení přístupu
Regularizácia
Dostupné pouze po zakoupení přístupu
Alpha
Dostupné pouze po zakoupení přístupu
Regularizované modely
Dostupné pouze po zakoupení přístupu
Ktorý regularizovaný model si vybrať
Dostupné pouze po zakoupení přístupu
12. Logistická regresia
Úvod do logistickej regresie
Dostupné pouze po zakoupení přístupu
Klasifikačný problém a príklady použitia
Dostupné pouze po zakoupení přístupu
Binárna logistická regresia
Dostupné pouze po zakoupení přístupu
Binárna logistická regresia - predpovede triedy
Dostupné pouze po zakoupení přístupu
Polynomiálna logistická regresia
Dostupné pouze po zakoupení přístupu
Koeficienty
Dostupné pouze po zakoupení přístupu
Nákladová funkcia
Dostupné pouze po zakoupení přístupu
Viactriedna klasifikácia
Dostupné pouze po zakoupení přístupu
Príprava dát
Dostupné pouze po zakoupení přístupu
13. Zhlukovanie
Úvod do učenia bez učiteľa
Dostupné pouze po zakoupení přístupu
Úvod do zhlukovania
Dostupné pouze po zakoupení přístupu
K-means
Dostupné pouze po zakoupení přístupu
K-means tipy
Dostupné pouze po zakoupení přístupu
DBSCAN
Dostupné pouze po zakoupení přístupu
DBSCAN tipy
Dostupné pouze po zakoupení přístupu
14. Redukcia dimenzionality
Úvod do redukcie dimenzionality
Dostupné pouze po zakoupení přístupu
PCA
Dostupné pouze po zakoupení přístupu
PCA tipy
Dostupné pouze po zakoupení přístupu
Učenie manifoldu
Dostupné pouze po zakoupení přístupu
15. Detekcia anomálií
Úvod do detekcie anomálií
Dostupné pouze po zakoupení přístupu
Faktor lokálnej odľahlej hodnoty (Local Outlier Factor)
Dostupné pouze po zakoupení přístupu
Izolujúci les (Isolation Forest)
Dostupné pouze po zakoupení přístupu
Čo ďalej?
Diskusia a hodnotenie
Dostupné pouze po zakoupení přístupu
Gratulujem! Čo ďalej?
Dostupné pouze po zakoupení přístupu

Podívej se i na tyto kurzy

9 Online kurzů
1 Příspěvků
Přejít na kanál

Rekvalifikovat se dnes může každý

Ať už jsi zaměstnaný, OSVČ nebo teprve hledáš práci, jsi tu správně. Nakopni svou kariéru pomocí vzdělávacího programu v oboru, který tě zajímá.