Popis kurzu Business Analytik pro Data Science 2 (machine learning)
Jste připraveni prohloubit své znalosti o Data Science? V tomto kurzu se naučíte vytvářet atributy pro machine learningové modely, pochopíte principy strojového učení, poznáte různé rodiny modelů a naučíte se je správně používat. Také pochopíte jak vyhodnotit kvalitu prediktivních modelů a jak vypadá proces nasazení modelu do reálného světa, ve kterém může být využíván a přinášet skutečnou hodnotu.
Upozornění: V tomto kurzu se NEbudeme učit „hands-on“ Data Science. Tento kurz je pro Vás tedy vhodný i když nemáte v budoucnu plány programovat v Pythonu nebo SQL-ku. Pokud takové plány máte, tak Vás kurz naučí mnoho velmi potřebných konceptů, které v budoucnosti jistě i prakticky implementujete. Tento kurz je přirozeným pokračováním kurzu Business Analytik pro Data Science 1 (definování projektu).
Co se v kurzu Business Analytik pro Data Science 2 naučíte?
Projděme si jednotlivými kapitolami, které na Vás v kurzu Business Analytik pro Data Science II. čekají:
Inference a prediktivní modelování
Když už máme pojetí o našich datech, využití machine learningu a prediktivního modelování může být hodnotné. V této části kurzu si uvedeme základní principy prediktivního modelování. Například řekneme si proč je důležité nechat si část našich historických dat „bokem“ a neučit se z nich (takzvaný holdout set). Existují také různé filozofie využití prediktivních modelů – můžeme se například snažit o vytvoření jednoduchého modelu nebo modelu, který bude mít velmi vysokou přesnost. Existuje mnoho různých „rodin“ modelů strojního učení, které můžeme použít, a proto si je představíme (PS: tohle je opravdu zábavná část kurzu :) ). Představíme si lineární modely, rozhodovací stromy, náhodné lesy a dokonce i neuronové sítě! Všechny tyto znalosti použijeme v následující části kurzu.
Klasifikační a regresní problémy
Je čas jít do hloubky strojového učení a prediktivního modelování. Zaměříme se na dva základní problémy, se kterými se při supervised learningu můžeme setkat. Těmi jsou klasifikační a regresní problém. Pro vyřešení klasifikačního problému vybudujeme rozhodovací strom a pro vyřešení regresního problému zase lineární regresi. V obou případech se podíváme do srdce těchto machine learningových modelů, kde se nachází takzvaná „cost function“. No a nakonec se musíme zamyslet, jak vyhodnotit přesnost a úspěšnost těchto modelů. Povíme si tedy, například, o nástrojích jako „confusion matrix“ nebo „residual analysis“.
Uvedení modelu „do produkce“
Během kurzu jsme již vytvořili různé modely Data Science – od vizualizací až po modely strojového učení. Pokud je však necháme takříkajíc „na papíře“, tak z nich samozřejmě žádný užitek nebude. Potřebujeme je využívat v praxi a dát je do produkce. Tento poslední krok však není zcela přímočarý. Náš model potřebujeme chápat jako experiment a počítat například s tím, že se různé věci mohou pokazit. Nemusíte se však bát, o všem podstatném si povíme v poslední části kurzu!
Co po kurzu Business Analytik pro Data Science II. dokážete a co si odnesete?
- Znalost o základních principech prediktivního modelování – například, co je to holdout set nebo jaký je rozdíl mezi „statistical learning“ a „machine learning“.
- Vědomost o srdci každého prediktivního modelu - "cost function" a jak ji model využívá při učení se z dat.
- Základní znalost o lineárních modelech, neuronových sítích, rozhodovacích stromech, distance-based modelech, ensemble modelech, algoritmech pro detekci anomálií a redukci dimenzionality.
- Schopnost vyhodnotit kvalitu klasifikačního a regresního modelu.
- Základní znalost o procesu nasazování machine learning modelu do reálného světa.
Má kurz Business Analytika pro Data Science II. vstupní požadavky?
Základní znalost principů Data Science. Můžete ji získat například pomocí našeho kurzu Poznej Data Science a Business Analytik pro Data Science 1 (definování projektu). Pokud jste tyto kurzy neabsolvovali tak je důležité, abyste:
- zvládali středoškolskou matematiku,
- věděli základní informace o tom, co je data science, machine learning, databáze nebo statistika,
- věděli o základních statistických nástrojích jako počítání průměru nebo směrodatné odchylky.
Žádné technické znalosti (jako například programování v Pythonu) nejsou potřebné.
Co vše v kurzu Business Analytik pro Data Science II. dostanete?
-
videotutoriály o Business Analytik pro Data Science 2 (machine learning),
- moderované diskusní fórum, ve kterém na vaše dotazy odpovídá lektor Róbert Barcík,
-
certifikát o absolvování online kurzu Business Analytik pro Data Science 2 (machine learning),
-
garance vrácení peněz do 14 dnů v případě nespokojenosti s kurzem.