Învățarea automată în practică - curs 41.500 rub. de la IBS Training Center, antrenament 24 de ore, Data 26 noiembrie 2023.
Miscelaneu / / December 02, 2023
Cursul este construit în jurul mai multor cazuri practice care conțin tabele cu date inițiale.
Pentru fiecare caz, parcurgem întregul ciclu de viață al unui proiect de învățare automată:
cercetarea, curățarea și pregătirea datelor,
alegerea unei metode de antrenament adecvate sarcinii (regresie liniară pentru regresie, pădure aleatoare pentru clasificare, K-means și DBSCAN pentru grupare),
antrenament folosind metoda aleasă,
evaluarea rezultatelor,
optimizarea modelului,
prezentarea rezultatului către client.
În cadrul părții de discuții a cursului, discutăm probleme practice cu care se confruntă studenții care pot fi rezolvate folosind metodele discutate.
Subiecte acoperite:
1. Revizuirea sarcinii (teorie – 1 oră)
Ce probleme sunt rezolvate bine prin învățarea automată și ce probleme încearcă să rezolve?
Ce se întâmplă dacă, în loc de Data Scientist, angajezi un nespecialist în domeniu (doar un dezvoltator/analist/manager) cu așteptarea că va învăța în acest proces.
2. Pregătire, curățare, cercetare de date (teorie – 1 oră, practică – 1 oră)
Cum să înțelegeți sursa datelor de afaceri (și, în general, să detectați orice ordine în ele).
Secvența prelucrării.
Ce poate și ar trebui să fie delegat analiștilor de domeniu și ce este cel mai bine făcut de Data Scientist însuși.
Priorități pentru rezolvarea unei probleme specifice.
3. Clasificatori și regresori (teorie – 2 ore, practică – 2 ore)
Secțiune practică - sarcini bine formalizate cu date pregătite.
Diferența între sarcini (clasificare binară/non-binară/probabilistă, regresie), redistribuirea sarcinilor între clase.
Exemple de clasificare a problemelor practice.
4. Clustering (teorie – 1 oră, practică – 2 ore)
Unde și cum se efectuează gruparea: cercetarea datelor, verificarea enunțului problemei, verificarea rezultatelor.
Ce cazuri pot fi reduse la grupare.
5. Evaluare model (teorie – 1 oră, practică – 1 oră)
Valori de afaceri și metrici tehnice.
Metrici pentru probleme de clasificare și regresie, matrice de erori.
Măsuri interne și externe ale calității grupării.
Validare încrucișată.
Evaluarea recalificării.
6. Optimizare (teorie – 5 ore, practică – 3 ore)
Ce face ca un model să fie mai bun decât altul: parametri, caracteristici, ansambluri.
Gestionarea setărilor.
Practică de selecție a caracteristicilor.
Revizuirea instrumentelor pentru găsirea celor mai buni parametri, caracteristici și metode.
7. Diagrame, rapoarte, lucru cu sarcini live (teorie – 2 ore, practică – 2 ore)
Cum să explici clar ce se întâmplă: ție, echipei, clientului.
Răspunsuri mai frumoase la întrebări fără sens.
Cum să prezentați trei terabytes de rezultate pe un singur diapozitiv.
Teste semi-automate, care puncte de control al procesului sunt cu adevărat necesare.
De la sarcini live la un proces complet de cercetare și dezvoltare („R&D în practică”) - analiza și analiza sarcinilor din partea publicului.