Curs „Specialist în știința datelor” - curs 112.000 rub. de la Yandex Workshop, training 8 luni, data 30 noiembrie 2023.
Miscelaneu / / November 28, 2023
Ce fac cercetătorii de date?
Analizați cantități mari de date, dezvoltați modele și aplicați învățarea automată pentru a face predicții și a identifica modele. Acestea sunt necesare în diverse domenii în care este nevoie de stocare și procesare a datelor.
În bănci
Analizați datele despre clienți și determinați ce indicatori le afectează bonitatea, preziceți probabilitatea ca clientul să părăsească banca
În industrie
Folosind învățarea automată, ei prezic când echipamentele vor eșua și în care exploatarea zăcămintelor va aduce cel mai mare profit.
În marketing și comerț
Ele ajută la găsirea punctelor de creștere analizând sezonalitatea, zilele de vârf de vânzări și creează un sistem de recomandare
În sectorul transporturilor
Optimizați funcționarea semafoarelor, evaluați sarcina pe drumuri și ajutați la ajustarea planurilor de reparații
Program complet de curs în Data Science
Îl actualizăm în mod regulat pentru a ne asigura că îndeplinește nevoile industriei și ale angajatorilor. Cu alte cuvinte, înveți doar ceea ce va fi cu siguranță util în munca ta.
Bazele Python și analiza datelor: Curs introductiv gratuit:
Aflați conceptele de bază ale analizei datelor și înțelegeți ce fac analiștii de date și oamenii de știință ai datelor. Rezolvați cinci cazuri de lucru cu date din zone diferite:
- aflați motivul defalcării masive a gadgeturilor,
- verificați rambursarea reclamei pentru aplicațiile mobile,
- găsiți cea mai bună locație pentru un magazin nou,
- vă ajută să alegeți o strategie de dezvoltare pentru un startup AI,
- evaluarea eficacității roboților în serviciul de asistență.
Rezolvând cazuri, veți învăța elementele de bază ale Python și a bibliotecii panda, veți învăța cum să construiți niște grafice și să le interpretați corect.
Introducere în profesia de „Data Science Specialist”
Ce este un specialist în știința datelor?
Cum predăm.
Python de bază:
Aprofundați în limbajul de programare Python și în biblioteca panda.
+1 proiect în portofoliu
Comparați datele utilizatorului Yandex. Muzică după oraș și ziua săptămânii.
Preprocesarea datelor:
Aflați să curățați datele de valori aberante, omisiuni și duplicate, precum și să convertiți diferite formate de date.
+1 proiect în portofoliu
Analizați datele despre clienții băncii și determinați ponderea celor solvabili.
Analiza exploratorie a datelor:
Aflați elementele de bază ale probabilității și statisticilor. Folosiți-le pentru a explora proprietățile de bază ale datelor, căutând modele, distribuții și anomalii. Faceți cunoștință cu bibliotecile scipy și matplotlib. Desenați diagrame și exersați analiza graficelor.
+1 proiect în portofoliu
Explorați arhiva de reclame pentru vânzarea de bunuri imobiliare din Sankt Petersburg și regiunea Leningrad.
Teoria probabilității. Curs suplimentar
Amintiți-vă sau recunoașteți termenii de bază din teoria probabilității: evenimente independente, opuse, incompatibile etc. Folosind exemple simple și probleme distractive, vei exersa lucrul cu numere și construirea logicii soluțiilor.
Acesta este un sprint opțional. Aceasta înseamnă că fiecare elev însuși alege una dintre opțiuni:
- Luați un curs suplimentar de zece lecții scurte, perfecționați teoria și rezolvați probleme.
- Deschideți doar blocul cu sarcini de interviu, amintiți-vă de practica fără teorie.
- Sari peste curs sau revino la el atunci cand este timp si nevoie.
Proiect final al primului modul
Aflați cum să efectuați cercetări preliminare de date și să formulați și să testați ipoteze.
+1 proiect în portofoliu
Găsiți modele care determină succesul jocului.
Introducere în învățarea automată:
Stăpânește conceptele de bază ale învățării automate. Cunoașteți biblioteca Scikit-Learn și utilizați-o pentru a crea primul proiect de învățare automată.
+1 proiect în portofoliu
Dezvoltarea unui sistem de recomandare tarifară pentru un operator de telefonie mobilă.
Antrenament tutorat:
Scufundați-vă mai adânc în cel mai tare domeniu al învățării automate: învățarea supravegheată. Aflați cum să gestionați datele dezechilibrate.
+1 proiect în portofoliu
Preziceți probabilitatea ca un client să părăsească banca.
Învățare automată în afaceri:
Aflați cum învățarea automată (abrev. MO) ajută afacerea cu privire la modul de colectare a datelor și la modul în care valorile produsului se raportează la valorile MO. Aflați să lansați o nouă funcționalitate de serviciu folosind ML. Aflați ce sunt valorile de afaceri, KPI-urile și testarea A/B.
+1 proiect în portofoliu
Antrenează un model care ajută la identificarea unei noi locații pentru producția de petrol cu cel mai mic risc de pierdere.
Proiect final al celui de-al doilea modul:
Pregătiți datele pentru învățarea automată. Folosind modelul, evaluați-i calitatea.
+1 proiect în portofoliu
Simulați procesul de topire a minereului de aur pentru a îmbunătăți funcționarea întreprinderii.
Algebră liniară:
Aruncați o privire în interiorul unora dintre algoritmii pe care i-ați învățat până acum și obțineți o mai bună înțelegere a modului de utilizare a acestora. În practică, stăpânește de la zero conceptele principale ale algebrei liniare: spații liniare, operatori liniari, spații euclidiene.
+1 proiect în portofoliu
Utilizați metoda de conversie a datelor pentru a proteja informațiile personale ale clienților companiei de asigurări.
Metode numerice:
Veți analiza o serie de algoritmi și îi veți adapta pentru a rezolva probleme practice folosind metode numerice. Stăpânește calcule aproximative, estimări ale complexității algoritmului și coborâre a gradientului. Aflați cum sunt antrenate rețelele neuronale și ce este creșterea gradientului.
+1 proiect în portofoliu
Dezvoltați un model pentru a determina costul unei mașini second hand.
Serii temporale:
Serii cronologice descriu modul în care parametrii, cum ar fi consumul de energie electrică sau numărul de comenzi de taxi, se modifică în timp. Vei învăța să analizezi seriale, să cauți tendințe și să identifici sezonalitatea. Aflați cum să creați date tabelare și o problemă de regresie în serie de timp.
+1 proiect în portofoliu
Construiți un model și preziceți încărcăturile maxime de taxi.
Învățare automată pentru texte:
Învață să faci vectori numerici din texte și să rezolvi probleme de clasificare și regresie pentru ei. Aflați cum sunt calculate caracteristicile TF-IDF și familiarizați-vă cu reprezentările limbajului word2vec și BERT.
+1 proiect în portofoliu
Accelerează moderarea comentariilor în comunitatea ta prin automatizarea evaluărilor de toxicitate.
SQL de bază:
Aflați elementele de bază ale limbajului de interogare SQL și algebrei relaționale pentru lucrul cu bazele de date. Familiarizați-vă cu caracteristicile de lucru în PostgreSQL, un sistem popular de gestionare a bazelor de date (abbr. DBMS). Învățați să scrieți interogări cu diferite niveluri de complexitate și să traduceți problemele de afaceri în SQL.
Veți lucra cu o bază de date a unui magazin online specializat în filme și muzică.
+1 proiect în portofoliu
Scrieți o serie de interogări de complexitate diferită într-o bază de date care stochează date despre investitorii de risc, startup-urile și investițiile în acestea.
Viziune computerizată:
Învață să rezolvi probleme simple de vedere pe computer folosind rețele neuronale gata făcute și biblioteca Keras. Faceți cunoștință cu Deep learning.
+1 proiect în portofoliu
Construiți un model pentru a determina vârsta aproximativă a unei persoane dintr-o fotografie.
Învățare nesupravegheată:
Învățarea nesupravegheată este una dintre metodele de învățare automată în care sistemul rezolvă o problemă fără date pre-etichetate pe baza caracteristicilor și structurii sale. Aflați despre problemele de grupare și de detectare a anomaliilor.
Proiect de absolvire:
În ultimul proiect, confirmați că ați stăpânit o nouă profesie. Clarificați sarcina clientului și parcurgeți toate etapele analizei datelor și învățării automate. Acum nu există lecții sau teme - totul este ca la un loc de muncă adevărat.
+1 proiect în portofoliu
Proiect din care să alegi:
- Construiți un model care prezice creșterea clienților de la o companie de telecomunicații.
- Construiți un model care prezice parametrii procesului tehnologic la o uzină metalurgică.
D
daryamanannikova
01.10.2020 G.
Exemplu de cursuri online ideale
În Yandex. În timpul atelierului, studiez profesia de DataScience, o direcție destul de la modă acum și, după cum s-a dovedit, este destul de greu, după cum se spune, greu de învățat - ușor de luptat. (adsbygoogle = window.adsbygoogle || []).push({}); Au fost multe greutăți pe drum, nu aveam suficient timp (îmi iau diploma și lucram), mă părăsea periodic puterea de a înțelege statisticile, coronavirusul ne-a închis pe toți acasă...
S
sergen355
14.07.2021 G.
Mare proiect educațional
Avantaje: simulator propriu, revizuiri de proiecte, consultații, comunitate în Slack, ajutor pentru fiecare problemă. Dezavantaje: singurul negativ este că în unele subiecte nu există material complet în simulator, este nevoie de timp suplimentar pentru căutarea independentă a informațiilor.Am studiat la Facultatea de Știința Datelor. Format bun de antrenament. Unii intră, alții nu. Dar pentru mine, acesta este maximul...