Specializarea "Analist de date" - curs 2900 rub. de la Stepik, antrenament 36 de lecții, Data: 29 octombrie 2023.
Miscelaneu / / December 05, 2023
Analist de date, analist de produs, analist bază de clienți, analist CRM, data scientist - toate aceste profesii sunt legate de analiza datelor.
🎯 Cele mai bune cerințe pentru aceste profesii:
- Cunoștințe SQL și experiență de lucru cu baze de date;
- Cunoașterea sintaxei Python de bază și cunoașterea bibliotecii Pandas;
- Cunoașterea statisticii și capacitatea de a le aplica în analiza datelor;
- Gandire analitica.
Aceasta nu este o listă completă. De exemplu, analiștii web trebuie să cunoască Google Analytics și Yandex. Metrici, iar pentru oamenii de știință de date - învățarea automată. Dar am dat cerințele de bază care se regăsesc în 70-80% din posturi vacante.
Specializarea Data Analyst constă în prezent din două cursuri:
1️⃣ SQL pentru toată lumea
În timpul cursului, veți stăpâni SQL până la nivelul scrierii de interogări SQL complexe și veți exersa utilizarea datelor de la o companie comercială într-unul dintre cele mai populare sisteme de gestionare a bazelor de date.
Cursul este conceput pentru începătorii care doresc să stăpânească SQL, precum și pentru cei care cunosc SQL la un nivel de bază, dar doresc să completeze golurile și să-și consolideze cunoștințele în practică.
2️⃣ Python: Analiza datelor cu Pandas
Cursul este dedicat lucrărilor practice cu Pandas. Veți primi teoria necesară și o veți consolida cu un număr mare de probleme practice.
Cursul este potrivit pentru cei care sunt deja familiarizați cu sintaxa de bază Python:
- Cunoaște tipurile de date de bază (inclusiv liste și dicționare) și operațiunile asupra acestora;
- Are o înțelegere a ceea ce sunt o funcție și o metodă.
Cursul poate fi urmat chiar și de către începători care își pot da seama în mod independent cum să instaleze Python și biblioteca Pandas. Dar, dacă abia începi să folosești Python, va trebui să ajungi din urmă pe cont propriu câteva lucruri de bază pe măsură ce cursul progresează. Apropo, puteți obține cunoștințe de bază despre sintaxa Python în acest curs. Atunci învățarea Panda va fi mult mai ușoară.
Conceptul cursurilor se bazează pe trei principii:
Simplitate
Prezentarea materialului este accesibilă și consecventă - acest lucru vă va permite să formați baza de cunoștințe necesară pas cu pas.
Practică
Se acordă multă atenție practicii - astfel încât nu numai să rezolvi problemele cursului, dar și să poți aplica cunoștințele în viitor, pe proiecte reale.
A sustine
Simțiți-vă liber să puneți întrebări în comentarii, este important pentru mine ca tot materialul să fie învățat. Răspund la comentarii într-o zi.
Ordinea în care sunt urmate cursurile nu este importantă.
1. SQL pentru toată lumea
Operații pe o singură masă
1. Introducere în baza de date
2. Filtrarea rândurilor WHERE. Expresii regulate LIKE. ȘI și SAU
3. Sortarea șirurilor ORDER BY
4. Funcții de agregare: COUNT, SUM, MIN, MAX, AVG. Aliasuri
5. Gruparea liniilor GROUP BY și HAVING. Generarea de rapoarte
6. Practică bazată pe rezultatele primului modul
Operații pe mai multe tabele
1. Concepte de cheie primară și cheie străină. Tipuri de relații în baza de date
2. Generarea de interogări din mai multe tabele. INNER JOIN și Aliasuri
3. LEFT JOIN și alte tipuri de JOIN
4. Unirea mai multor mese folosind UNION și UNION ALL
5. Subinterogări
6. Practică bazată pe rezultatele celui de-al 2-lea modul
Subiecte importante suplimentare
1. expresie CASE
2. Funcții populare pentru lucrul cu șiruri
Sarcini practice pentru consolidarea materialului de curs
1. Interogări simple
2. Interogări complexe
3. Concluzie
2. Python: Analiza datelor cu Pandas
Analizarea cadrelor de date individual
1. Citirea datelor din fișiere
2. Introducere expresă a datelor
3. Ieșire pe coloană
4. Tipuri de date
5. Filtrarea rândurilor
6. Expresii obisnuite
7. Sortarea șirurilor
8. Funcții de agregare
9. Gruparea rândurilor
Analiza mai multor cadre de date asociate
1. Fuzionați a. k. o alaturare
2. Concatenare
Modul suplimentar necesar
1. Lucrul cu date și ore
2. Tabele pivot
3. Noi moduri de a crea cadre de date
4. Categorizarea caracteristicilor nominale
5. Înlocuirea valorilor într-un cadru de date
6. Vizualizarea în panda
7. Tăierea
8. Concluzie