Big Data și Data Science: trece la nivelul următor - curs gratuit de la Stepik, instruire 11 lecții, Data 28 noiembrie 2023.
Miscelaneu / / November 29, 2023
Dacă știți deja puțin despre Data Science și doriți să continuați să învățați, să completați golurile și să practicați mai mult, acest curs este pentru dvs. Ca parte a programului, veți aprofunda în domeniul științei datelor - a se familiariza cu arhitectura MapReduce și ecosistemul Apache Hadoop, înțelegeți designul Apache Spark și Apache Parquet și stăpâniți elementele de bază ale rețelelor neuronale și arhitecturile acestora. De asemenea, veți învăța cum să efectuați analize de afaceri cu Power BI și de ce abilități soft are nevoie un manager de proiect.
Scopul cursului este de a vă atrage atenția asupra Big Data și Data Science, prin urmare toate materialele cursului sunt cu scop informativ, fără a vă scufunda în toate complexitățile. Dacă sunteți interesat de o scufundare adâncă, atunci utilizați materialele suplimentare ale modulelor.
Cursul constă din cinci module care vă vor ajuta să creșteți sistematic în domeniul științei datelor și să pregătiți în timp util teoria dobândită în practică:
1. Scufundați-vă în știința datelor.
Amintiți-vă ce procese implică analiza datelor. Aflați elementele de bază despre cum funcționează stocarea pe termen lung. Veți lucra cu SQL folosind Oracle DBMS ca exemplu și veți crea prima dumneavoastră bază de date. Familiarizați-vă cu arhitectura MapReduce și ecosistemul Apache Hadoop.
2. Instrumente de prelucrare, analiză și vizualizare a datelor.
Aflați ce este Power BI și ce probleme pot fi rezolvate cu ajutorul acestuia. Învață să obții, să modelezi, să analizezi date și să construiești vizualizări.
3. Instrumente pentru lucrul cu date mari.
Veți înțelege cum funcționează Apache Spark, un instrument de lucru cu big data. Aflați formatul de stocare a datelor Apache Parquet și caracteristicile acestuia. De asemenea, uitați-vă la exemple de lucru cu Pyspark în blocnotesul Jupyter.
4. Sisteme de învățare automată.
Veți afla ce este valoarea p, de ce sunt necesare criteriile statistice necesare și cu ce sarcini ajută acestea. Aflați conceptul de rețele neuronale, caracteristicile acestora și arhitecturile de bază. Veți înțelege, de asemenea, cum să dezvoltați o abordare simplă și pragmatică a utilizării datelor mari.
5. Competențe soft și management de proiect.
Aflați principiile și tehnicile managementului de proiect. Luați în considerare cum funcționează ciclul de viață al unui proiect gestionat în paradigma Agile. Veți învăța, de asemenea, de ce abilități cheie soft are nevoie un expert pentru a-și dezvolta abilitățile de conducere și management de proiect.
Pentru cine este acest curs?
Cursul se adresează tuturor celor care au cunoștințe de bază despre Data Science și doresc să studieze în continuare domeniul. Cursul este, de asemenea, potrivit pentru specialiști în IT și domenii conexe care sunt interesați de utilizarea învățării automate în afaceri și absolvenți ai cursului „Big Data și Data Science: începeți scufundarea de la zero” care doresc să-și continue educația.
Cerințe inițiale
Pentru a face cursul clar și util, trebuie să aveți abilități avansate de alfabetizare computer și cunoștințe de bază de programare și SQL. Le puteți obține în cursul anterior al proiectului nostru - „Big Data și știința datelor: începeți-vă scufundarea de la zero”.
3
cursData Scientist, cercetător ML/DL, profesor
Experiență în analiză - 5 ani. A lucrat ca Data Scientist la PJSC Megafon. Conduce cursuri în Skillbox, Netology, Yandex. Atelier și alte proiecte educaționale. Vorbitor la conferința Big Data Days 2021.
Data Scientist freelancer, profesor și cercetător ML/DL, autor de curs. A lucrat ca cercetător în domeniul „Teoriei deciziei” în serviciul militar. Ulterior a colaborat cu companii mari și mici. Ex-DataScientist PJSC Megafon.
1
bineContribuim la dezvoltarea școlarilor și elevilor din regiunile rusești și orașele în curs de dezvoltare țărilor vecine, le transferăm experiența și expertiza universităților metropolitane, companii și mari internaționale hub-uri IT
Școala Rusă de Programare, prescurtată ca RSP, operează în domeniul educației copiilor și adulților în sfera IT și dezvoltare abilități soft în formatele de tabere de antrenament, mișcări în cerc, cursuri de master, seminarii web, ateliere, cursuri online și conferințe. Activitățile noastre educaționale se bazează pe intensitate și imersiune profundă în subiect, transferul experienței de la seniori și experimentați la începători, mentorat și voluntariat. Servim ideile de educație practică accesibilă și de a cultiva o nouă generație de personal pentru economia digitală a țării. Misiunea noastră este să ajutăm tinerii să devină lideri ai schimbării tehnologice.
Cunoștință
1. Salutari
Picaj
1. Introducere în știința datelor
2. Scufundați-vă în SQL
3. Date mare. Introducere în MapReduce. Introducere în ecosistemul Hadoop
Instrumente de prelucrare, analiză și vizualizare a datelor
1. Analizați datele în Power BI
Instrumente de date mari
1. Cadrul Apache Spark
Sisteme de învățare automată
1. Statistici pentru incepatori
2. Învățare automată în afaceri
3. Bazele rețelei neuronale
Competențe soft și management de proiect
1. Managementul proiectelor de date
Completare
1. Rezumatul cursului și rezultatele