Modele liniare generalizate - curs 3600 rub. de la Educație deschisă, formare 3 săptămâni, aproximativ 6 ore pe săptămână, Data 29 noiembrie 2023.
Miscelaneu / / December 01, 2023
Una dintre condițiile pentru aplicabilitatea modelelor liniare convenționale este independența observațiilor unele față de altele, pe baza cărora este selectat modelul. Cu toate acestea, în practică există adesea situații în care proiectarea colecției de materiale este astfel încât încălcarea acestei condiții este inevitabilă. Imaginați-vă că ați decis să construiți un model care să descrie relația dintre performanța educației fizice și scorurile la testele de IQ în rândul elevilor. Pentru a rezolva această problemă, ați făcut numeroase mostre la mai multe instituții. Este posibil să combinați astfel de date într-o singură analiză, construită după schema tradițională? Desigur că nu. Studenții din fiecare universitate pot fi similari între ei în anumite privințe. Chiar și natura relației dintre cantitățile studiate poate fi oarecum diferită. Acest tip de date, în care există corelații intragrup, ar trebui analizate folosind modele mixte liniare. Vom arăta că unii predictori ar trebui să fie incluși în model ca așa-numiți „factori aleatori”. Veți învăța că factorii aleatori pot fi subordonați ierarhic. Vom discuta cum pot fi construite astfel de modele mixte pentru variabile dependente care urmează diferite tipuri de distribuții. În plus, vom arăta că partea aleatorie a modelului poate fi și mai complexă - poate avea o componentă care modelează comportamentul varianței ca răspuns la influența unei covariate. La sfârșitul cursului, veți găsi un proiect în care puteți exersa construirea de modele mixte alegând unul dintre mai multe seturi de date. Pe baza analizei acestor date, puteți crea un raport în tradiția cercetării reproductibile.
Profesor asociat, Departamentul de Zoologie Nevertebrate, Facultatea de Biologie, Universitatea de Stat din Sankt Petersburg, Ph.D.
Interese științifice: structura și dinamica comunităților bentos marine, scale spațiale, succesiune, interspecifice și intraspecifice interacțiuni biotice, creștere și reproducere a nevertebratelor marine, structura demografică a populațiilor, microevoluție, biostatistica.
Cursul este format din 4 module:
1) Introducere în modelele liniare generalizate
Modelele liniare generalizate (GLM) vă permit să modelați comportamentul mărimilor care nu urmează o distribuție normală. Pentru a vă ușura primii pași în lumea GLM, vom analiza structura acestora folosind exemplul GLM pentru cantități distribuite normal - astfel puteți face paralele cu modele liniare simple. Veți învăța ce este o funcție de legătură, cum funcționează probabilitatea maximă și cum să testați ipotezele GLM utilizând teste Wald și teste ale raportului de probabilitate.
2) Problemă de selecție a modelului
În acest modul vom vorbi despre aspectele metodologice asociate modelelor de construcție. Un model este o reprezentare simplificată a realității, iar alegerea dintre diferite metode concurente de astfel de simplificare este o sarcină frecventă pentru analist. În acest modul, veți învăța să comparați modele folosind criterii de informare. Vom discuta principalele opțiuni pentru analiză atunci când alegem modele și vom vorbi despre dificultățile care apar în legătură cu multiplicitatea ascunsă a modelelor. În cele din urmă, vă vom învăța să recunoașteți principalele tipuri de abuzuri de selecție a modelelor (pescuitul de date, p-hacking).
3) Modele liniare generalizate pentru numărarea datelor
În acest modul vom discuta metode de bază pentru modelarea cantităților numărabile. În primul rând, vom discuta de ce modelele liniare convenționale nu sunt potrivite pentru numărarea datelor. Proprietățile distribuțiilor numărabile vă vor ajuta să înțelegeți diferențele dintre tipurile de GLM pentru date numărabile și caracteristicile diagnosticării acestora. Veți vedea funcția de legătură în funcțiune atunci când vizualizați predicțiile GLM la scara funcției de legătură și la scara variabilei de răspuns.
4) Modele liniare generalizate cu răspuns binar
Uneori este nevoie de a simula dacă un eveniment a avut loc sau nu, dacă echipă de fotbal sau pierdut, dacă pacientul și-a revenit după tratament sau nu, dacă clientul a comis cumpărare sau nu. Modelele liniare convenționale nu sunt potrivite pentru modelarea unor astfel de date binare (evenimente cu două rezultate), dar acest lucru poate fi realizat cu ușurință folosind modele liniare generalizate. În acest modul, veți învăța să modelați probabilitățile evenimentelor care au loc prin reprezentarea lor ca cote. Vom analiza cum funcționează funcția logit link și cum sunt interpretați coeficienții GLM atunci când este utilizată. În cele din urmă, veți putea exersa analiza modelelor liniare generalizate cu diferite distribuții prin finalizarea unui proiect de analiză a datelor. Rezultatele acestei analize vor trebui prezentate ca un raport în format html, scris folosind rmarkdown/knitr.
• Aflați ce abilități sunt necesare pentru a începe în analiză și știința datelor• Învățați să utilizați Excel, SQL, Power BI, Google Data Studio pentru a lucra cu date și scrieți primul cod în Python• Obțineți un ghid pas cu pas și aflați cum să intrați în domeniul științei datelor și să alegeți un rol în Știința datelor
4,4
1 490 ₽