Statystyczna Analiza Danych z pakietem SAS
Informacje ogólne
Kod przedmiotu: | 1101-4`SAS |
Kod Erasmus / ISCED: |
11.203
|
Nazwa przedmiotu: | Statystyczna Analiza Danych z pakietem SAS |
Jednostka: | Wydział Fizyki |
Grupy: |
Fizyka, II stopień; przedmioty do wyboru Fizyka, II stopień; przedmioty sp. "Metody fizyki w ekonomii (ekonofizyka)" Przedmioty do wyboru dla doktorantów; Przedmioty obieralne na studiach drugiego stopnia na kierunku bioinformatyka |
Punkty ECTS i inne: |
(brak)
|
Język prowadzenia: | polski |
Skrócony opis: |
Zajęcia przeznaczone są dla studentów, którzy chcą poznać schemat pracy z systemem SAS, na przykładzie przeprowadzania w nim analiz statystycznych. Głównym celem kursu jest wprowadzenie studentów w środowisko pracy związane z oprogramowaniem SAS, a w szczególności zapoznanie ich z najważniejszymi procedurami i regułami tworzenia kodów i makr. Dodatkowym celem kursu jest przekazanie studentom umiejętności wstępnej analizy danych, z położeniem nacisku na graficzną część tego zagadnienia. Bazując na wstępnej analizie, po zakończeniu kursu student powinien posiadać umiejętność doboru i praktycznego wykorzystania popularnych metod statystycznych (testy parametryczne, nieparametryczne, ANOVA, analiza regresji, regresja logistyczna). |
Pełny opis: |
Zajęcia przeznaczone są dla studentów, którzy chcą poznać schemat pracy z systemem SAS, na przykładzie przeprowadzania w nim analiz statystycznych. Głównym celem kursu jest wprowadzenie studentów w środowisko pracy związane z oprogramowaniem SAS, a w szczególności zapoznanie ich z najważniejszymi procedurami i regułami tworzenia kodów i makr. Dodatkowym celem kursu jest przekazanie studentom umiejętności wstępnej analizy danych, z położeniem nacisku na graficzną część tego zagadnienia. Bazując na wstępnej analizie, po zakończeniu kursu student powinien posiadać umiejętność doboru i praktycznego wykorzystania popularnych metod statystycznych (testy parametryczne, nieparametryczne, ANOVA, analiza regresji, regresja logistyczna). 1. Zajęcia organizacyjne, omówienie zasad zaliczenia. 2. Tworzenie zbiorów danych, krok DATA, krok PROC. 3. Wczytywanie danych z pliku i zapisywanie danych, formaty zmiennych, informatyk 4. Przetwarzanie zbiorów danych: przygotowanie danych do analizy, usuwanie i modyfikowanie zmiennych, wybieranie i usuwanie obserwacji, ograniczanie zbiorów danych, sortowanie, poziome i pionowe łączenie zbiorów, transpozycja zbiorów, opisywanie zbiorów. 5. Analiza graficzna 1. Analiza rozkładu: histogramy, wykresy pudełkowe, wykres pień i liście, empiryczna dystrybuanta, wykres prawdopodobieństwo-prawdopodobieństwo i kwanty-kwantyl, przybliżanie empirycznego rozkładu zmiennej za pomocą rozkładu teoretycznego. 6. Analiza graficzna 2: wykres rozrzutu, wykresy szeregów czasowych, dwuwymiarowy rozkład normalny, wykresy do analizy zależności pomiędzy zmiennymi dyskretnymi: wykresy asocjacji, analiza korespondencji. 7. Analiza graficzna 3: wykresy słupkowe, wykresy kołowe, graficzna prezentacja danych geograficznych. 8. Weryfikacja hipotez dotyczących średnich – jedna i dwie próby, w tym próby zależne i niezależne (m.in. procedura TTEST). 9. Nieparametryczne testy istotności (m.in. procedura NPAR1WAY): m.in. test znaków, test zgodności, test Wilcoxona, test Manna-Whitneya, test Kolmogorowa-Smirnowa, test Kruskala-Wallisa. 10. Analiza współzależności zmiennych: analiza korelacji i test chi2. 11. Analiza wariancji ANOVA i testy post-hoc. 12. Analiza regresji: estymacja parametrów, ocena istotności zmiennych, ocena stopnia dopasowania modelu, interpretacja oszacowań. 13. Analiza regresji: efekty cząstkowe, elastyczności, semielastyczności; dodawanie do modelu zmiennych dyskretnych i interakcji, testy diagnostyczne. 14. Regresja logistyczna: istota regresji logistycznej, estymacja parametrów, efekty krańcowe, ilorazy szans. |
Literatura: |
SAS: OnlineDoc G. Der, B. Everitt (2002), A Handbook of Statistical Analysis using SAS, Chapman&Hall / CRC, wyd. 2 P.Francuz, R.Mackiewicz, Liczby nie wiedzą skąd pochodzą, Wydawnictwa KUL, 2005 |
Efekty uczenia się: |
Po odbyciu kursu student powinien znać składnię kodów pakietu SAS w stopniu pozwalającym na swobodną „obróbkę” wejściowych danych statystycznych, przeprowadzeniu na nich wstępnej graficznej analizy relacji między zmiennymi oraz późniejsze wnioskowanie oparte na stosownie dobranych formalnych metodach statystycznych. Strona teoretyczna kursu powinna ułatwić studentom wybór metod statystycznych najlepiej dopasowanych do specyfiki badanego problemu, zaś praktyczna – umożliwić praktyczne wykorzystanie tych metod w oprogramowaniu SAS. |
Metody i kryteria oceniania: |
Podstawą zaliczenia jest obecność (30%) oraz rozwiązanie zadań zaliczeniowych (70%). Zaliczenie odbędzie się na ostatnich zajęciach – studenci otrzymają zestaw problemów tematycznie nawiązujących do przerobionego w trakcie kursu materiału. Oceniany będzie kod SASa, który student wygeneruje, jako rozwiązanie otrzymanego problemu. |
Właścicielem praw autorskich jest Uniwersytet Warszawski, Wydział Fizyki.