Statystyka i bazy danych
Informacje ogólne
Kod przedmiotu: | 1200-2BLOK4-CHW4 |
Kod Erasmus / ISCED: |
13.3
|
Nazwa przedmiotu: | Statystyka i bazy danych |
Jednostka: | Wydział Chemii |
Grupy: |
Chemia i biologia strukturalna (S2-CH) |
Punkty ECTS i inne: |
1.50
|
Język prowadzenia: | polski |
Kierunek podstawowy MISMaP: | chemia |
Rodzaj przedmiotu: | obowiązkowe |
Założenia (opisowo): | W chemii i naukach przyrodniczych zawsze coś mierzymy lub obliczamy używając, na przykład, metod teoretycznych, dlatego jest niezwykle ważne aby nabrać umiejętności statystycznej obróbki danych. Zajęcia te nie wymagają pogłębionej wiedzy a'priori z jakiś przedmiotów, natomiast wymagają angażowania się w poszczególne zajęcia.Celem tych zajęć jest dostarczenie podstawowych informacji statystycznych oraz przedstawienie podstawowych jednowymiarowych technik statystycznych użytecznych w badaniach chemicznych. |
Tryb prowadzenia: | w sali |
Skrócony opis: |
Zagadnienia poruszane podczas wykładu: "Statystyka i bazy danych": 1. Podstawowe pojęcia statystyczne 2. Prawdopodobieństwo i jego rozkłady 3. Estymacja punktowa i przedziałowa, 4. Testowanie hipotez statystycznych, 5. Analiza wariancji 6. Analiza korelacji i regresji 7. Testy nieparametryczne 8. Wykorzystanie baz danych w krystalografii |
Pełny opis: |
Szczegółowy spis zagadnień poruszanych podczas wykładu obejmuje: 1. Podstawowe pojęcia statystyczne, podstawy statystyki opisowej, empiryczne rozkłady prawdopodobieństwa, tworzenie szeregów rozdzielczych punktowych i przedziałowych. 2. Zmienne losowe i ich rozkłady, prawdopodobieństwo i jego własności, funkcja prawdopodobieństwa i gęstości prawdopodobieństwa, momenty rozkładów, przykłady różnych rozkładów punktowych i ciągłych: normalny, jednostajny, dwumianowy, Studenta, chi-kwadrat, Poissona. 3. Estymacja punktowa i przedziałowa, populacja generalna, próbkowanie, rozkłady empiryczne, różne statystyki i ich rozkłady, przedziały ufności dla różnych parametrów statystycznych. 4. Testowanie hipotez statystycznych, hipoteza zerowa i alternatywna, procedura testowania hipotez, błędy pierwszego i drugiego rodzaju, parametryczne i nieparametryczne testy losowości, normalności, dla jednej zmiennej losowej, porównanie parametrów kilku zmiennych losowych, test Shapiro-Wilka normalności rozkładu 5. Analiza wariancji, Parametryczna, jedno- i wielowymiarowa analiza wariancji. 6. Regresja, dopasowywanie krzywej metodą najmniejszych kwadratów, regresja prosta i wielokrotna, regresja nieliniowa (sprowadzanie przypadków nieliniowych do liniowych), rola reszt, przedziały ufności i tolerancji. Analiza korelacyjna, parametryczne i nieparametryczne współczynniki korelacji, 7. Testy nieparametryczne, nieparametryczne odpowiedniki poznanych testów parametrycznych 8. W drugiej części wykładu przedstawiane są bazy danych: literaturowa baza danych Instytutu Informacji Naukowej Thompsona, baza struktur związków organicznych Cambridge Structural Database (CSD) ,baza struktur związków nieorganicznych Inorganic Data Base (ICSD), baza makromolekuł Protein Data File. |
Literatura: |
Materiały dla studentów przygotowane na wykłady, popularne akademickie podręczniki statystyczne |
Efekty uczenia się: |
Oczekiwanym efektem tego kursu jest: - zrozumienie przez studentów podstawowych idei statystyki, - nabycie umiejętności ich wykorzystywania do rozwiązywania problemów naukowych, - nabycie umiejętności wykonywania statystyki opisowej, - nabycie umiejętności charakterystyki zmiennych losowych, - zdobycie umiejętności estymowania parametrów statystycznych oraz testowania hipotez statystycznych oraz wykonywania jedno- i wieloczynnikowej analizy wariancji oraz obliczania przedziałów ufności i tolerancji. - zdobycie umiejętności wykonywania analizy regresji, dopasowywania krzywej metodą najmniejszych kwadratów, wykonywania regresji prostej i wielokrotnej, regresji nieliniowej, - zrozumienie roli reszt, - nauczenie się wykonywania analizy korelacyjnej testów parametrycznych i nieparametrycznych, obliczania współczynników korelacji, korelacji zupełnej, korelacji cząstkowych, macierzy wariancji-kowariancji oraz wykonywania analizy czynnikowej i faktorowa oraz stosowania metod sekwencyjnych. - poznanie najważniejszych strukturalnych baz danych takich jak CSD, ICSD, PDB i baza Inst. Thompsona. |
Metody i kryteria oceniania: |
Pierwszym elementem zaliczenia przedmiotu będzie wykonanie projektu - analizy wybranych przez studenta danych statystycznych i zademonstrowaniu użycia trzech wybranych metod statystycznych prezentowanych na wykładzie. Po zakończeniu wykładu odbędzie się egzamin na ocenę. Egzamin będzie miał formę testu jednokrotnego wyboru. Pytania będą dotyczyły treści przekazywanych na wykładzie. Część z nich będzie polegała na wykonaniu prostych obliczeń, przy wykorzystaniu poznanych na wykładzie wzorów. Egzamin odbędzie się stacjonarnie w tradycyjnej formie lub na platformie Kampus Egzaminy UW (do uzgodnienia ze studentami). Ocena wystawiana jest na podstawie sumarycznej liczby punktów zdobytych odmienionych do maksymalnej liczby punktów możliwych do zdobycia. Punkty zdobyte (x) przeliczane są na oceny w/g skali: x>90% max. liczby punktów (mlp) ocena 5+ celująca (5!) 80% < x < 90% mlp ocena 5 70% < x < 80% mlp ocena 4+ 60% < x < 70% mlp ocena 4 50% < x < 60% mlp ocena 3+ 40% < x < 50% mlp ocena 3 x < 40% mlp ocena 2 Możliwa jest ustna poprawa na wyższą ocenę w przypadku przekonania studenta, że jego wiedza i umiejętności z tego przedmiotu zasługują na wyższa ocenę. Poprawa ustna na wyższą ocenę możliwa jest po indywidualnym umówieniu się z osobą prowadzącą ten przedmiot. |
Praktyki zawodowe: |
n/a |
Zajęcia w cyklu "Semestr zimowy 2024/25" (w trakcie)
Okres: | 2024-10-01 - 2025-01-26 |
Przejdź do planu
PN WT ŚR WYK
CZ PT |
Typ zajęć: |
Wykład, 15 godzin, 12 miejsc
|
|
Koordynatorzy: | Krzysztof Woźniak | |
Prowadzący grup: | Wojciech Sławiński | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Egzamin |
Właścicielem praw autorskich jest Uniwersytet Warszawski, Wydział Fizyki.