Rozdział 5 ANOVA i test Kruskala-Wallisa
Aby zrozumieć ten rozdział należy zapoznać się z rozdziałem Podstawy. Warto również zapoznać się z rozdziałem Porównania dwóch grup
W poprzednim rozdziale opisywaliśmy porównania dwóch grup (nie ma problemu, jeżeli go nie przerobiliście - i tak bez obaw możecie czytać dalej). Często jednak zdarza się, że grup jest znacznie więcej i chcemy sprawdzić, czy istnieją pomiędzy nimi jakieś różnice, czy nie. Badając na przykład rytm serca u dzieci, moglibyśmy zapytać, czy u dzieci w przedziałach wiekowych 0-1 (grupa 1), 2-3 (grupa 2), 4-5 (grupa 3) rytm ten różni się, czy jest taki sam w każdej grupie. W tym celu moglibyśmy zebrać pewną liczbę dzieci w każdym z tych przedziałów wiekowych i zmierzyć dla każdego z nich częstotliwość bicia serca. W wyniku otrzymalibyśmy trzy zbiory danych, które jednocześnie poddalibyśmy analizie statystycznej, mającej na celu udzielenie odpowiedzi na postawione pytanie. W zależności od odpowiedzi moglibyśmy zechcieć zadawać kolejne pytania (tak zwane pytania post-hoc), np. w której grupie jest najwyższy, które grupy nie różnią się od siebie itd.
5.1 Analiza wariancji (ANOVA)
Najczęściej stosowaną techniką w takim przypadku jest analiza wariancji czyli ANOVA(ang.analysis of variance). Analiza wariancji jest bardzo bogata i obejmuje wiele technik i zastosowań, jednak my w tym podręczniku skupimy się tylko na najprostszym zastosowaniu, czyli tak zwanej jednokierunkowej analizie wariancji.
Analiza wariancji sprawdza, czy średnie w badanych grupach są takie same. W tym celu, trochę paradoksalnie, porównuje się w pewien specyficzny sposób wariancje w tych grupach - stąd właśnie wzięła się nazwa ANOVA. (Osoby, które czytały poprzedni rozdział zauważyły zapewne, że cel analizy wariancji jest taki sam jak testu t. Faktycznie: w przypadku zastosowania ANOVA do dwóch grup uzyskujemy dokładnie taki sam wynik jak przy zastosowaniu testu t.)
Podstawowym założeniem analizy przy pomocy ANOVA jest normalność rozkładu. Hipotezą zerową w ANOVA jest: wszystkie analizowane grupy mają tę samą średnią, hipoteza alternatywna to zwykle średnie w analizowanych grupach są różne.
Wielu osobom ANOVA wydaje się dość dziwną techniką. Przecież zdecydowanie lepiej i prościej byłoby zadać pytanie typu “jeżeli ustawimy średnie od najmniejszej do największej, to jaka będzie kolejność?” lub inaczej “w której grupie średnia jest największa, w której jest druga co do wielkości itd.”. Faktycznie, odpowiedź na tego typu pytanie, sformułowane być może w bardziej poprawny statystycznie sposób, byłaby bardziej wartościowa dla badacza. Problem w tym, że pytanie tego typu w rzeczywistości składa się z wielu “pod-pytań” (czy średnia w grupie 1 jest większa niż średnia w grupie 2? czy średnia w grupie 1 jest większa niż w grupie 3, itd.). Zasady działania i konstrukcja analizy statystycznej są takie, że im więcej mamy pytań, tym więcej musimy mieć danych, aby w wiarygodny sposób na nie odpowiedzieć. Ponieważ danych jest zwykle ograniczona ilość (dane kosztują! trzeba za nie zapłacić czasem, pieniędzmi itd.), możemy zadać ograniczoną liczbę pytań, zwykle tylko jedno. Najbardziej logicznym pytaniem jest “czy te grupy w ogóle się różnią?”. Temu właśnie służy ANOVA. Kolejne pytania i związane z nimi testy statystyczne, które zadajemy po poznaniu odpowiedzi na pytanie “czy grupy się różnią”, np. “w której grupie średnia jest największa”, nazywamy analizą post-hoc. Tego typu analizą nie będziemy się zajmować w tym podręczniku.
Technikę ANOVA zilustrujemy często używanym zbiorem danych pochodzących z eksperymentu, w którym badano czas krzepnięcia krwi u 24 zwierząt, które przypisano losowo do czterech grup (A, B, C, D); w każdej grupie stosowano inną dietę. Po ukończeniu eksperymentu wszystkim zwierzętom pobrano próbki krwi i zbadano czas krzepnięcia. Dane można pobrać w formacie Excela tutaj, a w postaci tekstowej csv tutaj.
Pierwsze przykazanie analizy danych mówi: “będziesz oglądał dane przed analizą”. W przypadku porównywania grup najlepszym narzędziem graficznym jest technika “pudełka z wąsami” (box-and-whiskers plot). Odpowiedni rysunek jest zamieszczony po prawej.
Na rysunku wyraźnie widać, że grupy różnią się między sobą, pozostaje tylko pytanie, czy te różnice są istotne statystycznie, czy nie. Dane, których używamy mają jedną podstawową wadę - jest ich bardzo niewiele. W związku z tym różnice, które oglądane gołym okiem wydają się duże, mogą okazać się nieistotne statystycznie. Sprawdźmy więc. Do programu na dole strony (patrz opis programu w ostatnim punkcie) wklejmy dane. Otrzymujemy bardzo małą wartość p, czyli wnioskować możemy, że grupy różnią się między sobą.
5.2 Test Kruskala Wallisa
Podobnie jak w wielu innych testach, ANOVA wymaga, aby dane w poszczególnych grupach miały rozkład normalny. Oczywiście bardzo często tak nie jest i wtedy musimy użyć testów nieparametrycznych. Nieparametrycznym odpowiednikiem ANOVA dla najprostszych analiz jest test Kruskal-Wallisa, który normalności nie wymaga.
W naszym zbiorze danych nie mamy właściwie szans na sprawdzenie normalności w grupach, ponieważ są one zbyt mało liczne. W ogóle prezentowany tutaj zbiór nadaje się tylko jako demonstracja techniki.
Załóżmy więc, że dane nie mają rozkładu normalnego i chcemy zastosować test Kruskala-Wallisa. Ponownie wklejmy nasze dane do programu na dole strony, tym razem jednak zaznaczając nieparametryczny test Kruskala-Wallisa. Ponownie uzyskujemy statystycznie istotnie różnice pomiędzy grupami. W innym przypadku (dla innych danych) moglibyśmy nie stwierdzić różnic między grupami - test Kruskala-Wallisa jest mniej czuły niż ANOVA. Jeżeli nie mamy konieczności używania testu nieparametrycznego, nie używajmy go, bo możemy przeoczyć ciekawe i istotne efekty.
W tym miejscu zakończymy nasze rozważania o analizie wariancji. Prawdę mówiąc temat został jedynie zasygnalizowany. Gdybyśmy chcieli szczegółowo opisać analizę wariancji trzeba by poświęcić temu tematowi osobny (mini) podręcznik.
5.3 Program statystyczny: ANOVA i test Kruskala-Wallisa
Poniższy program rysuje tzw. boxplot (pudełko z wąsami) dla każdej z analizowanych grup. W pierwszym polu zaznaczamy, czy chodzi nam o analizę wariancji (domyślnie), czy o test Kruskala-Wallisa. W następnym polu wklejamy lub wpisujemy dane (czyli np. czasy krzepnięcia) , a w kolejnym przynależność do odpowiedniej grupy (czyli np. do której grupy zwierzę, dla którego uzyskano dany wynik należy. Można używać zarówno kropki jak i przecinka dziesiętnego: można wpisać zarówno 1,1 jak i 1.1. Ten diagram opisuje proces przeklejania danych z Excela lub LibreOffice (OpenOffice). W kolejnym polu wpisujemy opis osi y. Opis osi x jest wstawiany automatycznie na podstawie grup wymienionych w drugim polu (np. A, B, C, D). Na koniec wybieramy kolor boxplotów.