Podstawowe ograniczenie zarówno rozstępu, jak i rozstępu ćwiartkowe- I go wynika z faktu, że miary te oparte są jedynie na dwóch wynikach, a zatem odzwierciedlają zróżnicowanie tylko w pewnej zdefiniowanej części rozkładu. Aby otrzymać bardziej dokładny obraz rozkładu, trzeba się odwołać do rozproszenia wszystkich wyników. Należy więc skonstruować taką miarę, która będzie oparta na rozproszeniu wszystkich wyników rozkładu wokół jakiegoś kryterium. Innymi słowy, badacz musi przyjąć jakąś normę, pozwalającą mu podjąć decyzję, której wartość jest niższa lub
390
wyższa od wartości oczekiwanej. Na przykład określenie dochodów jako „niskie" lub „wysokie" ma sens jedynie w stosunku do określonego kryterium. Dochody ocenione jako wysokie w Indiach będą traktowane jako niskie w Stanach Zjednoczonych.
Każda miara tendencji centralnej może służyć jako norma. Można mierzyć rozproszenie wyników wokół wartości modalnej, mediany czy średniej arytmetycznej, jednak średnia arytmetyczna jest miarą najczęściej stosowaną.
I Miary rozproszenia oparte na średniej
Najprostszym sposobem obliczenia wielkości rozproszenia wyników wokół średniej jest obliczenie odchylenia przeciętnego wyników od średniej:
I(X-X) odchylenie przeciętne =------------,
gdzie X — każda pojedyncza obserwacja, X — średnia arytmetyczna, N — całkowita liczba obserwacji.
Ponieważ suma odchyleń od średniej zawsze równa się zero2, więc odchylenie przeciętne zawsze byłoby zerowe, gdyż tyle wynosiłby mianownik tego wyrażenia. Aby ominąć tę własność średniej, podnosimy każde odchylenie do kwadratu i otrzymujemy wyrażenie na odchylenie standardowe wyników, najczęściej stosowaną miarę rozproszenia stosowaną dla danych interwałowych.
Wariancja i odchylenie standardowe
Gdy tylko to możliwe, badacze posługują się wariacją i odchyleniem standardowym jako miarami rozproszenia, ponieważ można je później wykorzystywać w bardziej zaawansowanych obliczeniach statystycznych. Wariancję i odchylenie standardowe oblicza się, podnosząc do kwadratu i sumując wszystkie odchylenia, a następnie dzieląc tę sumę przez liczbę obserwacji. Wariancja .v2 zatem3:
s2 = i(x-x)2 (1510)
N
Innymi słowy, od każdego wyniku odejmujemy średnią arytmetyczną, otrzymane różnice podnosimy do kwadratu i dzielimy przez ogólną liczbę obserwacji. Przedstawiony w tabeli 15.15 przykład liczbowy pokazuje kolejne kroki niezbędne do obliczenia wariancji. Po zastosowaniu równania (15.10) do tych danych otrzymamy:
, 200
s2 = —- = 40.
2 Na przykład średnia z następujących wartości 2, 4, 6 i 8 wynosi 5. Jeżeli od każdej wartości odejmiemy 5, to otrzymamy —3, —1, 1 i 3. Suma wszystkich tych różnic —(—3) + (—1)+ 1 +3 — wynosi zero.
1 Przedstawione w tym rozdziale wzory na odchylenie standardowe i wariancję to wzory pozwalające obliczyć te parametry w populacji. Odpowiednie wzory dla próby mają w mianowniku (N— 1), zamiast N.
391
Aby obliczyć wariancję, warto skorzystać z wzoru wygodniejszego od wzoru definicyjnego. Wówczas kwadrat średniej arytmetycznej odejmujemy od sumy kwadratów wszystkich wyników podzielonej przez liczbę obserwacji, czyli:
s = ^r - OO2. (15.11)
Stosując równanie (15.11) do tych samym danych z tabeli 15.15, otrzymamy
, 605 s2 = —- - (9)2 = 121 - 81 = 40.
Wariancja wyraża przeciętne odchylenie wyników w rozkładzie nie w oryginalnych jednostkach, lecz w jednostkach podniesionych do kwadratu. Możemy rozwiązać ten problem, wyprowadzając pierwiastek kwadratowy z wariancji, a zatem przekształcając wariancję w odchylenie standardowe. Odchylenie standardowe jest miarą rozproszenia wyrażoną w oryginalnych jednostkach. Możemy je wyrazić za pomocą równania (15.12) i (15.13), które odpowiadają równaniom (15.10) i (15.11):
s =
I(X - Xf
—^--------. (15.12)
\EX
gdzie s oznacza odchylenie standardowe. Dla naszego przykładu wartość odchylenia standardowego obliczonego za pomocą równania (15.12)
„/20Ó r— s = "Y------= V40 = 6>3-
Dane w tabeli 15.15 przedstawiają nie pogrupowany rozkład częstości zawierający po jednej liczebności dla każdej wartości X. Jeżeli dane w nie pogrupowanym rozkładzie częstości będą zawierać więcej liczebności dla którejś lub dla wszystkich wartości zmiennej X, to obliczając wariancję, możemy się posłużyć następującym wzorem definicyjnym:
2 if(x-x)\ 2 ifx2 (ifxY
s =-------------lub s —
N N
ffi-
392
Tabela 15.15. Obliczanie wariancji
X X-X (X-X)2 X2
3 -6 36 9
4 -5 25 16
6 -3 9 36
12 3 9 144
20 11 121 400
Ogółem 200 605
X = 9
Wariancja i odchylenie standardowe dla danych pogrupowanych
Jeżeli dane zostały pogrupowane, to do obliczenia wariancji i odchylenia standardowego musimy zastosować inne procedury. Do obliczenia wariancji możemy wówczas wykorzystać równanie (15.14), w którym X oznaczać będzie środek przedziału, a/odpowiadające mu liczebności:
s2 =________*L_ (15.14)
N
Wzór ten zastosowaliśmy do danych z tabeli 15.16 i otrzymaliśmy:
(136)2 18496
1094 -------- 1094----------
20 20 1094-924,8 169,20 „ „
r =-------------------------------------=----------------=--------= 8,46.
20 20 20 20