Odchylenie standardowe jest dodatnim pierwiastkiem kwadratowym wariancji. Jest to jedna z podstawowych metod analizy statystycznej. Odchylenie standardowe jest zwykle skrótem oznaczanym jako SD i oznacza się je symbolem „σ”, a mówi o tym, jak bardzo wartości danych odbiegają od wartości średniej. Jeśli uzyskamy niskie odchylenie standardowe, oznacza to, że wartości mają tendencję do być blisko średniej, podczas gdy wysokie odchylenie standardowe mówi nam, że wartości są daleko od wartości średniej.
Mamy osobne wzory do obliczania odchylenia standardowego dla danych zgrupowanych i niezgrupowanych. Ponadto, mamy różne wzory odchylenia standardowego do obliczania SD zmiennej losowej. Przyjrzyjmy się wszystkim wzorom dokładniej.

Czym jest odchylenie standardowe?
Odchylenie standardowe to stopień rozproszenia lub rozrzutu punktów danych w stosunku do średniej w statystyce opisowej. Mówi ono, jak wartości są rozłożone w próbie danych, a także jest miarą zmienności punktów danych względem średniej. Odchylenie standardowe zbioru danych, próby, populacji statystycznej, zmiennej losowej lub rozkładu prawdopodobieństwa to pierwiastek kwadratowy z jego wariancji.
Obliczanie odchylenia standardowego
Kiedy mamy n obserwacji i obserwacje są \(x_1, x_2, …..x_n\), średnie odchylenie wartości od średniej jest określane jako \(\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}\). Jednak suma kwadratów odchyleń od średniej nie wydaje się właściwą miarą rozproszenia. Jeśli średnia kwadratów różnic od średniej jest mała, wskazuje to, że obserwacje \(x_i\) są blisko średniej \(\bar x\). Oznacza to niższy stopień rozproszenia. Jeśli ta suma jest duża, wskazuje to na wyższy stopień rozproszenia obserwacji od średniej \(\bar x\). Zatem dochodzimy do wniosku, że \(\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}\) jest rozsądnym wskaźnikiem stopnia rozproszenia lub rozrzutu.
Wariancja i odchylenie standardowe
Jako właściwą miarę rozproszenia bierzemy \(\dfrac{1}{n}\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}\) i nazywamy to wariancją(σ2). Pierwiastek kwadratowy z wariancji to odchylenie standardowe.

Wzory na odchylenie standardowe
Rozrzut danych statystycznych mierzony jest przez odchylenie standardowe. Stopień rozproszenia jest obliczany przez metodę szacowania odchylenia punktów danych. Można przeczytać o rozrzucie w statystykach opisowych. Jak już omówiono, wariancja zbioru danych to średnia kwadratowa odległość między wartością średnią a każdą wartością danych. A odchylenie standardowe definiuje rozproszenie wartości danych wokół średniej. Oto dwa wzory na odchylenie standardowe, które służą do obliczania odchylenia standardowego próby danych oraz odchylenia standardowego danej populacji.
Wzór na odchylenie standardowe populacji
Wzór na odchylenie standardowe populacji jest podany jako: \(\sigma=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(X_{i}-\mu\right)^{2}}\)
Gdzie, σ = symbol odchylenia standardowego populacji μ = średnia populacji N = całkowita liczba obserwacji
Wzór na odchylenie standardowe próby
Podobnie wzór na odchylenie standardowe próby jest: \(s=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}\)
Gdzie, s = symbol odchylenia standardowego próby \(\bar x\) = średnia arytmetyczna obserwacji n = całkowita liczba obserwacji
Korekta Bessela
W trakcie obliczania średniej próbki, wszystkie wartości danych w populacji nie są brane pod uwagę, więc średnia próbki jest tylko szacunkiem średniej populacji, ale wprowadza to pewną niepewność lub błąd w naszych obliczeniach odchylenia standardowego. Aby to skorygować, mianownik odchylenia standardowego próbki jest korygowany na n-1 zamiast tylko n. Nazywa się to korektą Bessela.
Jak obliczyć odchylenie standardowe?
W ogólności, odchylenie standardowe odnosi się do odchylenia standardowego populacji, a oto kroki, jak obliczyć odchylenie standardowe zestawu wartości danych:
Krok 1: Obliczenie średniej
Znajdź średnią arytmetyczną obserwacji.
Krok 2: Obliczenie kwadratu różnic od średniej
Oblicz kwadrat różnic od średniej. (Wartość danych – średnia)2
Krok 3: Obliczenie wariancji
Oblicz średnią arytmetyczną kwadratów różnic. (Wariancja = suma kwadratów różnic ÷ liczba obserwacji)
Krok 4: Obliczenie odchylenia standardowego
Oblicz pierwiastek kwadratowy z wariancji. (Odchylenie standardowe = √Wariancji)
Odchylenie standardowe danych niezagregowanych
Obliczenia odchylenia standardowego różnią się w zależności od rodzaju danych. Rozkład mierzy odchylenie danych od ich średniej lub pozycji średniej. Istnieją trzy metody obliczania odchylenia standardowego:
Metoda rzeczywistej średniej
W tej metodzie najpierw obliczamy średnią wartość danych (\(\bar x\)) a następnie obliczamy odchylenia każdej wartości danych od średniej. Następnie korzystamy z następującego wzoru na odchylenie standardowe w metodzie rzeczywistej średniej:
σ = √(∑\((x-\bar x)\)2 /n), gdzie n = całkowita liczba obserwacji.
Rozważmy obserwacje danych 3, 2, 5, 6. Średnia tych punktów danych wynosi (3 + 2 + 5 + 6)/4 = 16/4 = 4.
Suma kwadratów różnic od średniej = (4-3)2+(2-4)2 +(5-4)2 +(6-4)2 = 10
Wariancja = Kwadraty różnic od średniej/ liczba punktów danych =10/4 =2,5
Odchylenie standardowe = √2,5 = 1,58
Metoda przyjętej średniej
Kiedy wartości x są duże, jako średnia wybierana jest arbitralna wartość (A) (ponieważ obliczenie średniej jest trudne w tym przypadku). Odchylenie od tej założonej średniej jest obliczane jako d = x – A. Następnie wzór na odchylenie standardowe w metodzie przyjętej średniej to:
σ = √[(∑(d)2 /n) – (∑d/n)2]
Metoda krokowego odchylenia
Odchylenie standardowe danych zagregowanych można również obliczyć metodą „krokowego odchylenia”. W tej metodzie również wybierana jest arbitralna wartość danych jako założona średnia, A. Następnie obliczamy odchylenia wszystkich wartości danych, używając d = x – A. Kolejnym krokiem jest obliczenie krokowych odchyleń (d’) za pomocą d’ = d/i, gdzie 'i’ to wspólny czynnik wszystkich wartości 'd’ (wybierz dowolny wspólny czynnik w przypadku wielu czynników). Teraz odchylenie standardowe danych niezagregowanych metodą krokowego odchylenia oblicza się według wzoru:
σ = √[(∑(d’)2 /n) – (∑d’/n)2] × i, gdzie 'n’ to cał
Odchylenie standardowe danych zagregowanych (dyskretnych)
Kiedy punkty danych są zagregowane, najpierw tworzymy dystrybucję częstości. Podobnie jak w przypadku danych niezagregowanych, odchylenie standardowe danych zagregowanych można obliczyć przy użyciu 3 metod: rzeczywistej średniej, przyjętej średniej i krokowego odchylenia. Zagłębmy się w każdą z tych metod.
Odchylenie standardowe danych dyskretnych metodą rzeczywistej średniej
Dla n obserwacji, \(x_1, x_2, …..x_n\) i odpowiadających częstości, \(f_1, f_2, f_3, …f_n\) odchylenie standardowe wynosi: \(\sigma=\sqrt{\frac{1}{n} \sum_{i=1}^{n}f_i \left(x_{i}-\bar x\right)^{2}}\). Tutaj n = całkowita częstość = \(\sum_{i=1}^{n}f_i\) \(\bar x\) = średnia Przykład: Obliczmy odchylenie standardowe dla poniższych danych: xi 6 10 12 14 24 fi 2 3 4 5 4 Oblicz średnią(\(\bar x\)): (6 × 2 + 10 × 3 + 12 × 4 + 14 × 5 + 24 × 4)/(2+3+4+5+4) = 14,22 xi fi fixi xi – \(\bar x\) (xi – \(\bar x\))2 fi (xi – \(\bar x\))2 6 2 12 -8,22 67,5684 135,1368 10 3 24 -4,22 17,8084 53,4252 12 4 40 -2,22 4,9284 19,7136 14 5 60 -0,22 0,0484 0,242 24 4 56 9,78 95,6484 382,5936 18 192 591,1112 Teraz wariancja: σ2 = 1/n \(\sum_{i=1}^{n}f_i \left(x_{i}-\bar x\right)^{2}\) = 1/18 × 591,1112 = 32,83 Oblicz odchylenie standardowe: σ = √Variance = √32,83 = 5,73
Metoda średniego odchylenia dla danych dyskretnych z założoną wartością średnią
Opis metody
Metoda ta służy do obliczania odchylenia standardowego dla danych dyskretnych, w których wartości są bardzo duże. W takim przypadku, jedna z wartości danych jest wybierana jako średnia (i nazywana jest założoną wartością średnią, A). Następnie odchylenie każdej wartości danych od założonej wartości średniej wynosi d = x – A. Formuła do obliczania odchylenia standardowego za pomocą metody założonej wartości średniej wygląda następująco:
σ = √[(∑(fd)2 /n) – (∑fd/n)2],
gdzie:
- ’f’ to częstość odpowiadającej wartości danych x,
- ’n’ to całkowita częstość.
Obliczanie odchylenia standardowego
Aby obliczyć odchylenie standardowe za pomocą tej metody, należy:
- Wybrać wartość danych jako założoną wartość średnią.
- Obliczyć odchylenie każdej wartości danych od założonej wartości średniej.
- Podnieść każde odchylenie do kwadratu i pomnożyć przez odpowiadającą mu częstość 'f’.
- Zsumować wyniki z punktu 3.
- Podzielić wynik z punktu 4 przez całkowitą częstość 'n’.
- Podnieść do kwadratu sumę odchylenia każdej wartości danych 'd’ i podzielić przez całkowitą częstość 'n’.
- Odjąć wynik z punktu 6 od wyniku z punktu 5.
- Pierwiastkować wynik z punktu 7.
Metoda średniego odchylenia dla danych dyskretnych z wykorzystaniem odchylenia krokowego
Opis metody
Metoda ta służy do obliczania odchylenia standardowego dla danych grupowanych z wykorzystaniem odchylenia krokowego. Podobnie jak w metodzie z założoną wartością średnią, wybieramy pewną wartość danych jako założoną wartość średnią, A, a następnie obliczamy odchylenia wartości danych od tej wartości średniej, d = x – A. W metodzie tej, oprócz odchylenia standardowego, obliczamy również odchylenie krokowe d’, korzystając z wzoru d’ = d/i, gdzie i to wspólny czynnik wszystkich wartości odpowiadających 'd’ (może to być wiele czynników, ale możemy wybrać dowolny z nich). Formuła do obliczania odchylenia standardowego za pomocą metody odchylenia krokowego wygląda następująco:
σ = √
Odchylenie standardowe dla danych grupowanych (ciągłych)
Opis metody
Jeśli rozkład częstości jest ciągły, każda klasa zastępowana jest swoim środkiem. Następnie, odchylenie standardowe jest obliczane tak samo jak w przypadku rozkładu częstości dyskretnych. Przykład:
Niech (x_i) oznacza środek każdej klasy, który obliczany jest za pomocą wzoru (dolny limit + górny limit)/2. Następnie stosujemy tę samą formułę odchylenia standardowego.
Klasa | Liczebność (fi) | Środek (xi) |
---|---|---|
0-10 | 3 | 5 |
10-20 | 4 | 15 |
20-30 | 6 | 25 |
30-40 | 4 | 35 |
40-50 | 8 | 40 |
Obliczanie odchylenia standardowego
Aby obliczyć odchylenie standardowe za pomocą tej metody, należy:
- Obliczyć środek każdej klasy.
- Obliczyć odchylenie każdego elementu danych od środka swojej klasy.
- Podnieść każde odchylenie do kwadratu i pomnożyć przez odpowiadającą mu częstość 'f’.
- Zsumować wyniki z punktu 3.
- Podzielić wynik z punktu 4 przez całkowitą częstość 'n’.
- Pierwiastkować wynik z punktu 5.
Metody obliczania odchylenia standardowego dla danych grupowanych
Odchylenie standardowe dla danych grupowanych może być obliczane za pomocą metod rzeczywistej średniej, założonej wartości średniej lub odchylenia krokowego. W każdej z tych metod, należy obliczyć środek każdej klasy przed obliczeniem odchylenia standardowego.
Odchylenie standardowe zmiennych losowych
Opis metody
Miara rozrzutu dla dystrybucji prawdopodobieństwa zmiennej losowej określa stopień, w jakim wartości różnią się od wartości oczekiwanej. Jest to funkcja, która przypisuje wartość numeryczną każdemu wynikowi w przestrzeni próbek. Oznaczana jest przez X, Y lub Z, ponieważ jest to funkcja. Jeśli X jest zmienną losową, odchylenie standardowe jest określane przez pierwiastek kwadratowy z sumy iloczynów kwadratu różnicy między zmienną losową X a wartością oczekiwaną (𝜇 lub E(X)) i wartością prawdopodobieństwa związaną z zmienną losową.
Odchylenie standardowe dystrybucji prawdopodobieństwa X wynosi 𝜎 = (\sqrt{\Sigma\left[(x-\mu)^2 \cdot P(x)\right]})
Skróconą metodą obliczania odchylenia standardowego zmiennych losowych jest: 𝜎 = (\sqrt{E(X^2)-[E(X)]^2}) lub 𝜎 = (\sqrt{\Sigma\left[x^2 \cdot P(x)\right]-\mu^2})
Obliczanie odchylenia standardowego
Aby obliczyć odchylenie standardowe za pomocą tej metody, należy:
- Obliczyć wartość oczekiwaną zmiennej losowej.
- Obliczyć kwadrat zmiennej losowej.
- Obliczyć wartość oczekiwaną kwadratu zmiennej losowej.
- Obliczyć odchylenie standardowe ze wzoru 𝜎 = (\sqrt{E(X^2)-[E(X)]^2}) lub ze wzoru 𝜎 = (\sqrt{\Sigma\left[x^2 \cdot P(x)\right]-\mu^2}).
Odchylenie standardowe zmiennych losowych jest jednym z najważniejszych narzędzi w statystyce, ponieważ pomaga w analizie rozkładów prawdopodobieństwa i określaniu stopnia zmienności lub zróżnicowania wyników w próbie.
Odchylenie standardowe dystrybucji prawdopodobieństwa
Opis metody
Doświadczalne prawdopodobieństwo składa się z wielu prób. Kiedy różnica między teoretycznym prawdopodobieństwem zdarzenia a jego częstością względną zbliżają się do siebie, zaczynamy znać średni wynik. Średnia ta jest znana jako wartość oczekiwana eksperymentu oznaczona przez 𝜇.
W rozkładzie normalnym średnia wynosi zero, a odchylenie standardowe wynosi 1.
W eksperymencie dwumianowym liczba sukcesów jest zmienną losową. Jeśli zmienna losowa ma rozkład dwumianowy, jej odchylenie standardowe jest określane przez 𝜎 = √npq, gdzie średnia: 𝜇 = np, n to liczba prób, p to prawdopodobieństwo sukcesu, a 1-p = q to prawdopodobieństwo porażki.
W rozkładzie Poissona odchylenie standardowe jest określane przez 𝜎= √λt, gdzie λ to średnia liczba sukcesów w przedziale czasu t.
Ważne uwagi dotyczące odchylenia standardowego
Odchylenie standardowe to pierwiastek kwadratowy średniej z kwadratów różnic pomiędzy wartościami obserwacji danych a średnią.
Odchylenie standardowe to dodatni pierwiastek kwadratowy wariancji.
Odchylenie standardowe to wskaźnik, który pokazuje rozproszenie punktów danych wokół średniej.
Znaczenie odchylenia standardowego
Opis metody
Odchylenie standardowe oznacza miarę rozproszenia lub zróżnicowania danych wokół wartości średniej. Pomaga nam porównać zestawy danych, które mają taką samą średnią, ale różny zakres. Wzór na odchylenie standardowe próby wynosi: (s=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}), gdzie (\bar x) oznacza średnią próbkę, a (x_i) daje obserwacje danych, a n oznacza wielkość próby.
Wzory na odchylenie standardowe dla populacji i próbki
Jeśli 'n’ to liczba obserwacji, a (\bar x) to średnia populacji/próby, to:
Dla próbki:
odchylenie standardowe próbki to s = √ [ 1/(n-1) ∑(xi – średnia próbki)2.
Dla populacji:
odchylenie standardowe populacji to σ = √ [ 1/n ∑(xi – średnia populacji)2.
Wzory na odchylenie standardowe dla danych nieskategoryzowanych
Kiedy dane nie są skategoryzowane, odchylenie standardowe (SD) można obliczyć w następujące 3 sposoby. Odpowiednie wzory na SD to:
Metoda rzeczywistej średniej:
σ = √(∑((x-\bar x))2 /n)
Metoda zakładanej średniej:
σ = √[(∑(d)2 /n) – (∑d/n)2]
Metoda krokowej zmienności:
σ = √[(∑(d’)2 /n) – (∑d’/n)2] × i
Aby dokładniej zrozumieć każdą z tych metod, należy odwołać się do powyższej strony.
Przykład obliczania odchylenia standardowego
Niech dane punkty wynoszą 1, 3, 4, 5. Średnia wynosi 13/4 = 3,25. Średnia z różnic średnich wynosi [(3,25-1)2 + (3-3,25)2+ (4-3,25)2 + (5-3,25)2]/4 = 2,06. Odchylenie standardowe wynosi √2,06 = 1,43.
Wzory na odchylenie standardowe dla danych skategoryzowanych
Opis metody
Dane skategoryzowane mogą być dyskretne lub ciągłe. Oto wzory na odchylenie standardowe dla skategoryzowanych danych według różnych metod. Jeśli dane są ciągłe, wartości danych będą środkami przedziałów klasowych, a następnie odchylenie standardowe można obliczyć za pomocą tych samych wzorów, co dla danych dyskretnych.
Metoda rzeczywistej średniej:
σ = √(∑(f(x-\bar x))2 /n)
Metoda zakładanej średniej:
σ = √[(∑(fd)2 /n) – (∑fd/n)2]
Metoda krokowej zmienności:
σ = √[(∑(fd’)2 /n) – (∑fd’/n)2] × i
Aby dokładniej zrozumieć proces obliczania odchylenia standardowego, przewiń tę stronę w górę.
Różnica między wzorem na odchylenie standardowe a wzorem na wariancję
Opis metody
Wariancja to średnia kwadratów odchyleń od średniej, podczas gdy odchylenie standardowe to pierwiastek kwadratowy tej liczby. Oba mierniki odzwierciedlają zmienność w rozkładzie, ale ich jednostki różnią się: odchylenie standardowe jest wyrażone w tych samych jednostkach co oryginalne wartości (np. minuty lub metry).
Wzory na odchylenie standardowe i wariancję dla próby
Wzór na odchylenie standardowe próbki: s = √[ Σ (xi – x̅)2/(n-1) ]
Wzór na wariancję próbki: σ2 = Σ (xi – x̅)2/(n-1)
Czym są średnia, wariancja i odchylenie standardowe w statystyce?
Wariancja to suma kwadratów różnic między wszystkimi liczbami a średnią. Odchylenie standardowe to pierwiastek kwadratowy z wariancji. Jest to miara stopnia, w jakim dane różnią się od średniej. Wzór na odchylenie standardowe to √wariancja.
Który wzór lepiej stosować, wzór na wariancję czy wzór na odchylenie standardowe?
Każdy z nich ma różne zastosowania. Odchylenie standardowe jest zwykle bardziej przydatne do opisywania zmienności danych, podczas gdy wariancja jest zwykle bardziej przydatna matematycznie. Na przykład suma nieskorelowanych rozkładów (zmiennych losowych) ma wariancję równą sumie wariancji tych rozkładów.
Dlaczego stosujemy wzór na odchylenie standardowe i wariancję?
Odchylenie standardowe pozwala zobaczyć, jak szeroko grupa liczb rozkłada się od średniej, patrząc na pierwiastek kwadratowy z wariancji. Wariancja mierzy średni stopień, w jakim każdy punkt różni się od średniej.
Źródło odniesienia: https://en.wikipedia.org/wiki/Standard_deviation