Mediana i dominanta

Matematyka Odsłon: 1244
MEDIANA
? Wyjaśnienie pojęcia mediany
MEDIANA (zwana też wartością środkową lub drugim kwantylem) to w statystyce wartość środkowa dzieląca zbiorowość (uporządkowany szereg) na dwie równe części. W jednej z tych części znajdują się jednostki o wartościach wyższych od mediany, w drugiej zaś o wartościach od niej niższych. Mediana jest kwantylem rzędu ?

? Obliczanie mediany
Medianę obliczamy w zależności od tego, z jakiego rodzaju szeregiem statystycznym przedstawiającym informacje o wartości cechy statystycznej, mamy do czynienia oraz czy liczba jednostek statystycznych (liczebność zbiorowości) jest parzysta, czy nieparzysta.

1) Szereg indywidualny wartości cechy o nieparzystej liczbie jednostek, czyli ustalenie numeru wyrazu środkowego i odczytanie jego wartości. Ustalony numer dzieli zbiorowość statystyczną na dwie grupy: jednostki posiadające wartości cechy mniejsze od wartości mediany i jednostki posiadające wartości cechy większe od wartości mediany. Ustalamy pozycję wartości środkowej, za pomocą wzoru:

Nm = (N 1) : 2

Nm ? wyraz środkowy
N ? ogólna liczba jednostek statystycznych
a ze wzoru M = xNm obliczamy wartość mediany
M ? wartość mediany
XNm ? wartość cechy jednostki środkowej

Przykład
Spółdzielnia mieszkaniowa ?Stokrotka? wystawiła na sprzedaż 9 pomieszczeń mieszkalnych o następujących cenach:
1) 13 000 zł
2) 17 000 zł
3) 20 000 zł
4) 26 000 zł }szereg musi być uporządkowany
5) 30 000 zł
6) 32 000 zł
7) 33 000 zł
8) 39 000 zł
9) 40 000 zł
N ? jednostek statystycznych jest 9
czyli, Nm = (9 1): 2 =5
wyraz środkowy w powyższym szeregu (jednostka), to piąte mieszkanie, które kosztuje 30 000 zł. Wartość mediany wynosi 30 000 zł.
Cztery mieszkania wystawione na sprzedaż osiągnęły cenę niższą niż 30 000 zł, a pozostały cztery mieszkania osiągnęły cenę wyższą niż 30 000 zł.

2) Szereg indywidualny wartości cechy o parzystej liczbie jednostek, występują tutaj dwa wyrazy środkowe:
Nm1 ? pierwszy wyraz środkowy
Nm2 ? drugi wyraz środkowy
Pozycję tych wyrazów obliczamy według wzorów
Nm1 = N : 2
Nm2 = (N 2) : 2
N ? liczebność całej zbiorowości
a ze wzoru, gdzie wartość mediany (M) równa się, sumie wyrazu pierwszego i drugiego, dzielonej przez 2 ( średniej arytmetycznej dwóch średnich wyrazów).
Przykład
Liczba pracowników z czterech zakładów pracy w Rzeszowie, którzy pojechali na wycieczkę do Pragi.
1) 6
2) 4
3) 8 } parzysta liczba jednostek
4) 3
Nm1= 2
Nm2 = 3, czyli wartość mediany jest równa średniej arytmetycznej liczbie pracowników z drugiego i trzeciego zakładu.
M = 6
W dwóch zakładach w Rzeszowie, liczba pracowników którzy pojechali na wycieczkę była mniej niż 6, a w dwóch pozostałych była wyższa niż 6.
3) Szereg statystyczny z cechą mierzalną ze zmiennością skokową w szeregu rozdzielczym stosuje się dodatkową kolumnę, która zawiera sumę liczebności klasy i klas, które ją poprzedzają. Następnie ustala się numer jednostki mediany przy pomocy wzoru

Nm = (N 1) : 2

( szereg indywidualny wartości cechy o nieparzystej liczbie jednostek), ustala się także wartość mediany, odczytując ją z kolumny z wartościami cechy statystycznej.


Przykład

Liczba pomieszczeń w lokalu mieszkalnym
przypadająca na rodzinę.
Liczba pomieszczeń Liczba rodzin Szereg skumulowany
2 18 18
3 16 34
4 20 54
5 15 69

Razem 69 x

Numer jednostki środkowej Nm = (69 1) : 2 = 35
Po ustaleniu numeru jednostki środkowej ustala się na podstawie szeregu skumulowanego, w której klasie szeregu rozdzielczego znajduje się ta jednostka. Ustala się to odszukując wiersz z szeregu skumulowanego, w którym liczebność jest większa niż wyraz środkowy (54). Następnie odczytujemy cechy z szeregu rozdzielczego (4), jest to wartość mediany.
Część rodzin posiada w swoich lokalach cztery pomieszczenia i mniej, a część cztery i więcej pomieszczeń.
- gdy mamy do czynienia z szeregiem indywidualnym wartości cechy wartość mediany oznacza, że połowa jednostek statystycznych posiada wartość cechy niższą niż mediana i połowa posiada wartość cechy wyższą niż mediana.
- W przypadku szeregu rozdzielczego wartość mediany oznacza, że połowa jednostek statystycznych posiada wartość cechy niższą lub równą niż mediana i połowa posiada wartość cechy wyższą lub równą niż mediana.

4) Szereg statystyczny z cechą mierzalną ze zmiennością ciągłą, w tym przypadku medianę można:
- wyznaczyć graficznie
- obliczyć jej przybliżoną wartość
wzór:

M = x0M (L : nM).[(N : 2) ? SsM-1)]
gdzie:
M ? mediana,
xoM ? dolna granica przedziału liczbowego mediany,
L ? rozpiętość przedziału mediany (różnica między górną a dolną granicą przedziału),
nM ? liczebność przedziału mediany,
N ? liczebność zbiorowości,
SsM-1 ? liczebność szeregu skumulowanego w wierszu poprzedzającym wiersz mediany
Przykład
Poziom wynagrodzenia pracowników
w czerwcu 2003 roku w ?Europak?

Wynagrodzenie w zł Liczba pracowników Szereg skumulowany
550 ?570 4 4
570 ? 590 6 10
590 ? 610 6 16
610 ? 630 2 18
630 ? 650 8 26
Razem 26 x

a) tworzymy szereg skumulowany,
b) określamy przedział klasowy w którym znajduje się mediana (sprawdzenie w którym wierszu szeregu skumulowanego mieści się wyraz środkowy) ? w tabeli mediana zawiera się w przedziale (590 ? 610>
c) obliczamy medianę:
xoM ? dolna granica przedziału liczbowego mediany - 590
L ? rozpiętość przedziału mediany ? 20
nM ? liczebność przedziału mediany - 6
N ? liczebność zbiorowości - 26
SsM-1 ? liczebność szeregu skumulowanego w wierszu poprzedzającym wiersz mediany ? 10
d) podstawiamy wartości do wzoru:
M = 590 (20 : 6) . [(26 : 2) ? 10] = 599,9 zł
Mediana wynosi 599,9 zł. Połowa pracowników ?Europak? w czerwcu 2003 roku zarobiła 599,9 zł lub więcej, a połowa zarabiała 599,9 zł i mniej.


? Metoda graficzna wyznaczania mediany w przypadku szeregów statystycznych z cechą mierzalną ze zmiennością ciągłą.
1) w układzie współrzędnych sporządza się wielobok liczebności szeregu skumulowanego
2) na osi y zaznacza się numer jednostki mediany ? 13 (punkt A)
3) z punktu A przeprowadza się odcinek równoległy do osi x aż do punktu przecięcie z krzywą liczebności (punkt B)
4) z punktu B prowadzi się prostą do osi y


? Zastosowanie mediany
Mediana znalazła szerokie zastosowanie w statystyce jako średnia znacznie bardziej odporna na elementy odstające niż średnia arytmetyczna. Używana jest także w grafice komputerowej i przetwarzaniu dźwięku w celu odszumiania - na obrazie zachowuje ona ostre krawędzie przy jednoczesnym usunięciu szumów.
? Zalety mediany
Zaletami mediany są: łatwośc wyznaczenia w szeregach pojedynczych, możliwość jej wyznaczenia w szeregach z otwartymi przedziałami klasowymi, nieuleganie wpływom skrajnych wartości ( dla badanej zbiorowości nietypowych), poza tym do jej wyznaczania nie jest konieczna znajomość wszystkich wartośći cechy mierzalnej.

? Wady mediany
Wadami mediany jest to, że jej wyznaczenie wymaga uporządkowania szeregu według kolejnych wartości cechy mierzalnej, a w szeregach strukturalnych tworzenia szeregu skumulowanego. Nie jest dobrą przeciętną dla szeregów statystycznych, w których rozkład wartości cechy mierzalnej jest bardzo nieregularny. Średni błąd medianybywa większy niż średniej arytmetycznej.


DOMINANTA
? Wyjaśnienie pojecia dominanty
Dominanta zwana jest również modą, wartością typową, wartością modalną lub wartością najczęstszą. Jest ona wartością cechy, która najczęściej występuje w zbiorowości badanej. Dominantę wykorzystuje się w przypadku cech niemierzalnych, jest ona jedyną miarą, która do tego służy
? Obliczanie dominanty
Wartość dominanty ustala się poprzez:
-wskazywanie,
-obliczanie
Jest to uzależnione od formy w jakiej przedstawione są informacje o wartości cechy jednostek statystycznych.

1) Indywidualny szereg wartości cechy ? w tym przypadku wartość dominanty wskazuje się, czyli tę wartość, która najczęściej występuje w danej zbiorowości statystycznej.

Przykład
Liczba uczniów w
klasach pierwszych liceum ogólnokształcącego

Klasy Liczba klas
I 3
II 2
III 1

RAZEM 6

Liczba uczniów wchodząca w skład klasy. Dominanta przedstawiona w tablicy równa się trzem (D = 3). Najczęściej występującą w badanej zbiorowości są klasy pierwsze.

2) Szereg statystyczny z cechą mierzalną ze zmiennością skokową ? dominanta jest wskazywana, jest to wartość cechy, dla której liczebność cząstkowa jest największa.

Przykład
Oceny końcowe z języka polskiego
klasy VI b szkoły podstawowej w Nowej Soli
Skala ocen Liczba uczniów
1 4
2 2
3 4
4 12
5 6
6 6

Razem 32

Cechą występującą w tej zbiorowości jest 4 w szeregu rozdzielczym, a liczebność cząstkowa wynosi 12, D = 4. Najczęściej występującą oceną jest ocena dobra.

3) Szereg statystyczny rozdzielczy z cechą mierzalną ze zmiennością ciągłą ? w tym przypadku obliczamy, tylko przybliżoną wartość dominanty za pomocą wzoru:

D ? xo hd . {(no ? n -1): [(no- n -1) (no ? n 1)]}

D ? dominanta;
xo ? wartość najmniejsza przedziału dominanty;
hd ? rozpiętość przedziału liczbowego dominanty;
no ? liczebność przedziału dominanty;
n ?1 ? liczebność przedziału poprzedzającego przedział dominanty;
n1 ? liczebność przedziału następującego po przedziale dominanty.
Nie stosuje się tego wzoru, gdy różne są rozpiętości przedziału poprzedzającego i przedziału następującego.

Przykład

Zarobki kobiet w ?Europak? Sp. z o.o.
na miesiąc listopad 2003 r.
Wynagrodzenie (zł) Liczba kobiet
800 ? 850 5
850 ? 900 8
900 ? 950 12
950 ? 1000 4
RAZEM 29

Dominanta zawarta jest w przedziale (900 ? 950>
xo ? dolna granica przedziału, w którym występuje dominanta wynosi 900
hd ? rozpiętość przedziału liczbowego dominanty wynosi 50
no ? liczebność podziału dominanty wynosi 12
n ?1 ? liczebność przedziału poprzedzającego przedział dominanty wynosi 8
n1 ? liczebność przedziału następującego po przedziale dominanty 4
Podstawiamy do wzoru i wyznaczamy dominantę.


? Metoda graficzna wyznaczania dominanty
1) na wykresie przedstawiamy trzy prostokąty: przedział dominanty D i przedziały sąsiednie A i B
2) następnie w przedziale dominanty wyznaczamy dwa odcinki, których początkiem są wierzchołki przedziałów sąsiednich
3) w miejscu przecięcia dwóch odcinków wyznaczamy prostą, która pozwoli na odczytanie dominanty.

? Zastosowanie dominanty
Dominanta może być szczególnie użyteczna gdy wartości zmiennej obserwowanej nie są liczbowe - co uniemożliwia (bez przypisania wartości liczbowych) zastosowania m.in. mediany czy średniej arytmetycznej. Np. dla realizacji (ciągu zaobserwowanych wartości) {jabłko, gruszka, jabłko, pomarańcza, gruszka, banan, jabłko} dominantą jest jabłko.
? Zalety dominanty
Zaletą dominanty jest nieuleganie wpływom wartości skrajnych, których uwzględnienie w obliczaniu średniej ( jak to się zieje w obliczaniu średniej arytmetycznej) może niekiedy wypaczyć jej sens. Dla ustalenia dominanty wystarczając jest znajomość zaledwie kilku wartości cechy mierzalnej.

? Wady dominanty
Wadą dominanty jest to, że dokładne jej wyznaczenie jest w wielu przypadkach niemożliwe. Ponadto niemożliwe bywa określenie jej miejsca w szeregu statystycznym, w którym jest jest jedna dominująca liczbowo wartośc badanej cechy mierzalnej, jak również w szeregach statystycznych z nierównymi przedziałami klasowymi

Related Articles