W tym artykule zajmiemy się tworzeniem szeregu rozdzielczego oraz rozróżnieniem szeregu otwartego i zamkniętego. Jeżeli chcesz się dowiedzieć jak obliczać wskaźniki z szeregu, zobacz te strony:
- Jak obliczyć średnią w szeregu rozdzielczym
- Jak obliczyć wariancje i odchylenie standardowe w szeregu rozdzielczym
- Jak obliczyć kwartyle w szeregu rozdzielczym
- Jak obliczyć dominantę w szeregu rozdzielczym
Szereg rozdzielczy przedziałowy, jak wyznaczyć?
- Krok 1: Ustalenie liczby klas – czyli ile będzie wierszy w naszej tabeli. Najczęściej wyznacza się $$k=\sqrt{n}$$
Inne źródła podają czasem inne sposoby – upewnij się jak podaje wykładowca na Twojej uczelni. Często liczbę przedziałów podaje się na tak zwany „zdrowy rozsądek”.
U nas:
Średnia dziennego utargu (cecha X) w tys. zł (dane umowne):
2.0; 2.5; 2.3; 3.1; 2.1; 1.7; 1.8; 3.1; 4.6; 3.8; 3.5; 2.7; 1.6; 3.0; 3.5; 2.6; 2.7; 3.2; 2.2; 4.3; 1.9; 2.1; 2.9; 3.1; 2.1; 2.9; 2.7; 2.4; 3.0; 3.6; 3.9; 2.2; 3.1; 2.5; 3.3; 2.5; 2.2; 3.3; 2.1; 2.4; 2.8Mamy $n=40$ danych, więc liczba klas to $k=\sqrt{n}=\sqrt{40}=6.32 \approx 6$
Nam wygodniej będzie wykorzystać 7 klas (7 wierszy z danymi) – inaczej nie pokrylibyśmy wszystkich danych przy rozpiętości 0.5.
- Krok 2: Wyznaczamy długości przedziałów
Rozstępem badanej cechy X w tej próbce nazywamy liczbę $$R=x_{max}-x_{min}$$ gdzie $x_{max}$, $x_{min}$ oznaczają odpowiednio największą i najmniejszą liczbę.
Jeżeli $R$ jest rozstępem próbki, zaś $k$ liczbą klas, to jakoś długość klasy przyjmuje się $$b \approx \frac{R}{k}$$
U nas:
$$R=4.6-1.6=3$$ $$b=\frac{3}{6}=0.5$$ - Krok 3: Wyznaczamy pierwszy przedział, kolejne przedziały i liczebności
Lewy koniec pierwszego przedziału $a_0$ wyznaczamy następująco:
$$a_0=x_1-\frac{c}{2}$$
gdzie $c$ to rozpiętość a $x_1$ to najmniejsza wartość.Ponownie- często inne źródła podają inne wzory i w tym przypadku.
Wyliczamy:
$$a_0=x_1-\frac{c}{2}=1.6-\frac{0.5}{2}=1.35$$
Tworzymy 7 przedziałów o wyznaczonej w kroku 2 długości 0.5:Przedziały dziennego utargu 1.35-1.85 1.85-2.35 2.35-2.85 2.85-3.35 3.35-3.85 3.85-4.35 4.35-4.85 Ostatni krok to uważne zliczenie wartości do odpowiednich przedziałów
Przedział dziennego utagu Liczba sklepów <$x_{i0},x_{i1}$> $n_i$ 1.35-1.85 4 1.85-2.35 9 2.35-2.85 10 2.85-3.35 9 3.35-3.85 4 9.85-4.35 3 4.35-4.85 1 Szereg przedziałowy zamknięty a szereg przedziałowy otwarty
Przykład szeregu rozdzielczego zamkniętego-wszystkie przedziały mają określone wartości „od do”
Liczba dni nieobecności Liczba pracowników $x_{i}$ $n_i$ 0-4 100 5-9 150 10-14 200 15-19 130 20-24 120 $\sum$ 700 Szereg rozdzielczy otwarty
Czasami mamy do czynienia z szeregami statystycznymi o pierwszym lub ostatnim przedziale kasowym otwartym.
Sytuacja taka ma miejsce, gdy np. w badanej zbiorowości statystycznej występują ekstremalne wartości badanej cechy, zarówno (zarówno bardzo duże, jak i bardzo małe).Przykład:
Liczba dni nieobecności Liczba pracowników $x_{i}$ $n_i$ 4 i mniej 100 5-9 150 10-14 200 15-19 130 20-24 120 $\sum$ 700 Liczba dni nieobecności Liczba pracowników $x_{i}$ $n_i$ 0-4 100 5-9 150 10-14 200 15-19 130 20 i więcej 120 $\sum$ 700 W przypadku szeregu rozdzielczego otwartego nie liczymy wskaźników klasycznych: średniej, wariancji, klasycznego współczynnik zmienności, itp.
Bibliografia:
- Stanisławek Jędrzej, Podstawy statystyki, Warszawa, Oficyna Wydawnicza Politechniki Warszawskiej, 2010, ISBN 978-83-7207-882-7