szukanie zaawansowane
 [ Posty: 9 ] 
Autor Wiadomość
Mężczyzna Offline
PostNapisane: 12 maja 2018, o 11:44 
Użytkownik

Posty: 16
Lokalizacja: Polska
Potrzebuję usystematyzować swoją wiedzą o kwantylach.
Ograniczmy się do zbioru [11,12,13,14,15,16,17,18,19,110]. (10 elementów)
1)Jeżeli chcę znaleźć medianę to jej pozycja to jest 5,5, dlatego Me = \frac{15+16}{2} Prawda?
2) Jeżeli chcę znaleźć jej kwartyl górny czyli jest to równoznaczne szukaniem kwantyla 3/4. Prawda?
3) Czyli pozycja kwantyla 3/4 to jest 7,75czyli ile wynosi kwartyl górny? Szukamy jakiejś średniej ważonej między 17 i 18 czy biorę po prostu najbliższą wartość - czyli w tym przypadku kwartyl górny to 18? Jeżeli nie to z jakiego wzoru korzystać?

4) Czy tylko w przypadku Me\equiv Q_{0,5}\equiv x_{1/2} (Mediana równoznaczna kwartylowi 1/2 równoznaczna kwantylowi 1/2) liczymy w przypadku parzystej liczby próby średnią arytmetyczną z wartości po obu stronach pozycji mediany?
Góra
Mężczyzna Offline
PostNapisane: 12 maja 2018, o 14:09 
Użytkownik

Posty: 4005
1. Nie,

Me  = \frac{15 +16}{2} = 15,5.

2. Tak

3. Jeden ze sposobów.

Mediana podzieliła dane na dwa pięcioelementwe podzbiory:

[ 11,12,13,14,15], \ \ [16,17,18,19,20]

Elementy środkowe tych podzbiorów 13, 18 są odpowiednio kwartylem dolnym i górnym.

4. Dla nieparzystej ilości danych:

Me = x_{\frac{n+1}{2}},

Dla parzystej ilości danych:

Me = \frac{x_{\frac{n}{2}} + x_{\frac{n}{2}+1}} {2}.
Góra
Mężczyzna Offline
PostNapisane: 12 maja 2018, o 21:55 
Użytkownik

Posty: 16
Lokalizacja: Polska
janusz47 napisał(a):
1. Nie,

Me  = \frac{15 +16}{2} = 15,5.

2. Tak

3. Jeden ze sposobów.

Mediana podzieliła dane na dwa pięcioelementwe podzbiory:

[ 11,12,13,14,15], \ \ [16,17,18,19,20]

Elementy środkowe tych podzbiorów 13, 18 są odpowiednio kwartylem dolnym i górnym.

4. Dla nieparzystej ilości danych:

Me = x_{\frac{n+1}{2}},

Dla parzystej ilości danych:

Me = \frac{x_{\frac{n}{2}} + x_{\frac{n}{2}+1}} {2}.




Ok dobra, ja to rozumiem co napisałeś, ale teraz jak mam znaleźć tym sposobem np pozykcje kwantyla 0,9 i sam kwantyl?
Tutaj już nie ma takiego prostego dzielenia dodawania.
Góra
Mężczyzna Offline
PostNapisane: 13 maja 2018, o 07:36 
Użytkownik

Posty: 4005
Kwantyl rzędu \frac{k}{10}, \ \  k=1 ,2,3,....,9.

Q_{9} = 19 - decyl 9.
Góra
Mężczyzna Offline
PostNapisane: 13 maja 2018, o 13:03 
Użytkownik

Posty: 16
Lokalizacja: Polska
janusz47 napisał(a):
Kwantyl rzędu \frac{k}{10}, \ \  k=1 ,2,3,....,9.

Q_{9} = 19 - decyl 9.

Eh no właśnie mi się to nie do końca kalkuluje, jeżeli wpisuję sobie do excela formułę percentyl (są to kwantyle rzędów wielokrotności 0,01 tak jak np decyle czyli kwantyle rzędu wielokrotności 0,1) z ww zbioru to wychodzi mi że percentyl 0,9 =28,1 ,a pozycja percentyla to 9,1, a nie 9.
Góra
Mężczyzna Offline
PostNapisane: 13 maja 2018, o 17:20 
Użytkownik

Posty: 4005
Nie używam Excela.

Program R

Kod:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
> Dane<-c( 11,12,13,14,15,16,17,18,19,20)
> median(Dane)
[1] 15.5
> wynik1 <-quantile(c(11,12,13,14,15,16,17,18,19,20),0.9)
> wynik1
 90%
19.1
> wynik2 <-quantile(c(11,12,13,14,15,16,17,18,19,20),0.1)
> wynik2
 10%
11.9
 wynik3 <-quantile(c(11,12,13,14,15,16,17,18,19,20),0.25)
> wynik3
  25%
13.25
> wynik4 <-quantile(c(11,12,13,14,15,16,17,18,19,20),0.75)
> wynik4
  75%
17.75


Z definicji kwantyla rzędu p

q_{p}= Pr(X\leq x_{p})\geq p,  \ \  q_{p}= Pr(X \geq x_{p}) \geq 1 -p ,

otrzymujemy wzór ogólny na wyznaczanie wartości przybliżonych kwantyli rzędu p\in (0, 1) dla szeregu szczegółowego:

q_{p} = x_{[n\cdot p]}

Stąd na przykład dla p = 0.9

q_{0,9} = x_{[10\cdot 0.9]} = x_{9}= 19

lub

q_{p} = x_{[n\cdot p] + 0,5} dla n -nieparzystego

p = 0.2

q_{0.2} = x_{[10\cdot 0,2]} = x_{2} = 12.

Programy takie jak np. R jak i Excel obliczają wartość przybliżoną kwantyla, dzieląc rozstęp między kolejnymi danymi na mniejsze części i używając interpolacji liniowej.
Góra
Mężczyzna Offline
PostNapisane: 14 maja 2018, o 10:07 
Użytkownik

Posty: 16
Lokalizacja: Polska
janusz47 napisał(a):
Nie używam Excela.

Program R

Kod:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
> Dane<-c( 11,12,13,14,15,16,17,18,19,20)
> median(Dane)
[1] 15.5
> wynik1 <-quantile(c(11,12,13,14,15,16,17,18,19,20),0.9)
> wynik1
 90%
19.1
> wynik2 <-quantile(c(11,12,13,14,15,16,17,18,19,20),0.1)
> wynik2
 10%
11.9
 wynik3 <-quantile(c(11,12,13,14,15,16,17,18,19,20),0.25)
> wynik3
  25%
13.25
> wynik4 <-quantile(c(11,12,13,14,15,16,17,18,19,20),0.75)
> wynik4
  75%
17.75

Programy takie jak np. R jak i Excel obliczają wartość przybliżoną kwantyla, dzieląc rozstęp między kolejnymi danymi na mniejsze części i używając interpolacji liniowej.


Ok rozumiem co do mnie napisałeś.
Tylko coś mi się to kłóci ze zdrowym rozsądkiem. Zaprogramowanie polecenia(makra ) tak, aby liczył wartość takiego kwantyla rzędu np 0,9 wg wzorów ogólnych to raczej banalna sprawa. Dlaczego w takim razie wyniki są interpolowane liniowo? Nie rozumiem za bardzo sensu.

Cytuj:
Z definicji kwantyla rzędu p

q_{p}= Pr(X\leq x_{p})\geq p,  \ \  q_{p}= Pr(X \geq x_{p}) \geq 1 -p ,

otrzymujemy wzór ogólny na wyznaczanie wartości przybliżonych kwantyli rzędu p\in (0, 1) dla szeregu szczegółowego:

q_{p} = x_{[n\cdot p]}

Stąd na przykład dla p = 0.9

q_{0,9} = x_{[10\cdot 0.9]} = x_{9}= 19

lub

q_{p} = x_{[n\cdot p] + 0,5} dla n -nieparzystego

p = 0.2

q_{0.2} = x_{[10\cdot 0,2]} = x_{2} = 12.


Czyli moment jakbym chciał policzyć kwantyl rzędu 0,2 dla 11 elementowego zbioru:
q_{p} = x_{[n\cdot p] + 0,5} =x_{[11\cdot 0.2] + 0,5} = x_{2,2 + 0,5} = x_{2,7}???
Góra
Mężczyzna Offline
PostNapisane: 14 maja 2018, o 14:29 
Użytkownik

Posty: 4005
Sens jest oczywisty, jeśli mamy dużą ilość danych statystycznych, to należy skonstruować metody numeryczno - komputerowe obliczania wartości kwantyli. Najbardziej efektywnymi i dobrze uwarunkowanymi są metody interpolacji liniowej - konstrukcji estymatorów kwantylowych.

Jeśli interesuje Pana ten problem - polecam:

M. del Mar Rueda, Antonio Arcos, M.Dolorez Martinez. Difference estimators of quantilles in finite populations. Springer 2002.

Dla 11 - elementowego (nieparzystego) zbioru danych:

q_{02} = x_{[11\cdot 0,2] +0,5} = x_{2,5},

przyjmujemy się również

q_{02} = x_{[11\cdot 0,2] + 1} = x_{3}.

[ . ] - oznacza "Entier" ("Podłogę") części całkowitej liczby.
Góra
Mężczyzna Offline
PostNapisane: 15 maja 2018, o 19:18 
Użytkownik

Posty: 16
Lokalizacja: Polska
janusz47 napisał(a):
Sens jest oczywisty, jeśli mamy dużą ilość danych statystycznych, to należy skonstruować metody numeryczno - komputerowe obliczania wartości kwantyli. Najbardziej efektywnymi i dobrze uwarunkowanymi są metody interpolacji liniowej - konstrukcji estymatorów kwantylowych.

Ja rozumiem, iż interpolacja liniowa jest najmniej kosztowna numerycznie. Jednak zabiegi linearyzacji można stosować i stosuje się je w różnych bardziej wymagających kosztów numerycznych zagadnieniach: rozwiązywanie równań różniczkowych, nieliniowych(NR) czy liniowych (metoda gradientów sprzężonego) i tym podobnych problemów.
W tym przypadku koszt numeryczny jest znikomy - to właśnie linearyzacja spowoduje jego powiększenie tak mi się wydaje.



janusz47 napisał(a):


Dla 11 - elementowego (nieparzystego) zbioru danych:

q_{02} = x_{[11\cdot 0,2] +0,5} = x_{2,5},

przyjmujemy się również

q_{02} = x_{[11\cdot 0,2] + 1} = x_{3}.

Ok
janusz47 napisał(a):
[ . ] - oznacza "Entier" ("Podłogę") części całkowitej liczby.

Ok dziękuję Panu bardzo, nie wiedziałem o tym:
Góra
Utwórz nowy temat Odpowiedz w temacie  [ Posty: 9 ] 


 Zobacz podobne tematy
 Tytuł tematu   Autor   Odpowiedzi 
 Momenty rzędu  wagus1  3
 Rozkłady i kwantyle  traczu93  4
 pochodne drugiego rzędu - zadanie 6  karolynqaa  0
 mediana, kwantyle  dethim  1
 Współczynnik zmienności, kwantyle  Diiven  0
 
Atom [Regulamin Forum] [Instrukcja LaTeX-a] [Poradnik] [F.A.Q.] [Reklama] [Kontakt]
Copyright (C) Karpatka.pl