szukanie zaawansowane
 [ Posty: 1 ] 
Autor Wiadomość
Kobieta Offline
PostNapisane: 4 sie 2008, o 17:27 
Gość Specjalny
Avatar użytkownika

Posty: 844
Lokalizacja: Zabrze
Obliczanie współczynnika korelacji liniowej Pearsona


Wartość współczynnika korelacji liniowej na podstawie n-elementowej próbki obliczamy według wzoru:

r=\frac{\sum\limits_{i=1}^{n}(x_i-\overline{x})(y_i-\overline{y})}{\sqrt{\sum\limits_{i=1}^{n}(x_i-\overline{x})^2\sum\limits_{i=1}^{n}(y_i-\overline{y})^2}} = \frac{\frac{1}{n} \sum\limits_{i=1}^{n}x_iy_i - \overline{x} \,  \overline{y}}{\sqrt{\left( \frac{1}{n} \sum\limits_{i=1}^{n}x_i^2-\overline{x}^2 \right) \left( \frac{1}{n} \sum\limits_{i=1}^{n} y_i^2-\overline{y}^2\right) }}


gdzie \overline{x}, \ \overline{y} - odpowiednie średnie:
\overline{x}=\frac{1}{n}\sum_{i=1}^n x_i, \ \ \overline{y}=\frac{1}{n}\sum_{i=1}^n y_i


Interpretacja wyniku
  • r \in [-1,1],
  • współczynnik korelacji jest miarą związku liniowego, r=0 oznacza brak zależności liniowej, na tej podstawie nie można wnioskować o niezależności zmiennych,
  • gdy r>0 - korelacja dodatnia - wzrostowi wartości zmiennej X towarzyszy wzrost wartości zmiennej Y,
  • gdy r - korelacja ujemna - wzrostowi wartości zmiennej X towarzyszy spadek wartości drugiej zmiennej,
  • im |r| jest bliższy 1 tym zależność liniowa jest silniejsza, zwykle przyjmuje się:
      • < 0,2 - brak związku liniowego,
      • 0,2 - 0,4 - słaba zależność,
      • 0,4 -0,7 - umiarkowana zależność,
      • 0,7 - 0,9 - dość silna zależność,
      • > 0,9 - bardzo silna zależność.

Przykład

Czy istnieje liniowa zależność między liczbą nowych użytkowników (X) a liczbą nieregulaminowych tematów (Y) w poszczególnych godzinach działania forum?
\begin{array}{r|r|r|r|r|r}
i&x_i&y_i&x_iy_i&x_i^2&y_i^2 \\ \hline
1&0&1&0&0&1\\ 
2&2&2&4&4&4\\ 
3&1&5&5&1&25\\ 
4&4&6&24&16&36\\ 
5&1&2&2&1&4\\  \hline
\sum &8&16&35&22&70 \\
\end{array}


n=5 \\
\overline{x}=\frac{1}{5}\cdot 8 =1,6 \\
\overline{y} = \frac{1}{5} \cdot 16= 3,2 \\
r=\frac{\frac{1}{5}\cdot 35 - 1,6 \cdot 3,2}{\sqrt{\left( \frac{1}{5} \cdot 22 - 1,6^2 \right) \left( \frac{1}{5} \cdot 70 - 3,2^2 \right)}}=0,71

  • r > 0 - korelacja dodatnia - wraz ze wzrostem liczby nowych użytkowników rośnie liczba nieregulaminowych tematów,
  • r = 0,71 - zależność liniowa między liczbą nowych użytkowników a liczbą nieregulaminowych tematów jest dość silna.
Góra
Utwórz nowy temat Odpowiedz w temacie  [ Posty: 1 ] 


 Zobacz podobne tematy
 Tytuł tematu   Autor   Odpowiedzi 
 Współczynnik korelacji. - zadanie 3  kaasia229  1
 Wzór funkci liniowej.  Poker_face__  1
 pełen opis przestrzeni liniowej  leszczu450  1
 Wykres funkcji liniowej - zadanie 7  anitka3694a  1
 Znaleźć współczynnik kątowy styczny do krzywej  rymek94  4
 
Atom [Regulamin Forum] [Instrukcja LaTeX-a] [Poradnik] [F.A.Q.] [Reklama] [Kontakt]
Copyright (C) ParaRent.com