szukanie zaawansowane
 [ Posty: 4 ] 
Autor Wiadomość
Kobieta Offline
PostNapisane: 17 lip 2018, o 22:54 
Użytkownik

Posty: 37
Lokalizacja: xxxx
Cześć,
prosiłabym o pomoc w wytłumaczeniu poniższych wniosków jakie mi wyszły.
Chciałam przeprowadzić analizę składowych głównych w programie R , po wpisaniu komendy:
Kod:
1
 princomp(data, cor=T)

wyskakują mi wyniki:
Kod:
1
2
3
4
5
Standard deviations:
 (Comp.1,      1.5871532,   Comp.2 , 0.9657289       
  Comp.3 0.8406119 , Comp.4   0.7086540, Comp.5 0.5826607

 5  variables and  50 observations

Co one oznaczają?
Uniwersytet Wrocławski Instytut Matematyczny - rekrutacja 2018
Góra
Mężczyzna Offline
PostNapisane: 18 lip 2018, o 12:52 
Użytkownik

Posty: 41
Lokalizacja: Stęszew
To co wykonałaś to analiza składowych głównych względem macierzy korelacji.

To co wypluwa Ci R to odchylenia standardowe dla konkretnych składowych. Dalej mówi Ci ile jest zmiennych i ile jest obserwacji.

To tyle jak na tą komendę ;)

Jeżeli chciałabyś wiedzieć coś konkretnego to napisz tutaj, a postaram się na to odpowiedzieć
Góra
Kobieta Offline
PostNapisane: 23 lip 2018, o 21:31 
Użytkownik

Posty: 37
Lokalizacja: xxxx
Jeżeli wezmę z Excella i policzę odchylenie standardowe dla poszczególnych składowych to wyniki mi się nie zgadzają z tymi z R. Mam pięć składowych: Szybkość, Obsługa, Cena, Jakość, Popularność.
Wyniki mam w skali od 1 do 5 (1 zdecydowanie się nie zgadzam - 5 zdecydowanie się zgadzam)
Jak zliczę wyniki np dla kolumny Szybkość to odchylenie standardowe wychodzi mi 0,8 a nie 1,58.
Nie rozumiem ;)
Kolejno po wpisaniu komendy:
Kod:
1
 summary(pca, loadings=T)


wyskakuje mi:
Kod:
1
2
3
4
5
 Importance of components:
                         Comp.1    Comp.2    Comp.3    Comp.4     Comp.5
Standard deviation     1.587153 0.9657289 0.8406119 0.7086540 0.58266074
Proportion of Variance 0.503811 0.1865265 0.1413257 0.1004381 0.06789871
Cumulative Proportion  0.503811 0.6903375 0.8316632 0.9321013 1.00000000


oraz
Kod:
1
2
3
4
5
6
7
8
9
10
11
12
 

Loadings:
            Comp.1 Comp.2 Comp.3 Comp.4 Comp.5
Szybkość    -0.473  0.455  0.367        -0.655
Obsługa     -0.497  0.229 -0.241 -0.653  0.464
Cena        -0.371 -0.558  0.693         0.266
Jakość      -0.392 -0.610 -0.533        -0.435
Popularność -0.488  0.240 -0.208  0.752  0.310
> pca
Call:
princomp(x = data, cor = T)


Proszę o pomoc w interpatacji wyników;)
Góra
Mężczyzna Offline
PostNapisane: 25 lip 2018, o 13:31 
Użytkownik

Posty: 41
Lokalizacja: Stęszew
Mylisz pojęcia składowa, a zmienna.

Składową nazywamy kombinację liniową zmiennych. Odchylenie składowej w takim razie to zwykłe odchylenie standardowe po przekształceniu danych daną kombinacją liniową.

Co do współczynników tych kombinacji liniowych masz je podane w tabeli ładunków (Loadings)

Ładunek nazywamy oczywiście dodatnim jak ma dodatni znak i ujemnym jak znak jest ujemny.

Jednym z najbardziej potrzebnych jednak rzeczy jest skumulowany procent objaśnianej wariancji (Cummulative proportion of Variance). Mówi on nam jak dużo/dobrze jest objaśniana zmienna zależnie od wyboru ilości składowych.

Inaczej mówiąc: Sama 1 składowa wyjaśnia około 50,4\%, Dwie pierwsze wyjaśniają około 69\%, itd.

Najczęściej wybieramy tyle składowych, aby wyjaśniały sławne około 95\%, więc twoim wyborem są 4 składowe. Jest to mały spadek wymiaru jednakże..

Nie rozumiem tylko dlaczego w kodzie dla składowych głównych masz argument cor=T
Góra
Utwórz nowy temat Odpowiedz w temacie  [ Posty: 4 ] 


 Zobacz podobne tematy
 Tytuł tematu   Autor   Odpowiedzi 
 analiza matematyczna w matlabie  e-nDrju  0
 Matlab programowanie  alpen  1
 [OpenOffice Calc]Programowanie arkusza kalkulacyjnego  Artut97  1
 WolframAplha - programowanie wypukłe - maksymalizacja  fibonacci1101  0
 programowanie w R - statystyka  krupka888  0
 
Atom [Regulamin Forum] [Instrukcja LaTeX-a] [Poradnik] [F.A.Q.] [Reklama] [Kontakt]
Copyright (C) Karpatka.pl