질문이 좀 많습니다. 죄송합니다^^
1. 다루고 있는 중인 data의 n수가 200에 가깝습니다. 200여개의 sample들에 여러 항목을 측정하고 이 연속성의 항목들 간의 연관성을 분석하는데요, n수가 충분하므로 중심극한의 정리에 의해 정규분포를 띤다고 가정하고 통계를 돌렸었는데, 표준편차가 상당히 크기 때문인지 정규성 검정을 해 보니 정규분포를 따르지 않았습니다. 이런 경우에는 비모수 통계방법으로 바꿔야 하는지 아니면 실제 정규분포는 아니지만 정규분포로 가정하고 그대로 모수적 통계를 진행해도 되는건지 궁금합니다.
2. 회귀분석을 하는데요, 회귀 모형의 기본 가정중에 오차항의 정규성과 관련해서 "모든 독립변수의 값에서 종속변수는 정규분포를 이룬다"라고 되어있는데, 이건 종속변수는 정규분포를 따라야 하고 독립변수는 정규분포를 따르지 않아도 된다는 말인가요? 그리고 종속변수가 정규분포를 따르지 않아서 다중회귀분석을 시행할 수 없다고 한다면 이와 유사하면서 비모수를 이용한 통계법이 혹시 있다면 알려주세요.
3. 마지막으로, 다중회귀분석의 다중공선성에 관한 질문입니다. A, B, C의 독립변수가 종속변수에 미치는 영향을 다중회귀분석 하려고 하는데, 독립변수 A와 B 사이의 연관관계가 있다고 생각된다면, 일단 세 독립변수를 모두 집어넣고 다중회귀분석을 했을 때 공선성통계량의 VIF가 10 이상인 항목이 없으면 다중공선성이 없다고 보는건지 아니면 독립변수 A, B, C사이의 상관관계를 미리 분석해서 종속관계가 있다고 생각되는 변수들 중 하나만 선택하여 모형에 투입한 뒤 다중회귀분석을 하고 VIF가 10이상이 없는지를 확인해야 하는지 궁금합니다.
질문이 좀 많네요. 통계를 이제 막 다뤄봐서 모르는게 많습니다. 잘 부탁드립니다^^