카이제곱검정의 실시에 있어 세 가지가 정말 궁금한데요. 꼭 도와주시면 감사하겠습니다.
1. 단일 보기에 대한 카이제곱검정 실시 관련
범주형 척도인 두 변수 간의 유의성을 검정하기 위해 카이제곱검정을 실시하는 것은 잘 이해됩니다. 근데 설문조사에서 단순히 1번 문항과 직업 간에 상관관계가 있는지가 아니라 문항에서 특정보기를 선택하는 정도에 대해 직업 프로필에 유의미한 차이가 있는지를 볼 때도 카이제곱검정을 실시할 수 있는지 궁금합니다.
예를 들어,
문항, 다음 중 가장 선호하는 커피프랜차이즈 브랜드는?
1) 스타벅스
2) 커피빈
3) 카페베네
4) 파스쿠찌
....
일때 이 문항에 대한 1번 보기인 '스타벅스'에 대해서 직업에 따라 유의미한 차이가 있다는 가설을 카이제곱검정을 통해 증명할 수 있는지 알고 싶습니다. 그리고 이렇게 문항을 구성하는 보기 중 한 가지에 대해서만 카이제곱검정을 실시할때는 나머지 보기의 관측빈도는 모두 합해서 보기를 일종에 '스타벅스'와 '그렇지 않은 것'으로 이원화해서 교차분석표를 만들고 카이제곱검정을 실시해도 되는지 궁금합니다.
2. 특정 2개의 값(value)에서의 결과 차이를 검정
만약 위와 같은 문항에서 1번 보기에 대해 직업 간에 유의미한 차이가 있는지를 해당 보기와 '직업'변수로만 분석하는 것이 아니라 직업에서도 '특정한 두 직업 간에 보기1번의 선택에 대한 유의미한 차이'가 있다는 것을 카이제곱 검정을 실시해서 증명할 수 있는지 알고 싶습니다.
예를 들어 1번 문항에는 아래와 같은 직업 프로필을 가진 응답자들이 응답했는데요.
응답자 직업구성 - 사무직/기술직/공무원/학생/주부
여기서 1번 보기(스타벅스)의 선택에 대해 직업에 따라 차이가 있는지를 보는 것이 아니라 좀 더 세부적으로 들어가서 '사무직'과 '주부' 사이에 유의미한 차이가 있다를 카이제곱 검정을 실시하여 증명하는 것이 가능한가요?
3. 독립변인이 두 가지 변수의 교차로 구성된 집단이라면?
설문조사를 진행하고 교차분석표로 결과를 해석할때 성별과 연령을 크로스로 봐서 교차분석표를 구성하고 그 안에서 특정한 차이가 유의미한지 보고 싶은 경우를 의미하는데요.
예를 들어 성by연령으로 표를 만들었고 그 안에서 특정 보기에 대해 20대 남성과 30대 남성을 비교한다고 하면, 그냥 남성과 여성의 응답결과간에 차이가 있는지를 알기 위해 실시하는 카이제곱검정과 동일하게 20대 남성의 보기1에 대한 관측빈도와 30대 남성의 보기1에 대한 관측빈도를 기반으로 계산하면 되는지 알고 싶네요.