R 프로그램, survival 패키지의 coxph를 활용하여 Cox proportional hazards model로 생존 분석을 하고 있습니다.
분석에 포함된 두 변수 간의 interaction term을 분석에 포함시키고자 하는데 몇 가지 질문이 있어 여쭙습니다.
1.
coxph(TS~A*B,data=data)
위 식에서 A와 B는 각각 4개의 group으로 구분된 범주형 변수입니다.
이 둘의 multiplicative interaction term인 A*B를 넣어 분석을 했을 때 아래와 같이 여러 경우의 interaction term이 출력되는데요
coef exp(coef) se(coef) z p
A2:B2 -0.090925 0.913087 0.151353 -0.60 0.548
A3:A2 -0.033619 0.966939 0.141383 -0.24 0.812
A4:B2 0.056397 1.058017 0.134474 0.42 0.675
A2:B3 -0.000475 0.999525 0.186385 0.00 0.998
....
이와 같이 출력되었을 때 두 범주형 변수 사이의 interaction 확인을 이와 같이 하는 것이 맞을지,
그렇다면 A, B interaction term의 p-value는 저 여러 값들 중 어떤 값으로 봐야 하는지,
또 저렇게 여러 개로 출력되는 interaction term의 p-value 중 하나만 유의하게 (<0.05) 나와도 A와 B 사이에 유의한 interaction이 있다고 봐야 하는지가 궁금합니다.
2.
A*B, A*C, A*D 등 주요 관심 대상인 변수 A와 여러 가지 변수(B, C, D)의 interaction term을 확인하는 경우에는 최종 모델에 어떻게 반영을 하는지가 궁금합니다.
예를 들어 모든 covariate를 포함하는 최종 모델식이 coxph(TS~A+B+C+D+E+F,data=data)이고 A*B, A*C, A*D를 1번의 식에 넣고 각각 돌리니 A*C, A*D의 interaction만 유의하게 나왔다고 할 때,
최종 모델에도 유의한 interaction term을 넣어 coxph(TS~A*C+B+A*D+E+F,data=data) 의 식을 채택하는 것이 맞을지
아니면 interaction term 검정은 coxph(TS~A*B,data=data)와 같이 대상이 되는 변수만 넣고 돌려서 interaction 여부만 언급해주고 최종 모델은 coxph(TS~A+B+C+D+E+F,data=data1) 그대로 결과를 내는 것이 맞을지가 혼란스럽습니다.
바쁘신 중 감사드립니다!