x : 산점도 변수 + 더미변수 2개
제품 스펙을 기준으로 cost 제안하는 모델을 만들어야 합니다. units값의 경우 경제학적 한계수익을 생각해서 이상치가 발견되어도 제거하지 않았습니다. stepwise를 이용해 회귀식을 적합하면 결정계수값이 낮게 나옵니다. units 값이 몰린 200, 300 값을 분할하여 분석하면 나머지 units값들을 적합한 식은 결정계수가 50%정도 나오는데 units 200, 300값의 결정계수가 낮게 나옵니다. units값에 로그, 역수, 루트 등 간단한 변수변환을 시행해도 상황이 크게 나아지지 않네요.
변수변환이나 구간나누는 것에 다른 방법론이 있는지 찾는게 쉽지 않아 질문올립니다.