예측 변수와 반응 변수를 모두 줄이기 위해 예측 변수를 사용할 수 있습니까?

최근 주성분 분석에 대한 무료 웹 세미나를 진행했습니다. 우리는 거의 300 명의 연구원이 참석했고 모든 질문을 통과하지 못했습니다. 이것은 그 질문에 일련의 응답의 부분 이다.

당신이 그것을 놓친 경우,당신은 여기에 웹 세미나 녹화를 얻을 수 있습니다.

질문:예측 변수와 반응 변수를 모두 줄이기 위해 예측 변수를 사용할 수 있습니까?

사실,결과 구성 요소 점수를 사용하고 해석하는 것과 관련하여 몇 가지 관련이 있지만 별도의 질문이 있었기 때문에 여기에서 함께 대답하겠습니다.

내 회귀 결과를 원본 데이터로 해석하고 싶지만 회귀 분석 결과 아래에 숨어 있다고 가정 해 봅시다. 이 경우 우리가 할 수있는 최선의 해석은 무엇입니까?

답변:

그래서 네,상관 변수의 그룹의 최적 가중치 조합 인 인덱스 점수 변수를 만들 수 있습니다.

그리고 예,이 인덱스 변수를 예측 변수 또는 반응 변수로 사용할 수 있습니다.

회귀 모델에서 예측 변수 간의 다 공선성에 대한 솔루션으로 자주 사용됩니다. 상관관계 예측 변수를 여러 개 포함하는 것이 아니라,그 중 어느 것도 중요하지 않습니다.

또한 여러 상관 결과 변수에 대해 동일한 분석을 실행함으로써 발생하는 과장된 패밀리 와이즈 유형 1 오류를 피하기 위해 솔루션으로 사용됩니다. 다음 단일 결과 변수로 사용 합니다. (이 마노 바가하는 일,덧붙여 말하자면,이다).

두 경우 모두 개별 변수를 더 이상 해석할 수 없습니다.

당신이 할 수 있습니다,하지만 당신은 할 수 없습니다.

의 우리가 웹 세미나에서 사용 된 예제를 사용하자. 이 예에서 궁극적 인 연구 질문은 다른 포유류 종의 예상 수명을 예측하는 것이 었습니다. 우리는 체중,수면 중 노출,하루 수면 시간,동물이 포식에 얼마나 취약한지에 대한 평가와 같은 상관 관계 예측 변수 세트를 가지고 있음을 발견했습니다.

이 네 가지 변수는 분명히 매우 별개의 개념입니다. 우리는 이해하고 무게와 수명 사이의 관계를 해석 할 수 있도록 할 수 있습니다.

그리고 우리는 수면 중 노출과 수명 사이의 관계를 별도로 이해하기를 원할 수 있습니다.

개념적으로 다릅니다.

그럼에도 불구하고,이 데이터 세트에서 그것들을 완전히 구별 할 수는 없습니다. 당신은 완전히 그들이 너무 상관있어 경우 수명에 무게의 영향을 분리 할 수 없습니다.

생각해 보세요—모든 얼룩말과 들소가 열린 곳에서 잠을 자고 무게가 많이 나가고 박쥐와 새끼가 밀폐 된 공간에서 잠을 자고 무게가 거의 없다면 데이터 세트의 수면 노출과 무게를 분리 할 수 없습니다.

이 네 변수의 효과를 분리할 수 없다고 했습니다. 이 네 가지 변수의 대부분의 정보를 하나의 인덱스로 설명합니다.

그래서 우리의 결합 된 인덱스 변수는 우리가 해석해야 할 것입니다. 이 결합 변수에서 높은 값이 더 긴 수명을 예측한다는 것이 밝혀지면 회귀 출력을 그런 식으로 해석해야 합니다.

주성분 분석
많은 변수의 일반적인 변동을 요약합니다… 그냥 몇 가지로. 주성분 분석을 수행하는 5 단계 및 요인 분석과 다른 방법에 대해 알아보십시오.

답글 남기기

이메일 주소는 공개되지 않습니다.