본문 바로가기
보건 의학 통계학

자료의 변환

by ARNI 2021. 8. 11.

변환의 필요성 - 통계분석을 수행하기 위해서

  • 정규분포를 따르지 않는 경우
  • 모분산이 동일해야 하는 두 독립표본 t-검정, 분산분석을 진행하고자 하는 경우
  • 회귀분석에 필요한 두 변수간 선형적인 관계가 성립하지 않는 경우

대수 변환 (로그 변환) : $Z=logY$

Y가 오른쪽으로 치우친 경우 Y가 X에 대해 지수적인 관계인 경우 큰 y값을 갖는 집단이 분산이 큰 경우
Z는 근사적으로 정규분포를 따른다 Z와 X는 선형적인 관계가 된다 각 집단간의 분산의 크기가 비슷해진다
정규화 선형화 분산 안정화

 

제곱근 변환  : $Z= \sqrt{Y}$

로그변환과 유사한 효과를 가진다

역변환시 해석이 복잡해지고, 포아송 변수에 대해 자주 사용된다

 

역수 변환 : $Z= \frac{1}{Y}$

로그변환과 유사한 효과를 가진다

생존시간과 관련된 자료에서 생존분석을 사용하지 않는 경우 적절한 변환 방법

 

*분산 안정화 (큰 y값을 갖는 집단이 분산이 큰 경우)

표준편자를 평균으로 나눈것(변동계수)이 일정한 경우 : 대수 변환

분산을 평균으로 나눈것이 일정한 경우 : 제곱근 변환

분산을 평균$^{4}$으로 나눈것이 일정한 경우  : 역수 변환


제곱 변환 : $Z= Y^{2}$

로그변환과 반대의 효과를 가진다

Y가 왼쪽으로 치우친 경우 Y가 X에 대해 위로 볼록한 곡선인 경우 큰 y값을 갖는 집단이 분산이 작은 경우
Z는 근사적으로 정규분포를 따른다 Z와 X는 선형적인 관계가 된다 각 집단간의 분산의 크기가 비슷해진다
정규화 선형화 분산 안정화

로짓(로지스틱) 변환 : $Z= ln\frac{p}{1-p}$

비율 자료를 다룰때 가장 많이 사용

s자형 곡선을 선형적으로 만들어준다

 

ref.

https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=273788798

 

한눈에 알 수 있는 보건.의학 통계학

책 한 권 내에 어떤 상황에서는 어떤 통계분석을 실시해야 하는지, 또 어떻게 분석을 실시하며, 분석결과는 어떻게 해석하는지 등 실질적으로 필요한 내용들을 충분히 제공하기가 결코 쉽지는

www.aladin.co.kr

 

'보건 의학 통계학' 카테고리의 다른 글

임상 시험 (3상)  (0) 2021.08.13
역학 - 용어 정리  (0) 2021.08.11
이론적 분포들 - 정규, 기타 분포  (0) 2021.08.11
자료의 기술 - 평균적인 값, 흩어진 정도  (0) 2021.08.09
오류 검토와 이상 값  (0) 2021.08.09

댓글