728x90

Statistics 2

데이터 자료 형태에 따른 상관분석 방법

1. 상관분석(Correlation Analysis) 두 확률 변수 간에 어떤 선형적 관계를 가지는지 분석하는 기법으로 상관계수를 이용하여 측정합니다. 하지만 두 변수간에 선형적인 관계가 있다고 해서 인과관계까지 있다는 것은 아닙니다. 2. 상관계수(Correlation Coefficient) 상관관계를 분석하는데 있어서 가장 직관적인 방법은 산점도를 그려 직선의 형태와 가까운지 확인하는 것입니다. 상관계수는 비교하고자 하는 두 확률 변수 X와 Y가 함께 변하는 정도를 의미하며 $r$ 이라고 표현합니다. X가 증가할때 Y도 같은 방향으로 증가하면 상관계수($r$)는 +1, 반대 방향으로 증가하면 $r$ = -1입니다. 아래 가운데 그림처럼 $r$ = 0인 경우는 X와 Y가 상관관계가 없다는 뜻이 아니라 ..

Statistics 2022.08.26

[비율검정] 두 그룹의 비율 차를 이용한 검정

오늘은 두 그룹의 비율 차이 검정에 대해 정리하고자 한다. 분석코드 및 대부분의 내용은 'Machine Learning at Work 머신러닝 실무 프로젝트' 책을 참고하였습니다. 두 개의 광고 서비스를 통해 각각 유입된 사용자들의 이용률을 아래와 같이 얻었다고 하자. 광고종류 유입 사용자 수 지속 이용 사용자 수 지속 이용 전환율 A 205 40 19.5% B 290 62 21.4% 위의 예시는 '지속이용자' 와 '이탈자' 두 범주에 대한 비율을 보이고 있기 때문에 이항분포를 따르지만 유입 사용자수가 어느정도로 크기 때문에 정규분포를 따른다고 보고 지속 이용 전환율의 분포를 시각화해보자. (위 내용은 중심극한 정리 참고!!) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1..

Statistics 2019.04.01
728x90
loading