오늘은 두 그룹의 비율 차이 검정에 대해 정리하고자 한다. 분석코드 및 대부분의 내용은 'Machine Learning at Work 머신러닝 실무 프로젝트' 책을 참고하였습니다. 두 개의 광고 서비스를 통해 각각 유입된 사용자들의 이용률을 아래와 같이 얻었다고 하자. 광고종류 유입 사용자 수 지속 이용 사용자 수 지속 이용 전환율 A 205 40 19.5% B 290 62 21.4% 위의 예시는 '지속이용자' 와 '이탈자' 두 범주에 대한 비율을 보이고 있기 때문에 이항분포를 따르지만 유입 사용자수가 어느정도로 크기 때문에 정규분포를 따른다고 보고 지속 이용 전환율의 분포를 시각화해보자. (위 내용은 중심극한 정리 참고!!) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1..