표본의 크기에 대해 알아봅시다 - 심화학습
- 작성일2023/03/10 15:48
- 조회 82
"여론조사 전화를 받았는데, 나이가 많다고 끊겼어요."
티브릿지에서 강의나 상담을 할 때 이런 질문을 받곤 합니다. 연령 문항에서 '60대'를 선택했는데, "이미 조사가 완료되었습니다"라는 조사원 또는 ARS 음성 안내가 나오고 통화가 종료되었다는 겁니다. 실제 이러한 사례를 여론조사 조작 또는 왜곡의 증거로 제시하곤 합니다. 여러분은 이러한 경험이 있거나 들어보신 적이 있나요?
실제로 이런 일이 발생합니다. 예를 들어 1,000명의 표본을 가진 조사에서는 우리나라 인구의 성별, 연령대, 지역별 비율에 맞게 1,000명을 선정해야 합니다. 위의 표는 한국갤럽이 3월 초 발표한 여론조사 결과의 표본입니다. 총 1,002명이 응답했으며, 왼쪽의 '조사 완료 사례수'는 실제로 응답한 사람의 수를 나타내고, 오른쪽의 '가중값 적용 기준 사례수'는 1,002명을 성별, 연령대, 지역 비율에 맞게 조정한 값입니다.
왜 처음부터 인구 비율에 맞게 1,000명을 선정하지 않고 가중값을 적용하는 걸까요? 위의 표를 다시 살펴봅시다. 18~29세 연령대의 경우, 필요한 표본수는 167명(오른쪽)이지만 실제로는 128명만의 응답이 있었습니다. 반면 60대는 인구 비율에 따라 168명을 표집해야 하는데 실제로는 198명이 응답했네요. 일반적으로 청년층보다 중장년층이 조사에 응하는 비율이 높아서 이런 경향이 나타납니다.
그래서 18~29세 연령대는 응답 결과에 플러스 가중값을 적용하여 167명의 응답값으로 조정하고, 60대는 마이너스 가중값을 적용하여 맞추는 것입니다. 그렇다고 청년층의 응답률이 낮아서 50명만 응답한 경우에도 167명으로 조정하는 것은 적절하지 않습니다. 이렇게 하면 조사 결과가 왜곡될 가능성이 높아지기 때문입니다. 가중값 적용 기준은 제도적으로 정해져 있습니다. 이는 다소 복잡한 내용이므로 자세한 설명은 다음 학습에서 다루겠습니다.
다시 원래 주제로 돌아가 봅시다. 이미 60대에서 받아야 할 응답(168명)을 초과해서 198명이 응답한 경우, 가중값 적용 기준에 따라 더 이상 60대 응답은 필요하지 않은 상황입니다. 이러한 판단은 개인이 아닌 계산 프로그램을 통해 기술적으로 조치되는 것입니다. 그러므로 나이가 60대라고, 남성이라고, 서울에 사는 등의 이유로 전화가 종료되는 것이 아니라 이미 해당 구간의 조사가 완료된 상황이라고 이해하시면 됩니다.
사람들의 생각을 똑바로 읽고 정확하게 해석하기 위해 노력하는 회사
여론조사 & 데이터 컨설팅 전문기관 <티브릿지>였습니다.