데이터 코딩랩
바이오 통계학_1강 통계학의 기본 개념과 데이터 요약 본문
✔️ 학습목표
- 모집단, 표본, 모수, 통계량의 개념을 이해하고 설명하기
- 범주형 데이터의 분포 ➡️ 도수분포표, 막대그래프로 나타내기
- 연속형 데이터의 분포 ➡️ 평균, 중앙값, 분산, 표준편차, 범위, 사분위수 범위 등으로 요약, 도수분포표나 히스토그램, 상자그림으로 나타낼 수 있다.
- 평균과 중앙값의 특징을 설명하기
✔️ 주요용어
- 모집단
우리가 알고 싶은 대상 전체 - 표본
모집단을 알기 위해서 실제로 관측한 모집단의 일부 - 모수
모집단 전체의 특성을 나타내는 값 - 통계량
표본의 특성을 나타내는 값 - 평균
관찰값의 총합을 관찰값의 개수로 나눈 값. 분포의 균형을 이루는 무게중심의 위치 - 중앙값
데이터를 크기 순서대로 늘어놓았을 때 정확히 중앙에 위치하는 값
✔️ 정리하기
1. 우리가 알고 싶은 대상 전체 = 모집단
표본 : 모집단을 알기 위해서 실제로 관측한 모집단의 일부
모집단 전체의 특성을 나타내는 값 : 모수
표본의 특성을 나타내는 값 : 통계량
2. 데이터 : 표본 또는 모집단에 대해 하나 이상 변수의 관찰값을 모은 것
어떤 실수 구간 안의 모든 값을 가질 수 있는 변수 : 연속형 변수라고 하고,
유한개의 범주 중 하나의 값을 취하는 변수 : 범주형 변수라고 한다.
3. 범주형 데이터를 표로 요약하려면, 도수분포표로 요약
범주형 데이터의 분포를 그래프로 나타내는 대표적인 방법은 막대그래프
4. 연속형 데이터의 중심위치를 요약하는 통계량 : 평균과 중앙값
데이터의 퍼진 정도를 요약하는 통계량 : 분산, 표준편차, 범위, 사분위수 범위 등
5. 연속형 변수의 분포를 표로 요약할 때 : 도수분포표
그래프로 나타낼 때 : 히스토그램이나 상자그림을 이용
6. 기울어진 분포를 가졌거나 특이점이 있는 연속형 데이터의 경우,
평균보다 중앙값이 데이터의 중심위치를 더 잘 나타낸다.
7. 질높은 연구와 투명한 결과 전달을 위해, 본격적인 데이터 분석에 앞서 요약통계량과 그래프를 반드시 확인해야 한다.
'방송통신대학_데이터통계학과' 카테고리의 다른 글
데이터과학개론 1강 (1) | 2024.11.16 |
---|---|
바이오통계학_1강 연습문제 (0) | 2024.11.08 |