데이터 코딩랩

바이오 통계학_1강 통계학의 기본 개념과 데이터 요약 본문

방송통신대학_데이터통계학과

바이오 통계학_1강 통계학의 기본 개념과 데이터 요약

researcher 틴틴 2024. 11. 6. 10:35

 

 

✔️ 학습목표

  1. 모집단, 표본, 모수, 통계량의 개념을 이해하고 설명하기
  2. 범주형 데이터의 분포 ➡️ 도수분포표, 막대그래프로 나타내기
  3. 연속형 데이터의 분포 ➡️ 평균, 중앙값, 분산, 표준편차, 범위, 사분위수 범위 등으로 요약, 도수분포표나 히스토그램, 상자그림으로 나타낼 수 있다.
  4. 평균과 중앙값의 특징을 설명하기

 

 

✔️ 주요용어

  1. 모집단
    우리가 알고 싶은 대상 전체
  2. 표본
    모집단을 알기 위해서 실제로 관측한 모집단의 일부
  3. 모수
    모집단 전체의 특성을 나타내는 값
  4. 통계량
    표본의 특성을 나타내는 값
  5. 평균
    관찰값의 총합을 관찰값의 개수로 나눈 값. 분포의 균형을 이루는 무게중심의 위치
  6. 중앙값
    데이터를 크기 순서대로 늘어놓았을 때 정확히 중앙에 위치하는 값

 

✔️  정리하기

1. 우리가 알고 싶은 대상 전체 = 모집단

    표본 : 모집단을 알기 위해서 실제로 관측한 모집단의 일부

    모집단 전체의 특성을 나타내는 값 : 모수

    표본의 특성을 나타내는 값 : 통계량

2. 데이터 : 표본 또는 모집단에 대해 하나 이상 변수의 관찰값을 모은 것

    어떤 실수 구간 안의 모든 값을 가질 수 있는 변수 : 연속형 변수라고 하고, 

    유한개의 범주 중 하나의 값을 취하는 변수 : 범주형 변수라고 한다.

3. 범주형 데이터를 표로 요약하려면, 도수분포표로 요약

    범주형 데이터의 분포를 그래프로 나타내는 대표적인 방법은 막대그래프

4. 연속형 데이터의 중심위치를 요약하는 통계량 : 평균과 중앙값

    데이터의 퍼진 정도를 요약하는 통계량 : 분산, 표준편차, 범위, 사분위수 범위 등

5. 연속형 변수의 분포를 표로 요약할 때 : 도수분포표 

    그래프로 나타낼 때 : 히스토그램이나 상자그림을 이용

6. 기울어진 분포를 가졌거나 특이점이 있는 연속형 데이터의 경우,

    평균보다 중앙값이 데이터의 중심위치를 더 잘 나타낸다.

7. 질높은 연구와 투명한 결과 전달을 위해, 본격적인 데이터 분석에 앞서 요약통계량과 그래프를 반드시 확인해야 한다.

 

'방송통신대학_데이터통계학과' 카테고리의 다른 글

데이터과학개론 1강  (1) 2024.11.16
바이오통계학_1강 연습문제  (0) 2024.11.08