상세 컨텐츠

본문 제목

필기) 2과목-20 정규분포의 이해

빅데이터 분석 기사

by 37_KIM 2022. 8. 12. 17:29

본문

 

 

S2-04 통계 기법 이해

 

1. 중심경향 통계량, 산포도

2. 표본 추출 방법

3. 확률 분포

4. 표본 분포

5. 추론 통계

6. 연속형 확률분포 - 졍규분포

 

6-1 연속형 확률분포 - 정규분포

  • 정규분포의 확률밀도 함수

https://commons.wikimedia.org/w/index.php?curid=3817954

 

File:Normal Distribution PDF.svg - Wikimedia Commons

 

commons.wikimedia.org

 

 

- 파란색, 평균=0 분산=0.2

- 빨간색, 평균=0 분산=1.0

- 노란색, 평균=0 분산=5.0

- 연두색, 평균=-2 분산=0.5

 

- 그래프를 보면 평균이 3개가 같고 분산에 따라 첨도가 다른것을 볼 수 있다 (첨도는 봉우리의 높이를 의미함)

- 분산이 낮을수록 첨도가 높은것을 볼 수 있다 즉, 분산이 크다는 것은 넓게 분포해있다고 이해할 수 있다

- 연두색 평균의 위치가 -2로 첨도가 -2쪽에 위치해있고 분산이 1.0과 0.2 사이인 0.5값의 위치를 보면 빨간색 봉우리와 파란색 봉우리 사이에 연두색 봉우리가 위치해 있는것을 볼 수 있다

 

 

- 정규분포는 평균(μ)과 표준편차(σ)에 대해 모양이 결정된다 (표준편차는 분산에 루트를 씌운 값)

- 평균(μ)은 분포의 중심으로 봉우리의 가장 높은 부분

- 평균(μ)을 중심으로 대칭을 이루고 있다

- 평균(μ)에서 가장 큰 값이 되는 하나의 봉우리만 가진다

- 분산(σ²)이 크면 분포의 산포가 커진다( 넓게 분포한다)

- 분산(σ²)이 작으면 분포의 산포가 작아진다 (좁게 분포한다)

- 그렇다면 N(3, 2²)의 그림은? (N=정규분포, 3은 평균, 2²은 분산)

  - x축이 3위치에서 가장 높은 봉우리가 될 것이고

  - 분산 2²는 4가 될것이니 노란색의 5.0인 봉우리보다 조금 더 높을 것이다

 

- 표준편차가 크다는 것은 분산이 크다는 것이고, 표준편차가 작다는 것은 분산이 작다는 것을 의미 ( 분산에 루트를 씌운것이 표준편차)

 

 

6-2 정규확률변수의 표준화

  • X ~ N(μ, σ²) 일 때, 평균0, 표준편차/분산 1인 정규분포 N(0, 1)를 표준 정규 분포, z 분포라고 한다

- 표준화 - 이 식은 외우기!!

 

 

- 다음 그림은 표준정규분포이다

→ X ~ N(10, 2²)일 때, P(10 ≤ X ≤ 13)은?

    - 위의 풀이로 구한 z를 그래프에 표기해보면 다금과 같고 이를 정규분포에서 표준정규분포로 변환

      - 표시된 부분의 확률을 구해주면 된다 ( 뒤에서 표준정규분포표를 이용해서 푸는것을 알아볼 것)

  - 정규분포를 표준화하는 방법, 위에서 10과 13 두개의 숫자를 a, b라고 표현한 것. 그리고 그 뒤에 확률을 구해라 하면

  - P(b) - P(a) 하면된다

 

 

6-3 표준정규분포

  • 표준정규 확률변수의 (1 - α) 분위수 : Zα

(1−α) 분위수

 일 때, 를 만족하는 분위수 c를 로 표기한다.

 

 

 

이 중 가장 자주 쓰이는 분위수는 0.05, 0.01 등이며, 이들의 누적확률은 다음과 같다.

  • P(Z≤1.645)=0.95
  • P(Z≤1.96)=0.975
  • P(Z≤2.326)=0.99

0.95 분위수 = 1.645

 

https://modern-manual.tistory.com/7

 

표준정규분포표 보는법 및 이미지 파일

 표준정규분포표는 표준정규분포에 대한 누적분포함수 $\Phi(Z_\alpha)$ 값을 미리 계산 해놓은 표로, 정규분포의 확률을 쉽게 계산하기 위해 사용한다. $(1-\alpha)$ 분위수  $Z \sim N[0,1]$일 때, $P[Z $\Ph

modern-manual.tistory.com

 

 

 

 

 

 

 

 

[출처] - EduAtoZ - Programming [빅데이터 분석기사 필기 2과목]

관련글 더보기