S2-03 데이터 탐색
1. 탐색적 데이터 분석
2. 상관 관계 분석
3. 시각적 데이터 탐색
1-1 탐색적 데이터 분석
- 데이터의 통계량과 분포 등을 통해 데이터의 형태를 확인하고, 데이터를 이해하며 의미 있는 관계를 찾아내는 과정
- 분석에 앞서 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정
- 수집한 데이터를 다양한 관점에서 관찰하고 이해하는 과정
저항성 | 수집된 자료에 결측값, 이상값이 있을 때도 영향을 적게 받는 성질 (평균보다 중앙값 선호) |
잔차 해석 | 잔차를 구하여 데이터의 보통과 다른 특징 탐색, 주 경향에서 벗어난 값이 왜 존재하는가? |
자료 재표현 | 데이터 분석, 해석을 단순화 할 수 있도록 원래 변수를 변환하는 것 ( 로그, 제곱근, 역수 등) |
현시성 | 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정 |
1-2 탐색 방법
- 변수 하나에 적용하는 탐색
범주형 (명목, 순위, 척도 데이터) | 수치형 (등간, 비율 척도 데이터) |
- 통계값 : 빈도수, 최빈값, 비율, 백분율 등 - 시각화 : Bar plot (막대 그래프) |
- 통계값 : 평균, 분산, 표준편차, 첨도, 왜도 등 - 시각화 : Histogram, Boxplot |
- 변수 여러개에 적용하는 탐색
범주형 - 범주형 | 범주형 - 수치형 | 수치형 - 수치형 |
- 빈도수와 비율 활용 - 교차빈도, 비율, 백분율 분석 - Bar plot ( 막대 그래프) |
- 범주를 그룹으로 사용 - 그룹에 따른 수치형 변수의 통계량 차이 비교 - Boxplot |
- 변수 간의 상관성 분석 - 공분산으로 방향 파악 - 상관계수로 방향, 강도 파악 - Scatter plot, Scatter matrix plot |
q1) 데이터의 통계량과 분포 등을 통해 데이터의 형태를 확인하고, 데이터를 이해하며 의미 있는 관계를 찾아내는 과정을 일컫는 것은?
1. 가설검정
2. 탐색적 데이터 분석
3. 데이터 시각화
4. 기술통계
q2) 탐색적 데이터 분석에 대한 설명으로 올바르지 않은 것은?
1. 수집한 데이터를 다양한 관점에서 관찰하고 이해하는 과정이다
2. 분석 모형에 대한 후보 모형을 선정하여 분석 효율성을 높이는 과정이다
3. 분석에 앞서 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정이다
4. 데이터를 이해하고 의미 있는 관계를 찾아내는 과정이다
A1) 2. 탐색적 데이터 분석
=> - 데이터의 통계량과 분포 등을 통해 데이터의 형태를 확인하고, 데이터를 이해하며 의미 있는 관계를 찾아내는 과정
- 분석에 앞서 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정
- 수집한 데이터를 다양한 관점에서 관찰하고 이해하는 과정
- 데이터를 이해하고 의미 있는 관계를 찾아내는 과정
A2) 2. 분석 모형에 대한 후보 모형을 선정하여 분석 효율성을 높이는 과정이다
=> 분석 모형 선정은 '분석 모형 설계 과정'에 포함된 내용
[출처] - EduAtoZ - Programming [빅데이터 분석기사 필기 2과목]
필기) 2과목-11 데이터 탐색 - 시각화 1/4 (0) | 2022.08.06 |
---|---|
필기) 2과목-10 데이터 탐색 - 상관 관계 분석 (0) | 2022.08.06 |
필기) 2과목-08 데이터 전처리 - 변수처리 - 불균형 데이터 처리 (0) | 2022.08.05 |
필기) 2과목-07 데이터 전처리 - 변수처리 - 변수 변환 (0) | 2022.08.03 |
필기) 2과목-06 데이터 전처리 - 변수처리 - 파생변수 (0) | 2022.07.31 |