본 자료는 고등학교 1학년 대상으로 수업을 진행한 빅데이터 교육에 관한 자료이다.
빅데이터 분석 타이타닉 데이터 분석 편
1. 가설 세우기

남성보다 여성이 생존확률이 높을 것이다.
"여성과 어린이 먼저"라고 불리는 원칙이 19세기 유럽에서 널리 퍼졌다. 이는 비상 상황, 특히 배가 침몰할 때와 같은 내한 사고에서 구조 활동을 진행할 때 여상과 어린이를 먼저 구조하는 관행이다.
그렇다면 모든 연령과 탑승등급에서 여성의 생존확률이 높을 것인가?
여자와 어린아이를 먼저 구하는 관행이 유행하지만 미성년의 연령에서는 모두가 먼저 구해야 하는 대상이 되기에 확실하지 않을 것이다.
2. 데이터 전처리
- 결측치를 찾고 삭제 및 대체하기
- 추가생성으로 범주화하기 (if함수 사용)


3. 피벗테이블 만들기
- 피벗테이블을 이용하여 생존자 수 확인하기
- 해당 숫자가 어떤 데이터를 표현하는지 학습하기


4. 피벗차트로 시각화하기
순위 비교 - 막대그래프

비율 비교 - 도넛 / 파이그래프

5. 가설 검증하기

'BigData' 카테고리의 다른 글
| 빅데이터 분석 | 빅데이터 분석 과정 활동 (0) | 2024.10.27 |
|---|---|
| 빅데이터 분석 | 빅데이터 분석 이론 (0) | 2024.10.23 |
| 빅데이터 이론 및 분석과 시각화 교육 후기 (4) | 2024.07.16 |
| 빅데이터 진로 캠프 교육 후기 (2) | 2023.11.11 |