본 자료는 고등학교 1학년 대상으로 수업을 진행한 빅데이터 교육에 관한 자료이다.
빅데이터 분석 이론 편
데이터의 크기


- 컴퓨터의 연산 방식 = 0과 1
- 0 또는 1 -> 1 BIT -> 데이터를 나타내는 최소 단위
- 8BIT ->1BYTE
하루에 발생하는 데이터 양
1) 1인당 발생하는 데이터 양
사람 한 명이 하루에 약 1.5 기가바이트(GB) ~ 2.5기가바이트(GB) 정도의 데이터를 발생
2) 전 세계에서 생성, 소비된 데이터 양
IDC연구 기준 2020년 전 세계에서 생성 소비된 데이터의 총량은 약 64.2 제타바이트 (약 4,266억 편의 영화, 약 84억 년)
3) 하루에 생성되는 데이터 양
추정치에 따르면 하루에 생성되는 평균 데이터 양은 약 175.8 엑사바이트로 추정(1 엑사바이트=10억 기가바이트)
4) SNS에서 생성되는 데이터
FACEBOOK은 하루에 약 4페타바이트
X(TWITTER)는 하루에 약 12 테라바이트
YOTUBE 사용자는 분당 500시간 이상, 시간당 30,000시간 하루 약 72,000시간의 비디오를 업로드하는 것으로 추정.
빅데이터 '3V'
VOLUME 규모
데이터의 크기
VARIETY 다양성
다양한 종류의 데이터를 수용하는 특성
VELOCITY 속도
데이터가 얼마나 빠르게 처리 / 분석되는지에 대한 특성
데이터의 다양성
데이터의 다양성 예시로 한눈에 보기




데이터를 분류하는 기준?
문제를 해결하기 위해 수집된 데이터를 분류하고 정리하는 특정 기준을 의미 즉, 데이터를 특성에 맞게 분류하는 기준을 의미한다.
데이터의 속성

Q1. 빅데이터의 3V는 __ , __, __,이다.
크기(규모), 다양성, 속도
Q2. 데이터의 종류는 __, __, 두 가지로 나눌 수 있다.
Q3. 데이터의 __은 수집된 데이터를 분류하고 정리하는 특정 기준을 의미한다.
속성
'BigData' 카테고리의 다른 글
| 빅데이터 분석 | 타이타닉 데이터 분석 (0) | 2024.10.29 |
|---|---|
| 빅데이터 분석 | 빅데이터 분석 과정 활동 (0) | 2024.10.27 |
| 빅데이터 이론 및 분석과 시각화 교육 후기 (4) | 2024.07.16 |
| 빅데이터 진로 캠프 교육 후기 (2) | 2023.11.11 |