1. 빅데이터의 이해
01. 빅데이터 개요 및 활용
> 정량 vs 정성 데이터
정량: 숫자로 이루어진 데이터 (정형,반정형 데이터를 포함함)
정성: 문자, 텍스트 위주 데이터 (비정형 데이터를 포함)
> 정형 vs 반정형 vs 비정형 데이터
정형: 정해진 형식과 구조가 있음. 연산이 가능한 관계형 데이터베이스의 테이블 형식.
반정형: 형식과 구조가 비교적 유연. 연산은 불가능하지만 스키마 정보를 제공하는 JSON, XML, RDF, HTML 등의 형식.
비정형: 동영상, 이미지, 음성, 문서, 메일 등 형식이 정해지지 않은 데이터.
* 유연성 측면: 정형 < 반정형 < 비정형
> 가역 vs 불가역 데이터
가역: 원본데이터를 가공하여 생긴 데이터를 다시 원본으로 환원이 가능한 데이터
불가역: 원본으로 환원이 불가능한 데이터. 원본과 전혀 다른 형태로 재생되기 때문.
> 데이터의 기능: 암묵지와 형식지의 상호작용
암묵지: 개인이 경험을 통해 구축한 무형의 지식
형식지: 형상화된 유형의 지식으로 전달과 공유가 쉽다.
> 지식 창조 매커니즘 4단계
1단계 공통화: 서로의 경험, 인식을 공유하여 한차원 높은 암묵지로 발전
2단계 표출화: 암묵지가 구체화되어 외부(형식지)로 표현된다.
3단계 연결화: 형식지를 재분류하여 체계화한다.
4단계 내면화: 전달받은 형식지를 다시 개인의 것으로 만든다.
* 공-표-연-내 4단계를 순환 반복함
> 데이터 vs 정보 vs 지식 vs 지혜
데이터: 수집된 값으로 객관적인 사실
정보: 데이터를 가공, 처리하여 관계를 분석하고 의미를 도출
지식: 개인적인 경험을 결합시켜 내재화한 결과물
지혜: 근본적인 원리를 이해하고 아이디어를 결합한 창의적 산물
02. 빅데이터 기술 및 제도 (중요도 상)