2일차 교재 내용 요약과 정리:
과목Ⅰ. 데이터 이해
제2장 데이터의 가치와 미래
1절 빅데이터의 이해
2절 빅데이터의 가치와 영향
3절 비즈니스 모델
4절 위기요인과 통제방안
5절 미래의 빅데이터
제2장 데이터의 가치와 미래
제1절 빅데이터의 이해
- 빅데이터는 큰 규모와 다양성, 속도로 증가하는 데이터 세트를 의미하며, 기존 데이터 처리 방식으로 다루기 어려운 데이터를 포함합니다.
- 빅데이터는 데이터의 규모, 처리 기술, 인재, 조직적 변화를 포함한 다양한 측면으로 정의될 수 있습니다.
- 빅데이터를 이해하는 관점에 따라 데이터 자체의 특성 변화, 기술 변화, 인재와 조직 변화까지 포함하는 정의가 있습니다.
1)관점에 따른 정의
Mckinsey(2011) | IDC(2011) | 가트너 그룹 더그 래니의 3V |
일반적인 데이터베이스 소프트웨어로 저장,관리,분석할 수 있는 범위를 초과하는 규모의 데이터 |
다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고, 데이터의 초고속 수집,발굴,분석을 지원하도록 고안된 차세대 기술 및 아키텍처 |
● Volume : 데이터의 규모 측면 ● Variety : 데이터의 유형과 소스 측면 ● Velocity : 데이터의 수집과 처리 측면 |
데이터 규모에 중점을 둔 정의 | 분석 비용 및 기술에 초점을 둔 정의 |
2) 빅데이터 정의의 범주 및 효과
데이터 변화 |
● 규모 (Volume) ● 형태 (Variety) ● 속도 (Velocity) |
▼
기술변화 |
데이터 처리, 저장, 분석기술 및 아키텍처 클라우드 컴퓨팅 활용 |
▼
인재, 조직 변화 |
● Data Scientist 같은새로운 인재 필요 ● 데이터 중심 조직 |
2.출현 배경과 변화
산업계의 출현배경 : 고객 데이터 축적, 보유를 통해 데이터에 숨어있는 가치를 발굴
학계의 출현배경 : 거대 데이터를 다루는 학문 분야가 늘어나면서 필요한 기술 아키텍처 및 통계 도구의 발전
기술발전으로 인한 출현 배경 : 관련기술(저장 기술, 인터넷 보급, 클라우드 컴퓨팅, 모바일 혁명)의 발달
3.빅데이터에 거는 기대의 비유적 표현
산업혁명의 석탄과 철, 21세기의 원유, 렌즈, 플랫폼
4.빅데이터가 만들어 내는 본질적인 변화
사전처리 → 사후처리, 표본조사 → 전수조사, 질 → 양, 인과관계 → 상관관계
제2절 빅데이터의 가치와 영향
- 빅데이터는 기업, 정부, 개인에게 가치를 창출하며, 새로운 기술과 분석 기법의 등장으로 더 많은 가치를 추출할 수 있게 합니다.
- 기업은 효율성 제고, 경쟁력 강화, 맞춤 서비스 제공 등으로 혁신과 성장을 이끌어내며, 정부는 상황 분석, 미래 대응 등에 활용하여 국가 안전과 시민 생활의 개선을 도모합니다.
- 개인은 자신의 관심사에 맞춘 데이터를 활용하여 더 스마트하고 편리한 생활을 할 수 있게 됩니다.
1. 빅데이터의 가치 산정이 어려운이유
데이터 활용방식
새로운 가치 창출
분석기술 발전
2. 빅데이터의 영향
빅데이터가 미치는 영향 | |||
분야 | 영향 | 내용 | |
기업 | 혁신, 경쟁력 제고, 생산성 향상 |
빅데이터를 활용해 소비자의 행동을 분석하고 시장 변동을 예측해 비즈니스 모델을 혁신하거나 신사업을 발굴한다. |
|
정부 | 환경 탐색, 상황분석, 미래대응 |
기상, 인구이동, 각종 통계, 법제 데이터 등을 수집해 사회변화를 추정, 정보를 추출한다. |
|
개인 | 목적에 따른 활용 | 개인은 빅데이터를 서비스하는 기업의 출현으로 비용이 지속적으로 하락하여 정치인이나 대중 가수 등이 인지도 향상에 빅데이터를 활용한다. |
▼
생활 전반의 스마트화 |
제3절 비즈니스 모델
- 빅데이터 활용사례로는 구글 검색 기능, 월마트 매출 향상, 의료 분야의 질병 예후 진단 등이 있습니다.
- 빅데이터를 활용하는 기본 기술로는 연관규칙 학습, 유형분석, 유전 알고리즘, 기계 학습, 회귀분석, 감정분석, 소셜 네트워크 분석 등이 있습니다.
1. 빅데이터 활용사례
1) 관점에 따른 정의
구글 : 사용자의 로그 데이터를 활용한 검색엔진 개발, 기존 페이지랭크 알고리즘 혁신
월마트: 고객의 구매패턴을 분석해 상품 진열에 활용
2) 정부
실시간 교통정보 수집, 기후 정보, 소방 서비스 등을 위해 실시간 모니터링을 실시하여 국가안전 확보에 활용
3) 개인
정치인 : 선거 승리를 위해 사회관계망 분석을 활용해 유세 지역 선거
가수 : 팬들의 음악 청취 기록을 분석해 공연 시 노래순서 선정
2. 빅데이터 활용 기본 테크닉
연관규칙 학습, 군집분석, 유전 알고리즘, 기계학습, 회귀분석, 감정분석, 소셜네트워크분석
제4절 위기요인과 통제방안
- 빅데이터 사용에 따른 사생활 침해, 책임 원칙 훼손, 데이터 오용 등의 위기 요인이 존재합니다.
- 동의에서 책임으로 접근하고, 결과 기반 책임 원칙을 고수함으로써 위기 요인을 해결할 수 있습니다. 또한 알고리즘 접근 허용으로 피해자를 보호할 수 있습니다.
1. 위기요인에 따른 통제방안
사생활 침해 → 동의에서 책임으로
책임 원칙 훼손 → 결과 기반 책임 원칙 고수
데이터 오용 → 알고리즘 접근 허용
제5절 미래의 빅데이터
- 빅데이터 활용에 필요한 기본 3요소는 데이터, 기술, 인력입니다.
- 데이터는 사물인터넷 시대로 모든 것이 데이터화되며, 기술은 인공지능 등의 진화로 점점 스마트해지고, 인력은 데이터 사이언티스트와 알고리즈미스트의 역할이 중요해집니다.
1. 빅데이터 활용의 3요소
데이터 → 모든 것의 데이터화
기 술 → 진화하는 알고리즘, 인공지능
인 력 → 데이터 사이언티스트, 알고리즈미스트