본문 바로가기
읽기

2030 데이터 리터러시 레볼루션 / 이재원

by mubnoos 2024. 11. 22.

 

챗GPT 시대, 데이터 리터러시가 생존을 판가름한다

1. 데이터 레버리지는 기존 산업에 데이터를 접목해 경쟁력을 높여야 한다. 

2. 데이터 수익화로 데이터를 활용해 다양한 비지니스 모델을 만들어야 한다. 

3. 데이터 이니셔티브로 공공 데이터와 연계해 기업 여건에 맞게 사회에 공헌해야 한다.

 

 

1부 데이터의 이해와 올바른 관점이 중요하다


1장 왜 데이터 리터러시인가

• 눈에 보이는 모든 것이 데이터로 존재하는 세상이다. 

 

데이터 리터러시는 기업이 성장하기 위해 갖춰야 할 제2외국어이다. 

 

이제 성공 경험이나 직감이 통하지 않는다. 

 

데이터의 역할

1. 탁월한 인식 능력을 갖게 해준다. 

2. 판단력의 기초를 제공한다. 

3. 상대방을 설득하고 동기를 부여할 수 있다. 

 

데이터 기반의 의사결정이 필요하다. 



2장 챗GPT 시대에도 데이터 리터러시가 필요하다

• 챗GPT는 실수를 기반으로 하는 반복적 강화학습 Reinforcement Learning 기술을 적용하여 사용자 의도에 적합한 답변을 찾아낸다. 즉 인간의 선호도를 인공지능 보상신호 reward signal 로 사용하여 모델을 미세조정 fine-tuning 한다. 

 

데이터 없이는 인공지능이 존재할 수 없다. 



3장 데이터 리터러시 어떻게 시작할까

• 데이터에 숨겨진 인사이트를 스스로 찾아야 한다. 

 

데이터 분석과 활용을 위한 4가지 요소

1) 데이터, 2) 개념이나 기법, 3) 분석 도구, 4) 사람

 

데이터 리터러시의 역량은 데이터를 기술적으로 다루는 것에서부터 데이터에 숨겨진 통찰력을 도출해내는 등 데이터 활용 전반에 필로 하는 역량을 의미한다. 

1) 개념적 프레임 구축: 데이터에 대한 개요 파악

2) 데이터 수집: 데이터 검색, 수집, 데이터 품질 평가

3) 데이터 관리: 데이터 구성, 데이터 처리

4) 데이터 평가: 데이터 분석, 데이터 이해와 해석, 데이터 기반 문제 파악, 데이터 시각화, 데이터 설명, 데이터 기반 의사결정

5) 데이터 활용: 비판적 사고, 데이터 문화, 데이터 윤리, 데이터 인용, 데이터 공유, 데이터 기반 의사결정 평가

 

데이터를 활용하는 데 도구나 기법을 얼마나 잘 다루는가의 문제보다도 데이터를 기반으로 문제를 바라보고 데이터로부터 의미와 맥락을 도출해내는 관점과 역량이 더 중요하다. 올바른 데이터 리터러시를 갖추기 위해서는 데이터나 분석 도구 이전에 사람의 생각이 먼저다라는 점을 잊지 말아야 한다.  



4장 데이터의 본질과 힘을 이해하자

• 데이터는 기록이자 실행의 기초다. 

 

데이터의 구분

1) 정형: 구조화된 데이터

2) 비정형: 형태가 없고 연산이 불가능한 데이터

3) 반정형: 약한 정형 데이터, 스키마나 메타데이터와 같이 형태는 있으나 연산이 불가능한 데이터

 

빅데이터의 특성

1) 양 Volume

2) 속도 Velocity

3) 다양성 Variety

 

실제 비지니스의 데이터 활용

1) 신속한 의사결정에 활용

2) 맞춤화된 상품과 서비스 제안

3) 현재 상황을 이해하고 미래를 예측하는 데 활용

4) 새로운 사업 기회 발굴에 사용

 

제조업에서는 사물인터넷에서 축적된 데이터를 기반으로 공장 내 여러 생산 설비의 가동 상태를 중앙 집권화하고 시각화해 상태를 한눈에 파악할 수 있다. 그럼으로써 관리 효율성과 생산성을 향상한다. 또한 불량 발생 빈도에 대한 데이터를 분석하고 문제 발생을 예측할 때도 사용된다. 

 

 


2부 조직의 데이터 활용 역량을 올려라


5장 데이터 중심으로 경영을 바꿔라

• 디지털 시대에는 물질적 자산보다 비물질적 자산이 더 주목받고 있다. 데이터, 정보, 지식 등이 중요한 자산으로 인식되고 있다. 특히 데이터는 사용할수록 가치가 증가하고 무제한 복제가 가능하다. 

 

데이터는 모아놓는다고 스스로 가치를 발휘하지는 않는다. 데이터 자산화를 이루기 위해서는 데이터 활용이 확대될 수 있도록 조직적인 노력이 있어야 한다. 데이터가 생성될 때 대부분 어떻게 활용될지 알 수 없어서 각양각색의 방법과 형태로 만들어진다. 데이터 활용이 원활하게 되려면 수집 이전부터 체계적인 관리 프로세스가 필요하다. 필요한 정보나 형태를 사전에 정의해 이에 맞춰 생선되고 수집되도록 준비해야 한다. 또한 데이터 수집 후에도 품질을 검수해 활용 가능 여부를 판별할 뿐만 아니라 품질 저하 원인을 찾아 지속적으로 개선해야 한다. 

 

데이터 문화는 조직이 의사결정을 위해 데이터를 가치 있게 사용하며 그 과정이 중요하다고 생각하는 구성원들의 신념과 행동을 지지한다. 그 결과로 조직의 사고방식과 운영에 데이터가 자연스럽게 녹아들어 가는 것이다. 

 

조직에서는 데이터 리터러시 문화를 구축하기 위한 방법

1) 보고서 형식을 데이터 분석이 포함되도록 바꿔야 한다. 

2) 전사적 지원 체계를 수립해야 한다.

3) 분석 역량과 노력을 측정하고 평가지표를 만들어 보상해야 한다. 

4) 실패를 두려워하지 않는 문화를 만들어야 한다. 

5) 계층별, 수준별로 데이터 리터러시 교육에 투자해야 한다. 

6) 데이터 커뮤니티를 통해 조직 내 소통을 활성화해야 한다. 



6장 데이터와 기술로 고객경험을 혁신하라



7장 데이터 리터러시를 선도하라

• 비지니스 모델을 혁신하라

 

데이터 중심으로 사업을 전면 수정하다. 

 

데이터 활용 능력으로 업의 본질을 재정의하다. 


8장 챗GPT 리터러시도 함께 높여라

• 챗GPT를 어떻게 활용할지 모색하라. 

 

챗GPT 활용 역량이 기업의 미래를 책임진다. 

 

챗GPT를 넘어 미래 생성형 인공지능에 대비하라. 

 

 



3부 개인의 데이터 분석 역량을 기르자



9장 목적과 문제해결을 먼저 생각하라

• 데이터를 분석할 때 정확한 의미부터 알아야 한다. 데이터 분석은 원시 데이터를 정리, 변환, 처리해 유용한 통찰력으로 바꾸는 것을 말한다. 당연히 데이터 분석의 목적은 데이터에서 알고 싶은 정보를 얻기 위한 것이다. 데이터 자체로는 문자나 숫자 등의 집합일 뿐이므로 정보를 더 쉽게 얻을 수 있도록 가공해야 한다. 이후 특이성, 규칙성, 상관관계나 인과관계 등을 찾아냄으로써 데이터가 의미를 갖게 된다. 

 

어떤 목적으로 데이터 분석을 하는가?

1. 고객을 이해하고 타깃팅하기 위해서

2. 데이터 분석을 통해 성공과 성과를 측정하기 위해서

3. 각종 문제해결에 데이터 분석을 활용하기 위해서

 

질문을 하고 명확한 목표를 설정했다면 그다음으로는 문제를 정의해야 한다. 데이터 분석 기획에서 가장 중요하지만 가장 어렵기도 한 단계다. 우리가 풀어야 할 문제는 분석의 목적이면서 대상이기도 하다. 

 

왜 데이터 분석을 하는가? 현장이나 사실에 대한 불완전한 이해를 데이터를 통해 해결하기 위해서다. 

 

데이터 안에는 답이 없다는 것을 명심하라. 데이터만 보지 말고 하고자 하는 목적이 먼저다. 

 



10장 데이터 분석을 위한 수집과 관리는 어떻게 할까

• 데이터의 가치는 정제와 가공에 달려 있다. 

 

올바른 수집과 저장과 정리가 관리의 기본이다. 



11장 데이터 분석에서 이것만은 알아두자

 



12장 백 개의 숫자보다 한 개의 그림이 낫다

• 시각화의 8가지 원칙

1. 데이터 그 자체르르 보여주는 것이 중요하다. 

2. 화려한 그래픽과 시각화 방법에 너무 집중하지 않게 한다. 

3. 데이터 자체가 말하고자 하는 바를 왜곡하지 말아야 한다. 

4. 작은 화면에 너무 많은 숫자나 문자를 보여주지 말라.

5. 아무리 많은 양의 데이터도 일관성이 있어야 한다. 

6. 서로 다른 데이터를 손쉽게 비교할 수 있게 한다.

7. 몇 단계로 깊이 들어가 살펴볼 수 있어야 한다. 

8. 통계 결과나 시각화를 데이터로 설명해야 한다. 

 

데이터에 스토리텔링을 더하라.


데이터 중심으로 근본적인 변화가 필요하다