본문 바로가기

Review

[리뷰] 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력

 

  데이터를 활용할 때 생각해야 할 것

  • 데이터 분석을 통해 얻을 수 있는 결과가 목적을 잘 반영하고 있는지는 데이터의 양과 분석 방법에 좌우되지 않는다.
  • 데이터 분석이란 눈앞의 데이터로부터 어떤 패턴을 추출하는 것이 아니다.
  • ‘데이터를 통해 판독'한 정보는 아무리 훌륭한 데이터 사이언스를 구사하더라도 시사점(인사이트)라고 할 수 없다.
  • ‘데이터 분석 방법'과 ‘데이터 분석을 활용하는 방법'은 전혀 다른 개념이다.
  • 목적이 애매하면 그것이 잘 풀릴지는 운에 의지하게 된다. 애당초 잘 풀리고 있는지 어떤지조차 평가할 수 없겠지만.
  • ‘분석’도 ‘데이터’도 어디까지나 수단이고 도구일 뿐, 답을 제시해주지 않는다.
  • ‘데이터 분석을 통해 성과를 낸다’는 것은 ‘나무로 가구를 만든다’에 비유된다.

 

좋은 목재(데이터)가 있고 못을 박는 실력(분석 방법과 통계 지식)이 뛰어나더라도, 어떤 가구를 어떻게 만들지 자신이 모른다면 가구를 완성할 수 없다.

 

 

  생각하고 → 작업하고 → 생각한다

  1. 분석 전에 문제 및 목적을 정의하고 가설을 구축한다.
  2. 목적과 문제에 따라 데이터 수집 및 방법론을 구축하고 분석을 통해 결과물을 도출한다.
  3. 분석 결과에 해석을 추가해 ‘스토리’, 즉 결론을 구축한다.

 

🙅🏻‍♀️ 데이터 활용 시 흔히 수행하는 프로세스

  1. 문제와 관련 있어 보이는 데이터를 모은다.
  2. 그것을 가공해서 그래프로 그린다.
  3. 거기서 ‘어쩌다’ 발견한 사항들을 열거한다.
  4. ‘데이터에서 이런 결론을 얻을 수 있었습니다' 라며 마무리한다.

 

“그래서 결국 무슨 말이 하고 싶은거지?” “그것이 가장 본질적이고 중요한 사항인가?”

 

 

생각없이 우연히 눈에 띈 데이터를 모아 그래프로 그려봤자 의미 있는 결론이 나오지 않는다. 거기서 알게 되는 사항은 어쩌다 나온 사소한 발견일 뿐이며 그 안에는 어떠한 논리성도 객관성도 없다.

 

 

  가장 먼저 해야하는 것은 ‘목적과 문제에 대한 정의’

  • 나는 무엇을 알고 싶은가
  • 나는 무엇을 해결하고자 하는가

‘데이터를 활용했지만, 정보가 효과적으로 도출되지 않는다' 라는 고민도 그 원인은 분석 방법이나 통계에 있는 것이 아니라 불충분하고 부적절하게 문제를 정의했기 때문에 발생한다.

 

👀 확인해야할 포인트

1. 둘 이상의 해석이 나오지 않도록, 구체적으로 표현하고 정의하였는가?

문제를 정의하는 방법에 따라 활용하게 될 데이터가 달라지고, 결과물에서도 전체적인 스토리 구조에 영향을 미친다.

2. 설정한 목적에 대한 ‘문제’, ‘원인', ‘해결 방안'을 구분하고 있는가?

세가지 요소가 중요한데,

  • ‘문제’가 무엇인가
  • 그 문제를 일으키는 ‘원인'은 무엇인가
  • 그 원인에 대한 ‘해결 방안'은 무엇인가

로 구분하여 인식하는 것이 중요하다. *자신이 ‘문제'라고 정의한 것 중에 무의식적으로 다른 요소들이 혼재하는 경우가 있음에 유의하라.

 

 

  정의한 문제와 데이터 및 지표를 일치시켜라

데이터 활용이 잘 안되는 주요 원인 두 번째는 정의한 목적과 문제가 사용한 지표와 논리적으로 일치하지 않는 경우가 자주 발생한다는 것이다.

👀 확인해야할 포인트

1. 설정한 목적에서 단어 정의가 명확하고 구체적인가?

  • ‘질' 이나 ‘생상성' 과 같이 익숙해서 무심코 사용하는 단어나 표현을 특히 주의해야 한다.
  • 해당 단어에 대한 합리적인 정의를 제시해서 설득력을 얻는 것이 중요하다.
  • 논리적인 설명을 통해 이용할 지표를 결정해야 하고, 필요하다면 복수의 지표를 이용한다.

2. 어떤 요소와 지표가 더욱 목적에 부합하는가?

  • ‘거리'를 평가하려면 ‘킬로’, ‘미터’ 같은 실제 측정 지표 뿐만 아니라 도보로 몇 분 걸린다 등의 ‘시간' 지표도 후보가 될 수 있다.
  • ‘다양한 메뉴'에서 ‘다양함'에 대해 정의하기 위해 메뉴의 ‘가짓수’와 더불어 계절이나 요일별 ‘변경 빈도’도 지표로 활용할 수 있다.

3. 시작 전부터 스토리를 만들고 단정하지는 않았는가?

  • 지표를 설정한 시점에서 이미 ‘원인'과 ‘해결 방안'을 단정하고 있지는 않는지 확인한다.
  • 현재 직면한 ‘문제'를 어떻게 나타낼지에 대한 관점으로 지표를 고려해야한다.

 

 

💬 도출된 결과를 효과적으로 제시하려면

결론에 도달하는 프로세스와 프레젠테이션 할 때의 순서를 다르게 하는 것이 좋다.

결론을 도출하는 프로세스와 프레젠테이션 순서

결론을 도출하는 프로세스 프레젠테이션 순서
(1) 평가 지표 및 기준을 결정

”어떤 요소와 지표가 더욱 목적에 부합하는가?”
(3) 결론

”결국 무슨 말을 할 수 있는가?”
(2) 적합한 데이터 및 그래프를 선택

”어떤 데이터 형태와 그래프가 효과적인가?”
(1) 평가 지표 및 기준을 결정

”어떤 요소와 지표가 더욱 목적에 부합하는가?”
(3) 결론

”결국 무슨 말을 할 수 있는가?”
(2) 적합한 데이터 및 그래프를 선택

”어떤 데이터 형태와 그래프가 효과적인가?”

 

 

  가치있는 정보를 얻으려면 ‘사실과 결과'를 확인 한 다음 ‘평가’를 해야한다

사실과 결과의 데이터를 그래프나 표, 지표 등으로 표시한 다음, 내용을 ‘평가’해서 구체적인 행동과 판단으로 연결해야 한다. 평가를 객관적으로 만드는 것은 바로 ‘다른 것과의 비교' 이며, 결과물을 만들 때 자기 생각과 주관을 전하지 않아야 한다. 결론을 심정적으로 정해놓고 데이터로 평가하려다 보면 데이터를 결론에 짜 맞추게 된다.

👀 확인해야할 포인트

1. 결론으로 이어지는 결과가 나올것인가?

  • 반드시 결론으로 부합하는 결과가 나온다는 보증은 없다.
  • ‘무슨 말을 하고싶은지’, ‘어떤 것을 확인하고자 하는지'에 따라 XX라는 데이터를 XX라는 데이터와 비교했다 라는 과정이 나와야한다.
  • ‘데이터를 활용한다’란, 결과가 아니라 결론을 도출하는 것이다.

2. 비교를 통해 ‘차이'를 찾을 수 있는가?

  • 결과가 별 차이가 없다면, 데이터나 결과가 틀린 것이 아니라 ‘차이가 있을 것이다'라는 초기 가설이 틀린것이다.
  • 여러 비교 대상 후보를 정하고 가설 → 검증을 반복하는 것이 현실적이다.

3. 비교의 기술은 적절한가?

  • 목적에 따라 ‘값의 크기’, ‘추이’, ‘편차’, ‘비율’ 등의 4가지 평가 기준을 이용해 데이터의 특징을 포착한다.

 

 

 

  결과 나왔다고 끝난 것은 아니다. 최종 목표는 ‘행동과 판단’ 이다

‘데이터를 활용한다’는 것은 현황 파악과 평가에서 그치는 것이 아니라 ‘구체적 행동’을 일으켜야 한다.
그렇지 않으면 그것은 ‘데이터 정리’라고 볼 수 밖에 없다.

👀 확인해야할 포인트

1. 직감이나 즉흥으로 해결방안을 수립하는 ‘방법맨’이 되고 있지는 않은가?

  1. 최종 행동, 즉 해결방안은 ‘문제’가 아니라 문제를 일으키는 ‘원인’에 취해야 한다.

2. 원인에 대한 결과를 데이터로 확인 가능한가?

  • 원인 후보를 열거한다 → 지표를 결정한다 → 관련성을 확인한다

3. 전체적인 경향에만 집중하고 있지는 않은가?

  1. 그래프를 전체적으로 봐야한다는 규칙은 없다
  2. 그룹화를 하거나, 경향이 바뀌는 분기점에 주목한다.
  3. 원인은 한가지가 아니라, 여럿이거나 복잡할 수 있다.
  4. 선형이 아닌 관계성도 존재한다.
  5. 산포도를 그려 전체를 부분으로 나누고 분석을 진행한다

 

 

 

  기법과 해결방안에 집착하지 마라. ‘왜(원인)’ 그런지 끈질기게 생각하라

데이터를 활용할 때 ‘생각한다’의 의미는 ‘참신한 아이디어’가 아니라 ‘내용의 논리성’ 이다.

‘원인이 명확히 규명된 후 수립하는 대책’‘즉흥적으로 만든 대책’은 효과와 정확성에 엄청난 차이가 있다. 해결 방안을 고민하는 것은 마지막 단계여야 한다.

 

💡 생각의 순서

  1. ‘무엇을 해결, 실현하고자 하는가’(목적 및 문제)
  2. ‘무엇이 결정적 요인인가’ (원인)
  3. ‘무엇을 해야 하는가’ (해결 방안)

 

👀 확인해야할 포인트

  1. 어째서 (다른 수단이 아니라) 그것이 필요한가?
  2. 그로 인해 어떤 것을 실현 또는 해결 가능한가?
  3. 효과적인 결과가 나올것이라는 근거는 어디에 있는가?

 

 

  느낀 점

 

학부생때는 데이터를 분석하는 기법에 대해서만 공부하기 바빴다. 그러나 아무리 화려하게 데이터를 시각화하거나 그래프를 도출해도 결국 문제를 해결하는 데 아무런 도움이 되지 않는다면 그 결과는 가치가 없다는 것을 깨닫게 해주는 책이다.

 

어떤 문제를 해결해야 하는지 명확이 알고, 데이터라는 지표로 문제에 대한 원인을 규명해서 해결 방안에 이르도록 논리적으로 사고하는 방식에 대해 알려준다. 이러한 프로세스를 거쳐서 나온 결과는 단순히 즉흥적으로 생각한 ‘참신한 아이디어’ 보다 신뢰를 높일 것이다.

 

기법 중심의 사고가 아니라 목적 중심의 사고를 해야한다. 이것은 데이터 분석 뿐만 아니라 우리가 살아가는 방식에도 적용해야 한다.

 

항상 ‘왜?’ 를 끊임없이 고민해야 한다. 나는 귀가 얇아 다른 이의 말에 혹해서 맹목적으로 따라하게 되는 습관이 있다. 무작정 따라하고 시작하는 것이아니라, 목적과 목표를 명확히하고 내가 행하고자 하는것이 내가 가려는 방향과 일치하는지를 항상 생각해야겠다.

 

그렇게 해서 내린 결정은 나를 더 나은 길로 이끌 것이며, 중간에 잘못된 길임을 깨달아도 방향을 잃지 않고 곧 다른 길을 찾을 수 있을 것이다.

그것이 읽을 책을 고르는 작은 결정이든, 어떤 직장에 다닐지 선택하는 큰 결정이든 말이다.