본문 바로가기
개발/데이터 시각화

[데이터시각화] #2 정보 전달의 효율성과 Data-ink

by 핸디(Handy) 2020. 8. 19.

#1에서 데이터의 시각화의 목적이란
' 문자와 숫자로 표현되었던 데이터를 차트를 사용하여 표현하는 것' 이라고 하였습니다.

목적을 더 추가해보자면 ' 요약되고 정리된 정보 전달' 이라고 할 수 있습니다.

하지만 요약되고 함축된 정보라도 사용자가 한 번에 처리할 수 있다는 보장이 없습니다. 또한 사용자에겐 처리할 수 있는 정보량의 한계가 존재하기 때문에 ' 정보 전달의 효율성 '을 중요하게 생각해야합니다.

정보 전달의 효율성을 증가시키기 위해서는 다음과 같은 법칙을 지켜야 합니다.

' 시그날을 최대화하고 노이즈를 최소화한다 '

    ○ 시그날 : 데이터가 가지고 있는 원래의 의미가 상대방에게 보다 쉽게 전달되는 효과

    ○ 노이즈 : 데이터가 가지고 있는 원래의 의미가 아닌 것이 상대방에게 전달되는 효과

이런 정의를 가진 시그날과 노이즈를 이용하여 데이터 잉크 비율 (Data-ink Ratio) 이라는 것을 만들 수 있습니다.

데이터 잉크란 데이터 시각화 분야의 선구자인 Edward Tufle이 제창한 개념입니다.

차트를 표현할 때 데이터 자체를 나타내는 부분을 데이터 잉크, 데이터 이외의 것을 나타내는 부분을 논 데이터 잉크라 합니다.

데이터 잉크 비율이란 아래의 계산식으로 도출된 결과입니다.

Data-ink ratio가 높을수록 더 좋은 차트라는 식입니다.

이것을 시그날과 노이즈로 대입을 해본다면 시그날 - data-ink , 노이즈 - Non data-ink 라고 할 수 있습니다.

따라서 불필요한 부분(노이즈, Non data-ink)을 최대한 줄여 차트를 간결하고 목적성있게 만들수록 

노이즈 ▼, 시그널 ▲ 이 되어 데이터 시각화에 최적화된 차트를 만들 수 있습니다.

 

예시를 보면서 설명한 내용을 확인해보겠습니다.

노이즈 ▲, 시그널 ▼ 

X축으로는 지역, Y축은 숫자가 있는데 뭘 의미하는지 차트에서는 확인할 수 없습니다. 그리고 배경색이 노란색이고 제목은 빨간색, 선모양의 경우 복잡스럽네요. 

해당 차트를 최적화 해보도록 하겠습니다.

노이즈 ▼, 시그널 ▲ 

불필요했던 부분(배경색, 제목색상, 선모양), 의미없던 부분(제목)을 수정했습니다. 훨씬 직관적인 차트를 얻을수 있었습니다. 

이렇듯 시각화 툴의 다양한 기능을 이용해 특이하고 화려한 차트를 만들 수 있습니다.

하지만 의미없는 스타일과 정보는 오히려 목적성에 부합되지 못하는 결과를 얻을 수 있다는 것을 항상 명심하길 바랍니다.

이번 포스트에서는 정보 전달의 효율성에 대해 살펴보았습니다.

다음 포스트에서는 데이터의 종류에 각각의 특성에 대해 살펴보도록 하겠습니다.

댓글