#1에서 데이터의 시각화의 목적이란
' 문자와 숫자로 표현되었던 데이터를 차트를 사용하여 표현하는 것' 이라고 하였습니다.
목적을 더 추가해보자면 ' 요약되고 정리된 정보 전달' 이라고 할 수 있습니다.
하지만 요약되고 함축된 정보라도 사용자가 한 번에 처리할 수 있다는 보장이 없습니다. 또한 사용자에겐 처리할 수 있는 정보량의 한계가 존재하기 때문에 ' 정보 전달의 효율성 '을 중요하게 생각해야합니다.
정보 전달의 효율성을 증가시키기 위해서는 다음과 같은 법칙을 지켜야 합니다.
' 시그날을 최대화하고 노이즈를 최소화한다 '
○ 시그날 : 데이터가 가지고 있는 원래의 의미가 상대방에게 보다 쉽게 전달되는 효과
○ 노이즈 : 데이터가 가지고 있는 원래의 의미가 아닌 것이 상대방에게 전달되는 효과
이런 정의를 가진 시그날과 노이즈를 이용하여 데이터 잉크 비율 (Data-ink Ratio) 이라는 것을 만들 수 있습니다.
데이터 잉크란 데이터 시각화 분야의 선구자인 Edward Tufle이 제창한 개념입니다.
차트를 표현할 때 데이터 자체를 나타내는 부분을 데이터 잉크, 데이터 이외의 것을 나타내는 부분을 논 데이터 잉크라 합니다.
데이터 잉크 비율이란 아래의 계산식으로 도출된 결과입니다.
Data-ink ratio가 높을수록 더 좋은 차트라는 식입니다.
이것을 시그날과 노이즈로 대입을 해본다면 시그날 - data-ink , 노이즈 - Non data-ink 라고 할 수 있습니다.
따라서 불필요한 부분(노이즈, Non data-ink)을 최대한 줄여 차트를 간결하고 목적성있게 만들수록
노이즈 ▼, 시그널 ▲ 이 되어 데이터 시각화에 최적화된 차트를 만들 수 있습니다.
예시를 보면서 설명한 내용을 확인해보겠습니다.
X축으로는 지역, Y축은 숫자가 있는데 뭘 의미하는지 차트에서는 확인할 수 없습니다. 그리고 배경색이 노란색이고 제목은 빨간색, 선모양의 경우 복잡스럽네요.
해당 차트를 최적화 해보도록 하겠습니다.
불필요했던 부분(배경색, 제목색상, 선모양), 의미없던 부분(제목)을 수정했습니다. 훨씬 직관적인 차트를 얻을수 있었습니다.
이렇듯 시각화 툴의 다양한 기능을 이용해 특이하고 화려한 차트를 만들 수 있습니다.
하지만 의미없는 스타일과 정보는 오히려 목적성에 부합되지 못하는 결과를 얻을 수 있다는 것을 항상 명심하길 바랍니다.
이번 포스트에서는 정보 전달의 효율성에 대해 살펴보았습니다.
다음 포스트에서는 데이터의 종류에 각각의 특성에 대해 살펴보도록 하겠습니다.
'개발 > 데이터 시각화' 카테고리의 다른 글
[데이터시각화] #3 데이터의 종류 (0) | 2020.08.20 |
---|---|
[데이터시각화] #1 데이터 시각화에 대한 개요 (0) | 2020.08.18 |
댓글