본문 바로가기
개발/데이터 시각화

[데이터시각화] #3 데이터의 종류

by 핸디(Handy) 2020. 8. 20.

#2에서 정보 전달의 효율성과 Data-ink에 대해 배웠습니다. 

정보전달의 중요성도 알고 차트도 최적화해서 그려야 한다는 것을 알았습니다.

근데 그 차트의 재료는 과연 무엇일까요?

바로 '데이터'입니다.

데이터를 이용해 직관적이고 효과적으로 시각화를 하려면 데이터의 종류에 대해 이해해야 합니다.

그래서 이번 포스트에서 다뤄보겠습니다.

데이터는 '질적 데이터''양적 데이터'로 나눠져 있습니다.

    ○질적 데이터 : aggregation function의 축이 되는 데이터 (dimension)

    ○양적 데이터 : 합계, 평균, 최대값 등 aggregation function를 통해 산출된 데이터 ( measure )

예를 들면 '시도별 교통사고 부상자수 합계'라고 했을 때

시도별 -> 질적 데이터 , 교통사고 부상자수 합계 -> 양적 데이터입니다.

이런 질적 데이터와 양적 데이터는 좀 더 세분화된 데이터로 나뉠 수 있는데요.


질적 데이터 : 명칭, 지리, 날짜, 순서 데이터 (ex 시도별, 날짜별, 월별)

    ○명칭 : 사람이나 물건에 붙여진 이름 (ex 홍길동, 박보검, 수박, 딸기 )

    ○지리 : 위도, 경도 좌표, 위치 좌표 (ex 시, 도, 군, 구, 읍, 면, 동 )

    ○날짜 : 년, 월, 일, 시, 분, 초 

    ○순서 : 순서가 의미 있는 데이터 (ex 1순위, 2순위, 금메달, 은메달 )


양적 데이터 : 간격척도, 비례척도 데이터 (ex 기온, 부상자수)

    ○간격척도 : 간격 그 자체로 의미 있는 데이터 (ex 기온, EQ, IQ,)

    ○비례척도 : 특정 기준으로 의미가 있는 데이터 (ex 신장, 매출, 무게)

위와 같이 데이터는 크게 2개, 작게는 6개로 나누어집니다. 

실제로 업무에서 데이터 시각화를 접하게 보면 데이터에 따라 차트의 종류가 상이해지고 의미하는 바가 달라지는 경우를 많이 보실 수 있을 겁니다. 

그래서 이번에는 데이터를 살펴보았다면 다음 포스트에서는 차트의 종류에 대해 살펴보도록 하겠습니다.

댓글