Daino's Archiving
article thumbnail
반응형

 

썸네일

 

Deviation(편차)

 

편차란

편차는 변량이 평균으로부터 얼마나 떨어져 있는지 나타내는 값이다.

그러므로 편차를 구하는 이유는 값이 평균과 얼마나 떨어졌는지 알기 위해 구한다는 것을 알 수 있다.

시각화에서의 편차는 기준을 평균에만 한정하는 게 아닌 여러 값으로 지정할 수 있다.

 

차트 종류

1. Diverging Bar

고정된 기준점으로부터의 변화(+/-)를 알고 싶을때 사용한다.

대조적인 값을 중심선을 기준으로 양쪽을 분리하여 보여주고 싶을 때 사용된다.

아래와 같이 정렬과 색상을 통해 양수와 음수를 구분하여 더욱 효과적으로 편차를 보여줄 수 있다.

 

Diverging Bar
Profit Ratio를 0을 기준으로 분리

 

2. Spin Chart

두 가지 대조적인 그룹을 나누어 비교할때 사용한다.

단일 값을 2개의 대조적인 구성 요소로 분할 비교할 수 있다.

일반적으로 편차의 기준점은 0이지만 하나의 값을 두 가지 대조적인 구성 요소로 나누어 비교할 때도 유용하다.

 

Spin Chart
남성과 여성의 구성 요소 비교

 

3. Diverging Stacked Bar

감정(예: 동의하지 않음/중립/동의)이 포함된 설문조사 결과를 표시할 때 적합하다.

상충된 데이터를 비교하고 세부 구성을 시각화하는 데 사용될 수 있다.

데이터를 그룹별로 세분화하고, 기준선을 중심으로 상반된 데이터를 누적 막대 형태로 표현한다.

 

Diverging Stacked Bar
질문에 대한 긍정, 중립, 부정을 비교

 

4. Surplus/Deficit Filled Line

기준선 위의 영역은 초과, 아래의 영역은 결손을 나타내며, Area Chart를 사용하여 구분을 가시화한다.

기준선을 중심으로 연속형 데이터의 변화를 시각화한다.

주로 시간에 따른 데이터의 초과와 결손을 비교할때 사용한다.

 

Surplus/Deficit Filled Line Chart
시간에 따른 매출의 초과/결손 비교

 

 

Correlation(상관관계)

 

상관관계란

상관관계는 두 변수 간의 연관성을 나타내고 싶을 때 사용한다.

쉽게 말해 두 변수 A와 B가 얼마나 관련이 있는지 알아보는 것이다.

독자가 상관관계와 인과관계를 혼동되지 않도록 유의해야 한다.

 

차트 종류

1. Scatterplot

각각 고유 축을 가진 두 연속형 변수 간의 관계를 표시하는 기본적인 방법이다.

각 데이터는 X축과 Y축의 값에 따라 점으로 표현된다.

이를 통해 데이터의 분포, 상관관계, 패턴 등을 확인할 수 있다.

 

Sctterplot
주별 비만률과 학사/학위 취득자의 상관관계 확인

 

2. Line + Column

하나의 차트에서 선(Line)과 막대(Column)를 함께 사용하여 두 개의 서로 다른 데이터를 동시에 비교할 때 사용한다.

두 변수의 관계를 한눈에 파악하고, 변화(선)와 절댓값(막대)을 동시에 확인할 수 있다.

 

Line + Column
매출의 절대값과 이익의 변화량을 동시 확인

 

3. Connected Scatterplot

두 변수 간의 관계가 시간에 따라 어떻게 변했는지 보여주는 데 사용된다.

일반 산점도와 달리 시간적 흐름 또는 변화 패턴을 동시에 시각화하는데 유용하다.

 

Connected Scatterplot
1917년과 2012을 동시에 시각화

 

4. Bubble

산점도와 비슷하지만 세 번째 변수에 따라 원의 크기를 조정하여 세부정보를 추가한다.

 

매출과 이익 이외에 다른 변수의 값을 크기로 표현

 

5. XY Heatmap

X축과 Y축의 교차점을 기준으로 데이터를 색상으로 시각화한 그래프이다.

두 범주의 데이터 사이의 패턴을 확인할 때 사용한다, 다만 정확한 값의 차이를 보여주는 데는 좋지 않다.

 

연령별 저축금액의 패턴 확인

 

Ranking(순위)

 

순위란

데이터를 기준 값에 따라 정렬하여 항목 간의 우선순위 나타낸다.

보통 크기, 중요도 등의 기준으로 데이터를 정렬하고, 각 항목에 순위 번호를 부과한다.

 

차트 종류

1. Ordered Bar

데이터의 값을 기준으로 막대를 오름차순 또는 내림차순으로 정렬한 막대형 차트이다.

간단하지만 데이터의 상대적인 크기를 명확히 보여주고, 최댓값과 최솟값을 알기 쉽다.

 

Ordered Bar
방향별 값 순위

 

2. Ordered Proportional Symbol

값 간에 큰 차이가 있거나 데이터 간의 미세한 차이를 확인하는 것이 중요하지 않은 경우 사용한다.

값의 절대적 크기보다 비율이나 상대적 차이를 효과적으로 전달할 수 있다.

 

Ordered Proportional Symbol
절도, 살인의 분포 확인

 

3. Dot Strip Plot

데이터의 개별 값을 점으로 표현하여 값의 분포와 개별 항목의 차이를 명확하게 보여준다.

여러 데이터 포인트를 한 줄로 나열하거나, 범주형 그룹별로 나누어 데이터를 비교하는 데 사용된다.

 

Dot Strip Plot
월별 데이터의 개별값과 평균 확인

 

4. Slope

시간에 따라 순위가 어떻게 변했는지 또는 조건별로 어떻게 다른지 보여주는데 적합하다.

두 시점에서의 값을 선으로 연결하여, 증감을 한눈에 확인할 수 있다.

 

Slope
학위와 비만의 관계

 

5. Lollipop Chart

막대형 차트의 변형으로, 막대 대신 선과 원을 조합하여 데이터를 시각화하는 차트이다.

표준 막대보다 데이터 값 크기 비교를 시각적으로 간결하게 보여준다.

 

Lollipop Chart
일반 막대 차트보다 순위 확인이 쉬움

 

 

반응형
profile

Daino's Archiving

@Daino

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!