호기심 많은 분석가

[Data Visualization] 시각화에서 데이터 유실될 때 😱 본문

Coding/시각화

[Data Visualization] 시각화에서 데이터 유실될 때 😱

DA Hun 2021. 8. 21. 16:12

개요

 혹시 다들 데이터 시각화 작업을 할 때 분명 데이터는 존재하는 데 시각화가 제대로 이루어지지 않은 경험이 있으신가요? 저는 아래와 같이 법정근로시간 이후의 데이터를 표현해야 해서 보고해야 하는 데 이런저런 작업을 해봐도 시각화가 이루어지지 않아서 곤란했던 경험이 있습니다. 

 그 당시에는 문제를 해결하지 못했는데, 이번 부스트캠프를 통해 만난 안수빈님 덕분에 쉽게 해결할 수 있었습니다.

시각화 오류
데이터 존재


해결방안

1. dpi 해상도

 문제의 원인은 복잡하지 않았습니다. maplotlib이 해상도에 따라 결과물이 왜곡되는 경우가 종종 있다고 합니다. 특히 histogram, histoplot에서 그 현상이 심하다고 하는데, plt.subplots(1, 1, figsize=(10, 8), dpi=100)을 통해 해상도를 높여줌으로써 시각화를 완성시켜줄 수 있었습니다.

 이 외에도 ax.bar를 2번 사용하는, 즉 그래프를 겹쳐서 그릴 때 x축의 개수가 달라도 문제가 생길 수 있는데, set_xticks()에서 범주가 아닌 np.arrange(0, 545) 수치로 넣으면 해결할 수 있습니다. 

시각화 완성 ! 야호 !

2. width

 이건 제가 저 그래프에 텍스트 작업을 하다가 발견한 건데, ax.bar(x, y, width=1.5)로 default 값이 아닌 새로 할당해줄 때도 시각화가 해결됨을 확인할 수 있었습니다 :)

width=1.5


자주 발생하지 않는 상황이지만 혹여라도 비슷한 상황을 맞닥뜨렸을 때 도움이 되길 바랍니다. 저는 안수빈님 덕분에 오랜 궁금증을 해결할 수 있었습니다. 역시 국내 1등..! 시각화는 역시 알면 알수록 재밌습니다. 감사합니다 :)