목록뚱뚱하고 굼뜬 판다 (1)
호기심 많은 분석가

포스팅 개요 데이터 분석할 때 Pandas 이용을 많이들 하실 겁니다. 저 또한 편리하기에 주로 쓰는 Library였습니다. 하지만 Pandas는 기본적으로 data type을 동일하게 불러오기 때문에 데이터 용량이 커지는 상황이 종종 발생합니다. 그러던 와중 오승우 님의 뚱뚱하고 굼뜬 판다(Pandas)를 위한 효과적인 다이어트 전략이라는 좋은 자료를 보게 되어 공유하고자 포스팅을 하게 되었습니다. 우리 함께 판다의 다이어트를 도우러 가시죠! 포스팅 본문 대용량 데이터를 다룰 때는 Memory가 버티지 못할 때가 많습니다. 간단한 두 가지 방법을 통해 줄여보겠습니다. 1. 코드화 문자열로 된 데이터를 숫자 / 영어로 변환하여 데이터 크기 축소 - 남자 -> 0 여자 -> 1 - 서울특별시 -> 11 대..
Coding/Machine Learning & Python
2021. 5. 2. 19:02