본문 바로가기

호기심 많은 분석가

검색하기
호기심 많은 분석가
프로필사진 DA Hun

  • 분류 전체보기 (152)
    • 정책 (12)
      • 재테크 (6)
      • 주택 (5)
    • 기업분석 (1)
    • Coding (139)
      • 시각화 (6)
      • Machine Learning & Python (21)
      • Coding Test & Algorithm (60)
      • BoostCamp (41)
      • Information (11)
Guestbook
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록뚱뚱하고 굼뜬 판다 (1)

호기심 많은 분석가

[Pandas] Pandas 대용량 데이터 처리하기

포스팅 개요 데이터 분석할 때 Pandas 이용을 많이들 하실 겁니다. 저 또한 편리하기에 주로 쓰는 Library였습니다. 하지만 Pandas는 기본적으로 data type을 동일하게 불러오기 때문에 데이터 용량이 커지는 상황이 종종 발생합니다. 그러던 와중 오승우 님의 뚱뚱하고 굼뜬 판다(Pandas)를 위한 효과적인 다이어트 전략이라는 좋은 자료를 보게 되어 공유하고자 포스팅을 하게 되었습니다. 우리 함께 판다의 다이어트를 도우러 가시죠! 포스팅 본문 대용량 데이터를 다룰 때는 Memory가 버티지 못할 때가 많습니다. 간단한 두 가지 방법을 통해 줄여보겠습니다. 1. 코드화 문자열로 된 데이터를 숫자 / 영어로 변환하여 데이터 크기 축소 - 남자 -> 0 여자 -> 1 - 서울특별시 -> 11 대..

Coding/Machine Learning & Python 2021. 5. 2. 19:02
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바