목록Machine Learning (3)
호기심 많은 분석가

구내식당 식수 인원 예측 AI 경진대회 - DACON [배경] 지금까지는 단순한 시계열 추세와 담당자의 직관적 경험에 의존하여한국토지주택공사 구내식당 식수 인원을 예측하였으나, 빅데이터 분석으로 얻어지는 보다 정확도 높은 예측을 통해 dacon.io 🎁 개요 [2021.06.03 ~ 2021.07.23] 신용도 예측 대회가 끝나고 다음 대회를 물색하던 중 굉장히 흥미로운 대회가 개최되었습니다. 한국토지주택공사, 즉 LH의 구내식당 식수 인원을 예측하는 대회였습니다. 과거 기숙사에 살 때 식수 인원이 제대로 예측되지 않아서 식사의 질도 떨어지고, 어떤 날은 늦게 가면 밥이 없기도 했던 기억이 있습니다. 이러한 불편함을 해소하는 알고리즘이라니, 굉장히 매력적이었고 도메인이 사람의 심리이니만큼 자신도 있어 참..

목차 우리는 머신러닝 기법을 사용할 때 회귀 관련 모델을 사용하긴 한다. 가장 기본적인 선형 회귀(Linear Regression) 모델을 많이 사용할 텐데, 데이터의 분포가 직선이 아니라 곡선 형태를 띠고 있을 경우 오차가 크게 나타날 수 있다. 그럴 때 사용할 수 있는 다항 회귀를 헷갈릴 수 있는 다중 회귀와 비교하며 알아보자. 회귀 분석 (Regression Analysis) 그게 앞서 회귀 분석부터 알아보자 정의 회귀 분석이란, 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해내는 분석 방법 회귀 분석은 시간에 따라 변화하는 데이터나, 어떤 영향, 가설적 실험, 인과 관계의 모델링등의 통계적 예측에 사용 회귀 분석은 하나의 종속변수와 하나의 독립변수 사이의 관계를 분석하..

포스팅 개요 대용량의 데이터의 경우 sklearn으로 model을 학습시키는 데만 많은 시간이 소요되곤 합니다. 이 과정을 매번 반복하기엔 우리들의 시간이 너무 아깝습니다. 고로 이번에는 그 model을 저장하여 재사용할 수 있는 방법을 알아보겠습니다. 포스팅 본문 model은 pickle 형태로 저장할 것이고, 저장할 때는 sklearn의 joblib라는 Library를 사용하겠습니다. pickle은 텍스트 상태의 데이터가 아닌 파이썬 객체 자체를 파일로 저장하기 위해 사용됩니다. 일반 덱스트의 경우 파일로 저장할 때 파일 입출력을 이용하나, 리스트나 클래스 같은 텍스트가 아닌 자료형은 일반적인 파일 입출력으로 저장하거나 불러올 수 없기 때문입니다. LogisticRegression 기법을 활용한 코드..