목록전체 글 (152)
호기심 많은 분석가
부스트캠프개발자의 지속 가능한 성장을 위한 학습 커뮤니티boostcamp.connect.or.kr개요어느덧 흘러간 4일, 오늘은 우리 AI Math의 수업을 담당해주신 임성빈 마스터님과의 만남이 있었다. 어제에 이어 조금 더 활발해진 피어세션이 이루어졌다. 통계학에 대해서 학습했는데, 여러 번 느끼지만 통계학은 참 중요하고 남들과는 다른 강점을 여기서 가져야 하지 않을까? 모르는 개념은 조금 더 고민하고 여러 책을 찾아보자.개인 학습(AI Math 7강) 통계학 맛보기모수가 뭐에요?통계적 모델링은 적절한 가정 위해서 확률분포를 추정(inference)하는 것이 목표이며, 기계학습과 통계학이 공통적으로 추구하는 목표입니다.그러나 유한한 개수의 데이터만 관찰해서 모집단의 분포를 정확하게 알아낸다는 것은 불가..
부스트캠프 개발자의 지속 가능한 성장을 위한 학습 커뮤니티 boostcamp.connect.or.kr 개요 3일 차에 접어들면서 들을 것도 많고 과제도 점점 많아지고 내용도 조금 어려워지며 살짝 두려움에 떨고 있다. 오늘도 개인 학습 후에 피어세션에서 토의를 나눴는데, 생각보다 모르는 내용이 많아서 질문이 몇 개 이루어졌다. 피어세션 시간에서도 완벽히 해결되지 않아, 학습 종료 이후에도 찾아보면서 조금은 해결했다. 피어세션이 끝난 후 18-19시 피어세션이 피어씁니다라는 이벤트를 진행했는데, 이 이벤트가 굉장히 인상 깊었다. 자세한 내용은 아래에서 마저 다루겠다. 개인학습 (AI Math 5강) 딥러닝 학습방법 이해하기 비선형모델인 신경망(neural network)을 배워보자. 신경망을 분해해보면 선형..
부스트캠프 개발자의 지속 가능한 성장을 위한 학습 커뮤니티 boostcamp.connect.or.kr 개요 두 번째 날은 별 다른 이벤트가 있진 않았다. 개인 학습하다가 내일 하는 피어세션이 피어씁니다라는 피어들의 자기소개 시간을 위해 PPT를 제작한 정도? 그리고 과제 하나가 굉장히 어렵게 나와서 2시간 동안 힘들었던 날이었다. 되게 신기했던 건 1학년 때 알던 같은 과 누나가 연락 와서 자기도 이 프로그램에 참여 중이라는 것이다.! 세상 좁지.. 반가움을 안아두고 오늘의 학습에 대해서도 소개해보겠습니다. :) 개인 학습 (AI Math 3,4강)경사하강법 미분이 뭔가요? 미분은 변수의 움직임에 따른 함숫값의 변화를 측정하기 위한 도구로 최적화에서 제일 많이 사용하는 기법입니다. import sympy..
부스트캠프 개발자의 지속 가능한 성장을 위한 학습 커뮤니티 boostcamp.connect.or.kr 개요 장장 5개월의 교육, 부스트캠프 AI Tech가 시작되었다. 첫날이라 굉장히 우여곡절도 많고 프로그램도 많았는데 앞으로 많이 성장하겠구나를 느꼈다. 타운홀 미팅으로 시작하여 밋 업을 거쳐 피어세션과 어색하DAY로 마무리 지어졌다. 기본적인 시간표는 오전 10시부터 오후 7시까지다. 공지와 출석, 질의응답은 슬랙(Slack)을 통해, 수업과 출석은 boostcourse, 협업은 Colab, Github, Notion, 카카오톡으로 이루어질 듯하다. 타운홀 미팅 타운홀 미팅이란 교육 도중에 전체 공지를 구두로 전달하는 시간인데 앞으로도 종종 한다고 함. 앞으로의 일정을 다시 복기하고 출석 방법등에 대해..
구내식당 식수 인원 예측 AI 경진대회 - DACON [배경] 지금까지는 단순한 시계열 추세와 담당자의 직관적 경험에 의존하여한국토지주택공사 구내식당 식수 인원을 예측하였으나, 빅데이터 분석으로 얻어지는 보다 정확도 높은 예측을 통해 dacon.io 🎁 개요 [2021.06.03 ~ 2021.07.23] 신용도 예측 대회가 끝나고 다음 대회를 물색하던 중 굉장히 흥미로운 대회가 개최되었습니다. 한국토지주택공사, 즉 LH의 구내식당 식수 인원을 예측하는 대회였습니다. 과거 기숙사에 살 때 식수 인원이 제대로 예측되지 않아서 식사의 질도 떨어지고, 어떤 날은 늦게 가면 밥이 없기도 했던 기억이 있습니다. 이러한 불편함을 해소하는 알고리즘이라니, 굉장히 매력적이었고 도메인이 사람의 심리이니만큼 자신도 있어 참..
우리는 보통 DataFrame을 merge할 때 pandas의 merge를 쓰곤한다. 하지만 Series에는 merge가 적용되지 않는 다! 그래서 pd.concat을 이용하곤 하는데, Series의 내장 함수인 combine을 사용해보자. 위와 같은 10-16시까지의 값들만 존재하는 Series가 있다. 이 데이터를 24시간으로 시각화 시키기 위해 나머지 HOUR에는 0을 넣으려고 한다. 이때 어떻게 해줄 수 있을까? 우선 0-24시까지 0뿐인 Series를 생성해준다. zero_series = pd.Series(index=range(24), data=[0]*24) zero_series 이제 우리는 두 Series를 combine을 통해 합쳐줄 거다. Series1.combine(Series2, max..
코딩테스트 연습 - 같은 숫자는 싫어 배열 arr가 주어집니다. 배열 arr의 각 원소는 숫자 0부터 9까지로 이루어져 있습니다. 이때, 배열 arr에서 연속적으로 나타나는 숫자는 하나만 남기고 전부 제거하려고 합니다. 단, 제거된 후 남은 programmers.co.kr from collections import deque def solution(arr): arr = deque(arr) answer = [] answer.append(arr.popleft()) while arr : input_val = arr.popleft() if answer[-1] != input_val : answer.append(input_val) return answer 여러 방법으로 풀다가 효율성에서 걸리던 와중 가장 좋은 풀..
코딩테스트 연습 - 3진법 뒤집기 자연수 n이 매개변수로 주어집니다. n을 3진법 상에서 앞뒤로 뒤집은 후, 이를 다시 10진법으로 표현한 수를 return 하도록 solution 함수를 완성해주세요. 제한사항 n은 1 이상 100,000,000 이하인 자연수 programmers.co.kr 내 풀이 def solution(n): answer = "" k = 0 while n/3**k >= 1 : k += 1 k -= 1 while k > -1 : quo, n = divmod(n, 3**k) answer += str(quo) k -= 1 k = 0 result = 0 for i in answer : result += int(i)*(3**k) k += 1 return result 지문에 적혀있는 순서대로 ..
코딩테스트 연습 - [1차] 뉴스 클러스터링 뉴스 클러스터링 여러 언론사에서 쏟아지는 뉴스, 특히 속보성 뉴스를 보면 비슷비슷한 제목의 기사가 많아 정작 필요한 기사를 찾기가 어렵다. Daum 뉴스의 개발 업무를 맡게 된 신입사원 튜브 programmers.co.kr 내 풀이 import re def solution(str1, str2): str1 = [str1[i:i+2] for i in range(len(str1)-1)] str1 = [re.sub('[^a-z]', '', i.lower()) for i in str1] str1 = [i for i in str1 if len(i)==2] str2 = [str2[i:i+2].lower() for i in range(len(str2)-1)] str2 = [..
코딩테스트 연습 - 기능개발 프로그래머스 팀에서는 기능 개선 작업을 수행 중입니다. 각 기능은 진도가 100%일 때 서비스에 반영할 수 있습니다. 또, 각 기능의 개발속도는 모두 다르기 때문에 뒤에 있는 기능이 앞에 있는 programmers.co.kr import math def solution(progresses, speeds): answer = [] while progresses : result = 0 time = math.ceil((100-progresses[0])/speeds[0]) progresses = [progresses[i]+time*speeds[i] for i in range(len(progresses))] for i in range(len(progresses)) : if progres..