목록Coding/BoostCamp (41)
호기심 많은 분석가
부스트캠프 개발자의 지속 가능한 성장을 위한 학습 커뮤니티 boostcamp.connect.or.kr 🕵🏻♂️마스크상태_분류_대회 torchvision.transforms는 100개가 있으면 그 이미지에 적용을 해줘서 200개가 되는 걸까? 그렇지 않다. 그 이미지 자체에 값을 입혀서 변환시키는 것으로 개수는 같다. Resize, ToTensor와 같은 확정적인 것들은 모든 이미지에 입혀지고, HoriaontalFlip(p=0.5) 같은 랜덤으로 적용되는 것은 p의 확률을 기준으로 적용이 되거나 되지 않거나 한다 transforms.Compose([ ToTensor(), Resize((512, 384)), HoriaontalFlip(p=0.5)] # default가 0.5 ) VS code에서는 작업을..
부스트캠프 개발자의 지속 가능한 성장을 위한 학습 커뮤니티 boostcamp.connect.or.kr 🕵🏻♂️마스크상태_분류_대회 1. Data labeling 이미지는 18900장이 주어졌으나, train.csv의 row는 2700개뿐, 심지어 라벨링도 되어있지 않았다. 그래서 주최측이 정한 labeling 기준에 맞춰 train.csv를 18900개의 row와 18 종류의 class 값을 가지는 데이터프레임으로 변경시켜주었다. 우선 여기서 이미지 모델은 input때 train을 대체 어떻게 시켜주나 했는데, 정형 데이터와 비슷하게 DataFrame에서 label을 뽑아내고 그것에 해당하는 이미지를 tensor로 변환해서 넣어준다는 것을 배웠다. 사실 이 과정을 정확히 몰라서 어제는 이 작업을 진행하..
부스트캠프개발자의 지속 가능한 성장을 위한 학습 커뮤니티boostcamp.connect.or.kr🙋🏻♂️타운홀미팅P-Stage가 시작하니만큼 우리가 모르는 여러 사항들이 있을 수 있으니, 오랜만에 타운홀미팅으로 한 주를 시작했다.P-Stage에 대한 소개와 이번 주에는 어떤 일들이 있을지, AI Stage 사용법 등을 배웠다.1. P Stage 소개Project - 대회 형 실습2. P Stage 학습 안내2-1. 학습 정리 제출'나는 어떤 방식으로 리더보드 점수를 올렸는지', '어제와 비교해서 무엇을 개선하고 시도해봤는지, 어떤 효과가 있었는지'도 포함해주시면 됩니다.스스로 회고하는 것은 여러분의 소중한 기록이 됩니다.2-2. Wrap UP 리포트P Stage 별 마지막 날에 학습 정리를 종합하여..
부스트캠프 개발자의 지속 가능한 성장을 위한 학습 커뮤니티 boostcamp.connect.or.kr 개요 다음 주부터는 3주간 배운 지식을 바탕으로 이미지 분류 대회를 진행한다. 바로 투입되기에는 지식의 흡수도 완전하지 않고, 완성도도 높지 않지만 실전과 함께 배워야 하지 않겠는가, 우리 팀은 1등이 목표가 아닌 모두가 함께 성장하는 방향으로 진행하고자 한다. 마지막 날이라 그런지 정말 많은 이벤트들이 있었다. ✍🏻학습 정리 (08강) Multi-GPU 학습 🎯 PyTorch에서 Multi GPU를 사용하기 위해 딥러닝 모델을 병렬화 하는 Model Parallel의 개념과 데이터 로딩을 병렬화하는 Data Parallel의 개념을 학습 예전에는 어떻게 하면 구조를 단순화하여 GPU를 적게 쓸까 고민하..
부스트캠프 개발자의 지속 가능한 성장을 위한 학습 커뮤니티 boostcamp.connect.or.kr 개인학습 (06강) 모델 불러오기 💡 PyTorch 모델 저장 및 불러오는 방법과 이어 학습하기(Transfer Learning)를 학습 요즘 딥러닝은 backbone, 즉 이미 학습이 되어있는 모델을 가져와서 우리 데이터에 맞춰서 다시 학습하는 fine tuning이 대세다. 이미지에서는 ResNet 계열들, NLP에서는 Bert 계열 모델들 우리는 학습 결과를 공유하고 싶다. 어떻게? Tip. Colab에서 작업 끝나면 Slack으로 메세지 보내기 1. model.save() 학습의 결과를 저장하기 위한 함수 모델 형태 (architecture)와 파라미터를 저장 모델 학습 중간 과정의 저장을 통해 ..
부스트캠프개발자의 지속 가능한 성장을 위한 학습 커뮤니티boostcamp.connect.or.kr개인학습(04강) AutoGrad & Optimizer딥러닝은 결국 블록(layer)의 반복이다. layer안에는 작은 layer들이 모여있기도 함torch.nn.Module딥러닝을 구성하는 Layer의 base classInput, Output, Forward, Backward 정의Input과 Output은 optional하지만, 대부분 정의해준다.Forward, Backward 때 하는 일을 정해주는 데, AutoGrad와 weight를 조절해준다.학습의 대상이 되는 parameter(tensor) 정의nn.Parameter모델을 구성하기 위해서는 학습의 대상이 되는 weight들을 정해야 하는데 weig..
부스트캠프 개발자의 지속 가능한 성장을 위한 학습 커뮤니티 boostcamp.connect.or.kr 굿모닝세션 비몽사몽한 정신으로 굿모닝세션과 함께 이번 주를 시작했다. 이미 학습 일정이 잘 나와있어서 그것을 따라 하기로! 수업은 학습 일정 따라서, Data Viz는 화, 수에 걸쳐서 학습 슬랙에 To-Do list 작성 멘토님께 학습 일정 말씀드리고, 조언받기 개인학습 (01강) Introduction to PyTorch Computational Graph 연산의 과정을 그래프로 표현 $g=(x+y)*z$ Define and Run (TF) 그래프를 먼저 정의 → 실행 시점에 데이터 Feed feed_dict를 통해 cost function에 데이터 Feed Define by Run (Dynamic ..
부스트캠프 개발자의 지속 가능한 성장을 위한 학습 커뮤니티 boostcamp.connect.or.kr (2-2) Line Plot 사용하기 기본 Line Plot 1. Line plot이란? Line Plot은 연속적으로 변화하는 값을 순서대로 점으로 나타내고, 이를 선으로 연결한 그래프 꺾은선 그래프, 선 그래프, line chart, line graph 등의 이름으로 사용됨 시간/순서에 대한 변화에 적합하여 추세를 살피기 위해 사용 시계열 분석에 특화!! 신기하게 .line이 아니라 .plot() 2. Line plot의 요소 5개 이하의 선을 사용하는 것을 추천 더 많은 선은 중첩으로 인한 가독성 하락 그렇다면 이를 구별하는 요소는 어떤 것이 있을까? 색상 (color) 마커 (marker, mar..
부스트캠프 개발자의 지속 가능한 성장을 위한 학습 커뮤니티 boostcamp.connect.or.kr Data Visualization의 기본 중의 기본, Bar Plot에 대해 알아보자. 우선 Bar Plot에 앞서 가볍게 Data Check를 할 때 배운 좋은 Method부터 소개하고 시작하겠다. # 랜덤하게 데이터가 뽑히기 때문에 얻지 못하던 정보를 얻을수도 있음 student.sample(5) # 내가 원하는 갯수의 데이터를 sample로 뽑아줌 # 조금 더 다양하게 describe해줌 student.describe(include='all') Bar plot이란? Bar plot이란 직사각형 막대를 사용하여 데이터의 값을 표현하는 차트/그래프 막대그래프, bar chart, bar graph 등의..
부스트캠프 개발자의 지속 가능한 성장을 위한 학습 커뮤니티 boostcamp.connect.or.kr 개요 정말 이 부스트캠프의 가장 큰 장점은 어디에서도 뵙기 힘든 분들을 강사님으로 만나 뵙게된다는 것이다. Kaggle KR 오픈채팅방에 들어간 지 1년하고 조금 지났는데, 거기에서 자주 뵙던 안수빈님께 시각화를 배울 수 있다니 영광이 아닐 수 없다. (1-1) Welcome to Visualization (OT) 강사 소개 서울대학교 컴퓨터공학과 석박통합과정 Human Computer Interaction Lab. 고려대학교 사이버국방학과 졸업 Kaggle Notebook 국내 1위 / 세계 41위 Notebook : 데이터 시각화 및 데이터 분석 및 코드 Kaggle Korea, Data Visual..