TIL51 [Boostcamp Lv2][P stage] Week9-Day37. Object Detection :: seoftware 📜 강의 정리 Obeject Detection Overview 1. Task classification : 이미지를 보고 어떤 객체인지 분류하는 것 object detection : bbox로 객체의 위치를 찾고 종류를 분류하는 것 semantic segmentation : 객체의 위치와 종류를 픽셀 단위로 분류하는 것 instance segmentation : semantic segmentation에 object detection의 기능을 더해서 같은 종류의 객체라도 다른 객체로 분류하는 것 2. History 3. Evaluation 모델의 평가 지표로 성능과 속도를 사용할 수 있다. 성능의 평가 지표로는 mAP, 속도의 평가 지표로는 FPS, Flops가 있다. ✔ mAP(mean Average P.. 2021. 9. 27. [Sequence Models] Recurrent Neural Networks :: seoftware 📜 강의 정리 * Coursera 강의 중 Andrew Ng 교수님의 Sequence Models 강의를 공부하고 정리한 내용입니다. * 이미지 출처 : Deeplearning.AI Recurrent Neural Networks 1. Why Sequence Models? 2. Notation 이전과 동일하게 i번째 example에 대해 (i)로 표현하고 x_(i)에서 시퀀스를 나타내기 위한 방법으로 를 사용 10K개의 단어가 있는 사전이 있다고 할 때, 각 단어의 위치를 1만 차원 shape의 원핫 벡터로 표현 3. Recurrent Neural Network Model 문장을 일반 신경망으로 학습하지 못하는 이유는 인풋과 아웃풋의 크기가 일정하지 않고, 한 단어의 중요도가 문장마다 다르기 때문에 특징을.. 2021. 9. 27. [Convolutional Neural Networks] Special applications: Face recognition & Neural style transfer :: seoftware 📜 강의 정리 * Cousera 강의 중 Andrew Ng 교수님의 Convolutional Neural Network 강의를 공부하고 정리한 내용입니다. * 이미지 출처 : Deeplearning.AI Face Recognition What is Face Recognition? Face recognition 문제는 verification과 구별된다. Face verification은 1:1 비교라면 Face Recognition은 1:N 비교라는 점이 가장 큰 차이점이다. One Shot Learning One shot learning이란 한 사진(example)만 보고 분류를 하는 것을 말한다. Face recognition에서 one-shot learning은 해결해야할 문제 중에 하나이다. 아래의.. 2021. 9. 27. [Boostcamp Lv2] Week8-Day36. 특강 Ⅱ :: soeftware 목차 1. 강의정리 1-1. 특강 - 2.1. Full Stack ML Engineer 1-2. 특강 - 2.3. AI 시대의 커리어 빌딩 2. 피어세션 정리 3. 이번주 회고 📜 강의 정리 [특강] 2-1. Full stack ML Engineer 1. Full stack Engineer란 무엇일까? ✔ ML Engineer란? ML 기술을 이해하고, 연구하고, product를 만드는 Engineer. ML Research와 software engineer의 경계에 ML Engineer가 있다. ✔ Full stack engineer란? client와 server software를 개발할 수 있는 사람 ✔ Full stack + ML? Deep learning research를 이해하고 + ML Pro.. 2021. 9. 24. [Boostcamp Lv2] Week8-Day35. 특강 Ⅰ :: seoftware 목차 1. 강의정리 1-1. 특강 - 서비스 향 AI 모델 개발하기(이활석) 2. 피어세션 정리 📜 강의 정리 ✨ 특강 1. 이활석 - 서비스 향 AI 모델 개발하기 회사에서 AI 모델을 개발하는 것과 공부할 때 배우는 AI와의 차이에 대해 말씀해주셨습니다. 가장 큰 차이점은 학습에 사용할 데이터셋과 테스트 방법이 준비되어 있지 않다는 점이었습니다. 아래 이미지는 AI 서비스를 만드는 과정을 도식화한 것입니다. 이 중에서 처음부터 주어지는 것은 "서비스 요구사항"밖에 없습니다. 나머지 학습데이터셋, 테스트 데이터셋 등을 채워나가는 방법에 대해 알려주셨습니다. 학습 데이터셋을 준비하기 위해서는 정답/수량/종류에 대해 알아야합니다. 다음은 학습 데이터셋을 구하는 과정을 도식화한 것입니다. 테스트를 하는 방법.. 2021. 9. 23. [Convolutional Neural Networks] Object Detection :: seoftware 📜 강의 정리 * Cousera 강의 중 Andrew Ng 교수님의 Convolutional Neural Network 강의를 공부하고 정리한 내용입니다. * 이미지 출처 : Deeplearning.AI Detection Algorithms Object Localization 위와 같은 예시에서 target label y를 살펴보면 [P_c, b_x, b_y, b_h, b_w, c1, c2, c3] 로 구성이 되어있다. P_c는 이미지에 객체가 있으면 1, 없으면 0이고 b_로 시작하는 것들은 바운딩박스에 관련된 것, c로 시작되는 것들은 각 클래스에 해당하는 객체가 이미지 안에 있는지 나타내는 것이다. 만약 P_c(=y_1)가 1이라면 predict와 target간의 각각의 위치에 해당하는 인자끼리 l.. 2021. 9. 20. [Convolutional Neural Networks] Deep Convolutional Models - Case studies :: seoftware 📜 강의 정리 * Coursera 강의 중 Andrew Ng 교수님의 Convolutional Neural Network 강의를 공부하고 정리한 내용입니다. * 이미지 출처 : Deeplearning.AI 1. Case Studies Why look at case studies? I learned about the basic building blocks, such as convolutional layers, pooling layers, and fully connected layers. 지난 시간에 conv layer, pooling layer, fc layer 에 대해 배웠는데, 어떻게 이것들을 쌓아야 효과적인 네트워크 아키텍쳐를 만들 수 있을까? 한 task에서 잘 작동하는 네트워크는 대부분 다른 ta.. 2021. 9. 20. [Booscamp Lv2]Week7-Day33. 3D understanding :: seoftware 목차 1. 강의정리 1-1. CV - chap10. 3D understanding 2. 피어세션 정리 3. 데일리 회고 📜 강의 정리 [CV] Chapter10. 3D understanding 1. Seeing the world in 3D perspective 3d 세상에 살고 있으므로 3d는 매우 중요하다. 3d가 활용되는 분야는 AR/VR, 3D printing, medical applications 등이 있다. 3d 물체는 카메라에 의해 2d로 projection 된다. 2d image가 두 방향에서 두 개가 있으면 3d로 복구할 수 있다. 📘관련 추천 도서 : Multipel View Geometry in computer vision(PDF available online) ✔ 3D가 컴퓨터에 어떻.. 2021. 9. 17. [Boostcamp lv2]Week7-Day33. Multi-modal Learning :: seoftware 목차 1. 강의정리 1-1. CV - chap9-1. Multi-modal Learning 1-2. CV - chap9-2. Image Captioning 2. 과제 2-1. Conditional GAN 3. 피어세션 정리 📜 강의 정리 [CV] Chapter 9-1. Muti-modal Learning Multi-modal learning이란 한 타입의 데이터가 아니라 다른 특성을 갖는 데이터 타입을 같이 활용하는 학습법. 예를 들면, 텍스트와 사운드 함께 학습하는 예시가 있다. 1. Overview of Multi-Modal learning ✔ multi-modal의 어려운 점(Challenge) Different representations between modalities : 데이터 간의 표현 방.. 2021. 9. 16. 이전 1 2 3 4 5 6 다음