부스트캠프18 [데이터제작] Text Detection in OCR Basics 위의 예시와 같이 글자 객체는 일반 객체와 다른 특징을 갖는다. 매우 높은 밀도, 극단적 종횡비, 특이 모양(구겨진 영역, 휘어진 영역, 세로 쓰기 영역), 모호한 객체 영역, 크기 편차 등의 특징을 볼 수 있다. 글자 객체가 갖는 특징 때문에 글자 영역을 표현하는 방법은 일반 객체를 표현하는 것과는 차이가 있다. 기본적인 표기 방법은 좌상단을 시작 좌표로 찍고 (x1, y1) 시계 방향으로 좌표를 찍는 것이다. 휘어진 글자의 경우에는 Polygon 형태로 어노테이션을 진행한다. 주의할 점은 2n개의 points를 찍는 것이다. 위의 두 점과 쌍이 되는 아래의 두 점을 잡았을 때 특정 글자 영역이 되도록 Polygon을 그린다. Taxonomy T1. Regression-based vs. S.. 2021. 11. 9. [데이터제작] OCR Technology & Services - Computer Vision OCR Technology OCR : Optical Character Recognition STR : Scene Text Recofgnition (OCR로 포함됨) 글자 영역을 찾고 영역 내 글자를 인식하는 과정을 통틀어 OCR이라고 할 수 있다 ✔ Text Detector : 이미지 입력에 글자 영역 위치가 출력인 모델 단일 클래스의 object detection 문제로 볼 수 있다. 클래스가 하나인 이유는 글자가 맞냐 아니냐만 구분하기 때문. 객체 검출과의 차이점은 영역의 종횡비와 객체의 밀도가 다르다는 점이다. ✔ Text Recognizer : 하나의 글자 영역 이미지 입력에 해당 영역 글자열이 출력인 모델 글자 인식기는 Computer Vision과 Natural Language Processi.. 2021. 11. 9. [데이터제작] 데이터 제작의 중요성 - Computer Vision 한 AI의 모델의 성능은 모델의 구조, 데이터, 최적화의 조합으로 이루어진다. 지금까지는 모델의 구조와 하이퍼파라미터의 튜닝으로 AI 모델의 성능을 올렸다면, 지금부터는 데이터 조작으로 모델의 성능을 올리는 과정을 알아보자. Software 1.0 vs. Software 2.0 software1.0은 딥러닝이 아닌 사람이 고민하여 feature를 추출하고 프로그램을 설계하고 구현하는 것을 의미한다. software2.0은 AI 모델의 구조로 프로그램의 검색 범위를 한정하고, 데이터와 최적화 방법을 통해 최적의 프로그램을 찾는 것을 의미한다. software2.0의 발전으로 software1.0의 프로그램이 software2.0으로 대체되고 있는 추세다. human detection, audio codec.. 2021. 11. 8. [Boostcamp Lv2] Week6-Day25. Image classification | VGG11 구현 :: seoftware 목차 1. 강의정리 1-1. CV - chap1. Image Classification 1 2. 과제 2-1. Assignment1_blank.ipynb (vgg11) 3. 피어세션 정리 4. 데일리 회고 📜 강의 정리 [CV] Chapter1. Image classification 1 컴퓨터비전은 왜 인공지능일까? 인공지능의 정의를 살펴보면, 인간의 지능을 모방하는 것이다. 컴퓨터비전은 사람의 눈을 대신하는 기술이기 때문에 인공지능이라고 할 수 있다. 이상적인 이미지 인식 방법은 세상의 모든 이미지를 학습시키고 k-nn 방식으로 비슷한 이미지를 고르는 것이지만, 모든 데이터를 학습시키는 것도 어렵고 모든 데이터에 대한 비교를 하는 것도 현실적이지 않다. Single fully connected laye.. 2021. 9. 7. [Boostcamp]Week4-Day18. Training & Inference :: seoftware 목차 1. 강의정리 1-1. P stage - chap7. Training & Inference 1 1-2. P stage - chap8. Training & Inference 2 2. 피어세션 정리 3. 데일리 회고 📜 강의 정리 [P stage] Chapter7. Training & Inference 1 🌈 Loss, optimizer, metric에 대해 알아보자 1. Loss loss backpropagation : output과 target 간의 loss를 구한 후 역전파 loss function 선택 중요 nn.Modules Family loss.backward() : 이 함수가 실행되면 모델의 파라미터의 grad 값이 업데이트. loss부터 input까지 체인 연결 조금 특별한 loss Fo.. 2021. 8. 26. [Boostcamp]Week4-Day17. Model :: seoftware 목차 1. 강의정리 1-1. P stage - chap5. Model 1 1-2. P stage - chap6. Model 2 2. 피어세션 정리 3. 데일리 회고 📜 강의 정리 [P stage] Chapter5. Model1 : Model with PyTorch 🌈 Pytorch라는 프레임워크가 가지는 특성과 Pytorch를 사용하여 모델을 구성하는 방법을 알아보자 모델 : In general, a model is an informative representation of an object, person or system. 1. pytorch Open Source Machine Learning Framework 런타임으로 정의되는 다이나믹한 그래프를 볼 수 있음. 유연함. Low-level, Pytho.. 2021. 8. 25. [Boostcamp]Week4-Day16. Dataset & Dataloader :: seofware 목차 1. 강의정리 1-1. [P]이미지 분류 - chap3. Dataset 1-2. [P]이미지 분류 - chap4. Data Generation 2. 피어세션 정리 3. 데일리 회고 * P stage 는 3주간 배운 이론을 실제로 사용해보는 시간입니다. 📜 강의 정리 [P stage] Chapter3. Dataset 🌈데이터전처리 방법과 일반화에 대해 알아보자 컴피티션이 데이터셋은 정제된 데이터를 담고 있지만, 실제 데이터의 품질은 보장하기 힘들다. 1. 데이터전처리 1. Bounding box 이미지 데이터에는 우리가 필요로 하는 데이터 외에 불필요한 정보까지 담고 있다. 2. Resize 화소가 너무 많으면 학습시킬 파라미터가 너무 많아서 학습시간이 오래걸린다. 따라서 계산의 효율을 위해 적당한 .. 2021. 8. 24. [Boostcamp]Data visualization Seaborn :: seoftware 목차 1. 강의정리 1-1. Data Viz - Seaborn 소개 1-2. Data Viz - Seaborn 기초 1-3. Data Viz - Seaborn 심화 📜 강의 정리 * 부스트캠프 Data visualization 강의를 맡아주신 안수빈 강사님의 강의를 정리한 것 입니다. [Data Viz] Seaborn 소개 Seaborn은 Matplotlib 기반 통계 시각화 라이브러리 통계 정보 : 구성, 분포, 관계 등 Matplotlib 기반이라 Matplotlib으로 커스텀 가능 쉬운 문법과 깔끔한 디자인이 특징 설치 : pip install seaborn==0.11 [Data Viz] Seaborn 기초 🌈 Seaborn의 구조와 문법에 대해 알아보자 Seaborn API 통계 시각화 종류 Ca.. 2021. 8. 24. [Boostcamp]Week4-Day15. P stage start :: seoftware 목차 1. 강의정리 1-1. [P]이미지 분류 - chap1. Competition with AI stages! 1-2. [P]이미지 분류 - chap2. Image classification & EDA 2. 실습 3. 피어세션 정리 4. 데일리 회고 * P stage 는 3주간 배운 이론을 실제로 사용해보는 시간입니다. 📜 강의 정리 [P stage] Chapter1. Competition with AI stages! 🌈대회 시작 전 중요한 포인트를 살펴보자 1. Overview : Kaggle, Dacon 등의 여러 competition 플랫폼이 존재하는데, 문제에서 가장 먼저 봐야할 것은 방향성이다. 어떤 문제인지 정확하게 파악한 후에 적절한 해결방안을 도출할 수 있다. 2. Description .. 2021. 8. 23. 이전 1 2 다음