OCR Technology
OCR : Optical Character Recognition
STR : Scene Text Recofgnition (OCR로 포함됨)
글자 영역을 찾고 영역 내 글자를 인식하는 과정을 통틀어 OCR이라고 할 수 있다
✔ Text Detector
: 이미지 입력에 글자 영역 위치가 출력인 모델
단일 클래스의 object detection 문제로 볼 수 있다. 클래스가 하나인 이유는 글자가 맞냐 아니냐만 구분하기 때문.
객체 검출과의 차이점은 영역의 종횡비와 객체의 밀도가 다르다는 점이다.
✔ Text Recognizer
: 하나의 글자 영역 이미지 입력에 해당 영역 글자열이 출력인 모델
글자 인식기는 Computer Vision과 Natural Language Processing의 교집합 영역으로, image captioning과 유사
✔ Serializer
: 정렬기는 OCR 결과 값을 자연어 처리하기 편하게 일렬로 정렬하는 모듈
정렬기 결과 값을 입력으로 받는 자연어 처리 모듈을 뒤에 붙여서 사용 가능
✔ Text Parser
: 자연어 처리 모듈 중 가장 많이 사용되는 것은 기 정의된 key들에 대한 value 추출
BIO 태깅 사용 : 문장에서 기 정의된 개체에 대한 값 추출
'TIL > Boostcamp AI tech' 카테고리의 다른 글
[데이터제작] Text Detection in OCR (0) | 2021.11.09 |
---|---|
[데이터제작] 데이터 제작의 중요성 - Computer Vision (0) | 2021.11.08 |
[Segmentation] FCN의 한계를 극복한 models - 성능면 (0) | 2021.11.08 |
[Segmentation] FCN, Semantic Segmentation의 기초와 이해 :: seoftware (0) | 2021.10.20 |
[Segmentation] COCO Dataset format & EDA & Metric (0) | 2021.10.19 |
댓글