[데이터제작] OCR Technology & Services

OCR : Optical Character Recognition

STR : Scene Text Recofgnition (OCR로 포함됨)

글자 영역을 찾고 영역 내 글자를 인식하는 과정을 통틀어 OCR이라고 할 수 있다

✔ Text Detector

: 이미지 입력에 글자 영역 위치가 출력인 모델

단일 클래스의 object detection 문제로 볼 수 있다. 클래스가 하나인 이유는 글자가 맞냐 아니냐만 구분하기 때문.

객체 검출과의 차이점은 영역의 종횡비와 객체의 밀도가 다르다는 점이다.

✔ Text Recognizer

: 하나의 글자 영역 이미지 입력에 해당 영역 글자열이 출력인 모델

글자 인식기는 Computer Vision과 Natural Language Processing의 교집합 영역으로, image captioning과 유사

✔ Serializer

: 정렬기는 OCR 결과 값을 자연어 처리하기 편하게 일렬로 정렬하는 모듈

정렬기 결과 값을 입력으로 받는 자연어 처리 모듈을 뒤에 붙여서 사용 가능

✔ Text Parser

: 자연어 처리 모듈 중 가장 많이 사용되는 것은 기 정의된 key들에 대한 value 추출

BIO 태깅 사용 : 문장에서 기 정의된 개체에 대한 값 추출

[데이터제작] Text Detection in OCR (0)	2021.11.09
[데이터제작] 데이터 제작의 중요성 - Computer Vision (0)	2021.11.08
[Segmentation] FCN의 한계를 극복한 models - 성능면 (0)	2021.11.08
[Segmentation] FCN, Semantic Segmentation의 기초와 이해 :: seoftware (0)	2021.10.20
[Segmentation] COCO Dataset format & EDA & Metric (0)	2021.10.19

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

seoftware