본문 바로가기
TIL/Boostcamp AI tech

[데이터제작] OCR Technology & Services - Computer Vision

by seowit 2021. 11. 9.

OCR Technology

 

OCR : Optical Character Recognition

STR : Scene Text Recofgnition (OCR로 포함됨)

STR 

글자 영역을 찾고 영역 내 글자를 인식하는 과정을 통틀어 OCR이라고 할 수 있다

 

✔ Text Detector

: 이미지 입력에 글자 영역 위치가 출력인 모델

단일 클래스의 object detection 문제로 볼 수 있다. 클래스가 하나인 이유는 글자가 맞냐 아니냐만 구분하기 때문.

 

객체 검출과의 차이점은 영역의 종횡비와 객체의 밀도가 다르다는 점이다.

✔ Text Recognizer

: 하나의 글자 영역 이미지 입력에 해당 영역 글자열이 출력인 모델

 

글자 인식기는 Computer Vision과 Natural Language Processing의 교집합 영역으로, image captioning과 유사

 

✔ Serializer

: 정렬기는 OCR 결과 값을 자연어 처리하기 편하게 일렬로 정렬하는 모듈

정렬기 결과 값을 입력으로 받는 자연어 처리 모듈을 뒤에 붙여서 사용 가능

 

✔ Text Parser

: 자연어 처리 모듈 중 가장 많이 사용되는 것은 기 정의된 key들에 대한 value 추출

 

BIO 태깅 사용 : 문장에서 기 정의된 개체에 대한 값 추출

댓글