TIL/Boostcamp AI tech
[데이터제작] OCR Technology & Services - Computer Vision
seowit
2021. 11. 9. 02:56
OCR Technology
OCR : Optical Character Recognition
STR : Scene Text Recofgnition (OCR로 포함됨)
글자 영역을 찾고 영역 내 글자를 인식하는 과정을 통틀어 OCR이라고 할 수 있다
✔ Text Detector
: 이미지 입력에 글자 영역 위치가 출력인 모델
단일 클래스의 object detection 문제로 볼 수 있다. 클래스가 하나인 이유는 글자가 맞냐 아니냐만 구분하기 때문.
객체 검출과의 차이점은 영역의 종횡비와 객체의 밀도가 다르다는 점이다.
✔ Text Recognizer
: 하나의 글자 영역 이미지 입력에 해당 영역 글자열이 출력인 모델
글자 인식기는 Computer Vision과 Natural Language Processing의 교집합 영역으로, image captioning과 유사
✔ Serializer
: 정렬기는 OCR 결과 값을 자연어 처리하기 편하게 일렬로 정렬하는 모듈
정렬기 결과 값을 입력으로 받는 자연어 처리 모듈을 뒤에 붙여서 사용 가능
✔ Text Parser
: 자연어 처리 모듈 중 가장 많이 사용되는 것은 기 정의된 key들에 대한 value 추출
BIO 태깅 사용 : 문장에서 기 정의된 개체에 대한 값 추출