본문 바로가기

OCR3

🧼 OCR 성능 향상을 위한 이미지 전처리 전략 📌 개요OCR 성능이 생각보다 낮게 나와서 실망한 적 있으신가요?OCR은 단순히 라이브러리만 좋다고 성능이 올라가지 않습니다.**"좋은 입력이 좋은 결과를 만든다"**는 말처럼, 이미지 자체의 품질이 인식 성능에 가장 큰 영향을 미칩니다.이번 글에서는 OCR 성능을 눈에 띄게 향상시킬 수 있는 전처리 전략들을 정리해드립니다.OpenCV, PIL 기반으로 바로 적용할 수 있는 실습 팁도 포함되어 있어요.🧠 핵심 개념왜 전처리가 중요한가?OCR은 기본적으로 픽셀 단위로 패턴을 인식하는 구조배경 노이즈, 그림자, 왜곡, 저해상도 등은 큰 방해 요소사람이 보기에는 잘 보이는 글자도, 머신은 알아보지 못함OCR 정확도에 영향을 주는 요인들해상도 (dpi)명암 대비기울기/왜곡텍스트 배치 방향배경의 복잡도압축/노.. 2025. 3. 26.
🔍 딥러닝 OCR: EasyOCR vs PaddleOCR 비교 분석 import easyocrreader = easyocr.Reader(['ko', 'en'])result = reader.readtext('image.jpg')📌 개요이미지 속 텍스트를 읽어들이는 기술인 **OCR(광학 문자 인식)**은문서 스캔, 영수증 처리, AI 키오스크, 문서 자동화 등 다양한 분야에 필수로 사용되고 있습니다.이번 포스팅에서는 Python에서 가장 많이 사용되는 딥러닝 기반 OCR 라이브러리인EasyOCR과 PaddleOCR을 비교해보며,어떤 상황에서 어떤 라이브러리를 선택해야 할지에 대한 기준을 제공합니다.🧠 핵심 개념📦 EasyOCRPython으로 설치와 사용이 매우 간단PyTorch 기반80개 이상의 언어 지원한글 인식 정확도도 준수pip install easyocr im.. 2025. 3. 26.
🧾 파이썬으로 이미지에서 텍스트 추출하기: OCR 기초 완전 정복 사진 속 글자를 추출해서 자동으로 문서화하거나, 영수증 스캔 정보를 텍스트로 변환하고 싶었던 적 있으신가요?이럴 때 바로 필요한 기술이 **OCR(Optical Character Recognition, 광학 문자 인식)**입니다.이번 포스팅에서는 파이썬 + Tesseract OCR을 활용해 이미지에서 텍스트를 뽑아내는 기본 방법을 알려드릴게요!📦 사전 준비1. 파이썬 설치 확인Python 3.7 이상 권장2. 필수 라이브러리 설치pip install pytesseract opencv-python pillow 3. Tesseract 설치운영체제에 맞게 설치 필요Tesseract 다운로드설치 후 시스템 환경 변수 등록 또는 경로 지정 필요import pytesseractpytesseract.pytesser.. 2025. 3. 26.
반응형