본문 바로가기
개발/Python

🧾 파이썬으로 이미지에서 텍스트 추출하기: OCR 기초 완전 정복

by 비트-바이트 2025. 3. 26.
반응형

사진 속 글자를 추출해서 자동으로 문서화하거나, 영수증 스캔 정보를 텍스트로 변환하고 싶었던 적 있으신가요?
이럴 때 바로 필요한 기술이 **OCR(Optical Character Recognition, 광학 문자 인식)**입니다.

이번 포스팅에서는 파이썬 + Tesseract OCR을 활용해 이미지에서 텍스트를 뽑아내는 기본 방법을 알려드릴게요!


📦 사전 준비

1. 파이썬 설치 확인

Python 3.7 이상 권장

2. 필수 라이브러리 설치

pip install pytesseract opencv-python pillow
 

3. Tesseract 설치

운영체제에 맞게 설치 필요

import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'  # 윈도우 기준

🖼️ 기본 예제: 이미지에서 텍스트 추출하기

import cv2
import pytesseract
from PIL import Image

# 이미지 불러오기
img = cv2.imread('sample_image.png')

# 흑백 처리
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# OCR 수행
text = pytesseract.image_to_string(gray, lang='eng')

print("추출된 텍스트:")
print(text)

🛠️ OCR 정확도 높이기 팁

  • 이미지 해상도를 높이고, 노이즈 제거하기
  • 흑백 이진화 (thresholding) 처리
  • 폰트가 깔끔한 데이터로 테스트할 것
  • 언어팩 추가 설치로 한글도 인식 가능: lang='kor'

📌 Tesseract 한글 인식하려면?

한글 언어팩 설치 후 lang='kor' 옵션 사용:

 
sudo apt install tesseract-ocr-kor   # Ubuntu 기준​


text = pytesseract.image_to_string(gray, lang='kor')​


💡 OCR 어디에 쓸 수 있을까?

  • 명함 스캔 후 연락처 자동 등록
  • 캡처된 이미지에서 문서화 작업
  • 운전면허증, 주민등록증 등 인식
  • 책/논문 스캔 후 검색 가능한 PDF로 변환

✅ 마무리

OCR은 인공지능 분야 중에서도 실무에 정말 많이 쓰이는 기술입니다.
파이썬으로 빠르게 시작해보고, 이후 딥러닝 기반 OCR로도 확장할 수 있어요.


🔜 다음 글 예고

  • 딥러닝 OCR: EasyOCR vs PaddleOCR 비교
  • OCR + Flask로 웹 OCR 서비스 만들기
  • OCR 성능 향상을 위한 이미지 전처리 전략

🖊️ 도움이 되셨다면 공감/댓글/구독 부탁드려요!
💬 더 궁금한 점이나 다뤄줬으면 하는 주제가 있다면 댓글로 남겨주세요.

반응형