tesseract_ocr
tesseract_ocr
Tesseract OCR es el motor OCR open-source más maduro, mantenido por Google. Aunque menos preciso que PaddleOCR/EasyOCR en documentos complejos, es extremadamente rápido y ligero como tercer nivel de fallback.
When to use
Usar en el ocr_agent como tercer motor de fallback cuando PaddleOCR y EasyOCR fallan o no están disponibles. Útil en modo de degradación cuando los recursos GPU son limitados.
Instructions
- Instalar:
apt install tesseract-ocr tesseract-ocr-spaypip install pytesseract. - Configurar:
pytesseract.pytesseract.tesseract_cmd = '/usr/bin/tesseract'. - Ejecutar OCR:
text = pytesseract.image_to_string(image, lang='spa+eng'). - Para bounding boxes:
data = pytesseract.image_to_data(image, output_type=Output.DICT). - Pre-procesar imagen: binarizar con Otsu, aplicar deskew antes del OCR.
- Usar PSM 6 para bloques de texto uniforme:
--psm 6. - Filtrar resultados con confianza del campo
conf> 60.
Notes
More from davidcastagnetoa/skills
traefik
Reverse proxy moderno con autodiscovery nativo en Kubernetes y Let's Encrypt
67easyocr
OCR alternativo a PaddleOCR, excelente en caracteres especiales y múltiples scripts
36prisma-nestjs-patterns
>
26c4_model_structurizr
Diagramas de arquitectura C4 como código con Structurizr DSL, versionados en Git
24exif_metadata_analyzer
Analizar metadatos EXIF para detectar edición previa con Photoshop, GIMP u otros editores
19insightface_arcface
Reconocimiento facial de estado del arte con ArcFace R100 para comparar selfie con foto del documento
15