easyocr
easyocr
EasyOCR es un motor OCR basado en deep learning que soporta más de 80 idiomas y scripts. Funciona como alternativa/fallback a PaddleOCR con mejor rendimiento en caracteres especiales y alfabetos no latinos.
When to use
Usar en el ocr_agent como segundo motor OCR cuando PaddleOCR tiene baja confianza (< 0.7) en la extracción. Especialmente útil para documentos con caracteres árabes, cirílicos o asiáticos.
Instructions
- Instalar:
pip install easyocr. - Inicializar reader con idiomas:
reader = easyocr.Reader(['es', 'en', 'fr'], gpu=True). - Ejecutar OCR:
results = reader.readtext(image). - Cada resultado contiene:
[bbox, text, confidence]. - Filtrar resultados con confianza < 0.5.
- Comparar resultados con PaddleOCR y usar el de mayor confianza por campo.
- Normalizar texto extraído con el
regex_data_normalizer.
Notes
More from davidcastagnetoa/skills
traefik
Reverse proxy moderno con autodiscovery nativo en Kubernetes y Let's Encrypt
67prisma-nestjs-patterns
>
26c4_model_structurizr
Diagramas de arquitectura C4 como código con Structurizr DSL, versionados en Git
24exif_metadata_analyzer
Analizar metadatos EXIF para detectar edición previa con Photoshop, GIMP u otros editores
19insightface_arcface
Reconocimiento facial de estado del arte con ArcFace R100 para comparar selfie con foto del documento
15asyncpg
Cliente PostgreSQL async de alto rendimiento para el backend FastAPI del pipeline KYC
14