Script_Convertir_PDF_IMG_TXT
Este script de pyhton convierte un pdf en Imagen luego utilizando tesseract como motor OCR convierte la Imagen a Texto.
-
pip install PyMuPDF
-
pip install Pillow
-
pip install pytesseract
-
pip install pdf2image
-
Instalar Tesseract Motor OCR https://github.com/UB-Mannheim/tesseract/wiki
Abrir ruta del Script Python y darle : py pdfToIMG.py
Saludos :)