Hola, estoy usando la versión 6 Community y no consigo que me extraiga texto de los PDFs.
De los ficheros de texto por ejemplo me saca el texto y de los JPG me hace el OCR sin problemas(con mayor o menor éxito usando el Tesseract 3 pero bueno)
Pero en el caso de los PDF siempre me arroja los mismos errores.
PDF does not contains text layer
There was a problem extracting text from .... Too few text extracted
He probado con distintos ficheros PDF, tanto creados por mi con Omnipage o con LibreOffice o ficheros de teceros
Las vistas previas me funcionan todas sin problemas y me permite buscar por texto en ellas, razón por la cual se que tienen texto y no imagenes.
Alguna idea de que puede estar pasando
Gracias
De los ficheros de texto por ejemplo me saca el texto y de los JPG me hace el OCR sin problemas(con mayor o menor éxito usando el Tesseract 3 pero bueno)
Pero en el caso de los PDF siempre me arroja los mismos errores.
PDF does not contains text layer
There was a problem extracting text from .... Too few text extracted
He probado con distintos ficheros PDF, tanto creados por mi con Omnipage o con LibreOffice o ficheros de teceros
Las vistas previas me funcionan todas sin problemas y me permite buscar por texto en ellas, razón por la cual se que tienen texto y no imagenes.
Alguna idea de que puede estar pasando
Gracias