Open Source Document Management System | OpenKM

PostPosted:**Tue Jun 21, 2016 6:05 pm**

buenas..

esoy probando el OCR en la Vr community de OpenKM 6.3, ya tengo instalado el Tesseract pero como logro hacer una busqueda del texto que esta en el archivo.

toca crear una plantilla?
me falta instalar algo mas?

muchas gracias

PostPosted:**Sat Jun 25, 2016 8:47 am**

Lo primero es ver que tipo de texto esta pasando por el OCR ( PDF, imagen ) ?
Piensa que la indexación es una cola ( en Administración / Stats -> tienes el "Pending text extractor queue" ), mientras los documentos esten en la cola, estan pendientes de extraer el contenido.
Finalmente con el uuid del documento ( lo puedes capturar de la pestaña de Propiedades en el panel inferior del UI ), puedes realizar esta consulta en la base de datos ( Administration / Database Query ):
select * from OKM_NODE_DOCUMENT WHERE NBS_UUID='valor de uuid del documento';

En el resultado tienes dos columnas significativas, el NDC_TEXT ( que es el texto extraído ) y el NDC_TEXT_EXTRACTED ( con un valor T o F ) que indica si ha sido o no procesado

Open Source Document Management System | OpenKM

OCR

OCR

Re: OCR