OCR
PostPosted:Tue Jun 21, 2016 6:05 pm
by andresj10
buenas..
esoy probando el OCR en la Vr community de OpenKM 6.3, ya tengo instalado el Tesseract pero como logro hacer una busqueda del texto que esta en el archivo.
toca crear una plantilla?
me falta instalar algo mas?
muchas gracias
Re: OCR
PostPosted:Sat Jun 25, 2016 8:47 am
by jllort
Lo primero es ver que tipo de texto esta pasando por el OCR ( PDF, imagen ) ?
Piensa que la indexación es una cola ( en Administración / Stats -> tienes el "Pending text extractor queue" ), mientras los documentos esten en la cola, estan pendientes de extraer el contenido.
Finalmente con el uuid del documento ( lo puedes capturar de la pestaña de Propiedades en el panel inferior del UI ), puedes realizar esta consulta en la base de datos ( Administration / Database Query ):
select * from OKM_NODE_DOCUMENT WHERE NBS_UUID='valor de uuid del documento';
En el resultado tienes dos columnas significativas, el NDC_TEXT ( que es el texto extraído ) y el NDC_TEXT_EXTRACTED ( con un valor T o F ) que indica si ha sido o no procesado