Cómo aplicar OCR a un PDF
El reconocimiento óptico de caracteres (OCR) te permite extraer texto editable de imágenes o documentos PDF escaneados. Con Tenorshare PDNob, puedes aplicar OCR fácilmente para que tus PDF sean buscables y editables. Esta guía ofrece un tutorial claro, paso a paso, sobre cómo instalar la función OCR y usarla en tus archivos PDF.
1. ¿Qué es el OCR?
El OCR (reconocimiento óptico de caracteres) es una tecnología que convierte imágenes escaneadas o PDF basados en imágenes en texto editable y buscable. Esto es particularmente útil cuando se manejan documentos escaneados o materiales impresos que han sido digitalizados.
2. Descargar e instalar OCR
- Inicia el software Tenorshare PDNob en tu ordenador.
- En la interfaz principal, haz clic en el botón "OCR PDF".
- Selecciona los archivos deseados desde tu ordenador y haz clic en "Abrir" para cargarlos en PDNob.
- Si se solicita, haz clic en el botón "Descargar" para instalar la funcionalidad OCR.
3. Cómo aplicar OCR a PDF
- Una vez instalada la función OCR, haz clic en el botón "OCR" en la barra de herramientas superior para iniciar el proceso de OCR.
- Aparecerá una ventana de configuración. Elige el modo de OCR según tus necesidades:
-
Escaneo a texto editable
Convierte el texto escaneado en contenido totalmente editable. Después del OCR, puedes editar, mover, copiar o eliminar texto en el PDF como en un documento normal. -
Escaneo a texto buscable en imagen
Mantiene la imagen escaneada original intacta mientras hace que el texto sea buscable y seleccionable. Ideal para indexar o buscar texto sin editar el diseño. - Después de seleccionar la opción adecuada, haz clic en "Realizar OCR" para iniciar el reconocimiento de texto.
- Después de completar el OCR, el texto reconocido se vuelve buscable y se puede copiar. Seleccionar "Escaneo a texto editable" te permite editar el texto directamente en el PDF.
4. Configuración avanzada de OCR (compatible con PDNob 2.0)
PDNob 2.0, cuya publicación está prevista para mediados o finales de marzo, introduce la configuración avanzada de OCR, que permite a los usuarios optimizar los resultados de reconocimiento. Habilitar estas opciones puede mejorar la precisión, aunque puede ralentizar ligeramente el procesamiento del OCR.
Para acceder a estas opciones, abre el panel de configuración de OCR y haz clic en Configuración avanzada. Puedes activar o desactivar funciones específicas de procesamiento de imágenes y detección de texto. Consulta la captura de pantalla a continuación para ver la ubicación de acceso.
Obtén más información sobre estas opciones en esta sección:
- Recortar página automáticamente – Detecta áreas de contenido automáticamente y recorta bordes innecesarios, haciendo las páginas más compactas y mejorando la precisión del OCR.
- Enderezar página automáticamente – Corrige páginas inclinadas para alinear el texto horizontalmente, mejorando la precisión del reconocimiento.
- Mejorar contraste local – Mejora el contraste local de la imagen para aclarar texto borroso, alterando ligeramente los colores originales.
- Eliminar manchas oscuras – Elimina pequeños puntos oscuros, mejorando la limpieza de la página y la claridad del OCR.
- Eliminar ruido – Filtra pequeñas imperfecciones blancas y otras interferencias, aclarando los bordes del texto para obtener mejores resultados de OCR.
- Detectar texto en imágenes – Reconoce y extrae texto incrustado dentro de regiones de imagen para un OCR completo.