MAPFORCE ALTOVA NOVEDADES 2026 – OCR para PDF

MapForce incluye len su version 2026 a potente herramienta PDF Extractor, que le permite definir visualmente la estructura de un documento PDF para extraer de manera eficiente sus datos y utilizarlos en un proyecto de asignación de datos. PDF Extractor es una herramienta de gran flexibilidad que le permite extraer partes del texto en lugar de todo el documento, mezclar y combinar fragmentos de información de diferentes páginas del mismo archivo PDF, dividir tablas en filas y organizar los datos en grupos.

Aunque esta funcionalidad resulta inmediatamente útil para los PDF digitales basados en texto, muchos PDF son en realidad documentos escaneados, es decir, solo imágenes. La nueva compatibilidad con OCR (reconocimiento óptico de caracteres) permite a MapForce convertir esas imágenes en texto que se pueda seleccionar y buscar, y que esté disponible para su extracción. De este modo, MapForce PDF Extractor puede procesar una gama más amplia de entradas, incluidos documentos antiguos, archivos en papel digitalizados y formularios escaneados o escritos a mano.

Cuando ejecuta el procesamiento OCR en un PDF escaneado en MapForce, PDF Extractor muestra el contenido detectado en una estructura de objetos en forma de árbol. Mediante una superposición del propio documento, se muestra cómo el procesador OCR ha detectado las palabras en el área escaneada, mostrando las palabras reconocidas en color verde. Las palabras resaltadas en rojo no se han añadido a la estructura en forma de árbol, ya que su índice de confianza no ha alcanzado el umbral del procesador. Puede editar la estructura en forma de árbol, así como las palabras en verde y rojo, manualmente, según sea necesario.

Mas información en: www.altova.com/es/mapforce/whatsnew

pdf extractor ocr