Introducing G2.ai, the future of software buying.Try now

¿Cuál es la mejor manera de extraer los datos del PDF?

Tenemos 4 tipos de fuentes de entrada (cuadrícula web, Excel, Word, PDF). El PDF es más desafiante para extraer la información. Las casillas de verificación y los botones de opción no se pueden extraer de un documento PDF. Por favor, ayúdame con este problema.
4 comentarios
Parece que no has iniciado sesión.
Los usuarios deben estar conectados para responder preguntas
Iniciar Sesión
Rajat S.
RS
Digital Transformation Consultant || Intelligent Automation (RPA/AI/ML)
0
Usar actividad de visión por computadora
Parece que no has iniciado sesión.
Los usuarios deben estar conectados para escribir comentarios
Iniciar Sesión
Responder
KANTHESH M.
KM
Certified RPA | Data Analyst. Data Analytics | Data Science
0
Para extraer botones de opción/casillas de verificación, puedes usar NLP [Procesamiento de Lenguaje Natural] para eso.
Parece que no has iniciado sesión.
Los usuarios deben estar conectados para escribir comentarios
Iniciar Sesión
Responder
DP
RPA Architect
0
Hola, La mejor manera de extraer datos de PDF es REGEX. Usando REGEX puedes hacerlo. Simplemente crea un patrón de lo que deseas extraer del PDF y pégalo en la actividad MATCH en UiPath. Para más detalles, visita el siguiente enlace.
Parece que no has iniciado sesión.
Los usuarios deben estar conectados para escribir comentarios
Iniciar Sesión
Responder
Yasser Q.
YQ
RPA Developer
0
https://forum.uipath.com/t/lectura-de-casillas-de-verificación-marcadas-no-marcadas-en-pdf-editable/111478 . Quizás esto debería ayudar.
Parece que no has iniciado sesión.
Los usuarios deben estar conectados para escribir comentarios
Iniciar Sesión
Responder