Hola Praveen,
La forma más poderosa de extraer la posición de un párrafo y otros datos de un documento PDF es el complemento pdf2Data de iText 7, que también tiene una demostración en línea: https://pdf2data.online/
Tal vez esta respuesta de Stack Overflow de Alexey Subach de iText pueda ayudarte: https://stackoverflow.com/questions/55807256/how-can-i-get-the-position-of-the-specified-keyword-in-itext7
Aunque pdf2data es el enfoque óptimo, puedes hacer extracciones básicas con iText 7 Core usando una expresión regular:
PdfDocument pdfDocument = new PdfDocument(new PdfReader(inputFile));
ILocationExtractionStrategy strategy = new RegexBasedLocationExtractionStrategy("expresión regular");
PdfCanvasProcessor canvasProcessor = new PdfCanvasProcessor(strategy);
canvasProcessor.processPageContent(pdfDocument.getPage(1));
pdfDocument.close();
strategy.getResultantLocations(); // ahora contiene todas las ubicaciones del texto coincidente
Si deseas una respuesta para tu caso específico, entonces es mejor publicar una pregunta más detallada en Stack Overflow señalando lo que has intentado y dónde estás atascado.
Si tienes una licencia comercial, también tendrás acceso al soporte al cliente de iText a través de Jira.
Atentamente,
Kenneth Holvoet
iText Software
Los usuarios deben estar conectados para escribir comentarios
Iniciar Sesión
Responder
¿Ya tienes iText by Apryse?
Acerca de iText by Apryse
Anteriormente conocido como iText, ahora somos parte de Apryse. Con tecnología optimizada y una suite completa de herramientas, Apryse simplifica incluso los proyectos más complejos, llevándote más le
Con más de 2.5 millones de reseñas, podemos proporcionar los detalles específicos que te ayudarán a tomar una decisión informada al comprar software para tu negocio. Encontrar el producto adecuado es importante, déjanos ayudarte.