Introducing G2.ai, the future of software buying.Try now

¿Cómo extraigo la posición del párrafo? de la misma manera que extraemos las posiciones en documentos de Word.

1 comentario
Parece que no has iniciado sesión.
Los usuarios deben estar conectados para responder preguntas
Iniciar Sesión
KH
0
Hola Praveen, La forma más poderosa de extraer la posición de un párrafo y otros datos de un documento PDF es el complemento pdf2Data de iText 7, que también tiene una demostración en línea: https://pdf2data.online/ Tal vez esta respuesta de Stack Overflow de Alexey Subach de iText pueda ayudarte: https://stackoverflow.com/questions/55807256/how-can-i-get-the-position-of-the-specified-keyword-in-itext7 Aunque pdf2data es el enfoque óptimo, puedes hacer extracciones básicas con iText 7 Core usando una expresión regular: PdfDocument pdfDocument = new PdfDocument(new PdfReader(inputFile)); ILocationExtractionStrategy strategy = new RegexBasedLocationExtractionStrategy("expresión regular"); PdfCanvasProcessor canvasProcessor = new PdfCanvasProcessor(strategy); canvasProcessor.processPageContent(pdfDocument.getPage(1)); pdfDocument.close(); strategy.getResultantLocations(); // ahora contiene todas las ubicaciones del texto coincidente Si deseas una respuesta para tu caso específico, entonces es mejor publicar una pregunta más detallada en Stack Overflow señalando lo que has intentado y dónde estás atascado. Si tienes una licencia comercial, también tendrás acceso al soporte al cliente de iText a través de Jira. Atentamente, Kenneth Holvoet iText Software
Parece que no has iniciado sesión.
Los usuarios deben estar conectados para escribir comentarios
Iniciar Sesión
Responder