¿Cómo extraigo la posición del párrafo? de la misma manera que extraemos las posiciones en documentos de Word.

Question

PV

Praveen kumar V.

•

más de 4 años atrás

--

¿Cómo extraigo la posición del párrafo? de la misma manera que extraemos las posiciones en documentos de Word.

Other Integrated Development Environments (IDE)

1 comentario

1

Parece que no has iniciado sesión.

Los usuarios deben estar conectados para responder preguntas

Iniciar Sesión

Kenneth H. • casi 4 años atrás · Answer 1 · 2021-09-23T06:04:08-05:00

Hola Praveen, La forma más poderosa de extraer la posición de un párrafo y otros datos de un documento PDF es el complemento pdf2Data de iText 7, que también tiene una demostración en línea: https://pdf2data.online/ Tal vez esta respuesta de Stack Overflow de Alexey Subach de iText pueda ayudarte: https://stackoverflow.com/questions/55807256/how-can-i-get-the-position-of-the-specified-keyword-in-itext7 Aunque pdf2data es el enfoque óptimo, puedes hacer extracciones básicas con iText 7 Core usando una expresión regular: PdfDocument pdfDocument = new PdfDocument(new PdfReader(inputFile)); ILocationExtractionStrategy strategy = new RegexBasedLocationExtractionStrategy("expresión regular"); PdfCanvasProcessor canvasProcessor = new PdfCanvasProcessor(strategy); canvasProcessor.processPageContent(pdfDocument.getPage(1)); pdfDocument.close(); strategy.getResultantLocations(); // ahora contiene todas las ubicaciones del texto coincidente Si deseas una respuesta para tu caso específico, entonces es mejor publicar una pregunta más detallada en Stack Overflow señalando lo que has intentado y dónde estás atascado. Si tienes una licencia comercial, también tendrás acceso al soporte al cliente de iText a través de Jira. Atentamente, Kenneth Holvoet iText Software

¿Cómo extraigo la posición del párrafo? de la misma manera que extraemos las posiciones en documentos de Word.

Discusiones relacionadas

Egi R.

alwaleed a.

Praveen kumar V.