Como faço para extrair a posição do parágrafo? Da mesma forma que extraímos as posições em documentos do Word.

Question

PV

Praveen kumar V.

•

mais de 4 anos atrás

--

Como faço para extrair a posição do parágrafo? Da mesma forma que extraímos as posições em documentos do Word.

Other Integrated Development Environments (IDE)

1 comentário

1

Parece que você não está logado.

Os usuários precisam estar logados para responder perguntas

Entrar

Kenneth H. • quase 4 anos atrás · Answer 1 · 2021-09-23T06:04:08-05:00

Olá Praveen, A maneira mais poderosa de extrair a posição de um parágrafo e outros dados de um documento PDF é o complemento pdf2Data do iText 7, que também possui uma demonstração online: https://pdf2data.online/ Talvez esta resposta no Stack Overflow por Alexey Subach do iText possa te ajudar: https://stackoverflow.com/questions/55807256/how-can-i-get-the-position-of-the-specified-keyword-in-itext7 Enquanto o pdf2data é a abordagem ideal, você pode fazer extrações básicas com o iText 7 Core usando uma expressão regular: PdfDocument pdfDocument = new PdfDocument(new PdfReader(inputFile)); ILocationExtractionStrategy strategy = new RegexBasedLocationExtractionStrategy("expressão regular"); PdfCanvasProcessor canvasProcessor = new PdfCanvasProcessor(strategy); canvasProcessor.processPageContent(pdfDocument.getPage(1)); pdfDocument.close(); strategy.getResultantLocations(); // agora contém todas as localizações do texto correspondente Se você tiver uma licença comercial, também terá acesso ao suporte ao cliente do iText via Jira. Atenciosamente, Kenneth Holvoet iText Software

Como faço para extrair a posição do parágrafo? Da mesma forma que extraímos as posições em documentos do Word.

Discussões Relacionadas

Egi R.

alwaleed a.

Praveen kumar V.