Introducing G2.ai, the future of software buying.Try now

Como faço para extrair a posição do parágrafo? Da mesma forma que extraímos as posições em documentos do Word.

1 comentário
Parece que você não está logado.
Os usuários precisam estar logados para responder perguntas
Entrar
KH
0
Olá Praveen, A maneira mais poderosa de extrair a posição de um parágrafo e outros dados de um documento PDF é o complemento pdf2Data do iText 7, que também possui uma demonstração online: https://pdf2data.online/ Talvez esta resposta no Stack Overflow por Alexey Subach do iText possa te ajudar: https://stackoverflow.com/questions/55807256/how-can-i-get-the-position-of-the-specified-keyword-in-itext7 Enquanto o pdf2data é a abordagem ideal, você pode fazer extrações básicas com o iText 7 Core usando uma expressão regular: PdfDocument pdfDocument = new PdfDocument(new PdfReader(inputFile)); ILocationExtractionStrategy strategy = new RegexBasedLocationExtractionStrategy("expressão regular"); PdfCanvasProcessor canvasProcessor = new PdfCanvasProcessor(strategy); canvasProcessor.processPageContent(pdfDocument.getPage(1)); pdfDocument.close(); strategy.getResultantLocations(); // agora contém todas as localizações do texto correspondente Se você tiver uma licença comercial, também terá acesso ao suporte ao cliente do iText via Jira. Atenciosamente, Kenneth Holvoet iText Software
Parece que você não está logado.
Os usuários precisam estar logados para escrever comentários
Entrar
Responder