Olá Praveen,
A maneira mais poderosa de extrair a posição de um parágrafo e outros dados de um documento PDF é o complemento pdf2Data do iText 7, que também possui uma demonstração online: https://pdf2data.online/
Talvez esta resposta no Stack Overflow por Alexey Subach do iText possa te ajudar: https://stackoverflow.com/questions/55807256/how-can-i-get-the-position-of-the-specified-keyword-in-itext7
Enquanto o pdf2data é a abordagem ideal, você pode fazer extrações básicas com o iText 7 Core usando uma expressão regular:
PdfDocument pdfDocument = new PdfDocument(new PdfReader(inputFile));
ILocationExtractionStrategy strategy = new RegexBasedLocationExtractionStrategy("expressão regular");
PdfCanvasProcessor canvasProcessor = new PdfCanvasProcessor(strategy);
canvasProcessor.processPageContent(pdfDocument.getPage(1));
pdfDocument.close();
strategy.getResultantLocations(); // agora contém todas as localizações do texto correspondente
Se você tiver uma licença comercial, também terá acesso ao suporte ao cliente do iText via Jira.
Atenciosamente,
Kenneth Holvoet
iText Software
Os usuários precisam estar logados para escrever comentários
Entrar
Responder
Já tem iText by Apryse?
Sobre iText by Apryse
Anteriormente conhecido como iText, agora fazemos parte da Apryse. Com tecnologia otimizada e um conjunto abrangente de ferramentas, a Apryse simplifica até os projetos mais complexos, levando você ma
Com mais de 2,5 milhões de avaliações, podemos fornecer os detalhes específicos que ajudam você a tomar uma decisão de compra de software informada para o seu negócio. Encontrar o produto certo é importante, deixe-nos ajudar.