A precisão do OCR depende da qualidade do documento. Para documentos não estruturados, as ferramentas de OCR integradas (do Google, Microsoft) são bastante aceitáveis. Para documentos semiestruturados (faturas, recibos e extratos bancários), estamos trabalhando com as ferramentas Abbyy FlexiCapture. Para cada tipo de documento, é possível definir um layout para os dados que devem ser extraídos usando o Abbyy FlexiLayout. Este layout é então usado no Abbyy FC Document Definition para testar a extração. Isso gerará o chamado .fcdot que pode ser integrado em fluxos de trabalho do UIPath usando o pacote Abbyy Intelligent OCR. Desta forma, a extração é muito precisa e a automação funciona de forma excelente. Ainda assim, o nível de confiança deve ser definido no Abbyy FC. Em caso de quaisquer incertezas, o UIPath aciona a estação de verificação Abbyy. É possível extrair dados não apenas de arquivos pdf, mas também de .tiff, .png e .jpg. Ainda assim, para usar o pacote Abbyy Intelligent OCR é obrigatório usar o Abbyy FC Engine. Isso é licenciado separadamente pelo UIPath diretamente e não pela Abbyy. Uma última recomendação: Use o Abbyy FC Standalone em vez do Abbyy FC Distributed. É obrigatório usar a integração nas atividades do UIPath para os arquivos .fcdot.
A precisão do OCR depende da qualidade do documento. Para documentos não estruturados, as ferramentas de OCR incorporadas (do Google, Microsoft) são bastante aceitáveis. Para documentos semiestruturados (faturas, recibos e extratos bancários), estamos trabalhando com ferramentas Abbyy FlexiCapture. Para cada tipo de documento, é possível definir um layout para os dados que devem ser extraídos usando o Abbyy FlexiLayout. Este layout é então usado no Abbyy FC Document Definition para testar a extração. Isso gerará o chamado .fcdot que pode ser integrado em fluxos de trabalho do UIPath usando o pacote Abbyy Intelligent OCR. Desta forma, a extração é muito precisa e a automação funciona de forma excelente. Ainda assim, o nível de confiança deve ser definido no Abbyy FC. Em caso de quaisquer incertezas, o UIPath aciona a estação de verificação Abbyy. É possível extrair dados não apenas de arquivos pdf, mas também de .tiff, .png e .jpg. Ainda assim, para usar o pacote Abbyy Intelligent OCR é obrigatório usar o Abbyy FC Engine. Isso é licenciado separadamente pelo UIPath diretamente e não pela Abbyy. Uma última recomendação: Use o Abbyy FC Standalone em vez do Abbyy FC Distributed. É obrigatório usar a integração nas atividades do UIPath para os arquivos .fcdot.
Graduate Engineering Trainee at Vodafone Shared Services India
0
0
A maioria das vezes, o OCR é bastante preciso. Mas quando há textos semelhantes na tela, ele se comporta de forma ambígua. Por exemplo, se você tiver "modo-I" e "modo-II" na mesma página, ele pode se confundir entre os dois.
Depende do conteúdo que você está escaneando. Minha suposição é que, se o conteúdo estiver claro, então pode dar 100%, mas se o conteúdo estiver borrado ou manuscrito, então pode reduzir para 50%, dependendo da clareza do conteúdo.
Intelligent Automation Specialist | RPA, AI and Digital Solutions | Hackett Consulting Services
#HCS #RiseOfTheMidMarket
0
0
A UiPath utiliza muitos métodos diferentes de reconhecimento e leitura de texto, incluindo vários motores de OCR, como Microsoft e Google, todos os quais são muito confiáveis.
Os usuários precisam estar logados para escrever comentários
Entrar
Responder
Já tem UiPath Platform™ for Agentic Automation?
Sobre UiPath Platform™ for Agentic Automation
UiPath (NYSE: PATH) é um líder global em automação agente, capacitando empresas a aproveitar todo o potencial de agentes de IA para executar e otimizar autonomamente processos de negócios complexos. A
Com mais de 2,5 milhões de avaliações, podemos fornecer os detalhes específicos que ajudam você a tomar uma decisão de compra de software informada para o seu negócio. Encontrar o produto certo é importante, deixe-nos ajudar.