No geral, as ferramentas do Diffbot são simples de usar e entender fora de casos de uso mais complexos. Usamos várias de suas funcionalidades para fornecer insights de conteúdo aos nossos clientes. Eu recomendaria o Diffbot a qualquer pessoa ou organização que precise extrair grandes quantidades de dados de fontes web arbitrárias.
A primeira ferramenta que usamos é o crawlbot, que apreciamos por ser configurável e extremamente capaz. Na maioria dos nossos casos de uso - só precisamos apontar para um URL e fazê-lo repetir de tempos em tempos para descobrir novo conteúdo. Após a varredura, os dados estão disponíveis através de um arquivo JSON fácil de analisar.
Também usamos a API do Knowledge Graph do Diffbot. A poderosa linguagem DQL nos permite consultar uma quantidade massiva de dados para encontrar artigos e entidades. DQL é simples de usar, e a interface GUI permite testes e iterações fáceis.
O serviço ao cliente do Diffbot também é excepcional. Nosso contato tem sido muito atencioso em nos ajudar a aprender como usar adequadamente os serviços do Diffbot para atender às nossas necessidades. Ele organizou reuniões pontuais no Zoom para nos guiar através do método apropriado para criar consultas DQL e acelerou correções de bugs necessárias para nossos casos de uso.
Diffbot torna a tarefa difícil de gerenciar dados e extrair informações úteis muito mais fácil. Eles fornecem acesso a uma quantidade aparentemente infinita de informações de empresas e contatos e estão continuamente melhorando sua interface de usuário para adicionar ainda mais valor. Eu uso Diffbot sempre que posso!
Antes de usar o Diffbot, dependíamos principalmente de feeds RSS e de uma ferramenta de web scraping que se baseia no layout visual e no HTML de uma página da web. Estávamos muito dependentes de X Paths para obter os dados que queríamos. Descobrimos que os rastreadores do Diffbot são mais estáveis a longo prazo porque não são tão impactados por mudanças no design do site. Isso nos economiza muito tempo que, de outra forma, gastaríamos em manutenção.