No geral, as ferramentas do Diffbot são simples de usar e entender fora de casos de uso mais complexos. Usamos várias de suas funcionalidades para fornecer insights de conteúdo aos nossos clientes. Eu recomendaria o Diffbot a qualquer pessoa ou organização que precise extrair grandes quantidades de dados de fontes web arbitrárias.
A primeira ferramenta que usamos é o crawlbot, que apreciamos por ser configurável e extremamente capaz. Na maioria dos nossos casos de uso - só precisamos apontar para um URL e fazê-lo repetir de tempos em tempos para descobrir novo conteúdo. Após a varredura, os dados estão disponíveis através de um arquivo JSON fácil de analisar.
Também usamos a API do Knowledge Graph do Diffbot. A poderosa linguagem DQL nos permite consultar uma quantidade massiva de dados para encontrar artigos e entidades. DQL é simples de usar, e a interface GUI permite testes e iterações fáceis.
O serviço ao cliente do Diffbot também é excepcional. Nosso contato tem sido muito atencioso em nos ajudar a aprender como usar adequadamente os serviços do Diffbot para atender às nossas necessidades. Ele organizou reuniões pontuais no Zoom para nos guiar através do método apropriado para criar consultas DQL e acelerou correções de bugs necessárias para nossos casos de uso. Análise coletada por e hospedada no G2.com.
Diffbot é uma ferramenta poderosa, e com suas inúmeras capacidades, pode ser difícil para aqueles que não estão familiarizados com ela entender como usá-la corretamente. Felizmente, Diffbot oferece um excelente serviço ao cliente, que pode ajudar a orientá-lo no processo de determinar as melhores práticas para o seu caso de uso. Análise coletada por e hospedada no G2.com.
Diffbot torna a tarefa difícil de gerenciar dados e extrair informações úteis muito mais fácil. Eles fornecem acesso a uma quantidade aparentemente infinita de informações de empresas e contatos e estão continuamente melhorando sua interface de usuário para adicionar ainda mais valor. Eu uso Diffbot sempre que posso! Análise coletada por e hospedada no G2.com.
Diffbot é muito responsivo e sempre disposto a ajudar. A interface deles ainda precisa de algumas melhorias, mas sou cliente há mais de um ano e tenho visto grandes melhorias. Análise coletada por e hospedada no G2.com.
Antes de usar o Diffbot, dependíamos principalmente de feeds RSS e de uma ferramenta de web scraping que se baseia no layout visual e no HTML de uma página da web. Estávamos muito dependentes de X Paths para obter os dados que queríamos. Descobrimos que os rastreadores do Diffbot são mais estáveis a longo prazo porque não são tão impactados por mudanças no design do site. Isso nos economiza muito tempo que, de outra forma, gastaríamos em manutenção. Análise coletada por e hospedada no G2.com.
Os dois problemas que são mais desafiadores para nós são:
1. O Diffbot não reconhece documentos PDF, e frequentemente gostaríamos de ingeri-los como artigos.
2. Achamos difícil solucionar problemas de um rastreador em situações onde ele não está trazendo dados ou não está trazendo os dados que esperamos. Análise coletada por e hospedada no G2.com.
Diffbot fornece ótimas APIs, recursos técnicos e serviço geral. Seus recursos técnicos são um dos mais avançados e altamente precisos. A equipe da Diffbot mantém suas APIs atualizadas com a rápida evolução das mídias sociais. O suporte ao cliente é igualmente útil e muito amigável. Eles estão muito dispostos a trabalhar com cenários flexíveis, acomodar necessidades e orçamentos baixos para pequenos grupos de pesquisa, fornecer contas de demonstração e teste para experimentação. No geral, eles são o melhor fornecedor de dados de mídia social e empresa de análise, na minha experiência de mais de uma década. Análise coletada por e hospedada no G2.com.
Isto é mais como uma sugestão. Diffbot tem várias capacidades excelentes e estão constantemente melhorando e adicionando novos recursos. Clientes atuais e talvez potenciais também se beneficiariam de um boletim informativo semanal/mensal, ou atualizações nas redes sociais, sobre esses novos desenvolvimentos. Análise coletada por e hospedada no G2.com.
Alta precisão de detecção e tempo de atividade: na maioria das vezes, podemos enviar solicitações de API e saber que as respostas do Diffbot serão válidas. Análise coletada por e hospedada no G2.com.
Algumas versões antigas do Python são usadas (<3.0) e poderiam ser atualizadas. Análise coletada por e hospedada no G2.com.
O KG é incrivelmente abrangente. Produtos, pessoas, corporações e mais, todos interligados de forma contextual.
KG oferece uma maneira amigável de sentir que você explorou toda a web. Sem regras de raspagem personalizadas, sem necessidade de descobrir as nuances de onde a informação está armazenada online. Basta consultar e ver se o que você está procurando está na web pública.
Finalmente, os recursos de exportação são ótimos. Você pode exportar para CSV ou JSON. Acredito que também haja uma série de APIs onde você pode extrair dados sobre diferentes tipos de entidades. Análise coletada por e hospedada no G2.com.
Para consultas avançadas, você precisa aprender a linguagem de consulta do Diffbot (DQL) Análise coletada por e hospedada no G2.com.
Temos usado tanto o Knowledge Graph quanto os produtos Enhance. Usamos o Knowledge Graph para uma busca mais ampla, encontrando indivíduos com certos cargos em determinadas organizações. Em seguida, enriquecemos esses perfis com o Enhance, juntos é uma ótima configuração de pesquisa de mercado e enriquecimento de leads. Análise coletada por e hospedada no G2.com.
Não precisamos de todas as ofertas da Diffbot. (Pelo menos por enquanto.) Suas APIs e rastreador não são muito aplicáveis ao nosso caso de uso no momento. Dito isso, ver que tipo de dados bem estruturados são retornados de outros produtos da Diffbot nos faz pensar que poderíamos encontrar uma utilidade para eles no futuro. Não somos uma equipe técnica. Portanto, esse aspecto dos produtos da Diffbot não é realmente aplicável a nós... mas pelo que entendo, deveríamos ser capazes de encontrar facilmente alguém que possa nos ajudar a fazer melhor uso dos produtos mais técnicos da Diffbot. Análise coletada por e hospedada no G2.com.
Antes de usar o Diffbot, consideramos construir nosso próprio sistema de scraping. Isso nos teria custado pelo menos 4 semanas de tempo de desenvolvimento inicial e 1-2 dias de custo de manutenção mensalmente. O tempo em si é valioso, mas ainda mais ao considerar o custo de oportunidade do que esse tempo poderia ser gasto fazendo em uma startup em estágio inicial.
Após integrar o Diffbot, temos esse tempo de volta para construir nosso negócio, desenvolver recursos empolgantes para nossos clientes e expandir nossa base de clientes. A API tem sido confiável e os dados que o Diffbot está recuperando adicionam valor aos nossos clientes com cada resumo de conteúdo que é criado. Análise coletada por e hospedada no G2.com.
Sem desvantagens até agora. Estamos obtendo valor do serviço deles e recomendaríamos a qualquer pessoa que esteja procurando uma API de extração de conteúdo confiável. Análise coletada por e hospedada no G2.com.
A capacidade de aprimorar meus dados existentes. Tenho informações da empresa importadas de outras fontes, como o Crunchbase. Com um script simples no Google Sheets, consegui aprimorar as informações da empresa com coisas como habilidades dos funcionários, títulos comuns de funcionários, pilha de tecnologia utilizada e artigos recentes sobre a empresa. Como resultado, consegui priorizar melhor meus leads e rapidamente filtrar os não qualificados, economizando tempo.
A facilidade de encontrar novos leads. Posso buscar novas empresas com base em tags de indústria, tamanho de funcionários, valor de financiamento, pilha de tecnologia e habilidades dos funcionários encadeadas com lógica complexa usando uma linguagem de consulta poderosa. O número de leads de alta qualidade que encontrei através do Diffbot Knowledge Graph mais do que triplicou o número de leads de alta qualidade que encontrei de outras fontes importadas. Análise coletada por e hospedada no G2.com.
Há uma certa curva de aprendizado com a Linguagem de Consulta Diffbot se você não está acostumado a formar consultas de banco de dados. Mas a equipe de suporte deles é bastante útil, e uma vez que você resolve alguns exemplos e se acostuma a construir consultas, perceberá o quão poderosas suas buscas podem se tornar. Análise coletada por e hospedada no G2.com.
Trabalhando com apenas um engenheiro, conseguimos realizar uma integração simples em uma semana. Usamos a API do Article para expandir e melhorar algo que já estávamos fazendo internamente, mas não tínhamos os recursos necessários para justificar fazer por conta própria. A Diffbot nos permitiu terceirizar algo que não era um foco principal e usar esses recursos liberados para expandir outros aspectos de nossa infraestrutura. Análise coletada por e hospedada no G2.com.
Não muito, na verdade. Nosso representante continua nos lembrando de que estamos usando apenas uma fração do que poderíamos estar usando. Um dia desses teremos tempo para explorar algumas das APIs de gráficos de conhecimento de nível superior, um dia desses. Análise coletada por e hospedada no G2.com.
Diffbot pode aumentar fluxos de dados para MUITAS indústrias/casos de uso. Dentro do nosso, somos capazes de acompanhar menções de notícias sobre universidades (de literalmente toda a web) e enriquecer leads para divulgação. Tenho certeza de que há muito mais que poderíamos fazer com o Diffbot. Mas mesmo com esses usos, o serviço já se pagou muitas vezes. Não são necessárias muitas horas de trabalho economizadas para justificar o preço de $299... Análise coletada por e hospedada no G2.com.
Para aproveitar todo o potencial das ofertas do Diffbot, você precisa de um membro da equipe técnica. (Mas para qual serviço isso não é o caso?) Basicamente, você pode lidar com sites pré-extraídos (dos quais parecem haver milhões) com o Knowledge Graph e o Enhance. Se você quiser rastrear um site específico repetidamente, precisará pelo menos saber como fazer uma chamada de API. Análise coletada por e hospedada no G2.com.