En general, las herramientas de Diffbot son simples de usar y entender fuera de casos de uso más complejos. Usamos varias de sus características para ofrecer información sobre contenido a nuestros clientes. Recomendaría Diffbot a cualquier persona u organización que necesite extraer grandes cantidades de datos de fuentes web arbitrarias.
La primera herramienta que usamos es el crawlbot, que apreciamos por ser configurable y extremadamente capaz. En la mayoría de nuestros casos de uso, solo necesitamos apuntar a una URL y hacer que se repita cada cierto tiempo para descubrir nuevo contenido. Después del rastreo, los datos están disponibles a través de un archivo JSON fácil de analizar.
También usamos la API del Knowledge Graph de Diffbot. El poderoso lenguaje DQL nos permite consultar una gran cantidad de datos para encontrar artículos y entidades. DQL es simple de usar, y la interfaz GUI permite pruebas e iteraciones fáciles.
El servicio al cliente de Diffbot también es excepcional. Nuestro contacto ha sido muy atento en ayudarnos a aprender cómo usar adecuadamente los servicios de Diffbot para satisfacer nuestras necesidades. Ha organizado reuniones puntuales por Zoom para guiarnos en el método adecuado para crear consultas DQL y ha acelerado las correcciones de errores necesarias para nuestros casos de uso. Reseña recopilada por y alojada en G2.com.
Diffbot es una herramienta poderosa, y con sus numerosas capacidades, puede ser difícil para aquellos que no están familiarizados con ella entender cómo usarla correctamente. Afortunadamente, Diffbot ofrece un excelente servicio al cliente, que puede ayudar a guiarte a través del proceso de determinar las mejores prácticas para tu caso de uso. Reseña recopilada por y alojada en G2.com.
Diffbot hace que la difícil tarea de gestionar datos y extraer información útil sea mucho más fácil. Proporcionan acceso a una cantidad aparentemente infinita de información de empresas y contactos y están mejorando continuamente su interfaz de usuario para añadir aún más valor. ¡Uso Diffbot cada vez que puedo! Reseña recopilada por y alojada en G2.com.
Diffbot es muy receptivo y siempre dispuesto a ayudar. Su interfaz aún necesita algunas mejoras, pero he sido su cliente durante más de un año y he visto grandes mejoras. Reseña recopilada por y alojada en G2.com.
Antes de usar Diffbot, dependíamos principalmente de los feeds RSS y de una herramienta de web scraping que se basa en el diseño visual y el HTML de una página web. Dependíamos mucho de los X Paths para obtener los datos que queríamos. Encontramos que los rastreadores de Diffbot son más estables a largo plazo porque no se ven tan afectados por los cambios en el diseño de los sitios web. Esto nos ahorra mucho tiempo que de otro modo estaríamos gastando en mantenimiento. Reseña recopilada por y alojada en G2.com.
Los dos problemas que son más desafiantes para nosotros son:
1. Diffbot no reconoce documentos PDF, y con frecuencia nos gustaría ingerirlos como artículos.
2. Nos resulta difícil solucionar problemas con un rastreador en situaciones donde no está trayendo datos o no está trayendo los datos que esperamos. Reseña recopilada por y alojada en G2.com.
Diffbot proporciona excelentes APIs, recursos técnicos y servicio en general. Sus recursos técnicos son de los más avanzados y altamente precisos. El equipo de Diffbot mantiene sus APIs actualizadas con la rápida evolución de las redes sociales. El soporte al cliente es igualmente útil y muy amigable. Son muy dispuestos a trabajar con escenarios flexibles, acomodar necesidades y presupuestos bajos para pequeños grupos de investigación, proporcionar cuentas de demostración y prueba para experimentar. En general, son el mejor proveedor de datos de redes sociales y empresa de análisis, en mi experiencia de más de una década. Reseña recopilada por y alojada en G2.com.
Esto es más como una sugerencia. Diffbot tiene varias capacidades excelentes y están mejorando constantemente y añadiendo nuevas características. Los clientes actuales y quizás los potenciales también se beneficiarían de un boletín semanal/mensual, o actualizaciones en redes sociales, sobre estos nuevos desarrollos. Reseña recopilada por y alojada en G2.com.
Alta precisión de detección y tiempo de actividad: la mayoría de las veces podemos enviar solicitudes de API y saber que las respuestas de Diffbot serán válidas. Reseña recopilada por y alojada en G2.com.
Algunas versiones antiguas de Python se utilizan (<3.0) y podrían actualizarse. Reseña recopilada por y alojada en G2.com.
El KG es increíblemente completo. Productos, personas, corporaciones y más, todos vinculados de manera contextual.
KG ofrece una forma fácil de usar que te hace sentir como si hubieras rastreado toda la web. No hay reglas de rastreo personalizadas, no hay necesidad de averiguar las sutilezas de dónde se encuentra la información en línea. Simplemente consulta y ve si lo que buscas está en la web pública.
Finalmente, las funciones de exportación son excelentes. Puedes exportar a CSV o JSON. Creo que también hay una serie de APIs donde puedes extraer datos sobre diferentes tipos de entidades. Reseña recopilada por y alojada en G2.com.
Para consultas avanzadas, sí tienes que aprender el lenguaje de consulta de Diffbot (DQL) Reseña recopilada por y alojada en G2.com.
Hemos estado utilizando tanto el Knowledge Graph como los productos Enhance. Usamos el Knowledge Graph para una búsqueda más amplia, encontrando individuos con ciertos títulos de trabajo en ciertas organizaciones. Luego enriquecemos esos perfiles con Enhance, juntos es una excelente configuración de investigación de mercado y enriquecimiento de leads. Reseña recopilada por y alojada en G2.com.
No necesitamos todas las ofertas de Diffbot. (Al menos por ahora.) Sus APIs y rastreador no son muy aplicables a nuestro caso de uso en este momento. Dicho esto, ver qué tipo de datos bien formados se devuelven de otros productos de Diffbot nos hace pensar que podríamos encontrarles un uso en el futuro. No somos un equipo técnico. Así que este aspecto de los productos de Diffbot no es realmente aplicable para nosotros... pero por lo que entiendo, deberíamos poder encontrar fácilmente a una persona que pueda ayudarnos a hacer un mejor uso de los productos más técnicos de Diffbot. Reseña recopilada por y alojada en G2.com.
Antes de usar Diffbot, consideramos construir nuestro propio sistema de scraping. Esto nos habría costado al menos 4 semanas de tiempo de desarrollo inicialmente y 1-2 días de costo de mantenimiento mensualmente. El tiempo en sí mismo es valioso, pero aún más al considerar el costo de oportunidad de lo que ese tiempo podría invertirse en hacer en una startup en etapa temprana.
Después de integrar Diffbot, tenemos ese tiempo de vuelta para construir nuestro negocio, desarrollar características emocionantes para nuestros clientes y hacer crecer nuestra base de clientes. La API ha sido confiable y los datos que Diffbot está recuperando añaden valor a nuestros clientes con cada resumen de contenido que se crea. Reseña recopilada por y alojada en G2.com.
Hasta ahora, no hay inconvenientes. Estamos obteniendo valor de su servicio y lo recomendaríamos a cualquiera que busque una API de extracción de contenido confiable. Reseña recopilada por y alojada en G2.com.
La capacidad de mejorar mis datos existentes. Tengo información de la empresa importada de otras fuentes como Crunchbase. Con un simple script en Google Sheets, pude mejorar la información de la empresa con cosas como habilidades de los empleados, títulos comunes de empleados, pila de tecnología utilizada y artículos recientes sobre la empresa. Como resultado, pude priorizar mejor mis prospectos y filtrar rápidamente los no calificados, ahorrándome tiempo.
La facilidad de encontrar nuevos prospectos. Puedo buscar nuevas empresas basándome en etiquetas de industria, tamaño de empleados, cantidad de financiamiento, pila de tecnología y habilidades de los empleados encadenadas con lógica compleja usando un lenguaje de consulta poderoso. El número de prospectos de alta calidad que encontré a través del Diffbot Knowledge Graph más que triplicó el número de prospectos de alta calidad que encontré de otras fuentes importadas. Reseña recopilada por y alojada en G2.com.
Hay una pequeña curva de aprendizaje con el Lenguaje de Consulta de Diffbot si no estás acostumbrado a formar consultas de bases de datos. Pero su equipo de soporte es bastante útil, y una vez que resuelves algunos ejemplos y te acostumbras a construir consultas, te darás cuenta de lo poderosas que pueden llegar a ser tus búsquedas. Reseña recopilada por y alojada en G2.com.
Trabajando con solo un ingeniero, pudimos lograr una integración simple en una semana. Usamos la API de Artículos para escalar y mejorar algo que ya habíamos estado haciendo internamente, pero no teníamos los recursos necesarios para justificar hacerlo por nuestra cuenta. Diffbot nos permitió externalizar algo que no era un enfoque central y usar esos recursos liberados para escalar otros aspectos de nuestra infraestructura. Reseña recopilada por y alojada en G2.com.
No mucho realmente. Nuestro representante sigue recordándonos que solo estamos usando una fracción de lo que podríamos estar usando. Uno de estos días tendremos tiempo para explorar algunas de las API de gráficos de conocimiento de nivel superior, uno de estos días. Reseña recopilada por y alojada en G2.com.
Diffbot puede aumentar los flujos de datos para MUCHAS industrias/casos de uso. Dentro de los nuestros, podemos hacer un seguimiento de las menciones en noticias sobre universidades (de literalmente toda la web) y enriquecer los contactos para el alcance. Estoy seguro de que hay mucho más que podríamos estar haciendo con Diffbot. Pero incluso con esos usos, el servicio se ha pagado a sí mismo muchas veces. No se necesitan muchas horas de trabajo ahorradas para justificar el precio de $299... Reseña recopilada por y alojada en G2.com.
Para aprovechar al máximo el poder de las ofertas de Diffbot, necesitas un miembro del equipo técnico. Básicamente, puedes tratar con sitios pre-extraídos (de los cuales parece haber millones) con el Knowledge Graph y Enhance. Si deseas rastrear un sitio específico repetidamente, al menos necesitarás saber cómo hacer una llamada a la API. Reseña recopilada por y alojada en G2.com.