Ao avaliar as duas soluções, os revisores acharam Apache Sqoop mais fácil de usar, configurar e administrar. No entanto, preferiram fazer negócios com Apache NiFi em geral.
É de código aberto e com suporte da comunidade, você pode construir qualquer coisa que desejar, desde a ingestão simples de arquivos até Kafka, S3, etc... A capacidade de criar grupos de processos e isolar suas cargas de trabalho. O número de...
Rastrear a linhagem a nível de linha é importante na implementação de ingestão de data lake. A linhagem pode ser controlada a nível de linha? Desempenho de transformação em lote. Precisa de Benchmark. Pode requerer Kafka.
Ensaiar para usar, bom é segurança, e transferência rápida de dados entre a fonte e o destino.
A coisa que eu não gostei sobre o Apache Sqoop é que, uma vez que o pipeline é quebrado, é difícil recuperar mensagens perdidas.
É de código aberto e com suporte da comunidade, você pode construir qualquer coisa que desejar, desde a ingestão simples de arquivos até Kafka, S3, etc... A capacidade de criar grupos de processos e isolar suas cargas de trabalho. O número de...
Ensaiar para usar, bom é segurança, e transferência rápida de dados entre a fonte e o destino.
Rastrear a linhagem a nível de linha é importante na implementação de ingestão de data lake. A linhagem pode ser controlada a nível de linha? Desempenho de transformação em lote. Precisa de Benchmark. Pode requerer Kafka.
A coisa que eu não gostei sobre o Apache Sqoop é que, uma vez que o pipeline é quebrado, é difícil recuperar mensagens perdidas.