Ao avaliar as duas soluções, os revisores acharam Azure Data Factory mais fácil de usar, configurar e administrar. Também preferiram fazer negócios com Azure Data Factory em geral.
O Data Pipeline se integra muito bem com o EMR, e é fácil implantar pipelines via CloudFormation, tornando a automação possível. Nós o usamos para gerenciar fluxos de trabalho complexos de map-reduce e geralmente funciona de forma bastante suave.
Realmente deveria ser redesenhado, pois um blob JSON é uma maneira terrível de organizar trabalhos SQL. Por que as coisas não podem ser agendadas como um calendário ou solicitação de reunião?
As melhores características, de acordo comigo, são Integração de Dados Híbridos, Movimento de Dados, Orquestração e Agendamento e Integração com outros Serviços Azure.
Às vezes, torna-se difícil compreender os erros devido aos quais o pipeline de dados falha. Mesmo após procurar na internet, isso não ajuda, então talvez a mensagem de erro possa ser melhorada, o que ajuda os usuários a compreender e resolver facilmente.
O Data Pipeline se integra muito bem com o EMR, e é fácil implantar pipelines via CloudFormation, tornando a automação possível. Nós o usamos para gerenciar fluxos de trabalho complexos de map-reduce e geralmente funciona de forma bastante suave.
As melhores características, de acordo comigo, são Integração de Dados Híbridos, Movimento de Dados, Orquestração e Agendamento e Integração com outros Serviços Azure.
Realmente deveria ser redesenhado, pois um blob JSON é uma maneira terrível de organizar trabalhos SQL. Por que as coisas não podem ser agendadas como um calendário ou solicitação de reunião?
Às vezes, torna-se difícil compreender os erros devido aos quais o pipeline de dados falha. Mesmo após procurar na internet, isso não ajuda, então talvez a mensagem de erro possa ser melhorada, o que ajuda os usuários a compreender e resolver facilmente.