Tudo começa com os dados – lixo entra, lixo sai. Alguns fatores a considerar que podem ter um impacto na qualidade do modelo:
- Se houver dados que são impuros ou não confiáveis, considere removê-los do conjunto. Impuros ou não confiáveis podem significar que a maioria dos valores da coluna são nulos, alta concentração de um valor em uma única coluna (ou seja, você tem uma coluna com os valores 'vermelho', 'verde', 'azul' e 90% dos valores na coluna são 'vermelho'), valores em uma coluna são altamente únicos.
- Se a natureza dos dados que você está coletando sofreu uma mudança significativa (por exemplo, uma grande mudança de política que entra em vigor pode significar que os dados anteriores não se assemelham aos novos dados).
- Um volume maior de dados tende a produzir modelos mais confiáveis, então quaisquer pontos de dados adicionais relevantes ajudarão, sejam eles novas observações coletadas à medida que o tempo passa, ou históricos coletados de uma fonte anteriormente não explorada.
Se o seu modelo ainda não está pontuando bem, pode ser também porque as métricas que realmente têm uma relação com a Métrica prevista ainda não estão capturadas no conjunto de dados. Pode ser hora de pensar em outras coisas que possam ter um efeito na métrica prevista e ver se esses dados podem ser coletados e incluídos no conjunto de dados. Lembre-se – os algoritmos preditivos só podem identificar padrões que estão lá para serem encontrados!
Os usuários precisam estar logados para escrever comentários
Entrar
Responder
Já tem Qlik AutoML?
Sobre Qlik AutoML
O Qlik AutoML (aprendizado de máquina automatizado) traz modelos de aprendizado de máquina gerados por IA e análises preditivas diretamente para a comunidade maior de usuários e equipes de análise da
Com mais de 2,5 milhões de avaliações, podemos fornecer os detalhes específicos que ajudam você a tomar uma decisão de compra de software informada para o seu negócio. Encontrar o produto certo é importante, deixe-nos ajudar.