2021 é o ano de crescimento no espaço de software. À medida que mais e mais empresas estão voltando ao normal, muitas estão lutando para gerenciar sua complexa infraestrutura de TI com a crescente demanda.
Os clientes hoje querem uma interação online rápida e confiável. No meu artigo anterior, falei sobre a importância do desempenho do site e como as empresas estão usando software de monitoramento de sites para melhorar as métricas de desempenho — mas os sistemas de TI modernos são muito mais do que apenas sites.
No ambiente de TI de hoje, a maioria das organizações opera em ambientes multicloud que utilizam uma ampla variedade de tecnologias, como microsserviços, big data, aplicativos móveis, plugins de terceiros, e assim por diante. As equipes de TI lutam para gerenciar todas essas tecnologias, então muitas delas compraram uma dúzia de soluções de monitoramento, na esperança de capturar tudo o que está acontecendo em sua infraestrutura de TI. No entanto, com isso, surge uma nova questão: como gerenciar todas essas soluções de monitoramento?
Uma resposta popular é a inteligência artificial para operações de TI (AIOps), que analisa todo o feedback do software de monitoramento e agiliza um processo automático para a equipe de TI corrigir o problema raiz. Agora temos uma IA avançada que pode lidar com tudo para nós. Será que esse sonho pode se tornar realidade? Vamos dar uma olhada em como o AIOps se encaixa atualmente no grande esquema da infraestrutura de TI hoje.
Como o AIOps se encaixa no ambiente de TI de uma organização?
O que são Plataformas AIOps?
AIOps usa IA ou aprendizado de máquina para analisar grandes volumes de dados em uma variedade de sistemas. Plataformas AIOps aceleram a identificação e resolução de problemas aumentando a precisão da análise de causa raiz (RCA) e a identificação proativa, o que reduz o tempo de resolução e ajuda a melhorar a adesão ao acordo de nível de serviço (SLA). Todas as equipes de TI podem aproveitar os benefícios que as plataformas AIOps oferecem.
O AIOps monitora logs de software de monitoramento. Uma vez que o software de monitoramento detecta uma irregularidade ou problema, o AIOps rastreia o problema onde a transação ocorreu com análise de logs e monitoramento. Em seguida, alerta a equipe de TI via soluções de gerenciamento de incidentes e service desk para que possam corrigir quaisquer problemas. Este processo pode mudar com base nas soluções utilizadas, mas a ideia central é a mesma: as plataformas AIOps integram essas funcionalidades diretamente na plataforma para consolidar recursos de solução de problemas. Em vez de ter toda uma equipe de TI gerenciando cada solução, o AIOps cuida da maior parte do trabalho e libera recursos de TI para outras prioridades estratégicas.
Esta é uma grande tendência agora porque, no G2, o tráfego para a categoria de software de Plataformas AIOps aumentou significativamente nos últimos meses. Há um crescimento de cerca de 200% de visitantes únicos no tráfego da web da categoria Plataformas AIOps do G2 desde maio passado. Em fevereiro de 2021, a categoria viu um aumento de 600% no tráfego, o que pode ser atribuído a eventos do setor.
Como fazer o AIOps funcionar?
O AIOps requer muito mais tempo e consideração para acertar do que muitas empresas pensam. Não é uma solução definitiva que pode ser implementada uma vez e depois esquecida. Requer gerenciamento constante para entregar sua funcionalidade completa. Existem duas considerações a serem observadas para estar preparado para os desafios e entregas.
Gestão de equipe: alinhando objetivos com todas as partes interessadas
Surpreendentemente, um dos desafios mais difíceis de usar o AIOps não está no lado técnico. A gestão e a comunicação determinarão quão bem-sucedido será o programa AIOps. Uma solução AIOps completa muda a forma como a equipe de desenvolvimento, a equipe de operações, a equipe de garantia de qualidade (QA) e outras partes interessadas interagem entre si. Para que a automação funcione, cada equipe deve ser responsável por seu papel no processo e não trabalhar em silos.
Se a equipe de desenvolvimento e a equipe de operações ainda estiverem trabalhando em silos, as organizações devem considerar combiná-las em uma equipe DevOps para entrega rápida. A maioria das empresas de tecnologia já fez isso, e pode ajudar as empresas a dar uma olhada em como a Amazon, a Microsoft e o Google gerenciam seus DevOps.
A equipe DevOps deve ser totalmente treinada na solução AIOps por dois motivos: integração e usabilidade. O AIOps recebe uma grande quantidade de dados para analisar quais são os problemas. No entanto, a infraestrutura legada pode não se integrar bem, então é importante que a equipe DevOps conheça as capacidades do software AIOps. Eles podem decidir comprar software adicional de limpeza e armazenamento de dados para conectar o AIOps aos sistemas legados. O AIOps usa uma abordagem de caixa preta para identificar problemas e dar recomendações. Como o AIOps nem sempre mostra como chega à sua solução, a equipe DevOps teria que entender o software completamente para configurar regras personalizadas para insights adicionais. Caso contrário, eles não saberão o que o software está fazendo e podem estar perdendo outra peça do quebra-cabeça.
Como o AIOps automatiza a detecção de problemas e o monitoramento com IA, haverá momentos em que as equipes DevOps não entenderão por que a IA está recomendando certas soluções e seus possíveis impactos negativos. É por isso que a equipe de QA deve verificar e acompanhar.
Por fim, os KPIs e métricas para as equipes envolvidas precisam ser alterados com base na responsabilidade de cada equipe. Forçar as equipes a trabalharem juntas enquanto mantêm o KPI anterior pode distraí-las da participação total. Detectar mais anomalias pode não ser um bom objetivo em comparação com a redução de tempos de inatividade. Um novo caso de uso deve ser publicado para que todos saibam a expectativa. Isso não é apenas "outro software", é também um novo processo que todos devem seguir e que mudará suas prioridades diárias.
Gestão de custos: despesas gerais e integração
Sempre que há uma mudança de responsabilidade entre diferentes equipes, haverá muitas despesas gerais. As equipes de TI precisarão ser treinadas no novo software e em como ele pode ser integrado ao sistema legado. Elas precisam ter um entendimento completo da atual infraestrutura de TI, dos problemas que precisam ser corrigidos e dos recursos disponíveis. Uma coisa que ajuda é começar com metas menores que requerem menos recursos, o que dá tempo para as equipes praticarem antes de enfrentar problemas mais complexos. Haverá menos despesas gerais e maior ROI com essa abordagem.
Outra consideração de custo é o software complementar. Pode ser necessário comprar novo software para integrar com a solução AIOps. Monitoramento adicional, alerta de TI, data lake, e assim por diante, são necessários dependendo da infraestrutura atual e do software AIOps escolhido.
Por exemplo, se o banco de dados de gerenciamento de configuração não consegue acompanhar seus servidores em outro local, você não pode construir um mapa de dependência para seu aplicativo. Se o problema vier desse servidor, o software de monitoramento não poderá rastrear o problema até esse servidor. O AIOps não receberá nenhum feedback da solução de monitoramento. Todo o seu processo de AIOps falhou por causa disso, então é importante entender o que é necessário antes que algo dê errado. O AIOps só pode analisar o que conecta e quanto mais dados consome, mais inteligente se torna com o tempo.
Como o G2 pode ajudar
Relatórios G2 para plataformas AIOps fornecem uma tonelada de dados para compradores com base em avaliações reais de usuários de produtos AIOps. As organizações podem usar diferentes relatórios para analisar diferentes aspectos dos produtos AIOps para tomar as melhores decisões de compra.
Como mencionado acima, implantar o AIOps não é fácil. O gráfico abaixo destaca o Índice de Implementação para Plataformas AIOps — baseado em classificações reais de satisfação do usuário para uma série de perguntas de revisão relacionadas à implementação sobre o processo de configuração, taxa de adoção do usuário, tempo para entrar em operação, métodos de implementação, e assim por diante.
Em outras categorias do G2, os principais produtos geralmente têm pontuações de implementação acima de 8 e até 9, sendo a pontuação mais alta 10. No entanto, para a categoria Plataformas AIOps, muitos desses produtos têm pontuações inferiores a isso. Isso sinaliza que os clientes não estão satisfeitos com o processo de implementação. Se as organizações não prepararem suas equipes de TI e principais partes interessadas, será difícil implantar soluções AIOps para a empresa.
Quer aprender mais sobre Ferramentas de Monitoramento de Desempenho de Aplicações (APM)? Explore os produtos de Monitoramento de Desempenho de Aplicações (APM).

Tian Lin
Tian is a research analyst at G2 for Cloud Infrastructure and IT Management software. He comes from a traditional market research background from other tech companies. Combining industry knowledge and G2 data, Tian guides customers through volatile technology markets based on their needs and goals.