Dando continuidade ao problema com os agent do Telegraf, caso não tenha visto a primeira parte recomendo a leitura (vrops-cloud-proxy-agent-install-errors.html).
Apos resolvido o problema anterior ao tentar instalar novamente o agent do Telegraf foi reportado o erro abaixo:
"error connect to salt master"
Como os testes de conectividades ja havia sido executados anteriormente, iniciamos as validações dos serviços dentro da VM do cloud proxy através dos comando abaixo:
- docker ps - para checar o status do control plane:
- Caso o control plane esteja parado ou com algum erro usar o comando seguinte para restart (docker restart ucp-controlplane-saltmaster).
- docker exec -it ucp-controlplane-saltmaster bash - para conectar no container e fazer teste de conectividade com o agent do Telegraf:
- Comandos para executar no S.O que hospeda o agent do Telegraf:
- service ucp-minion status
- service ucp-telegraf status
- service ucp-salt-minion status
Todos os serviços estavam operacionais e não reportando nenhum problema, porem a instalação do agent continuava a falhar.
Realizando uma pesquisa interna e após analise dos logs, descobrimos um problema que pode ocorrer na instalação/upgrade de novos agents Telegraf quando foi realizado um upgrade no vRops (exatamente nosso caso) conforme descrito nesse link.
Basicamente o documento pede para logarmos em todos os cloud proxy do ambiente e executar o comando abaixo:
rpm-content/ucp/subsequentboot.sh
Feito isso a instalação dos agents ocorreu com sucesso em todos os S.O e tanto pela UI do vRops como por linha de comando.
Com o agent Telegraf instalado e operacional agora sim podemos iniciar a monitoração e configuração de métricas e serviços mais avançados dentro do S.O.
Espero que os posts ajudem a não sofrerem o tanto que eu sofri, pois no que tange Telegraf+vRops ainda temos muito pouco conteúdo disponível.
Quem sabe começo a colocar mais alguns exemplos aqui no futuro.