Team Leader - Nutanix Technology Champion - Nutanix NTC Storyteller

Julien DUMUR
Infrastructure in a Nutshell
nutanix centreon supervision snmp

On a tous connu ce moment de solitude. Celui où ton dashboard de supervision affiche un magnifique cercle vert pour ton cluster Nutanix, alors qu’en réalité, un des noeuds du cluster est en souffrance. C’est exactement ce qui m’est arrivé récemment.

Quand j’ai intégré Nutanix dans mon infrastructure, mon premier réflexe a été de dégainer Centreon. Pourquoi ? Parce que c’est mon couteau suisse de la supervision. Mais j’ai vite réalisé que la méthode « standard » d’ajout d’un cluster nous enferme dans une illusion de sécurité. On voit le « tout », mais on ignore le « détail ».

Dans ce retex, je vais vous partager mon expérience sur la supervision Nutanix Centreon et vous expliquer pourquoi vous devriez arrêter de monitorer uniquement votre cluster par son IP virtuelle (VIP) pour passer à une stratégie de supervision granulaire par nœud.

Pourquoi la configuration « par défaut » m’a laissé sur ma faim

Lorsqu’on installe le Plugin Pack Nutanix sur Centreon, la documentation nous guide naturellement vers l’ajout d’un hôte unique représentant le cluster.

Le fonctionnement du Plugin Pack Nutanix standard

La méthode classique consiste à interroger l’IP virtuelle (VIP) du cluster ou l’IP d’une des CVM (Controller VM). C’est simple, c’est rapide : on renseigne la communauté SNMP, on applique le template, et hop, les services remontent. On surveille alors l’usage global du CPU, la latence moyenne du stockage et l’état général déclaré par Prism.

Le problème de la « boîte noire »

C’est là que le bât blesse. En interrogeant uniquement la VIP, on interroge en réalité un agent SNMP qui agrège les données. Si vous avez un cluster de 3 nœuds, la supervision va vous dire que la mémoire à l’échelle du cluster est « OK ». Mais qu’en est-il de la charge mémoire du nœud n°3 ?

C’est ce que j’appelle l’effet « boîte noire ». L’architecture Shared Nothing de Nutanix est une force pour la résilience, mais elle peut devenir un angle mort pour la supervision si on ne descend pas au niveau de la couche physique. Pour un expert, savoir que le cluster est « Up » est insuffisant ; on a besoin de savoir quel composant physique précis nécessite une intervention avant que la redondance ne soit plus assurée.

Découpler la supervision pour une visibilité granulaire

Pour sortir de cette impasse, j’ai changé d’approche : traiter chaque nœud comme une entité propre dans Centreon. Voici comment j’ai procédé.

Étape 1 : Préparer le terrain sur Prism Element

Avant de toucher à Centreon, il faut s’assurer que Nutanix est prêt à causer. Direction Prism Element, dans les paramètres SNMP. Ici, j’ai configuré les accès SNMP v2c (ou v3 si vous voulez blinder la sécurité).

Consultez mes articles dédiés, si vous voulez des précisions sur la méthode de configuration du SNMP v2c ou du SNMP v3 sur votre cluster Nutanix.

Étape 2 : La stratégie d’ajout « Nœud par Nœud » dans Centreon

C’est ici que la magie opère. Au lieu de créer un seul hôte « Cluster-Nutanix », j’ai créé autant d’hôtes que j’ai de nœuds physiques (ex: cluster-2170_n1, cluster-2170_n2, etc.).

Configuration de l’Hôte : Chaque hôte pointe vers l’adresse IP de la VIP du cluster ou de la CVM du noeud concerné. De base, cela remontera les mêmes informations globales, mais attendez la suite.

Application des Templates : J’applique le template Virt-Nutanix-Hypervisor-Snmp-Custom.

Filtrage chirurgical : C’est ici que réside le secret. Dans les “Host check options”, j’applique la macro personnalisée FILTERNAME. Elle permet d’indiquer précisément le nom de l’hôte à superviser. Le plugin fait alors le tri dans les données SNMP envoyées par la VIP pour ne remonter que ce qui concerne mon nœud spécifique.

Étape 3 : L’astuce pour garder la cohérence du Cluster

Pour garder une vue d’ensemble, j’utilise les Host Groups dans Centreon. J’ai créé un groupe HG-Cluster-Nutanix-Prod regroupant mes 3 nœuds. Cela me permet de créer des dashboards agrégés tout en conservant la capacité de « drill-down » (cliquer pour voir le détail) sur chaque machine physique.

Les bénéfices immédiats : Dashboarding et Sérénité

Depuis que j’ai basculé sur cette configuration, mon quotidien de sysadmin a radicalement changé :

Analyse de performance granulaire : Je peux désormais identifier un nœud qui consomme anormalement plus de RAM ou de CPU que ses voisins. C’est l’outil idéal pour détecter un « hot point » ou un problème de distribution des VMs.

Réactivité accrue : Lorsqu’un problème survient, Centreon m’envoie une alerte avec le nom précis du nœud (n1, n2, etc.). Plus besoin de jouer aux devinettes dans Prism Element pour savoir où je dois accentuer mes recherches.

Historisation propre : J’ai des graphiques de métriques par serveur physique, ce qui facilite grandement le Capacity Planning ou le troubleshooting.+

Conclusion

Si vous gérez du Nutanix, ne vous contentez pas de la vue superficielle offerte par l’IP VIP seule. En prenant 10 minutes pour déclarer vos hôtes individuellement dans Centreon avec la macro FILTERNAME, vous passez d’une supervision « passive » à une véritable tour de contrôle.

Mon verdict est sans appel : la supervision par nœud est la seule façon de garantir une haute disponibilité réelle et de dormir sur vos deux oreilles.

Read More

Dans le précédent article, je vous ai expliqué comment superviser votre cluster sur Centreon en SNMP v2c.

Au travers de ce nouvel article, je vais vous expliquer comment assurer la supervision de votre cluster Nutanix sur Centreon en SNMP v3.

Pré requis

Il y a quelques pré requis a respecter afin de pouvoir ajouter son cluster Nutanix sur la solution Centreon. Voici la liste de ce dont vous avez besoin :

  • un cluster Nutanix avec des accès admin à l’interface web
  • un serveur Centreon opérationnel avec le connecteur Nutanix installé
  • un accès SSH a la VM Centreon
  • les flux doivent être ouverts dans le pare feu

Configuration du SNMP v3 sur le cluster Nutanix

Pour configurer le SNMP sur son cluster Nutanix, il faut commencer par se connecter au Prism Element puis aller dans « Settings > SNMP ». Cocher « Enable SNMP » et cliquer sur « + New Transport » pour ajouter le port 161 en UDP :

Ensuite, dans « Users » cliquer sur « New User », entrer un nom d’utilisateur ainsi qu’un couple clé privée en AES et clé d’authentification en SHA :

Dans mon cas, j’ai mis les informations suivantes car c’est uniquement a des fins de lab mais je vous conseille de renseigner des informations qui soient beaucoup plus complexes :

  • username : snmp-centreon
  • Priv Key : snmp-priv-key
  • Auth Key : snmp-auth-key

Notez bien le Username, la Priv Key et l’Auth Key, nous en aurons besoin ultérieurement. La configuration est terminée coté Nutanix, passons maintenant à la configuration coté Centreon.

Ajout du cluster Nutanix sur Centreon

Pour ajouter son cluster Nutanix sur Centreon, il faut se connecter à l’interface web de votre supervision et aller dans « Configuration > Hosts » et cliquer sur « Add » :

Sur la page qui s’affiche, il y a un premier block d’informations à remplir avec :

  • 1 : nom du cluster
  • 2 : adresse IP du cluster
  • 3 : la version 3 de SNMP
  • 4 : le serveur Centreon qui va superviser le cluster
  • 5 : le fuseau horaire associé à votre cluster
  • 6 : les templates que vous souhaitez ajouter
  • 7 : cocher « Yes » pour être sûr que tous les services associés aux templates précédemment ajoutés soient automatiquement créés

Sur la deuxième partie de la page, il y a quelques petites choses a configurer notamment l’amplitude, la fréquence des checks mais surtout le champ « SNMPEXTRAOPTIONS » qui va nous permettre de configurer les identifiants précédemment créés :

La syntaxe de la ligne de commande à entrer dans SNMPEXTRAOPTIONS est la suivante :

--snmp-username='snmp-centreon' --authprotocol='SHA' --authpassphrase='snmp-auth-key' --privprotocol='AES'--privpassphrase='snmp-priv-key'

Pensez à bien cocher la case « Password » afin de masquer les informations sensibles :

Une fois l’ensemble des informations saisies, valider afin que le nouvel hôte soit créé sur le serveur. Il faut ensuite exporter la configuration vers les pollers. Pour ce faire, cliquer en haut à gauche sur « Pollers » puis sur « Export configuration » :

Cliquer ensuite sur « Export & Reload » dans la petite fenêtre qui s’affiche :

Pour vérifier que votre hôte est bien pris en compte, rendez vous dans « Monitoring > Ressources Status », vos premiers check devraient commencer à remonter :

Si tout se passe comme prévu, vous devriez avoir toutes vos sondes au vert en quelques minutes !

Troubleshooting

Si par malheur vous avez une supervision qui ressemble à ceci :

Je vous conseille de vérifier les points suivants :

  • ouverture des flux SNMP (port 161/UDP) dans le pare-feu
  • configuration du couple AuthKey / PrivKey et du username
Read More

Effectuer une supervision constante de son cluster est la meilleure option pour s’assurer que toute fonctionne comme vous le souhaitez.

Au travers de cet article, je vais vous expliquer comment assurer la supervision de votre cluster Nutanix sur Centreon en SNMP v2c.

Pré requis

Il y a quelques pré requis a respecter afin de pouvoir ajouter son cluster Nutanix sur la solution Centreon. Voici la liste de ce dont vous avez besoin :

  • un cluster Nutanix avec des accès admin à l’interface web
  • un serveur Centreon opérationnel avec le connecteur Nutanix installé
  • un accès SSH a la VM Centreon
  • les flux doivent être ouverts dans le pare feu

Configuration du SNMP v2c sur le cluster Nutanix

Pour configurer le SNMP sur son cluster Nutanix, il faut commencer par se connecter au Prism Element puis aller dans « Settings > SNMP ». Cocher « Enable SNMP » et cliquer sur « + New Transport » pour ajouter le port 161 en UDP :

Ensuite, dans « Traps » cliquer sur « + New Trap Receiver » et renseigner les champs suivants :

  • Receiver Name : le nom que vous souhaiter attribuer à votre Receiver
  • Cocher v2c
  • Community : indiquez la communauté SNMP que vous souhaitez utiliser
  • Address : l’adresse de votre serveur Centreon
  • Port : 161
  • Transport protocol : UDP

Cliquer sur « Save » pour enregistrer la configuration.

Ajout du cluster Nutanix sur Centreon

Pour ajouter son cluster Nutanix sur Centreon, il faut se connecter à l’interface web de votre supervision et aller dans « Configuration > Hosts » et cliquer sur « Add » :

Sur la page qui s’affiche, il y a un premier block d’informations à remplir avec :

  • 1 : nom du cluster
  • 2 : adresse IP du cluster
  • 3 : la communauté que vous avez renseigné sur le trap receiver
  • 4 : la version 2c de SNMP
  • 5 : le serveur Centreon qui va superviser le cluster
  • 6 : le fuseau horaire associé à votre cluster
  • 7 : les templates que vous souhaitez ajouter
  • 8 : cocher « Yes » pour être sûr que tous les services associés aux templates précédemment ajoutés soient automatiquement créés

Sur la deuxième partie de la page, il y a quelques petites choses a configurer notamment l’amplitude et la fréquence des checks :

Une fois l’ensemble des informations saisies, valider afin que le nouvel hôte soit créé sur le serveur. Il faut ensuite exporter la configuration vers les pollers. Pour ce faire, cliquer en haut à gauche sur « Pollers » puis sur « Export configuration » :

Cliquer ensuite sur « Export & Reload » dans la petite fenêtre qui s’affiche :

Pour vérifier que votre hôte est bien pris en compte, rendez vous dans « Monitoring > Ressources Status », vos premiers check devraient commencer à remonter :

Si tout se passe comme prévu, vous devriez avoir toutes vos sondes au vert en quelques minutes !

Troubleshooting

Si par malheur vous avez une supervision qui ressemble à ceci :

Je vous conseille de vérifier les points suivants :

  • ouverture des flux SNMP (port 161/UDP) dans le pare-feu
  • configuration du Traps Receiver sur le cluster Nutanix
  • configuration de la communauté sur le serveur Centreon
Read More

Nous avons souvent besoin d’avoir des stats de ping à long terme sur certains de nos équipements qui ne supportent pas toujours le SNMP ou qui sont dans un environnement qui ne nous permet pas de mettre en place du SNMP.

Je vous explique dans cet article comment procéder à l’installation et à la configuration de Smokeping qui est alors un allié idéal pour réaliser des stats de disponibilité de ces équipements.

Voici quelques pré-requis :

  • serveur SSH installé
  • IP fixe

Tout d’abord, il faut commencer par mettre à jour le système :

sudo apt update && sudo apt upgrade

Il convient ensuite d’installer certaines dépendances :

sudo apt install rrdtool fping 

Et enfin Smokeping :

sudo apt install smokeping

Smokeping est maintenant installé, vous pouvez y accéder via l’adresse IP du serveur sur lequel il est installé.

Vous pouvez passer à la configuration des Targets en éditant le fichier Targets :

sudo vi /etc/smokeping/config.d/Targets

A l’intérieur, voici la syntaxe à respecter :

++ SEPARATEUR
menu = NOM_DU_MENU
title = TITRE_DE_LA_PAGE
host = ADRESSE_IP

Chaque élément en majuscule est à personnaliser.

Voici un exemple si je souhaite monitorer ma Freebox par exemple :

++ Freebox
menu = Freebox
title = Freebox
host = 192.168.1.1

Une fois votre fichier renseigné, vous pouvez fermer l’éditeur et redémarrer le service Smokeping :

sudo service smokeping restart

Après quelques minutes, les graphiques commenceront à apparaitre sur l’interface web.

Les métriques dans Smokeping
Read More