Après l’upgrade de mon cluster Nutanix vers la dernière version de la Community Edition 5.11.1.2, attaquons maintenant la partie hyperviseur…
Mon cluster tourne avec des AHV en 20190211.279 et la dernière build est la 20191030.415.
Toujours le même processus, on passe par Prism Element, Settings, puis Upgrade Software et on clique sur l’onglet Hypervisor.
On clique sur Upload a Hypervisor Binary
Je clique sur Upload now.
Ok, cela commence mal… La version des binaires ne semble pas compatible avec la version d’AOS. Enfin c’est le message en rouge dans la console Prism.
Mon deuxième réflexe après avoir râlé, fut d’éditer le fichier Json, (hypervisor metadata file) pour analyser le contenu…
Je change la version 2019.11.15 en 2019.11.22
J’avais déjà remarqué dans le Json de Prism Central une version 2019.11.15, certainement une version intermédiaire qui n’est jamais sortie…
C’est mieux… Après la modification du Json, l’upload se lance sans erreur.
Vérification… On clique sur Yes
Petit rappel concernant mon cluster, 3 nodes, 2 nodes de 32Go de RAM et 1 de 64Go qui héberge mon Prism Central (PC), PC sizé avec 32Go de RAM, impossible de faire le move de cette VM sur un autre node. L’erreur est là… Pas d’autre choix que d’éteindre le PC.
Bon, j’ai attendu longtemps, longtemps car je sais que ces upgrade peuvent mettre un temps fou, mais l’upgrade du premier node est resté bloqué sur 71% à l’étape : Installing bundle on the hypervisor
Il semble qu’il y a un souci au moment du stop de la CVM. La CVM n’étant plus joignable via SSH, je décide de passer par la console.
Je lance un CVM_shutdown -P now
Et là! Error !
Sur de la Prod, j’aurais ouvert un case ou au moins essayé de restarter les services nuta, mais sur mon lab, on va malmener un peu tout ça.
Le problème, c’est que la CVM ne redémarre pas…
En tapant la commande Virsh start NomdelaCVM
j’obtiens un message d’erreur qui m’annonce un problème avec la mémoire allouée.
En cherchant un peu sur le forum de Nutanix, je tombe sur une discussion intéressante :
J’applique le workaround proposé par Primzy,
La CVM démarre correctement et quelques minutes plus tard, l’upgrade se termine correctement. A ce stade, il me reste encore 2 nodes à mettre à jour. Wait and see…
Pour le second node, pareil, l’upgrade n’avance pas non plus, bloquée à 71%. La CVM est freezé, et est non joignable en SSH.
Je refais la même opération pour éteindre la CVM, mais contre toute attente, la CVM redémarre correctement et je constate que l’upgrade se poursuit.
Quelques minutes plus tard, c’est carrément le host qui est freezé et non joignable, je n’ai pas la possibilité de voir la console de la machine pour voir les erreurs. Je suis obligé de redémarrer le Host électriquement.
Au bout de quelques minutes, le host redémarre ainsi que la CVM et l’upgrade se termine correctement.
Le troisième et dernier node de mon cluster aura le même comportement que le deuxième, c’est-à-dire CVM freeze, puis host freeze. Et enfin impossible de démarrer la VCM pour le problème de mémoire allouée.
Il ne me reste plus qu’à rallumer mon Prism Central….
3 hosts en 20191030.425 Prism Central OK
En conclusion, cette upgrade ne s’est pas passé aussi facilement que je l’espérais mais le résultat est quand même positif. Mon cluster est à jour et je vais peut-être pouvoir faire un peu de Karbon…
A suivre….