[NUTANIX] AHV Community Edition update to build 20191030.415

Après l’upgrade de mon cluster Nutanix vers la dernière version de la Community Edition 5.11.1.2, attaquons maintenant la partie hyperviseur…

Mon cluster tourne avec des AHV en 20190211.279 et la dernière build est la 20191030.415.

Toujours le même processus, on passe par Prism Element, Settings, puis Upgrade Software et on clique sur l’onglet Hypervisor.

On clique sur Upload a Hypervisor Binary

Attention, les fichiers téléchargés ont une mauvaise extension tar.tar, il faut les renommer en tar.gz pour que Prism Element les accepte.

Je clique sur Upload now.

Ok, cela commence mal… La version des binaires ne semble pas compatible avec la version d’AOS. Enfin c’est le message en rouge dans la console Prism.

Mon deuxième réflexe après avoir râlé, fut d’éditer le fichier Json, (hypervisor metadata file) pour analyser le contenu…

Surprise… La version d’AOS attendue est la 2019.11.15 alors que nous venons de pousser la version 2019.11.22… OK pas de souci, on va changer cela dans le fichier Json.

Je change la version 2019.11.15 en 2019.11.22

J’avais déjà remarqué dans le Json de Prism Central une version 2019.11.15, certainement une version intermédiaire qui n’est jamais sortie…

C’est mieux… Après la modification du Json, l’upload se lance sans erreur.

Allez, on continue le processus, on clique sur Upgrade.

Vérification… On clique sur Yes

L’upgrade est lancé.
Boom, Error, mais pourquoi ??? OK, j’ai compris…

Petit rappel concernant mon cluster, 3 nodes, 2 nodes de 32Go de RAM et 1 de 64Go qui héberge mon Prism Central (PC), PC sizé avec 32Go de RAM, impossible de faire le move de cette VM sur un autre node. L’erreur est là… Pas d’autre choix que d’éteindre le PC.

Les mises à jour sont en cours…

Bon, j’ai attendu longtemps, longtemps car je sais que ces upgrade peuvent mettre un temps fou, mais l’upgrade du premier node est resté bloqué sur 71% à l’étape : Installing bundle on the hypervisor

Il semble qu’il y a un souci au moment du stop de la CVM. La CVM n’étant plus joignable via SSH, je décide de passer par la console.

Freeze total…mais j’arrive quand même a me loguer en Root.

Je lance un CVM_shutdown -P now

Et là! Error !

Ok, on va passer par le host en ssh.

Sur de la Prod, j’aurais ouvert un case ou au moins essayé de restarter les services nuta, mais sur mon lab, on va malmener un peu tout ça.

Virsh shutdown NomdelaCVM
La CVM s’arrête.
Elle a fini par s’éteindre

Le problème, c’est que la CVM ne redémarre pas…

En tapant la commande Virsh start NomdelaCVM

j’obtiens un message d’erreur qui m’annonce un problème avec la mémoire allouée.

En cherchant un peu sur le forum de Nutanix, je tombe sur une discussion intéressante :

https://next.nutanix.com/discussion-forum-14/solution-for-hypervisor-upgrade-stuck-on-version-5-11-1-2-2019-11-22-33818

J’applique le workaround proposé par Primzy,

La CVM démarre correctement et quelques minutes plus tard, l’upgrade se termine correctement. A ce stade, il me reste encore 2 nodes à mettre à jour. Wait and see…


Pour le second node, pareil, l’upgrade n’avance pas non plus, bloquée à 71%. La CVM est freezé, et est non joignable en SSH.

Je refais la même opération pour éteindre la CVM, mais contre toute attente, la CVM redémarre correctement et je constate que l’upgrade se poursuit.

Quelques minutes plus tard, c’est carrément le host qui est freezé et non joignable, je n’ai pas la possibilité de voir la console de la machine pour voir les erreurs. Je suis obligé de redémarrer le Host électriquement.

Au bout de quelques minutes, le host redémarre ainsi que la CVM et l’upgrade se termine correctement.

Le troisième et dernier node de mon cluster aura le même comportement que le deuxième, c’est-à-dire CVM freeze, puis host freeze. Et enfin impossible de démarrer la VCM pour le problème de mémoire allouée.

La mise à jour du cluster est terminée.

Il ne me reste plus qu’à rallumer mon Prism Central….

3 hosts en 20191030.425 Prism Central OK

En conclusion, cette upgrade ne s’est pas passé aussi facilement que je l’espérais mais le résultat est quand même positif. Mon cluster est à jour et je vais peut-être pouvoir faire un peu de Karbon…

A suivre….

fgagne Auteur