Investigation sur la stabilité de la plateforme Saison 3
(Rappel) Des nœuds sur nos environnements dysfonctionnent. Nous avons lancé avec les équipes OPS, SRE, Exploitation une démarche pour identifier la cause. Actions :
Création de pool de noeuds dédié pour CDTN car elle a été identifié comme potentiel root cause; le dysfonctionnement persistent donc nous allons prévoir un rollback.
Désactivation -> Réactivation d'outils Annexes
Ajout d'outil d'investigation systems
OVH s'implique de plus en plus dans l'investigation
Création de services
Mise en place de services Vault pour :
- Création et modification d'une Startup
- Pour les services de Storage-object S3
- Pour les services de bases de données Postgresql
Et pour finir, Mise en place et validation de l'opérateur qui déploiement et synchronise les secrets kube depuis vault.