Maintenance
L’environnement CLOUD nécessite un suivit régulier pour assurer le bon fonctionnement de la plateforme dans le temps.
On retrouve trois types de maintenance : la maintenance non maitrisé, la maintenance réguliere et la maintenance évènementiel.
Maintenance non maîtrisé
La maintenance non maitrisé correspond aux maintenances des composants que nous ne pouvons pas maitriser (Portail Web Scaleway Element / Firebase / Brevo / Serveur de notification Google & Apple / Serveur DNS / Autorité de certification (Let’s enscrypt)).
La maintenance de ces composants peut rendre le CLOUD totalement ou partiellement temporairement inutilisable.
Voici les risques par composant :
- Portail Web Scaleway Element, administration des instances CLOUD impossible
- Firebase : Notification PUSH ne seront pas envoyés
- Brevo : Les emails ne seront pas envoyés
- Serveur de notification Google & Apple : Notification PUSH ne seront pas envoyés
- Serveur DNS : La résolution DNS ne fonctionnera plus
- Autorité de certification (Let’s enscrypt) : La mise à jour du certificat Let’s enscrypt sera impossible
Maintenance Régulière
La maintenance régulière correspond à des tâches à effectués hebdomadaire mensuellement ou annuellement
| Libelle | Recurrence | action |
|---|---|---|
| Suivie de l'évolution des produits Scaleway - Instance BACKEND | Mensuel | Manuelle |
| Suivie de l'évolution des produits Scaleway - Base de données Managée | Mensuel | Manuelle |
| Backend - Mise à jour de sécurité (OS / PHP / NGINX) | Mensuel | Manuelle |
| Backend - Mise à jour de sécurité (Symfony et ses dépendances) | Mensuel | Manuelle |
| Backend - Monté de version LTS (Symfony) | Annuel | Manuelle |
| Backend - Monté de version LTS (Ubuntu Server) | Annuel | Manuelle |
| Backup de la base de donnée | Hebdomadaire | Automatique |
Maintenance Événementiel
La maintenance évènementiel correspond à des tâches à effectués lorsque des évènements se produise.
| Libelle | Déclanché par ? |
|---|---|
| Déploiement d’une nouvelle version ou d’un correctif de l'APPWEB | Validation d’une version de recette par équipe projet (Tyllt / Feelity) |
| Analyse d’un arrêt de service et programmer une intervention si besoin | Alerte UptimeRobot |
| Analyse de l’alerte et programmer une intervention si besoin (Exemple : Plus de RAM sur le serveur BACKEND) | Alerte Grafana |
| Analyse de l’alerte et programmer une intervention si besoin (Exemple : Dépréciation d’un service) | Alerte Scaleway |
| Analyse de l’alerte et programmer une intervention | Alerte 500 Bundle Symfony |
| Analyse de l’alerte et programmer une intervention | Alerte expiration certificat let’s enscrypt (Envoyé à bcatinot@feelity.fr) |
Détail des alertes
Alerte uptimeRobot
Des alertes sont envoyé par email et sur notre chaine d’infogérance Slack lorsqu’un des composants (Reseau MQTT / Base de donnée / instance backend 1 / instance backend 2 / load balancer) n’est plus accessible.
Alerte Grafana
L'outils permet de monitorer les surchages réseaux / CPU / RAM / Stockage des instances backend. Des alertes sont envoyé par email et sur notre chaine d’infogérance Slack lorsqu’un dysfonctionnement ce produit.
Alerte 500 Bundle Symfony
Suivis des erreurs critique de fonctionnement du backend via un bundle symfony maison. Il envoit une alertes sur notre chaine d’infogérance Slack lorsqu’un dysfonctionnement ce produit.