Notes importantes sur la mise à jour du serveur de bases de données

[Note]

Note

Cette section parle de la réinstallation des logiciels de bases de données lorsqu'une base de données est utilisée. Elle n'est pas pertinente pour l'installation initiale ou si vous n'avez pas de bases de données pour le paquet mis à jour, mais vous devriez lire cette section pour prendre connaissance des problèmes qui peuvent survenir dans le futur.

Commençons ce chapitre avec une copie d'écran d'un problème qui a vraiment eu lieu. Ce problème n'aura pas lieu si vous installez le logiciel pour la première fois :

$ sudo systemctl status postgresql
-- postgresql.service - PostgreSQL database server
     Loaded: loaded (/usr/lib/systemd/system/postgresql.service; enabled; vendor preset: enabled)
     Active: failed (Result: exit-code) since Tue 2021-10-26 17:11:53 CDT; 2min 49s ago
    Process: 17336 ExecStart=/usr/bin/pg_ctl -s -D ${PGROOT}/data start -w -t 120 (code=exited, status=1/FAILURE)
        CPU: 7ms

Oct 26 17:11:53 SVRNAME systemd[1]: Starting PostgreSQL database server...
Oct 26 17:11:53 SRVNAME postgres[17338]: 2021-10-26 17:11:53.420 CDT [17338] FATAL:
                database files are incompatible with server
Oct 26 17:11:53 SRVNAME postgres[17338]: 2021-10-26 17:11:53.420 CDT [17338] DETAIL:
                The data directory was initialized by PostgreSQL version 13,
                which is not compatible with this version 14.0.
Oct 26 17:11:53 SRVNAME postgres[17336]: pg_ctl: could not start server
Oct 26 17:11:53 SRVNAME postgres[17336]: Examine the log output.
Oct 26 17:11:53 SRVNAME systemd[1]: postgresql.service: Control process exited, code=exited, status=1/FAILURE
Oct 26 17:11:53 SRVNAME systemd[1]: postgresql.service: Failed with result 'exit-code'.
Oct 26 17:11:53 SRVNAME systemd[1]: Failed to start PostgreSQL database server.

Pour éviter ce genre de situation où votre serveur de bases de données refuse de démarrer, lisez les réflexions suivantes à propos de la mise à jour d'un DBMS (système de gestion de bases de données) avant d'effectuer la mise à jour.

La cause principale du problème ci-dessus était la mise à jour du serveur vers une nouvelle version majeur et les fichiers de données qui n'ont pas été mis à jour. L'administrateur a réussi à corriger le problème sans perdre de données.

Même si vous effectuez une installation de DBMS initiale, lisez cette section. Elle vous donnera des informations sur la mise en place de sauvegardes et les procédures de restauration (au moins la stratégie pour les créer) suffisantes pour vos besoins et pour la sûreté de vos données.

Mise à jour des paquets de serveurs de bases de données

Les systèmes de bases de données fonctionnent sur les fichiers qui contiennent les métadonnées de la base de données et ses données. Ces fichiers sont fortement optimisés dans leur structure interne pour être utilisés par le serveur. Lors de la mise à jour de ce serveur, le nouveau serveur peut s'attendre à un format de fichier différent que celui créé par la version précédente. Dans le meilleur des cas, le nouveau serveur peut utiliser l'ancien format—mais sans bénéficier du nouveau format qui peut permettre de meilleures performances ou d'autres améliorations. Il se peut aussi que le nouveau serveur reformate les fichiers de données automatiquement au démarrage.

Malheureusement, le cas le plus probable est que le nouveau serveur se plaigne du format obsolète et quitte. Lorsque cela se produit et que vous avez écrasé le serveur installé, vous pourriez ne plus pouvoir lire les fichiers de données et le nouveau serveur ne le fera pas non plus.

Les changements de format de fichiers arrivent en général au changement de versions majeures mais peuvent arriver à d'autres moments. Avant de mettre à jour le serveur, vérifiez dans la documentation s'il y a des changements qui nécessitent le reformatage de la base de données.

Bien sur, si vous avez des bases de données dont le contenu n'est pas facile à reconstruire, c'est toujours une bonne idée de créer des sauvegardes de votre base de données de temps en temps. Lors de la mise à jour du serveur, il est temps de créer une nouvelle sauvegarde.

Mise à jour par sauvegarde et restauration

[Note]

Note

Une sauvegarde est inutile s'il n'y a pas de processus vérifié pour restaurer les données de la sauvegarde. Lorsque vous utilisez un serveur de bases de données vous devriez non seulement créer des sauvegardes, mais vous devriez vérifier aussi que le processus que vous avez conçu pour les restaurer fonctionne correctement. Lorsque vous rencontrez un problème avec la restauration alors que vous avez un besoin urgent de vos données de sauvegarde, c'est trop tard—votre base de données est en danger.

En général, la plupart (tous?) des serveurs de bases de données fournissent des outils de base pour créer des sauvegardes de vos données. En général les sauvegardes créées avec ces outils peuvent être lues par les nouvelles versions du logiciel (avec un outil de restauration). Utiliser les anciens outils de restauration avec les nouvelles données de sauvegarde est incertain et vous ne devriez jamais supposer aveuglément que cela fonctionnera. C'est possible, mais en général ça ne marche pas.

Le plus simple pour mettre à jour vos fichiers de bases de données est de

  • Créer une sauvegarde complète de votre base de données avec les anciens outils.

    Cette étape crée une copie hors-ligne des fichiers de bases de données pour les utiliser pour l'archivage à long terme, pour la restaurer après une catastrophe ou simplement pour préparer une mise à jour. Cette sauvegarde hors-ligne consiste en une copie complète des fichiers de bases de données ou d'une sauvegarde des fichiers à un certain moment de l'histoire plus toutes les données de journal (c'est la terminologie d'Oracle®, ça s'appelle « Continuous Archiving » ou « write ahead log (WAL) » dans Postgresql) qui contiennent les informations sur les changements de données. Ce dernier prend moins de temps à créer si le logiciel de bases de données fournit ce type de journalisation car vous n'avez qu'à sauvegarder les dernier changements après la création de la dernière sauvegarde. La quantité de données à sauvegarder est bien plus faible que pour une sauvegarde complète à chaque fois.

    En terme de mise à jour du serveur, une sauvegarde complète (qui peut être utilisée pour des sauvegardes incrémentales suivantes) est recommandée, mais si la quantité de données est trop élevée, une sauvegarde incrémentale devrait être suffisante. La stratégie appropriée dépend de la quantité de données dans votre base de données (une centaine de lignes ou plusieurs centaines de téraoctets ?). Une sauvegarde complète de cette dernière n'est pas rapide (et on suppose que le système sous-jacent d'une telle base de données n'est probablement pas un système LFS). Pour être sûr et complètement protéger vos données, créez une sauvegarde des anciens binaires correspondants (et/ou leurs sources) et stockez-les avec les fichiers de données pour vous assurer qu'il y a une solution de repli si le nouveau logiciel n'est pas capable de lire les anciennes données.

  • Mettez à jour le serveur

    Pour cette étape, exécutez les instructions de construction du serveur de bases de données telles qu'elles sont montrées dans les sections suivantes parlant de DBMS comme MariaDB ou PostgreSQL. C'est-à-dire, construisez le logiciel comme d'habitude avec les instructions de BLFS.

  • Restaurez la base de données avec les nouveaux outils.

    Pour restaurer les données, vous devriez utiliser les outils du serveur nouvellement installé. Pendant la restauration, les nouveaux outils créeront ou mettront à jour les fichiers de données vers le format requis par le logiciel. On suppose que le nouveau logiciel est capable de lire les anciennes données de sauvegarde.

Comme vous avez déjà une procédure de sauvegarde (et que vous avez testé votre procédure de restauration, n'est-ce pas ?), c'est la manière la plus simple de mettre à jour puisque vous utilisez des procédures connues pour mettre à jour comme vous le faites toujours—au moins pour la sauvegarde et la restauration.

Mise à jour des fichiers de bases de données avec des outils systèmes

Certains systèmes de bases de données (par exemple Postgresql) fournissent un outil qui peut reformater (mettre à jour) les fichiers de bases de données existants vers le nouveau format. Comme l'outil de mise à jour doit être utilisé avec le nouveau serveur (l'ancien ne peut pas connaitre le nouveau format), l'ancien logiciel peut être écrasé par l'installation du nouveau.

Si vous devez restaurer une sauvegarde (par exemple, l'outil de mise à jour a échoué) vous devrez réinstaller l'ancienne version pour récupérer l'accès à vos données.

Même si ces outils peuvent fonctionner avec l'un des fichiers de bases de données, vous devriez créer une sauvegarde complète avant de les lancer. Un échec peut occasionner de sérieux dommages à vos fichiers de bases de données.

Remarque pour des DBMS spécifiques

PostgreSQL

Documentation en amont pour la sauvegarde et la restauration : https://www.postgresql.org/docs/current/backup.html

MariaDB

Documentation en amont pour la sauvegarde et la restauration : https://mariadb.com/kb/en/backup-and-restore-overview/

Sqlite

Ne sous-estimez pas Sqlite. C'est un DBMS riche en fonctionnalités. La différence majeure par rapport aux deux grands concurrents plus haut est que Sqlite ne fournit pas d'accès par une API en réseau. Les bases de données Sqlite sont des fichiers stockés sur la même machine que le programme qui l'utilise. La manipulation de données se fait par des appels API vers des bibliothèques directement dans le programme.

Dans la documentation en amont, vous pourriez trouver que ceci est utile :

La documentation de l'outil en ligne de commande sqlite3 : https://www.sqlite.org/cli.html

La documentation des appels API de sauvegarde : https://www.sqlite.org/backup.html

Malheureusement, il n'y a pas de chapitre dédié dans la documentation en amont sur la sauvegarde et la restauration, mais il y a plusieurs articles à ce sujet sur internet. Voici un exemple plus bas.

Documentation pour la sauvegarde et la restauration : https://database.guide/backup-sqlite-database/

Berkeley DB

Comme Sqlite ce logiciel agit sur des fichiers de bases de données locaux ce qui signifie qu'il n'y a pas d'interface en réseau.

Les ressources intéressantes pour la sauvegarde et la restauration des bases de données Berkeley sont les pages de manuel de db_dump et de sa contre-partie db_load.

Last updated on