Qu’est-ce que la migration des données et comment y parvenir ?
Publié: 2023-12-14On sait depuis longtemps que les données constituent l’un des atouts les plus importants, sinon le plus important, de toute entreprise ou organisation. Ce message n’est pas nouveau et n’a guère besoin d’être approfondi, car de plus en plus d’organisations, grandes et petites, prennent conscience de la véritable valeur des données et cherchent à exploiter leur pouvoir de transformation. Rien qu’en 2023, 91,9 % des organisations ont généré une valeur commerciale mesurable grâce à leurs investissements dans les données et l’analyse.
À un moment donné, les entreprises qui s'appuient fortement sur leurs données pour prendre des décisions stratégiques sont confrontées à la nécessité de migrer leurs données commerciales, soit dans le cadre d'un effort d'optimisation des performances, soit dans le cadre d'un projet de transformation numérique à grande échelle. Les raisons pour lesquelles les entreprises pourraient avoir besoin d’entreprendre une migration de données et de demander l’aide de consultants en migration de données varient d’un cas à l’autre.
Dans cet article de blog, nous allons définir ce qu'est la migration de données, quand elle est nécessaire et quelles étapes constituent une stratégie de migration de données robuste. De plus, nous aborderons certains des principaux défis et risques auxquels les entreprises peuvent être confrontées lors de la migration de données, et partagerons quelques conseils et recommandations de bonnes pratiques d'ITRex sur la façon de les gérer. Continuez à lire.
Qu’est-ce que la migration des données ?
En termes généraux, la migration des données signifie le déplacement de données entre des systèmes informatiques. Plus précisément, la migration des données est le processus de transfert de données d'un type de stockage à un autre, ou d'une application à une autre, généralement piloté par la mise en œuvre d'une nouvelle application ou d'un nouveau logiciel.
Mais avant d'aborder les spécificités de la migration des données, il est essentiel d'expliquer la différence entre la migration des données, l'intégration des données et la réplication des données, qui peuvent être traitées de manière interchangeable en cas d'erreur et regroupées. Bien qu’ils traitent tous du mouvement des données, ces termes sont aux antipodes, car ils répondent à des objectifs distincts. Définissons donc le sens de ces termes.
Alors que la migration des données implique le traitement d'informations internes, l'intégration des données fait référence au processus de combinaison de données résidant dans des sources internes et externes hétérogènes dans un seul entrepôt de données ou base de données. Ceci est fait pour fournir une vue unifiée de toutes les données critiques dans une entreprise. Mais les différences ne s’arrêtent pas là. Alors que la migration des données est une activité ponctuelle qui se termine lorsque toutes les données ont atteint leur emplacement cible, l'intégration des données peut être un processus continu. Ce processus continu permet aux données de circuler constamment en temps réel, ce qui contribue à accélérer les analyses, à permettre une prise de décision solide et éclairée et à soutenir les opérations quotidiennes.
La réplication des données, par opposition à un processus de migration unique, implique un processus permanent de création de plusieurs copies de données, soit en temps réel, par lots selon un calendrier, ou à la demande, et de leur stockage sur plusieurs emplacements. Cette approche permet une récupération rapide et efficace des données après un sinistre, permet un accès plus rapide aux données, augmente la disponibilité des données et contribue à optimiser les performances du serveur. De plus, pendant le processus de réplication, le stockage source n'est jamais supprimé ou abandonné. En revanche, la migration des données implique la mise hors service de la base de données source une fois les données migrées vers le système de stockage de destination.
Quand la migration des données est-elle requise ?
Maintenant que nous vous avons donné une définition concise de la migration de données et expliqué en quoi elle diffère des processus d'intégration et de réplication, explorons les raisons pour lesquelles les entreprises pourraient avoir besoin d'effectuer une migration de données.
Voici une liste des scénarios les plus courants dans lesquels la migration des données est nécessaire.
- Mise à niveau ou remplacement des logiciels et des systèmes de bases de données existants, qui peuvent dater de plusieurs décennies
- Consolider les données d'entreprise provenant de sources multiples et disparates dans un référentiel centralisé pour éliminer les silos de données et obtenir une vue unique à 360 degrés des informations à l'échelle de l'entreprise.
- Restructuration et expansion de l'entreprise, telles que fusions, acquisitions ou cessions, pouvant nécessiter une consolidation ou une ségrégation des données.
- Passer à un stockage basé sur le cloud pour atteindre l'évolutivité et la sécurité et réduire les coûts liés au stockage de données sur site
- Adopter de nouvelles technologies, telles que l'analyse du Big Data, l'Internet des objets, l'apprentissage automatique, etc., qui nécessitent des capacités de stockage et de traitement de données différentes.
- Maintenir la conformité avec un nombre toujours croissant de lois et de réglementations sur la confidentialité des données – par exemple, localiser les données réglementées avant qu'elles ne quittent leur pays d'origine conformément aux lois sur la localisation des données, ou déplacer les données en raison de l'évolution des règles de résidence.
Quelle qu’en soit la raison, la migration des données n’est pas une mince affaire, pour ne pas dire risquée, dont l’issue est parfois incertaine. Pourtant, choisir de ne pas migrer est souvent encore plus risqué. Pour atténuer les risques et faciliter la migration de vos données, vous souhaiterez peut-être faire appel à un partenaire de confiance et expérimenté pour faire tout le gros du travail.
Types de migration de données
La migration des données se décline en plusieurs types qui, à leur tour, peuvent se chevaucher en fonction des exigences spécifiques de l'entreprise, des systèmes et des données impliqués. Voici un aperçu des scénarios de migration de données les plus courants.
Migration du stockage
En tant que type de migration de données le plus élémentaire, la migration du stockage couvre toute la gamme des scénarios de migration, tels que la transition de serveurs sur site vers un stockage basé sur le cloud, le passage d'un fournisseur de stockage cloud à un autre ou la migration de données depuis des centres de données régionaux vers un autre. un centre de données central.
Migration de base de données
Étant donné que les bases de données sont gérées via des systèmes de gestion de bases de données (SGBD), la migration de bases de données signifie normalement soit le passage d'un SGBD à un autre (migration hétérogène), soit la mise à niveau vers une version plus récente du même SGBD (ce que l'on appelle la migration homogène). L'exemple du premier est le passage de MySQL à PostgreSQL, ou d'Oracle Database à MongoDB.
Migration d'applications
La migration d'applications fait référence au déplacement d'une application d'un environnement informatique à un autre. Il s’agit simplement d’un type de migration qui peut en combiner plusieurs autres. Quelques exemples de ce scénario de migration pourraient consister à déplacer une application de gestion de la relation client (CRM) sur site vers une solution Salesforce basée sur le cloud, ou à migrer une application de commerce électronique monolithique vers un ensemble de microservices.
Migration vers le cloud
L'aspect clé de la migration vers le cloud fait référence au déplacement des données d'un service de base de données sur site vers le cloud et entre différents environnements basés sur le cloud – par exemple, la migration d'un serveur Microsoft SQL sur site vers une base de données Microsoft Azure SQL.
Migration des processus métier
Associé à une initiative de réingénierie des processus métier à grande échelle, ce type de migration de données implique le transfert d'applications et de données critiques pour l'entreprise, telles que des mesures commerciales, des processus ou des informations opérationnelles, vers un nouvel environnement.
Approches de la migration des données
Bien qu’il existe plusieurs façons d’élaborer une stratégie de migration de données, la plupart des approches appartiennent essentiellement à l’une des deux catégories les plus courantes, chacune présentant ses propres forces et limites. Les voici.
Migration du Big Bang
Dans la migration Big Bang, une ressource de données entière est transférée du système source vers l'environnement cible en une seule action. Même si cela peut prendre un certain temps, pour les utilisateurs, cela revient à se débarrasser de l'ancien système et à en lancer un nouveau à un moment donné, ce qui s'apparente au Big Bang, d'où son nom.
Du côté positif, l’approche Big Bang permet de passer à un nouveau système dans les plus brefs délais, évitant ainsi d’avoir à utiliser simultanément l’ancien système et la nouvelle base de données.
En revanche, les migrations Big Bang nécessitent souvent des temps d'arrêt du système, ce qui signifie que le système reste indisponible pour ses utilisateurs tant que les données subissent une transformation et sont déplacées vers le système de stockage de destination. Dans cette optique, ces migrations doivent être exécutées en dehors des heures d'ouverture ou pendant les heures creuses, comme le week-end ou les jours fériés, lorsque les utilisateurs ne sont pas censés utiliser le système. De plus, les gigaoctets et téraoctets de données accumulés dans le système source peuvent provoquer une congestion du réseau pendant la transmission, ce qui peut entraîner une perte de données ou, dans le meilleur des cas, un ralentissement du transfert de données. Par conséquent, l’adoption du Big Bang pourrait être la bonne solution pour les petites entreprises qui ne génèrent pas de grands ensembles de données et peuvent se permettre des temps d’arrêt.
Migration au compte-goutte
Comme son nom l'indique, l'approche Trickle Migration, en revanche, consiste à migrer les données en morceaux plus petits et gérables. La stratégie permet d'exécuter simultanément l'ancien système et le système cible jusqu'à ce que l'entreprise soit prête à effectuer une transition finale vers le nouveau. Cela permet d'éliminer les temps d'arrêt et de réduire les problèmes de congestion du réseau, réduisant ainsi le risque d'erreur ou de panne inattendue. La migration des données s'effectue en permanence en arrière-plan, ce qui est particulièrement important pour les systèmes qui doivent rester opérationnels pendant le transfert de données.
Cependant, contrairement à la stratégie Big Bang, la migration itérative est un processus gourmand en temps et en ressources, tant en termes de planification que d’exécution. L'équipe de migration doit veiller à ce que le système cible reste synchronisé avec le système source et effectuer une validation et des tests continus des données pour garantir la cohérence et l'intégrité des données tout au long du processus de migration. À cet égard, choisir d’adopter l’approche Trickle Migration pourrait être la meilleure option pour les organisations qui travaillent avec de grands ensembles de données et ont une faible tolérance aux temps d’arrêt.
Le processus de migration des données : comment s'y prendre sans problème
Maintenant que vous avez une compréhension complète de ce que signifie la migration de données, de ses types, de son importance et de ses approches, il est grand temps d'approfondir les spécificités du processus de migration de données.
Quelle que soit l’approche, chaque projet de migration de données passe par les mêmes phases clés. À un niveau élevé, ces phases comprennent généralement la planification préalable à la migration, la mise en œuvre et l'audit post-migration. Chaque étape, à son tour, peut être subdivisée en un certain nombre de phases en fonction des besoins et des exigences spécifiques de l'entreprise. Voici un aperçu des étapes essentielles pour réussir la migration des données.
Planification
Une planification stratégique approfondie est la clé du succès d’un projet de migration de données. Cela commence généralement par l'évaluation des ensembles de données existants et l'élaboration d'un plan clair : vous devez avoir une compréhension précise des données qui doivent être migrées, de leur destination et de la manière dont vous y parviendrez. La phase de planification peut également comprendre les étapes suivantes.
- Examiner les données sources et identifier le format des données, leur emplacement, leur structure et leurs attributs
- Optez pour une solution de stockage cible adaptée et analysez le système de destination pour déterminer si les données sources s'intègrent dans le nouvel environnement et ce qui doit être restructuré pour s'adapter aux spécifications de la destination.
- Choisissez l’approche de migration de données la plus adaptée (Big Bang ou Trickle)
- Allouez les ressources les mieux adaptées, définissez un budget et définissez des délais de transfert de données
- Audit des données
Avant la migration des données, il est essentiel que vous effectuiez un audit complet des données à déplacer. L'audit des données vise à détecter les problèmes de qualité des données, tels que les enregistrements en double, les inexactitudes ou les incohérences, et à les résoudre avant de poursuivre afin de garantir que seules les données de haute qualité sont transférées vers le nouveau système. C’est là que les solutions clé en main de qualité des données peuvent s’avérer très utiles.
Suppression des données obsolètes
Identifiez et supprimez les objets inutilisés ou obsolètes qui n’ont pas besoin d’être dans le nouveau système. La suppression des données obsolètes peut rendre votre migration plus fluide, tout en permettant à votre équipe de travailler avec un ensemble de données propre après la migration.
Sauvegarde de données
Bien que techniquement cela ne soit pas obligatoire, la sauvegarde de vos données, de préférence dans plusieurs emplacements, représente la meilleure pratique lors de la mise en œuvre d'une migration. Cela fournira une couche de protection supplémentaire en cas d’échec de la migration.
Conception des migrations
C'est ici que vous détaillez le processus de migration, c'est-à-dire configurer l'environnement de destination, effectuer un mappage approfondi des données, définir les règles de migration et de test, rédiger les critères d'acceptation, attribuer les rôles et responsabilités de migration et spécifier les technologies et méthodes de migration de données.
Quant à ce dernier, il existe plusieurs méthodes de migration de données qui permettent de transférer des données du système source vers le système cible. Des exemples sont la migration du stockage physique, la sauvegarde et la restauration, la copie 1:1 (batch EL) ou la technologie ETL (qui signifie Extract, Transform, Load), entre autres. En ce qui concerne les outils de migration de données, certains des plus courants sont AWS Database Migration Service, Azure Data Box, Apache NiFi ou des scripts Python personnalisés pour des besoins de migration spécifiques et complexes.
Exécution et tests
C’est là que s’effectue réellement la migration. Un processus de migration de données robuste nécessite des tests réguliers pour garantir que les données sont transformées et chargées conformément aux spécifications. À mesure que les données transitent, il est essentiel de tester et retester les données migrées pour vérifier leur exhaustivité, leur exactitude et leur fiabilité. Des tests fréquents ou continus sont absolument nécessaires pour voir s'il y a des signes de panne et de temps d'arrêt du système source et pour corriger les problèmes dès que possible.
Audit post-migration
Une fois la mise en œuvre terminée, il est crucial de réaliser un audit des résultats de la migration pour confirmer si les données ont été déplacées en toute sécurité vers l'infrastructure cible et si elles sont complètes et viables. Une fois que le nouveau système est opérationnel et fonctionne parfaitement, vous pouvez mettre hors service l’ancien environnement en toute sécurité.
Défis de la migration des données : à surveiller
Une fois que vous avez réalisé que la migration des données est nécessaire pour votre entreprise dans le cadre du projet de modernisation, il est essentiel de bien comprendre les défis qui pourraient se présenter à vous.
La migration peut être l'une des étapes les plus complexes et les plus difficiles d'une mise en œuvre, car un certain nombre de problèmes peuvent entraver le processus de migration des données. Considérez ceci : selon Gartner, plus de 83 % des projets de migration de données échouent ou dépassent leurs budgets et calendriers. La plupart du temps, cela est dû au fait que les organisations négligent les risques ou sous-estiment les efforts requis pour un processus de migration de données réussi, considérant la migration des données comme un simple déplacement d'un point A à un point B. Pour éviter que vos efforts de migration de données ne tombent à l'eau, il Il est fortement recommandé de faire attention aux risques et aux défis liés à la migration des données avant de vous lancer dans une initiative de migration de données. Voici une liste de considérations clés.
Interruption opérationnelle et temps d'arrêt
Il peut s'avérer très difficile d'assurer la continuité des activités en matière de migration de données, car les organisations doivent équilibrer le besoin d'intégrité des données et la nécessité de maintenir les systèmes opérationnels. Cela est particulièrement vrai pour les entreprises générant de grandes quantités de données et qui ne peuvent se permettre aucun temps d'arrêt. Bien qu'il existe des temps d'arrêt inévitables mais planifiés, comme c'est le cas avec l'approche de migration de données Big Bang, vos processus métier peuvent s'arrêter de manière inattendue en raison de pannes de transmission, de problèmes de performances des applications ou d'une foule d'autres urgences que vous n'avez pas planifiées au préalable. la phase initiale.
Sous-estimation des coûts
La budgétisation a le potentiel de faire ou défaire votre initiative de migration de données. C’est la sous-estimation des coûts qui met en danger les projets de migration de données. Si vous ne prenez pas en compte tous les aspects de la mise en œuvre de la migration des données, y compris les coûts indirects cachés, tels que ceux associés aux temps d'arrêt imprévus ou aux urgences, vous risquez de vous retrouver dans une situation où vous dépasserez de manière inattendue le budget spécifié. Comme le précise Gartner, pour les projets de migration de données, les dépassements de coûts sont en moyenne de 30 %.
Mauvaise cartographie des données
Les champs de données d'un système existant peuvent ne pas être synchronisés avec ceux du nouveau système en raison de différences dans l'architecture de la base de données. Ainsi, le simple fait d’essayer de cartographier les champs et de bloquer les données dans le système cible peut avoir des conséquences néfastes. Un mappage de données incomplet ou inexact peut conduire à placer certains éléments de données dans des champs incorrects, ce qui peut nécessiter beaucoup de temps et d'efforts pour les mises à jour régulières et le remappage des champs.
Sécurité et conformité des données
Garantir la conformité légale et sécuriser les données sensibles pendant la migration ajoute de la complexité au projet. Lorsque vous traitez les données personnelles des clients, vous devez comprendre et chercher des moyens de respecter les réglementations en matière de confidentialité et de protection des données qui varient selon les régions. Le fait est qu’aux États-Unis, il n’existe pas de législation fédérale complète sur la protection des données. Au lieu de cela, les réglementations diffèrent considérablement selon les États et les secteurs. En revanche, dans l’Union européenne, les données sont protégées par le Règlement général sur la protection des données (RGPD). Ce cadre unifié de règles en matière de confidentialité des données impose des obligations strictes aux détenteurs de données et interdit le transfert de données personnelles vers des pays tiers ne disposant pas de mesures adéquates de protection des données. Ces transferts ne peuvent avoir lieu que si la Commission européenne a rendu une décision d'adéquation.
Par conséquent, la recherche de moyens de prévenir les violations du RGPD devient une préoccupation majeure en matière de flux de données transatlantiques, car ces violations peuvent entraîner des sanctions, comme ce fut le cas avec le géant de la technologie Meta, qui s'est vu infliger une amende record de 1,3 milliard de dollars en vertu du RGPD. – le plus important de l’histoire du RGPD.
Résistance au changement
Les migrations de données à grande échelle créent simultanément tout un univers de changements, ce qui est toujours frustrant pour les utilisateurs du système. Habitués à exécuter des requêtes sur des bases de données existantes, les utilisateurs peuvent avoir du mal à s'adapter au nouvel environnement et aux changements de formats de données, ce qui se manifeste souvent par une résistance au changement.
Meilleures pratiques de migration de données de l'équipe ITRex
Voici quelques directives claires des consultants Big Data d'ITRex pour vous aider à gérer les risques et les défis de migration de données répertoriés ci-dessus :
- Planifiez les perturbations pour minimiser les temps d'arrêt ou atténuer leur impact si cela se produit. Oui, vous avez bien entendu. Vous voulez certainement savoir comment continuer en toutes circonstances, n'est-ce pas ? C’est pourquoi il est essentiel d’élaborer une stratégie solide et prête à faire face aux perturbations. Élaborer un plan concret de continuité des activités décrivant une gamme de scénarios de catastrophe et des moyens de récupération est un moyen infaillible de protéger vos opérations commerciales contre des perturbations prolongées et de l'aider à se remettre sur les rails dans les plus brefs délais. En ce qui concerne les temps d'arrêt inévitables, les planifier correctement à un moment qui convient à l'organisation est un excellent moyen de garantir une migration transparente des données, tout en minimisant la probabilité de problèmes inattendus ou de ralentissements imprévus.
- Estimez avec précision les coûts de migration des données, tout en mettant l’accent sur les coûts cachés potentiels. Ceux-ci incluent les coûts liés à la gestion des dépendances des applications, à l’embauche de sous-traitants externes, à l’exécution de cycles de tests supplémentaires et à la résolution des problèmes de qualité des données. L’exécution de versions en double du même système, ainsi que les pertes de productivité et les problèmes post-migration peuvent également contribuer de manière significative aux coûts. Collectivement, ces facteurs s’ajoutent aux dépassements de budget à long terme.
- Avant d'écrire des scripts de mappage, il est essentiel de profiler toutes les données sources pour identifier leur structure, leur qualité et leurs relations. Effectuer un mappage complet des données source à destination avant le chargement des données est une étape critique pour garantir que toutes les données sont placées avec précision.
- Lors de la migration de données sensibles, il est essentiel de donner la priorité aux considérations liées à la sécurité et à la confidentialité des données. Assurez-vous que les données sensibles sont traitées en toute sécurité pendant leur transit et dans leur nouvel environnement. Vous souhaiterez peut-être appliquer des techniques de cryptage, d'anonymisation ou de masquage des données pour protéger les données sensibles tout au long du processus de migration. Assurez-vous également d’aligner la migration des données sur les réglementations pertinentes en matière de protection des données, telles que le RGPD ou les directives spécifiques à votre secteur.
- Bien que souvent négligée, la formation personnalisée des utilisateurs basée sur les rôles et les responsabilités peut faire toute la différence dans votre processus et vos résultats de migration de données. Allouer suffisamment de temps et de budget pour requalifier les équipes existantes contribue à une transition plus fluide pendant et après la migration des données, garantit l'acceptation des utilisateurs et contribue à minimiser les perturbations opérationnelles. C'est une bonne pratique d'initier dès le début la communication sur la migration de données à venir et les sessions de formation pratique afin de donner aux utilisateurs la possibilité d'accepter le changement bien avant que la migration réelle des données n'ait lieu. Une telle communication peut également les aider à être mieux équipés pour mieux comprendre et fonctionner dans le nouvel environnement.
Voici quelques conseils supplémentaires de l’équipe de migration de données ITRex qui sont tout aussi importants :
- Évaluez, comprenez et justifiez la nécessité de migrer vers une nouvelle technologie, plutôt que de rejoindre le train en marche à la hâte : vous devez avoir une vision claire de ce que vous voulez et pourquoi vous le voulez. Quels seront les bénéfices de la migration ?
- Créez une preuve de concept (PoC) : essayez d'abord à petite échelle et testez le terrain avant de vous engager pleinement dans la migration des données.
- Explorez des alternatives et évaluez les risques et les avantages associés à chaque option. Quelles sont les autres technologies qui font le même travail ? Pourquoi as-tu choisi celui-ci ?
- Évaluer les limites de la nouvelle technologie. Par exemple, les procédures stockées, communes à Oracle et à de nombreux autres systèmes de gestion de bases de données relationnelles (SGBDR), peuvent ne pas être disponibles sous la même forme dans les entrepôts de données à traitement massivement parallèle (MPP) basés sur le cloud.
- Évaluer la nécessité de réécrire la logique de traitement des données.
- Évaluez la manière dont vos utilisateurs peuvent être affectés et envisagez de créer un point de contact unique pour vos clients et vos employés afin de les aider à relever les défis qui se présentent à eux.
Rassembler tout cela : pourquoi la migration des données
En matière de transformation numérique, se lancer dans une initiative de migration de données est une question de nécessité plutôt que de choix. En termes de migration de données, le changement est inévitable, même s'il comporte certains risques, incertitudes et considérations. Traiter la migration des données comme faisant partie d’un processus d’innovation important représente la moitié de la bataille.
Maintenant que vous comprenez bien ce qu’est la migration de données et pourquoi elle peut être nécessaire, vous aurez plus de facilité à lancer votre projet de migration de données.
Le taux d’échec de 83 % ne signifie pas nécessairement que votre initiative de migration de données est vouée à l’échec dès le départ. Même si la migration des données peut s’avérer difficile et quelque peu frustrante, avec une stratégie de migration des données bien orchestrée en place, tout devrait se dérouler sans problème. Nous espérons que les recommandations précises et les meilleures pratiques de nos meilleurs spécialistes en gestion de données vous feront beaucoup de bien.
Vous cherchez à comprendre ce qu’est la migration de données et comment la réaliser correctement ? N'hésitez pas à nous tenir au courant. Maximisez les avantages de la migration des données grâce à une approche éprouvée de notre équipe de migration de données.
Cet article a été initialement publié sur le site Web ITRex.