IntegraGen : Aider à percer les secrets du génome humain avec Google Cloud Platform

Grâce à Google Cloud Platform, IntegraGen a créé des outils d’analyse ultra-performants et évolutifs qui permettent aux chercheurs et aux oncologues d’interpréter rapidement des données génomiques.

● Fournit aux chercheurs et aux praticiens des analyses à grande vitesse et des insights à partir d’ensembles de données complexes et variés
● Réduit les coûts d’infrastructure grâce à l’autoscaling et aux VM préemptives
● Accélère l’innovation et le développement sans limitation physique en matière de capacité matérielle

Réduit le temps de traitement de 16 à 8 heures

La science du génome humain est récente et en constante évolution. Les techniques de séquençage génomique deviennent de plus en plus puissantes, ce qui rend l’interprétation des grandes quantités de données générées encore plus difficile. Disposant d’une technologie de pointe et d’une vaste expérience, IntegraGen fournit aux chercheurs et aux praticiens les moyens d’analyser et d’interpréter le matériel génomique de manière suffisamment rapide à des fins d’utilisation en cliniques médicales.

« Notre défi est d’effectuer des interprétations de données de séquençage génomique de plus en plus complexes, à grande échelle et dans des délais compatibles avec la prise de décisions cliniques. Avec Google, nous pouvons évoluer plus intelligemment, innover plus vite et sécuriser nos données plus efficacement. »
— Bérengère Génin, directrice de la bio-informatique, IntegraGen

En 2017, lors du développement d’un nouvel outil d’analyse de données, l’équipe d’IntegraGen s’est rendu compte que son infrastructure sur site atteignait les limites de ses capacités en termes d’échelle et de performances. Pour aller plus vite et plus loin, l’entreprise a choisi de développer ses nouveaux outils avec Google Cloud Platform (GCP).

Optimiser les performances, réduire les coûts

Les cliniques médicales ont besoin d’informations précises le plus rapidement possible. IntegraGen améliore et met à jour constamment ses analyses bio-informatiques et statistiques afin de fournir aux oncologues et à leurs patients les meilleurs insights possibles dans les plus brefs délais. Début 2017, la société a commencé à travailler sur un nouvel outil Software as a Service (SaaS) appelé MERCURY.

Celui-ci permettrait d’interpréter rapidement les données concernant les variantes de cellules cancéreuses et aiderait les praticiens à prendre des décisions plus éclairées et plus rapides. La société cherchait alors un moyen de se développer au-delà de son infrastructure bio-informatique sur site, et MERCURY offrait l’occasion d’explorer les technologies cloud.

Après avoir examiné diverses options, IntegraGen a choisi Google Cloud Platform en septembre pour sa simplicité d’utilisation et ses prix compétitifs. L’entreprise a collaboré avec SFEIR, un partenaire Google Cloud, pour concevoir et mettre en œuvre la nouvelle architecture, en commençant par une démonstration de faisabilité du pipeline de données qui alimenterait la plate-forme MERCURY. Les Co-founder, Atomxrésultats ayant été probants, SFEIR et IntegraGen ont commencé début 2018 à travailler sur la nouvelle infrastructure.

« Grâce à la fonctionnalité d’autoscaler de cluster disponible dans Google Kubernetes Engine, nous
sommes en mesure d’adapter automatiquement les ressources utilisées et facturées en fonction de la charge de travail. Le nombre de VM utilisables simultanément est pratiquement illimité. Nous pouvons désormais traiter des lots d’analyses complets en parallèle. »
— Pascal Castéran, Ingénieur Données et Consultant Google Cloud, SFEIR

Selon Pascal Castéran, ingénieur données et consultant Google Cloud chez SFEIR, Google Kubernetes Engine constituait le cœur du nouveau système. L’utilisation des clusters Google Kubernetes Engine a permis à SFEIR et à IntegraGen de créer une infrastructure avec autoscaling qui ajoutait de la puissance de calcul en quelques secondes au besoin, puis la réduisait lorsque la demande diminuait. IntegraGen a fait appel à BigQuery et Cloud Dataflow pour traiter les ensembles de données divers et complexes qui alimenteraient le service MERCURY. Pour booster les performances, IntegraGen a également opté pour l’utilisation de disques SSD locaux. Dans le même temps, grâce à l’utilisation de VM préemptives dans Google Kubernetes Engine et à d’autres fonctionnalités innovantes, l’entreprise a pu réduire ses coûts encore davantage.

Haute évolutivité, maintenance réduite

En prenant appui sur Google Cloud Platform, IntegraGen a lancé en Europe MERCURY, un outil d’analyse hautement évolutif et personnalisable, permettant aux praticiens d’exploiter la puissance de calcul de milliers de machines à partir d’une interface simple et conviviale.

« Avec Google Cloud Platform, il n’est pas nécessaire d’acheter beaucoup de nouveau matériel ni de s’inquiéter de l’infrastructure sous-utilisée lors du développement d’un nouveau produit. La solution
nous rend agile, elle réduit les risques et, comme nous ne payons que ce que nous utilisons, elle fait
baisser les coûts opérationnels. »
—Bérengère Génin, directrice de la bio-informatique, IntegraGen

Sans infrastructure physique à maintenir et grâce à la tarification innovante de Google, IntegraGen a réduit ses coûts de manière substantielle par rapport à une solution entièrement basée sur site. S’il est difficile de quantifier exactement les économies réalisées grâce à GCP, ce qui est clair, selon Bérengère Génin, c’est le temps gagné par la société. « Auparavant, il nous aurait fallu plus de 16 heures pour traiter ce type de données », affirme-t-elle. « Avec Google, nous pouvons le faire en seulement huit heures. »

Avec une nouvelle solution cloud, les nouveaux projets d’IntegraGen ne sont plus limités par la capacité physique ou la maintenance de son architecture sur site. L’entreprise peut désormais gérer des projets en parallèle, innover et progresser plus rapidement que jamais. Dans le même temps, le service informatique peut se concentrer sur le développement de nouveaux outils améliorés pour les clients d’IntegraGen, au lieu de se soucier de l’infrastructure.

« Avec Google Cloud Platform, il n’est pas nécessaire d’acheter beaucoup de nouveau matériel ni de s’inquiéter de l’infrastructure sous-utilisée lors du développement d’un nouveau produit », explique Bérengère Génin. « La solution nous rend agiles, elle réduit les risques et, comme nous ne payons que ce que nous utilisons, elle fait baisser les coûts opérationnels. »

Depuis le lancement de MERCURY en Europe, IntegraGen n’est pas restée inactive. À la mi-2018, l’entreprise a déployé facilement MERCURY aux États-Unis, grâce à l’infrastructure mondiale de Google. IntegraGen continue de collaborer étroitement avec Google afin de respecter les normes de sécurité et de confidentialité des données les plus strictes en Europe, ainsi que la loi HIPAA aux États-Unis. L’entreprise a depuis lancé une deuxième solution appelée SIRIUS, reposant sur GCP. SIRIUS aide les chercheurs à analyser rapidement et intuitivement des données sur l’exome pour des applications mendéliennes et oncologiques. IntegraGen et SFEIR s’emploient maintenant à ajouter davantage de fonctionnalités à MERCURY et explorent les capacités de la gamme d’outils de big data et de machine learning de Google.

« Nous continuons à expérimenter avec différents outils de GCP, car ils sont très ouverts », déclare Bérengère Génin. « Nous sommes convaincus que de nombreuses applications peuvent nous aider à nous développer. »

Leave a Reply