La vision FINAXYS selon 2 cas d’usage et 1 REX Big Data

Nous sommes convaincus que les solutions Big Data apportent une réponse pertinente aux problématiques métiers dans le domaine bancaire (réglementaire, gestion des risques, détection de fraude, PnL, gestion de référentiel), IT & Digital (maintenance prédictive, monitoring applicatif, analyse du comportement des investisseurs, vision client 360).

De plus en plus de cas d’usages concrets apparaissent, facilitant l’appropriation et l’acculturation Data des directions métiers.
Amélioration de la connaissance clients dans la banque de détail, réglementations européennes et lutte anti-fraude dans la BFI ont été les catalyseurs de nombreux projets. Nous présentons ci-dessous notre vision pour deux cas d’usage très répandus chez nos clients et un REX.

Use case : anti-fraude

Afin de lutter contre les fraudes au crédit bancaire et de sécuriser le système d’information de la banque, les données en provenance de sources web et de capteurs IOT font l’objet d’une analyse profonde via l’agrégation avec les informations récupérées par le système d’information interne à la banque. Historiquement, la détection de fraude était réalisée sur des petits échantillons de transactions, faute d’outils assez puissants pour analyser l’ensemble des données historiques. Désormais cette analyse est rendue possible par l’utilisation des technologies Big Data qui permettent de stocker et d’analyser un gros volume de données à moindre coût. Le Big Data ne remplace pas ici les process existants mais il les étend à l’analyse d’un plus gros volume de données historiques et permet l’agrégation de données externes non structurées de type réseaux sociaux, internet des objets…

JP Morgan Chase a par exemple mis en place des technologies Big Data pour améliorer la surveillance de ses propres collaborateurs et éviter le risque de fraude interne. Le dispositif permet à la banque américaine d’analyser un grand volume de données (environ 150 petabytes pour 3,5 milliards de comptes utilisateurs) disponibles sous différents formats : emails et enregistrements d’appels téléphoniques principalement, pour vérifier si les employés n’ont pas commis de délits d’initiés. Il aurait été impossible de traiter ces données non structurées avec des outils classiques de type bases de données relationnelles.

Sur le même modèle, une équipe FINAXYS accompagne un banque CIB depuis 4 ans pour la surveillance de ses activités de marché et la lutte contre le Rogue Trading (cf affaire Kerviel). Le projet projet utilise la plateforme Hortonworks et les technologies Spark, Hive, Kafka.

Use case : connaissance client

Face à une clientèle de plus en plus volatile, le premier enjeu des banques est de conserver leurs clients en anticipant leurs besoins par le biais de l’analyse de leurs comportements bancaires.

35% des clients sont multi-bancaires. Même si ce chiffre tend à se stabiliser voire à diminuer, les usages en termes de mode de paiement (paypal, ApplePay etc.) se diversifient. Les nouveaux acteurs de la Fintech changent les règles du jeu. Il n’est plus nécessaire d’utiliser les services d’une banque pour bon nombre de transactions simples. Face à ce risque de perte de marché, les banques doivent utiliser la masse de données cumulée au cours de dizaines d’années d’exploitation. En effet, la Commission Européenne leur impose de garder un historique de 10 années sur les données personnelles de leurs clients. L’utilisation des technologies Big Data pour l’analyse de ces données permettrait la création de nouveaux services ciblés et l’anticipation des moments clés de la relation bancaire.

Les banques historiques doivent mettre en cohérence les différentes sources d’informations sur leurs clients: sources internes en provenance de leur système d’information et sources externes en provenance du site web de la banque, de son application smartphone, de sa page Facebook ou Twitter. Croiser ses sources leur permettrait de faire ressortir des données psychographiques de leurs clients. Il s’agit de critères de segmentation ou de ciblage basés sur les styles de vies, les croyances, les valeurs et les personnalités des consommateurs.

Sur ce cas d’usage, un Architecte Big Data Senior FINAXYS a accompagné avec succès un client banque de détail dans la mise en place d’une solution applicative centralisée de valorisation du parcours client. L’objectif de notre client était l’obtention d’une vision orientée client au service de la pro-activité commerciale :

  • Analyser et optimiser les chemins de vente (agence, web, téléphonique)
  • Détecter les moments de vie client en fonction des transactions cartes
  • Géolocaliser les territoires et les zones de consommation

Pour obtenir ces fonctionnalités, FINAXYS a mis en place un socle Hadoop transverse avec un Data Layer permettant une abstraction du Mainframe.

 

 

REX : réglementaire

Pensées pour stabiliser le système financier, les récentes évolutions réglementaires (FRTB, MIFID II, etc..) font peser d’énormes contraintes sur les établissements financiers. Pour y répondre, ils ont été contraints de mettre en œuvre de grands projets informatiques. Les technologies Big Data, souvent encore au stade de POC au sein des directions relations clients se sont retrouvées en première ligne de ces mises en œuvre. Elles servent en effet de socle aux nouveaux systèmes et procédures capables de mieux évaluer les risques bancaires, quasiment en temps réel.

En 2015, nous avons été sélectionnés par notre client pour le projet conception de l’architecture et la mise en place d’une équipe Big Data, et définir les contours d’un projet : les composants logiciels et l’architecture technique. En parallèle, une étude comparative était réalisée par notre client pour la sélection d’une distribution adéquate : Cloudera, Hortonworks, MAPR. Le choix s’est porté sur la plateforme HDP d’Hortonworks en raison des fonctionnalités BluePrint et de sécurité (Ranger, intégration Kerberos) indispensables dans un contexte bancaire.

En 2016, une équipe pluridisciplinaire (data engineer, expert système, architecte, chef de projet) a été mise en place pour déployer les premiers clusters HDP à destination des équipes de développement avec les technologies suivantes : HDFS, Yarn, HBase, Hive , Spark et Kafka. Le choix d’Ansible a été fait comme technologie de provisioning.

Les premiers clusters mis à disposition des équipes de développement ont permis de réaliser des PoCs en mai 2016. Ceux-ci ont donné satisfaction au métier et le choix de continuer sur la plateforme d’Hortonworks a été retenu.

Une fois les premiers clusters déployés nous avons travaillé sur la partie Haute Disponibilité et les aspects DRP (Disaster Recovery Plan). Notre équipe en place fonctionne en mode agile avec des sprints de 3 semaines, le résultat d’un sprint étant un ensemble de playbook Ansible qui permettait soit l’ajout d’un composant supplémentaire, soit la mise en haute disponibilité d’un composant.

Notre client dispose de plusieurs datacenters, et une de ses exigences était la continuité de service du cluster HDP sans perte de données même en cas de perte d’un site. Le plus gros challenge a été la mise en place d’un cluster étendu sur deux sites pour respecter les contraintes de RPO 0 (Recovery Point Objective – perte de données maximale 0). Pour ne pas perdre de données en cas de perte d’un site, le choix d’avoir 4 réplicas HDFS a été fait : 2 réplicas par datacenters. Pour ce faire, notre équipe s’est appuyée sur les fonctionnalités de rack-awareness de HDFS et une extension de Pivotal.

En 2017, pour respecter les contraintes de sécurité, Ranger a été mis en place pour la gestion des ACL et Kerberos pour la partie authentification.

 

 

 

Leave a Reply