« Nous transformons la donnée brute en une information éclairée et contextualisée pour une meilleure prise de décision »

Le point avec Alexandre Bilger (X.90), Président et CEO de Sinequa et Fabrice de Salaberry, Directeur Général et COO. Ils mettent l’accent sur l’importance de l’analyse combinée des données structurées et non structurées.

Sinequa en bref

Sinequa est un éditeur de logiciel indépendant qui fournit une plateforme de Cognitive Search & Analytics aux entreprises du Global 2000 et aux grandes administrations.

Reconnu comme un leader mondial du marché dans le rapport « 2018 Magic Quadrant for Insight Engines » de Gartner et le rapport « Forrester Wave™ : Cognitive Search & Knowledge Discovery Solutions Q2 2017 », Sinequa développe son expertise et son activité à travers le monde grâce à un vaste réseau de partenaires et d’alliances technologiques.

Sinequa est spécialisé dans la recherche et l’analyse de données basées sur les technologies du machine learning, du deep learning  et du traitement automatique du langage naturel (NLP). Pouvez-vous nous en dire davantage sur votre cœur d’expertise ?

Nous permettons aux entreprises d’accéder de manière automatisée et systématisée à un capital de données intégrant des centaines de millions de documents écrits en langages naturels, et ce, dans plus de 300 langues dont 22 en traitement avancé.

À travers nos outils de traitement du langage  naturel (Natural Language Processing), nous offrons ainsi aux entreprises un accès unifié et contextualisé aux informations extraites de  leurs données structurées et non structurées.

Auparavant, les entreprises prenaient leurs décisions en se basant uniquement sur les données structurées, soit 20% seulement du volume total de leurs données disponibles. Grâce à notre technologie, les entreprises disposent enfin de la capacité à utiliser les 80% de volume de données dite ‘non structurées’, non exploitées jusqu’à maintenant. Aujourd’hui, en   enrichissant la donnée structurée avec des contenus non structurés et inversement, nous permettons aux entreprises d’optimiser la totalité de leur capital de données

Concrètement, nous transformons la donnée brute en une donnée éclairée et contextualisée, autrement appelée Information. C’est la garantie de prendre ses décisions dans les meilleures conditions possibles.

L’analyse combinée de données structurées et non structurées constitue un levier majeur d’économies. Qu’en est-il ?

Depuis les années 70, les spécialistes du business intelligence, comme SAP avec l’acquisition notamment de « Business Objects », ont énormément travaillé sur l’analyse de la donnée structurée. Depuis, au fil des années, les questions business ont gagné en complexité. En effet, les entreprises génèrent  de plus en plus des contenus non structurés (emails, documents, vidéos, chats, contenus des réseaux sociaux…) où il y a plus de données textuelles que de données structurées – typiquement gérées dans des bases de données alimentées par des logiciels d’entreprise (ERP, CRM, BI, etc.).

Bien qu’elles soient de plus en plus conscientes de l’importance des contenus non structurés, la quasi-totalité des entreprises se sont focalisées  principalement sur l’exploitation des données structurées. Sinequa a fait le choix de concentrer ses efforts  sur la partie la plus difficile : l’analyse de ces données non structurées (texte, image, vidéo, audio), car ces données constituent un véritable trésor en termes de valeur et de levier économique pour les entreprises.

Par exemple, dans le domaine financier, les algorithmes développés sur la base des données structurées ne sont plus différenciants pour une évaluation pertinente des cours en bourses. Les données non structurées sont donc indispensables pour créer des informations analysables et donc capitales pour les décisions d’investissement. Dans le secteur pharmaceutique, les recherches qui se basent sur l’analyse d’ essais pré-cliniques extrêmement coûteux permettent aux laboratoires pharmaceutiques de raccourcir considérablement la mise sur le marché de nouveaux médicaments. Il est donc primordial de comprendre et de croiser d’importants volumes de données structurées et non structurées, et nos technologies, incluant des mécanismes de machine learning, le permettent.

Dans quelle mesure vos solutions, appliquées à des usages métiers, permettront-elles de répondre aux problématiques « data » de vos clients ?

Nos solutions sont très utiles pour la lutte contre la fraude et contre le blanchiment d’argent, alors que les fraudeurs ont recours à des pratiques difficilement détectables à partir des données structurées.

Le potentiel du machine learning réside donc dans la vitesse de détection des transactions frauduleuses ou la « pattern recognition » dans le domaine des investigations, par exemple.

Dans ce cadre, nous travaillons avec un organisme européen sur la détection des collusions illégales entre entreprises. Cela consiste à analyser le contenu des échanges entre les entreprises et à détecter les signaux faibles.

Nous collaborons également avec une institution étatique qui analyse les transactions bancaires en Europe, afin de détecter des transactions bancaires frauduleuses, y compris les opérations de financement du terrorisme.

Leave a Reply