Orphanet a pour mission de fournir des informations sur les maladies rares et les médicaments orphelins aux professionnels de santé et au grand public afin d’améliorer le diagnostic et la prise en charge des maladies rares. Après une évolution sur plus d’une dizaine d’années, les bases de connaissances d’Orphanet sont devenues si complexes qu’il est difficile pour les responsables scientifiques d’en assurer la maintenance avec les outils dont ils disposent actuellement. Le domaine des maladies rares est vaste (près de 6000 maladies rares sont référencées par Orphanet) et l’évolution des connaissances y est rapide. Les outils de représentation et de validation utilisés pour l’édition et la maintenance des connaissances se résument à des tableurs permettant de modifier des vues de la base de données. Ces outils ne permettent pas aux éditeurs scientifiques d’avoir une vue correcte des connaissances structurées. De plus, Orphanet connaît des difficultés croissantes pour répondre aux demandes de plus en plus nombreuses d’extraction de données. L’objectif général dans le cadre du projet OrphaOnto est la migration des données d’Orphanet à partir d’une base de données relationnelle vers une plateforme d’édition et de mise à disposition des connaissances reposant sur une ontologie. Cette plateforme fondée sur une ontologie sera capable de pallier les limites actuelles de représentation de la base, d’édition et de validation de contenu, de recherche d’information et de mise à disposition d’un contenu formalisé, adapté aux utilisations actuelles et futures de données sur le Web.
Une interview de Ferdinand Dhombres, chercheur responsable d’OrphaOnto
Ferdinand Dhombres est gynécologue-obstétricien avec une spécialisation pour le diagnostic prénatal ; il sera en poste dans quelques mois à l’hôpital Armand Trousseau à Paris (AP-HP). Il prépare actuellement une thèse d’informatique en ingénierie des connaissances en santé et a déjà travaillé sur la construction d’ontologies médicales pour le diagnostic prénatal et les urgences médicales. F. Dhombres a accepté de répondre à nos questions.
Qu’est ce qu’une « ontologie » ?
Il faut distinguer le terme d’ontologie tel qu’il est employé en informatique du concept utilisé en philosophie. Nous parlons ici d’ontologie informatique. L’ontologie dans le domaine de l’ingénierie des connaissances, un sous-domaine de l’informatique, c’est une façon de décrire les choses qui existent en utilisant un langage non ambigu, interprétable par un ordinateur. La définition consacrée d’une ontologie est une formalisation, avec un langage particulier, d’un domaine de la connaissance. Une ontologie permet une représentation des connaissances avec un certain point de vue, pour un objectif donné.
Pourriez-vous décrire l’objectif général du projet OrphaOnto ?
Le projet OrphaOnto est un projet assez large. C’est un projet coordonné par Jean Charlet (Inserm UMRS 872 & AP-HP). Je suis responsable de la première partie du projet qui est de transformer l’inventaire des maladies rares d’Orphanet en une ontologie (une première version de celle-ci est consultable sur le site Bioportal).
Le but initial de ce projet est d’utiliser les nouvelles technologies de l’information et des communications pour améliorer à la fois l’édition et la maintenance des connaissances dans le domaine des maladies rares. Un autre aspect important du projet est la diffusion et le partage de ces connaissances, en utilisant ces technologies, et en particulier les dernières évolutions du Web : ce qu’on appelle le Web sémantique. Nous utilisons donc ces outils du Web sémantique qui nous servent à améliorer les procédures d’édition et la diffusion de l’information sur Internet. Ces technologies permettront également de faire des liens avec les autres ontologies qui ont déjà été construites, comme par exemple une ontologie des gènes ou de l’anatomie.
Qui sont les bénéficiaires de ce projet ?
Il y a plusieurs niveaux d’utilisation. Le premier est celui d’un outil interne qui va aider les professionnels travaillant pour Orphanet, ceux qui maintiennent les classifications, les nomenclatures, les liens sémantiques. La première étape est de lier les concepts du domaine, par exemple les maladies, les signes cliniques, les prévalences, etc., avec une relation qui a un sens particulier. Le fait d’avoir ce lien va améliorer les procédures pour contrôler qu’il n’y a pas d’incohérence dans les modèles et permettre de réduire les tâches répétitives actuellement nécessaires au maintien des classifications. Avec l’ontologie, on maintiendra à un seul endroit les connaissances, et les classifications seront automatiquement générées. Cela va probablement réduire les risques d’erreur, et permettra en tout cas de les identifier de façon plus précise.
Au-delà de cet usage pour l’équipe Orphanet, c’est toute la communauté des chercheurs au sens large qui va ainsi avoir accès à des connaissances bien organisées pouvant donner des pistes pour le développement de nouvelles thérapies, par exemple.
Pourquoi Orphanet a-t-il besoin de ce projet aujourd’hui ?
La grande complexité des connaissances dans le domaine des maladies rares, leur évolution rapide, et le nombre important de sources différentes, rendent difficile la modélisation des connaissances. Les outils actuels ne sont pas adaptés à la représentation de connaissances extrêmement compliquées et toujours en évolution. Les ontologies et le Web sémantique sont des outils bien plus adaptés à la description des connaissances que les bases de données traditionnelles. En plus, dans l’évolution des domaines des maladies rares, des maladies génétiques et de la recherche biomédicale en général, il y a énormément de projets qui se mettent en place afin d’échanger des données sur les gènes, les protéines, les mécanismes cellulaires. Ces projets sont basés sur des technologies identiques, et il y a des possibilités, par Internet justement, de faire communiquer ces données, pour récupérer, pour fournir ou pour valider l’information. Le fait d’évoluer dans ce sens permet aussi d’être interopérable et d’échanger avec d’autres sources de connaissance.
Un autre aspect très important en termes de santé publique concerne la nomenclature d’Orphanet qui est complètement intégrée dans l’ontologie et qui peut servir à coder des documents comme des comptes rendus de dossiers médicaux.
L’ontologie peut aussi permettre de déduire un certain nombre d’informations. Par exemple, si on définit une maladie liée à un gène et à certains signes, on peut déduire certaines liaisons entre les gènes et les signes. On peut aller très loin avec cela. On peut générer énormément d’informations automatiquement avec l’ordinateur en utilisant les modèles et l’application de modèles. Mais il n’y a pas d’intelligence derrière. Tout cela nécessitera une validation humaine : il faut toujours interpréter l’information créée.
Orphanet est disponible en six langues – est-ce que cela pose des problèmes ?
Du point de vue des standards et des techniques, cela ne pose pas particulièrement de problème car les outils du Web sémantique sont capables de supporter tous les contenus Internet de la planète. Donc, la problématique de langue n’en est pas une. Traduire, en revanche, c’est autre chose. C’est plus compliqué !
Quelles sont les étapes du projet OrphaOnto ?
OrphaOnto est un projet de recherche. J’ai déjà travaillé sur les ontologies depuis un moment, en particulier sur une ontologie pour les signes en diagnostic prénatal. J’ai commencé à travailler avec Orphanet sur ce projet depuis le début 2011. On a fixé deux ans pour la totalité du projet. Le projet dépasse le cadre de la création de l’ontologie. Un de ses autres objectifs est d’aider aux procédures d’édition : les maladies, les classifications, le contrôle de qualité, etc. Cela implique de créer l’ontologie, d’interagir avec la base de données actuelle d’Orphanet, de pouvoir faire des mises à jour, et de tester l’intégration de ces outils à Orphanet. De plus, plusieurs parties du projet relèvent aussi de la recherche en informatique, puisqu’on va faire communiquer des technologies différentes.
D’autres aspects du projet concernent la diffusion de l’information. Il y a deux cibles : la première, ce sont les partenaires d’Orphanet (comme par exemple le European Bioinformatics Institute), afin de leur permettre d’interagir avec la base de données. On va pouvoir proposer aux partenaires d’accéder directement aux données dans ce format-là. Ça, c’est l’aspect vers les professionnels.
Pour les utilisateurs du site Internet d’Orphanet, cela ne changera rien sauf à accéder à des données plus justes et mieux mises à jour, ce qui n’est pas peu ! A l’avenir, ce type d’outil est tout à fait adapté, si c’est un choix stratégique, pour fournir l’information pour un site Internet dynamique. Fournir de l’information via le site Internet grâce au modèle ontologique développé dans le cadre de ce projet est tout à fait imaginable, mais pour l’instant nous n’en sommes pas encore là. Cependant, plus on avance dans ce projet, plus les services rendus potentiels deviennent intéressants et plus l’investissement augmente. Avec plus d’investissement en termes d’énergie et de travail, cela peut aller relativement vite. Actuellement, je travaille à plein temps sur ce projet, financé par Orphanet.