Introduction aux ontologies

Qu'est-ce que c'est ?

Les onto­lo­gies telles qu'on les emploie en infor­ma­tique (car le concept est phi­lo­so­phique avant tout) ont d'abord été mises au point pour l'intelligence arti­fi­cielle. Leur objec­tif est de décrire ce qui existe et la défi­ni­tion for­melle est assez com­plexe mais je vais m'efforcer de pré­sen­ter les choses plus sim­ple­ment.

Dans sa défi­ni­tion, une onto­lo­gie est un ensemble struc­tu­ré de termes et de concepts d'un domaine par­ti­cu­lier en pré­ci­sant les rela­tions entre ces termes et leurs pro­prié­tés. Chaque terme d'une onto­lo­gie doit pos­sé­der une défi­ni­tion pour être sûr de la signi­fi­ca­tion qui y est asso­ciée. Une onto­lo­gie pré­sente une struc­ture hié­rar­chique et l'ensemble des termes est ancré par un terme de haut niveau, la racine. Concer­nant les rela­tions, le lien de base est un lien d'héritage et il existe d'autres liens : com­po­si­tion, exclu­sion, etc.

Par exemple, l'ontologie qui doit être la plus connue en bio­lo­gie est la Gene Onto­lo­gy. Elle s'attache à décrire ce que sont les gènes et leurs pro­duits avec 3 espaces de noms dif­fé­rents (3 sous-par­ties de l'ontologie) : les fonc­tions molé­cu­laires, les com­par­ti­ments cel­lu­laires et les pro­ces­sus bio­lo­giques. La cel­lule (terme cell) est défi­nit comme suit : c'est l'unité struc­tu­rale et fonc­tion­nelle élé­men­taire de tout orga­nisme et elle inclut la mem­brane plas­mique et toute autre struc­ture externe comme une paroi ou une enve­loppe cel­lu­laire (tra­duit libre­ment de : cell dans Ami­GO brow­ser). Dans un autre registre (mais que je connais mieux), la Plant Onto­lo­gy per­met de décrire l'anatomie, la mor­pho­lo­gie et les stades de déve­lop­pe­ment des végé­taux. Cette onto­lo­gie pos­sède le terme fruit auquel est asso­cié pas moins de 58 syno­nymes !  Et oui, on peut par­ler de légume, de graine, de drupe ou d'achène mais tout cela cor­res­pond au même terme dans l'ontologie. A noter que l'ensemble des syno­nymes est une pro­prié­té du terme. Une rela­tion par­ti­cu­lière dans la Plant Onto­lo­gy est la rela­tion develops_​from qui per­met de faire le lien entre des struc­tures végé­tales au cours des phases de déve­lop­pe­ment : le fruit se déve­loppe à par­tir d'un gynoe­cium (plus com­mu­né­ment appe­lé pis­til).

Au niveau de la visua­li­sa­tion, on peut repré­sen­ter une onto­lo­gie de 2 manières dif­fé­rentes : soit une arbo­res­cence (comme dans un navi­ga­teur de fichier), soit un graphe. L'arborescence offre une repré­sen­ta­tion qui per­met de voir faci­le­ment les rela­tions hié­rar­chiques entre les termes tan­dis que la repré­sen­ta­tion sous forme de graphe est plus adap­tée pour la visua­li­sa­tion des autres types de rela­tions.

Extrait de la Plant Ontology - Vue arborescente
Vue arbo­res­cente d'une par­tie de la Plant Onto­lo­gy sous OBO-Edit.

Extrait de la Plant Ontology
Vue en graphe d'une par­tie de la Plant Onto­lo­gy sous OBO-Edit.

 

A quoi ça sert ?

Un des inté­rêts de faire une onto­lo­gie est d'avoir une réfé­rence com­mune pour l'utilisation d'un voca­bu­laire com­mun dans le domaine qui nous concerne. Tou­jours pour reprendre l'exemple de la Gene Onto­lo­gy, elle est très lar­ge­ment uti­li­sée pour l'annotation de génomes afin d'harmoniser les carac­té­ris­tiques asso­ciées aux gènes quelque soit l'espèce. Ensuite, encore grâce à ce voca­bu­laire, lorsqu'on a besoin de recher­cher un gène ou une fonc­tion par­ti­cu­lière, il suf­fit d'utiliser le GO Term cor­res­pon­dant. Ain­si, la Gene Onto­lo­gy est uti­li­sée par de nom­breux logi­ciels et base de don­nées qui ont besoin de concepts sur les gènes (voir cette page d'outils) et cela faci­lite leur prise en main pour les uti­li­sa­teurs car ils n'ont besoin de connaître que cette réfé­rence.

Pour pous­ser un peu plus loin cet aspect de des­crip­tion, les onto­lo­gies sont aus­si très sou­vent liées au concept de méta­don­nées. Les méta­don­nées sont des don­nées des­crip­tives qui sont asso­ciées à des don­nées afin d'y ajou­ter de l'information, de la connais­sance. Dans ce cadre, les onto­lo­gies trouvent leur place très faci­le­ment ! Les termes d'une onto­lo­gie peuvent être uti­li­sés direc­te­ment afin de défi­nir un ensemble de méta­don­nées pour décrire un orga­nisme ou une série de mesures expé­ri­men­tales par exemple. Il existe même des bases de don­nées qui reposent sur des onto­lo­gies : la base de don­nées Cha­do fai­sant par­tie du pro­jet GMOD pos­sède un module cen­tral qui contient les termes de plu­sieurs onto­lo­gies (Sequence Onto­lo­gy, Gene Onto­lo­gy, Rela­tion­ship Onto­lo­gy au moins) et per­met de sto­cker des don­nées géno­miques de manière très adap­table sur des gènes de résis­tance, sur un insecte rava­geur ou encore sur le patho­gène de la tuber­cu­lose. Même si chaque appli­ca­tion a des carac­té­ris­tiques par­ti­cu­lières, la sou­plesse et la puis­sance des onto­lo­gies per­mettent d'adapter la base de don­nées.

Un autre aspect est qu'on peut uti­li­ser des outils de rai­son­ne­ment sur une onto­lo­gie. En effet, en plus des élé­ments pure­ment des­crip­tifs que consti­tuent les termes et leurs rela­tions, une onto­lo­gie com­prend des règles de rai­son­ne­ment et il existe des algo­rithmes per­met­tant de par­cou­rir le graphe en sui­vant les rela­tions et les contraintes entre les termes. Ceci est plu­tôt uti­li­sé en intel­li­gence arti­fi­cielle mais beau­coup moins en bio­lo­gie.

 

Où les trou­ver ? Com­ment les consul­ter ?

Dans le domaine de la bio­lo­gie (et plus par­ti­cu­liè­re­ment du bio­mé­di­cal), il existe des réper­toires qui ras­semblent les onto­lo­gies :

  • Bio­por­tal : l'accès à des onto­lo­gies du domaine bio­mé­di­cal réper­to­riées par le NCBO
  • OBO Foun­dry : autre réper­toire d'ontologies du domaine bio­mé­di­cal
  • Crop Onto­lo­gy : réper­toire dédié à la bio­lo­gie végé­tale

Même si les res­sources que j'ai don­né sont asso­ciées à une thé­ma­tique spé­ci­fique, les onto­lo­gies sont par­fois réuti­li­sables : par exemple, sur OBO Foun­dry, on pour­ra retrou­ver des res­sources sur des mesures expé­ri­men­tales en spec­tro­mé­trie de masse ou en ima­ge­rie qui peuvent être reprises dans d'autres dis­ci­plines. On trou­ve­ra aus­si des moyens de décrire des pro­to­coles ou des expé­riences qui sont assez géné­riques. D'ailleurs c'est un point impor­tant pour cette forme de repré­sen­ta­tion d'être réuti­li­sable dans dif­fé­rents cas et il arrive de trou­ver des onto­lo­gies dites de "haut niveau" qui contiennent des concepts géné­riques et d'autres de "bas niveau" qui sont plus spé­cia­li­sées.

Sur ces sites, vous pour­rez télé­char­ger les onto­lo­gies (au for­mat owl ou obo) et ensuite les explo­rer grâce à des logi­ciels spé­cia­li­sés comme, par exemple, OBO-Edit ou Pro­té­gé sui­vant le for­mat pro­po­sé. Ces logi­ciels per­mettent de navi­guer à tra­vers une onto­lo­gie mais aus­si de les modi­fier ou d'en créer une nou­velle.

L'initiative de la Crop Onto­lo­gy est très inté­res­sant car ce réper­toire pro­pose de déve­lop­per des onto­lo­gies adap­tées pour chaque genre ou espèce végé­tale à par­tir d'ontologies de réfé­rence : la Plant Onto­lo­gy (encore !) et la Plant Trait Onto­lo­gy. En effet, si la géné­ra­li­sa­tion de cer­tains domaines est pos­sible, il arrive que vou­loir faire entrer de "force" des concepts dans un terme qui ne cor­res­pond pas soit com­pli­qué et sur­tout lui fasse perdre du sens.

 

Pour ter­mi­ner cette intro­duc­tion rapide, une onto­lo­gie n'est pas figée dans le temps. Pour celles qui sont main­te­nues par des consor­tiums, la par­ti­ci­pa­tion de tous les membres et les pro­grès dans le domaine concer­né mènent à modi­fier la struc­ture ou le conte­nu (défi­ni­tion ou autre pro­prié­té) afin de gar­der une réfé­rence fiable et uti­li­sable. La pré­sen­ta­tion que j'ai faite ici ne pré­sente que quelques aspects de ce mode de repré­sen­ta­tion, ce sont des outils très puis­sants qui reposent sur un for­ma­lisme très pous­sé et qui s'appliquent à des domaines très variés, pas seule­ment en bio­lo­gie.

 

Mer­ci aux relec­teurs : Clem_​, ZaZo0o et Yoann M.

 

Pour aller plus loin

Page wiki­pe­dia anglaise : http://en.wikipedia.org/wiki/Ontology_%28information_science%29

Gru­ber, Tho­mas R. (June 1993). "A trans­la­tion approach to por­table onto­lo­gy spe­ci­fi­ca­tions" (PDF). Know­ledge Acqui­si­tion 5 (2): 199–220.

Conseils pour com­men­cer une onto­lo­gie : http://​www​.ksl​.stan​ford​.edu/​p​e​o​p​l​e​/​d​l​m​/​p​a​p​e​r​s​/​o​n​t​o​l​o​g​y​-​t​u​t​o​r​i​a​l​-​n​o​y​-​m​c​g​u​i​n​n​e​s​s​-​a​b​s​t​r​a​c​t​.​h​tml



Pour continuer la lecture :


Commentaires

Laisser un commentaire