Aux origines de la bioinformatique

Pour chan­ger des tuto­riels et des pers­pec­tives sur l’avenir de la bio­in­for­ma­tique, je vous pro­pose aujourd’hui un retour aux sources. En effet, nous allons voir com­ment est née la bio­in­for­ma­tique. Nol­wenn vous en avait déjà par­lé ici, mais plus d'un point de vue métho­do­lo­gique.

S’interroger sur les ori­gines de la bio­in­for­ma­tique nous per­met­tra de répondre (ou pas) à la ques­tion « Qu’est-ce que la bio­in­for­ma­tique ? » et nous amè­ne­ra éga­le­ment à faire un peu de phi­lo­so­phie des sciences. En effet, la bio­in­for­ma­tique est-elle une dis­ci­pline scien­ti­fique ou une tech­nique scien­ti­fique ?

Cette der­nière ques­tion se pose pour de nom­breuses dis­ci­plines scien­ti­fiques (sinon toutes) et depuis long­temps. Le savant grec Aris­tote s’interrogeait déjà, dans l’Ethique à Nico­maque sur la dif­fé­rence entre l’épis­tè­mé (les connais­sances scien­ti­fiques) et la tech­né (la tech­nique) aux­quelles il ajou­tait la phro­ne­sis (la saga­ci­té). [0]

Peut-être avez-vous déjà enten­du par­ler de bio­lo­gie com­pu­ta­tion­nelle ? Cer­tains consi­dèrent la bio­lo­gie com­pu­ta­tion­nelle comme la science et la bio­in­for­ma­tique comme la tech­nique lui étant asso­ciée. Mais cette dis­tinc­tion n’a vrai­ment lieu qu’en anglais. D’ailleurs la socié­té savante inter­na­tio­nale de la bio­in­for­ma­tique est nom­mée « Inter­na­tio­nal Socie­ty for Com­pu­ta­tio­nal Bio­lo­gy » (ISCB), alors que la socié­té savante fran­çaise est nom­mée « Socié­té Fran­çaise de Bio­in­for­ma­tique » (SFBI). En effet en fran­çais le mot « infor­ma­tique » désigne à la fois la science et la tech­nique, ce qui n’est pas le cas en anglais. D’ailleurs la fron­tière entre science et tech­nique est très mince et la science a besoin de la tech­nique qui elle même a besoin de la science. Dans la pra­tique, rares sont ceux qui sont dans la science pure ou dans la tech­nique pure, en tout cas en bio­in­for­ma­tique.

D’autres voient une autre forme de dis­tinc­tion. Mor­gan Taschuk, par exemple, nous explique sur son blog qu’un bio­in­for­ma­ti­cien va s’intéresser à des outils géné­ra­listes alors qu’un « bio­lo­giste com­pu­ta­tion­nel » (oui c’est moche) s’intéressera plus à des outils spé­ci­fiques [5]. Certes, cer­tains s’intéressent plus à créer des outils qui répon­dront à la plu­part des besoins alors que d’autres s’intéressent plus à créer des outils spé­ci­fiques pour leur pro­jet, mais de là à en faire une dis­tinc­tion entre deux termes… Et puis il fau­drait défi­nir à par­tir de quel niveau de spé­ci­fi­ci­té on devient un bio­lo­giste com­pu­ta­tion­nel et à par­tir de quel niveau de géné­ra­li­sa­tion on devient bio­in­for­ma­ti­cien… De longs débats en pers­pec­tive !

Tout ça pour dire que le débat science ou tech­nique, bien qu’intéressant (il nour­rit les dis­cus­sions sur inter­net !), est un débat sans fin sur lequel on pour­rait dis­cu­ter des heures et des heures (cer­tains diraient que c’est un bon gros sujet à trolls velus).

Mais reve­nons à nos mou­tons, de l’origine de la bio­in­for­ma­tique. Bien que le terme ait été inven­té en 1970 comme nous le ver­rons plus loin, la bio­in­for­ma­tique, en tant que tech­nique, est appa­rue bien avant. En fait, l’apparition des ordi­na­teurs à très vite entraî­né leur uti­li­sa­tion pour faire des cal­culs per­met­tant de répondre à des ques­tions bio­lo­giques.

En effet, la pre­mière publi­ca­tion scien­ti­fique dans laquelle l’informatique a été uti­li­sée pour répondre à une ques­tion scien­ti­fique date de 20 ans aupa­ra­vant, aux débuts de l’informatique.

Cet article a été écrit par le célèbre sta­tis­ti­cien R.A. Fisher (oui oui celui qui a créé le test) en 1950 [6]. Il s’agissait alors de résoudre une équa­tion dif­fé­ren­tielle afin de cal­cu­ler la fré­quence au cours du temps d’un gène sous sélec­tion dans un modèle de dif­fu­sion. L’ordinateur que Fisher a uti­li­sé était le Elec­tro­nic Delay Sto­rage Auto­ma­tique Cal­cu­la­tor (EDSAC) qui venait tout juste d’être ins­tal­lé au labo­ra­toire de Mathé­ma­tiques de l’Université de Cam­bridge. La pré­ci­sion obte­nue était de l’ordre du dix-mil­lio­nième, avec une incer­ti­tude de 3 ou 4 uni­tés sur la der­nière déci­male.

Ordinateur EDSAC | Par Thorpe CC-BY 2.0
Ordi­na­teur EDSAC | Par Thorpe CC-BY 2.0

Un autre célèbre mathé­ma­ti­cien anglais s’est inté­res­sé à la bio­lo­gie, et en par­ti­cu­lier de la mor­pho­gé­nèse. Il s’agit de Sir Alan Turing en per­sonne. Turing a uti­li­sé l’ordinateur Mark I de l’Université de Cam­bridge pour modé­li­ser le déve­lop­pe­ment bio­lo­gique ain­si qu'il l'expliquait dans une lettre à Mike Wood­ger [3].

Notre nou­velle machine [le Fer­ran­ti Mark I] va com­men­cer à arri­ver (sic) lun­di. J'espère faire dans les pre­miers tra­vaux quelque chose en rap­port avec "l'embryologie chi­mique". En par­ti­cu­lier, j'espère pou­voir expli­quer l'apparition de suite de Fibon­nac­ci dans les cônes de sapin.

Turing  espé­rait, tou­jours dans une lettre à Young, pou­voir don­ner des expli­ca­tions à dif­fé­rents pro­blèmes bio­lo­giques comme :

  1. La Gas­tru­la­tion.
  2. Les struc­tures symé­triques poly­go­nales, comme les étoiles de mer ou les fleurs.
  3. La phyl­lo­taxie, et en par­ti­cu­lier com­ment les suites de Fibo­nac­ci sont impli­quées dans la dis­po­si­tion des feuilles.
  4. Les patrons de cou­leurs chez les ani­maux (bandes, points et tâches).
  5. Les patrons de struc­tures presque sphé­riques, comme par exemple les Radio­laires, bien que ceux-ci soient bien plus com­pli­qués et dou­teux.

Turing s’intéressait éga­le­ment, comme on l’imagine très bien, aux réseaux de neu­rones [7], qu’il com­pa­rait à sa fameuse machine… de Turing (qui rap­pe­lons le, n’existe pas !).

Venons en main­te­nant au terme « bio­in­for­ma­tique ». Je vous ai dit tout à l’heure qu’il avait été uti­li­sé pour la toute pre­mière fois en 1970 par Pau­lien Hoge­weg et Ben Hes­per dans un article, en néer­lan­dais inti­tu­lé « Bio­in­for­ma­ti­ca : een werk­con­cept » [1] publié dans la revue Kame­leon (l’article n’est mal­heu­reu­se­ment pas dis­po­nible).
À l’époque, le terme ne dési­gnait pas du tout le champ scien­ti­fique mul­ti­dis­ci­pli­naire que l’on connaît aujourd’hui. Il s’agissait alors d’étudier les sys­tèmes d’informations des orga­nismes vivants. En d’autres termes, c’était la science de l’information (l’informatique) telle que nous la connais­sons, non pas appli­quée à des machines construites par l’homme, mais à des orga­nismes vivants.

On ne connaît pas actuel­le­ment la bio­in­for­ma­tique pour ces concepts, mais ils com­mencent à reve­nir en force, notam­ment avec la part de plus en plus impor­tante de la bio­lo­gie des sys­tèmes.

 

Mer­ci à Alice pour ses conseils et ses relec­tures ain­si qu'aux relec­teurs Wocka, Kum­qua­tum, et Yoann M.

Références

[0] : http://​pla​to​.stan​ford​.edu/​e​n​t​r​i​e​s​/​e​p​i​s​t​e​m​e​-​t​e​c​h​n​e​/#3
[1] : Hes­per B, Hoge­weg P (1970) Bio­in­for­ma­ti­ca : een werk­con­cept. Kame­leon 1(6): 28–29. (In Dutch.) Lei­den : Leidse Bio­lo­gen Club.
[2] : Hoge­weg P (2011) The Roots of Bio­in­for­ma­tics in Theo­re­ti­cal Bio­lo­gy. PLoS Com­put Biol 7(3): e1002021. doi:10.1371/journal.pcbi.1002021
[3] http://​www​.alan​tu​ring​.net/​t​u​r​i​n​g​_​w​o​o​d​g​e​r​_​f​e​b​51/
[4] http://​www​.ruther​ford​jour​nal​.org/​a​r​t​i​c​l​e​0​4​0​1​0​1​.​h​tml
[5] https://​modern​mo​de​lor​ga​nism​.word​press​.com/​2​0​1​5​/​0​7​/​1​9​/​b​i​o​l​o​g​i​s​t​s​-​a​n​d​-​b​i​o​i​n​f​o​r​m​a​t​i​c​i​a​n​s​-​h​a​v​e​-​d​i​f​f​e​r​e​n​t​-​s​o​f​t​w​a​r​e​-​n​e​e​ds/
[6] http://​www​.jstor​.org/​s​t​a​b​l​e​/​3​0​0​1​780
[7] http://www.alanturing.net/turing_archive/pages/reference%20articles/connectionism/Turing's%20neural%20networks.html



Pour continuer la lecture :


Commentaires

Laisser un commentaire