Python, dessine-moi un graphe

9 juillet 2015

par

Derrière ce titre énigmatique, qui n'aura pas été sans vous rappeler la fameuse phrase du Petit Prince d'Antoine de Saint Exupéry, se cache un module pour Python qui dira sûrement quelque chose à nos lecteurs assidus spécialisés dans les graphes : pygraphviz !

Ce module a été créé autour de GraphViz et vous permet ainsi de faire des graphes sous Python en respectant les normes établies par GraphViz et, par conséquent, d'exporter ou d'importer très facilement vos graphes pour vos différents projets. Sans plus attendre, attaquons-nous à quelques exemples d'utilisations du module. Prêts ? Graphez !

Installation de pygraphviz

Dans un premier temps, il vous faut avoir installé GraphViz.

Disponible depuis les dépôts officiels de Python, le module peut être très facilement installé, à l'aide du gestionnaire pypi :

1	pip install pygraphviz

Si vous n'aimez pas pypi, vous pouvez également utiliser easy_install :

1	easy_install pygraphviz

Vous avez bien tous réussi l'installation ? Place à un peu de pratique 🙂 !

pygraphviz par la pratique

Hello world !

Commençons par créer une première ébauche de notre script :

#!/usr/bin/env

#-*- coding : utf-8 -*-

# Hello world avec pygraphviz, oh oui !

import pygraphviz as pgv

graph = pgv.AGraph()

graph.add_edge("Hello", "world!")

graph.add_node("Hi!")

print(graph.string())

Exécutez votre script et, un graphe sauvage apparaît ! Ce graphe apparaît tel qu'il aurait été écrit dans un fichier au format dot.

strict graph {

Hello -- "world!";

"Hi!";

}

Maintenant que nous pouvons afficher un graphe pour GraphViz, peut-être voulez-vous pouvoir l'exporter ? Rien de plus simple, rajoutez cette simple ligne :

# Enregistrer le graphe dans un fichier pour GraphViz

graph.write('hello_world.dot')

Bon, d'accord, ce n'est pas très visuel, surtout lorsque nous sommes étranger à la logique de GraphViz. Pourquoi ne pas créer une image du graphe 🙂 ? Voici comment procéder :

# Créer une image du graphe

graph.layout('dot')

graph.draw('hello_world.png')

graph.close()

Et un aperçu de l'image :

Hello world! — Votre premier graphe en Python, bravo ! | par Norore, CC-0

Félicitations, vous avez créé votre premier graphe sous Python !

Le code final si vous voulez vous amuser avec (faites-le, on apprend mieux en testant !) :

#!/usr/bin/env

#-*- coding : utf-8 -*-

# Hello world avec pygraphviz, oh oui !

import pygraphviz as pgv

graph = pgv.AGraph()

graph.add_edge("Hello", "world!")

graph.add_node("Hi!")

print(graph.string())

# Enregistrer le graphe dans un fichier pour GraphViz

graph.write('hello_world.dot')

# Créer une image du graphe

graph.layout('dot')

graph.draw('hello_world.png')

graph.close()

Jouer avec les ontologies

Pour cet exemple, nous allons reproduire ce graphe déjà existant : Skin development

Notre objectif est ici multiple :

avoir un graphe orienté
chaque nœud du graphe doit être une boîte
le nœud principal qui indique le nom de l'ontologie doit être rempli en gris
certaines arêtes doivent être de couleur bleue

Par chance pygraphviz nous permet de faire des graphes orientés et de modifier les attributs des nœuds et des arêtes. Voici comment j'ai procédé pour reproduire le graphe :

#!/usr/bin/env python

#-*- coding : utf-8 -*-

import pygraphviz as pgv

graph = pgv.AGraph(directed=True)

# changement de l'attribut shape (forme) pour le type box (boîte)

graph.node_attr["shape"] = "box"

# le premier noeud doit être rempli (style="filled") et coloré en gris (color='grey')

graph.add_node("skin development", style="filled", color='grey')

graph.add_edge("skin development", "organ development")

graph.add_edge("organ development", "anatomical structural development")

# l'arête doit être colorée en bleue (color="blue)

graph.add_edge("organ development", "system development", color='blue')

graph.add_edge("system development", "anatomical structural development")

graph.add_edge("system development", "multicellular organismal development", color="blue")

graph.add_edge("anatomical structural development", "developmental process")

graph.add_edge("multicellular organismal development", "single-organism developmental process")

graph.add_edge("multicellular organismal development", "single-multicellular organism process")

graph.add_edge("single-organism developmental process", "developmental process")

graph.add_edge("single-organism developmental process", "single-organism process")

graph.add_edge("single-multicellular organism process", "single-organism process")

graph.add_edge("single-multicellular organism process", "multicellular organismal process")

graph.add_edge("developmental process", "biological process")

graph.add_edge("single-organism process", "biological process")

graph.add_edge("multicellular organismal process", "biological process")

graph.layout('dot')

graph.draw("ontologies.png")

graph.close()

Ce qui vous donne ce résultat une fois le script exécuté :

Reproduction des ontologies de QuickGO | par Norore, CC-by 0 — Première reproduction des ontologies de QuickGO | par Norore, CC-by 0

Bon, on a un bon premier aperçu, mais avouez que le code est un peu lourd à taper et à relire. Heureusement, pygraphviz nous permet de créer un graphe à partir d'une liste de nœuds ou d'une liste d'arêtes ! Pour nos arêtes, nous allons utiliser la fonction add_edges_from(list) :

list_edges_black = [("skin development", "organ development"), \

("organ development", "anatomical structural development"), \

("system development", "anatomical structural development"), \

("anatomical structural development", "developmental process"), \

("multicellular organismal development", "single-organism developmental process"), \

("multicellular organismal development", "single-multicellular organism process"), \

("single-organism developmental process", "developmental process"), \

("single-organism developmental process", "single-organism process"), \

("single-multicellular organism process", "single-organism process"), \

("single-multicellular organism process", "multicellular organismal process"), \

("developmental process", "biological process"), \

("single-organism process", "biological process"), \

("multicellular organismal process", "biological process")]

list_edges_blue = [("organ development", "system development"), \

("system development", "multicellular organismal development")]

graph.add_edges_from(list_edges_black)

graph.add_edges_from(list_edges_blue, color='blue')

Bien, on y voit déjà un peu plus clair, et ce sera plus facile à modifier si besoin ! Cependant, on aimerait bien que le premier nœud ne soit pas en haut mais en bas du graphe. Pour cela, graphviz nous propose l'option adéquate ! Dans notre instanciation de la classe AGraph, nous devons déclarer l'option rankdir en lui indiquant une orientation bottom -> top (par défaut, top -> bottom) :

7	graph = pgv.AGraph(directed=True, rankdir="BT")

Ce qui nous donne le graphe final suivant :

ontologies — Reproduction de l'ontologie Skin development de QuickGO | par Norore, CC-by 0

Et le script complet :

#!/usr/bin/env python

#-*- coding : utf-8 -*-

import pygraphviz as pgv

graph = pgv.AGraph(directed=True, rankdir="BT")