Un génome : 400 sortes de cellules ! Comment ça marche ?

Notre organisme est constitué d’environ 400 types de cellules différentes et pourtant elles possèdent toute la même information génétique qui se trouve répartie dans les 23 chromosomes. Cette information codée dans l’ADN correspond à environ 50000 gènes codant pour 50000 protéines différentes couvrant une large panoplie de fonctions, que ce soient des enzymes, des protéines de structure ou de régulation. La classe la plus abondante de ces protéines est formée par les facteurs de transcription qui ont pour rôle de se fixer sur l’ADN et de contrôler sa transcription en ARN messager. L’ARN messager sert alors de guide à une machinerie enzymatique complexe, les ribosomes, qui est en charge de synthétiser les protéines. On peut faire une comparaison avec un télex, ça n’existe plus depuis le développement d’internet mais son fonctionnement aide à comprendre comment les choses se passent dans la cellule. On commençait à écrire un texte avec une machine à écrire, ce serait l’ARN polymérase (l’enzyme qui copie le code génétique de l’ADN pour le transformer en ARN) qui éditait une bande perforée, dans notre comparaison l’ARN dit messager, et celle-ci était ensuite introduite dans le télex qui la lisait et la traduisait en document, pour nous ici la protéine. Pour être complet dans cette comparaison, le rôle de l’ADN est matérialisé par l’opérateur qui possède l’information sur le texte qu’il compose sur le clavier de la machine à perforer la bande comme l’ADN possède les informations génétiques.

Pour que la même information génétique conduise à au moins 400 cellules de types différents dans l’organisme il faut donc qu’un mécanisme de régulation très précis fonctionne et module finement l’expression de ces quelques 50000 gènes et c’est le rôle de ces facteurs de transcription dont on a décrit environ 2500 variétés, soit 5 % de l’ensemble des gènes exprimés de tout l’ADN. C’est loin d’être négligeable et il faut tout cet attirail de clés et de serrures, en quelque sorte, pour qu’une cellule devienne un neurone, un globule blanc, une cellule cardiaque, un cône ou un bâtonnet de la rétine ou une cellule capable de produire un cheveu.

Depuis le début des années 2000 le Riken Institute à Yokohama, dans le sud de l’agglomération de Tokyo, s’est intéressé à l’expression des ARN qu’on appelle messagers (la bande perforée du télex) et le projet appelé FANTOM que cet institut a créé et mis en place englobe maintenant plus de 250 personnes réparties dans 114 laboratoires de 20 pays de par le monde.

Capture d’écran 2014-03-27 à 12.52.50

En appliquant une technique (CAP, voir la figure) mise au point au Riken Institute consistant à repérer l’ARN messager au début de sa synthèse et avec des machines automatiques de séquençage devenues au fil des années extrêmement performantes, précises et rapides, les résultats se sont accumulés et ont permis de se faire une bonne idée de la différenciation cellulaire. Pour bien comprendre comment les choses se passent, il faut garder en mémoire le schéma ci-dessous (Wikipedia) où figurent des portions de séquence de l’ADN particulières situées en amont du gène qui va être transcrit par l’ARN polymérase.

1600px-Transcription_Factors.svg

Il y a les protomères reconnus par les facteurs de transcription et sur lesquels ces derniers se fixent et il y a aussi les séquences d’ADN dites activateurs (enhancers) sur lesquelles vont se fixer les protéines activatrices qui forment un complexe avec les facteurs de transcription pour décider au final si l’ARN polymérase peut fonctionner ou non, c’est-à-dire générer l’ARN messager qui conduira à la protéine correspondant au gène. Le projet FANTOM coordonné par le Riken Institute a répertorié pas moins de 180000 séquences de protomères et 44000 séquences d’activateurs. Ca fait beaucoup mais il faut tout cet attirail pour que la régulation de l’expression des gènes puisse conduire à la différenciation cellulaire telle qu’on peut l’observer.

On peut faire une estimation arithmétique rapide mais cependant éloignée de la réalité, chaque gène serait sous le contrôle de près de 4 protomères différents et les quelques 2500 facteurs de transcription, agissant chacun sur 20 gènes différents (50000/2500), permettraient donc une combinaison d’environ 500 possibilités, en gros le nombre de cellules différentes décrites : (2500×4)/20. Naturellement, c’est une estimation de mon cru en appliquant une statistique grossière qui ferait hurler d’horreur n’importe quel coauteur de cette étude mais ce qui n’est pas difficile à comprendre c’est que la moindre erreur et c’est la pagaille assurée, par exemple une cellule qui devient cancéreuse. Toute l’étude a d’ailleurs été réalisée initialement avec des cellules saines mais les cellules cancéreuses n’ont pas été non plus négligées.

Le Docteur Alister Forrest, coordinateur scientifique du projet dit les choses ainsi et je n’ai fait que reprendre ses propos : « Les êtres humains sont des organismes multicellulaires complexes composées d’au moins 400 types cellulaires distincts. Cette belle diversité de types de cellules nous permet de voir, de penser, d’entendre, de se déplacer et de combattre les infections alors que tout cela est codé dans le même génome. La différence entre toutes les cellules provient des parties du génome qu’elles utilisent – par exemple, les cellules du cerveau utilisent des gènes différents de ceux des cellules du foie, et donc ils travaillent très différemment. Dans FANTOM5, on a pour la première fois systématiquement étudié exactement quels gènes sont utilisés dans presque tous les types de cellules à travers le corps humain, et les régions qui déterminent cette utilisation lorsque les gènes sont lus à partir du génome ».

Cette immense somme de travail a fait l’objet d’une salve d’articles publiés ce 27 mars 2014 qui décrivent en détail comment, entre autres exemples les mastocytes, des cellules de la lignées sanguine, se différencient en dehors de la moelle osseuse d’où elles proviennent pour remplir leurs fonctions protectrices une fois qu’elle ont ciblé l’organe vers lequel elles doivent intervenir et pourquoi elles sont différentes des globules blancs dits basophiles. Cette sorte d’exception était encore mystérieuse il y a à peine deux ans.

Capture d’écran 2014-03-27 à 19.38.38

L’illustration ci-dessus tirée de l’article de Nature (voir le lien et les notes en fin de billet) montre la complexité de ce mécanisme de régulation mais il est intéressant de noter, ce qui n’est pas apparent dans cette figure, que les gènes essentiels à la vie de la cellule, ce que les biologistes appellent les gènes « housekeeping », un terme pas très facile à traduire en français mais qui signifie que sans l’expression de ces gènes la cellule ne peut pas vivre, les promoteurs de ces gènes sont hautement conservés dans tous les types de cellules. Pour les autres gènes, les sites de début de transcription sont des entités composites dont la diversité est matérialisée par le diamètre des petites sphères dans l’illustration. Pas surprenant que les cellules du testicule qui doivent exprimer pratiquement tous les gènes pour produire les gamètes mâles disposent d’une panoplie étendue de promoteurs, pas surprenant non plus que les hépatocytes, les cellules du foie, qui sont multitâches, jouissent d’une plus grande flexibilité pour exprimer toutes sortes d’enzymes indispensables à leurs fonctions métaboliques ou de détoxification. Par contre les cellules épithéliales sont hautement spécialisées et la diversité des promoteurs est faible. Belle illustration de la complexité du vivant et la recherche en génétique réserve encore de nombreuses surprises en particulier en affinant les mécanismes d’apparition des cellules cancéreuses probablement grâce à ce type d’approche comme cela est suggéré dans l’illustration.

Sources : Riken Institute News et Nature (doi:10.1038/nature13182)

Illustrations : Wikipedia et Nature.

Note : l’illustration tirée de Nature (capture d’écran) a été insérée dans ce billet sans l’autorisation des éditeurs mais comme mon blog n’a pas de vocation commerciale, il n’y figure notamment aucune publicité, je suppose que ces éditeurs n’en seront pas offusqués. FANTOM5 est le cinquième rapport du projet Fonctional ANnoTation Of the Mammalian genome promu et dirigé par le Riken Institute. A noter qu’aucun laboratoire français n’a participé à cette étude multinationale extraordinairement innovante.