Comment le caféier fabrique la caféine

Deux milliards deux cent cinquante millions de tasses servies chaque jour, 87 millions de tonnes produites et un chiffre d’affaire de plus de 15 milliards de dollars, 26 millions de personnes vivant de cette production dans 52 pays occupant 11 millions d’hectares, voilà les statistiques du café, une plante qui, comme le cacao, le maté et le thé, contient le psychotrope le plus utilisé dans le monde, la caféine. Pas de quoi s’étonner qu’une vaste équipe de biologistes et de généticiens se soit intéressée au séquençage du génome complet du caféier et pour une fois, qui n’est plus vraiment la coutume, on doit ce travail majestueux majoritairement à des Français de l’IRD et du CEA mais en collaboration avec beaucoup d’autres laboratoires répartis presque dans le monde entier. Décrypter le génome d’une plante n’est en effet pas une amusette. La technologie moderne permet malgré quelques manipulations préalables de faire en sorte que les machines automatiques développées par des sociétés comme Illumina dont j’ai déjà parlé dans un précédent billet de ce blog ainsi que des dispositifs proposés par la société suisse Roche permettent à l’aide d’une analyse informatique sophistiquée de décrypter le génome de n’importe quel organisme vivant assez rapidement. J’avoue que je suis dépassé par la rapidité de l’évolution de la biologie. Pour que mes lecteurs comprennent quelle est ma position qui me demande un effort d’analyse devant des recherches qui parfois me dépassent, j’en suis resté à l’art de la purification d’une protéine, par exemple un enzyme, qui doit présenter tous les critères de pureté et d’activité que l’on doit attendre ou espérer. En ce qui concerne cette élucidation du génome du caféier, il se trouve que les résultats sont exceptionnellement intéressants dans la mesure ou pour que cette plante se spécialise dans la production de caféine, son patrimoine génétique s’est trouvé modifié au cours du temps de manière à privilégier la voie métabolique aboutissant à la production de cette molécule relativement simple dérivée de la xanthosine. Pour les curieux, la xanthosine est dérivée de la xanthine, une base purique de la famille de la guanine et de l’adénine, les constituants fondamentaux de l’ADN. La xanthosine est le précurseur de la caféine et de la théobromine, le principal alcaloïde du chocolat.

Mais revenons au caféier. Pour que cette plante puisse produire des quantités appréciables de caféine et par voie de conséquence soit recherchée par les milliards de consommateurs de café de par le monde, elle s’est arrangé au niveau génétique pour s’enrichir en quelques activités enzymatiques qui conduisent de la xanthosine à la caféine, pas plus compliqué que cela, encore fallait-il le démontrer. C’est ce qu’est arrivé à prouver cette équipe multinationale en réalisant une cartographie complète du génome du caféier. Quelque part et pour des raisons qui échappent à l’analyse, le caféier s’est spécialisé dans la production de caféine. Mai si on regarde de plus près cette espèce de comportement atypique il se trouve que la caféine est un insecticide qui protège le caféier des ravageurs car cette plante produit aussi de la caféine dans ses feuilles et pas seulement dans les graines. Pour les graines, les grains de café que tout le monde connait, la caféine remplit aussi un rôle bénéfique puisqu’elle inhibe la germination des autres graines qui pourraient se trouver fortuitement en compétition dans le même espace quand elle tombent au sol. Un peu comme la nicotine qui est un puissant insecticide protégeant la plante des ravageurs mais la caféine et la nicotine, deux psychotropes bien connus, n’ont rien à voir au niveau chimique.

Revenons donc à cette élucidation de la totalité du génome du caféier. Schématiquement, il est apparu que la plante s’est arrangée par un mécanisme encore inexpliqué à faire en sorte que les gènes correspondant aux enzymes impliqués dans les étapes de la biosynthèse de la caféine se retrouvent plus ou moins dans les mêmes chromosomes et soient présents en plusieurs exemplaires. C’est un peu ce que la firme Monsanto a fait avec le maïs résistant au glyphosate, faire en sorte que la plante sur-exprime dans le cas du glyphosate la cible de cet herbicide. Le caféier n’a pas attendu les technologies modernes et s’est donc arrangé lui-même pour produire des quantités impressionnantes de caféine dans le but, comme je le disais plus haut, de se protéger. On dirait presque que cette plante est intelligente. Il a fallu cependant réaliser cette étude détaillée pour élucider la totalité du génome de cette plante afin d’expliquer au niveau moléculaire la stratégie choisie pour produire de la caféine. Ce que cette étude dirigée par le Professeur Philippe Lashermes depuis longtemps impliqué dans l’étude du caféier au sein de l’IRD ( http://www.ird.fr/toute-l-actualite/actualites/communiques-et-dossiers-de-presse/sequencage-du-genome-du-cafeier ) pas seulement en ce qui concerne la caféine mais aussi de nombreuses autres molécules pharmacologiquement actives présentes dans le café.

La caféine est une molécule extraordinairement simple si on la compare à la morphine ou à la codéine (voir un précédent billet de ce blog) et à n’en pas douter n’importe quelle levure convenablement manipulée génétiquement pourrait excréter de la caféine pour la plus grande satisfaction des fabricants de boissons énergétiques. Il est beaucoup plus rentable de faire appel aux services de Nestlé par exemple (un des sponsors de la présente étude) pour se procurer de la caféine issue des procédés de décaféinisation à l’aide de CO2 supercritique à l’échelle industrielle, à tel point que la caféine est en réalité un résidu pratiquement sans valeur marchande à moins d’être incorporée dans ces dites boissons « énergétiques » dont la consommation ne cesse d’augmenter. Ces considérations mercantiles mises à part, il se trouve que le caféier à réussi un ingénieux transfert de gènes d’un chromosome vers un autre, une espèce de prouesse génétique inattendue, pour en quelque sorte regrouper sur seulement deux chromosomes au cours de l’évolution les gènes codant pour les activités enzymatiques conduisant à la synthèse de la caféine à partir de la xanthosine. Dans les faits la plante s’est arrangée pour que l’expression de ces gènes soit la plus efficace possible afin de forcer la production de caféine, un genre de manipulation rêvée par les généticiens !

Tout est (presque) dit dans les illustrations tirées de l’article paru dans la revue scientifique Science aimablement communiquée par le Docteur Lashermes. D’abord un bref rappel de la voie de biosynthèse de la caféine à partir de la xanthosine, de la xanthine fixée à un sucre (ribose), consistant en trois ajouts successifs de groupements méthyle. Ça paraît simple encore faut-il que les étapes s’effectuent dans le bon ordre et de manière synchrone, c’est la raison pour laquelle la plante a fait en sorte d’exprimer de manière optimale les enzymes nécessaires à cette synthèse, des N-méthyl transférases (NMT), chaque méthyle étant ajouté sur des azotes (N) de la xanthine :

Capture d’écran 2014-09-07 à 14.47.31

Il y a donc intervention de trois enzymes différents dans ce processus. D’aucuns pourraient penser qu’il peut s’agir des mêmes enzymes mais pas du tout, la particularité d’un enzyme est de remplir une fonction très précise et chaque réaction chimique dans le milieu vivant requiert un enzyme bien individualisé. Dans le cas de la biosynthèse de la caféine, les trois catalyseurs, XMT, MXMT et DXMT, respectivement xanthosine méthyl transférase, théobromine synthase et caffeine synthase, utilisent le méthyl situé sur l’aminoacide méthionine, pour faire simple.

Capture d’écran 2014-09-07 à 14.49.14

Cette autre illustration explique clairement ce qui s’est passé au cours de l’évolution de la plante. A partir du chromosome 1 ancestral, il y a eu des duplications de gènes puis des blocs entiers de l’ADN ont été transférés sur le chromosome 9 (en rouge) et tous les gènes codant pour les méthyl-transférases (NMT) ont été en quelque sorte regroupés pour se retrouver contrôlés de concert. L’expression des différents gènes a pu être suivie au cours du développement de la plante, des racines jusqu’à la graine mature 320 jours après la pollinisation (DAP, days after pollinisation) dans la partie droite de l’illustration.

En outre l’élucidation du génome du caféier a montré que cette plante exprimait 25574 protéines différentes dont les gènes se trouvent répartis sur 11 chromosomes dupliqués, soit 22 au total. L’étude a été réalisée sur un parent de l’arabica appellé Coffea canephora. Enfin l’acide linoléique, un acide gras polyinsaturé essentiel pour la conservation de l’arôme du café après la torréfaction est également le résultat d’un regroupement de gènes assurant sa biosynthèse optimale.

Comme quoi l’élucidation du génome complet d’une plante aussi importante que le café sur le plan commercial est riche en informations parfois inattendues.

Sources : IRD et Science. Le Docteur P. Lashermes (IRD) est ici vivement remercié pour avoir aimablement fourni le reprint de l’article paru dans Science.

Un génome : 400 sortes de cellules ! Comment ça marche ?

Notre organisme est constitué d’environ 400 types de cellules différentes et pourtant elles possèdent toute la même information génétique qui se trouve répartie dans les 23 chromosomes. Cette information codée dans l’ADN correspond à environ 50000 gènes codant pour 50000 protéines différentes couvrant une large panoplie de fonctions, que ce soient des enzymes, des protéines de structure ou de régulation. La classe la plus abondante de ces protéines est formée par les facteurs de transcription qui ont pour rôle de se fixer sur l’ADN et de contrôler sa transcription en ARN messager. L’ARN messager sert alors de guide à une machinerie enzymatique complexe, les ribosomes, qui est en charge de synthétiser les protéines. On peut faire une comparaison avec un télex, ça n’existe plus depuis le développement d’internet mais son fonctionnement aide à comprendre comment les choses se passent dans la cellule. On commençait à écrire un texte avec une machine à écrire, ce serait l’ARN polymérase (l’enzyme qui copie le code génétique de l’ADN pour le transformer en ARN) qui éditait une bande perforée, dans notre comparaison l’ARN dit messager, et celle-ci était ensuite introduite dans le télex qui la lisait et la traduisait en document, pour nous ici la protéine. Pour être complet dans cette comparaison, le rôle de l’ADN est matérialisé par l’opérateur qui possède l’information sur le texte qu’il compose sur le clavier de la machine à perforer la bande comme l’ADN possède les informations génétiques.

Pour que la même information génétique conduise à au moins 400 cellules de types différents dans l’organisme il faut donc qu’un mécanisme de régulation très précis fonctionne et module finement l’expression de ces quelques 50000 gènes et c’est le rôle de ces facteurs de transcription dont on a décrit environ 2500 variétés, soit 5 % de l’ensemble des gènes exprimés de tout l’ADN. C’est loin d’être négligeable et il faut tout cet attirail de clés et de serrures, en quelque sorte, pour qu’une cellule devienne un neurone, un globule blanc, une cellule cardiaque, un cône ou un bâtonnet de la rétine ou une cellule capable de produire un cheveu.

Depuis le début des années 2000 le Riken Institute à Yokohama, dans le sud de l’agglomération de Tokyo, s’est intéressé à l’expression des ARN qu’on appelle messagers (la bande perforée du télex) et le projet appelé FANTOM que cet institut a créé et mis en place englobe maintenant plus de 250 personnes réparties dans 114 laboratoires de 20 pays de par le monde.

Capture d’écran 2014-03-27 à 12.52.50

En appliquant une technique (CAP, voir la figure) mise au point au Riken Institute consistant à repérer l’ARN messager au début de sa synthèse et avec des machines automatiques de séquençage devenues au fil des années extrêmement performantes, précises et rapides, les résultats se sont accumulés et ont permis de se faire une bonne idée de la différenciation cellulaire. Pour bien comprendre comment les choses se passent, il faut garder en mémoire le schéma ci-dessous (Wikipedia) où figurent des portions de séquence de l’ADN particulières situées en amont du gène qui va être transcrit par l’ARN polymérase.

1600px-Transcription_Factors.svg

Il y a les protomères reconnus par les facteurs de transcription et sur lesquels ces derniers se fixent et il y a aussi les séquences d’ADN dites activateurs (enhancers) sur lesquelles vont se fixer les protéines activatrices qui forment un complexe avec les facteurs de transcription pour décider au final si l’ARN polymérase peut fonctionner ou non, c’est-à-dire générer l’ARN messager qui conduira à la protéine correspondant au gène. Le projet FANTOM coordonné par le Riken Institute a répertorié pas moins de 180000 séquences de protomères et 44000 séquences d’activateurs. Ca fait beaucoup mais il faut tout cet attirail pour que la régulation de l’expression des gènes puisse conduire à la différenciation cellulaire telle qu’on peut l’observer.

On peut faire une estimation arithmétique rapide mais cependant éloignée de la réalité, chaque gène serait sous le contrôle de près de 4 protomères différents et les quelques 2500 facteurs de transcription, agissant chacun sur 20 gènes différents (50000/2500), permettraient donc une combinaison d’environ 500 possibilités, en gros le nombre de cellules différentes décrites : (2500×4)/20. Naturellement, c’est une estimation de mon cru en appliquant une statistique grossière qui ferait hurler d’horreur n’importe quel coauteur de cette étude mais ce qui n’est pas difficile à comprendre c’est que la moindre erreur et c’est la pagaille assurée, par exemple une cellule qui devient cancéreuse. Toute l’étude a d’ailleurs été réalisée initialement avec des cellules saines mais les cellules cancéreuses n’ont pas été non plus négligées.

Le Docteur Alister Forrest, coordinateur scientifique du projet dit les choses ainsi et je n’ai fait que reprendre ses propos : « Les êtres humains sont des organismes multicellulaires complexes composées d’au moins 400 types cellulaires distincts. Cette belle diversité de types de cellules nous permet de voir, de penser, d’entendre, de se déplacer et de combattre les infections alors que tout cela est codé dans le même génome. La différence entre toutes les cellules provient des parties du génome qu’elles utilisent – par exemple, les cellules du cerveau utilisent des gènes différents de ceux des cellules du foie, et donc ils travaillent très différemment. Dans FANTOM5, on a pour la première fois systématiquement étudié exactement quels gènes sont utilisés dans presque tous les types de cellules à travers le corps humain, et les régions qui déterminent cette utilisation lorsque les gènes sont lus à partir du génome ».

Cette immense somme de travail a fait l’objet d’une salve d’articles publiés ce 27 mars 2014 qui décrivent en détail comment, entre autres exemples les mastocytes, des cellules de la lignées sanguine, se différencient en dehors de la moelle osseuse d’où elles proviennent pour remplir leurs fonctions protectrices une fois qu’elle ont ciblé l’organe vers lequel elles doivent intervenir et pourquoi elles sont différentes des globules blancs dits basophiles. Cette sorte d’exception était encore mystérieuse il y a à peine deux ans.

Capture d’écran 2014-03-27 à 19.38.38

L’illustration ci-dessus tirée de l’article de Nature (voir le lien et les notes en fin de billet) montre la complexité de ce mécanisme de régulation mais il est intéressant de noter, ce qui n’est pas apparent dans cette figure, que les gènes essentiels à la vie de la cellule, ce que les biologistes appellent les gènes « housekeeping », un terme pas très facile à traduire en français mais qui signifie que sans l’expression de ces gènes la cellule ne peut pas vivre, les promoteurs de ces gènes sont hautement conservés dans tous les types de cellules. Pour les autres gènes, les sites de début de transcription sont des entités composites dont la diversité est matérialisée par le diamètre des petites sphères dans l’illustration. Pas surprenant que les cellules du testicule qui doivent exprimer pratiquement tous les gènes pour produire les gamètes mâles disposent d’une panoplie étendue de promoteurs, pas surprenant non plus que les hépatocytes, les cellules du foie, qui sont multitâches, jouissent d’une plus grande flexibilité pour exprimer toutes sortes d’enzymes indispensables à leurs fonctions métaboliques ou de détoxification. Par contre les cellules épithéliales sont hautement spécialisées et la diversité des promoteurs est faible. Belle illustration de la complexité du vivant et la recherche en génétique réserve encore de nombreuses surprises en particulier en affinant les mécanismes d’apparition des cellules cancéreuses probablement grâce à ce type d’approche comme cela est suggéré dans l’illustration.

Sources : Riken Institute News et Nature (doi:10.1038/nature13182)

Illustrations : Wikipedia et Nature.

Note : l’illustration tirée de Nature (capture d’écran) a été insérée dans ce billet sans l’autorisation des éditeurs mais comme mon blog n’a pas de vocation commerciale, il n’y figure notamment aucune publicité, je suppose que ces éditeurs n’en seront pas offusqués. FANTOM5 est le cinquième rapport du projet Fonctional ANnoTation Of the Mammalian genome promu et dirigé par le Riken Institute. A noter qu’aucun laboratoire français n’a participé à cette étude multinationale extraordinairement innovante.