DYNAMIQUE ET FONCTIONNALITÉ DES ACIDES NUCLÉIQUES

INTERACTIONS PROTÉINES - ACIDES NUCLÉIQUES

Marie-Claude Serre




Avertissement

Certaines images de ce cours sont tirées de livres et d’articles de journaux scientifiques et couvertes par le copyright. Pour la plupart, elles peuvent être utilisées pour l’enseignement comme l’illustration d’un cours, mais ne peuvent pas être reproduites sans autorisation. En conséquence ce fichier est à usage exclusivement personnel.



  
Considérations générales
Bases et acides aminés
Structure des hélices d’acides nucléiques
Motifs protéiques de fixation à l’ADN
Hélice-tour-Hélice (Ex: CRP)
Feuillets b (Ex: Arc/Mnt et IHF/HU)
Doigts de Zinc (Ex: TFIIIA)
Leucine Zippers (Ex: GCN4)
Interactions protéines-ARN*
La fixation d’une protéine à l’ADN affecte sa migration électrophorètique
Retards sur gel: EMSA (Electrophoretic Mobility Shift Assay), REMSA (RNA electromobility shift assay) et Supershift
Bending: Substrats de permutation et détermination des angles de courbure
Phasing, looping et sandwiches (Ex: Assemblage de l’intasome)
– Recherche de sites génomiques par retard 2D
L’organisation de la chromatine affecte l’accessibilité de l’ADN:
Sensibilité à la nucléase micrococcale
Extension de monomères
• Des modifications des bases peuvent affecter la fixation des protéines:
– Réactions d'alkylation: DMS et Ethyl nitrosourea
Methylation interference, ethylation interference
– Les informations de contact qui peuvent en être déduites
• La fixation d’une protéine à l’ADN affecte l’accessibilité des bases:
– Définir un site de fixation par extention d’amorce (primer extention)*
Footprints enzymatiques et chimiques
Exo III*
Dnase I sur complexes purifiés
DMS, Fe-EDTA, H2O2
Footprint in vivo, LM-PCR

Les liens en vert (signalés par *) n'ont pas été traités en cours. Ils font l'objet d'un complément ici.

Questions, commentaires : marie-claude.serre(@)igmors(.)u-psud(.)fr
dernière mise à jour: avril 2005



CONSIDÉRATIONS GÉNÉRALES

La principale difficulté de l’étude des interactions protéines - acides nucléiques est d’observer simultanément deux macromolécules associées. D’une manière générale, les méthodes d’analyse spectrophotométrique sont mal adaptées. La détermination de structure aux rayons X ou par RMN dans le cas de petits objets est très informative mais inadaptée par exemple à l’étude d’assemblages dynamiques. Elle est surtout très lourde à mettre en œuvre sans aucune garantie de résultat!

Il existe toute une série de méthodologies utilisables in vitro ou in vivo qui permettent de décrire assez précisément les interactions entre une protéine et des acides nucléiques.
Plusieurs classes d'interactions peuvent exister:
    Protéines-ADN simple brin (par exemple RecA)
    Protéines - ARN simple brin (par exemple le ribosome)
    Protéines - ARN double brin (par exemple, amino acyl tRNA synthétases)
    Protéines - ADN double brin
C'est principalement cette dernière classe d'interactions qui est abordée ici. Cette famille peut également se décomposer en interactions séquences spécifiques (régulateurs transcriptionnels, histone-like bactériennes, enzymes de restriction, ...) ou non (ADN polymérase, histones, topoisomérases...). Le but de ce cours est de présenter un certain nombre de méthodologies qui permettent d'étudier les différentes interactions. 

Nous allons dans un premier temps, revoir brièvement quelques considérations d’ordre général qui reposent sur les propriétés chimiques des objets que nous voulons étudier. La reconnaissance entre une protéine et un acide nucléique va faire intervenir d’une part 4 bases et d’autre part 20 acides aminés. Ces interactions permettront d’obtenir si nécessaire une spécificité de reconnaissance. Quatre types d’interactions potentielles peuvent exister entre protéines et acides nucléiques. Du plus fort au plus faible, on peut avoir:

Interactions entre bases et acides aminés
  1. Des ponts salins formés entre les phosphates et les chaînes latérales d’acides aminés chargés positivement (N de la Lys, guanidinium de l’Arg, histidine protonée)
  2. Des liaisons hydrogène pouvant s’établir entre les phosphates, sucres et bases des acides nucléiques et les liaisons peptidiques ou les chaînes latérales des acides aminés hydrophiles.
  3. Des interactions d’empilement (stacking) impliquant les chaînes latérales des acides aminés aromatiques (Trp, Tyr, Phe, His voire le cycle indol des proline) et les bases.
  4. Des interactions hydrophobes entre les bases des acides nucléiques et les chaînes latérales des acides aminés non polaires.

Si l’on considère les acides aminés et les nucléotides comme des objets isolés, on s’aperçoit que les ponts salins et les liaisons H sont mieux adaptés et probablement dominants. Si on considère maintenant l’ADN et l’ARN sous leur forme double hélice, la situation va changer puisque de nombreux sites de formation de liaison H vont être masquées par l’appariement des bases en Watson-Crick.
















Appariement des bases et structure des hélices d’acides nucléiques

appariements WCLes atomes qui apparaissent dans le grand et le petit sillons sont différents pour chaque paire de bases. Les sillons sont tapissés d'atomes qui peuvent interagir avec des composants extérieurs aux acides nucléiques, comme les nucléases (dont les enzymes de restriction), les facteurs de transcription, les polymérases...Ces protéines interagissent donc avec des atomes qui peuvent donner ou accepter des liaisons hydrogènes, et qui sont plus (méthyle) ou moins (hydrogène) encombrants. Les protéines reconnaissent donc spécifiquement une séquence nucléique et sa séquence complémentaire, en interagissant avec ces différents atomes orientés dans la suite de la séquence.

Le petit sillon permet seulement de discriminer entre la guanine et les autres bases par l’intermédiaire du groupe amino sur le N2. Le grand sillon offre plus de potentiel en terme de discrimination (amino groupe du C4 de la citosine, du C6 de l’adénine, céto des guanine et thymine) et devrait être la cible principale des interactions si l’on doit distinguer entre paires de bases. Par ailleurs, le petit sillon pourra être un site préférentiel pour les interactions avec des ions métalliques ou des molécules d’eau.




Doubles hélices d'ADN et d'ARN

L’ADN a une conformation en double hélice droite, de type B. Ses paramètres sont de 10,5 bp/tour (un tour a une longueur de 34 Å). Le grand sillon est large (11,7Å) et le petit sillon étroit (5,7 Å).
Les ARN peuvent aussi adopter une structure en double hélice. Il s’agit alors d’une hélice de type A, qui est également une hélice droite en double brins anti parallèles présentant des appariements de type Watson - Crick. Les paramètres de l’hélice A sont différents de l’hélice B: 11 pb/tour (un tour fait 31 Å). Si la concentration saline augmente, il y aura passage en hélice A’ (12 pb/tour). Le grand sillon est plus profond que dans l’hélice B (13,5 Å contre 8,5 Å) , et le petit sillon très peu profond (2,8 Å contre 7,5 Å dans l’hélice B). La largeur des sillons est également très différente entre les deux hélices, le grand sillon de l’hélice A est plus étroit que celui de l’hélice B (2,7 Å contre 11,7 Å). A l’inverse, le petit sillon de l’hélice A est beaucoup plus large que celui de l’hélice B (11 Å contre 5,7 Å).
Les différences de taille des sillons des deux types d’hélice vont conduire à des interactions différentes avec des motifs protéiques (contraintes d’accessibilité). Par exemple, il a été montré qu’un feuillet b antiparallèle pouvait se placer naturellement dans le petit sillon d’une hélice A d’ARN. Cet assemblage est stabilisé par des liaisons H directes entre les hydroxyl O2’ des riboses et les oxygène carbonyl de la liaison peptidique, et renforcé par des liaisons H faisant intervenir des molécules d’eau entre les groupes NH de la liaison peptidique et les oxygènes O2’ et O4’ des riboses.




            D'après Principles of Nucleic Acid Structure, W. Saenger (Edt Springer-Verlag), 1984



Haut de page



MOTIFS PROTÉIQUES DE FIXATION AUX ACIDES NUCLÉIQUES



Motif Hélice-tour-hélice

Structure du complexe CRP-ADNCe motif a été identifié à l’origine dans des DNA binding protéines procaryotes. La résolution des structures 3D de Cro, CI (deux répresseurs du phage lambda) et CRP (régulateur transcriptionnel bactérien) a permis de le déterminer sans aucune ambiguité. On retrouve également ce motif dans des protéines eucaryotes comme par exemple les homéobox (antenapedia par ex.). La résolution de co-cristaux ADN-protéines a permis ensuite de définir plus précisément le mode de reconnaissance et de fixation à l’ADN. Il est à noter que les protéines ayant ce motif sont en général sous forme dimérique et que leurs sites de fixation sont palyndromiques. On peut voir sur la structure du complexe ADN-CRP que les deux hélices du motif sont exposées à l’extérieur de la protéine. Le fragment d’ADN est de 30 bp (environ 3 tours) et contient la séquence consensus de fixation. Les deux hélices forment un angle d’environ 60° et sont séparées par un coude de 4 à 6 acides aminés. On peut observer que la grande hélice (la 2nde du motif) se couche dans le grand sillon. La 1ère hélice du motif va servir de verrou conformationnel qui permet l’orientation correcte de l’hélice de reconnaissance. Dans le cas de CRP, cette fixation induit de plus une déformation (courbure) de l’ADN formant un angle de 90°. Cette courbure est principalement dûe à deux déformations de 40° (kinks) qui se produisent entre les pb TG/CA (positions 5 et 6 de chaque coté de la séquence symétrique). La reconnaissance du site par CRP est liée d’une part à cette distorsion et d’autre part à l’établissement de liaisons H directes entre des résidus de la grande hélice et 3 pb précises du site de fixation (ces interactions ont lieu dans le grand sillon).

Motifs en Feuillets beta

Structure du complexe Arc-DNA

Arc/Mnt
: Les premières protéines identifiées comme interagissant avec l’ADN par l’intermédiaire de feuillets béta, ont été Arc et Mnt, deux répresseurs du phage P22. Ces deux répresseurs sont sous forme tétramérique. Ils sont composés d’une partie C-terminale majoritairement en hélices, et responsable des interactions protéine-protéine, et d’un petit domaine N-terminal qui apporte la spécificité de reconnaissance de l’ADN. Ce domaine est composé d’un feuillet béta suivi de deux hélices. Ce feuillet va s’étendre dans le grand sillon en y établissant de nombreux contacts.


Structures HU-IHF

IHF/HU: IHF et HU sont des protéines "histone-like" de bactéries. Les structures d’IHF et HU d'origine mésophiles et thermophiles montrent que ces protéines ont le même repliement général: un corps majoritairement constitué d’hélices a chapeauté par des feuillets b qui s’étendent en deux bras en ruban. Sur l’image toutes les structures connues de protéines HU sont superposées. Les bras sont désordonnés dans les cristaux, et les études par RMN on montré que bien que les bras soient flexibles en solution, leurs extrémités sont repliées. Les protéines IHF d’E. coli et HU d’Anabaena ont été co-cristallisées avec l’ADN. Les bras en ruban s’étendent dans le petit sillon de l’ADN et un résidu proline extrêmement conservé à l’extrémité de chaque bras induit et/ou stabilise la courbure de l’ADN en s’intercalant entre les paires de bases.

Article original: Swinger & Rice (2004) Curr Opin Struct Biol. 14:28-35.
Autres structures: Swinger et al. (2003) EMBO J. 22:3749-60.



Zinc finger
TFIIIA
C’est un petit domaine qui requiert la coordination d’un ou plusieurs atomes de Zn pour stabiliser son repliement. Sa structure est en général constituée de deux feuillets beta anti parallèles et d’une hélice alpha. L’atome de Zn est chélaté par des résidus histidine et/cystéine. Ce motif permet de fixer de l’ADN et de l’ARN. Les interactions avec l’ARN font intervenir 3 bases et les acides aminés situés au début de l’hélice alpha. Le premier motif à doigt de Zinc a été identifié dans la protéine TFIIIA, un facteur de transcription. Il s’agit d’un motif C2H2. La paire de cystéine est séparée de la paire d’histidine par une boucle de 12 acides aminés qui forme le doigt à proprement parler. Les protéines ayant ce motif l’ont toujours répété un minimum de 2 fois. Chaque doigt est séparé par une séquence de 7 à 8 acides aminés, appellée le H/C link. La protéine TFIIIA comporte 9 de ces doigts.
Un autre sous groupe de doigt de zinc (appelé groupe Cx) est également rencontré. La protéine Gal4 a de tels doigts. Dans ce motif, l’atome de zinc est chélaté par 4 cystéines, et la boucle extrudée a une taille de 13 acides aminés.
Les doigts de zinc interagissent dans les grands sillons, et interagissent avec 4 nucléotides. Un « code » de reconnaissance a récemment été proposé, qui ne sera pas présenté ici.
Zinc finger codeVoir article: Isalan et al. (1997) Proc. Natl. Acad. Sci. USA, 94, 5617-5621.


Leucine Zipper
leucine zipper

Le motif Leucine Zipper n’est pas à proprement parler un motif de fixation à l’ADN. Il est cependant important de l’évoquer car c’est un motif structural qui va permettre le positionnement correct d’une région de la protéine se fixant à l’ADN. Ce motif a été identifié à l’origine dans une protéine enhancer. Le motif fait intervenir la répétition de Leucines tous les 7 résidus, ce qui va tous les positionner du même côté d’une héliced a. En général cette hélice est très longue avec un minimum de 6 tours d’hélice. De plus cette hélice est amphipatique, ce qui va permettre sa stabilisation vis à vis du corps plus ou moins globulaire de la protéine. Cette hélice va interagir fortement avec la même hélice d’un autre monomère. C’est cette interaction qui forme le zip. GCN4 possède un tel motif, et si on fusionne un motif de fixation à l’ADN on obtiendra une protéine chimère ayant la spécificité de reconnaissance du motif greffé (ici des doigts de zinc).









EF-Tu ARNHaut de page


INTERACTIONS PROTÉINES - ARN

Les amino acyl tRNA synthétases ont des domaines conservés mais pas de motifs courts conservés chez toutes ces protéines.
Le facteur d'élongation des protéines appelé EF-Tu est indispensable à l’élongation de la chaîne polypeptidique lors de la traduction des protéines chez les eucaryotes. Il permet que les ARNt se fixent au ribosome apportant ainsi chaque peptide. C'est donc une protéine abondante, qui existe sous deux formes liant respectivement le GTP et le GDP.  La forme GTP interagit fortement avec les ARNt, en donnant un complexe qui a la structure générale présentée. On distingue très nettement l'ARN de transfert avec sa forme dite en "tête de marteau". La protéine est sous forme de trois domaines dont les deux derniers interagissent avec l'ARN, tandis que le premier fixe le GTP. Le premier domaine, dit de fixation du ligand est de forme alpha-beta. Il ressemble à la protéine Ras (qui est une protéine G, fixant aussi GTP et GDP) Les deux autres domaines sont du type tonneau beta.









LA FIXATION D'UNE PROTÉINE À L'ADN AFFECTE SA MOBILITÉ ÉLECTROPHORÈTIQUE

Retards sur gel

EMSA

L’EMSA(Electrophoretic Mobility Shift Assay), et son dérivé le REMSA (RNA electromobility shift assay), est la technique la plus simple qui soit pour étudier une interaction entre un acide nucléique et des protéines. Elle repose sur le fait qu’un complexe ADN-protéine ou ARN-protéine migrera moins vite dans un gel non-dénaturant qu’un ADN ou un ARN nu. Ce retard de migration permet de juger au premier coup d’oeil si une séquence particulière d’ADN ou d’ARN a été reconnue et liée par une protéine. L'illustration présente le cas de deux sites portés sur un même fragment. Si les deux sites fixent la même protéine, l'apparition du second complexe sera fonction de la concentration en protéine dans la réaction.





supershift




La spécificité de l'interaction ADN-protéine peut être vérifiée en incubant le(s) complexe(s) formé(s) avec un anticorps reconnaissant la protéine, puis en déposant sur gel natif les produits générés. Le complexe ternaire ADN-protéine-anticorps a une migration encore plus retardée, qu'on qualifie de supershift. Cette technique est particulièrement adaptée lorsque les protéines ne sont pas purifiées (i.e. extraits nucléaires) afin de vérifier que les complexes observés sont bien spécifiques. Il est cependant possible qu'un anticorps qui fonctionne très bien en western ne soit pas efficace en supershift. Une possibilité est que l’épitope soit moins accessible lorsque la protéine est fixée sur un acide nucléique. Une autre, que son affinité ne soit pas assez forte pour résister aux conditions d’électrophorèse. De plus, il arrive parfois que des anticorps interfèrent avec la liaison ADN-protéine: dans ce cas, aucun supershift ne sera observé, et par ailleurs on observera une inhibition du gel-shift. Dans le cas de complexes faisant intervenir plusieurs protéines, le supershift permettra d’identifier dans quels complexes sont impliqués les différents partenaires.






Bending, substrats de permutation, détermination des angles de courbure

bendingPrincipe de la détermination de la courbure induite par la fixation d’une protéine sur son site ADN. La mobilité (µ) d’un complexe dépend de la distance entre ses extrémités (L). Cette distance est modifiée en fonction de l’angle de courbure a induit par la fixation de la protéine. µM représente la plus faible mobilité obtenue lorsque la protéine est fixée au centre du fragment d’ADN. la plus forte mobilité µE est obtenue lorsque la protéine est fixée à une extrémité.

L’utilisation de substrats de permutation va permettre d’accéder à la valeur de l’angle de distorsion induit par la fixation de la protéine. Plus le gel utilisé sera concentré, plus l’effet observé sur la migration sera important.

L’angle de courbure a peut être estimé d’après la relation empirique:     µME = cos (a/2)
Pour la  plus faible mobilité (µM) la distance entre les extrémités devient alors:    L’ = L cos (a/2)
Pour la plus grande mobilité (µE) a est quasi nul et L’ est sensiblement égal à L

Lorsque l’ADN est courbé, la courbure va induire un « déstacking » des paires de bases adjacentes. L’affinité d’une protéine qui induit une courbure dépend donc non seulement de la reconnaissance spécifique d’une séquence, mais également de la capacité de son site à se déformer. Il est très fréquent que des sites de fixation de protéines soient naturellement légèrement courbés.




Phasing

phasing







La migration de l’ADN est déterminée par la distance entre les extrémités. La localisation apparente du centre de courbure sera donc sensible à la présence des courbures environnantes. Ainsi la rotation d’une courbure par rapport à une autre en ajoutant des petits segments d ’ADN, conduit à une variation sinusoïdale de la distance entre les extrémités avec la périodicité d’un tour d’hélice. Si deux courbures sont dans le même plan et ont la même direction (cis) la distance entre extrémités sera minimale et l’effet sur la migration maximal. A l’opposé, une configuration trans conduira à une distance maximale entre les extrémités et un effet sur la migration minimal. Cette propriété peut être utilisée pour déterminer la direction d’une courbure à une position en utilisant comme référence une autre courbure de propriétés connues.






Source: Lane et al. (1992), Microbiol. Rev., 56: 509-528

Looping et sandwiches

loops & sandwiches


De nombreux opérons ont des sites multiples pour des protéines régulatrices (ou comme nous allons le voir dans un instant les bras du phage l pour l’assemblage de l’intasome). Il a été montré dans de nombreux cas que certaines protéines étaient capables d’interagir avec deux sites pour former une boucle (loop). On peut citer le cas de l’opéron arabinose. De tels assemblages ont également pu être démontrés par l’utilisation du retard sur gel. En particulier, de tels assemblages vont être sensibles au phasing existant entre les sites. On peut également tester ce type d’assemblage en regardant la formation de sandwiches. Le retard sera pratiqué en utilisant deux fragments d’ADN de taille différente qui vont conduire à une mobilité apparente intermédiaire entre les mobilités observées pour chaque fragment pris séparément.

Source: Lane et al. (1992), Microbiol. Rev., 56: 509-528



intasome assembly

Exemple: Assemblage de l'intasome lors de l'excision du prophage lambda

La formation du complexe nucléoprotéique conduisant à l'excision du prophage lambda du génome de son hôte repose sur différentes propriétés que nous venons d'aborder: courbure de l'ADN, importance du phasing, formation d'un sandwich.
















Recherche de sites génomiques par gel retard en 2 dimensions

        Source: Lane et al. (1992), Microbiol. Rev., 56: 509-528

retard en 2 dimensions
La possibilité de sélectionner par gel retard des molécules rares dans une grande population peut être utilisée pour localiser des sites de liaison spécifiques dans des génomes entiers. Le principal problème à circonvenir est que la quantité et la complexité des molécules d’ADN pourrait empêcher la résolution des fragments retardés. Ils peuvent en effet co-migrer avec des fragments non liés de plus grande taille. L’utilisation d’une seconde dimension de migration permet de contourner ce problème.
Un génome complet est soumis à une digestion par enzyme de restriction, et marquage avant d’être incubé avec la protéine d’intérêt (ici IHF sur le génome du phage lambda). La migration en première dimension va décaler vers le haut (retard) les fragments ayant fixé la protéine. La 2nde dimension sera réalisée dans des conditions permettant la dénaturation des complexes ADN protéine (température, agents chaotropes..). Les fragments retardés en 1ère dimension vont alors migrer « normalement » c’est à dire plus vite que ceux de plus haut poids moléculaire avec lesquels ils co-migraient dans la 1ère dimension. De fait, ils vont donc sortir de la diagonale et pourront être récupérés pour clonage etc…
Haut de page


L’ORGANISATION DE LA CHROMATINE AFFECTE L'ACCESSIBILITÉ DE L'ADN

Nucléase MicroccocaleLorsqu’il n’est ni répliqué ni transcrit, l’ADN est protégé par des protéines. Cette protection se fait par enroulement autour de protéines basiques (cationiques) capables de se lier avec l’ADN qui est un polyanion. Des octamères d'histones sont au centre de particules qu'on trouve tous les 200 nucléotides et autour desquels l’ADN s'enroule. La structure évoque un « collier de perles ». L’ADN ainsi lié aux histones est protégé contre l'action des enzymes. Une endonucléase peut digérer entre les « perles » et détacher des particules de 11 nm de diamètre appelées nucléosomes. Chaque nucléosome est constitué d'un fragment de DNA de 145 nucléotides et de huit molécules d'histones. La nucléase micrococcale a beaucoup de difficulté à couper l'ADN complexé à un nucléosome. On peut donc utiliser cet enzyme pour couper la chromatine entre les nucléosomes, et juger ainsi de l'état de la chromatine. L'ADN d'une cellule coupé à la nucléase micrococcale et séparé sur gel d'agarose ressemble à une échelle de fragments dont la taille est un multiple d'environ 145 pb. Ils correspondent à des monomères, dimères, trimères, etc. de nucléosomes. Quand on tranfère cette échelle sur une membrane et qu’on l’hybride avec une sonde d’ADN, on observera une échelle si la région où s’hybride la sonde a des nucléosomes en phase (régulièrement déposés) ou encore une traînée si les nucléosomes sont déphasés (déposés irrégulièrement).

   

©Benoît Leblanc, Université de Sherbrooke



Positionnement des nucléosomes par extension de monomères
Extention de monomères



Cette technique fournit énormément d'information sur la position des nucléosomes. On peut ainsi regarder l’état d’une région précise de l’ADN (accessibilité etc…)
La chromatine est digérée par la nucléase micrococcale jusqu'à l'obtention de monomères de nucléosomes. Les monomères sont ensuite purifiés et l'ADN extrait.

-A- La région d’intérêt est clonée dans un phagemide (2 pour avoir les 2 brins) afin de faire de l'ADN simple brin
-B- Les deux brins sont préparés indépendamment pour déterminer la position de chacune des deux extrémités des monomères (un seul brin est représenté ici).
-C- L'ADN récupéré des monomères de nucléosome est dénaturé et hybridé sur l'ADN simple brin du phagemide; il est ensuite allongé par la polymérase de Klenow. Chaque monomère donnera naissance à un fragment d'ADN dont la synthèse commence à une position qui lui est propre.
-D- L'ADN obtenu après l'extension par la Klenow est ensuite coupé avec une endonucléase coupant une fois dans le phage, ce qui génère une échelle de bandes: chaque bande de cette échelle a une taille correspondant à la distance entre l'extrémité distale du monomère et le site de restriction. Cela nous donne la positon d'une des extrémités de chaque nucléosome.

La même opération menée sur l'autre brin permettra d'obtenir la position de l'autre extrémité du fragment initialement protégé par le nucléosome.


Haut de page



DES MODIFICATIONS DES BASES PEUVENT AFFECTER LA FIXATION DES PROTÉINES

La technique de « methylation interference » est basée sur une modification chimique des Guanines et Adénines par le di méthyl sulfate (DMS). Elle permet de déterminer quelles bases établissent des contacts avec la protéine. La méthylation de positions essentielles à la fixation de la protéine inhibera le contact (=interférence).

La position N7 des guanines est localisée dans le grand sillon de la double hélice, et la position N3 des adénines dans le petit sillon. Les interférences observées permettront donc de localiser les contacts ADN-Protéine sur la double hélice.

Methylation interferenceMethylation interference 2



Un fragment d’ADN radiomarqué à une extrêmité est modifié dans des conditions telles qu’une seule base par molécule sera modifiée. Après méthylation, l’ADN est incubé avec la protéine dans des conditions permettant la formation de complexes. Les populations d’ADN lié et libre sont séparés et purifiés.
L’ADN est ensuite traité à la pipéridine ce qui conduit à couper les bases méthylées. Les échantillons sont ensuite déposés sur un gel dénaturant. Les bases critiques pour la fixation de la protéine ne produiront pas de bandes dans la population liée.






Ethylation interference


Sur le même principe, on peut également réaliser des tests d’Ethylation interference. Dans ce cas, le substrat ADN est éthylé par action de l’éthylnitrosourée. Cette méthode permet d’identifier les contacts critiques entre des Phosphate de l’ADN et la protéine. Ces contacts sont importants puisque les interactions électrostatiques fournissent l’énergie de binding de l’interaction. De plus, le squelette phosphate est relativement uniforme quelle que soit la séquence des bases. L’interférence d’éthylation est donc une des rares techniques qui puisse être utilisée pour étudier des interactions qui ne sont pas séquence spécifiques.

Exemple : Effet de l’éthylation sur la fixation de l’ARN Polymérase au promoteur LacUV5.
B= Bound (lié); F= Free (libre). Les effets sont très discrets. Les signaux affectés sont en général identifiés par analyse densitométrique.

Adapté de Noel & Reznikoff J. Biol. Chem. (2000) 275:7708-7712
article




Haut de page




LA FIXATION D'UNE PROTÉINE À L'ADN AFFECTE L'ACCESSIBILITÉ DES BASES

Principe du footprint
La méthodologie utilisée pour réaliser des footprints (empreintes) ou des expériences de protection, ou d’interférence est la même mais les informations fournies sont différentes.
 Les principes généraux sont les suivant:
Le fragment d’ADN à étudier est marqué à UNE seule extrémité. Il faut donc 2 types d’expériences pour obtenir les informations complètes sur une région.
Chaque fragment d’ADN ne sera attaqué statistiquement qu’une seule fois par l’enzyme ou le réactif chimique. Les réactions seront donc courtes en durée et les réactifs utilisés à de faibles concentrations. Ces conditions sont déterminées expérimentalement pour chaque ADN étudié.
Dans les réactions de footprint, la fixation de la protéine sur son site va le protéger de l’attaque de réactifs chimiques ou de l’action de nucléases. L’absence de dégradation permettra d’accéder à la séquence reconnue. Il est à noter que les footprints chimiques donnent des empreintes plus courtes que ceux obtenus par les nucléases (problèmes d’encombrement stérique).
Cette méthode peut également être appliquée aux ARN. La nucléase choisie sera alors une Rnase.










Empreinte à l’ExoIII
empreinte Exo III
L’exonucléase III a une activité 3’-5’ exonucléase, mais ne s’attaque qu’aux extrémités 5’ proéminentes ou franches. Elle ne digère pas l’ADN simple-brin, ni à partir d’extrémités 3’ proéminentes.
Cette activité de l’exo III est utile pour déterminer les limites d’une interaction entre une protéine et un fragment d’ADN. Si on marque l’extrémité 5’ du fragment au 32P, et que l’on traite celui-ci à l’exonucléase III pendant qu’une protéine en protège une partie, l’exonucléase III ne pourra digérer l’ADN que jusqu’à ce qu’elle entre en contact avec cette protéine. La taille de l’ADN protégé, qu’on détermine sur dénaturant, permet alors de déterminer jusqu’où s’étendait l’interaction ADN-protéine.
Un des avantages de l’empreinte à l’exonucléase III est que l’ADN non-protégé par une protéine est entièrement dégradé; une interaction partielle ne génère donc pas de bruit de fond.











Principe de l’empreinte à la DNaseI sur complexes purifiés

footprint sur complexes
A: Formation des complexes et traitement par la DNaseI.
Les complexes sont obtenus en incubant la protéine et son substrat marqué sur un brin. Ils sont ensuite soumis à l’action de la DNaseI, calibrée de sorte qu’il n’y ait qu’une coupure par brin.
B: Séparation des complexes formés sur gel natif.
1: substrat incubé seul (S0); 2: substrat traité à la DNaseI (SD); 3 : complexes formés après incubation du substrat avec la protéine puis traité à la DNaseI (SI et SII).
Les bandes S0, SD, SI et SII encadrées sont découpées. L’ADN de chaque bande est élué puis purifié.
C: Electrophorèse des ADN purifiés sur gel de séquence.
Les régions protégées au sein des complexes sont identifiées en comparant les profils obtenus avec l’ADN des complexes (SI et SII) et celui de l’ADN seul traité par la DNaseI (SD). Les séquences correspondantes peuvent être déterminées en faisant migrer en parallèle des réactions de séquence réalisées sur le même substrat.
footprint RNaPol












Exemple: Footprints à la Dnase I des complexes fermés et ouverts entre l’ARN polymérase et le promoteur Prmup-1265.
A: bottom strand; B: top strand.
C1, C2: contrôles sans et avec héparine
2,3: Closed complex sans et avec héparine (30’’ avec RNAP, héparine ajoutée avec DNase)
4: Open complex avec héparine (60’ avec RNAP, héparine ajoutée avec DNase)
Start transcription: +1
Article original: Li & McClure, J. Biol. Chem. (1998) 273:23549-23557





Empreintes chimiques

DMSLe principe de l’empreinte se prête à l’utilisation de différents réactifs outre les nucléases. On peut ainsi utiliser les réaction d’alkylation en utilisant le DMS (di méthyl sulfate) pour méthyler les Guanines et les Adénines. Les produits de la réaction sont la N7-Me G et la N3-Me A. Ces bases modifiées peuvent être coupées par la pipéridine. Cette réaction est celle qui est utilisée en séquence Maxam & Gilbert pour les purines (G+A).  Dans ce type de réaction, les G seront plus réactifs que les A.
On peut également générer dans le milieu d’incubation des radicaux hydroxyl libres qui attaquent la chaîne de phosphate de l’ADN et cassent un des brins de l’ADN.
La réaction pour générer ces radicaux est la suivante:
 Fe2+(EDTA4-) + H2O2 ---> Fe3+ (EDTA4-) + HO.
C’est le radical HO. qui attaque l’ADN. Il n’a pas de préférence quant à la séquence et tend à couper partout. Une telle empreinte peut donner plus de bruit de fond qu’une empreinte à la DNase parce que cette dernière, beaucoup plus massive, peut difficilement atteindre des sites situés sous la protéine qui protège l’ADN, alors qu’une petite molécule comme HO. y arrive plus facilement. D’autres radicaux peuvent être utilisés pour ce type de réaction, comme par exemple le cuivre-phénanthroline.

Haut de page



Empreintes in vivo : apport de la LM-PCR
L’analyse des interactions entre une protéine et de l’ADN ou de l’ARN in vivo nécessite deux étapes:
(i)  Modifier in situ les acides nucléiques par le réactif de footprint
(ii) Visualiser les footprints
Presque toutes les techniques utilisées pour étudier les interactions ADN-protéines in vitro peuvent être utilisées in vivo aussi. Il est juste un peu plus difficile de faire pénétrer les réactifs dans la cellule et d’en récupérer l’ADN par la suite. Parmi les traitements disponibles pour effectuer des empreintes in vivo, on peut retenir
(a)  la DNAse I: il faut alors perméabiliser les cellules (noyaux dans le cas des eucaryotes) pour permettre l’entrée de l’enzyme, et s’assurer de ce qu’il y ait assez de Mg2+
(b)  le DMS, qui pénètre spontanément dans les cellules et va causer une méthylation des guanines non-protégées. Les guanines méthylées peuvent alors être coupées par la piperidine.
(c) le footprinting UV, ou formation de dimères de pyrimidines par irradiation aux rayons ultraviolets UVB (280-320nm) ou UVC (200-280nm). Ces dimères de pyrimidines peuvent être coupés par une photolyase et la piperidine. Cette empreinte aux UV a l’avantage de ne pas (trop) affecter les cellules, et permet donc d’étudier une cellule très près de son état naturel.
présent dans le milieu.  La technique la plus populaire depuis une dizaine d’années pour récupérer des fragments d’ADN après une réaction d’empreinte in vivo est celle de LM-PCR, ou Ligation-Mediated Polymerase Chain Reaction. Cette méthode fourni un seuil de sensibilité et de spécificité qui convient pour visualiser des footprints sur des séquences mono copies ou sur des ARNm peu abondants.

Principe de la technique de LM-PCR
LM-PCRA- Récupération de l'ADN génomique. Cet ADN contient des coupures simple-brin, là où la DNAse I ou un autre agent comme le DMS a endommagé la chaîne d'acides phosphoriques, ou des coupures double brin si l’on a utilisé la Mnase (dans ce cas, la méthode change un peu).

B- Séparation des brins et hybridation de l'un d'eux avec une amorce spécifique de la région étudiée. L'autre brin pourra être étudié plus tard lors d'une autre expérience. Les fragments d'ADN générés à cette étape sont de tailles différentes, la coupure à la DNAse I étant partielle.

C- Extension de l'amorce. Cette élongation se fait jusqu'au bout de l'ADN matrice et génère donc une extrémité franche.


D- Ligation d'un adapteur double à l'extrémité franche. Comme l'autre extrémité n'est pas franche, l'adapteur ne peut pas s'y attacher. Cet adapteur a une extrémité prohéminente, ce qui permet d’éviter des concaténations. Elongation par PCR à partir d’une deuxième amorce spécifique, l'amorce a légèrement décalée de la première amorce. Ce changement d’amorce permet d’améliorer le résultat.

E- PCR entre l’amorce a et l'amorce b semblable à l'extrémité prohéminente de l'adapteur ajouté à l'étape précédente. Le premier cycle de PCR n’a fonctionné que dans un sens, c'est à dire à partir de l’amorce a, parce que l'amorce b n'avait pas encore de séquence complémentaire. Cette séquence sera synthétisée lors de ce premier cycle. Le fragment d’intérêt peut alors être amplifié puis cloné et séquencé.

Imaginons qu’on vienne de réaliser une expérience d’empreinte à la DNAse in vivo sur le promoteur d’un gène. L’ADN génomique entier de chaque cellule a été coupé par la DNAse I et nous voulons maintenant voir si des sites ont été protégés au niveau de ce promoteur. l’ADN génomique en entier est récupéré. L’ADN qui correspond au promoteur est en si petite quantité comparé à l’ADN génomique qu’il doit être amplifié par PCR pour pouvoir être visualisé de façon utile. Une amélioration vient d’être apportée en utilisant une amorce biotinilée à l'étape de l’extention de l'amorce. Cette méthode va permettre d’enrichir les produits d’extention en les piégeant avec des billes magnétiques couvertes de streptavidine. Les amplifications suivantes seront améliorées d’autant.
LM-PCR2
Dans un premier temps, une amorce spécifique au promoteur d'intérèt est utilisée. L’ADN génomique est dénaturé, et l’amorce 1 est utilisée pour allonger tous les fragments correspondant au voisinage du gène d’intérêt. Cette élongation s’arrête là où la DNAse I a fait une brèche dans le brin du bas. L’ADN du promoteur ainsi allongé est donc rendu franc à une de ses extrémités. Dans un deuxième temps, un adapteur (linker) partiellement double-brin est ligué au bout de cette extrémité franche.  Cet adapteur est franc à un bout et 5’ proéminent à l’autre; cela évite entre autres d’avoir un concatémère d’adapteurs au bout du fragment que l'on veut piéger: un seul réussit à s’y liguer. L’extrémité du fragment d’ADN se trouvant en amont de l’amorce 1 n’a pas pu être allongée et a donc une extrémité proéminente; l’adapteur ne peut pas s’y liguer non plus.
On commence alors la réaction de PCR en utilisant deux nouvelles amorces. La première se trouve un peu en aval de l’amorce 1. En fait, on pourrait ré-utiliser l’amorce 1, mais il a été démontré que changer d’amorce à cette étape améliore la spécificité des résultats. La deuxième amorce, amorce LP25, correspond à l’extrémité 5’ proéminente de l’adapteur. Comme la séquence sur laquelle cette amorce devrait s’hybrider n’est pas présente sur l’adapteur, le premier cycle de PCR est linéaire: seule l’amorce 2 peut s’hybrider à l’ADN et être allongée. Cette première élongation complète la séquence manquante de l’adapteur; lors du deuxième tour de PCR, l’amorce LP25 sera capable de s’hybrider et la réaction sera vraiment exponentielle.

Ingram et al. Nucleic Acids Res. (2005)33:e1
article










Exemple: Comparaison entre des footprints obtenus par différentes méthodes, in vitro et in vivo

footprints in vivo et in vitro


Les footprints obtenus in vivo (v) ont été obtenus par LM-PCR, et comparés à ceux obtenus in vitro (t) à partir du même ADN.
Dnase : l’alternance de sites hypo et hyper réactifs (flêches horizontales) obtenus in vivo est caractéristique du positionnement de nucléosomes. On voit bien de plus les empreintes des deux protéines régulatrices (CTCF et FP1).




Szabo et al., Mol Cell Biol. (2004) 24:4858-4868
article









Haut de page