PMC

Associations de maladies CNV

L’effet des CNV sur l’expression des gènes et leurs effets potentiellement perturbateurs sur la structure et la fonction des gènes, suggère qu’ils sont susceptibles d’apporter une contribution considérable aux maladies humaines. Cependant, en raison de la découverte relativement récente de VCN et des limites actuelles des techniques à haut débit, l’étendue complète des associations de maladies à VCN n’est pas encore claire. Néanmoins, compte tenu du nombre croissant de cas où de telles associations ont été démontrées, il est probable qu’elles apportent une contribution substantielle à la maladie humaine.

Étant donné le grand nombre de gènes qui sont chevauchés par les CNV (Tableau (Tableau 1), 1), une proportion significative de gènes biomédicalement pertinents sont susceptibles d’être affectés. Dans notre étude de découverte du VCN, par exemple, près de la moitié des gènes se croisant des variantes étaient représentés dans la base de données OMIM, y compris les gènes associés aux maladies mendéliennes, aux troubles génomiques et aux maladies courantes (de Smith et al., 2007). En effet, de nombreuses modifications du nombre de copies de gènes contribuent directement aux maladies monogéniques. Dans les maladies récessives, une hémizygosité due à la délétion d’un gène, ou d’une partie d’un gène, pourrait démasquer une mutation sur l’autre copie du gène. Inversement, la duplication d’une copie génique saine sur un chromosome pourrait théoriquement masquer les effets d’une mutation pathogène du gène sur l’autre chromosome, sauvant ainsi le phénotype. En effet, il a été prédit qu’une partie de la pénétrance variable démontrée par de nombreux troubles génétiques dominants pourrait être expliquée par les CNV (Beckmann et al., 2007).

La maladie d’Alzheimer autosomique dominante à début précoce (ADEOAD) est connue pour être causée par des mutations faux sens dans les gènes APP sur le chromosome 21, mais une duplication du locus APP a également été trouvée chez les patients atteints de ce trouble (Rovelet-Lecrux et al., 2006). On pense que ce gain de nombre de copies conduit à une abondance de dépôts amyloïdes dans le cerveau. De même, la triplication du gène SNCA, qui conduit à une profusion de corps de Lewy, a été associée chez des patients atteints de la maladie de Parkinson autosomique dominante (Singleton et al., 2003). Aucun de ces gènes n’est connu pour être chevauché par des variants chez des individus en bonne santé, et ces gains de nombre de copies sont donc à la base de la maladie: de telles caractéristiques sont appelées mutations du nombre de copies (MNC). La perte ou le gain de matériel exonique pourrait également entraîner des mutations erronées ou des décalages de cadres: en effet, la dystrophie musculaire de Duchenne (DMD) est généralement causée par des suppressions et des duplications de novo entraînant des décalages de cadres. Si ceux-ci étaient découverts pour la première fois aujourd’hui, ils seraient connus sous le nom de CNMs. Il est important de noter que la plupart des stratégies de séquençage pour l’identification des mutations à l’origine de la maladie monogénique manqueraient de telles variantes, ce qui pourrait donc expliquer une proportion importante de mutations « manquantes » et compliquer le conseil génétique.

En plus des maladies monogéniques, les variations du nombre de copies de grandes régions génomiques sont la cause sous-jacente de nombreux troubles génomiques, et de telles aberrations peuvent affecter le nombre de copies de plusieurs gènes. Dans certains cas, on pense que les changements de dosage de nombreux gènes contribuent au phénotype, par exemple avec le ∼1.Délétion de 6 Mb au chromosome 7q11.23 qui conduit au syndrome de Williams-Beuren (Peoples et al., 2000). Dans d’autres troubles, tels que le CMT1A et le SMS, on pense que les modifications posologiques d’un seul gène sont à la base de la maladie (Roa et al., 1991; Slager et coll., 2003). L’interprétation des données issues des études cliniques sur la cause sous-jacente des troubles génomiques suspectés est souvent compliquée par la présence de CNV. Nous n’avons pas encore une appréciation complète du spectre normal de variation du nombre de copies, en particulier dans les groupes de population non HapMap (Consortium international HapMap, 2003), et il peut donc être très difficile de faire la distinction entre les CNV bénignes et les variantes pathogènes. D’autres complications peuvent être causées par des CNV qui chevauchent des aberrations plus importantes, de sorte que différentes combinaisons de variantes atténuent ou aggravent les phénotypes. Cela pourrait aider à expliquer, par exemple, les différentes manifestations de phénotypes observées chez les patients atteints de trisomie 21: par exemple, 40 % des patients ont des malformations cardiaques congénitales (Freeman et al., 1998) et ∼1% développent une leucémie (Zipursky et al., 1992).

La situation en ce qui concerne la maladie complexe est encore moins simple. Les progrès récents de l’analyse des maladies complexes, utilisant des approches d’association de SNP à l’échelle du génome, ont mis en évidence de nouveaux gènes et des voies pathogènes potentielles (Frayling et al., 2007; Sladek et coll., 2007), mais les marqueurs SNP trouvés ne tiennent toujours pas compte de l’héritabilité estimée de ces troubles. Il est donc probable que d’autres facteurs génétiques contribuent à des troubles complexes courants, notamment des variantes rares, des modifications épigénétiques et des variations du nombre de copies. Bien que les CNV chevauchent de nombreux gènes biologiquement importants, dont plusieurs étaient déjà associés à la maladie, cela ne prouve pas en soi qu’ils jouent un rôle dans la maladie. Par conséquent, des études sont en cours pour identifier les VCN spécifiques associées à la maladie. Cela a déjà conduit à des associations de maladies signalées avec des variantes relativement courantes dans des populations apparemment en bonne santé. Une proportion importante de ces associations a été trouvée avec des gènes impliqués dans le système immunitaire et dans la défense contre les maladies. Le premier exemple de ceci a été la découverte qu’un faible nombre de copies d’un CNV fréquent comprenant le gène FCGR3B est associé à la glomérulonéphrite chez le rat et l’homme (Aitman et al., 2006). Ce gène joue un rôle clé dans la régulation des réponses inflammatoires et immunitaires, en particulier dans l’attache des neutrophiles aux complexes immuns et la clairance de ces complexes, et a depuis été associé au lupus érythémateux disséminé (LED) et à d’autres maladies auto-immunes systémiques, telles que la vascularite associée à l’ANCA (Fanciulli et al., 2007).

Comme décrit précédemment, les variations du nombre de copies d’un autre gène, le composant du complément C4, ont longtemps été associées au LED. Ce gène joue également un rôle dans la clairance des complexes immuns, ainsi que dans l’activation des voies du complément qui agissent contre les microbes envahisseurs et dans la réduction du seuil d’activation des lymphocytes B. Il a récemment été confirmé que de faibles nombres de copies de C4 augmentent le risque de LED, tandis que des nombres élevés de copies de ce gène ont un rôle protecteur contre la maladie (Yang et al., 2007).

Un autre gène impliqué dans la défense contre la maladie est CCL3L1, qui est également incorporé dans un CNV extrêmement commun et hautement polymorphe. Ce gène a été impliqué dans la susceptibilité et la progression de la maladie chez le VIH, puisque CCL3L1 est le ligand le plus efficace pour le récepteur de la chimiokine CC 5 (CCR5), qui est le principal co-récepteur du VIH, il s’agit donc d’une importante chimiokine suppressive du VIH (Menten et al., 2002). La possession d’un faible nombre de copies de CCL3L1 est un facteur de risque majeur pour le VIH, associé à des charges virales plus élevées et à une perte subséquente accrue de lymphocytes T (Gonzalez et al., 2005).

L’exemple le plus intrigant d’un CNV associé à une maladie qui chevauche des gènes liés au système immunitaire est celui des gènes de la bêta-défensine, qui sont candidats à la variation de la susceptibilité aux troubles auto-immunes et inflammatoires, en raison de leurs rôles antimicrobiens et pro-inflammatoires. Le nombre de copies de ces gènes varie considérablement chez les humains (Armour et al., 2007) et aussi des macaques, ce qui suggère qu’il s’agit d’un ancien point chaud pour la variation du nombre de copies (Lee et al., 2008). Une grande unité de répétition au chromosome 8p23.1, y compris DEFB4, SPAG11, DEFB103, DEFB104 et DEFB105 entre autres, est très variable en nombre de copies, avec des individus portant entre 2 et 12 copies par génome diploïde. Un nombre élevé de copies de cette unité augmente la sensibilité au psoriasis, une maladie inflammatoire de la peau courante, compatible avec une réponse immunitaire exagérée conduisant à une maladie inflammatoire (Hollox et al., 2008). Inversement, un faible nombre de copies du gène DEFB4 a été associé à la maladie de Crohn du côlon, qui serait due à un affaiblissement de la barrière antibactérienne de la muqueuse du côlon dû à une carence relative en bêta-défensines (Fellermann et al., 2006). Il s’agit du premier exemple d’une VCN commune qui, dans un nombre de copies faible, peut conduire à une maladie, et dans un nombre de copies élevé, peut conduire à une autre maladie phénotypiquement distincte.Il a également été démontré que les variants

chevauchent des gènes pertinents pour le cancer, par exemple une région de délétion de 630 kb sur le chromosome 3p21.3 supprimé dans le cancer du poumon, incorporant trois gènes suppresseurs de tumeurs TUSC2, TUSC4 et NAT6, s’est avéré chevaucher une délétion CNV relativement commune dans une population apparemment saine (Wong et al., 2007). De nombreux autres oncogènes et suppresseurs de tumeurs sont affectés par la variation du nombre de copies, notamment LPP, MLLT3, MEN1, APC, VAV2, TNFRSF25, BCAS1 et HIC2 (Conrad et al., 2006; de Smith et coll., 2007; Wong et coll., 2007). Des études pour déterminer leurs conséquences sur la sensibilité au cancer sont en cours, mais nous avons déjà au moins un exemple d’association significative. Une variante de délétion UGT2B17, trouvée chez environ 11 à 12% des sujets sains, présente une association significative avec le risque de cancer de la prostate chez les Caucasiens. Des niveaux accrus de testostérone sérique et d’autres androgènes sont un facteur de risque de cancer de la prostate, et on pense que la délétion de ce gène, qui est impliqué dans le métabolisme des androgènes, peut entraîner une augmentation des taux sériques d’androgènes (Park et al., 2006). Une question intéressante, qui n’a pas encore été étudiée, est de savoir s’il existe une relation entre les CNV héritées dans les régions génomiques pertinentes pour le cancer et l’incidence des différentes pertes et gains génomiques qui se produisent au cours de la progression du cancer. Étant donné que ces changements ont une signification pronostique considérable, une telle relation peut avoir des conséquences importantes pour les premières décisions sur la prise en charge thérapeutique.

Comme décrit, les gènes impliqués dans le développement du cerveau sont enrichis en CNV (de Smith et al., 2007), et une partie de ces variantes peut donc contribuer à la susceptibilité aux troubles neurologiques et psychiatriques, tels que le trouble bipolaire (BD) et la schizophrénie. En effet, certains des gènes candidats BD et schizophrènes les plus importants, tels que PDE4ß, CHRNA7 et DISC1, sont chevauchés par des variants connus. Dans une cohorte de patients BD, par exemple, une augmentation significative a été constatée pour la présence d’un CNV connu chevauchant le GSK3ßgene par rapport aux témoins sains (Lachman et al., 2007). Il s’agit d’un gène candidat crédible pour le BD car il est impliqué dans le développement des cellules neuronales, et il a été démontré que des souris transgéniques avec une surexpression de GSK3ß imitaient des actes de manie clinique, avec une activité locomotrice accrue et une réponse acoustique de sursaut (Prickaerts et al., 2006). Le GSK3ßvariant n’a été documenté que dans deux échantillons témoins sains jusqu’à présent, de sorte qu’il pourrait être décrit comme un CNV rare. Certaines études visant à identifier des variants associés à des maladies particulières ont cependant mis au jour des variants du nombre de copies de gènes qui ne sont présents que chez les patients atteints de ces maladies et non dans la population générale. Ces variantes devraient donc être nommées à juste titre mutations du nombre de copies (MNC), car elles ne sont pas présentes à une fréquence appréciable (> 1%) dans la population générale et peuvent être la cause directe de la maladie, plutôt que d’agir comme des locus de susceptibilité.

En plus des CNV courants jouant un rôle dans les troubles neurologiques, un certain nombre de CNM de novo ont également été associés à de telles maladies. Des variants incorporant trois gènes exprimés par le cerveau impliqués dans la signalisation du glutamate, GLUR7, AKAP5 et CACNG2, n’ont été trouvés que chez des patients schizophrènes dans une étude (Wilson et al., 2006). On suppose que ces gènes sont exprimés de manière différentielle au début du développement embryonnaire humain et que le développement d’un système nerveux central normal dépend d’une régulation complexe de ces gènes (Wilson et al., 2006). Une étude récente indique également que de rares variantes de novo avec une pénétrance élevée peuvent sous-tendre la schizophrénie dans certains cas. Xu et coll. (2008) ont constaté une fréquence de 10% de nouveaux variants chez les patients atteints de schizophrénie sporadique, ce qui était huit fois plus élevé que chez les témoins. Le nombre de gènes chevauchés par ces variants était relativement faible, mais l’analyse GO a montré que les catégories les plus enrichies étaient des voies associées au développement neuronal (Xu et al., 2008). Ces résultats sont reflétés par un autre rapport récent d’une association avec des variants rares affectant les gènes neurodéveloppementaux dans les cas de schizophrénie (Walsh et al., 2008).

Les résultats de ces études sur la schizophrénie ont des parallèles dans des enquêtes récentes sur la génétique de l’autisme, car des associations de variantes de novo ont également été déterminées avec ce trouble neurodéveloppemental (Sebat et al., 2007; Marshall et coll., 2008). Sebat et coll. (2007), par exemple, ont constaté que la fréquence des mutations spontanées était de 10% dans les cas sporadiques d’autisme, contre seulement 1% chez les témoins non affectés, et un certain nombre de gènes, dont SHANK3, NLGN4 et NRXN1, ont été impliqués dans l’étiologie de l’autisme par des études de variation du nombre de copies. L’interprétation de ces données est cependant quelque peu compliquée par les difficultés inhérentes à (a) prouver qu’une variation particulière du nombre de copies est effectivement de novo (la plupart des méthodologies actuelles souffrent de résultats faussement négatifs et faussement positifs élevés) et (b) établir le taux « normal » de génération de changements de nombre de copies de novo.

La distinction entre les variants du nombre de copies de gènes communs et les MNC rares n’est pas toujours claire. Un exemple particulier de ceci sont les gains et les pertes de nombre de copies communs de la région sur le chromosome 7 qui incorpore les gènes PRSS1 et PRSS2, mutations faux sens dans lesquelles sont connues pour provoquer une pancréatite héréditaire. Il s’agit d’une maladie autodigestive, dans laquelle une cascade d’activation des enzymes digestives pancréatiques est causée par l’activation prématurée de la trypsine (Le Maréchal et al., 2006). Des CNV chevauchant les deux gènes ont été trouvés chez des individus en bonne santé, mais une triplication de cette région est associée à la maladie. On pense que l’augmentation de la dose des gènes PRSS1 et PRSS2 triplés peut perturber l’équilibre entre l’activation et l’inhibition de la trypsine dans le pancréas (Le Maréchal et al., 2006), ce qui suggère qu’une duplication du même locus sur les deux chromosomes pourrait avoir le même effet. La région triplée est donc une mutation du nombre de copies qui sous-tend la maladie, alors qu’un gain de copie unique sur un chromosome (c.-à-d. la duplication CNV) pourrait être décrit comme une prémutation CNV pour le phénotype adverse. La situation est cependant encore compliquée par l’identification récente d’une duplication de ce locus chez quatre patients atteints de pancréatite héréditaire, qui n’a pas été trouvée chez les témoins (Masson et al., 2008b): il est donc possible que la duplication de ce locus puisse, chez certains individus, provoquer des maladies, mais chez d’autres agir comme un VNC bénin.

Il a également été récemment démontré que la même maladie résultait d’un autre mécanisme génétique. Comme mentionné précédemment, Masson et coll. (2008a) ont identifié un gène hybride PRSS2/PRSS1, qu’ils décrivent comme ayant un effet de « double gain de fonction », avec des conséquences à la fois qualitatives et quantitatives, dans une famille française atteinte de pancréatite héréditaire. Ce gène de fusion consiste essentiellement en une duplication de la moitié de chaque gène, agissant ainsi comme une CNM « quantitative », en plus d’une mutation faux sens « qualitative », qui a abouti à un phénotype très pénétrant dans cette famille. Cela semble être une nouvelle relation génotype-phénotype.

Jusqu’à présent, très peu d’études ont été menées pour examiner les effets doubles des CNV et des SNP. Un exemple, cependant, est l’analyse du gène du facteur H du complément et du cofacteur membranaire (CFH), qui contient un variant d’acide aminé prédisposant à la dégénérescence maculaire liée à l’âge (Klein et al., 2005). Ce gène est contenu dans une région CNV; il est donc possible que des variations du nombre de copies de ce gène, ou de sa région génomique environnante, puissent modifier le risque de maladie. À l’appui de cela, il a été démontré qu’un haplotype portant des délétions des gènes CFHR1 et CFHR3 voisins protège contre la maladie (Hughes et al., 2006). Cet exemple met en évidence la nécessité d’évaluer la contribution des deux types de variantes aux phénotypes complexes et aux maladies, car de tels cas ne peuvent être que la pointe de l’iceberg (Masson et al., 2008a).

Il est donc probable que les variations du nombre de copies de gènes jouent un rôle important dans la santé humaine, certains CNV de gènes communs augmentant la susceptibilité à certaines maladies complexes, alors que ce que l’on appelle les CNM sont la cause directe de maladies de type mendélien. Les estimations actuelles indiquent que les variantes du nombre de copies chevauchent davantage le génome humain que les SNP (estimations actuelles de bp 29% pb cf. 0,4% (http://projects.tcag.ca/variation)); cependant, il reste à prouver si les CNV sont la principale source de différences interindividuelles dans le phénotype physiologique, ainsi que dans la forme physique globale et la susceptibilité aux maladies. L’interaction entre les SNP et les CNV pertinents sur le plan fonctionnel ajoute un niveau supplémentaire de complexité aux enquêtes.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.