Génomique : étude du génome, c’est-à-dire de l’ensemble de l’ADN d’un organisme, permettant d’analyser la structure, la fonction et la variation génétique.
Transcriptomique : analyse de l’ensemble des ARN messagers, reflétant l’expression génique en réponse à des conditions biologiques spécifiques.
Protéomique : étude globalisée des protéines, incluant leur abondance, structure, modification et interaction, pour comprendre la fonction cellulaire.
Épigénomique : exploration des mécanismes de régulation de l’expression génique qui ne modifient pas la séquence d’ADN, comme les modifications chimiques des histones ou de l’ADN.
L’approche multi-omique consiste en une analyse intégrée de plusieurs niveaux biologiques, permettant de relier le génotype, qui correspond à l’information génétique, au phénotype, qui désigne la fonction biologique observée.
Le workflow inclut plusieurs étapes : la collecte d’échantillons (plasma, tissu, biopsie tumorale, cfDNA), la bioanalyse utilisant des technologies telles que le séquençage de nouvelle génération (NGS), la PCR ou les immunoassays, puis l’analyse bioinformatique pour extraire des insights exploitables.
Cette stratégie combine différentes approches pour une compréhension globale, notamment en utilisant la génomique, la transcriptomique, la protéomique et l’épigénomique, afin d’obtenir une vision complète du système biologique étudié.
L’analyse multi-omique est une stratégie intégrative qui relie plusieurs couches biologiques pour mieux comprendre la complexité fonctionnelle du vivant, en combinant collecte, analyse et interprétation de données variées.
NGS : méthode de séquençage qui permet la lecture massive de séquences d'ADN ou d'ARN, utilisée pour explorer la diversité génétique, la détection de mutations ou l’expression génique.
PCR : technique d’amplification ciblée d’ADN par cycles successifs de dénaturation, d’alignement des amorces et d’extension, utilisant une enzyme de synthèse.
qPCR : version quantitative de la PCR, qui utilise des sondes fluorescentes pour détecter en temps réel l’amplification de l’ADN, permettant d’évaluer la quantité initiale.
Digital PCR (dPCR) : technique de quantification absolue qui divise l’échantillon en milliers de compartiments, chaque compartiment contenant 0 ou 1 molécule cible, permettant un comptage digital précis.
Single-cell sequencing : séquençage d’une seule cellule, utilisant des codes-barres pour identifier chaque cellule et chaque molécule, afin d’analyser l’expression ou la génétique cellulaire à une résolution fine.
Barcoding cellulaire : procédé d’attribution d’un code unique à chaque cellule lors du séquençage, permettant de distinguer et d’analyser individuellement chaque cellule dans un échantillon.
NGS permet la lecture massive de séquences pour diverses applications : exploration génomique, détection de mutations, expression génique.
PCR et qPCR sont basés sur l’amplification spécifique d’ADN, avec la détection par fluorescence : la qPCR permet une quantification en temps réel.
dPCR offre une quantification absolue en divisant l’échantillon en micro-compartiments, chaque compartiment contenant 0 ou 1 molécule cible, ce qui permet un comptage précis.
Single-cell sequencing utilise des codes-barres pour analyser chaque cellule individuellement, en encapsulant cellules et oligos barcodés dans des gouttelettes via microfluidique, puis en séquençant l’ARN capturé pour obtenir des données sur l’expression génique, la diversité clonale ou l’hétérogénéité cellulaire.
Les technologies de séquençage reposent sur des principes distincts d’amplification, détection et résolution cellulaire, chacune étant adaptée à des besoins spécifiques en recherche ou diagnostic.
Double hélice : structure moléculaire de l’ADN caractérisée par deux brins complémentaires enroulés en spirale, selon un modèle spécifique.
Bases azotées (A, T, C, G) : composants fondamentaux de l’ADN, où A s’associe à T et C à G, formant des paires complémentaires.
Génome : ensemble complet de l’ADN d’un organisme, comprenant toutes ses régions, qu’elles soient codantes, régulatrices ou répétées.
Gènes : segments spécifiques de l’ADN qui contiennent l’information nécessaire à la synthèse des protéines ou à leur régulation.
Exome : sous-ensemble des exons, représentant environ 1 à 2 % du génome, contenant la majorité des mutations responsables de maladies.
Transcription et traduction : processus biologique par lequel l’information génétique est d’abord copiée de l’ADN en ARN (transcription), puis convertie en protéine (traduction).
L’ADN possède une structure en double hélice, composée de deux brins complémentaires. Ces brins sont formés par l’association de bases azotées : adénine (A) avec thymine (T), et cytosine (C) avec guanine (G). Le génome correspond à l’ensemble complet de l’ADN, qui comprend environ 3 milliards de paires de bases. Il englobe des régions variées : celles qui codent pour des protéines (régions codantes), celles qui régulent l’expression génétique (régions régulatrices), ainsi que des régions répétées. Les gènes sont des segments spécifiques de l’ADN contenant l’information nécessaire pour produire des protéines ou pour leur régulation. L’information génétique circule selon un flux : ADN → ARN (transcription), puis ARN → protéine (traduction). L’exome, constitué uniquement des exons, représente une petite fraction du génome mais contient la majorité des mutations pathogènes connues.
La structure en double hélice et l’organisation du génome déterminent la base moléculaire de l’information génétique et de son expression, en reliant la composition de l’ADN à ses fonctions biologiques.
Whole Genome Sequencing (WGS) : technique de séquençage qui lit l’intégralité du génome, incluant toutes les régions codantes et non codantes, pour une vision exhaustive de l’ADN.
Whole Exome Sequencing (WES) : méthode ciblée qui séquence uniquement les régions codantes, appelées exons, permettant une analyse plus ciblée et économique.
Variant calling : étape du processus qui consiste à identifier et à localiser les différences ou variations dans la séquence d’ADN par rapport à un génome de référence.
Capture par sondes : procédé de sélection des régions d’intérêt (notamment pour le WES) par hybridation avec des sondes spécifiques, permettant d’enrichir ces zones pour le séquençage.
Variants de type SNP, Indels, CNV, SV : différentes formes de variations génétiques détectées par séquençage, comprenant les mutations ponctuelles (SNP), insertions/délétions (Indels), variations du nombre de copies (CNV) et variations structurales (SV).
Le WGS consiste à séquencer l’intégralité du génome, offrant une vision exhaustive qui inclut aussi bien les régions codantes que non codantes. Il permet la détection de variants dans toutes ces régions, y compris celles qui ne sont pas directement impliquées dans la production de protéines.
Le WES cible uniquement les régions codantes, soit les exons, en utilisant une étape de capture par sondes. Cette approche est plus ciblée, ce qui la rend plus économique et adaptée à une recherche spécifique de mutations dans les zones responsables de la synthèse protéique.
Le WGS détecte à la fois les variants codants et non codants, tandis que le WES se limite aux exons, ce qui peut limiter l’analyse des régions régulatrices ou non codantes. La qualité de la capture par sondes influence directement la réussite de l’analyse en WES, car une capture inefficace peut entraîner des régions non couvertes ou mal analysées.
Les données générées par ces techniques sont volumineuses, comprenant des centaines de millions à milliards de reads, représentant plusieurs dizaines de gigaoctets par échantillon. Ces données permettent une recherche exploratoire approfondie, notamment la détection de variants non codants, mais rendent aussi l’interprétation complexe, avec de nombreux variants inconnus appelés Variants of Unknown Significance (VUS).
WGS et WES sont des approches complémentaires de séquençage, équilibrant exhaustivité et coût selon l’objectif de l’étude. Le WGS offre une vision globale, tandis que le WES privilégie la ciblée, plus économique, pour l’identification de mutations dans les régions codantes.
RNA-Seq : technique de séquençage qui permet de mesurer le niveau d’expression génique en analysant l’ARN à partir de son séquençage après conversion en ADN complémentaire (ADNc).
ARN messager (mRNA) : type d’ARN qui porte l’information génétique transcrite à partir du DNA pour la synthèse des protéines.
cDNA (ADNc) : ADN synthétisé à partir de l’ARN, utilisé pour le séquençage et la quantification de l’expression génique.
Quantification d’expression (TPM, FPKM) : méthodes permettant d’évaluer la quantité relative d’ARN messager en normalisant la lecture par la longueur du gène et le total des lectures.
Isoformes : différentes versions d’un même gène résultant de l’épissage alternatif, qui produisent des ARN messagers variés.
Fusions de gènes : événements où deux gènes distincts sont combinés, créant une nouvelle séquence hybride, détectée par RNA-Seq.
Le séquençage de l’ARN permet de mesurer le niveau d’expression génique en convertissant l’ARN en ADNc, puis en séquençant cet ADN pour analyser la quantité de chaque gène exprimé. Ce processus inclut plusieurs étapes : extraction de l’ARN, conversion en ADNc, fragmentation, séquençage, alignement des séquences, puis quantification. La technique permet d’identifier non seulement l’expression globale mais aussi la présence d’isoformes différentes et de fusions de gènes. Elle peut être appliquée à différents types d’ARN, notamment le total RNA, le mRNA et le small RNA.
La transcriptomique par RNA-Seq révèle l’activité fonctionnelle des gènes en capturant la diversité des isoformes et la dynamique de leur expression, essentielle pour comprendre la différenciation cellulaire, la réponse à un traitement ou l’identification de biomarqueurs.
Méthylation ADN : modification chimique de l’ADN qui consiste en l’ajout d’un groupement méthyle (CH₃) sur des cytosines, généralement dans les régions CpG, sans altérer la séquence d’ADN elle-même.
CpG : séquence spécifique composée d’une cytosine suivie d’un phosphate et d’une guanine, qui constitue la cible principale de la méthylation dans le génome.
Bisulfite sequencing : technique permettant de différencier les cytosines méthylées et non méthylées par conversion chimique, facilitant leur lecture différenciée lors du séquençage.
ATAC-Seq : méthode qui mesure l’accessibilité de la chromatine en insérant des adaptateurs dans les régions accessibles grâce à l’action d’une transposase, permettant d’identifier les zones actives de régulation transcriptionnelle.
Chromatine accessible : régions de la chromatine où l’ADN est décondensé, permettant l’interaction avec des facteurs de transcription et autres protéines régulatrices.
Transposase : enzyme qui insère des séquences d’ADN (adaptateurs) dans l’ADN chromatinien, utilisée dans ATAC-Seq pour détecter l’accessibilité chromatinienne.
La méthylation de l’ADN modifie chimiquement l’ADN en ajoutant un groupe méthyle sur les cytosines, principalement dans les sites CpG. Cette modification ne change pas la séquence d’ADN mais influence son activité, étant souvent associée à une répression transcriptionnelle.
La technique du bisulfite sequencing permet de différencier chimiquement les cytosines méthylées des non méthylées : lors du traitement, les cytosines non méthylées sont converties en uraciles, alors que les cytosines méthylées restent inchangées, ce qui facilite leur lecture lors du séquençage.
L’ATAC-Seq évalue l’accessibilité de la chromatine en insérant des adaptateurs dans les régions décondensées par l’action d’une transposase. Les régions chromatiniennes accessibles correspondent à des zones actives de régulation transcriptionnelle, où la chromatine est moins condensée et plus perméable aux facteurs de transcription.
L’épigénétique, via la méthylation de l’ADN, et l’accessibilité chromatinienne contrôlent la régulation génique en modulant l’activité des régions régulatrices, indépendamment de la séquence d’ADN.
Short-read : Technique de séquençage qui produit des lectures courtes, généralement comprises entre 100 et 300 paires de bases, caractérisées par une haute précision et un faible coût.
Long-read : Technique de séquençage générant des lectures longues permettant une analyse plus complète, notamment pour la détection de variants structuraux et d’isoformes.
Illumina : Plateforme de séquençage short-read, reconnue pour sa précision élevée, son haut débit et son faible coût.
PacBio : Plateforme de séquençage long-read, capable de produire des lectures continues de longues molécules en temps réel.
Structural Variants (SV) : Variants génomiques de grande taille, tels que délétions, insertions ou inversions, détectés efficacement par le séquençage long-read.
HiFi reads : Lectures de haute fidélité issues de PacBio, combinant la longueur des long-reads avec une précision accrue.
Le séquençage short-read consiste à produire des lectures courtes, généralement entre 100 et 300 paires de bases, nécessitant un assemblage bioinformatique pour reconstituer le génome. Il offre une précision élevée, un débit important et un coût réduit, ce qui le rend adapté à de nombreux projets de grande échelle. En revanche, il présente des limitations pour la détection de variants structuraux (SV) et d’isoformes complètes, car la courte longueur des lectures complique l’analyse de régions répétées ou complexes.
Le séquençage long-read, en revanche, génère des lectures continues de longues molécules, permettant une détection précise des SV, des répétitions et des isoformes entières. La technologie PacBio, notamment avec ses lectures HiFi, offre une combinaison de longueur et de précision, facilitant l’analyse de régions difficiles à assembler avec des reads courts. Cependant, cette méthode implique un coût plus élevé et une capacité moindre en termes de débit comparé au séquençage short-read.
La comparaison clé entre ces deux approches repose sur la longueur des lectures, le coût, et la capacité à détecter des variants ou isoformes complexes. Le choix dépend du compromis entre précision, budget et complexité des variants à analyser.
Le séquençage court est privilégié pour sa précision et son coût réduit, idéal pour des projets de grande échelle, tandis que le séquençage long offre une meilleure détection des variants structuraux et des isoformes, mais à un coût plus élevé. Le choix dépend du compromis entre précision, coût et complexité des variants à détecter.
| Date | Événement |
|---|---|
| Non mentionné | — |
| Non mentionné | — |
| Non mentionné | — |
| Domaine | Notions clés | Définition | Points essentiels | Maîtrise |
|---|---|---|---|---|
| Analyse multi-omique | Génomique, transcriptomique, protéomique, épigénomique | Étude intégrée de plusieurs niveaux biologiques pour relier génotype et phénotype | Approche combinant collecte, analyse et interprétation de données variées | Comprendre le workflow et l’intérêt de l’analyse multi-omique |
| Technologies de séquençage | NGS, PCR, qPCR, dPCR, Single-cell sequencing, Barcoding cellulaire | Techniques permettant la lecture massive ou ciblée d’ADN/ARN à différentes résolutions | Différences entre amplification, détection, quantification absolue et analyse cellulaire unique | Connaître principes et applications spécifiques de chaque technologie |
| Structure ADN et génome | Double hélice, bases azotées (A, T, C, G), gènes, exome | Organisation moléculaire et fonctionnelle de l’ADN et du génome | Relation entre structure moléculaire et fonction génétique | Maîtriser la composition et l’organisation du génome |
| Séquençage WGS et WES | Whole Genome Sequencing, Whole Exome Sequencing, variants (SNP, Indels, CNV, SV) | Techniques de séquençage exhaustif ou ciblé du génome ou des exons | Différences entre WGS et WES en termes couverture et coût | Savoir quand utiliser chaque méthode et leurs limites |
Teste seu conhecimento sobre Introduction à la génomique et séquençage com 6 perguntas de múltipla escolha com correções detalhadas.
1. Quelle est la caractéristique principale de l'approche multi-omique ?
2. Quelle est la fonction principale du séquençage d'une seule cellule ?
Memorize os conceitos chave de Introduction à la génomique et séquençage com 14 flashcards interativos.
Analyse multi-omique — définition ?
Approche intégrée de plusieurs niveaux biologiques.
Technologies de séquençage — principales ?
NGS, PCR, qPCR, dPCR, séquençage single-cell.
Structure ADN — bases complémentaires ?
A avec T, C avec G.
Importe seu curso e a IA gera fichas, quizzes e flashcards em 30 segundos.
Gerador de fichas