用語集【遺伝学】
遺伝学で出てくる用語をまとめました。独学なので間違い等があれば教えてください。
【Allele】
同じ遺伝子または遺伝子座のを占めることができる遺伝構成要素(塩基配列)が複数存在する場合、そのうちの一つの型。
【Annotaion catalog】
ノンコーディングRNAやトランスクリプトRNAにバインドするサイトのような特定の遺伝子領域の機能を記述したマップ。
【Common disease-common variant hypothesis】
Common diseaseに対する感受性関する遺伝的影響はpopulationの1から5%以上に存在するvariantの限定された数に寄与するという仮説。
【Complex condition】
複数の遺伝子と環境要素のインタラクションによるcondition。Multifactional diseaseともいう。
【Copy-number variation】
個人間の特定の遺伝子やDNA sequenceのコピー数のvariation。
【Epigenetics】
DNA塩基配列の変化を伴わず、DNAメチル化やヒストン修飾などの後天的な修飾により遺伝子発現を制御、伝達するシステム及び研究分野のこと。
【Expression QTL(e-QTL)】
transcriptの量を量的形質とし、それと関連する遺伝因子のマッピング
【Fine mapping】
Tag SNPを含んでいるhaplotype blockにあるすべての既知のSNPをtypingすることによりgenomewide association signalを狭める実験的アプローチ。上手くいけば、このアプローチの結果は、周囲の領域よりも強い相関があるブロックのsubsegmentを特定することになる。
【Fragments Per Kilobase of exon per Million mapped reads (FPKM)】
ノーマライズした発現量。RNA-seqでペアエンドで読んだときに使う。一組のリードを一つのフラグメントとしてみて計算する。【RPKM】を参照。
【Gene desert】
intergenic regionsに存在する長く延びたDNA。かつては、タンパク質の生合成に関与しない生物学的機能はないDNA、「ジャンクDNA」、として無視されていた。近年では、遺伝子発現の制御に大きな役割を果たすことが知られるようになっている。
【Gene expression】
遺伝子発現。発現。遺伝子の情報が細胞における構造および機能に変換される過程。具体的には、普通は遺伝情報に基づいてタンパク質が合成されることをさすが、RNAとして機能する遺伝子(noncording RNA)に関してはRNAの合成が発現ということになる。
遺伝子の機能の記述に関して、生物学分野における共通語彙を分類するシステム。このシステムは、三つのカテゴリーに分かれる。
- biological process
- cellular component
- molecular function
【Gene pool】
あらゆる集団(一般的には特定の種)における全ての遺伝子、または遺伝情報の集合のこと。
【Genetic variation】
とあるgene poolにおける遺伝子のアレルの多様性。
【Genome-wide association study (GWAS)】
遺伝情報(全ゲノムを網羅するSNPのジェノタイプデータ)と形質情報(病気や量的形質)との関連性を評価する統計学の手法の一つ。
遺伝的多様性を代表するSNPを位置マーカーとして用い、特定の形質を連動する(control群よりもcase群で有意に高頻度に認められる)SNPを見つけ出し、その付近に存在すると推定される感受性遺伝子をリスト化する。
【Haplotype】
DNA variationまたはpolymorphismのセット。それらは互いに遺伝する傾向がある。Haplotypeは同一染色体上で見られるアレルの組み合わせやSNPのセットに言及することができる。
【Heritability】
遺伝率。多因子遺伝形質の遺伝要因の度合いの指標。遺伝率は、遺伝要因がもたらす形質の分散(variance)と形質全体の分散の比で表される。その比が「0」ならその形質は遺伝要因の影響がなく、「1」なら完全に遺伝要因が影響している。
【Human leukocyte antigen (HLA)】
ヒト白血球型抗原。ヒトのMHCのこと。白血球の血液型といえるもの(一般的なABO式の血液型は赤血球の型を指す)。
【Intergenic region】
遺伝子を含んでいないまたはオーバーラップしていないDNAのセグメント。
【Intron】
たんぱく質に翻訳される前に除かれる遺伝子の一部。適切な遺伝子発現にとって欠かせない規制情報を含んでいる。
【Inversion】
相補の遺伝配列を持っているが、切り取られたりまた同じ場所に再挿入される染色体の領域。
【Major histocompatibility complex (MHC)】
主要組織適合遺伝子複合体。免疫反応に必要な多くのタンパクの遺伝子情報を含み大きな遺伝子領域。
【Mapping】
染色体上における遺伝子や突然変異の位置を決めること。
【Meta-analysis】
複数の研究の結果を統合し、より高い見地から分析すること、またはそのための手法や統計解析のこと。
【Microarray】
細胞内の遺伝子発現量を測定するために、多数のDNA断片をガラスなどの基板上に高密度に配置した分析器具のこと。DNAチップ。
【Missense mutation】
コドンが別のアミノ酸のコドンになる変化。
【Nonsense mutation】
アミノ酸のコドンが終止コドンになる変化。
【Polymorphism】
多型。表現型多型と遺伝的多型に分けられる。
- 表現型多型:二つ以上の異なる表現型が同じ種の集団の中にぞんざいする状態をさす。
- 遺伝型多型:同じ生物種の集団のうちに遺伝子型(genotype)の異なる個体が存在すること、またはその異なる遺伝子・DNA配列のことをいう。
【Reads Per Kilobase of exon per Million mapped reads (RPKM)】
ノーマライズした発現量。リファレンス全体にマップされたリード数が仮に100万本とするとき、各遺伝子にマップされたリードは何本に相当するか。また、長い転写産物はその分たくさんのリードがマップされるので、それらの長さも考慮しなければならない。そこで、全転写産物が1kbであると仮定して、各転写産物にマップされたリード数は何本か。これらを考慮したのがRPKM。RNA-seqでシングルリードで呼んだときにつかう。
【Silent mutation】
コドンが同じアミノ酸だが別のコドンになる変化。
【Single-Nucleotide Polymorphism (SNP)】
ある集団の中でゲノム塩基配列中の一塩基が変異した多様性が見られ、その頻度が1%以上で存在する多様性。
【Synonymous SNP】
coding regionにおけるSNPには、二つのタイプ、synonymous SNPとnonsynonymous SNP、がある。