Y染色体で探る日本人の起源 1.知識編
この謎解き物語の主役、Y染色体について
最初にY染色体は説明しておこう。
これはいわば、この謎解き物語の舞台説明である。
Y染色体は男だけが持つ染色体である。
そして子供のY染色体は、その父親のY染色体がコピーされた物だが、時には突然変異が起こってほんのわずかな変化が起こることもある。
しかし元のY染色体は同じだから、血縁関係が近ければそのY染色体の特徴はほぼ一致し、逆に血縁関係が離れるほど特徴が違ってくることになる。
つまり、ある集団でこのY染色体のどこが変異しているかを調べれば、その変異の似ている、血縁関係の近い者たちがわかるわけである。(この記事の最後でこのシミュレーションをしている)
さらにこの調査を人類全体でやって比較し、大まかにまとめていくつかに分類したのが、この次のY染色体の分類「世界のY染色体」である。
このときわかるのは血縁の近さだけではない。
どこが変異していてどこが同じか調べることで、その変異が起こった順番や、分岐の仕方もわかるわけである。さらに詳しく分析すればその変異の古さがわかり、つまりその変異の起こった成立年代までもわかるわけである。
つまりここで、Y染色体がいつどう分岐していったか、人類のY染色体の系統樹が描けるわけである。
用語の整理
ついでに、わかっているつもりでも紛らわしい、よく似た用語の整理もしておこう。
「DNA」と「遺伝子」と「染色体」の定義の正確な違いを説明できるだろうか?
学術用語というものは定義の変わる場合があるため、昔勉強したことがあっても確認の必要がある*1。定義の細かい部分が気になるため、私も確認しよう。
まだ知識編(後からミトコンドリア(DNAによる系統解析)の説明も付け加えた。最後におまけで実験室付き)は続くが、ここは知識の確認作業のようなものだから先に進んでもいいよ。
『Y染色体で探る日本人の起源』 目次
1.知識編(今いるのはココ!)
4-3.氷河期が終わるまでにやってきた人々3 C2(旧C3)(ただいま制作中! 近日公開)
5.その後やってきた人々(ただいま制作中! 近日公開)
6.混合民仮説(ただいま制作中! 近日公開)
説明できない! って方は続きをどうぞ。(ついでにミトコンドリアの説明もしてる)
- 「DNA」とは、遺伝子を構成する化学物質名デオキシリボ核酸(DeoxyriboNucleic Acid)のことであり、これはその頭文字を使った略称である。これは言語で例えれば文字に当たる。なお、DNAの集合が必ず遺伝子というわけではなく、遺伝子の調節(言語で例えれば接続詞や各種記号などに当たる)だとか別の機能を持っている場合(たとえばテロメア)もある。また、何の機能があるかわからない未解明部分*2もある。
- 「遺伝子」(ジーンGene)とは、遺伝情報の単位(言語で例えれば文章に当たる)であり、DNAもしくはRNA(リボ核酸。RiboNucleic Acid)で構成される。なお、定義として遺伝子の構成物質(使用する文字の種類)はこの二種類の核酸に限定されないはずである。まず、地球外生命体の遺伝子を構成するものは何かという可能性の問題があり、そして(未解明部分は問題となるが)既に電子データとしての遺伝情報の保存とそこからの人工遺伝子合成も可能なのだ。
ところで本来は、遺伝子は子孫に遺伝するから遺伝子である。しかし実際には、生殖細胞以外にあって子孫に遺伝しない場合でも、そのDNA配列は遺伝子と呼ばれる。 - 「染色体」(クロモソームChromosome)とは、細胞の中にあって遺伝情報を担う部品を指す。これは本来が細胞の中の部品名称(染色したら染まったから染色体)であり、核酸とタンパク質が組み合わさって構成されている。細胞核の中にある染色体のみを指すだけでなく、ミトコンドリアなど独立した部品内にある遺伝情報部品をそう呼ぶ場合もある。
ヒトの細胞核には23対、46本の染色体がある。うち一対が性染色体であり、男はX染色体とY染色体のセット、女はX染色体のみ二つのセットになっている。 - 「ゲノム」(Genom)というある生物の持つ遺伝情報全体を指す言葉もある。なお、ヒトゲノムと言ったらヒトの46本の染色体の遺伝情報を意味し、細胞核以外にあるヒトミトコンドリアなどのゲノム情報は含まれない。
ただし一般的な傾向として、これら学術的な定義のある言葉にも、日常会話で使用されるときの意味合いもあり、おそらく現実的には、ほとんど同じ意味で使うことの合意がされているだろう。
たとえば「遺伝子治療」のように、遺伝情報全体を遺伝子とかDNAとか呼ぶことも一般的である。
ここにも現れているが、同じ用語が学問分野によって異なる定義を持ってしまう場合もあるのだ。
これは例えば、患者など一般に向けてわかる言葉で説明する必要のある臨床医学と、厳密な定義の必要な研究する学問の間でも起こることである。特定の学問が用語定義の独占的決定権を持っているわけではないのだ。
ミトコンドリアDNAによる母系系統解析
ここでついでに、ちょうど説明に登場したミトコンドリアDNAによる系統解析の話もしておこう。
ミトコンドリアは基本的には母親からしか遺伝しない。ただし男も母親由来のミトコンドリアを持つ。
そのため、Y染色体と同じようにミトコンドリアDNAの変異を調べれば、調査対象が男であっても、今度は女の民族移動がわかるのだ。
もう一つ説明しておこう。このミトコンドリアが細胞の中で何をしているかと言えば、酸素呼吸によって体のエネルギー生産をしているのだ。
ひょっとするとこのミトコンドリア、酸素の薄い高地で、より優秀なミトコンドリアが選び抜かれるような適応進化があり得るのだろうか?
特に、酸素の薄い高地での出産は、産む母親だけでなく生まれてくる子供にとっても試練であり、そのミトコンドリアの遺伝的能力を厳しく選別することは考えられる。
出産における有利不利は、子孫の繁栄増減に直結するものだ。
文科省が科学技術週間にヒトゲノムマップのポスター用PDFを作ってた。
http://stw.mext.go.jp/common/pdf/series/genome_map/genomemap_2013_A2.pdf
2013年のデータで、Y染色体の遺伝子数449、X染色体の遺伝子数1717だそうな。
こういう数字は常に更新されるもので、wikipediaなどにはずいぶん古い数字が書かれている。もちろん、検証は必要だが新しい数字が正しいのだ。
Homo sapiens (ID 51) - Genome - NCBI*3には、もっと新しい(2016/4/5確認)、Y染色体の遺伝子数496、X染色体の遺伝子数1973という数字が書かれている。ミトコンドリアの遺伝子数も書かれていて、37だそうな。
おまけの実験室:分類と年代
ここでちょっと分類の仕方をシミュレーションしてみよう。
たとえば、遺伝子のある特定の位置に、もともとは【00000000】と同じ物が八つあるDNA配列があったとしよう。
ある集団を調べたら、他のDNA配列は同じでも、その特定位置の元配列【00000000】が変異した……
【00000001】 【00000300】 【03010000】
【03210000】 【03210030】 【20000001】
……の六種類の配列を持つ人々が見つかったとする。
するとこの集団の人々は、DNA配列の変異の共通部分を見ることで……
【00000001】→【20000001】
【00000300】
【03010000】→【03210000】→【03210030】
……と三つの系統に分けられ、さらにそれぞれの中での変異の順番もわかることになる。
たとえば、【03210030】から見て一箇所しか違わない【03210000】は極めて近い先祖であり、さらにもう一箇所違う【03010000】は、二つの【03210***】の共通の先祖だということになる。なお、【03010000】の先祖として【00010000】か【03000000】のどちらかがいたと考えられるが、それは(不在とは限らず)見つからなかったわけだ。
ここで、【00000001】や【00000300】や【20000001】が、DNA配列の違いすぎる【03010000】などの先祖になることはあり得ないわけである。
もちろん、実際の染色体はもっとずっとDNA量の多い物であり、この簡略化した例以上に、「完璧に同じ変異が起こるようなことは、一旦変異した状態が世代を経たあとで完璧に元に戻ることも含めて、確率的にあり得ない」と見なせるわけである。
ただし、DNAをチェックして修復する機能は、完璧ではないがちゃんと存在する。致命的なコピーが単純に残らない場合もある。世代を超えて残る変異とは、次世代に引き継がれる生殖細胞において、チェックにひっかからない場合も含めて元に修復できず、代々問題なく(むしろ有利な変異もある)その子孫を残し、大災害などでも失われなかったものである。
そしてこのとき、ある特定のDNA配列の成立年代の古さは、その一定の長さあたりの変異量から計算することができる。ある長さのDNA配列に一定期間でいくつの変異が起こるか、変異速度か変異確率を予測できていれば、実際にDNAの変異した数を数えることで、そのDNA配列が原型からおよそ何年ほど経過しているか、計算で出せるわけである。(ただし現在において知ることのできるのは時代を経た結果であるため、過去の大災害で激減する場合を考えたり、いろいろと考慮に入れる必要がある)
ある分岐以下の系統の成立年代の古さも、同様に変異量を調べればわかるわけだ。
それらの各系統をまとめれば、あちこちに予測の誤差はあるけれど、分岐年代もほぼ妥当な全体の系統樹が描くことができるわけである。*4
このように、DNA配列の変異を元にその分岐年代を推測できることから、これを分子時計とも呼ぶ。これは、すべての生き物の進化系譜を推定して系統樹を描くことにも役立っている。
ミトコンドリアDNAの変異量(多様性)から、古代の世界の人口変化予測もできる。
引用元http://mbe.oxfordjournals.org/content/25/2/468.long
mtDNA Variation Predicts Population Size in Humans and Reveals a Major Southern Asian Chapter in Human Prehistory
北の冷たい海に繋がらないインド洋の周辺は、氷河期でも暖かいよな。
このグラフは、篠田謙一さん『DNAで語る 日本人起源論』(2015)でも使われてた。(新しい本だしいいよ。崎谷さんの本も有名だけど、記述が既に古くなっててオススメできなかったり、日々新しい事実がわかる学問分野は紹介する本を探すのも一苦労する)
へえーと思ってたら、同じことをY染色体でやったものを見つけた。
引用元http://genome.cshlp.org/content/25/4/459.full
A recent bottleneck of Y chromosome diversity coincides with a global change in culture.
なんだこのY染色体だけにある谷間は!
(答えは次回)
*2:がらくたDNAとかジャンクDNAとも呼ばれたが無機能とは限らず不適切な表現だった
*3:NCBIはwikipediaに「国立生物工学情報センター(こくりつせいぶつこうがくじょうほうセンター、英: National Center for Biotechnology Information、NCBI)は、アメリカ合衆国の国立衛生研究所 (NIH) の下の国立医学図書館 (National Library of Medicine; NLM) の一部門」って書いてあった
*4:説明のために単純化してるが、変異は入れ替わるだけでなく、ダブったり縮まったりいろいろある。遺伝子となっている重要な場所は変異速度が遅く、強い意味が無いらしき反復配列領域で変異速度が速いなど、場所及び調べる種による変異速度の違いもある。