Y染色体で探る日本人の起源 3.日本人の構成
日本人のY染色体ハプログループ構成
まずはデータをお見せしよう。
wikipediaの日本人にあるデータをそのままコピーしても面白くないため、元の論文の確認をしたついでに、別の論文からのデータ追加というついで以上のことをして合算データを作成した。
既にDが日本人の三分の一強などの話をしているが、その元になっているのがこれらのデータである。
日本人のY染色体ハプログループ構成グラフ(人口比換算)
D1b | C1a1 | C2 | O1a | O1b1 | O1b2*(x47z) | O1b2-47z | O2 | N | 他 | サンプル数 | |
---|---|---|---|---|---|---|---|---|---|---|---|
北海道 札幌+旭川+N |
42.3 | 2.9 | 5.6 | 1.0 | 1.7 | 7.6 | 17.7 | 17.6 | 0.6 | 3.1 | 712 508+201+3 |
東北 青森+N |
35.6 | 6.7 | 0.0 | 4.4 | 0.0 | 6.7 | 26.7 | 11.1 | 6.7 | 2.2 | 45 26+19 |
関東 川崎+N+東京茨城 |
37.2 | 4.4 | 5.5 | 1.2 | 0.5 | 8.3 | 24.6 | 16.6 | 1.1 | 0.5 | 565 321+137+57+50 |
東海甲信 名古屋+静岡+N |
32.9 | 5.0 | 1.7 | 2.3 | 0.3 | 11.3 | 22.3 | 21.9 | 0.7 | 1.7 | 301 207+61+33 |
北陸(越) 金沢+N |
32.4 | 3.9 | 6.3 | 1.3 | 2.0 | 10.5 | 20.3 | 20.1 | 1.7 | 1.5 | 543 530+13 |
関西 大阪+N |
31.5 | 6.2 | 6.9 | 1.2 | 0.8 | 10.4 | 18.8 | 20.8 | 1.9 | 1.2 | 260 241+19 |
中国 山口+N |
30.0 | 3.3 | 5.0 | 6.7 | 0.0 | 5.0 | 20.0 | 30.0 | 0.0 | 0.0 | 60 44+16 |
四国 徳島三論文+N |
28.5 | 6.4 | 6.9 | 1.3 | 2.3 | 9.0 | 23.0 | 19.3 | 2.3 | 1.1 | 534 398+70+57+9 |
九州 長崎+福岡+H+N |
30.8 | 3.4 | 6.2 | 0.4 | 1.1 | 9.4 | 24.6 | 20.9 | 1.5 | 1.3 | 468 300+102+53+13 |
沖縄 二論文合計+N |
45.1 | 6.8 | 1.5 | 0.8 | 0.8 | 6.0 | 17.3 | 18.8 | 0.0 | 3.0 | 133 87+45+1 |
全体 アイヌ限定データ除く |
34.7 | 4.5 | 5.5 | 1.3 | 1.3 | 9.0 | 21.4 | 19.3 | 1.3 | 1.6 | 3621 |
人口比換算 | 34.2 | 4.8 | 4.9 | 1.8 | 0.7 | 9.0 | 22.6 | 19.1 | 1.6 | 1.2 | 単純合計せず地方別人口比換算 |
アイヌ限定 | 89.5 | 0.0 | 10.5 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 19 |
参考・韓国 | 1.6 | 0.2 | 12.3 | 2.2 | 1.0 | 22.5 | 8.9 | 44.3 | 4.5 | 2.6 | 506 |
※O1b2-47z(ハプログループO1b2a1a1)の47zは変異のラベル*1である。
またO1b2*(x47z)はこの変異47zがない、それ以外すべてのO1b2下位系統を意味している。
なお、データ作成方法及び参照した論文については今回の最後にまとめて記す。
2016/12/21アイヌ更新 別室β版
データの解説
- 「全体」は単純合計による比率で、「人口比換算」は日本の2010年国勢調査を参照した地方別男の人口比に従った比重をもって日本全体の割合を算出したもの。日本全体の状況を出すには人口比換算するのが正しいが、サンプルの少ない地方の誤差が拡大されるという注意点がある。
- アイヌを個別に調査したデータは北海道にも全国にも含まず別枠とした。ただサンプル(19)も人口も少ないため全体の統計に含めてもそれほど数値に変化はない。
また、北海道全体のデータにも存在比率なりのアイヌの子孫(自覚の有無に関わらず)がちゃんと含まれていて、それが北海道のDの多さに結びついているのだと考えられる。*2 - 場所の偏りとサンプル数に注意。四国は徳島だけ重点的で九州は全体データでも南九州があまり入っていない。東北と中国地方は(この両地域でユニークな数値は出ているものの)場所の偏り*3以前にサンプルが少なく、それほど信頼性の高いデータではないのが本当に惜しい。
- 実は地形的にも離れた南北両端を除けば、全般的に地方による差が少ない。特にDの数値の地方差の少なさは面白い。またC系統など少数派も意外と全国に満遍なくいるらしい*4こともわかる。(イギリスとかの移住の傾向*5がはっきり見えるデータと比べると、本当に差がない)
特に少数派の場合、特定の一族や集団の動向の影響が強く出て、特定の場所に集中していたり、ちょっとした偶然だけでどこかの地域集団からいなくなったり、むしろたくさんいる人々より存在は偏りやすいはずなのだ。(※現在のデータにあまり入っていない地域に集中がある可能性はまだ否定できない) - 後から移住してきた系統であるOは合計すると確かに半数を超える。もちろんOには下位分類が、O2系統の下も含めて大量にあり、その構成がアジアの各国でまちまちである。参考として付けた韓国のデータ(このデータはwikipediaにない)と比較してみていただきたい。
- 特にO1b2-47zはOでも日本に多く韓国に少ないという特徴を持つために注目されたラベルである。この47zは面白いことに、わずかな差だが関西など中央(つまりヤマト政権の中心地)も少ないというドーナツ化の傾向を示す。つまりこれは47zが九州に多いというデータではなく、実は東に進むと(もちろん北海道は別だが)比率は増えていたのだ。
なおO1b2*(x47z)も、47z以外のありとあらゆるO1b2系統すべてであるため、必ずしも韓国に同じ系統がいるとは限らないことに注意。また境目としても47zが一番良いとは限らない。 - こちらにも書いておく。Nは多少数え漏れがあってその他に含まれているようだ。詳しい事情はデータの注記に記す。
ちなみに日本の場合、その他にはQが含まれている場合が一番多い。また今回の分類の場合、稀にいるD1bでないDもその他に入る。あとは沖縄だとRが出たり、他のアルファベットもたまに見かける。
お願い。利用できる日本人のY染色体データの情報求む!
この表その他は今後も更新する予定。
詳細なデータが多ければ、中部地方を北陸(ただし金沢に偏る)と東海側(ただし三重は関西に含む)に分けたようなことも可能になる。
さらに将来的には、それぞれ地方別に細かく語ることも可能になる、はず。
さあ、どうやって人々が日本列島にやってきたか、次から探っていこう。
まずは氷河期が終わるまでにやってきた、最初の人々だ。
『Y染色体で探る日本人の起源』 目次
3.日本人の構成(今いるのはココ!)
4-3.氷河期が終わるまでにやってきた人々3 C2(旧C3)(ただいま制作中! 近日公開)
5.その後やってきた人々(ただいま制作中! 近日公開)
6.混合民仮説(ただいま制作中! 近日公開)
データ作成のために引用した論文
基本的にはwikipediaの日本人の項目と同じ論文を参照し、さらに別の論文と使用されていないデータを含めて合算している。
- Sato et al. 2014 Overview of genetic variation in the Y chromosome of modern Japanese males
サンプル数(2400)が一桁多くて新しい。そこでこのデータをベースとして表を作成した。データは、札幌508、川崎321、金沢530、大阪241、徳島398、長崎302、福岡100。
なおNがN1になっているため、少し数え漏れがあったようだ。 - Nonaka et al. 2007 IRUCAA@TDC : Y-chromosomal binary haplogroups in the Japanese population and their relationship to 16 Y-STR polymorphisms (apendixに詳細データあり)
表で各地にある「+N」表記はこの個別データをカウントしたもの。末尾にも他の論文も引用した地方別データがあり、これもその比率から人数を逆算して加算した。旭川201(Sasaki & Dahiya 2000)、関東137(これはこの論文。内容は東京51・千葉45・神奈川14・埼玉13など)、名古屋207、沖縄87(Uchihi et al. 2003)。(wikipediaはこの地方別データを使わず合計のみ使用している)
Naitoh et al 2013 IRUCAA@TDC : Assignment of Y-chromosomal SNPs found in Japanese population to Y-chromosomal haplogroup tree
この論文でも同じデータを使用しており、少し古い元の論文でNO*となっているデータがNと確定されていたり、その後の分類の更新に従った解析が成されている。(私はこちらのデータでカウントした) - Hammer et al. 2006 Dual origins of the Japanese: common ground for hunter-gatherer and farmer Y chromosomes. - PubMed - NCBI
合計20人分のアイヌのデータ(他の論文の引用付き)もここから。青森26、静岡61、徳島70、九州53(表の九州にある「+H」はこのデータを意味する)、沖縄45、アイヌ20(この論文で引用されているTajima et al. 2004のデータを合わせた)。
なお、この論文も少し古く、分類の更新された部分があちこちに存在する。そのためこのデータのNO*もNと判断して表に加えた。*6 - Tajima et al. 2004 Genetic origins of the Ainu inferred from combined DNA analyses of maternal and paternal lineages. - PubMed - NCBI
Oの分類の仕方が異なるため直接は使えなかったが、ここにはwikipediaにもある別の九州の104人分のデータもある。 - Kim et al. 2011 High frequencies of Y-chromosome haplogroup O2b-SRY465 lineages in Korea: a genetic perspective on the peopling of Korea | Investigative Genetics | Full Text (xlsが詳細データ)
韓国506のデータ源であるだけでなく、山口44、茨城50、徳島57のデータ源でもある。なお、C1a1(一人)は済州島で出ている。さらにこのデータにはソウル地域のC*(一人。これはその他としてカウントした)もあるが、論文を見ると現C1の一部(旧C4,C5,C6に当たる)に該当するかをチェックしておらず、C1a1ではないが、これも別のC1系統の可能性がある。ただし中国のヤオ族などにもC*(2011年の論文で旧C1から旧C5までチェックしすべて該当せず)は結構な比率で存在することから、Cはまだどこかに新しい分類が追加されるのかも知れない。*7(wikipediaはこの論文を参照していない)
Y chromosome homogeneity in the Korean population | SpringerLink
同じデータを韓国国内の地方別にしたもの。 - 2016/4/12、yfullの 1000 Genomes Projectのデータに57人分の東京のデータ(JPT)があったため追加。人口の多い関東でC1a1が増えたりしたため少しだけ影響が出た。
- 2016/4/16、Koganebuchi et al. 2012 Autosomal and Y-chromosomal STR markers reveal a close relationship between Hokkaido Ainu and Ryukyu islanders
アイヌ19人分追加。 - 2016/4/16、信頼度の高くないデータを扱うための別室を作った。その他ぼちぼちと手直し。
- 2016/4/26、Sato et al のNがN1になっているのに気づいた。表は修正しないが、どうもその他に数え漏れたNが多少含まれている可能性もあるようだ。
- 2016/12/20、アイヌデータ修正。Koganebuchiの19人分だけの数値にした。また徳島のサンプル数を修正し、その影響で全体の数値も直した。
- 2018/3/9、ここのデータに反映していないが、別室β版と同じ論文データからの地域別データ(以下画像。βは付かない)をここにアップしよう。分類が雑すぎるため他の論文との合計は難しいが、C1a1-M8、D1b1a-M125、N-M231、Q-M242などの地域別の正式データです。*8
*1:現在この47zの変異ラベルは使用されておらず、CTS713などが使われる
*2:ちなみに私は、少し多い北海道の「その他」に、アイヌ単独を調べていてもなかなか出てこないぐらいに低比率の北方系Qが含まれることを期待している
*3:データの多いのが、三内丸山遺跡の青森と、土井ヶ浜遺跡の山口だから、むしろ偏っていて面白い部分もあるが、中国地方は出雲とか吉備とかも重要なわけ。
*4:ゼロが見えるのはサンプルの少ない東北・中国と沖縄だけだが、サンプルを増やせば見つかる可能性が高いと思われる。
*5:ケルト系がR1b-L21、ゲルマン系R1b-S21、イタロケルト系R1b-S28。これらR1bもまとめてしまったら傾向がわからなくなるため、日本も細分化すると別の構図が見えてくる可能性はある
*6:どうも昔はNを判別する変異マーカーが妥当じゃなく、それで多くのNO*が出ていたようだ。
*7:ただし最新の分類は既に昔未分類だったものを多数分類に含むため、もうどこかの分類に入るのかも知れない。
*8:β版は画像データだけは更新している。