知識探偵クエビコ

人類史・古代史・神話の謎を探ったり、迷宮に迷い込んだり……

日本人3554人のゲノムデータベース

日本人3554人のゲノムのデータベース(3.5KJPN)を、東北大学が作ったというニュースがあった。

ヒトゲノム、世界最大級のDBに 日本人特有の特徴発見:朝日新聞デジタル

 

これはもちろん東北大学の公式プレスリリースがある。こっち読んだほうがいいでしょう。

リリースの詳細pdf https://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20170718_05web.pdf

 

中身をまとめる。

  • 日本人3554人の全ゲノムリファレンスパネル(3.5KJPN)を作った。――これまでは2049人分だった。
  • のべ約 329 兆塩基もの高品質な全ゲノム断片配列情報を解読。――これは全人数分で、という意味。
  • 約3710万個(37,067,715)の一塩基変異(SNVs)を収載。うち約2690万個は世界各地のSNVsを登録する国際データベースにないもの(日本人に特徴的)。――これまでは約2800万個(うち1830万が日本人に特徴的)だった。
  • 3.5KJPN の約32%は宮城県岩手県以外(地域分けは母親出身地*1)。――ただし他にも東日本の都道県がある。*2

    サンプル数

    その他を除いて(総数2660)比率を計算すると――宮城岩手:56.7%、東日本その他:12.6%、中部:10.6%、西日本:20.0%――となる。(なお、地域分けの地図は二つ後の図にある)

  • 日本列島内の地域集団の微細な違いは確認されるものの、他のアジア集団のゲノム情報とは、大きく、かつ明確に異なる日本列島出身者としてのまとまりが検出(確認)。――この傾向は以前の1KJPN、2KJPNでも検出されていたもの。*3

    主成分分析

    ちなみにCDXのDaiは雲南省シーサンパンナのタイ族(タイ・カダイ語族)。KHVはベトナム南部ホーチミンのキン族(いわゆるベトナム人。オーストロアジア語族)。ベトナム人よりタイ族のほうが漢民族から遠くに出るわけ。

    主成分分析(地方別)

    • 東日本は全体的には大陸から遠い。ところが大陸寄りの集団が一部含まれてる。(※もともと東日本のデータだけが多く、その分少数派も出やすくなってることに注意)*4
    • 西日本は全体的には大陸に近い。ところがこちらでも、大陸から大きく離れて出た集団は西日本だけにある。(これは沖縄かもしれない*5
  • 3.5KJPN は、日本人の持つ 0.03%以上の SNVs をカバーする。
  • これらの情報により、現在日本医療研究開発機構(AMED)が実施中の、未診断疾患イニシアチブ(IRUD)事業における疾患候補遺伝子の絞り込み性能のさらなる向上が見込まれる。
  • 東北大学はデータベースも作ってる。直リンクはやめておく。*6

 

*1:長崎と滋賀長浜の検体は西日本とした、ともある。

*2:アイヌについて何も書いてないが、後の分布図からすると、データに入れてないようだ。

*3:出雲の時似た図を見た気がしたが、左右反転で日本人が右側にいる図だった。もちろん、傾向は似てる。

*4:しかしこれは本当に古いのか、高麗移民あたりか、奥州藤原氏などの移住豪族か、ずっと新しく近年の移住者(混血)か。

*5:西日本は、各地の集団がそれぞれどう出るのか、地域性に興味がある。

*6:データに地域情報があるなら追及してもいいが、そもそも大雑把な地域も調べられなさそうで。(個人情報になるのかこれは)