ダイヤモンドオンライン 「弥生人」の定説に待った、ゲノム解析で迫る日本人の由来の新説 [ゲノム解析で古代史]
ダイヤモンドオンライン
「弥生人」の定説に待った、ゲノム解析で迫る日本人の由来の新説
橘玲、人類学者・篠田謙一対談(後編)

この対談は、何を言いたいのかさっぱりわかりません…![[たらーっ(汗)]](https://blog.ss-blog.jp/_images_e/163.gif)
たぶん、「現代日本人のY染色体の70%ぐらいが縄文系」と書いていないことから判断すると、従来の定説が変わりそうなので、篠田氏が困っているだと思います。
やっぱり、専門家の間違いは、部外者がどしどし指摘しないとダメですね。
篠田氏が述べているように、弥生時代の人骨DNAの調査結果は、日本列島と朝鮮半島南部はほとんど同じです。
もし、渡来人が日本列島の縄文人に入れ替わったとすると、現代日本人のY染色体の70%ぐらいが縄文系ということはあり得ない。
当時の人口は、日本列島の方が朝鮮半島よりずっと多いので、従来の説とは逆に、日本列島から朝鮮半島南部に縄文人や弥生人が「渡来」していったと考えた方が素直です。
ただ、そう考えると従来の説が否定されるので、あいまいな言い方に終始しているのではないかと思います。
奇妙なことに、こうもあります。
これは少々おかしいくないでしょうか。
古墳時代ぐらいなら、韓国では当時の人骨DNAは結構調査しています。論文を読めばわかりますが、弥生人や現代日本人とほぼ同じです。
つまり、弥生人、当時の朝鮮半島南部、現代日本人はほぼ同じDNAを持っていたのです。
学者がこれでは困りますね。
「弥生人」の定説に待った、ゲノム解析で迫る日本人の由来の新説
橘玲、人類学者・篠田謙一対談(後編)

人類の起源 古代DNAが語るホモ・サピエンスの「大いなる旅」 (中公新書)
- 作者: 篠田謙一
- 出版社/メーカー: 中央公論新社
- 発売日: 2022/04/15
- メディア: Kindle版
この対談は、何を言いたいのかさっぱりわかりません…
![[たらーっ(汗)]](https://blog.ss-blog.jp/_images_e/163.gif)
たぶん、「現代日本人のY染色体の70%ぐらいが縄文系」と書いていないことから判断すると、従来の定説が変わりそうなので、篠田氏が困っているだと思います。
やっぱり、専門家の間違いは、部外者がどしどし指摘しないとダメですね。
誰が日本に渡来したのかっていうのは、難しい話になっています。これまではいわゆる縄文人といわれる人たちと、朝鮮半島で農耕をやっていた人たちは遺伝的に全く違うと考えられてきたんですね。それがどうも、そうではなさそうだと。
朝鮮半島にも縄文人的な遺伝子があって、それを持っていた人たちが日本に入ってきたんじゃないかと。しかもその人たちが持つ縄文人の遺伝子の頻度は、今の私たちとあまり変わらなかったんじゃないかと考えています。
篠田氏が述べているように、弥生時代の人骨DNAの調査結果は、日本列島と朝鮮半島南部はほとんど同じです。
もし、渡来人が日本列島の縄文人に入れ替わったとすると、現代日本人のY染色体の70%ぐらいが縄文系ということはあり得ない。
当時の人口は、日本列島の方が朝鮮半島よりずっと多いので、従来の説とは逆に、日本列島から朝鮮半島南部に縄文人や弥生人が「渡来」していったと考えた方が素直です。
ただ、そう考えると従来の説が否定されるので、あいまいな言い方に終始しているのではないかと思います。
奇妙なことに、こうもあります。
弥生時代、最初に日本に入ってきた人というのは、現在の我々とは相当違う人だったというのが現在の予想です。それを知るには当時の朝鮮半島の状況、弥生時代の初期から古墳時代にかけてどうなっていたのか、人がどう動いたのかをちゃんと調べる必要があるんですが、難しいんですよ。いろいろと政治的な問題もあって。
現地の研究者との間では「この人骨を分析しましょう」という話になるんですけれども、上からOKが出ないわけです。「今この人骨を渡すのは困る」と。それでポシャったプロジェクトがいくつかあって。なかなか進まないんです。
これは少々おかしいくないでしょうか。
古墳時代ぐらいなら、韓国では当時の人骨DNAは結構調査しています。論文を読めばわかりますが、弥生人や現代日本人とほぼ同じです。
つまり、弥生人、当時の朝鮮半島南部、現代日本人はほぼ同じDNAを持っていたのです。
学者がこれでは困りますね。
2022-07-27 20:17
コメント(0)
現代日本人が縄文人由来のDNAを持つ割合は?【追記あり】 [ゲノム解析で古代史]
自分自身の備忘録です。
YouTubeで、
Y染色体とmtDNAも合わせて考えた日本人の成り立ち(後期旧石器・縄文・弥生)
という、すばらしい動画を見つけました。![[るんるん]](https://blog.ss-blog.jp/_images_e/146.gif)
現在の定説では、縄文人1に対して弥生人9が渡来してきたとされています。

しかし、Y染色体ベースで見るとこの数字が逆転するというのです。


この動画ではO1b2(xO-47z)は弥生系とされていますが、私はこれも縄文系だと考えています。
なぜなら、現在発見されているO1b2の一番最初の「親」となるタイプは、日本だけで発見されているからです。
この「親」の出現は約8000年前とされており、朝鮮半島はほぼ無人ですが、当時(縄文時代)の日本の全人口は2万人程度です。

出典:図録▽人口の超長期推移
ほぼ無人の朝鮮半島から、突然変異で新しいタイプが出現する確率は、縄文時代の日本に比べると非常に低いと思います。
別なケースでは、日本の「親」から韓国の「子」、そして日本では「孫」が発見されているそうです。これは、当時は日本列島と朝鮮半島で頻繁に人間が行き来していた可能性を示しています。
-------
【参考】Yahoo!知恵袋
ID非公開さん 2017/10/21 13:53 13回答
百済人は何故日本語を話したの? 日本史・1,719閲覧
ベストアンサー
現代の「日本人」「韓国人」の「DNA(Y染色体マーカ)= Y染色体ハプログループ」を分析すると、古代人類集団が、「日本列島」から「朝鮮半島」へ行った「痕跡」はあるが、「朝鮮半島」から「日本列島」へ渡来した「痕跡」がほとんど検出されません。
(中略)
O-47z=CTS713(旧47z):日本人(大和民族、琉球民族)で高頻度にみられる。インドネシア人、朝鮮民族、満州族、タイ人、ベトナム人でもみられる。
xO-47z=L682 :朝鮮民族に高頻度に見られる。日本人、満州族、ナナイなどにもみられる。
(中略)
韓国人の「弥生系」を示す「マーカ」には、「親」が居て、その「親」は、「朝鮮半島でも、中国東北部でも、中国でもなく」、「日本列島」に存在することを示しています。つまり、これだと、韓国人の男性の33%(中国系のO2は40%)が持っている「マーカ」は、「日本列島」から来たと、さし示しています。
韓国人に関係する「O1b2a1a2 F2868」だけを見てみると、
---★O1b-----★F2868-----------------------------日本人(ヤマト人)
---★O1b-----★F2868-----★L682------------------韓国人(弥生系)
---★O1b-----★F2868-----★L682-----★CTS723-----韓国人(弥生系)
↑★は突然変異を示します。左へ行くほど「古い突然変異」、右へ行くほど「新しい突然変異」です。また「F2868、L682、CTS723」は突然変異の名称(番号)となります。韓国人は「L682系」で、これは、日本人(ヤマト人)の「F2868」に、プラス「L682」が追加されたことを意味します。
-------
元のデータを確認したい方は、次の資料に当たってみてください。
Michael F. Hammer et al. (2006)
Dual origins of the Japanese: common ground for hunter-gatherer and farmer Y chromosomes
Soon-Hee Kim et al. (2011)
High frequencies of Y-chromosome haplogroup O2b-SRY465 lineages in Korea: a genetic perspective on the peopling of Korea
なお、ハプロタイプの名称は頻繁に変わっているので、比較するときには注意が必要です。
たとえば、後者の「O2b-SRY465」は、現在では「O1b2a1a2a L682」となります。
これから判断すると、現在の日本や韓国のO1b2は、8000年前(縄文時代)に日本列島に住んでいた縄文人が起源である可能性が高いということになります。
これまた私の推測ですが、当時の未熟な航海技術から考えて、渡来系(ハプロタイプO2)が2割というのは多過ぎると思います。これらの人の多くは百済から亡命してきたのでしょうが、身分が高い人や熟練技術者が中心で、相当優遇されたと考えられます。
よって、常識的に考えると、同じハプロタイプを持つ渡来人の子は「増えた」はずです。
たとえば、百済系の高野新笠は光仁天皇の皇后なわけで、それなら現在の日本人に(渡来系の)O2が2割というのも納得です。
なお、この動画ではミトコンドリアの分析もしています。
しかし、ミトコンドリアが変異するのは万年単位なので、縄文以前の変異であれば、それが日本独自かどうか判断するのは困難なのではないでしょうか?

下の図で、グレーの部分は、日本にも韓国にもあるとのことです。

もちろん、多くの変異を調べて統計的な処理をすれば結論は出るでしょうが…![[たらーっ(汗)]](https://blog.ss-blog.jp/_images_e/163.gif)
【追記】
冒頭の動画の続編で、ミトコンドリアDNAについての考察もあります。
縄文系男子が多いのに弥生系女子が多い理由について考えてみた(日本人のルーツと成り立ち)
YouTubeで、
Y染色体とmtDNAも合わせて考えた日本人の成り立ち(後期旧石器・縄文・弥生)
という、すばらしい動画を見つけました。
![[るんるん]](https://blog.ss-blog.jp/_images_e/146.gif)
現在の定説では、縄文人1に対して弥生人9が渡来してきたとされています。
しかし、Y染色体ベースで見るとこの数字が逆転するというのです。
この動画ではO1b2(xO-47z)は弥生系とされていますが、私はこれも縄文系だと考えています。
なぜなら、現在発見されているO1b2の一番最初の「親」となるタイプは、日本だけで発見されているからです。
この「親」の出現は約8000年前とされており、朝鮮半島はほぼ無人ですが、当時(縄文時代)の日本の全人口は2万人程度です。

出典:図録▽人口の超長期推移
ほぼ無人の朝鮮半島から、突然変異で新しいタイプが出現する確率は、縄文時代の日本に比べると非常に低いと思います。
別なケースでは、日本の「親」から韓国の「子」、そして日本では「孫」が発見されているそうです。これは、当時は日本列島と朝鮮半島で頻繁に人間が行き来していた可能性を示しています。
-------
【参考】Yahoo!知恵袋
ID非公開さん 2017/10/21 13:53 13回答
百済人は何故日本語を話したの? 日本史・1,719閲覧
ベストアンサー
現代の「日本人」「韓国人」の「DNA(Y染色体マーカ)= Y染色体ハプログループ」を分析すると、古代人類集団が、「日本列島」から「朝鮮半島」へ行った「痕跡」はあるが、「朝鮮半島」から「日本列島」へ渡来した「痕跡」がほとんど検出されません。
(中略)
O-47z=CTS713(旧47z):日本人(大和民族、琉球民族)で高頻度にみられる。インドネシア人、朝鮮民族、満州族、タイ人、ベトナム人でもみられる。
xO-47z=L682 :朝鮮民族に高頻度に見られる。日本人、満州族、ナナイなどにもみられる。
(中略)
韓国人の「弥生系」を示す「マーカ」には、「親」が居て、その「親」は、「朝鮮半島でも、中国東北部でも、中国でもなく」、「日本列島」に存在することを示しています。つまり、これだと、韓国人の男性の33%(中国系のO2は40%)が持っている「マーカ」は、「日本列島」から来たと、さし示しています。
韓国人に関係する「O1b2a1a2 F2868」だけを見てみると、
---★O1b-----★F2868-----------------------------日本人(ヤマト人)
---★O1b-----★F2868-----★L682------------------韓国人(弥生系)
---★O1b-----★F2868-----★L682-----★CTS723-----韓国人(弥生系)
↑★は突然変異を示します。左へ行くほど「古い突然変異」、右へ行くほど「新しい突然変異」です。また「F2868、L682、CTS723」は突然変異の名称(番号)となります。韓国人は「L682系」で、これは、日本人(ヤマト人)の「F2868」に、プラス「L682」が追加されたことを意味します。
-------
元のデータを確認したい方は、次の資料に当たってみてください。
Michael F. Hammer et al. (2006)
Dual origins of the Japanese: common ground for hunter-gatherer and farmer Y chromosomes
Soon-Hee Kim et al. (2011)
High frequencies of Y-chromosome haplogroup O2b-SRY465 lineages in Korea: a genetic perspective on the peopling of Korea
なお、ハプロタイプの名称は頻繁に変わっているので、比較するときには注意が必要です。
たとえば、後者の「O2b-SRY465」は、現在では「O1b2a1a2a L682」となります。
これから判断すると、現在の日本や韓国のO1b2は、8000年前(縄文時代)に日本列島に住んでいた縄文人が起源である可能性が高いということになります。
これまた私の推測ですが、当時の未熟な航海技術から考えて、渡来系(ハプロタイプO2)が2割というのは多過ぎると思います。これらの人の多くは百済から亡命してきたのでしょうが、身分が高い人や熟練技術者が中心で、相当優遇されたと考えられます。
よって、常識的に考えると、同じハプロタイプを持つ渡来人の子は「増えた」はずです。
たとえば、百済系の高野新笠は光仁天皇の皇后なわけで、それなら現在の日本人に(渡来系の)O2が2割というのも納得です。
なお、この動画ではミトコンドリアの分析もしています。
しかし、ミトコンドリアが変異するのは万年単位なので、縄文以前の変異であれば、それが日本独自かどうか判断するのは困難なのではないでしょうか?
下の図で、グレーの部分は、日本にも韓国にもあるとのことです。
もちろん、多くの変異を調べて統計的な処理をすれば結論は出るでしょうが…
![[たらーっ(汗)]](https://blog.ss-blog.jp/_images_e/163.gif)
【追記】
冒頭の動画の続編で、ミトコンドリアDNAについての考察もあります。
縄文系男子が多いのに弥生系女子が多い理由について考えてみた(日本人のルーツと成り立ち)
2022-06-19 08:55
コメント(0)
日本人と中国人の違いを「マンハッタンプロット」で調べる [ゲノム解析で古代史]
古代人や縄文人のゲノム解析ですが、なぜか「マンハッタンプロット」を使った分析は見たことがありません。

※上の図にある説明では、「疾患との関連が高い」とありますが、要するに「異なるグループの遺伝子(SNP)の違い」が偶然かどうかの確率を示しているわけです。
誰でもすぐに思いつきそうなことですが、本当に誰もやってないのかな?
ここでは、テストケースとして、前回調べた1000 Genome Projectのデータを使った日本人と中国人の違いをマンハッタンプロットを使って見てみることにします。

前回の分析結果
下の図は、ABO血液型がある第9染色体後半部分のマンハッタンプロットを描いてみたものです。
赤い↓がABO血液型の場所なのですが、残念なことに意外と差が出てないですね。

点が上に行くほど差があることを示しているのですが、あまりパッとしません。
なお、水平の赤い線以上が統計的に有意なことを示しています。
もう一つ残念なのは、ノイズが多いのため、このままでは使いものにならないことです。
どうしようかな…。
--☆----☆----☆--
なお、具体的なやり方は次のとおりです。
★PLINKについて★
【1】PEDファイルにPhenotypeを追加する
前回までにできた、マンハッタンプロットをしたいPEDファイル(テキストファイルです)にPhenotypeを追加します。
PLINKの使い方 1 〜フォーマット整形〜
http://bio-and-info.blogspot.com/2013/05/plink1.html
2. デフォルトのフォーマット
(1) PED FORMAT:サンプルとジェノタイプ情報
ここの、列#6 Phenotypeを、EmEditorで追加(変更)します。
(デフォルトは「-9」のようです…)
・例 日本人=1、外国人=2
【2】関連分析
plink --file inputfile --assoc --allow-no-sex --out outputfile
→outputfile.assocに結果が出力されます。
(--allow-no-sexは性別を無視するオプションで、元データに性別が入ってないため、指定しないとエラーになります)
《参考》
・PLINKでGWAS(basicなcase/control study)をするコマンド
https://jojoshin.hatenablog.com/entry/2016/09/22/094319
plink --bfile データ名 --assoc --out アウトプットするデータ名
→上のファイルはバイナリではないので、「--bfile」を「--file」に変更する
★Rについて★
カラフルなマンハッタンプロットを描く
https://staffblog.amelieff.jp/entry/2018/05/15/173432
《Rのスクリプトの例》
rm(list=ls())
setwd("C:\\データがあるフォルダ名")
#必要なパッケージをロードする。
library("qqman") #ライブラリ読み込み
library("data.table")
dat.raw <- fread("データファイル名.assoc", stringsAsFactors=F,header=T)
dat.ylim <- c(0, max(10, max(-log10(dat.raw$P) * 1.04, na.rm=TRUE)))
manhattan(dat.raw, ylim=dat.ylim, genomewideline = -log10(1e-07))

※上の図にある説明では、「疾患との関連が高い」とありますが、要するに「異なるグループの遺伝子(SNP)の違い」が偶然かどうかの確率を示しているわけです。
誰でもすぐに思いつきそうなことですが、本当に誰もやってないのかな?
ここでは、テストケースとして、前回調べた1000 Genome Projectのデータを使った日本人と中国人の違いをマンハッタンプロットを使って見てみることにします。

前回の分析結果
下の図は、ABO血液型がある第9染色体後半部分のマンハッタンプロットを描いてみたものです。
赤い↓がABO血液型の場所なのですが、残念なことに意外と差が出てないですね。

点が上に行くほど差があることを示しているのですが、あまりパッとしません。
なお、水平の赤い線以上が統計的に有意なことを示しています。
もう一つ残念なのは、ノイズが多いのため、このままでは使いものにならないことです。
どうしようかな…。
--☆----☆----☆--
なお、具体的なやり方は次のとおりです。
★PLINKについて★
【1】PEDファイルにPhenotypeを追加する
前回までにできた、マンハッタンプロットをしたいPEDファイル(テキストファイルです)にPhenotypeを追加します。
PLINKの使い方 1 〜フォーマット整形〜
http://bio-and-info.blogspot.com/2013/05/plink1.html
2. デフォルトのフォーマット
(1) PED FORMAT:サンプルとジェノタイプ情報
ここの、列#6 Phenotypeを、EmEditorで追加(変更)します。
(デフォルトは「-9」のようです…)
・例 日本人=1、外国人=2
【2】関連分析
plink --file inputfile --assoc --allow-no-sex --out outputfile
→outputfile.assocに結果が出力されます。
(--allow-no-sexは性別を無視するオプションで、元データに性別が入ってないため、指定しないとエラーになります)
《参考》
・PLINKでGWAS(basicなcase/control study)をするコマンド
https://jojoshin.hatenablog.com/entry/2016/09/22/094319
plink --bfile データ名 --assoc --out アウトプットするデータ名
→上のファイルはバイナリではないので、「--bfile」を「--file」に変更する
★Rについて★
カラフルなマンハッタンプロットを描く
https://staffblog.amelieff.jp/entry/2018/05/15/173432
《Rのスクリプトの例》
rm(list=ls())
setwd("C:\\データがあるフォルダ名")
#必要なパッケージをロードする。
library("qqman") #ライブラリ読み込み
library("data.table")
dat.raw <- fread("データファイル名.assoc", stringsAsFactors=F,header=T)
dat.ylim <- c(0, max(10, max(-log10(dat.raw$P) * 1.04, na.rm=TRUE)))
manhattan(dat.raw, ylim=dat.ylim, genomewideline = -log10(1e-07))
2022-05-05 10:03
コメント(0)
Windows 11 に WSL2:Ubuntu20.04をインストールする [ゲノム解析で古代史]
私の備忘録です。
基本的に、次のサイトのとおりで大丈夫です。
WSL2:Ubuntu20.04のインストール
なお、このサイトの環境はWindows 10ですが、WIndows 11でもほとんど同じでした。
変更が必要なのは2点です。
Windows 11は、Windowsファイアウォールの設定がWindows 10と違うため、次のようにして設定を変更します。
[設定]→[プライバシーとセキュリティ]→[Windows セキュリティ]→[ファイアウォールとネットワーク保護]→[ファイアウォールによるアプリケーションの許可]
Ubuntuの設定のパラメーターにミスがあるため、少し訂正が必要です。
・Ubuntuの設定
・$ sudo apt install -y git gedit emacs vim subuild-essential pkg-config firefox dbus
subuild-essential→build-essential [最初のsuは不要]
このサイトの作者に感謝です。![[るんるん]](https://blog.ss-blog.jp/_images_e/146.gif)
しかし、なぜかfirefoxの動作が不安定でした…![[あせあせ(飛び散る汗)]](https://blog.ss-blog.jp/_images_e/162.gif)
基本的に、次のサイトのとおりで大丈夫です。
![[iモード]](https://blog.ss-blog.jp/_images_e/108.gif)
なお、このサイトの環境はWindows 10ですが、WIndows 11でもほとんど同じでした。
変更が必要なのは2点です。
![[1]](https://blog.ss-blog.jp/_images_e/125.gif)
[設定]→[プライバシーとセキュリティ]→[Windows セキュリティ]→[ファイアウォールとネットワーク保護]→[ファイアウォールによるアプリケーションの許可]
![[2]](https://blog.ss-blog.jp/_images_e/126.gif)
・Ubuntuの設定
・$ sudo apt install -y git gedit emacs vim subuild-essential pkg-config firefox dbus
subuild-essential→build-essential [最初のsuは不要]
このサイトの作者に感謝です。
![[るんるん]](https://blog.ss-blog.jp/_images_e/146.gif)
しかし、なぜかfirefoxの動作が不安定でした…
![[あせあせ(飛び散る汗)]](https://blog.ss-blog.jp/_images_e/162.gif)
2022-05-04 10:13
コメント(0)
Ubuntuのツールのインストール方法 [ゲノム解析で古代史]
私の備忘録です
。
◎samtoolsをインストールするには…
sudo apt update
sudo apt install -y wget
sudo apt install -y libncurses5-dev
sudo apt install -y zlib1g-dev
sudo apt install -y libbz2-dev
sudo apt install -y liblzma-dev
sudo apt install -y gcc
sudo apt install -y make
sudo apt install libcurl4-openssl-dev
wget https://github.com/samtools/samtools/releases/download/1.15.1/samtools-1.15.1.tar.bz2
tar -xvf samtools-1.15.1.tar.bz2
cd samtools-1.15.1/
./configure --prefix=/usr/local/
make -j 8 #マルチコアCPUの場合に高速化(8コアの場合)
[sudo] make install
参考 https://kazumaxneo.hatenablog.com/entry/2019/01/04/220013
◎bcftools-1.15.1をインストールするには…
wget https://github.com/samtools/bcftools/releases/download/1.15.1/bcftools-1.15.1.tar.bz2
tar -xvf bcftools-1.15.1.tar.bz2
cd bcftools-1.15.1.tar.bz2
./configure --prefix=/usr/local/
make -j 8 #マルチコアCPUの場合に高速化(8コアの場合)
[sudo] make install
◎htslib-1.15.1をインストールするには…
↑と同じ方法でbcftools→htslibに変更
◎bgzipを使うには…
htslibをインストールする。
※ 元ファイルを保存する「-c 」オプションを付けると、出力ファイルが標準出力(スクリーン)にリダイレクトされるので注意!
![[たらーっ(汗)]](https://blog.ss-blog.jp/_images_e/163.gif)
◎samtoolsをインストールするには…
sudo apt update
sudo apt install -y wget
sudo apt install -y libncurses5-dev
sudo apt install -y zlib1g-dev
sudo apt install -y libbz2-dev
sudo apt install -y liblzma-dev
sudo apt install -y gcc
sudo apt install -y make
sudo apt install libcurl4-openssl-dev
wget https://github.com/samtools/samtools/releases/download/1.15.1/samtools-1.15.1.tar.bz2
tar -xvf samtools-1.15.1.tar.bz2
cd samtools-1.15.1/
./configure --prefix=/usr/local/
make -j 8 #マルチコアCPUの場合に高速化(8コアの場合)
[sudo] make install
参考 https://kazumaxneo.hatenablog.com/entry/2019/01/04/220013
◎bcftools-1.15.1をインストールするには…
wget https://github.com/samtools/bcftools/releases/download/1.15.1/bcftools-1.15.1.tar.bz2
tar -xvf bcftools-1.15.1.tar.bz2
cd bcftools-1.15.1.tar.bz2
./configure --prefix=/usr/local/
make -j 8 #マルチコアCPUの場合に高速化(8コアの場合)
[sudo] make install
◎htslib-1.15.1をインストールするには…
↑と同じ方法でbcftools→htslibに変更
◎bgzipを使うには…
htslibをインストールする。
※ 元ファイルを保存する「-c 」オプションを付けると、出力ファイルが標準出力(スクリーン)にリダイレクトされるので注意!
2022-05-03 23:00
コメント(0)
趣味のゲノム解析【実践編6】血液型が存在する理由【追記あり】 [ゲノム解析で古代史]
血液型がなぜ存在するのかという謎は、まだ誰も解明していません。
さて、ABO血液型は、第9染色体の後半部に位置しています。
この部分のゲノム解析の結果は興味深いものでした。

第9染色体の「後半部分」の主成分分析の結果(右側)は、第9染色体の「全体」(左側)と比較すると、明らかにバラツキが大きいのです。
これは、血液型の多様性が存在することが、人類全体の生存に有利に働く…ということのようです。
もちろん、このことは以前から言われていましたが、現実のデータで実証したのは、たぶん初めてだと思われます。
へ~、という感じですね。
ということは、核ゲノム解析(全ゲノム解析)の数値で、現代日本人は縄文人の遺伝子の○%を受け継いでいる…なんて、ほとんど意味はないということです![[たらーっ(汗)]](https://blog.ss-blog.jp/_images_e/163.gif)
弥生時代になって水田稲作が普及すると、人口が急増して結核や寄生虫などの感染症も爆増したはずです。それを逃れるために、縄文人が弥生人になる過程で、遺伝子が急速に多様化したということになります。
我々はそういう環境変化に対応するため、いたるところから生存に有利な遺伝子をかき集め、不利な遺伝子をそぎ落とし、結果としてしぶとく生き残った、いわば縄文人の「勝ち組」なわけですね。![[るんるん]](https://blog.ss-blog.jp/_images_e/146.gif)
【追記】
これは、生物のサバイバル戦略として当然のことです。
新型コロナウイルスでも、現在流行していてるオミクロン株は、ワクチンが認識する「スパイクたんぱく質」だけが集中的に変異していて、他の部分は突然変異と同じ程度だそうです。
つまり、「ワクチンのがれ」の部分だけが天文学的に低い確率で変異していることになります…![[たらーっ(汗)]](https://blog.ss-blog.jp/_images_e/163.gif)
さて、ABO血液型は、第9染色体の後半部に位置しています。
この部分のゲノム解析の結果は興味深いものでした。

第9染色体の「後半部分」の主成分分析の結果(右側)は、第9染色体の「全体」(左側)と比較すると、明らかにバラツキが大きいのです。
これは、血液型の多様性が存在することが、人類全体の生存に有利に働く…ということのようです。
もちろん、このことは以前から言われていましたが、現実のデータで実証したのは、たぶん初めてだと思われます。
へ~、という感じですね。
ということは、核ゲノム解析(全ゲノム解析)の数値で、現代日本人は縄文人の遺伝子の○%を受け継いでいる…なんて、ほとんど意味はないということです
![[たらーっ(汗)]](https://blog.ss-blog.jp/_images_e/163.gif)
弥生時代になって水田稲作が普及すると、人口が急増して結核や寄生虫などの感染症も爆増したはずです。それを逃れるために、縄文人が弥生人になる過程で、遺伝子が急速に多様化したということになります。
我々はそういう環境変化に対応するため、いたるところから生存に有利な遺伝子をかき集め、不利な遺伝子をそぎ落とし、結果としてしぶとく生き残った、いわば縄文人の「勝ち組」なわけですね。
![[るんるん]](https://blog.ss-blog.jp/_images_e/146.gif)
【追記】
これは、生物のサバイバル戦略として当然のことです。
新型コロナウイルスでも、現在流行していてるオミクロン株は、ワクチンが認識する「スパイクたんぱく質」だけが集中的に変異していて、他の部分は突然変異と同じ程度だそうです。
つまり、「ワクチンのがれ」の部分だけが天文学的に低い確率で変異していることになります…
![[たらーっ(汗)]](https://blog.ss-blog.jp/_images_e/163.gif)
トライ&エラーの自然変異では、塩基配列が変化してもアミノ酸配列に影響しないS変異が蓄積、アミノ酸配列に影響するN変異はフィットしたものだけ残り、S変異>N変異となるが、オミ変異ではS変異1、N変異が30。自然変異である確率は天文学的低さ / オミクロン変異考察|荒川央https://t.co/RprgBcMmLH
— J Sato (@j_sato) December 27, 2021
2022-03-12 19:53
コメント(0)
趣味のゲノム解析【実践編3】日本人と中国人 [ゲノム解析で古代史]
前回の続きです。
1000 Genome Projectの9番染色体のデータから、日本人(東京)、中国人(北京・漢族)、中国人(南部・漢族)の主成分分析の結果を添付します。
日本人は意外とバラバラで、はるかに人口の多い中国人・漢族よりもバラツキが大きいことがわかります。
1000 Genome Projectの9番染色体のデータから、日本人(東京)、中国人(北京・漢族)、中国人(南部・漢族)の主成分分析の結果を添付します。
日本人は意外とバラバラで、はるかに人口の多い中国人・漢族よりもバラツキが大きいことがわかります。

2022-03-05 11:47
コメント(0)
韓国のデータの入手方法 [ゲノム解析で古代史]
Genome1000プロジェクトのデータには、フリーで使えるVCFファイルがあるのですが、日本も中国もベトナムもあるのに、なぜか韓国がありません。
最近、フリーで入手できるサイトを見つけたので報告します。
KoreanGenome.org

※下から2行目のThe VCF files of Korean Genomes: FTP at Biodiskに注目!
なお、このサイトのリンクは、
・ftp://biodisk.org/Release/KPGP/
KPGP_Data_2014_Release_Candidate/WGS_VCF/
となっていますが、最新版は、
・ftp://biodisk.org/Release/KPGP/
KPGP_Data_2019_Release_Candidate/
WGS_SR_VCF_91_KOREAN_JOINT_CALL/
の「chrX.snv.recalibrated.vcf」のようです。
サイズは1-3GB程度ですので、なんとかダウンロード可能でした![[るんるん]](https://blog.ss-blog.jp/_images_e/146.gif)
最近、フリーで入手できるサイトを見つけたので報告します。
![[iモード]](https://blog.ss-blog.jp/_images_e/108.gif)

※下から2行目のThe VCF files of Korean Genomes: FTP at Biodiskに注目!
なお、このサイトのリンクは、
・ftp://biodisk.org/Release/KPGP/
KPGP_Data_2014_Release_Candidate/WGS_VCF/
となっていますが、最新版は、
・ftp://biodisk.org/Release/KPGP/
KPGP_Data_2019_Release_Candidate/
WGS_SR_VCF_91_KOREAN_JOINT_CALL/
の「chrX.snv.recalibrated.vcf」のようです。
サイズは1-3GB程度ですので、なんとかダウンロード可能でした
![[るんるん]](https://blog.ss-blog.jp/_images_e/146.gif)
2022-03-02 22:38
コメント(0)
趣味のゲノム解析【実践編2】 [ゲノム解析で古代史]
前回の続きです。
VCFファイルから「血液型」を調べる方法について書いておきます。
ABO血液型の遺伝子は第9染色体にあり、そのSNP(塩基の変異のこと…A/T/G/C)は次の2つです。
・rs8176746 (C→A型/A→B型)
・rs8176719 (del[なし]→O型/G→rs8176746の型)
ただし、人間の染色体は2本で1組(2倍体)なので、↑のSNPはそれぞれ2個ずつあります。
ABO Blood Type and Personality Traits in Healthy Japanese Subjects

つまり、VCFファイルに格納されているSNPの内容を解読すれば、その人の血液型がわかるのです!
ただし、一部のVCFファイルの情報にはrs番号がなく、POS(位置情報)だけの場合があり、そのときは該当するPOSを検索する必要があります。
やり方は↓のとおりです。
jMORP Genomic Variants

実際に調べてみたところ、
・rs8176746→POS 136131322
・rs8176719→POS 136132908
となりました。
しかし、現実のVCFファイルは巨大なので、特定のSNPのデータだけ取り出すのは簡単ではありません。
VCFファイルの実体は、TAB区切りのCSVファイルなので、Excelで読み取ること自体は可能です。
ただし、Excelの上限の100万行以上になると、取り扱いは相当大変です。
私は、ツールを探すのが面倒だったので、CsvDivNetというソフトを使ってVCFファイルを分割し、Excelで該当する番号の行を切り出しました。
結果は↓のとおりです。

※一般的には「rs8176746 (C→A型/A→B型)」ですが、なぜかこのVCFファイルでは、C→G(Cのペアになる塩基)、A→T(Aのペアになる塩基)が表示されます。これは、rs8176719も同じで、G→C(Gのペアになる塩基)でした。
なんで?
面白かったのは、rs8176746はA型が標準(REF)、rs8176719はO型が標準(同)と決められていることです。欧米人が基準なので、そうなるんでしょうね![[わーい(嬉しい顔)]](https://blog.ss-blog.jp/_images_e/140.gif)
VCFファイルから「血液型」を調べる方法について書いておきます。
ABO血液型の遺伝子は第9染色体にあり、そのSNP(塩基の変異のこと…A/T/G/C)は次の2つです。
・rs8176746 (C→A型/A→B型)
・rs8176719 (del[なし]→O型/G→rs8176746の型)
ただし、人間の染色体は2本で1組(2倍体)なので、↑のSNPはそれぞれ2個ずつあります。
![[本]](https://blog.ss-blog.jp/_images_e/70.gif)

つまり、VCFファイルに格納されているSNPの内容を解読すれば、その人の血液型がわかるのです!
ただし、一部のVCFファイルの情報にはrs番号がなく、POS(位置情報)だけの場合があり、そのときは該当するPOSを検索する必要があります。
やり方は↓のとおりです。
![[本]](https://blog.ss-blog.jp/_images_e/70.gif)

実際に調べてみたところ、
・rs8176746→POS 136131322
・rs8176719→POS 136132908
となりました。
しかし、現実のVCFファイルは巨大なので、特定のSNPのデータだけ取り出すのは簡単ではありません。
VCFファイルの実体は、TAB区切りのCSVファイルなので、Excelで読み取ること自体は可能です。
ただし、Excelの上限の100万行以上になると、取り扱いは相当大変です。
私は、ツールを探すのが面倒だったので、CsvDivNetというソフトを使ってVCFファイルを分割し、Excelで該当する番号の行を切り出しました。
結果は↓のとおりです。

※一般的には「rs8176746 (C→A型/A→B型)」ですが、なぜかこのVCFファイルでは、C→G(Cのペアになる塩基)、A→T(Aのペアになる塩基)が表示されます。これは、rs8176719も同じで、G→C(Gのペアになる塩基)でした。
なんで?
面白かったのは、rs8176746はA型が標準(REF)、rs8176719はO型が標準(同)と決められていることです。欧米人が基準なので、そうなるんでしょうね
![[わーい(嬉しい顔)]](https://blog.ss-blog.jp/_images_e/140.gif)
2022-03-02 22:07
コメント(0)
趣味のゲノム解析【実践編1】 [ゲノム解析で古代史]
前回の続きです。
Genome1000プロジェクトのサイトにアクセスして、日本人だけのサンプルを作ってみました。
【参考】
bcftoolsを使用して指定したサンプルのvcfファイルを抽出する(extract specified samples in vcf format)
【実際のLinuxのコマンド】
bcftools view -S JPTList.txt --force-samples ALL.chr9.phase3_shapeit2_mvncall_integrated_v5b.20130502.genotypes.vcf.gz -Ov > JPT.vcf
※出力はテキストファイル(vcf)になるようです。
サンプルファイル
NA18939
NA18940
NA18941
NA18942
NA18943
NA18944
NA18945
NA18946
NA18947
...
↑は、前回ダウンロードした integrated_call_samples_v3.20200731.ALL.ped がタブ区切りテキストファイルなので、Excelに読み込んで適宜加工したものです。
Genome1000プロジェクトのサイトにアクセスして、日本人だけのサンプルを作ってみました。
【参考】
bcftoolsを使用して指定したサンプルのvcfファイルを抽出する(extract specified samples in vcf format)
【実際のLinuxのコマンド】
bcftools view -S JPTList.txt --force-samples ALL.chr9.phase3_shapeit2_mvncall_integrated_v5b.20130502.genotypes.vcf.gz -Ov > JPT.vcf
※出力はテキストファイル(vcf)になるようです。
サンプルファイル
NA18939
NA18940
NA18941
NA18942
NA18943
NA18944
NA18945
NA18946
NA18947
...
↑は、前回ダウンロードした integrated_call_samples_v3.20200731.ALL.ped がタブ区切りテキストファイルなので、Excelに読み込んで適宜加工したものです。
2022-02-28 23:12
コメント(0)