SSブログ

趣味のゲノム解析【実践編1】 [ゲノム解析で古代史]

前回の続きです。

Genome1000プロジェクトのサイトにアクセスして、日本人だけのサンプルを作ってみました。

【参考】
bcftoolsを使用して指定したサンプルのvcfファイルを抽出する(extract specified samples in vcf format)

【実際のLinuxのコマンド】
bcftools view -S JPTList.txt --force-samples ALL.chr9.phase3_shapeit2_mvncall_integrated_v5b.20130502.genotypes.vcf.gz -Ov > JPT.vcf
※出力はテキストファイル(vcf)になるようです。

サンプルファイル
NA18939
NA18940
NA18941
NA18942
NA18943
NA18944
NA18945
NA18946
NA18947
...

↑は、前回ダウンロードした integrated_call_samples_v3.20200731.ALL.ped がタブ区切りテキストファイルなので、Excelに読み込んで適宜加工したものです。

コメント(0) 

趣味のゲノム解析に成功!【追記あり】 [ゲノム解析で古代史]

前回の続きです。

試行錯誤の末、意外にあっさりと成功しました!

大変お世話になったのは↓のサイトです。

バイオインフォマティクスでゲノムワイド関連解析(GWAS)

bio.PNG

ありがとうございま~す。
本当に素晴らしいです[exclamation]

[1]plinkを使ってゲノムの集団構造を体験する-パート1
[2]plinkを使ってゲノムの集団構造を体験する-パート2

試しに14番染色体をプロットしてみましたが、結果はこのサイトの1番染色体とほとんど同じでした。

plink.PNG

なお、私は慣れたところでRを遣い、これに関連して3箇所ほど修正しました。

①4を、data <- read.delim('integrated_call_samples_v3.20200731.ALL.ped', header=TRUE) に変更
②パッケージ ggplot2 をインストール
③5の1行目を、columnList <- c("Individual.ID","Population") に変更 【追記1 Population表示が正しくなるよう修正】

どうやら、パソコンのメモリは8GBだと足りないようです。
このサイトのように、主成分を10個指定すると、私のパソコンではメモリ不足になってしまいました…[たらーっ(汗)]

CPUは、それほどは高性能でなくともいいらしく、私はi5-7500なのですが…計算自体は数分で終わりました。[手(チョキ)]
ただ、ゲノムデータは1染色体ほぼ1GBあるので、高速回線が必須となります。

それにしても、個人レベルで気軽にゲノム解析ができるようになったのだから、世の中も随分と変わったものです。

参考までに、ソフトとデータの入手はすべて無料です。
ただし、プライバシーの関係で、センシティブなデータには厳重な手続きが必要となります。

【追記2】

これで、血液型別にゲノム解析をして、もしも差が出たら万々歳です[るんるん]
コメント(0) 

趣味でゲノム解析をする方法 [ゲノム解析で古代史]

自分でゲノム解析をする場合の備忘録です。
下は、国立科学博物館の例ですが、ソフトはPLINKを使っているようです。

002l.jpg

なにはともあれ、相当高性能のパソコンが必要で、メモリは最低でも16GBが必須となります。
HDDも500GBでは足りないかもしれません。
非力なパソコンだと、処理に時間がかかったり、メモリが足りなくてエラーになりやすく、相当イライラします。

さて、ゲノムのデータについては、無料で1000人ゲノムプロジェクトから入手可能です。

入手先と入手方法はこちら

https://www.internationalgenome.org/data-portal/sample
https://biotech-lab.org/articles/6385#i-2

Data types は Variatnts(VCFファイル)を選択します。

注意点ですが、Filter by populationで選択しても、SGDP以外は調査対象者全員分が付いてくるので、誰を選択しても同じ内容です。
また、基本的にファイルは染色体別なので、ALL.chr○…は全部ダウンロードする必要があります。
容量は、1つのファイルは圧縮済み(gzフォーマット)でも数100GB以上なので、トータルでは結構なサイズとなります。

基本的にFTPでダウンロードするので、Windowsならコマンドラインか専用クライアントソフトが必要です。
なお、最近のソフトは圧縮済みでもそのまま取り扱えるようになったので、ちょっと便利になりました。

日本人の1094人のデータ

https://seichannel.net/2020/04/13/snp_analysis_for_japanese_data_for_begginers/

次に分析方法ですが、Rを使う方法とPLINKを使う方があります。

Rを使う方法

https://www.iu.a.u-tokyo.ac.jp/lectures/AG16/180509/20180509.pdf (PDF)
https://nemunemu-nyanko.hatenablog.com/entry/2020/12/19/191440#google_vignette

pcaMethodsのインストール方法

https://www.kkaneko.jp/data/rna/velocyto.html (ページの一番下)

PLINKを使う方法

http://www.sg.med.osaka-u.ac.jp/files/StatGenSummerSchool2021_GenomeDataAnalysis1.pdf (PDF)
https://qiita.com/insilicomab/items/790553a5a92d759c6ab3

まだ、主成分分析まで完了していないのですが、頑張りたいと思いますv(^^)。
コメント(0) 

アイヌ人は日本列島の新参者だった [ゲノム解析で古代史]

前回の続きです。

アイヌ人は、遺伝子的には、縄文人、弥生人、オホーツク人、シベリア人の混血のようです。

DNAを調べると、

【Y染色体】→日本人とは遠い
distance.png
出典:Dual origins of the Japanese: Common ground for hunter-gatherer and farmer Y chromosomes (図の注釈や日本語の紹介記事はこちら

【ミトコンドリアDNA】→縄文人、弥生人、オホーツク人、シベリア人の混血

ainu.PNG

出典:プレ・アイヌ期の人類集団を捉え直す:北海道先史時代人骨についての総合的研究

ainu2.PNG

出典:Ancient mitochondrial DNA sequences of Jomon teeth samples from Sanganji, Tohoku district, Japan

その他
Ethnic derivation of the Ainu inferred from ancient mitochondrial DNA data

【核DNA】→バラツキが大きい(地域差が大きい?)

ainu3.PNG

出典:A partial nuclear genome of the Jomons who lived 3000 years ago in Fukushima, Japan

また、文化や言語の歴史は、遡ってもせいぜい1000年前のようです。
たとえば、アイヌが主に使っていたのは鉄器ですが、それ以前の北海道は擦文土器です。
ところが、約3800年前の北海道・礼文島の船泊遺跡では、縄文人そのままのDNAが発見されています。
つまり、アイヌ以前には縄文人が住んでいたということです。
ミトコンドリアDNA多型からみた北海道縄文人および続縄文人

以上のことから考えると…

日本では縄文時代から弥生時代になると、東北以南では稲作が普及して弥生人になった。
しかし、北海道は当時の品種では稲作が不可能なので、縄文人がそのまま残り、それが続縄文人になった。
その後に、東北地方から弥生人、北方からオホーツク人とシベリア人が流入して混血したが、地域による違いが大きい。
アイヌの言語と文化は、擦文土器より後のことであり、その起源は北方系らしい…ということなります。

最近、アイヌ人が日本の先住民だという話を聞かない(ような気がする…)のは、そのせいなのかもしれません[たらーっ(汗)]
縄文人は、日本列島には少なくとも1万年以上は住んでいるので、それから比べるとアイヌ人は新参者です。
ただし、DNA的には、地域差はあるものの、アイヌ人の半分ぐらいは縄文人由来と考えていいのかもしれませんね。

ついでに(._.)φ

ゲノム解析のやり方の一例です。

2021年8月27-29日
遺伝統計学・夏の学校@大阪大学 講義実習資料
1000人ゲノムプロジェクトからデータを取得する

コメント(0) 

2/20 北京オリンピックメダリスト 金3 銀6 銅9

ski_jump.png

北京オリンピックメダリスト

[トイレ]金3 銀5 銅9

2/05 スキー男子モーグル 銅 堀島行真 A
2/06 スキージャンプ男子個人ノーマルヒル 金 小林陵侑 A
2/07 フィギュアスケート団体女子 銅
2/07 スピードスケート女子1500m 銀 高木美帆
2/10 フィギュアスケート男子シングルフリー 銀 鍵山優真 O
2/10 フィギュアスケート男子シングルフリー 銅 宇野昌磨 B
2/10 スノーポード女子ハーフパイプ 銅 冨田せな O
2/11 スノーボード男子ハーフパイプ 金 平野歩夢 O
2/12 スキージャンプ男子個人ラージヒル 銀 小林陵侑 A
2/12 スピードスケート男子500m 銅 森重航 ?
2/14 スピードスケート女子500m 銀 高木美帆 O
2/14 スピードスケート女子パシュート 銀
2/15 スキーノルディック複合個人ラージヒル 銅 渡部暁斗 O
2/15 スノーボード女子ビッグエア 銅 村瀬心椛 B
2/15 フィギュアスケート女子シングルショートプログラム 銅 坂本花織 B
2/17 スピードスケート女子1000m 金 高木美帆 O
2/17 フィギュアスケート女子シングルフリー 銅 坂本花織 B
2/20 カーリング女子団体 銀
コメント(0) 

2/17 北京オリンピックメダリスト 金3 銀5 銅9

skate_figure.png

北京オリンピックメダリスト

[トイレ]金3 銀5 銅9

2/05 スキー男子モーグル 銅 堀島行真 A
2/06 スキージャンプ男子個人ノーマルヒル 金 小林陵侑 A
2/07 フィギュアスケート団体女子 銅
2/07 スピードスケート女子1500m 銀 高木美帆
2/10 フィギュアスケート男子シングルフリー 銀 鍵山優真 O
2/10 フィギュアスケート男子シングルフリー 銅 宇野昌磨 B
2/10 スノーポード女子ハーフパイプ 銅 冨田せな O
2/11 スノーボード男子ハーフパイプ 金 平野歩夢 O
2/12 スキージャンプ男子個人ラージヒル 銀 小林陵侑 A
2/12 スピードスケート男子500m 銅 森重航 ?
2/14 スピードスケート女子500m 銀 高木美帆 O
2/14 スピードスケート女子パシュート 銀
2/15 スキーノルディック複合個人ラージヒル 銅 渡部暁斗 O
2/15 スノーボード女子ビッグエア 銅 村瀬心椛 B
2/15 フィギュアスケート女子シングルショートプログラム 銅 坂本花織 B
2/17 スピードスケート女子1000m 金 高木美帆 O
2/17 フィギュアスケート女子シングルフリー 銅 坂本花織 B
コメント(0) 

歴代天皇のY染色体は縄文系だった!? [ゲノム解析で古代史]

サムライDNAというサイトを発見しました。
このサイトの説明によると、歴代天皇のY染色体は縄文系だったことが判明したそうです。

===========
このプロジェクトはサムライDNAです。
日本の天皇のY染色体ハプログループは、D1a2a1b2a1a1に属することが、多くの検査によって明らかとなりました。同時に、天皇家から分岐した系統とされる、源氏(Mimamoto clan)、平家(Taira clan)および、東山天皇(Emperor Higashiyama)の男系子孫である徳大寺(Tokudaiji)、住友(Sumitomo)の各家から得られたサンプルからも同様の結果が得られました。
(中略)
鳥取県の青谷上寺地遺跡(あおやかみじちいせき)から大量に出土した100体近くの古代人骨は、頭蓋骨に脳の組織が残るほど保存状態の良いものが含まれていました。出土地の沼地が酸素を遮断し腐敗を防いだため、腐りやすい組織である脳が奇跡的に古代から現代まで保存される結果となりました。
これらの古代人骨は、骨格の測定から当初は弥生人骨と考えられていましたが、2019年、篠田謙一(Shinoda Kenichi)らのグループが、Y染色体を解析した結果、75%の人骨は、ハプログループD1a2(M64.1)に属することが分かり、男系は縄文系に由来する人々であることが明らかとなりました。このように、発掘調査から得られたDNA解析でも、日本民族の男系の系統が裏付けられる結果となりました。産経新聞『鳥取の出土人骨をDNA解析』(2019.4.5)
https://web.archive.org/web/20190524050810/https://www.sankei.com/premium/news/190405/prm1904050001-n3.html
===========

なお、データは次のとおりです。

続きです。

このプロジェクトはサムライDNAです。
https://www.familytreedna.com/groups/samurai-dna/about/background
日本の天皇のY染色体ハプログループは、D1a2a1b2a1a1に属することが、多くの検査によって明らかとなりました。同時に、天皇家から分岐した系統とされる、源氏(Mimamoto clan)、平家(Taira clan)および、東山天皇(Emperor Higashiyama)の男系子孫である徳大寺(Tokudaiji)、住友(Sumitomo)の各家から得られたサンプルからも同様の結果が得られました。
(中略)
鳥取県の青谷上寺地遺跡(あおやかみじちいせき)から大量に出土した100体近くの古代人骨は、頭蓋骨に脳の組織が残るほど保存状態の良いものが含まれていました。出土地の沼地が酸素を遮断し腐敗を防いだため、腐りやすい組織である脳が奇跡的に古代から現代まで保存される結果となりました。
これらの古代人骨は、骨格の測定から当初は弥生人骨と考えられていましたが、2019年、篠田謙一(Shinoda Kenichi)らのグループが、Y染色体を解析した結果、75%の人骨は、ハプログループD1a2(M64.1)に属することが分かり、男系は縄文系に由来する人々であることが明らかとなりました。このように、発掘調査から得られたDNA解析でも、日本民族の男系の系統が裏付けられる結果となりました。産経新聞『鳥取の出土人骨をDNA解析』(2019.4.5)
https://web.archive.org/web/20190524050810/https://www.sankei.com/premium/news/190405/prm1904050001-n3.html

データはこちら。
Samurai DNA project - Y-DNA Classic Chart

samurai.PNG

マニアが驚喜しそうなネタですが、なぜ誰も騒がないんですかね?

コメント(0) 

2/12 北京オリンピックメダリスト 金2 銀3 銅5

ski_jump.png

[トイレ]金2 銀3 銅5

2/5 スキー男子モーグル 銅 堀島行真 A
2/6 スキージャンプ男子個人ノーマルヒル 金 小林陵侑 A
2/7 フィギュアスケート団体女子 銅
2/7 スピードスケート女子1500m 銀 高木美帆
2/10 フィギュアスケート男子シングルフリー 銀 鍵山優真 O
2/10 フィギュアスケート男子シングルフリー 銅 宇野昌磨 B
2/10 スノーポード女子ハーフパイプ 銅 冨田せな O
2/11 スノーボード男子ハーフパイプ 金 平野歩夢 O
2/12 スキージャンプ男子個人ラージヒル 銀 小林陵侑 A
2/12 スピードスケート男子500m 銅 森重航 ?
コメント(0) 

247年3月24日に「天の岩戸の日食」があった!? [ゲノム解析で古代史]

japan_amaterasu_oomikami.png

天の岩戸の日食は、247年3月24日と248年9月5日が有力な候補になっています。

さて、この日食ですが、実は地球自転の遅れ(ΔT)が不安定なので、きちんとした計算ができません。
247年3月のΔTは、次のサイトだと8,189.8秒です。
https://keisan.casio.jp/exec/user/1348207854

この最新の数値を入れて計算すると、247年3月24日は完全な皆既日食にはなりませんが、北部九州なら食分0.95ぐらいと思われるので、相当暗くなるとは思います。
日没時に太陽が見られれば、ほぼ真っ暗になって沈んでゆくことになります。
(この日食は、魏の都・洛陽でも観測されているそうです)

なお、倭国大乱の原因と思われる158年7月13日には、北部九州でも大和でも皆既日食になります。
この日食は、新羅の首都である慶州でも観測されたと歴史書に記録されています。

そして、北部九州に限ると、168年12月17日に日没時に金環食になります。

参考『天の磐戸』日食候補について 国立天文台
https://www.nao.ac.jp/contents/about-naoj/reports/report-naoj/13-34-3.pdf
参考 247年3月24日の日食について
https://www.nao.ac.jp/contents/about-naoj/reports/report-naoj/14-34-1.pdf

iwato2.PNG

なお、天照大神は卑弥呼だという説があり、魏の使者か倭国に到着した249年には、卑弥呼は既に死亡していました。

天照大神の別名は大日孁貴神(おおひるめのむちのかみ)で、当時は神様と話せるのは独身女性だけです。名前に貴神とあるとおり、極めて位が高い女性ということになります。

それが、何の前触れもなく突然日食になれば、宗教的には彼女は霊力を失ったとされるので、最悪の場合には殺害されることもありえます。
これは宗教的にはよくあることです。

そして、このことには再現性がある(らしい?)こともわかります。

158/168年の日食⇒倭国大乱
247年の日食⇒卑弥呼の死→男王が引き継ぐが混乱→台与が引き継いで終息

158年と247年のどちらも、新羅や魏では日食が観測されていますから、日本でも日食が観測された可能性は高いと考えられます。
コメント(0) 

2/10 北京オリンピックメダリスト

ice_skate_kaiten.png

北京オリンピックメダリスト
2/5 スキー男子モーグル 銅 堀島行真 A
2/6 スキージャンプ男子個人ノーマルヒル 金 小林陵侑 A
2/7 フィギュアスケート団体女子 銅
2/7 スピードスケート女子1500m 銀 高木美帆
2/10 フィギュアスケート男子シングルフリー 鍵山優真 O
2/10 フィギュアスケート男子シングルフリー 宇野昌磨 B
2/10 スノーポード女子ハーフパイプ 冨田せな O
コメント(0)