SSブログ
前の10件 | -

ゲノムのフォーマット(Assembly)を変換する [ゲノム解析で古代史]

前回の続きです。

古代人と現代人を併合した主成分分析がうまくいかなかったのですが、どうやら、ゲノムのフォーマット(Assembly)を変換する必要があったようです[たらーっ(汗)]

古代人のゲノムは(なぜか?)GRCh37らしいのですが、現代人は最新のGRCh38(例:1000 Genome Project)です。

ネットで探したら、一番簡単そうなのが↓

macでインフォマティクス
EnsemblのGenomic feature座標変換機能(CrossMap)

トップページからEnsembl Toolsを選択します。

ensmbl.png

そして、Assembly Converterを選択します。

AsssemblyConverter.png

残念ながら、エラーになってしまいました[もうやだ~(悲しい顔)]

本当にうまくできるのかな?

【追記】

URLを直打ちしたらうまくいきました[グッド(上向き矢印)]
https://grch37.ensembl.org/Homo_sapiens/Tools/AssemblyConverter?db=core

たまたま?

コメント(0) 

朝鮮半島古代人のDNAは縄文人・弥生人とほぼ同じ《謎3》 [ゲノム解析で古代史]

前回の続きです。

既出の歴博の論文、

国立歴史民俗博物館研究報告 第242集
[論文] 弥生人の成立と展開Ⅱ : 韓半島新石器時代人との遺伝的な関係を中心に
(2022年11月21日受付,2023年3月31日審査終了)
https://rekihaku.repo.nii.ac.jp/records/2000021

ですが、読み直して不思議なことを見つけました。それは冒頭にある図1↓です。

fujio.JPG
この図に示されている朝鮮半島南部の古代人のゲノムですが、安島(Ando)は「中国北部系」、獐項(Changhang)と欲知島(Yokchido)は「韓半島新石器系(西遼河系+古代東アジア沿岸集団系(韓半島新石器時代人))」とあります。

また、烟臺島(Yondaedo)と大中里(Taejungni→Daejungri)も同じ「韓半島新石器系」ですが、なぜか掲載されていません。

さて、この論文で参照されているNatureの論文↓、

Robbeets M et al. (2021). Triangulation supports agricultural spread of the Transeurasian languages.
Triangulation supports agricultural spread of the Transeurasian languages.
https://doi.org/10.1038/s41586-021-04108-8

のExtended Figureでは、「主成分分析」の結果の図↓があり、

triangulation2.JPG
Extented Figure 7

triangulation.JPG
Extented Figure 8

これらを見てみると、

Changhang(一部)、Yokchido →縄文人に最も類似
Ando、Changhang(一部)、Taejungni、Yondaedo →弥生人(現代日本人)に最も類似
※主成分分析は、分析の対象にするデータの選択により結果が変化することがあるため、上の2つの図の結果は必ずしも一致しない。

となります。また、歴博の論文の「古代東アジア沿岸集団系」はほぼ「縄文系」と同じなので、わざわざ言葉を区別する意味も分かりません。

なお、この論文の注釈(1)にはこうあります。

後期旧石器時代に東南アジアから東アジア沿岸を北上してきたホモ・サピエンスで,沿岸部や島嶼部に存在する。韓半島の新石器時代人や縄文人の共通の祖先である(古代東アジア沿岸集団)。

ところが、朝鮮半島の後期旧石器時代は「事実上無人」だったので、そもそも住民がいないのだからこの注釈(1)の記述はおかしいのです。

それにしても、烟臺島(Yondaedo)と大中里(Taejungni→Daejungri)も同じ「韓半島新石器系」ですが、掲載していない理由は不明です。

以上のことを素直に考えると、数千年前に縄文人や弥生人が日本列島から朝鮮半島南部に移住し(Taejungniは微妙)、その後に中国北部系と混血して現代韓国人になった、というのが最も可能性が高いシナリオになります。

実際にも、朝鮮半島には楽浪郡や帯方郡が置かれ、中国北部系と混血があったことは確実ですから、歴史書とも矛盾しません。

なお、韓国の地名ですが、アルファベットを漢字に直すと、

Ando→慶尚南道 統営市 安島
Changhang→釜山市 加徳島 獐項
Taejungni(Daejungri)→忠清南道 公州市 大中里
Yokchid→慶尚南道 統営市 欲知島
Yondaedo→慶尚南道 統営市 烟臺島

となります。

コメント(0) 

朝鮮半島古代人のDNAは縄文人・弥生人とほぼ同じ《謎2》【追記あり】 [ゲノム解析で古代史]

前回の続きです。

さて、前回紹介した東大の「二重構造説」の論文↓ですが、

縄文人と渡来人の混血史から日本列島人の地域的多様性の起源を探る
渡部 裕介(生物科学専攻 特任助教)
大橋 順(生物科学専攻 教授)
https://www.s.u-tokyo.ac.jp/ja/press/8252/

原論文は↓で、

Modern Japanese ancestry-derived variants reveal the formation process of the current Japanese regional gradations
https://www.cell.com/iscience/fulltext/S2589-0042(23)00207-9

この論文が投稿されたのは「2022年9月26日」↓とあり、改訂版は2022年12月2日となっています。

date.JPG

ご存じのとおり、朝鮮半島古代人である「渡来人」が縄文人と混血して弥生人になった、というのが「二重構造説」のキモです。それなら、「朝鮮半島古代人」のデータがあれば、論拠は極めて強力になるはず。しかし(なぜか?)、そういうデータはありません。

ところが、前回説明したENA↓のデータには、ちゃんと問題の朝鮮半島古代人のデータがあるのです。"ancient Korea"で検索すると数件が引っかかりました。
(日本なら、"jomon"、"yayoi"、"kofun"などで検索)

ENA: https://www.ebi.ac.uk/ena/browser/home

ena2.JPG

では、このデータはいつ公開されたのか?
↓の例では、「2022年6月22日」でした。この東大論文を投稿した2022年9月26日の「3か月前」なので、頑張れば内容に反映することは可能だったはずです。

ena3.JPG

仮に無理だとしても、改訂版は2022年12月2日なのですから、この時点で反映することは十分に可能だったはず。

念のため、この論文のプレスリリースの日付は、東大のサイト↓によると「2023年2月21日」です。

date2a.JPG

閑話休題。

もちろん、朝鮮半島古代人のデータが公開されたことを「うっかり」知らなかったという可能性もあります。
ただ、それにしても、プレスリリースの「2023年2月21日」時点で半年以上前の「2022年6月22日」公開のデータを知らなかったというのは、素人じゃないので考えにくいです(汗)。

やっばり、欧米人の論文じゃないとダメ?

実は、同じことは「2022年11月21日受付」の歴博の論文↓にも言えます。

国立歴史民俗博物館研究報告 第242集
[論文] 弥生人の成立と展開Ⅱ : 韓半島新石器時代人との遺伝的な関係を中心に
(2022年11月21日受付,2023年3月31日審査終了)
https://rekihaku.repo.nii.ac.jp/records/2000021

読めばわかりますが、やはり「2022年6月22日」公開のこのデータを知らなかったということになります。そして「2023年3月31日審査終了」だから、審査者も知らなかった…(汗)。

もっとも、歴博はゲノム解析の専門家ではないので、しょうがないのかもしれませんね…。

さて、日経サイエンス2024年2月号 特集:DNAが語る古代ヤポネシアでも、この1年半前のデータについては何も書いてありません。

さすがに、こうなるとステータスのある科学誌としてはいかがかと思いますが…(汗)。

結論として、これら最新のゲノム解析の結果が正しいとすれば、従来の「二重構造説」はほぼ完全に否定される…ということになります。[パンチ]

また、石井望氏のブログ記事には、

2000/12/01  
「古代朝鮮と日本との交流」――西谷正・九州大学教授
  (朝鮮奨学会「古代史シンポジウム」から)
朝鮮の南海岸地域にあたる欲知島では、縄文時代早期末の九州の轟式土器のほか、朝鮮で初めて縄文時代によく見る石匙(さじ)が出土している。
http://www.toyo-keizai.co.jp/news/culture/2000/post_3605.php

とあります。

よって、考古学的な知見からも、「朝鮮半島古代人のDNAは縄文人・弥生人とほぼ同じ」ということが裏付けられることになります。

やれやれ(汗)。

余談ですが、↑のENAから得られるデータはBAMなので、主成分分析をするためには、PLINKで扱えるVCFにする必要があります。

やり方の例↓
To go from .bam to .vcf, it is fairly easy using bcftools call: bcftools mpileup -Ob -o -f bcftools call -vmO z -o Taken from htslib website. https://bioinformatics.stackexchange.com/questions/18598/how-to-convert-a-bam-file-into-a-vcf-file/18603#18603


本当にできるのかな?

【2024.1.27追記】

そうしたら、2021年のNatureの論文↓には、朝鮮半島古代人のデータは、既に大部分が公開されていたのですね…。
Robbeets M et al. (2021). Triangulation supports agricultural spread of the Transeurasian languages.
Triangulation supports agricultural spread of the Transeurasian languages.
https://doi.org/10.1038/s41586-021-04108-8

間抜けなことに、私は知りませんでした。[たらーっ(汗)]
しかし、まさか東大の人間が「2021年のNature論文」を読まなかったとは思えません。
よって、知らなかったのではなく、朝鮮半島古代人のデータが公開されたことを知っていたにもかかわらず、意図的に無視した(?)可能性が極めて高いことになります。

ということは、冒頭に紹介した東大論文は、「二重構造説」を否定したくないための論文で、日経サイエンスも“同調”した可能性が極めて高いという結論になります。

本当なのかな?

【2024.2.17追記】

やり方の例↓

1. リファレンスゲノム配列を入手します。

リファレンスゲノム配列(GRCh38/hg38)と日本人基準ゲノム配列(JG2)
https://biotech-lab.org/articles/6389

Ensembl (EMBL-EBI):
http://ensembl.org/Homo_sapiens/Info/Index

スクリーンショット 2024-02-17 132240.png
→Homo_sapiens.GRCh37.dna.primary_assembly.fa.gzをダウンロードします。
※GRCh38ではダメでした…。[2023.2.18修正・追記]

2. bfctoolsを使ってvcfを作ります。

bcftools mpileup -Ou -f ref.fa map.bam | bcftools call -mv -Ov > var.raw.vcf
https://bioinformatics.stackexchange.com/questions/18598/how-to-convert-a-bam-file-into-a-vcf-file/18603#18603

コメント(0) 

朝鮮半島古代人のDNAは縄文人・弥生人とほぼ同じ《謎1》 [ゲノム解析で古代史]

前回の続きです。

そうしたら、中国人も同じような図を出してました。
The genetic structure and admixture of Manchus and Koreans in northeast China
https://doi.org/10.1080/03014460.2023.2182912

iahb_a_2182912_f0002_c.jpg

この図でも、朝鮮半島古代人のDNAを見ると、ほとんどが弥生人か縄文人です。
だんだんバカバカしくなってきますね。
知らないのは日本人だけなのか…(苦笑)。

ひょっとして、欧米人が同じ図を出さないとダメ?

これでわかったのは、古代人のデータはかなりの数が無料で入手できるということです。恥ずかしながら、私は初めて知りました(汗)。

例えば、

縄文人と渡来人の混血史から日本列島人の地域的多様性の起源を探る
渡部 裕介(生物科学専攻 特任助教)
大橋 順(生物科学専攻 教授)
https://www.s.u-tokyo.ac.jp/ja/press/8252/

の原論文は↓ですが、

Modern Japanese ancestry-derived variants reveal the formation process of the current Japanese regional gradations
https://www.cell.com/iscience/fulltext/S2589-0042(23)00207-9

ここには、データの入手先として、

1000 Genomes Project Phase 3 ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/release/20130502/
KPGP Korean genomes ftp://biodisk.org/Release/KPGP/KPGP_Data_2018_Release_Candidate/
Funadomari Jomon genome SRA: DRA008031
Ikawazu Jomon genome ENA: PRJEB26721
11 Jomon and 3 Kofun genomes ENA: PRJEB43762
GWAS summary statistics http://jenger.riken.jp/result

とあります。SRAとENAは↓のとおりです。

SRA: https://ddbj.nig.ac.jp/search

ddbj.JPG

→ここは三貫地縄文人のデータしかありません。

ENA: https://www.ebi.ac.uk/ena/browser/home

ena.JPG

→こちらは日韓中なんでもあり!

【続く】
コメント(0) 

1/18 22:00 アベプラ②なぜ科学的じゃない血液型占いを信じる?/兼近大樹【感想】追記あり [テレビ番組]

前回の続きです。

#アベプラ②なぜ科学的じゃない血液型占いを信じる?/兼近大樹
ABEMA NEWSチャンネル
1月18日(木) 22:00 〜 23:00
https://abema.tv/channels/abema-news/slots/CwgENE3yGXdxsH

ABEMA 1.18.png

番組[TV]を見たので、簡単な紹介と感想を書いておきます。

結論からすると、否定の理由がまったく「科学的じゃない」のに大笑いしました。[わーい(嬉しい顔)]
こうなると、「関係ない」という人に「科学的」に説明してもムダと言うことがよく分かります。[たらーっ(汗)]
私も説得の方法を考えないとだめですね。

まずは「バーナム効果」について。
バーナム効果というのは、「誰にでも当てはまる」ような文章を見せて、あたかも自分に当てはまると感じさせることです。
だから、血液型の性格が当たっているように見えるのは、「ウソ」だというものです。

さて、これが番組で見せた「血液型の性格」です。

abema2.png

次は、この番組の実験で使った「バーナム効果」の文章です。

abema1.png

見れば分かりますが、血液型の性格については、このバーナム効果の文章にはほとんど書いてない!
つまり、この実験では、血液型の性格が当たっているように思える理由が、バーナム効果のせいどうかは「不明」なのです。

本気でテストするなら、もちろん!血液型の性格を書いてないといけない!
いや、それなら“信じている”人が64%もいるのだから、当たるに決まっています。[わーい(嬉しい顔)]

abema3.png

さらに笑ってしまうのが、次の画面です。

abema12.png

少し考えるれば分かるように、一番上の「バーナム効果」(誰にでも当てはまる)と一番下の「予言の自己成就」(本当になる)は正反対なのです!
どっちを主張したいのか不明です。

また、次のような「血液型で差がある」データを見せても、それは根拠にならないというのです。

abema6.png

abema5.png

abema7.png

abema8.png

いやぁ、まるっきり統計を分かってないとしか思えません。
ちゃんと勉強したのかな? 思わずツッコミたくなります。[わーい(嬉しい顔)]

また、次のBPOの「要望」は、その後の裁判で実質的に撤回しています。[パンチ]

abema9.png

そしてまた、この画面のペルー人の血液型ですが…
O型が100%なのは先住民だけです。現在は混血が多いので、O型が100%はありえない!
理由は、梅毒に強いO型が淘汰圧で生き残ったためだとされています。

abema4.png

いやぁ、本当に大丈夫ですかね?

なお、番組では“ブラハラ”を強調していましたが…

abema11.png

最後まで反対していたB型の大空さんも、大谷翔平がB型と聞くと態度を豹変。[わーい(嬉しい顔)]

まぁ、バラエティー番組なのですから、あまり真剣に考えてもしょうがないのかもしれませんね…。[たらーっ(汗)]

【追記】

↑について、Gijika.comの血液型掲示板に書き込もうとしたら、BANされました。まぁ、いつものことなので…。

【追記2】

絵文字を入れたのが悪かったのかもしれません…。今度は大丈夫でしたが、このシステムはよく分かりませんね。


コメント(0) 

台湾の総統選挙に当選した賴清德氏はB型

台湾の総統選挙に当選した賴清德氏はB型のようです。
https://www.facebook.com/1755405381238013/posts/1918142368297646/

賴清德.JPG

パイナップルを食べている表情がすごくB型っぽい[わーい(嬉しい顔)]

コメント(0) 

日経サイエンス2024年2月号 特集:DNAが語る古代ヤポネシア [ゲノム解析で古代史]


日経サイエンス2024年2月号 [雑誌]

日経サイエンス2024年2月号 [雑誌]

  • 出版社/メーカー: 日経サイエンス
  • 発売日: 2023/12/25
  • メディア: Kindle版

この記事は、ある意味では非常に面白いです。
というのは、核ゲノムとミトコンドリアはきちんと解析しているのに、Y染色体については何も書いてないのです。
なぜなら、“渡来人”のY染色体は、かなりの部分が「縄文系」だからです[わーい(嬉しい顔)]
まぁ、なぜ書かない(書けない?)かは推測がつきますが、古代人のゲノム解析はタブーが非常に多いことがわかりました[たらーっ(汗)]
コメント(0) 

1/18 22:00 アベプラ②なぜ科学的じゃない血液型占いを信じる?/兼近大樹 [テレビ番組]

ABEMA TV[TV]で血液型特集をやるそうです。
これですね!

#アベプラ②なぜ科学的じゃない血液型占いを信じる?/兼近大樹
ABEMA NEWSチャンネル
1月18日(木) 22:00 〜 23:00
https://abema.tv/channels/abema-news/slots/CwgENE3yGXdxsH

ABEMA 1.18.png
コメント(0) 

山本 輝太郎、石川 幹人さん 科学がつきとめた疑似科学 [新刊情報]


科学がつきとめた疑似科学

科学がつきとめた疑似科学

  • 出版社/メーカー: エクスナレッジ
  • 発売日: 2024/02/03
  • メディア: 単行本(ソフトカバー)

疑似科学を科学的に考えるGijika.comの管理者さんたちの著書です。
紹介文を読んだ限りでは、なぜか血液型は書いてないようです。
なんで?
コメント(0) 

大河ドラマ主役の吉高由里子はO型 [テレビ番組]

今年NHK大河ドラマの主役は吉高由里子で、番宣を見てたらO型だと確信したのですが、やっぱりそうでした[手(チョキ)]

私がO型を当てるのは珍しいです[たらーっ(汗)]

源氏物語 1 (河出文庫 か 10-6)

源氏物語 1 (河出文庫 か 10-6)

  • 出版社/メーカー: 河出書房新社
  • 発売日: 2023/10/05
  • メディア: 文庫



コメント(2) 
前の10件 | -