SSブログ

心理学の性格検査の結果は、「血液型人間学」とぴったり一致する!【奥村教授の勘違い】《再度追記》 [サイト紹介]

前回の続きです。

繰り返しになりますが、統計学の大家である三重大学の奥村晴彦教授のサイトで、血液型の統計解析があることを見つけました。

・話題: B型の彼氏 / 血液型と性格の無関連性 / またまた血液型と性格

okumra3.JPG

奥村教授が作成した次のグラフ(Persistence=継続性)を見るとわかりますが、血液型の傾向どおりA型が最も忍耐強い」「B型が最も飽きっぽい」「O型もその次に飽きっぽいという結果になっています。

※点がその血液型の値で、誤差の推定範囲は点から上下に伸びる実線で示されています。

okumura2.jpg

奥村先生は、これは「偶然である」として、こう書いています。

論文では年齢・性別でコントロールしたMANCOVAが使われているが,年齢・性別がわからないので,ここでは単なるMANOVAを使ってみる:

いずれも有意ではない(Pillai 以外の方法については manova() のマニュアル参照)。

okumura4.JPG

確かに、最初と2番目の赤の下線にあるように、遺伝子型(Blood types)も表現型(ABO)もp>0.05ですので有意ではありません。

しかし、この数字は間違っているのです。なぜなら、一番下の赤の下線にあるように、なぜか「Pillai 以外の方法」の値の記述がなく、元の(土嶺さんの)論文では有意になった「Pillai 以外の方法」の値を採用しているからです。

※元の論文にはp=0.001で有意とあります。

下に、私が教授と同じ方法でフリーソフトのjamoviを使って計算した結果を示します(欠損値を除いた1435サンプルで計算)。

okumura6.JPG

確かに、Pillai's Traceこそ奥村教授と同じp=0.282となっていますが、Roy's Largest Root は、p=0.002ですから有意水準0.05よりはるかに小さく、文句なく有意となります。

奥村教授は、おそらくRoy's Largest Rootは計算しなかったのでしょう。 なぜなら、これらの4種類の数値、Pillai、Wilks、Hotelling、Royは、普通はだいたい一致するからです。
[2019.9.23 8:30追記 もう一度チェックしたら、論文中に"we used Roy's largest root statistics"とあるので、有意差が出ているのに無視した可能性もあります。仮にそうだとすると、少々問題なのではないかという気もしますが…。そもそも、MANCOVAのp値(genotypeで0.001、phenotypeで0.014)はAbstractも含めて何回も出ているのに、まったく書かないというのはケアレスミスとは考えにくいですしね。[ふらふら]

※jamoviの使い方は、こちらのサイトに日本語で解説されています。⇒MANCOVAはこちら
以前はRとEZRを使っていたのですが、jamoviはGUIで使えるので非常に使いやすいです。技術の進歩はすごいですね。


よって、奥村教授の「偶然である」という判断は否定されることになります。
ということで、奥村教授の次の文章、

慣習的な統計的検定を使う際には,多重比較に陥らないように注意すべきである。この論文のように変数が7個もある場合は,全部をまとめた検定(上の例ではMANCOVAやMANOVA)をまず行い,それが有意にならなかったら,個々の変数についての検定は参考程度にとどめる。

okumura5.JPG

は、MANOVAがp=0.002で有意なのですから、Persistenceに有意な差があることは確定と考えていいことになるでしょう。

結局、奥村教授の言う、差が出たのは「偶然」だという主張は、現実のデータで否定されてしまうのです。

では、なぜRoy's Largest Rootだけが他の3つの値と違うのでしょうか。
手持ちのデータでシミュレーションをしてみたところ、男女や年齢で血液型の影響が変わってくる場合、Roy's Largest Rootだけが有意になったりするようです。
よって、血液型のデータをMANOVAで分析する場合、奥村教授のように、Pillai's Traceだけで判断するのは「危険」ということになります。

ここで、念のために他の質問項目を調べると、Persistenceだけではなく、Reward DependenceやCooperativenessではほぼ血液型が予測するとおりの差が出ているようです。
RDは前回報告したとおりですが、Cでも、O型とA型は、B型やAB型より数値が高いのです。
7項目中3項目でそうなのですから、やはりこれらの差は偶然ではないと判断するのが妥当かと思われます。

実は、奥村教授のこのサイトには、もう一つの致命的な間違いがあります。

特に日本や韓国など血液型性格判断を信じる人が多い国では,性格テストに現れる性格は,血液型に影響されてしかるべきである。「□型の性格は○○である」と聞いて育った□型の人は「自分の性格は○○だ」という先入観を持ち,性格テストでもそのように答える傾向があってもおかしくない。

okumura5.JPG

しかし、血液型の性格で「自己成就」しているなら、仮に他の性格指標で差がないとしても、それは「見かけ」だけで、本当は差が出るはずです。よって、有意差に関係なく帰無仮説は棄却されることになります。

統計の専門家だから、かえって「血液型と性格」を誤解するのかもしれませんね。帰無仮説が無意味なんて、普通は考えないですからね(笑)。

このように、血液型は「統計の常識」をことごとく否定してしまうのです。
遺伝子が性格に与える影響を直接的に研究しているケースはほとんどないはずなので、こんな奇妙なことが起きても特に不思議ではないのかもしれません。

現時点では、真相は神のみぞ知る…というところ、ですかね?

誰かが一刀両断に謎を解き明かしてくれないでしょうか…。

【2019.9.22 18:20 追記】

調べてみたところ、
・Pillai's Traceが適していないのは、自由度が1より大きい場合
・Roy's Largest Rootが適しているのは、帰無仮説からのずれが大きく、固有値が大きく異なる場合
とあり、どちらも土嶺章子氏の論文に当てはまると思うのですが。

なお、ソースは次のとおりです。
https://www.statisticshowto.datasciencecentral.com/pillais-trace/
http://www.jmp.com/japan/support/help/13/flm-multiple-response-10.shtml
元々のソースは、いずれも Seber, G.A.F. (1984). Multivariate Observations. とのことです。


後者のサイトには「残念ながら常に他よりも優れている検定というのものはありません」ともあります。

【2019.9.22 21:30 追記】

ところで、MANOVAの計算には線形代数(行列)を使います。
私は、数学は嫌いではありませんが、線形代数は大の苦手でした。[あせあせ(飛び散る汗)]
それでも、ちょっと気になったので、TCIの7つの性格因子の関係が「線形」代数でうまく扱えるのか、直感的にわかるように分布図を書いてみました。

少々極端な例として、HAとSDの関係を示しておきます。

okumura7.JPG

結果は見たとおりで、2つの関係は「線形」(1次方程式)ではなく、2次(以上の)方程式でないとうまくフィットしません。

実は、MANOVAの計算にはいくつかの条件があり、
1. 正規分布
2. グループのサンプルサイズが同じ
3. 従属変数間に相関があってもよい
ということになっています。

このHAとSDでは、rは0.565(R2=0.319)ですから、結構な相関があります。
しかし、この相関は「線形」ではありません。
この場合、MANOVAはたしてどのような結果になるのでしょう?
Roy's Largest Rootだけ極端にpが小さいのは、そういう理由からかもしれません、ね…。

【2019.9.22 23:30 追記】

Roy's Largest Rootだけ極端にp値が小さい理由がやっとわかりました。[るんるん]
私は線形代数は苦手なのですが、さすがに固有値λぐらいはわかります(どうやって計算するんだっけ?[あせあせ(飛び散る汗)]

MANOVAでは、p値を計算するのに、擬似的なF分布を使います。
簡単に言うと、従属変数ごとにこのλを計算し、λの値が大きいほど(逆数の場合は小さいほど)p値が小さくなります。
計算方法はわからないので省略します。[あせあせ(飛び散る汗)]

okumura8.JPG
ソース:心理統計法-多変量分散分析(1)

では、具体的にMANOVAの4つの値
・Pillai's Trace
・Wilks' Lambda
・Hotelling's Trace
・Roy's Largest Trace
はどうやって計算するのでしょうか。

私が一番わかりやすかったのは、次の英語版Wikipediaでした。

okumura9.JPG

これなら素人でもわかりますね(笑)。

・Pillai's Trace
・Wilks' Lambda
・Hotelling's Trace
の3つは、すべての従属変数のλの平均値です。
#平均の出し方にはいろいろな方法があります。

ところが、Roy's Largest Rootだけはすべての従属変数のλの最大値なのです!

土嶺章子氏の論文を読めば明らかなように、TCIの7つの性格因子は、Persistenceだけがかなり小さなp値で有意なものの、残りの6つにはほとんど有意差はありません。

これはどういうことかというと、Persistenceだけが有意な場合は、Roy's Largest RootだけがMANOVAの結果で有意になるということです。Pillai's Traceなどの残りの3つは、7つの性格因子の平均値なので、有意差は小さくなるか、消滅するということになります。

これは、最初の16:20の追記の内容
・Pillai's Traceが適していないのは、自由度が1より大きい場合
・Roy's Largest Rootが適しているのは、帰無仮説からのずれが大きく、固有値が大きく異なる場合
ともうまく符合します。
やっと謎が解けたので、これで枕を高くして眠れますね。[ウッシッシ]

【2019.9.23 9:20 追記】

我ながらしつこいのですが、手持ちのデータでMANOVAをやってみました。
少数の従属変数だけに有意差がある場合は、Roy's Largest Rootが適していることは明らかです。
6つの質問項目のうち、血液型で最も差が大きいのはq3-2ですが、予想どおりRoy's Largest Rootだけがp=0.002で有意で、他はp=0.092だから有意ではありませんでした。
奥村先生もうっかりしたのですかね。
弘法も筆の誤りということでしょうか…。

okumura10.JPG

コメント(4)