UA-115498173-1

2019年02月02日

不正統計と統計リテラシー

不正統計の報道で騒がしい昨今ですが,この言葉を聞くたびに「ちょっと違うのではないか」と思うのです.不正統計が何を指しているのかといえば,ご存知のように厚生労働省の毎月勤労統計の調査が正しく実施されていなかったという問題です.毎月勤労統計調査(いわゆる「マイキン」)では従業員500人以上の事業所はその全てが対象になっていますが,東京都内では3分の1しか調査していなかったとのことです.
母集団からサンプリングしてその平均値を母平均の推定値とするという行為そのものは統計学としては全く問題ありません.問題はサンプリングがランダムでなかったことです.日本全国の平均賃金を推定する場合,東京都内でのみ三分の一サンプリング(少しい変な言い方ですが,そのほかではサンプリングは全数)していたのであれば,母平均の推定値は真値よりも小さくなります.東京都には比較的賃金の高い事業所が集中しているからです.この報道を聞いたとき,サンプリングして東京都の平均賃金を推定した後,東京のサンプルサイズを3倍したのかと思っていましたが,そんな単純な処理すらしていなかったようです.どうしてそのままでいいと思ったのでしょうか.謎ですね.
とはいえ,この問題を不正統計と呼ぶのはやめていただきたい.確かにサンプリング手法は間違ってはいますが,統計手法が不正なわけではありません.おそらく不正統計というときの「統計」はデータの意味で用いていると思いますが,データ自身も捏造された不正なものではありません.この行為が問題なのは違法であるということです.毎月勤労統計調査は,それによって景気判断はもとより様々な政策が決定されるわけですから,国の基幹統計調査として統計法で定められているのです.ですから,今回の問題は不正統計ではなく不法統計と言って欲しいと思います.統計という言葉と不正という言葉が紐付けられてしまい,人のヒューリスティックな判断に影響をもたらすはずです.不正統計などという間違った言葉が蔓延るのは少なくとも統計教育にとって百害あって一利なしです.
統計には嘘はありません.「嘘には三つある.一つは嘘でもう一つは大嘘(真っ赤な嘘とも),そして三つ目は統計だ.」などというマーク・トゥエインの言葉が有名ですが,彼がこのイギリスの首相の言葉(諸説あります)を引用したのは,元々は「(私は)数字に惑わされる」という文脈でした.確かに数学には嘘はありませんが,数字には嘘があります.それと同じく,統計学には嘘はありませんが,統計データ(結果)には嘘はあります.嘘があるのはそこに人間がいるからで,嘘をつくのは人間なのです.それを統計のせいにするな,とわたしは言いたい.とはいえ,嘘をつくつもりがなくとも人間に間違いや勘違いは付きものです.そのための最低限の能力が統計リテラシーです.
例えば,マイキンでもその一部で全数検査が(本当に必要なのかは別にして)実施されているかもしれませんが,そもそも,日本の勤労者すべてを母集団とするならば,東京都のみ全数調査するのは正しいサンプリングなのでしょうか.精度を上げたいという意図は理解できますが,従業員が499人の事業所はおそらくサンプリング調査されているはずです.500人という区切りの根拠は明確ではありません.統計学の示すところによれば,所詮はサンプリングの結果に過ぎないのならば,推定値と合わせて信頼区間を提示すべきということです.
信頼区間を提示するには提示する側もされる側にもある程度の統計学の知識が必要です.この統計学の知識を読んだり書いたりする能力が統計リテラシーとも言えます.統計リテラシーを前提にしてデータの開示がなされるようになるべきですが,とある科学分野の論文を読んでいても,SDとSEを取り違えているようなものも目に付くくらいですから,役所に統計リテラシーを期待すべきではないかもしれません.
そもそもお上の統計の扱いには常々疑問を抱いています.e-Statが開設された時のゴタゴタは記憶に新しいところです.わたしもセミナー用のデータとしてe-Statをよく利用させていただいているのですが,そのほとんどがmessy dataです.JMPのマニュアルでは雑然データと訳されていますが,messyには散らばって汚らしいというニュアンスがあります.あまり触れたくない感じです.csvやxslで提供されているならまだしもPDFになっているデータがかなりあります.PDFというフォーマットは本来印刷用のものでデータ分析にかけることは想定されていません.
xslデータであっても,例えばこの学校保健統計調査のような見ることを前提としたデータが圧倒的です.年齢という重要な変数がシートに分割されてしまっています.これは困りました.おかげでわたしとしてはこれを他山の石としてセミナーの題材にできるのですが.さて,データはe-Statからダンロードできます.このmessy dataをJMPで分析するのはどうすれば良いでしょうか?例えば,身長と体重からBMIを算出してそれが年齢でどのように変化するのかを男女別に見たいとして,どうすればいいでしょうか.実はこの処理で一箇所つまずくところがあります.来週のブログで手順を合わせて回答しますので,お楽しみに.
因みに結果の一部を示しておきます.データは「学校保健統計調査平成30年度(速報)」を使ってBMIのクラスタリング結果(性別,年齢を区別しない)を表示していますが,この分布を再現できますか?
DraggedImage.42b27d5ea5b842f484a9413144f3de1a.png

それではまた.
タグ:JMP
posted by Tad at 19:00| Comment(0) | TrackBack(0) | 統計リテラシー

2018年12月15日

コミュ力とは何か?

ブログとはそもそも日記のようなものなので,思ったことを書けばいいのでしょうけれど,思ったことをそのまま発信するのは気が引けるものです.結果として誰かを批判するように取られてしまうのを恐れるからです.そんなわけで,あまり時事ネタは取り上げないようにしているのですが,たとえ少しでも統計に関わっていれば話は別です.
今週目にとまったのは,順天堂大学の入試問題についてのニュースです.朝日新聞デジタルによれば,「順大入試、女子を一律に減点「コミュ力が高いため補正」」という見出しで以下のように報道されていました.

 順天堂大(東京都)は10日、医学部入試をめぐって設置した第三者委員会から「合理的な理由なく、女子や浪人回数の多い受験生を不利に扱っていた」と指摘されたと公表した。

具体的には,2次試験の面接で女性の点数に負の下駄を履かせていたとのことです.その理由が「女子はコミュニケーション能力が高いため、補正する必要がある」からとのことです.補足すると,この差は「18歳の時は女性が高くても、20歳で一緒になる」のだそうです.この「客観的データ」に基づいて,18歳の男性の不利にならないように面接評価を補正したとのこと.この「客観的データ」というのは,大学側が第三者委員会に提出した,その旨の医学的検証を記載した米大学教授の1991年の論文と書かれてあります.朝日新聞がその論文を確認したところ,面接時のコミュニケーション能力について論じた部分は見当たらなかったそうです.記事には論文についての詳細はありません.「有料会員になると続きをお読みいただけます。残り:660文字/全文:1311文字」とのことで,660文字にそれが書かれているのかもしれません.無料会員でも1日1本まで有料記事が読めるのですが,朝日新聞のサイトはトラッカーが多い(確認できるだけでも5つ)のであまり立ち寄らないようにしています.(因みに,読売新聞も毎日新聞も1トラッカーしか確認できません.)
どうやって「コミュ力」のような得体の知れない能力を医学的なエビデンスの検証対象としての俎上に載せるのか興味があり,わたしもその論文を読んでみたいと思ったのであちこち調査して,ようやくその論文を見つけました.幸いオープンになっています.Cohn L.D.(1991), Psychol Bull. Mar;109(2):252-66 Sex differences in the course of personality development: a meta-analysisという題名からもわかるようにメタアナリシスの論文でした.著者はテキサス大学のCohn先生です.
この論文を読むのに必須な前提知識がありまして,それがLoevenger’s Systemと呼ばれる自我発達過程についての理論です.子供から大人へと登る階段とでもいいましょうか.1976年の論文(Ego Development: Conceptions and Theories)では衝動的から自立的に至る7つの段階(定義の違いによっては9つまたは10)が説明されています.重要なのはこの理論では各段階と年齢とを紐付けないので,大人でも衝動的段階に留まったままの人もいるかもしれないということです.
Cohn L.D.(1991)では,この階段の登り方に性差があるかを調査した65の研究(113の比較データ)をメタアナリシスにかけたものです.どのように自我発達段階を数値化したかを読んでみると,WUSCT(Washington University Sentense Completion Test)という,文の出だしを与えてそれに続く言葉を考えて文章を完成させるテストを基にしているようです.例えば,”If my mother…”に続いて,“…hadn’t married so young and had less than five children…”などと書いたとして,それをマニュアルに従って採点します.このテストには色々なバージョンがあるようですが,ジェーン・ロエビンガー先生の考案したオリジナルでは36ある文章完成問題の総合点数TPR(Total Protocol Rating)スコアという1つの指標で発達段階を表現します.メタアナリシスでは男女間の差を,効果サイズ(Hedges’gが計算できる情報がなければCohen’d)で統合的に示したのです.エビデンスレベルとしては高い研究と思います.JMPでどうやってこれらの指標を求めるかについてはいずれこの場で書きたいと思います.
その結論としては,女性の方が男性よりも青年期においては(自我発達段階において)進んでいるが,大人になるとその差は消滅するというものです.言葉を変えれば「女の子の方がおませだ」という一般に言われていることを科学的に検証したといえます.
問題は,この結論から大学入試(高校卒業)の時点で女性の方がコミュニケーション力があると言えるかということですね.いくつか思ったことを列挙します.
1.発達段階とコミュニケーション力の関係については重要なキーワードがありますが,1つはego centrismです.自己中心主義と訳すこともありますが,今の文脈ではピアジェが児童心理学で用いた自己中心性のことです.よくあげられるのが,幼い子供が目をつぶって相手からも自分が見えなくなると思い込むという例です.即ち,自分の主観的視点でしかものを見れないという幼児期の特徴を意味しています.ego centrismをコミュニケーション力の指標とするならば,自我発達段階が進んでいる女性の方が(ある年代までは)コミュニケーション力はあるとは言えます.一方,Cohnの論文には,先行研究の知見として”perspective talking appears no greater in girls than in boys.”という記述があります.perspective talkingとはthe ability to accurately label the feelings of another person(他人の気持ちを正確にラベル付けする能力)と書いてありますが,日本語では視点取得と訳され,相手の立場に立って考える対人的な共感的過程のことです.この能力は男性よりも女性の方
いずれにせよ,Cohn論文には,コミュニケーション力という言葉が直接出てくるわけではありません.この点は朝日新聞の指摘通りなのですが,問題はそこにはなく「自我発達段階が進んでいるからコミュニケーション力がある」というピース(エビデンス)なしには順天堂大学のロジックは破綻しているということです.探せばあるのかもしれませんが,それなしにはロジックの中抜き論法にすぎません.特に初段に権威を持って来ればその威力は絶大だという例になっています.
2.WUSCTはジェーン・ロエビンガー先生がそもそも女性を対象として開発されたテストであって,男性や日本人に対しての妥当性は別の議論になります.男性向けのマニュアルや日本人を対象としたSCTも開発されていますが,それは90年代後半になってからのことなので,Cohn論文の対象となった研究で発達段階の(少なくとも日本人の)性差を議論するのは疑問が残ります.
3.性差があったとしても,それは大人になれば消失するという結論です.それでは,どの時点で消失するのかについて考察もされていますが,高校生の間は差は安定しているもののgrade13(米国では18−19歳)で急激に減少すると示されています.もしかしたら,この発達段階の性差のダイナミズムは大学入学という節目による環境の変化を反映しているのかもしれません.何れにせよ,20歳で消失するというのではなく,20歳では既に消失(低減)しているというのがより正確です.従って,面接試験を受ける女性(特に一浪でもしていたら)不利を被っているだけということになります.
4.仮に,順天堂大学のロジックの根拠を認めたとして,そもそもコミュニケーション力が高い方が医師に向いているのではないでしょうか.不公平をもたらすというのであれば,面接を止めれば良いのでは?
5.計測技術の技術者としてこれだけは譲れないのが,補正という言葉は使わないでいただきたいということです.減点とかペナルティとかハンディキャップとか他に適切な言葉は色々ありますから.

この件についてわたしがどう結論するかはここには書きません.とはいえ,朝日新聞の記者が読んだというだけで納得せずに,自分でソースを探し出して自分で理解しようとしました.勉強になったこともたくさんあります.これが統計リテラシーの基本だと思うのです.

それではまた来週.

この記事を書いた後に奥村先生のtweetがありましたのでご参考まで.

posted by Tad at 19:00| Comment(0) | TrackBack(0) | 統計リテラシー

2018年11月03日

紅茶の話

11月1日は紅茶の日だったそうです.ポッキーの日(正式にはポッキー・プリッツの日)がその形状から決められたように,紅茶の葉を数字の1に見立てて11月1日と決めたのだろうと思っていたのですが,日本紅茶協会によると,初めて外国での正式の茶会で紅茶を飲んだ日本人と言われる大黒屋光太夫が,女帝エカテリーナ2世に接見したのが1791年の11月と記録されているからだそうです.別の記録によれば1791年6月とも書かれていますが,とにかく由来はこのような歴史に基づいているそうです.大黒屋光太夫といえば,司馬遼太郎『菜の花の沖』にも登場したので,高田屋嘉兵衛とイメージがダブりますが.緑茶に慣れていたであろう光太夫の舌には紅茶はどのように感じられたのか興味があります.ロシア流の紅茶は甘いジャムを舐めながら(おそらく口に含んで溶かしながら)飲むそうなので,おそらく不味いと感じたと推察します.
紅茶の日ということで,日本紅茶協会が配布したポスターがtwittetで話題になっていました.「紅茶はインフルエンザウイルスを99.9%無力化します!!!」とのことで,みなさん99.9%というところを怪しまれているようです.紅茶のテアフラビンは抗菌作用があることで知られています.確かのど飴が売られていたと記憶していますが...あった,見つけました.このテアフラビンは紅茶の発酵過程で緑茶のカテキンが酸化して生成するポリフェノールです.長崎大学大学院医歯薬学総合研究科天然物科学研究室のサイトによればその生成にはまだわかっていないことが多いと書かれています.このページの下の方にあるカテキンの参加経路など拝見すると,この式が理解できるというのはすごいですね.ここに書かれていますが,紅茶でなくても,緑茶にリンゴの皮やバナナスライスなどを入れることで,テアフラビンは生成されるそうです.緑茶にリンゴの皮を入れて飲めばインフルエンザ予防に効果あるのでしょうか?
さて.紅茶がインフルエンザウイルスを99.9%無力化するという主張を統計リテラシーに照らして検証してみましょう.まずは主張の根拠を探すことから始めます.行き当たったのが,紅茶協会のインフルエンザに対する感染伝播阻止効果という資料です.ここにはインフルエンザウィルスを何と99.999%無力化すると書かれています.どうやら培地上で100万個以上あったウィルスが紅茶を作用させたことで検出限界の10個以下になったからということが根拠のようです.検出値を検出限界で割り算して何倍というのは残留放射線のケースでもそうでしたが,よくある間違いです.検出限界はバックグラウンドの変動という確率的な現象を数値化したものという認識が欠けています.**%無力化するという表現も気になるところです.100個のものが1個に減ったことを無力化と呼んでいいものか.とはいえ,紅茶がインフルエンザ予防に何らかの作用がありそうだということはわかりました.ウィルスのスパイクに付着するというメカニズムも合理的です.但し,下に小さく書かれているように「ヒトでの実験は実施していません」ということは知っておくべきです.
そこで,ヒトを対象にした研究を調べてみました.見つけたのが,岩田雅史他(1997), 感染症学雑誌 第71巻 第6号, 487-494, 紅茶エキスのうがいによるインフルエンザ予防効果です.この論文で示されているのは,in vitroだけでなく約300名を対象としたin vivoの実験を実施している本格的な研究です.材料,対象および方法のところで,うがいには,紅茶(日東セイロン紅茶)を50°Cで30分抽出して0.5w/v%無糖液を作成した,などと書かれているのがジワジワきます.この論文でペア血清というのは,同一人物から一定間隔で採取した二つの血清のことで,ウィルス血清抗体価は過去にそのウィルスに感染した履歴の影響を受けるので,感染前後での抗体価を比較する必要があるのです.ですから,感染の有無を判定するためのペアであって対応があるということではありませんので注意が必要です.実験結果はtable3にまとめられていますが,ペア血清が得られた制御群125名中感染者が61名,実験群134名中47名..ってインフルエンザにかかり過ぎのような気がしますが,カイ二乗検定の結果は有意水準5%で有意性ありと結論しています.JMPではこんなふうになります.
93_1.png
93_2.png
検定結果は5%有意ではあるけれども1%有意ではない程度のようです.臨床試験にはよく5%有意であることのみ示した研究が多いですが,できるだけp値も併記して頂きたいですね.実験データから何らかの判断を下すのはときには利害関係がある研究者だけではなく,一般人の立場から判断したいからです.もちろん,そのために最低限の統計リテラシーをみっている必要はあります.
この研究では制御群は何もしていないのですが,本来は水や塩水でうがいをしてもらうべきでもあったと考えます.紅茶うがいは液体でうがいをすることに主たるインフルエンザ防止の効果があったとも考えられるからです.
以上を踏まえると,少なくとも99.9%という数字には惑わされない方が良いように思います.紅茶の効用をアピールしたいのは理解できるのですが,ワクチン嫌いなお母さんがいて,うちの子には紅茶飲ませてるからワクチン接種しなくて大丈夫,などというケースが多くなればそれこそインフルエンザ流行に拍車をかけてしまうかもしれません.
しかしながら,個人で臨床試験をするのは無理です.せいぜい自らが実験動物になるくらいですが,人間の場合は認知バイアスという思い込みもあります.そこで日常的な統計リテラシーの練習としてできることとして,仮説をたててそれを検証することがあります.紅茶を世界で一番飲む国はご存知でしょうか?先のロシアでもイギリスでもなく,実はトルコなのです.
それならばトルコではインフルエンザは流行しないのではないか?という仮説を立ててそれを検証してみます.WHOの2018年1月の報告,Influenza Update number 307. 22 January 2018 がありました.トルコはどこかと探すと黒海と南のエーゲ海・地中海に面しているあたりです.微妙な黄土色なのでinfluenza pisitiveが21-30%です.イギリスも30%以上ですから,しっかりとインフルエンザが流行しています.他にもトルコ日本国大使館が在留邦人に出した,トルコ国内におけるインフルエンザの流行についてなどから判断するに,紅茶のインフルエンザ予防効果は期待しすぎない方が良いようです.
今日は冷えますので,皆様もお気をつけください.それではまた,
タグ:JMP
posted by Tad at 20:00| Comment(0) | TrackBack(0) | 統計リテラシー