UA-115498173-1

2018年03月11日

アメリア・イアハート効果

昨日の続きです.パラメータ設計において「アメリア・イアハート効果」を関連付けるとすれば,多特性の最適解にはならなくても単特性の最適解にはなり得る解があって,それらの解にも価値があるということではないでしょうか.ちょっと事情があって英語環境からの説明になって申し訳ないのですが,このような解を求めるには,Profilerの赤三角から「Optimization and Desirability>Set Desirability」で「Response Goal」の設定ウィンドウを出して一番上のプルダウンから所望の特性以外のGoalを「None」にします.(すいません,日本語での表記はうろ覚えなので,英語のままにしています.)ここのインターフェイスが前からわかりにくいと思っているので少し説明します.
0311201801.png

この例でY1だけの最適化をしたい場合は残すとすると,『OK』でY1はスルーして→プルダウンからNoneを選択→『OK』→ プルダウンからNoneを選択→『OK』という手順となります.それから最適化を実行すればY1だけの最適解が得られることになります.
0311201802.png

多目的最適化でなければならないような事例であっても,それぞれの単特性の最適化を独立に実施してみてください.それは人と同じことをやらずに,狭くてもその世界での一番を見つけるようなものです.例えば,Y1単独の最適解の意味するところはY2,Y3の制約がなければそのシステムはY1に関する限りはそこまではいけるということです.そのシステムのY1についての可能性とも言えます.この情報を得た後に他の特性の制約を一つ一つ(すべての組み合わせで)解除していくことで,どの特性がY1の可能性を妨げているのかがわかります.いわゆるトレードオフの関係が把握しやすくなります.
とはいえ,それぞれの単特性の解は尖った解です.システムとして全体のバランスに欠けているのでそれらは安定した解ではなく,アインシュタインの言葉でいうところの幸せな解ではありません.幸せな解を見出すにはすべての特性を最適化に組み入れた多目的最適化によるべきであることは言うまでもありませんが,JMPのような計算機支援最適化ではこのとき注意があります.
それは品質工学でやるような二段階設計では真の最適解が得られない可能性があるということです.二段階設計とは具体的に言うと,Y1単独の最適解を踏まえて部分的に設計因子を固定し,その状態で別の特性の最適化を実施するという設計手法のことです.基本的にコンピュータによらず,SN比と感度という比較的単純な特性の最適化である品質工学においては,二段階設計は有効な手法なのかもしれませんが,私たちのようにもっと精度の高い(複雑な交互作用を扱う)統計モデルに基づく最適化では真の最適解にたどり着けないこともあり得ます.JMPによる多目的最適化では必ず,すべての設計因子をフリーにして同時に最適化するように心がけてください.
以上まとめますと,ステップ1として,多目的最適化では個々の特性を単独で最適化すること.優先順位の高い特性から始めると良いでしょう.その際,最大化したい特性であっても,最大化だけでなく最小化も実施します.ですから最適化という言葉は正確ではなくて,その特性に対するシステムの可能性を把握すると言ったほうが正確かもしれません.次のステップとして,優先順位に従って別の特性を最適化に加えていきます.優先順位が同位の特性がある場合は,すべての組み合わせで実施することが望ましいです.締めくくりのステップ3で,すべての特性を同時に最適化します. 
なぜ最初からステップ3を実施してはいけないかというと,JMPの満足度の最大化では,すべての応答空間を網羅して満足度を計算しているわけではないので,たまに局所最適解に陥ってしまう場合があり,そのような状況であることを見抜くためです.更には,最適解が見つからなかった場合,特に望目最適化であれば,目標値をほんの僅かずらすだけで準最適解とでも呼べるような解が見つかる可能性を探るためです.特にJMPの望目最適化はピンポイントでしか目標値が設定できないのでそのような状況になっている可能性は十分あります.
この状況では,本書にダウンロードバンドルしたMCDAアドインが大変有効です.JMP単独ではできない最適化ができるMCDAアドインについては本書では書ききれなかったのですが,文字だけでの説明では困難なので,SAS社のご厚意でゼミを開催する予定にしています.実施日等の詳細は未定ですが,MCDAアドインを使いこなしたいという方はぜひおいで下さい.
というわけで,JMPで最適化する際は,伝説の女性パイロットのエアハートのことを思い出してくださいね.
それでは,強引に落ちをつけたところでまた.

3/12追記
発音としてはエアハートだとしても日本語の用語としては「アメリア・イアハート効果」が正しいので本文を修正しました.
タグ:問題解決 JMP
posted by Tad at 19:41| Comment(0) | TrackBack(0) | 雑記

2018年03月10日

女性パイロットとパラメータ設計

以前からブログに書こうと思っていたことがあるのですが,いざ書き始めるといろいろと深く考え込んでしまうこと多々あるので,本日は全くの雑談に変更しました.といっても,何を書くかは決まっているわけではないので,昨日のニュースに目を通しながら思案を巡らせています.このブログは自分へのチャレンジとして続けていると言う側面もあるので,何か題材を探す必要があります.目に止まったのが次の記事です.
島で発見の人骨、女性飛行士イアハートの可能性高い 研究成果
太平洋離島で発見の人骨、A・イアハートのものか 米研究
なぜか日本ではイアハートと呼ばれるエアハートという有名なパイロットの失踪の謎が判明しそうだとのことです.パイロットといってもリンドバーグの時代の人で1928年に大西洋横断無着陸飛行に成功しました.日本での知名度はリンドバーグほどは高くないと思いますが,米国では誰もが知っている「あの伝説の」と冠がつくほどに人気が高い有名人物でした.
いまウィキペディアをみたところでは,やはり「エアハート」が言語の表記に近いとあります.日本語のカタカナを英語風に発音しても全く通じないと言う経験を何度もしている私ですが,余計なお世話といわれようと少なくとも人名と地名だけは原語の発音を真似した方が無難です.エアハートという文字であれば見ればわかりますけれど,イントネーションも重要です.2015年のSUMMITで来日されたWilliams CollegeのRichard D. De Veaux(デ・ヴォー)先生とお話しした際.大学がマサチューセッツ州にあるので,彼の地での実験的営みの日々の回想録として有名な『森の生活』 のことを話題にしようとしました.当時は原題を知らなかったので(今調べたら単純に”LIFE IN THE WOODS”でした.),「ソローが書いた本」と言ってもこれが伝わらないのです.本の内容を話し出すと,「あ,ソローね.」とようやくわかって頂けたのでした.このように書いてもよくわかりませんが,原語ではソローのローがあがるイントネーションで発音するということがポイントです.あまりにも日本語化してしまっているものは仕方ないですけれど,知っているならば日本でも嫌味にならない程度に(これが重要),原語発音に近い表記を心がけるべきと考えています.
とはいえ,英語化してしまった変な発音もあるので注意が必要です.例えば,J.S.BachのCDを買いにいって全く通じなかったことがあります.自分で見つけて店員に見せたら「ああ,バックのことね.」とか.ウルトラマンはアルトラマンだったり,ワコムのタブレットが通じなくて,それはワイコムと読むんだよと教えてもらったり?
話が逸れました.エアハートですが,日本の捕虜になって亡くなったという説があります.興味がある方は,例えば,こちらとかこちらをご覧ください.旧日本軍がアメリカの英雄しかも女性を捕虜にして殺したとかの説は彼女の人気にあやかろうとした志の低いメディアのなせるものとはいえ,証拠がないのでいつまでも亡霊のように付き纏ってくるのです.イエスの墓は青森県にあるとか,源義経がモンゴルに渡ってチンギス・ハーンになったとかの類と一緒です.
あまり知られていないと思いますが,マーケティングでは「アメリア・イアハート効果」と言われている言葉があります.その分野で一番になれなくても,見方をかえれば一番なので,それをマーケティングに使うということです.楽天などでも,とても細かいカテゴリー内でランキング1位とうたっていて何か意味があるのかと思っていましたが,あれが「アメリア・イアハート効果」を使った手法なのですしょうか.
確かにエアハートはリンドバーグに最初の大西洋横断で先を越されたとはいえ,女性としては世界初であったために今の世に名を残しているともいえます.一番になるには層別化を進めていけばよいということですが,果たしてそうなのでしょうか.エアハートは,”Never do things others can do and will do if there are things others cannot do or will not do.”と言う言葉も残しています.最初から一番になることを目指していたのではなく,誰もできないこと,やらないことをやっていたら一番になっていた,ということなのです.ですから,「アメリア・イアハート効果」のマーケティング分野での使われ方は,彼女に対する誤解を招くもののように感じます.彼女の人生においては一番になることが目的だったのではなくて,単なる結果に過ぎなかったのでしょう.エアハートが今の世に名を残しているのは,39歳の若さでそれこそ大空に散った伝説のヒロインということに加え,女性の地位向上に尽くした貢献によるところが大きいのです.
日常的に万年筆を使っているものとして,常々万年筆にも興味を持っているのですが,限定品の高級万年筆を専業とすることで有名なKrone(クローネ)にもエアハートの名を冠した美しい万年筆があります.クローネの万年筆はとにかく高価で,例えばアルベルト・アインシュタイン万年筆などは,アインシュタイン直筆の原稿を裁断した紙片が埋め込まれているとかで値段は,ebayで今みたら$7425もしています.
アインシュタインといえば,去年日本滞在中のメモがオークションで1億円を超える価格で落札されたというニュースがありました.
直筆メモは2枚あって,そのうちの一枚には英語に訳すと“a quiet and modest life brings more joy than a pursuit of success bound with constant unrest.”と書かれています.日本語では「静かで謙虚な人生は成功を追い求めて常に不安に脅かされるよりも幸せである.」というような意味でしょうか.この格言がアインシュタインのオリジナルであるか否かは不明ですが,一番を目指すことは必ずしも幸福には繋がらないということを教えてくれています.
エアハートとアインシュタインの言葉を(無理やり)統合すると,人がやらない(やれない,やりたがらない)ことをやれば,その結果一番になれるかもしれないし,一番になれなくてもそれもまた幸福なものだ.というようなことでしょうか.
さて,ここで落ちをつけなければなりません.エアハート,アインシュタインときて,以下でそれらを強引にタイトルにあるパラメータ設計に結びつけようと思いますが,本日はこれから外出しなければならないので,続きはまた明日とさせてください.
それではまた明日.
タグ:問題解決
posted by Tad at 13:14| Comment(0) | TrackBack(0) | 雑記

2018年03月03日

p82の列の寄与について

p82に示した,エクセルでやるようなクロス集計法との比較はオフトピックで,原稿段階でもこの部分は削除対象だったということもあってこの部分の手順説明は省略しています.p82一番上のグラフの描き方については少し前にお話していますが,今度はその下にある「列の寄与」のグラフが描けないとの質問をいただきました.統子ちゃんのセリフ「この結果を「パーティション」による「赤三角>列の寄与」と比較すればいいのね.」,その次のJMPくんのセリフ「これは装置#を除外してk分割交差検証によって自動分割した結果だよ.」をそのまま実行してもp82のグラフは得られません.ヒントは除外されている行の扱いです.以下に書くことはJMP経験者であればご存知だと思うのですが,本書をもとに新たにJMPを勉強してくださっている方もいるようなのでこの場でもう少し丁寧に説明します.詳細なJMPの操作を示すことまでは本書の守備範囲と考えていませんが,このブログでは可能な限りJMP操作もサポートしていこうと思っています.
さて,以下に手順を示します.まず,データは同じ「5_概観結果.jmp」を用意してください.ファイルを開いたら,すべての非表示かつ除外になっている行が選択されていることを確認して,もしも選択が解除されているならば,「装置No.」列と1行目を選択してから,右クリックで「一致するセルを選択」を実行します.これですべての非表示かつ除外になっている行(装置No.が#4)が選択されるので,この状態で「行>行の削除」です.(ここがポイント)
ここで「パーティション」を実行するわけですが,このとき装置#を「X」に入れないでください.パーティション プラットフォームが出てきたら,赤三角から「k分割交差検証」を実行するとkの値を入力するように聞いてきますので,デフォルトの5のままにして『OK』です.この操作で『分岐』『剪定』の隣に『実行』ボタンが出てきますので,それを押せばp82のグラフが描けます.
因みに,このデータでは「k分割交差検証」を実行しなくても最初から『実行』ボタンが出ています.それはなぜかという理由は,なぜ非表示かつ除外のままではいけないかという理由と同じなのです.JMPではモデリングの際のオーバーフィッティング対策として検証という機能が実装されています.データを学習セットと検証セットとに分けて,前者でモデルを作成し,後者でそのモデルを評価します.検証セットの指定方法にはいくつかあって,JMP Proでは検証列を指定することも可能ですが,JMP Stdで最も簡単なのが「k分割交差検証」を使うことです.デフォルトのk=5であれば,データを5分割してそのうちの一つが検証セットに割り当てられます.(kの選び方は観測データの性質によって選ばれるべきですが,今のデータサイズであればデフォルトのままでよいでしょう.)k個のデータセットそれぞれを検証セットとしたすべての結果が比較され,最終的にこれらの中で最もR二乗の大きいモデルが採用されます.ここで問題となるのは,「除外」された行があるとこれらが(頼みもしないのに)検証セットとして扱われてしまうという仕様があるのです.このためデータに除外された行があると本それは異常値としてモデル作成には使いたくないデータですから,「k分割交差検証」を実施してもおかしな結果になってしまうのです.このため,実質的に「k分割交差検証」をかけるデータでは一部を除外するという機能が使えないのでとても不便です.
厳密には装置#4以外にも除外されているデータが二つあるわけですが,この二つは削除しなくても「k分割交差検証」の結果には大きな違いはありません.すべての除外された行を削除して「k分割交差検証」を実施した結果を示しておきます.(p82の結果とは微妙に違います.)
列の寄与.png

今週は別のお話をしようと思っていたのですが,それはまた来週ということで.それではまた.
タグ:Q&A JMP
posted by Tad at 13:53| Comment(0) | TrackBack(0) | Q&A

2018年02月24日

「お国柄」をコントロールする

先週の続きをもう少し.『原因と結果の経済学』では回帰分析は「ありもののデータ」を分析するための手法として紹介されています.その上で「回帰分析」では因果関係を明らかにすることが困難であり,そのためにはRCT(あるいは擬似実験)によらなけらばならないという説明に違和感があると書きました.
「ホルモン補充療法の罠」と題したコラムにも,女性ホルモンが動脈硬化を起こしにくくしているという仮説に対して,観察データを用いた(回帰分析による)研究ではこの仮説が肯定されたものの,この効果を確認するために実施されたRCTではこの仮説は否定されたというよく知られている話が紹介されています.Women’s Health Initiative(WHI) の中間報告でホルモン補充療法(HRT)を受けるとむしろ心筋梗塞のリスクが高くなることが示された経緯は堂地先生の日本産科婦人科学会雑誌の解説(日産婦誌58巻9号)に詳しく書かれています.わたしも当時のメディアでセンセーショナルに報道されたことを覚えています.上記の日産婦誌のを読むとその後の研究でWHIの報告にもいくつかの疑問があって,未だHRTのリスクとQOLとの間の線引きはグレーのようです.RCTといえども完璧ではないことの良い例ですね.
いずれにせよ,観察データの分析ではHRTのリスクが見逃されたのは事実です.RCTと逆の結果となったことのカラクリはHRTを受けるような女性は,所得が高く健康への関心も強い,したがって生活習慣も動脈硬化を起こしにくい人々であったからとコラムでは説明されています.その一節を引用すると
「健康への関心」といった交絡因子の存在を検討せず,見せかけの相関に過ぎないものをあやまって因果関係と解釈していたのではないか.」(引用ここまで)
おそらく,このとおりなのだと思いますが,とはいえ,このミスは回帰分析という手法のせいではありません.
わたしは一度に並行して何冊もの本を読む癖があるのですが,ちょうど同じ時期に読んだ,畑農・水落(2017),『データ分析をマスターする12のレッスン』,有斐閣,に面白い例があったのでそれをここで紹介します.因みに,こちらの本は社会科学分野を対象としています.特に後半では個票データの回帰分析を扱っているので,技術者向けのデータ分析とは少々毛色が異なるのですが,二つの標本分散についてきちんと説明していたり,ダミー変数を導入した質的変数の扱いについての説明は優れていますし,何よりも著者自らがデータに向き合っていることがわかるよい本です.
ここの計算は統計ソフトを使えば簡単にできます,とあっさり流している箇所が度々でてきますが,統計ソフトのありがたさが実感できます.データの性質から質的データの分析が多く紹介されていて,JMPで名義尺度の「モデルのあてはめ」を実行すると,その背後でどのような処理が走っているのかを知ることで,データ分析の理解は一層深まります.
さて,『12のレッスン』にある女性労働力率と合計特殊出生率との関係をJMPで3分間分析してみました.このデータ分析の背景は女性が働くようになると少子化が進むという仮説に対する検証です.この段階で(この本では明示的には触れてはいませんが),交絡因子として「経済の低迷といった社会背景」が考えられます.この状況で社会実験を実施しなければ因果関係はわからないと評論するのは簡単ですが,まずはデータに向きあうことが重要です.このデータでは1980年と2000年のそれぞれで都道府県ごとの上述した二つの変数が記載されています.相関をみるだけならJMPのグラフビルダーを使えば簡単です.『12のレッスン』にあるデータ全体の相関係数と年を層別にした場合の相関係数は正負が逆になるという「シンプソンのパラドックス」もこのようになります.本日は時間がなくPDFでアップしますのでサムネイルはありません.
PastedGraphic-1.pdf
PastedGraphic-2.pdf
ここで経験ある分析者であれば警戒のアラームが鳴るはずです.『12のレッスン』ではこのパラドックスの背景には「都道府県における地域背景」が関与しているのではないかとの仮定のもとに次の分析にすすみます.ここで問題となるのはこの地域ごとの社会経済環境という「お国柄」はデータには直接現れていないこと,そもそもデータとして観察することすら困難であるということです.このようなサンプルの固有の特徴を個体効果と呼ぶわけですが,これは上述したHRTのリスク調査における被験者の収入や教育レベルあるいはその総合指標としての生活習慣に相当するものでしょう.
この個体効果を如何にしてコントロールするかということが重要になってくるわけですが,都道府県を名義尺度にしてモデルをたてると,ダミー変数を46個導入することになってしまい,このような説明変数が多いモデルはオーバーフィッティングのリスクが大きく,できるだけ避けたいところです.実際にやってみると寄与率はかなり高くなりますが,そのモデルの価値はどれだけのものなのか再現実験なしにはなにもわかりません.この場合,再現実験を実施することは不可能です.産業分野の技術者はなんと恵まれていることか.
本文にも言及されていますが,関東,京阪とか中部,北陸といった地域ごとにまとめるのも一つの手ではありますが,県境が地域特性の境になっているわけではないという日本の特殊事情がどのような影響をもたらすか.出張で天浜線(天龍浜名湖鉄道)や遠鉄(遠州鉄道)に何回か乗ったことがありますが,静岡県でも静岡市と浜松市とでは全く異文化の感があります.静岡市でも旧清水市とはまた違ったお国柄のような気もします.
個体効果をコントロールするための手法として,年の差分データで回帰分析するという方法が『12のレッスン』でも紹介されています.差分データの回帰モデルの定数項をトレンド項ということを知れば,この手法で何をしているのかが理解できることと思います.少しだけしくみをお話ししておくと,都道府県ごとの回帰モデルの切片が個体効果をあらわしているとして,それは経年変化はしないだろう(少なくとも数十年のタイムスパンでは)と仮定すると,これが1980年と2000年との差分データで消えてしまうことがポイントです.JMPでの結果を示しておきます.
PastedGraphic-3.pdf
相関は弱いとはいえ負の相関が示され,女性が働きに出ると出生率が低下する傾向が示唆されています.もちろん,他の年度のデータだけでなく各種経済指標などをデータに取り込むなどで回帰分析による結果の信頼性は高まっていき,因果関係に近づくことになることが理解できます.WHIのデータが入手できればこの手法を適用してみたいところです.
というわけで,因果関係の探求には回帰分析という手法そのものではなく,データの質が問題なのであって,直ちに着手できる回帰分析をとおして考察を深めていくことの価値は過小評価すべきではないと考えます.
もちろん,実験計画が大事であるという『統計的問題解決』の趣旨と回帰分析よりもRCTのほうがエビデンスレベルは上とする主張は矛盾はしません.とはいえ,穿った見方をすれば,RCT第一義を主張する背景には別の理由もあるのではないでしょうか.大掛かりな実験を実施できれば,自らの研究を社会的に認知してもらうのには大いに効果があることでしょう.特に,経済学の分野では実験といっても多くの人や政府を巻き込んだ大掛かりなものになるので,それなりの額の研究費も得られます.
一般人にRCTの威力と効果を知ってもらいたいというのはよくわかります.そのうえでRCTが直ちに実施できないような場合に,様々な手法でデータ分析を試みることの重要性も併記すべきと思うのです.
今週も書きなぐりですいません.それではまた.

補足
少し紛らわしい部分があったので補足します.『原因と結果の経済学』では差分データで分析する手法が「差の差分析」という擬似実験の一つとして紹介されています.差の差分析は英語ではDifference in Differencesあるいは略してDIDなどとも呼びます.一方,『12のレッスン』でやっている差分データの回帰分析はDID分析ではありません.因果関係を究明するためには措置群と対照群とを明確に示せなければなりませんし,そもそもDID分析に必要な三つの仮定が成立していないからです.
とはいえ,データの差分を取ることのエッセンスは同じです.名称は異なっていても回帰分析という手法における一つのテクニックに過ぎません.私が回帰分析と考えているもの(それはごく普通に統計学の教科書に書いてあるものですが)とこの本で回帰分析と定義しているものは異なるので注意が必要ですね.もちろん,措置群と対照群とを明確に意識してとったデータであるか否かということが(因果関係の)エビデンスレベルには重要ということは全くその通りです.
タグ:統計学 books JMP
posted by Tad at 13:15| Comment(0) | TrackBack(0) | Stat Spotting

2018年02月17日

回帰分析のエビデンスレベル

最近とあるニュースが話題になりました.「博士採用増で生産性低下」という日本経済新聞の日本経済研究センターの報告を基にした記事です.オリジナルの報告に輪をかけて日経がおかしな解釈をしたことで,twitterでも(案の定)炎上していました.詳細はこのtogetterを読んでいただくとして,この記事についてここで論評するのは避けます.少なくともオリジナルの文献のグラフを見る限りでは博士採用と生産性には正の相関があるように見えますが,どうみれば負の相関があると言えるのでしょうか?
この記事のタイトルにしか目を通さない日経読者も大勢いるであろうことを考慮すると,少なくともメディアが記事のタイトルをコロコロと変え続けたのは問題ありとは思います.タイトルの変遷をみるに表現の違いだけでいろいろなニュアンスが出てくるのがわかります.このニュアンスの違いをうまく使い分けて読者を惹きつけるのがメディアの技量です.メデイアもやはり商売ですから,ある程度は情報を都合よく解釈することも売れる情報を発信するためには必要なのかもしれません.このような事情もあって,Stat Spottingを趣味とするものにとっては,メディアは良い対象なのです.とはいえ,週刊誌ならともかく,やはり新聞には信頼できる情報源としての品位を保ってもらいたいと個人的には願っています.
メディアに都合よく操られまいという意識が高まっている昨今ですから,読者も勉強しています.何かしらの報道があると,それは単なる疑似相関にすぎないというのがよくある批判の一つです.ビッグデータの流行に伴って様々な啓蒙書が出版されいます.例えば,以前紹介した伊藤公一郎(2017),『データ分析の力 因果関係に迫る思考法』,光文社新書などは産業分野以外における実験の工夫と苦労がわかる良書でした.この本に先駆けて中室牧子,津川友介(2017),『原因と結果の経済学』,ダイヤモンド社というかなり内容が重なっている本も出版されています.中室さんの『学力の経済学』に比べるとあっさりしすぎていてわたしには今ひとつでしたが,それでもよく売れているそうです.一般人に対する統計リテラシーレベルの底上げにこれらの書籍の貢献は大きいでしょう.
とはいえ,昨今の「因果関係を絶対視して相関関係を軽視する」風潮には少し疑問を持っています.
『原因と結果の経済学』ではエビデンスを因果関係を示唆する根拠と定義しています.経済学ではそのような考えがあるのかもしれませんが,私は因果関係があろうとなかろうとに関わらず,エビデンスとはpeer reviewを経た(科学的)知見のことと考えています.
もともとエビデンスという考え方は医療分野のEBM(Evidence Based Medicine)からきたもので,『原因と結果の経済学』にも有名なエビデンスのピラミッドが改変されて掲載されています.それによれば,エビデンスレベル(結果の信頼性)が高い方から低い方に,一番上にメタアナリシス,次にランダム化比較試験(RCT),擬似実験と続いて一番下に回帰分析があります.この改変されたピラミッドは間違いとまでは言えませんが,ミスリーディングを誘うと思います.
一つにはエビデンスの強さはデータの性質によるものであって,データ分析の手法には良いも悪いもないということが見落とされています.回帰分析くらいしか適用できないデータであるからこそエビデンスレベルが低いということなのです.回帰分析の結果であっても,ここから因果関係の仮説をたてて再現性の検証を実施したものであれば,信頼性はあるといえます.統計的問題解決で中心となる統計手法(統計モデリング)は重回帰です.
二つ目として,特定の研究手法を採用するだけで,その結果のエビデンスが強くなるとは限りません.EBMにおけるピラミッドではRCTがエビデンスレベルが高い(文献によっては,最高位にメタアナリシス代表されるSystematic Reviewという二次情報が置かれていて,その次のレベルをRCTとしているものもあります)のは当然としても,このRCTでは二重盲検などの処置が施された介入試験でなければなりません.RCTであればそれだけでエビデンス足り得ないことは明らかです.二重盲検の適用については適用実験ごとに議論が必要ですが,例えば,特定の学習手法が子供の能力向上に与える影響を調査するような場合は,やはり臨床試験におけるプラセボ効果の排除が必要になるでしょう.
三番目にEBMのピラミッドにはRCTの下の階層に非ランダム化比較試験とでもいうCohort Study(コホート研究)があり,更にその下のレベルにCase Control Study(症例対象研究)とアンケート調査のようなCase Series(横断研究)がそれぞれ位置します.これら三つの研究手法をまとめて疫学調査あるいは観察研究という場合があります.『原因と結果の経済学』で回帰分析と称している階層はおそらくこれらに対応させたものと考えられますが,EBMでは最下層にはCase Reports(症例報告)があって,これは記述研究と呼ばれています.更にその下にはEditorialという研究者の意見や考えというエビデンスとなり得ない階層もあるのです.このように,本来ならば回帰分析の下にもエビデンスレベルが低い手法があるのにそこを示さないのはやはり(著者の主張に)誘導的であると言わざるを得ません.いずれにせよ,オリジナルのEBMのエビデンスレベルのピラミッドでは回帰分析について言及されているわけではありません.
もう一つ言いたいことがあって,疫学調査では回帰分析を使うことが多いのは事実とはいえ,疫学調査の結果のエビデンスレベルが低いから研究の価値が低いというわけではないということです.疫学研究はその性質から結果のエビデンスレベルが低くなってしまうのは宿命のようなものです.かといって疫学研究の価値が低いわけでは全くありません.反対にRCTであっても特定の企業がスポンサーについたような研究では報告バイアスが生じる可能性がありますし,peer reviewされた研究であっても,そこにもやはり出版バイアスがあったかもしれないことを忘れてはなりません.要するにRCTで回避できるのはいわゆる交絡バイアスや選択バイアスだけなのです.
このような理由で産業分野の私にとっては『原因と結果の経済学』で回帰分析が不当に低く扱われているのに違和感を覚えました.そもそも因果関係を追求するのは学者の仕事であって,私たちには因果関係を追求するよりも重要な仕事があります.誤解されることを恐れずに言ってしまうと,それは利益を追求することです.装置に異常が起こって歩留まりを落としていることが判明したならば,直ちに対策を講じなければなりません.おそらくDOEを実施して因果関係を把握するよりも先に,手元にあるデータで回帰分析でも何でも実施して何らかの策を講ずるべきです.もちろん,因果関係は不明ですから,分析結果が再現する保証はありませんが,対策に固有技術の知見が裏打ちされているならばエビデンスレベルが低いからと言って躊躇すべきではないと考えます.
メタボ健診や子供の学力向上では経済学見地?からエビデンスを考慮することの必要性は理解できますが,それと量産ラインで今起こっている問題解決とは別のストーリーがあり得ると考えます.メタボ健診の場合であっても,エビデンスを求めるあまり,対策に時間がかかり過ぎてしまうと経済的損失が発生します.このことを見失っていないでしょうか.もちろん,エビデンスを軽視しているわけではありません.ただ,何らかの結果がpeer reviewを経て科学的知見に昇華するには一般的には長い時間がかかるということです.

ここまで一気に書いて読み返すと,いろいろ論理の粗や言いたりないことが目に入りますが,ブログなのでご容赦ください.因果関係についてはもっと書きたいこともあるのですが,論点もずれてきましたので続きはまた今度にします.それでは.
タグ:統計学 books
posted by Tad at 14:01| Comment(0) | TrackBack(0) | 雑記