UA-115498173-1

2018年04月21日

Feynman先生の教え(前編)


統計学を勉強する技術者に私が最初にアドバイスすることがあります.それは,勉強する過程で生じる様々な疑問に対する心構えについてです.疑問が生じるのは一般的には良いことと考えられていますが,その疑問が足枷になってしまうこともあるのです.この足枷を外すには,疑問には階層があるという認識が重要です.重要なことは,その人によってはそもそも理解することさえ許可されていない疑問もあるということです.その上で何が理解することが許されていて何が許されていないかを知る必要があるということを知ることが大切です.
こう書くと誤解を招くかもしれませんが,これは物理学者のRichard Phillips Feynmanの受け売りです.彼が二つの磁石の間に働く力について質問をうけたときの回答がYouTubeにあります,統計に限らず科学を勉強するものにとって重要なポイントをついていて,有名なのでご存知の方もいらっしゃるかもしれません.URLを貼ろうとも思いましたが,著作権が不明でしたので「Feynman, Magnets」というキーワードで検索してみてください.このビデオでは質問に答える側の立場から,非常に乱暴を承知でまとめると.質問者のレベルを知らなければ答えることは難しいと言っています.社会人の場合,基本は独学ですから質問をするものと受けるものは同じなので,私も(統計に限らず)勉強をしていて,ときどきこの教えを思い出す状況に遭遇します.Feynman先生の英語は比較的聞きやすいと思いますが,この記事を書くにあたってもう一度YouTubeで聞き直してみました.調べても和訳されている方が見つからなかったので,英語が苦手だという方のために以下に前半部分だけ意訳してみます.私の英語力では聞き取りにくい箇所もあったので,細かいところでは間違いあると思います.参考に留めてください.何かしら間違いあればご指摘いただけるとありがたいです.
状況はおそらく新聞か雑誌の取材かはわかりませんが,おそらくその類の記者から磁石が反発したり引き寄せ合ったりする現象について質問されるところから始まります.会話が交錯して聞き取りにくいですが,質問者をI,FeynmanをFとして冒頭のやり取りは以下のようです.
I「二つの磁石の間に感じるものは何なんです?」
F「それはどういう意味だね?」
I「そこに何かがあるんですよね?何かがそこにあるという感覚がありますよ.」
F「そりゃ何かを感じるだろうよ.それより僕の質問に答えてよ.何が知りたいんだい?」
I「この二つの金属の間に何が起こっているのかが知りたいんですけど.」
F「反発しあってるんだよ.」
I「それがどういう意味なのか,なぜそうなるのか?これってもっともな疑問だと思うんですけど.」
磁石の反発についてその現象を高名な物理学者であるFeynmanであればうまく説明してくれるだろうと期待した質問者でしたが,取り合ってくれないのでいささかムッとしたようです.「そんな愚問じゃないと思うんですけど」というところでしょうか.これに対して以下ミニーおばさんが病院にいるという例を示して Feynmanの長い説明が続きます.第一声は「もちろん,素晴らしい質問だよ.だけどね,なぜそれが起こったのかと聞くときは,いかにそれに答えるのかが問題なんだよ.」と言っています.どういうことなんでしょうか.以下は意訳しますが,重要なポイントは下手な訳ではニュアンスがつたわらないかもしれないので,英語を聞き取ったものも併記します.

例えば,ミニーおばさんが病院にいるって,なぜか?氷ですべって,お尻を打ったからさ.地球人ならこの説明で満足するけど,宇宙人ならお尻を打ったら病院にいくということは知らないよね.お尻の骨が折れてたときに,どうやって病院にいったんだろう?ミニーおばさんの旦那さんが病院に電話して人をよこしてもらったのさ.これですべて納得できるよな.このように,なぜかということを説明するとき,それが真実だと思う何らかの枠組みを前提としなければならないんだ.(When you explain a why, you have to be in some framework that you allow something to be true. )そうでないと,永遠に「なぜ」を問い続けなくちゃならなくなる.なぜ旦那さんは病院に電話したの?奥さんの幸せのためさ.いつもそうだというわけじゃないよ,酔っ払ってたり,喧嘩したりしてるときには.奥さんの幸せに無頓着な輩もいるからね.

そして,君は世界を理解するってこと,そしてそれが複雑なものだってことが面白く感じられるようになり出すんだ.もしも君が何かを追い続けようとすれば,どんどんと深みに嵌まっていくことになる.(If you try to follow anything up, you go deeper and deeper in various directions.) 例えば,もし君が「なぜミニーおばさんは氷の上で滑ったのか?」と問うたとしよう.そりゃ,氷が滑りやすかったからさ.誰だって知っている.このとき,君は「その答えで満足です.氷は滑りやすい,これで説明つきました.」と答えることもできるし「なぜ氷は滑りやすいのか?」と問い続けて深みに巻き込まれていくこともできるんだ.なぜなら,氷のように滑りやすいものって多くはないからね.濡れていたりぬるぬるしているの以外で滑りやすいものはなかなかないよ.固体は滑りやすいかといえば氷がそうなんだけど,氷の上に立つと圧力で氷が一瞬ほんの少しだけ溶けて瞬間的に水になって,その表面で滑り易くなる.なぜ氷の上で滑り易くなって他のものではそうならないかというと,水は凍ると膨張するからなんだ.圧力をかけるとこの膨張をもとに戻そうとして氷は溶けることになる.圧力で氷を溶かすことができるけれど,他の物体では凍るとヒビが入るから,圧力をかけても個体のままでいたいというわけさ.なぜ水は凍ると膨張して他の物体はそうならないのか?僕にはこの質問には答えられないけれど,それが如何に難しい質問かということは言えるね.君が理解することを許可されているものは何なのか,何が理解され知られることが許されていて,何が許されていないのかを君は知ってなければならないね.(You have to know what it is that you are permitted to understand and allowed to be understood and known, and what it is you are not.)

ブログに費やす時間は基本的に30分までと決めているので,最初に紹介したFeynman先生の言葉が出てきたところで,本日はここまでとし,続きは来週にさせてください.それではまた.
タグ:統計
【統計教育の最新記事】
posted by Tad at 19:00| Comment(0) | TrackBack(0) | 統計教育

2018年04月14日

Discovery Summit Japan 2018

2018年11月16日(金)に例年と同じグランド・ハイアット東京で,今年もDiscovery Summit Japan 2018が開催されます.去年のDiscovery Summit Japan(以下DSJ)は口頭発表に加えてポスターまでも欲張って妙に慌ただしかったせいか,私にはなにか最近の出来事のようにも思えます.それで,もうそんな時期かと軽く驚きましたけれど,発表の申し込みが開始されました.申し込みサイトはこちらです. 申し込み期限は2018年5月31日(木)17:00となっていますので,あと一月半ありますから,連休中に構想を練る時間もあります.特に産業分野からの申し込みをお待ちしています.
というのも,私は今年もコミッティのメンバーを拝命していて,私の昨年の発表の冒頭にお話ししましたように,DSJでも米国並みにもう少し産業分野をからの発表を多くしたいと画策しているからです.去年は特に顕著でしたが,例年DSJでは医薬分野からの発表が盛んで羨ましいかぎりです.医薬分野では,StatViewというMacで有名な統計ソフトがあったのですが(後にWindows版もできましたけど),このソフトは医薬・生物関係の分野で人気がありました.因みに,同じ頃SPSSは社会科学分野で主流だったように思います.そのStataViewはver.5を最後にSAS社に買収されてクローズした経緯があります.その際に多くの医薬分野のユーザーがJMPに鞍替えしたため,JMPにはそもそも医薬関係のユーザーが多いのではないかと推察しています.
そうはいっても,この事情は米国も同じなので,DSJでの発表件数の日米間の差は単に日本の産業分野に元気がないことの表れなのかもしれません.社外発表の敷居が高いという日本の産業分野の事情もあるでしょう.もちろん,社外発表についてはいろいろと決まりがあるのはどこも同じですが,いろいろな場で技術者の皆さんとお話しして思うのは,産業分野では会社側だけでなく発表者も社外発表のメリットを正当に評価できていないように思います.
メリットはいろいろあります.ここでそれを話すよりも体感したほうが早いです.端的にいうと,いつかやらなければならないと思っていたこと(やりたいと思っていたこと)が,確実に進みます.自分を追い込むこと以外にも,発表したいアイデアが確実に改良されます.アイデアがあれば,まずは申し込んでみてください.データそのものや事例の詳細は開示する必要ありません.むしろある程度一般化して話していただいた方がありがたいくらいです.応募に必要な情報は,発表タイトル(50文字以内)発表者プロフィール(250〜500文字)に加えて,発表概要を250〜500文字でお願いしています.内容は学会発表と違ってDSJはJMPユーザーの集いですから,論文の査読のようなことはしません.我々コミッティの役目はあくまでも内容をチェックして,偏りのないプログラムを構成することです.コミッティとしては,よほどのことがない限り発表の申し込みを採択はすれども棄却することはありません.但し,発表の枠はありますから定員はあります.それをオーバーした場合,ポスターに回っていただけるかをお願いすることはあるかもしれません.
申し込んでみたいという方がいらっしゃいましたら,「このような内容でも発表できるのか」とか「どこまで技術内容を伏せてもいいものか」等々,いつでも相談に乗りますのでご連絡いただければありがたいです.こんなことがやりたいというレベルでもかまいません.
本日は別のことを書く予定でしたが,急遽DSJ発表のお誘いに変更しました.それではまた.
タグ:JMP
posted by Tad at 13:01| Comment(0) | TrackBack(0) | JMP

2018年04月07日

システム最適化と中華料理

先週の記事で「P178のイラストのように同じシステムでも見方(角度)を変えれば,全く異なったシステムになります.同じ問題を共有している仲間だからこそ起きやすい間違いを避けるために,システム構造図を活用してください.」
と書きましたが,初心者のうちはなかなか難しいと思います.本日は私が心がけていることをお話ししたいのですが,まず最初に一つの漢詩を引用します.

題西林壁
看成嶺側成峰
遠近高低各不同
不識廬山真面目
只縁身在此山中

これは北宋代最高の詩人と言われる蘇軾(そしょく)(1037-1101)の詩です.春宵一刻値千金でご存知の方も多いでしょう.有名な詩で,あちこちに解説がありますので(例えばここ)ここで繰り返すことはしませんが,わたしなりに自由に意訳してみます.

西林寺の壁にこの詩を書くよ
廬山(ろざん)は横から見れば山々が連なる嶺に見えるけど,また別の方向から見れば独立峰に見える
見るところが遠かったり近かったり,高かったり低かったりすると,廬山はそれぞれ皆異なって見える(これが廬山の真の姿なんだ)
だけど,この廬山の真の姿を知ることはできない
それはなぜかと言えば私が廬山の山中にいるからなんだ

廬山は中国江西省にある古典にもよくでてくる名山で,171もの峰々が連なる複雑な地形から構成された広い領域を指し,廬山自然公園として世界遺産にも登録されました.ここに有名な東林寺やこの西林寺が点在しています.
もうおわかりのように,システムを廬山に例えれば,その真の姿はシステムの中にいては見えないのです.それではどうすればいいかというと,システムの峰や嶺といった詳細を知るために,異なった複数の視点から眺めることが必要になります.このためにはシステムに関わるすべてのステークホルダー(利害関係者)を洗い出し,それぞれの立場からシステム構造を記述してみてください.
技術者が製品というシステムを考察するときはどうしても製造者としての立場になってしまいますが,例えばユーザーの立場に立ってみると,紙ヘリコプターであれば,特性である滞空時間はユーザーの身長に大きな影響を受けることがわかるはずです.その紙ヘリコプターを製造する立場に立ってみれば,形状が複雑な設計はプロセスタイムが増大するだけでなく,工作精度にも悪影響があるということが見えてきます.
これらの複数の視点を踏まえた上で,鳥になった気持ちでシステムを俯瞰します.わたしがシステムを考察するときには毎回このことを心掛けています.例えば,おそらくノイズ因子が影響しないシステムは製造業では皆無と思います.ノイズ因子に気づいていて,それを固定することでシステムから排除するというのであればいいのですが,そもそもノイズ因子に気付いていない.こういうシステムの構造を見落とさないためのヒントとしてお話ししました.
因みに,蘇軾の経歴を知ればこの詩の背景には仏教の根本思想があることが推察できます.般若心経の有名な一節「色不異空 空不異色(万物の事象には実態などはなくて空なのだ)にも通じるものです.ですから,蘇軾はこの詩は本来は「廬山の真の姿などというものは無い」ということを言っているのです.システムというものは,ステークホルダーとしての視点や,観察者の知識,経験によって変わるものであり,真のシステムなど存在しないということです.即ち,私たちは常にシステムの写像と対峙しているという認識が必要である,と常々謙虚に思っています.
蘇軾といえば,号を東坡といったことから,彼の考案したトンポーロという豚肉の中華料理にもその名を残しています.今晩はトンポーロでも食べながら,今抱えている問題のシステム構造について考えてみてください.
それではまた.
タグ:問題解決
posted by Tad at 17:00| Comment(0) | TrackBack(0) | 統計的問題解決

2018年04月01日

MCDAアドインに関する補足・訂正について(4/2修正)

昨日の投稿で予告しましたように,以下について補足・訂正させていただきます.

1.P280の二つの設計画面に「重み」という「入力セル」がありますが,配布版のアドインにはありません.これは開発版のアドインにあった「予測変数」の優先順位を決めるパラメータで「満足度関数」の「重み」です.「重み」は配布版ではすべて100に固定されていますので,GUIからは隠してあります.多目的最適化では特性の優先順位を「重み」で変えるのは混乱のもとになるだけという判断によるものです.ですので,この図にある「重み」は無視して下さい.

2.P294のJMPくんの台詞で,「設定画面で「予測式Yu1」を「予測式」に,...」は「設定画面で「予測式Yu1」と「予測式Yu2」を「予測式」に,...」に訂正します.不親切ですいません..

3.P295の「包括システム」の設計で最適解は,配布版のアドインでは書籍と同じにならないことを確認しました.その他にも,第5講の例題では書籍の図と出力結果が異なる場合がありますことにご注意ください.書籍の出力結果は開発版のアドインで出力したものですが,配布版のアドインには最適化アルゴリズムに改良が加わったため,統計モデルと最適化設計の状況次第で異なった結果となる場合があります.開発版では「MCDAデモ事例.jmp」の最適化に私の環境で10分近い時間がかかっていましたが,配布版では遅いPCでも数分に短縮されたのはこの改良によるものです.P258の「この例題についての注意」に書きましたように,そもそもJMPによる最適化のしくみから,微妙な環境の違いによって必ずしも同じ結果が得られるとは限らないので,ここは最適解そのものよりも最適解を得る流れを追っていただければと思います.因みに,P295の「包括システム.jmp」の最適解はMac版のJMP Pro 14上で動作するMCDAアドインの最新版では次のようになっています.Mac OSは最新のHigh Sierraです.
mcda.jpg

ここ以外にP265の最適解でも異なる解が得られることを確認していますが,この二箇所以外では小数点以下の微小な違いにとどまっています.私の方で確認している限りでは,P253下,P254下,P261上,P264下,P280上,P280下,P288の7つの設計で微妙な違いなあります.Macは64bit環境ですから,32bit環境ではまた違った結果になるかもしれません.MCDAアドインを使った関係するすべての図版の修正版をこの場に掲載しようとも考えましたが,使用するOSの種類やJMPのバージョン全てを網羅することは困難なためそれは諦めました.何かご質問あれば個別にお問い合わせいただければその都度対応いたします.

このように最適解がいろいろと出てきてしまうことに不安を持たれるかたもいらっしゃるかもしれません.この状況はソフトのバグとういうわけではなく,どのような状態を最適とするかというプログラム上の定義(の違い)によるものです.書籍では「最適化はJMP(PC)がやるものではなく技術者自らがやるものだ」ということを認識していただきたいという思いがあり,このようなコンピュータ計算による最適化設計の実態を示すために,ノイズ因子が複数あるというあえて複雑な問題を事例にとりました.しかしながら,通常の比較的単純な問題ではこのような状況に陥ることは多くないので安心してください.ここのところについては来週(か再来週)もう少し説明を加えたいと思います.

上記についてご質問あればコメントをいただければと思います.どうぞよろしくお願いいたします.
posted by Tad at 15:00| Comment(0) | TrackBack(0) | お詫びと訂正

2018年03月31日

JMP14対応のMCDAアドインについて

先日まで検証していたのですが,本書の例題の範囲では少なくとも動作に問題はないようですので,JMP14に対応したMCDAアドインを一週間後の4月7日の受付分からリリースします.整理しておきますと,現時点でMCDAアドインには三つのバージョンがあります.書籍出版と同時にリリースした「MCDA20170821.jmpaddin」が最初です.その後に,私のSUMMITでの発表のために一部の処理を改良していただいた「MCDA20171101.jmpaddin」が続き,今回JMP14対応の「MCDA20180214.jmpaddin」となります.今後アドインのGUIの改良や新機能の追加なども考えてはいますが,この三つのバージョンの機能はほぼ同じですので,2017年のリリースのものを旧バージョン,今回リリースするものを新バージョンと以下で呼びます.
念のため補足しておきますと,使用しているJMPのバージョンによって以下のオプションがあります.
JMP12以前
MCDAアドインはサポートされていません.
JMP12
現在お持ちの旧バージョンのアドインをそのままお使い下さい.JMP14対応版は動作しません.JMP12に対するMCDAアドインの提供はこれで打ち切ります.
JMP13
新旧どちらのバージョンでもお使いいただけます.既にアドインをお持ちであれば,新バージョンにアップデートする必要はありません.
JMP14(トライアル版を含む)
JMP14では新バージョン「MCDA20180214.jmpaddin」にアップデートしていただく必要があります.MCDAアドインの申し込みページからフォームに入力して再度お申し込みください.(SAS社のサイトに飛びますのでご注意ください.)上述のように一週間後の4月7日の受付分から最新版の配布を開始します.アップデートはアドインをダブルクリックすれば上書きするかを聞いてくるので『OK』を押してください.
今回Mac版のJMP Pro 14.0.0で検証しましたので,WINDOWS環境やJMP Stdでの検証はできていません.継続してこれらの環境で検証をしていきますが,何かしら問題を見つけられたかたはご一報いただけると大変助かります.
今回の検証でいくつか本書の内容に修正すべきところが見つかりました.本書の図版や結果はMCDAアドインの開発版を使っているため,一部の結果が正式に配布したアドインによるものと異なっています.解の導出手順等には違いはありませんので,本文の数値は参考に留めていただければと思います.混乱を招いてしまい申し訳ございません.上記の詳細については,あらためて「お詫びと訂正」のカテゴリーに明日投稿します.
MCDAアドインは使いこなせれば非常に強力なツールなのですが,本書の説明はページ数の制約のため急ぎ足になっていますし,上記のような問題もあります.それを補足する意味でも,かねてから予告していますように「統計的問題解決セミナー」を開催しますのでしばしお待ちください.それではまた明日.
タグ:JMP