UA-115498173-1

2018年11月24日

統計とチンパンジー

今年のDiscovery Summitでは産業分野からの発表が増えました.産業分野からのコミッティ委員メンバーとして,ありがたいことです.企業に所属している技術者が社外発表するのは,会社によってはハードルが高くてなかなか困難なご時世ですが,それを乗り越えてでも価値があると考えています.

これはわたし自身の体験ですが,発表を意識することで考察のレベルがぐっと高まります.発表前になって粗を見つけてしまい大慌てで対策を考えたり,あるいは発表のストーリーを軌道修正したりということは度々あります.そこに価値があります.技術者としてもそのことには気づいているので,発表はしたいんだけど,という方がたくさんいらっしゃいます.Summitでもある企業の術者の方とお話ししたのですが,発表を検討していたんだけれど上司に「まだそのフェーズでない」と言われたとか.t分布の発見で有名なゴセットが,所属していたギネスビール社に隠れてStudentというペンネームで論文を発表したことはよく知られています.当時も「まだそのフェーズでない」と言われて彼が引き下がっていたら,確実に統計学の進歩は遅れていたことでしょう.とはいっても,Summitは学会ではないのでデータは作っても構わない(その旨は明示すべきですが)と考えていますし,技術背景も代替モチーフで説明しても何ら問題ありません.わたしが一昨年の発表で使ったメッキの事例は「ある半導体プロセス」の代替モチーフです.

Summitの場合,もう人つ発表者に恩恵があります.発表者には参加費無料(ポスターは半額割り引き)の特典があるのはご存知だと思いますが,実は前夜にプレナイト・ディナーが開催され,そこにも招待されるのはご存知でしたか.その場には米国からSAS社の幹部も参加していますので,いろいろとJMPについてに深い話も聞けます.わたしも今回,あるスクリプトの一般公開の可否についてスクリプトを書いた本人(テクニカルセッションに登壇したBrady Bradyさん)に直接尋ねることができました.因みに,現時点では公開されていないが,公開する方向で検討するというお答えでした.

プレナイト・ディナーにはコミッティメンバー全員に簡単なスピーチをせよとの依頼を頂いたので,以下のようなお話をしました.日本人が多数の場であり,米国SAS社の幹部には通訳がついているので,日本語でお話しすることも考えましたが,韓国からの参加者が3名ほどいらっしゃるので,英語でやってみました.久しぶりに英語を話すので,皆様に通じるかが不安でしたが,後で韓国からの参加者にお世辞でしょうが「Good presentation」と言っていただけたので言いたいことは理解していただけたようです.以下は覚えている限りの要旨を補足,修正しています.

スピーチここから
昨年,幸運にもJMP14についての early adopter version を試す機会に恵まれましたことに感謝しています.小さなバグを見つけたのでそれを報告し,製品版で修正されました.JMPのMac版に貢献できて幸せです.そのとき,JMP wish listにささやかな要望も投稿しました.未だに誰からも反応ありませんが,今でもMacbookのTouch Bar にtool メニューが欲しいと思っています.
これはJMPユーザーとしての要望ですけれども,現在は単なるユーザーとしてよりも,JMPのadvocatorあるいはエバンジェリストのような役目で立ち回る機会が多くなってきました.ことあるごとに,周囲にJMPを使ったDOEや統計分析の重要性を訴えていますが,多くの人からの反応はまだ薄いのが現状です.なぜあの人たちには,世の中の常識が理解できないのかについていろいろと考えるに,思い当たることがありました.
道具を使うチンパンジーのことをご存知かもしれません.いくつかのチンパンジーのグループは平たい石の上に種を載せ,ハンマーのような別の石でそれ潰して中身を食べます.野外観察によると,婚姻のため道具を使わないグループから道具を使うグループへ移動したメスのチンパンジーは生涯にわたって道具を使うことを覚えられないそうです.彼女の子供は道具を使うことを覚えるので,遺伝ではありません.京都大学の研究者によれば,チンパンジーは幼少期のある一定の時期に道具を使うことを学習しないと一生道具を使えないのだそうです.
この話を思い出して腑に落ちました.世の中の常識が理解できない人々は新人のときに統計ツールを使う機会がなかったので,もはや統計あるいはJMPを使うことができないのです.そこで私は戦略を変えました.理解できない人々を説得して時間を無駄にするよりも若い技術者を指導していくことが肝要です.明日のジャパンセミコンダクターの坂本さんの発表はその成果の1つです.皆様が明日の彼の発表にきてくださることを望んでいます.
スピーチここまで

因みにDOEの重要性や統計ツールの有効性が理解できない人々をチンパンジーと言っているわけではないですよ.この意味ではわたしたちも同じチンパンジーには違いなく,ただわたしたちのグループは道具を使うことができるというだけの違いです.現時点では道具を使うグループも使えないグループも共存しているわけですが,今後の環境の変化などで生き残っていくのは道具を使うグループであることは間違いなく,これはチンパンジーに限ったことではありません.
それではまた.
posted by Tad at 19:00| Comment(0) | TrackBack(0) | JMP

2018年11月17日

事例検討会のご案内とMac版の最新情報など

Discovery Summit Japan 2118に参加された皆様,お疲れ様でした.わたしも前日の朝から高橋先生による「紙ヘリコプターを用いた実践型計画法入門」のお手伝いをしたりして,何かと動き回っていたので今になってどっと疲れが出ております.というわけで本日は短めに.
上述の高橋先生のセミナーは丸1日のセミナーなので,遠方からSummitに参加するために前泊される方も多いとのことで,Summitの前日に開催するという企画で昨年から始まりました.来年も開催すると思いますので,「実験計画って何の役に立つの?」と疑問に思われる方は是非受講してみてください.32,400円(税込)の有償セミナーでしたが,Summitの参加者には特別価格21,600円(税込)が適用されましたので,おそらく次回も同様な割引があると思います.講師の高橋武則先生(現在は慶應義塾大学)は今年もパワー全開のご発表をしていただきました.まだ今年のご発表については資料がアップされていませんが,昨年のご発表の資料がこちらにあります.このセミナーではブログでも度々言及しているHOPEアドインを使いますので,実験計画だけでなくHOPEアドインの基本的な使い方も学ぶことができます.受講後半年間という有効期限付きではありますが,個人で使うことができるHOPEアドインが入手できます.
セミナーの場で,HOPEアドインを継続して使いたいというご質問をいただくのですが,最も簡単なのは,隔月開催(今年は偶数月)のHOPE事例検討会という実験計画をもとにした事例相談会に参加していただくことです.参加費は無料ですが,自らの事例を持ち込みことが参加条件になっています.企業の技術者にとってはデータの社外開示はハードルが高いかもしれませんが,変数名や水準,更にはデータそのものを変えてしまっても全く問題ありません.必要最低限の技術背景の説明はしていただいた方がより適切な助言はできると思いますが,それさえも差し支えあれば伏せるか別のモチーフに変えるなどの工夫をしていただければ,ハードルを下げることができるはずです.上述のセミナーを受講しなくとも,検討会に参加することは可能です.わたしも検討会のオブザーバーとして出席していますので,ご興味あれば実施予定日等の検討会についての詳細をブログのコメントでお問い合わせください.
本日はここまでと思いましたが,短すぎるのでSummitで入手したMac版についての最新情報を一つ.わたしは以前よりJMPがMacBook ProのTouch Barに対応していれば便利だと考えています.ご存じない方のために補足しますと,Touch BarはMacBook Proの一部のモデルに搭載されているファンクションキーに代わる60×2170という細長い形状のディスプレイです.面積としては小さいですが,高精細なRetinaなので写真も表示できソフトによっては非常に有効です.個人的にはここにJMPのツールメニューがあれば便利だなと思っているのです.とはいえ,このTouch BarはMac本体とは別のOS(Apple WatchのOSのようです)で動作するので,ソフトメーカー側で作りこまなければなりません.Summitには毎回JMPのセールスとマーケティングのボスのJon Weiszさんが来ていて,彼はMacユーザーでもありますからこの機会に直訴してみました.そうしたら「私も欲しい」とのこと,プロダクトマネージャーのDaniel Valenteさんもその場にいたのですが,彼もまたMacユーザーで同意見でした.(今回の二人の掛け合いの講演は面白かったですね.)聞くところによると御大John Sallさんも最近Touch Bar付きのMacBookを買ったということで,おそらく彼がToch Bar対応を命じるのではないかともいっていました.
とはいえ,実現はしばらく先になる見込みです.なぜかというと最新のMac OSであるMojaveに搭載された「ダークモード」という暗い色調の表示スタイルが,JMPで問題となることが判明したからです.(そう聞いたのですが,自分もMajaveにしてJMP13を起動して見ましたが,特に問題は見あたらないですね.何か特別な操作や環境下での問題かもしれません.11/18追記:もしかしたらダークモードに対応したJMPの開発中に問題が見つかったということだったのかもしれません.以前からエディター系のソフトでダークモードをサポートしたものはありましたが,JMPの場合はグラフやデータの表示が見にくくなってしまうので,あまり現実的ではないような気もします.)ダークモードにしなければ問題ないので,普通のソフトメーカーであれば対応は後回しにされるところですが,John Sallさんが「fix it!」と命じたそうで,そうなるとそれがJMP開発の最優先になるのです.というわけで,今現在SASの開発陣がその対処に追われているとのことです.おそらくダークモードは12月リリースの14.2で対応されると予測します.ですので,Touch Bar対応は作業量の多さもあるので,遅ければJMP15になってしまうかもしれませんが,対応はしたい,とSAS USのトップが入っているので,Mac使いのJMPerの我々は心待ちにしていましょう.
Summitについてのいろいろについてはまた来週ということで本日はここまで.それではまた.
posted by Tad at 19:00| Comment(0) | TrackBack(0) | JMP

2018年10月27日

等高線を読む際のヒント

紅葉の季節が近づいてきました.どこかに山登り(といっても本格的な登山ではないです)にでもいこいうかなと地図を眺めていて思ったことを本日は.
「モデルのあてはめ」は実験データを表現する数式を導出してくれるJMPの代表的な機能です.ですから,モデルとは数式そのものを指しています.一方,モデルには日本語で模型という意味もあります.わたしはモデルを考えるときは常に模型のイメージを大切にしています.模型といっても,いわゆる工作模型の類です.応答関数の性質やその挙動を把握するのには実験データを仲介としてシステムを模型化するという考え方が重要です.この意味では,予測プロファイルよりも曲面プロファイルの方が直感的に理解しやすいので,必ず曲面も見ることにしています.一度に見れるのは二因子までに限定されますが,他の因子を色々と切り替え,スライドさせて,それこそ捻くり回すのです.
工作模型は偽物ではありますが,特に精密にできた模型には本物以上の魅力があります.ときには本物以上の機能が備わっていたりします.誤解のないように補足しますと,本物では検証不可能なことが模型を使って可能である,というような意味です.例えば,何らかのシステム開発ではUMLを用いて分析・設計を実施します.UMLで表記したビジネスモデルをオブジェクト指向で分析するのはシステム開発では必須の手順です.一方で,技術開発ではまだまだ実験計画によるデータに基づくモデリングは必須のものとはなっていません.システム開発のように技術開発もすべきである,というのがわたしの持論です.
JMPの一連のプロファイルはこのために欠かせないツールです.松岡正剛さんは千夜千冊の書評で,松井広志(2017)『模型のメディア論』青弓社を取り上げて,「モデリングの真骨頂は可塑的であることだ。」と看破されていますが,わたしもJMPのプロファイルの長所は応答関数を可塑的に変化させることができる点にあると考えています.
ところで,曲面プロファイルは,模型のイメージには近いのですが,応答が複数になると手に負えなくなります.そこで多目的最適化では等高線プロファイルが活躍します.とはいえ,しょせん二次元モデル(マップ)なのでその情報を三次元に再構築する能力がわたしたちに必要となります.サイクリングで峠に登るコースを選ぶときなどで,等高線を読むのに慣れているのでわたし自身は問題ないのですが,経験的に,これが苦手な人がいらっしゃいます.そこでちょっとした小技をお教えしましょう.
データは何でもいいのですが,サポートファイルの「MCDAデモ事例.jmp」を使って説明します.まずは,グラフメニューから等高線プロファイルを選んで,「予測式_膜厚」_を「Y,予測式」に割り当てます.このときN2とSiH4を誤差因子にも割り当てるのが味噌です.(この例では他の因子は無視します.)水平はN2,垂直はSiH4をチェックしてから,Y軸をダブルクリックして範囲を最小−1000,最大を3000とし,同様にしてX軸の範囲も最小−300,最大300に変更します.あくまでも等高線プロファイルの例として示しているだけで,範囲を拡張しているので現実的な例では全くありませんので,この点はご注意ください.
さて,予測式(この場合膜厚)の応答関数が赤線で示されていますが,もっとわかりやすくするために赤三角から「等高線グリッド」を設定(デフォルトで構いません)します.この時点で既にお気付きのように青と緑の線が示されています.これらは膜厚の予測式をそれぞれSiH4とN2とで偏微分した係数の予測式(∂予測式)であり,即ち応答関数の曲面の傾き(の等高線)を示しています.デフォルトでは0の等値線が示されているので,これは山の尾根線に相当するのものです.青線の線上ではSiH4の変動に対する膜厚(の予測値)の変化は0になっています.二次までの応答関数を仮定した場合限定ですが,山の尾根道,山登りの用語でいうといわゆる乗越(のっこし)ですね.もちろんか谷道の場合もあります.(三次までを仮定するならば,林道のような片側が崖で片側が山のような道というケースもあります.)そして,両者が混じった点が山の頂上あるいは谷底,あるいはいわゆる鞍部になります.
この2つの∂予測式が応答関数の把握に役に立ちます.このためには2つの∂予測式の等高線グリッドを挿入してみます.
92−1.png
ここから応答曲面が再構築できますか?わからないという人は,膜厚の下限をスライダーで変化させるとこの曲面は鞍部の形状になっていることがわかります.曲面プロファイルだとこんな感じです.
92−2.png
このプロファイルに誤差因子を割り当てるのは,本来はロバスト設計のための機能です.ここでは「満足度の最大化」は実施していませんが,膜厚を最大に,両方の∂予測式を0に制約することでロバスト解が得られることになります.それだけでなく,通常の内乱でなく外乱の影響を考えるときに役に立ちます.例えば,SiH4とN2のガス流量の変動に対しては,2つの∂予測式の上加減をそれぞれN2は±3, SiH4は±0.5などと入力するとこのようになります.
92−3.png
この図の白抜きの領域がガス流量の変化にロバストになっています.費用をかけてガス流量の安定を図るならば,SiH4の方が効果が高いということがわかります.
簡単な例ですが,JMPのプロファイルの素晴らしさが伝われば幸いです.秋深くなってまいりました.皆様も風邪など召されませんよう.それでは. 
タグ:JMP
posted by Tad at 20:00| Comment(0) | TrackBack(0) | JMP