2017年12月09日

カスタム計画の最適基準について(少し追加)

先日,カスタム計画について質問されました.同じ事前モデルにしても人によって最小実験数が異なるというのです.計画そのものは乱数計算で作成されるので人によって異なるのはそれが仕様なのですが,実験数は変わらないはずです.状況を確認したところ,人によって事前モデルの作成手順が異なっていたためということがわかりました.
このことを理解するためにはカスタム計画の最適基準について知っていることが必要です.本書にも書いたことですが,ほとんど場合はデフォルト設定である「推奨する最適化法」というJMPのおすすめに従っていればいいので,最適化基準の使い分けはもちろん,その存在を意識しなくても大丈夫です.とはいえ,推奨と言っても高度なアルゴリズムが背後にあるというわけではありません.基本はD最適基準が採用されて,「RSM」ボタンを使って事前モデルを作成する場合に限り「I最適基準」で計画が作成されます.二次の交互作用項と二乗項とを個々に追加しても全く同じ事前モデルが作成できますが,この場合はD最適基準で計画が作成されます.このため,同じ事前モデルでもその操作手順によって(基準が)異なった計画ができてしまうのです.この際,基準によって必要実験数が変わることがあります.5因子のフルモデルを「交互作用」「べき乗」のボタンで作成すると,最小が21,推奨が28の実験ができます.一方,「RSMボタン」を使うと最小が21,推奨が27になります.試してみてください.
それではなぜこの違いが出るのかということですが,実験計画をモデル行列として記述して,数理的な観点から眺めるとそれぞれの基準の意味するところは容易に理解できます.(最尤法は理解しているほうがいいですけど.)数式が書きにくいブログで詳細に説明するのは困難なので,乱暴ながらニュアンスだけお伝えします.言葉の定義もあいまいにしているので少々不正確なところもあるのはご了承ください.
まず最適化にはいろいろあるということは最適化設計の場合と全く同じです.何を最適化しているのかという違いがそれぞれの最適化基準の違いです.I最適基準ではJMP流にいうと(相対)予測分散が最適化(最小化)されています.予測分散とは予測値の分散のことで,ここらへんのことはモデルのあてはめのアナロジーで理解できます.この予測分散と誤差分散との比をとって相対予測分散と定義していて,この値は実験データには無関係になります.この場では,実験空間内で計画に固有の値(予測分散)が計算できると理解しておけばそれで十分です.このとき実験空間内での予測分散の平均値を最小化するのがI最適基準です.この平均というところがポイントです.一方,D最適基準は情報行列の行列式を最大化すると書籍には書かれています.まず情報行列とはパラメータ推定の精度向上のための情報を尤度関数の分散で表現したフィッシャー情報量の多次元分布への拡張版です.この情報量とは推定に必要な情報量と理解してください.行列式とは単位ベクトルがその行列によって変換されたベクトルで囲まれた単位体積ですから,それを最大化するということは情報量がより大きい計画によってパラメータ推定精度を高めることを目的としていることになります.
D最適基準とI最適基準の違いを視覚化してみました.この図は3因子のフルモデルで実験数16とした場合です.青丸がD最適の実験点で赤丸がI最適の実験点です.紫色の点は両方に共通している点で,中央の濃い赤丸は中心点で点が重なっていることを示しています.I最適計画には二つある中心点はD最適計画には一つもないことがわかりますね.
最適基準.png
言葉だけの説明では限界がありますので,なんとなくという理解でOKです.最適化基準の定義を数式として覚えるよりも,最適化基準の意味するところを理解し,それによって最適化基準を使いわけられるほうが技術者には重要です.本書では入門書であるということを意識して,基準の使い分けは紹介しませんでした.JMPのおすすめはほとんどの場合D最適基準ですから多くの技術者はこれだけを使うことでも構いませんが,少し上級者は使い分けをしてもおもしろいですね.このことでカスタム計画作成の戦略の幅が広がるからです.
現時点での私の考える使い分けの戦略を書いておきます.まずD最適基準はモデルのパラメータの分散を最小化することを第一義にしているのでスクリーニングの目的で使うと有効です.このためには存在が不明な2乗項は事前モデルには入れないかわりに設計因子は可能な限り入れます.モデルのあてはめ精度が気になる場合は「中心点の数」をデフォルトの0から変更します.寄与率の高いモデルができたならばこのモデルで最適化設計に進みます.
しかしながら,このモデルの予測分散(の平均値)はI最適計画によるものよりも大きいはずなので,D最適計画の結果をもとにI最適計画に繋げます.この際,最適解を予測分散が最小になっている実験空間の中心に持ってくると良いです.スクリーニング後なのですべて因子の効果はそれなりにあるはずですから,事前モデルは「RSM」ボタンで作成することになります.おそらくこのような使い分けを想定しているのでJMPの「推奨する最適化法」の仕様は上述のようになっているのではないでしょうか.
この他JMPには交絡最適計画とうのもありますが,これもうまくつかうと大変有効な計画なのでいつか紹介します.更には最適計画には最適化基準としてA最適やG最適などもあって,これらはJMPには実装されていませんが,特にA最適はD最適の回転可能性 (design rotatability)という制約を外した最適基準と理解できるので,事前モデルにおける交互作用の確信度がある程度高い場合などではD最適のかわりに使うことで予測値の分散を低減できると考えています.
世には上述の最適基準の定義を解説した書籍は多くあるのですが実戦的な使い分けを教えてくれる書籍がないので,自らの事例でトライアンドエラーで使い分けを確立していこうと思っています.どなたか一緒にやりませんか?
それではまた.
タグ:統計学 JMP

2017年10月28日

Mac版の小技など

無事に出版記念セミナーを終えました.参加して頂いた皆様,どうもありがとうございました.興味はあったけれど,今回参加できなかったという方もいらっしゃるかもしれませんので,機会をみてこのブログで今回のセミナー内容を掲載しようと考えています.セミナー後の歓談でもいろいろ議論させていただき大変勉強になりました.拙著にサインを求められるとは思ってもいなかったので,こんなことならば練習しとけばよかったです.SUMMITで書籍販売するかはまだ決まっていませんが,もし同じような機会あるならば少し練習しておきます.
基本的にJMPユーザーの集いとはいえ,統計の知識もJMPのキャリアも様々な皆様がおいでになるとSAS社のご担当から伺っていましたので,セミナーはやさしい内容にしたつもりですが,いかがでしたでしょうか.JMPエキスパートの方には物足りなかったかもしれませんが,最後にお見せしたMCDAアドインのデモはタグチメソッドを知らない方には理解しにくかったかもしれません.そういう方々のためにセミナーでご案内しましたように,本書の内容を理解したい初心者のためのフォローアップゼミを企画しています.ゼミ形式でやるので,申し訳ありませんが人数は5名程度が限度です.このため,今回のセミナーのように一般告知はしないかもしれませんので,興味ある方は直接お問い合わせください.日時は全く定かではないのですが,SAS社からは場所の提供について快諾いただいています.可能であれば,おそらくプレスルームと思われる,受付右を左折した突き当りの部屋をお借りするつもりです.六本木のオフィスに行ったことがある方ならばご存知のあの壁がガラス張りになっている部屋です.
さて,本日はこれだけですと情報が少ないので,今回のセミナーで初めて知ったJMPネタを披露します.といってもMac版限定なのでWINDOWS版しか使わない方には申し訳ないのですが,JMPの言語表示に関することです.WINDOWS版とMac版との違いは色々ありますが言語変更のやり方はそのうちの一つです.WINDOWS版では「環境設定」から「WINDOWSのみ」にある表示言語で言語を自由に切り替えられますが,Mac版JMPの環境設定にはこの項目はありません.OS Xで使用する言語が日本語であればJMPの表示言語も日本語に,私のように英語環境で使っているとJMPも英語で表示されます.個人的にはJMPの英語メニューの方がわかりやすく,仕事では日本語が第一言語でない方(当然英語版JMPを使っている)の指導をすることもあるので,WINDOWSでは日本語JMP,Macでは英語JMPという使い分けをしています.
私が英語表示の方が絵借りやすいと思う一例をあげましょう.例えば「1変量の分布」は英語版ではシンプルに「distribution」です.もちろん,いくつもの変数についてヒストグラムを並べて表示できるわけなので,1変量という限定をなぜ日本語メニューに入れているのでしょうか,更に,「2変量の関係」は英語版では「Fit Y by X」と直接的です.日本語版メニューは直訳にもなっていませんが,その機能からは明らかに英語版の表記に方が的確ですね.「2変量の関係」ですと,「Fit X by Y」もありになってしまいます.データ分析では何をXにして何をYにするのかを常に意識する必要ありますから.
というわけで,私が個人的に使う分にはこのような(Macでは英語JMP,WINDOWSでは日本語JMP)使い分けをしていたのですが,今回のように人前でデモをする場合はMacを使わざるを得ませんので,Mac上で日本語JMPを使いたいところです.OSの言語を英語に切り替えればいいのですが,プレゼンに使うkeynoteというソフトは英語でしか使っていないので,やや不安があります.その場で資料を作成するわけではないので,まず問題はないはずですが,できれば慣れた環境のままにしておきたいと思いました.
この状況でSAS社の技術の方に教えていただいたのは,Macの環境設定で,言語リストで日本語を一番上に持っていってJMPを再起動するという方法です.この状態でOSの再起動または一度ログオフするとOSの言語は日本語に切り替わるのですが,そうせずに,ここでJMPを再起動します.そうするとOSは英語のまま日本語JMPが走るのです.どうやらJMPは起動時にOS Xの言語環境でリストの先頭にある言語を見ているだけのようです.JMP起動後は先ほど先頭に持って来た日本語を英語に戻しておきます.JMPを再起動すると英語表示に戻ってしまいますが,今回の目的には十分です.数少ないMac版JMPのデメリットがこの小技で解消できると考えて皆様にもお知らせします.多くのMac版JMPユーザーの皆さんには「おお」と言ってもらえるのですが,わかる人にしかわからない話ですいません.

それではまた.
タグ:JMP

2017年10月21日

出版記念セミナーに備える

いよいよ来週はJMPer’s Meetingです.何をお話しするのかは決めてあるので,この週末にKeynote(Mac用のパワーポイントのようなソフト)でプレゼン資料を作成していますが,ここにきて一つ困ったことが判明しました.
今回は出版記念セミナーということで,JMPよりは問題解決を中心としてお話しする予定にしていますが,それだけですと内容が少し抽象的になりすぎてしまうので,後半にMCDAアドインのデモを入れることにしました.そもそも当初の原稿では易しいものから難しいものまでAMDCアドインを使う三つの例題を準備していましたが,ページ数オーバで原稿をカットする必要が出てきました.そこで,その中でもやや難しい例題のみを本書で採用したという経緯があります.不採用とはしましたが,他の二つも理解を助けるためにはなかなか良い例題なのでこのまま埋めておくのも勿体ないと考えていたところ,今回の機会をいただきました.そこで,今回のセミナーと来月のサミットでそれぞれ別の例題を取り上げることにしました.
来週紹介する例題は,ノイズ因子がない代わりに二入力を扱っていることが特徴です.本書の言葉では,目的因子が二つあるシステムということになります.ノイズ因子がないと計算負荷は少なくなるのですが,それでも因子をアサインして実行かけてから設計ウィンドウが出てくるまでに30秒ほどかかります.これは私のMacが遅いからということもあります.使っているデスクトップは2xQuad-core Xeonのものなので余裕なのですが,今回のように外に持ち出せる機種では第二世代のMacBook Air(Early 2009)が一番新しいという状況です.こいつはCPUがプアということもありますがなんとメモリが2GBしかありません.ご存知かもしれませんが,MacBookにはメモリを追加することはできないので,KeynoteとJMPとを同時に動かすのはそもそも厳しいところです.
そこで新たにMacBook購入を検討しています.あまり使用頻度が高いものではないので,高価なものである必要はないのでまたMacBook Airでいいかなと考えていますが,アップルの新技術が気になります.写真を見たりすることはないので,Retinaディスプレイとかは(新しいというわけでもありませんし)どうでもいいのですが,感圧式のtrack padがとても気になっています.擬似的にクリック感を出しているということが好きになれずスルーしてましたけれど,先日購入を前提として実機に触って,この機能の価値にあらためて気付きました.
感式圧track padのレビューはWEBで多くの人が書いていますが,どれにも最大のメリットが書かれていないようです.それはクリック操作がパッドの上部でもできるということです.windowsでもおなじですが,クリックはパッドの下部を押す操作になりますが,このことでホームポジションを崩すことを余儀なくされます.感圧式のtrack padでは機械的なボタンがないのでパッドのどこを押してもクリックが可能なので,ホームポジションを保ったままボタン等をクリックできます.このことが何よりも貴重です.
私は英字キーボード派なのですが,その理由もホームポジションを崩さずにenterが押せるからです.よく英字キーボードのデメリットにenterキーが小さくて押しにくいと書いてありますが,これは間違いです.将棋盤に王手を打ち込むようにenterを押す人がいますが,こういう人であれば着地点が広い方が(打ちやすい)狙いやすいのかもしれませんが,思考を素早くテキストとして出力するためにブラインドタッチしている人にとってはホームポジションから指を離さないことは必須です.特に英語混在の文章を書くことが多い技術者には,生産性向上のために英字キーボードを使うことをお勧めします.
ということで,MacBookかMacBook Proにしようと考えていますが,これらの機種には通常のビデオポートがありません.USB-Cのアダプタは結構高価なので一回しか使わないのにもったいないかなあと悩んでいます.なので,やはり古いMacBook Airのままで講演するかもしれません.その場合は30秒の間延びした時間をご容赦ください.
それでは26日に参加くださる方がもしもこれを読んでいただいているなら,当日お会いいたしましょう.どうぞよろしくお願いします.