UA-115498173-1

2018年03月31日

JMP14対応のMCDAアドインについて

先日まで検証していたのですが,本書の例題の範囲では少なくとも動作に問題はないようですので,JMP14に対応したMCDAアドインを一週間後の4月7日の受付分からリリースします.整理しておきますと,現時点でMCDAアドインには三つのバージョンがあります.書籍出版と同時にリリースした「MCDA20170821.jmpaddin」が最初です.その後に,私のSUMMITでの発表のために一部の処理を改良していただいた「MCDA20171101.jmpaddin」が続き,今回JMP14対応の「MCDA20180214.jmpaddin」となります.今後アドインのGUIの改良や新機能の追加なども考えてはいますが,この三つのバージョンの機能はほぼ同じですので,2017年のリリースのものを旧バージョン,今回リリースするものを新バージョンと以下で呼びます.
念のため補足しておきますと,使用しているJMPのバージョンによって以下のオプションがあります.
JMP12以前
MCDAアドインはサポートされていません.
JMP12
現在お持ちの旧バージョンのアドインをそのままお使い下さい.JMP14対応版は動作しません.JMP12に対するMCDAアドインの提供はこれで打ち切ります.
JMP13
新旧どちらのバージョンでもお使いいただけます.既にアドインをお持ちであれば,新バージョンにアップデートする必要はありません.
JMP14(トライアル版を含む)
JMP14では新バージョン「MCDA20180214.jmpaddin」にアップデートしていただく必要があります.MCDAアドインの申し込みページからフォームに入力して再度お申し込みください.(SAS社のサイトに飛びますのでご注意ください.)上述のように一週間後の4月7日の受付分から最新版の配布を開始します.アップデートはアドインをダブルクリックすれば上書きするかを聞いてくるので『OK』を押してください.
今回Mac版のJMP Pro 14.0.0で検証しましたので,WINDOWS環境やJMP Stdでの検証はできていません.継続してこれらの環境で検証をしていきますが,何かしら問題を見つけられたかたはご一報いただけると大変助かります.
今回の検証でいくつか本書の内容に修正すべきところが見つかりました.本書の図版や結果はMCDAアドインの開発版を使っているため,一部の結果が正式に配布したアドインによるものと異なっています.解の導出手順等には違いはありませんので,本文の数値は参考に留めていただければと思います.混乱を招いてしまい申し訳ございません.上記の詳細については,あらためて「お詫びと訂正」のカテゴリーに明日投稿します.
MCDAアドインは使いこなせれば非常に強力なツールなのですが,本書の説明はページ数の制約のため急ぎ足になっていますし,上記のような問題もあります.それを補足する意味でも,かねてから予告していますように「統計的問題解決セミナー」を開催しますのでしばしお待ちください.それではまた明日.
タグ:JMP

2017年12月09日

カスタム計画の最適基準について(少し追加)

先日,カスタム計画について質問されました.同じ事前モデルにしても人によって最小実験数が異なるというのです.計画そのものは乱数計算で作成されるので人によって異なるのはそれが仕様なのですが,実験数は変わらないはずです.状況を確認したところ,人によって事前モデルの作成手順が異なっていたためということがわかりました.
このことを理解するためにはカスタム計画の最適基準について知っていることが必要です.本書にも書いたことですが,ほとんど場合はデフォルト設定である「推奨する最適化法」というJMPのおすすめに従っていればいいので,最適化基準の使い分けはもちろん,その存在を意識しなくても大丈夫です.とはいえ,推奨と言っても高度なアルゴリズムが背後にあるというわけではありません.基本はD最適基準が採用されて,「RSM」ボタンを使って事前モデルを作成する場合に限り「I最適基準」で計画が作成されます.二次の交互作用項と二乗項とを個々に追加しても全く同じ事前モデルが作成できますが,この場合はD最適基準で計画が作成されます.このため,同じ事前モデルでもその操作手順によって(基準が)異なった計画ができてしまうのです.この際,基準によって必要実験数が変わることがあります.5因子のフルモデルを「交互作用」「べき乗」のボタンで作成すると,最小が21,推奨が28の実験ができます.一方,「RSMボタン」を使うと最小が21,推奨が27になります.試してみてください.
それではなぜこの違いが出るのかということですが,実験計画をモデル行列として記述して,数理的な観点から眺めるとそれぞれの基準の意味するところは容易に理解できます.(最尤法は理解しているほうがいいですけど.)数式が書きにくいブログで詳細に説明するのは困難なので,乱暴ながらニュアンスだけお伝えします.言葉の定義もあいまいにしているので少々不正確なところもあるのはご了承ください.
まず最適化にはいろいろあるということは最適化設計の場合と全く同じです.何を最適化しているのかという違いがそれぞれの最適化基準の違いです.I最適基準ではJMP流にいうと(相対)予測分散が最適化(最小化)されています.予測分散とは予測値の分散のことで,ここらへんのことはモデルのあてはめのアナロジーで理解できます.この予測分散と誤差分散との比をとって相対予測分散と定義していて,この値は実験データには無関係になります.この場では,実験空間内で計画に固有の値(予測分散)が計算できると理解しておけばそれで十分です.このとき実験空間内での予測分散の平均値を最小化するのがI最適基準です.この平均というところがポイントです.一方,D最適基準は情報行列の行列式を最大化すると書籍には書かれています.まず情報行列とはパラメータ推定の精度向上のための情報を尤度関数の分散で表現したフィッシャー情報量の多次元分布への拡張版です.この情報量とは推定に必要な情報量と理解してください.行列式とは単位ベクトルがその行列によって変換されたベクトルで囲まれた単位体積ですから,それを最大化するということは情報量がより大きい計画によってパラメータ推定精度を高めることを目的としていることになります.
D最適基準とI最適基準の違いを視覚化してみました.この図は3因子のフルモデルで実験数16とした場合です.青丸がD最適の実験点で赤丸がI最適の実験点です.紫色の点は両方に共通している点で,中央の濃い赤丸は中心点で点が重なっていることを示しています.I最適計画には二つある中心点はD最適計画には一つもないことがわかりますね.
最適基準.png
言葉だけの説明では限界がありますので,なんとなくという理解でOKです.最適化基準の定義を数式として覚えるよりも,最適化基準の意味するところを理解し,それによって最適化基準を使いわけられるほうが技術者には重要です.本書では入門書であるということを意識して,基準の使い分けは紹介しませんでした.JMPのおすすめはほとんどの場合D最適基準ですから多くの技術者はこれだけを使うことでも構いませんが,少し上級者は使い分けをしてもおもしろいですね.このことでカスタム計画作成の戦略の幅が広がるからです.
現時点での私の考える使い分けの戦略を書いておきます.まずD最適基準はモデルのパラメータの分散を最小化することを第一義にしているのでスクリーニングの目的で使うと有効です.このためには存在が不明な2乗項は事前モデルには入れないかわりに設計因子は可能な限り入れます.モデルのあてはめ精度が気になる場合は「中心点の数」をデフォルトの0から変更します.寄与率の高いモデルができたならばこのモデルで最適化設計に進みます.
しかしながら,このモデルの予測分散(の平均値)はI最適計画によるものよりも大きいはずなので,D最適計画の結果をもとにI最適計画に繋げます.この際,最適解を予測分散が最小になっている実験空間の中心に持ってくると良いです.スクリーニング後なのですべて因子の効果はそれなりにあるはずですから,事前モデルは「RSM」ボタンで作成することになります.おそらくこのような使い分けを想定しているのでJMPの「推奨する最適化法」の仕様は上述のようになっているのではないでしょうか.
この他JMPには交絡最適計画とうのもありますが,これもうまくつかうと大変有効な計画なのでいつか紹介します.更には最適計画には最適化基準としてA最適やG最適などもあって,これらはJMPには実装されていませんが,特にA最適はD最適の回転可能性 (design rotatability)という制約を外した最適基準と理解できるので,事前モデルにおける交互作用の確信度がある程度高い場合などではD最適のかわりに使うことで予測値の分散を低減できると考えています.
世には上述の最適基準の定義を解説した書籍は多くあるのですが実戦的な使い分けを教えてくれる書籍がないので,自らの事例でトライアンドエラーで使い分けを確立していこうと思っています.どなたか一緒にやりませんか?
それではまた.
タグ:統計学 JMP

2017年10月28日

Mac版の小技など

無事に出版記念セミナーを終えました.参加して頂いた皆様,どうもありがとうございました.興味はあったけれど,今回参加できなかったという方もいらっしゃるかもしれませんので,機会をみてこのブログで今回のセミナー内容を掲載しようと考えています.セミナー後の歓談でもいろいろ議論させていただき大変勉強になりました.拙著にサインを求められるとは思ってもいなかったので,こんなことならば練習しとけばよかったです.SUMMITで書籍販売するかはまだ決まっていませんが,もし同じような機会あるならば少し練習しておきます.
基本的にJMPユーザーの集いとはいえ,統計の知識もJMPのキャリアも様々な皆様がおいでになるとSAS社のご担当から伺っていましたので,セミナーはやさしい内容にしたつもりですが,いかがでしたでしょうか.JMPエキスパートの方には物足りなかったかもしれませんが,最後にお見せしたMCDAアドインのデモはタグチメソッドを知らない方には理解しにくかったかもしれません.そういう方々のためにセミナーでご案内しましたように,本書の内容を理解したい初心者のためのフォローアップゼミを企画しています.ゼミ形式でやるので,申し訳ありませんが人数は5名程度が限度です.このため,今回のセミナーのように一般告知はしないかもしれませんので,興味ある方は直接お問い合わせください.日時は全く定かではないのですが,SAS社からは場所の提供について快諾いただいています.可能であれば,おそらくプレスルームと思われる,受付右を左折した突き当りの部屋をお借りするつもりです.六本木のオフィスに行ったことがある方ならばご存知のあの壁がガラス張りになっている部屋です.
さて,本日はこれだけですと情報が少ないので,今回のセミナーで初めて知ったJMPネタを披露します.といってもMac版限定なのでWINDOWS版しか使わない方には申し訳ないのですが,JMPの言語表示に関することです.WINDOWS版とMac版との違いは色々ありますが言語変更のやり方はそのうちの一つです.WINDOWS版では「環境設定」から「WINDOWSのみ」にある表示言語で言語を自由に切り替えられますが,Mac版JMPの環境設定にはこの項目はありません.OS Xで使用する言語が日本語であればJMPの表示言語も日本語に,私のように英語環境で使っているとJMPも英語で表示されます.個人的にはJMPの英語メニューの方がわかりやすく,仕事では日本語が第一言語でない方(当然英語版JMPを使っている)の指導をすることもあるので,WINDOWSでは日本語JMP,Macでは英語JMPという使い分けをしています.
私が英語表示の方が絵借りやすいと思う一例をあげましょう.例えば「1変量の分布」は英語版ではシンプルに「distribution」です.もちろん,いくつもの変数についてヒストグラムを並べて表示できるわけなので,1変量という限定をなぜ日本語メニューに入れているのでしょうか,更に,「2変量の関係」は英語版では「Fit Y by X」と直接的です.日本語版メニューは直訳にもなっていませんが,その機能からは明らかに英語版の表記に方が的確ですね.「2変量の関係」ですと,「Fit X by Y」もありになってしまいます.データ分析では何をXにして何をYにするのかを常に意識する必要ありますから.
というわけで,私が個人的に使う分にはこのような(Macでは英語JMP,WINDOWSでは日本語JMP)使い分けをしていたのですが,今回のように人前でデモをする場合はMacを使わざるを得ませんので,Mac上で日本語JMPを使いたいところです.OSの言語を英語に切り替えればいいのですが,プレゼンに使うkeynoteというソフトは英語でしか使っていないので,やや不安があります.その場で資料を作成するわけではないので,まず問題はないはずですが,できれば慣れた環境のままにしておきたいと思いました.
この状況でSAS社の技術の方に教えていただいたのは,Macの環境設定で,言語リストで日本語を一番上に持っていってJMPを再起動するという方法です.この状態でOSの再起動または一度ログオフするとOSの言語は日本語に切り替わるのですが,そうせずに,ここでJMPを再起動します.そうするとOSは英語のまま日本語JMPが走るのです.どうやらJMPは起動時にOS Xの言語環境でリストの先頭にある言語を見ているだけのようです.JMP起動後は先ほど先頭に持って来た日本語を英語に戻しておきます.JMPを再起動すると英語表示に戻ってしまいますが,今回の目的には十分です.数少ないMac版JMPのデメリットがこの小技で解消できると考えて皆様にもお知らせします.多くのMac版JMPユーザーの皆さんには「おお」と言ってもらえるのですが,わかる人にしかわからない話ですいません.

それではまた.
タグ:JMP