2017年11月11日

MCDAアドインの修正について

MCDAアドインに修正が入りました.修正といっても,言われなければ気づかないような些細な修正で,本書の内容にも変更はありません.修正されたのは次の二つです.
1.メッシュデータの生成で作成されるテーブル名が「最適化」となっていたのが「グリッド」に修正されています.
2.最適化の結果が「プロファイル」と連動するようになりました.
前者は単純な間違いの訂正ですが,後者の改良によって最適化解を視覚化する際に便利になりました.出版記念セミナーに参加していただいた方は覚えていらっしゃると思いますが,私のデモでは最適化後にその都度「プロファイル」を起動していました.それがトリガーとなって最適解の値が「曲面プロット」等に送られるのです.プロファイルのウィンドウは大きいのでグラフ描画の度にいちいちそれを閉じなければならないのが面倒でしたし,そもそもその都度「プロファイル」を起動するのはスマートではありませんでした.今回の修正で「最適化」すれば直ちにそれがグラフ描画に反映されることになります.
今回の修正は本文中で言及していませんので,既にMCDAアドインをダウンロードされている方でも本書を読み進める上では問題ありません.最新版をダウンロードするには(お手数おかけして恐縮ですが)もう一度フォームに入力していただく必要がありますので,今回のようなマイナーな修正では,その必要はあまりないかもしれません.もちろん,これからアドインをダウンロードされる方は修正版になります.今後も修正や改良を入れていく可能性がありますので,このブログを時々のぞいてみてください.この類の情報は「ファイル・ダウンロード」のカテゴリーに投稿していきます.
週末にブログ更新をしているのですが,本日のお知らせと被ってしまいますので今週の投稿は明日アップします.それでは.
タグ:JMP

2017年11月04日

JMPとIoT

最初にセミナーでお配りしたPDFの印刷物について補足します.プレゼンソフトのkeynoteから40枚のうちの8枚を抜粋したごく簡単なものですが,なんとかA4一枚に納めたかったので文字サイズや色を修正してオリジナル版を作成しました.一枚の資料にしたかったのは紙をめくる音が好きでないということもありますが,アニメーションを多用しているので,PDFにするとわけが分からなくなってしまうページや写真などの著作物を引用したページを間引くと配布できるようなページがあまり残らないという事情がありました.比較的重要なページを選んで作り直しましたが,特に後半の第二部はあれだけでは説明不足かもしれません.実際の問題解決では綺麗ごとでは済まされないという状況があり,そのためには統計学の枠組みを超えることも必要です.このことだけは是非とも皆様に知って頂きたかったので近いうちにこのブログでもう一度お話しさせてください.
一つ重要なことを思い出しました.配布資料には間違いが入れてありますとお話ししたきり,時間配分の都合で第二部の後半を急いだために正解をお伝えするのを忘れてしまいました.間違いを入れたのは掟破りの問題解決のページです.破る掟は,Principle,Standard,Protocol,Rule,Regulationの五つですが,そのうちのStandardは配布資料に書いてある「現実の再定義」ではなくて,Principleと同じく「理想状態の再定義」が正解です.Standardは「基準」ですから,理想状態を定義する数値です.基準を変えることで問題を解決するという荒技がここで意味していることです.
ちなみにこのStandardは基準と訳していますが,MCDAにおける多基準の基準はCriteriaとなります.本書では「基準」という漢字を採用しましたが,Standardの基準と区別して多規準としたほうがよかったかもしれません.この両者の違いを知るには,この文献が参考になります.
以上のことはセミナーに参加されなかった方々には何を言っているのかわからないと思いますが,上述したようにいずれこのブログで紹介しますので,そのときまでお待いただければありがたいです.
さて,前置きが長くなりましたが,先日IoT関連のコンファレンスに参加してきましたのでJMPに絡めて考えてみます.統計的問題解決ではIoTデータを直接扱うことはあまりないかもしれませんが,分析結果としてデータから因果関係が抽出するという点では,本書でも解説した量産データ分析と変わりはありません.もちろん,IoTデータはビッグデータなので,JMPで分析するには少々敷居が高いかもしれませんが,JMPでもかなりのことができます.IoTデータが入手できるならばやってみるべきです.
やるならば,CPUは64bitであることと搭載メモリを可能な限り増やすことが必須となります.32bit版のJMPでは扱えるメモリは最大2GBまでなので,データのファイルサイズとして500MBを一つの目安とし,それ以上のデータを扱う場合は64bit版のJMPまたはJMP Proを使って2GB以上をアサインすることを推奨されています.意外と知られていないのが,WINDOWSの場合,シングルユーザーライセンスのJMPは32bit版であるということで,64bit版を使うには年間ライセンスが必要ということです.
一方,Macでは64bitマシン(Core 2 Duo以降)では確かJMP12からはシングルユーザーライセンスでも64bit版JMPのはずです.今年のWWDC(世界開発者会議)でAppleは今後はApp Storeでは32bitアプリケーションのサポートを終了(最新のOSであるHigh Sierraが最後)していく方針を発表し,JMPのようなStore以外で購入するソフトについても64bit化することを推奨していますが,JMPはいち早くこの要求に応えたようです.個人でビッグデータを扱うならばMac版JMPを使うのが良いということになります.
そもそも対話的な操作を特徴とするJMPにとって,ビッグデータ分析は分析者が介在しにくいという意味で相性は良くないように思います.例えば,普段何気なく実行している「多変量の相関」なども変数の数が増えると指数関数的に負荷が増大し,出力結果の認性も著しく低下します.個々のデータをクリックして,様々な処理を実施することができるJMPのインターフェイスの宿命とも言えます.
とはいえ,一昨年のDSJ2016ではJohn Sallさんが基調講演でJMPでビッグデータを分析して見せてくれました.SAS社としてもSASとJMPとの棲み分けがあるようで,ビッグデータはSASのテリトリーというのが暗黙の了解事項のようで(私の推測です),JMP事業部も積極的にビッグデータ分析をアピールしてはいませんが,JMP10あたりからビッグデータを意識した機能が加わってきています.上述した64bitにより扱えるデータサイズがほぼ無制限になったことや,JMP13には新機能の一つに「仮想結合」が加わりました.JMPのデータはメモリ内に展開されますが,リンクを張るような機能だと思うのですが,これによって大きなテーブルの結合でメモリ不足を回避することができます.その他,サンプルサイズの大きいデータを扱う際に知っておいて便利なのは「工程のスクリーニング」です.この機能は説明変数が多いときに使います.挙動が似ている変数同士をクラスタリングしてくれます.同じようなことは「多変量の相関>」でもできますが,この機能を使えばクラスタリングした結果を「モデルのあてはめ」に持っていけるので分析フローを重要視するならば,大変重宝します.その他,「テキストエクスプローラ」などもビッグデータを意識した機能ですね.JMP13では残念ながら英語にしか対応していませんが,JMP14では部分的に日本語対応するとも聞いていますので,それまではMeCab(日本語形態素解析システム)などを使えばいろいろ面白いことができるように思ってはいるのですが,なかなか時間が取れないでいます.どなたか試してみませんか?
それではまた.
タグ:JMP
posted by Tad at 09:39| Comment(0) | TrackBack(0) | JMP

2017年10月28日

Mac版の小技など

無事に出版記念セミナーを終えました.参加して頂いた皆様,どうもありがとうございました.興味はあったけれど,今回参加できなかったという方もいらっしゃるかもしれませんので,機会をみてこのブログで今回のセミナー内容を掲載しようと考えています.セミナー後の歓談でもいろいろ議論させていただき大変勉強になりました.拙著にサインを求められるとは思ってもいなかったので,こんなことならば練習しとけばよかったです.SUMMITで書籍販売するかはまだ決まっていませんが,もし同じような機会あるならば少し練習しておきます.
基本的にJMPユーザーの集いとはいえ,統計の知識もJMPのキャリアも様々な皆様がおいでになるとSAS社のご担当から伺っていましたので,セミナーはやさしい内容にしたつもりですが,いかがでしたでしょうか.JMPエキスパートの方には物足りなかったかもしれませんが,最後にお見せしたMCDAアドインのデモはタグチメソッドを知らない方には理解しにくかったかもしれません.そういう方々のためにセミナーでご案内しましたように,本書の内容を理解したい初心者のためのフォローアップゼミを企画しています.ゼミ形式でやるので,申し訳ありませんが人数は5名程度が限度です.このため,今回のセミナーのように一般告知はしないかもしれませんので,興味ある方は直接お問い合わせください.日時は全く定かではないのですが,SAS社からは場所の提供について快諾いただいています.可能であれば,おそらくプレスルームと思われる,受付右を左折した突き当りの部屋をお借りするつもりです.六本木のオフィスに行ったことがある方ならばご存知のあの壁がガラス張りになっている部屋です.
さて,本日はこれだけですと情報が少ないので,今回のセミナーで初めて知ったJMPネタを披露します.といってもMac版限定なのでWINDOWS版しか使わない方には申し訳ないのですが,JMPの言語表示に関することです.WINDOWS版とMac版との違いは色々ありますが言語変更のやり方はそのうちの一つです.WINDOWS版では「環境設定」から「WINDOWSのみ」にある表示言語で言語を自由に切り替えられますが,Mac版JMPの環境設定にはこの項目はありません.OS Xで使用する言語が日本語であればJMPの表示言語も日本語に,私のように英語環境で使っているとJMPも英語で表示されます.個人的にはJMPの英語メニューの方がわかりやすく,仕事では日本語が第一言語でない方(当然英語版JMPを使っている)の指導をすることもあるので,WINDOWSでは日本語JMP,Macでは英語JMPという使い分けをしています.
私が英語表示の方が絵借りやすいと思う一例をあげましょう.例えば「1変量の分布」は英語版ではシンプルに「distribution」です.もちろん,いくつもの変数についてヒストグラムを並べて表示できるわけなので,1変量という限定をなぜ日本語メニューに入れているのでしょうか,更に,「2変量の関係」は英語版では「Fit Y by X」と直接的です.日本語版メニューは直訳にもなっていませんが,その機能からは明らかに英語版の表記に方が的確ですね.「2変量の関係」ですと,「Fit X by Y」もありになってしまいます.データ分析では何をXにして何をYにするのかを常に意識する必要ありますから.
というわけで,私が個人的に使う分にはこのような(Macでは英語JMP,WINDOWSでは日本語JMP)使い分けをしていたのですが,今回のように人前でデモをする場合はMacを使わざるを得ませんので,Mac上で日本語JMPを使いたいところです.OSの言語を英語に切り替えればいいのですが,プレゼンに使うkeynoteというソフトは英語でしか使っていないので,やや不安があります.その場で資料を作成するわけではないので,まず問題はないはずですが,できれば慣れた環境のままにしておきたいと思いました.
この状況でSAS社の技術の方に教えていただいたのは,Macの環境設定で,言語リストで日本語を一番上に持っていってJMPを再起動するという方法です.この状態でOSの再起動または一度ログオフするとOSの言語は日本語に切り替わるのですが,そうせずに,ここでJMPを再起動します.そうするとOSは英語のまま日本語JMPが走るのです.どうやらJMPは起動時にOS Xの言語環境でリストの先頭にある言語を見ているだけのようです.JMP起動後は先ほど先頭に持って来た日本語を英語に戻しておきます.JMPを再起動すると英語表示に戻ってしまいますが,今回の目的には十分です.数少ないMac版JMPのデメリットがこの小技で解消できると考えて皆様にもお知らせします.多くのMac版JMPユーザーの皆さんには「おお」と言ってもらえるのですが,わかる人にしかわからない話ですいません.

それではまた.
タグ:JMP

2017年10月21日

出版記念セミナーに備える

いよいよ来週はJMPer’s Meetingです.何をお話しするのかは決めてあるので,この週末にKeynote(Mac用のパワーポイントのようなソフト)でプレゼン資料を作成していますが,ここにきて一つ困ったことが判明しました.
今回は出版記念セミナーということで,JMPよりは問題解決を中心としてお話しする予定にしていますが,それだけですと内容が少し抽象的になりすぎてしまうので,後半にMCDAアドインのデモを入れることにしました.そもそも当初の原稿では易しいものから難しいものまでAMDCアドインを使う三つの例題を準備していましたが,ページ数オーバで原稿をカットする必要が出てきました.そこで,その中でもやや難しい例題のみを本書で採用したという経緯があります.不採用とはしましたが,他の二つも理解を助けるためにはなかなか良い例題なのでこのまま埋めておくのも勿体ないと考えていたところ,今回の機会をいただきました.そこで,今回のセミナーと来月のサミットでそれぞれ別の例題を取り上げることにしました.
来週紹介する例題は,ノイズ因子がない代わりに二入力を扱っていることが特徴です.本書の言葉では,目的因子が二つあるシステムということになります.ノイズ因子がないと計算負荷は少なくなるのですが,それでも因子をアサインして実行かけてから設計ウィンドウが出てくるまでに30秒ほどかかります.これは私のMacが遅いからということもあります.使っているデスクトップは2xQuad-core Xeonのものなので余裕なのですが,今回のように外に持ち出せる機種では第二世代のMacBook Air(Early 2009)が一番新しいという状況です.こいつはCPUがプアということもありますがなんとメモリが2GBしかありません.ご存知かもしれませんが,MacBookにはメモリを追加することはできないので,KeynoteとJMPとを同時に動かすのはそもそも厳しいところです.
そこで新たにMacBook購入を検討しています.あまり使用頻度が高いものではないので,高価なものである必要はないのでまたMacBook Airでいいかなと考えていますが,アップルの新技術が気になります.写真を見たりすることはないので,Retinaディスプレイとかは(新しいというわけでもありませんし)どうでもいいのですが,感圧式のtrack padがとても気になっています.擬似的にクリック感を出しているということが好きになれずスルーしてましたけれど,先日購入を前提として実機に触って,この機能の価値にあらためて気付きました.
感式圧track padのレビューはWEBで多くの人が書いていますが,どれにも最大のメリットが書かれていないようです.それはクリック操作がパッドの上部でもできるということです.windowsでもおなじですが,クリックはパッドの下部を押す操作になりますが,このことでホームポジションを崩すことを余儀なくされます.感圧式のtrack padでは機械的なボタンがないのでパッドのどこを押してもクリックが可能なので,ホームポジションを保ったままボタン等をクリックできます.このことが何よりも貴重です.
私は英字キーボード派なのですが,その理由もホームポジションを崩さずにenterが押せるからです.よく英字キーボードのデメリットにenterキーが小さくて押しにくいと書いてありますが,これは間違いです.将棋盤に王手を打ち込むようにenterを押す人がいますが,こういう人であれば着地点が広い方が(打ちやすい)狙いやすいのかもしれませんが,思考を素早くテキストとして出力するためにブラインドタッチしている人にとってはホームポジションから指を離さないことは必須です.特に英語混在の文章を書くことが多い技術者には,生産性向上のために英字キーボードを使うことをお勧めします.
ということで,MacBookかMacBook Proにしようと考えていますが,これらの機種には通常のビデオポートがありません.USB-Cのアダプタは結構高価なので一回しか使わないのにもったいないかなあと悩んでいます.なので,やはり古いMacBook Airのままで講演するかもしれません.その場合は30秒の間延びした時間をご容赦ください.
それでは26日に参加くださる方がもしもこれを読んでいただいているなら,当日お会いいたしましょう.どうぞよろしくお願いします.

2017年10月14日

「産業に生かすJMP」

「産業に生かすJMP」と題したSAS社主催の事例セミナーに参加してきました.講演者のBill Worleyさんは化学畑の技術者としてのキャリアが長く,米国SAS社の前にはP&GやBASFにいらしたというキャリアをお持ちです.Technical Enablement Engineerという役職はアプリケーション・エンジニアのようなものなのでしょうか.化学者の立場からというサブタイトルもあってか,化学関連の会社からの参加者が多かったようです.当初はもっと化学寄りに専門的な内容かと思っていたのですが,JMPスターターの説明があったり,「エクセルからデータを持ってくる方法は三つあるけど,それらを知っているかい」という質問を皆さんに出されたりして,十分初心者でもフォローできる内容でした.
因みに,この質問の答えはおわかりでしょうか?
1.まずはデータをコピーアンドペーストすることです.ペーストのときに列名とともにペーストを指定するのを忘れずに.
2.エクセルのJMPメニューを使う方法が二つ目の方法です.エクセルのレイアウトによっては環境設定の各種数値を調整することが必要となります.
3.そして最後に「統計的問題解決入門」でも紹介したエクセルwizardです.

それで知ったのですが,エクセルwizardは英語版ではEXCEL import wizardなんですね.エクセルwizardというとエクセル名人のような意味合いなので,なんか変だなとは思っていました.日本語版ではおそらく文字幅に起因する視認性を優先したのでしょう.漢字フォントを使う我々の場合,どうしてもフォントサイズが大きくなってしまいます.(余談ですが,万年筆のニブも日本製のものは外国製に比べて細くなっています.例えば,ペリカンのFはパイロットではM相当です.手帳に漢字を書くのにはペリカンのF(細字)では厳しいです.)
英語が苦手な人でも今回のセミナーは逐次通訳付きでなので十分理解できるレベルでしたが,JMPの画面は英語版のままでした. John SallさんのSummitの講演などではSAS Japanの人が二画面あるうちの片面で日本語版の画面を出したりしていますが,操作をリアルタイムに真似しなければならず,シンクロさせるのに苦労さなっています.
今回のセミナーで英語版のJMPの画面を見ると,いろいろな違いにあらためて気づきました.「統計的問題解決入門」でも「二変量の関係」は「Fit Y by X」であるとかを紹介していますが,なるほどと思ったのが,グラフビルダーのボタンです.
ご存知のように設定パネルには左から「元に戻す」「やり直し」「終了」という三つのボタンが並んでいますが,これらは英語版では「Undo」「Start Over」「Done」となっています.正直にお話ししますと,今だにUndoするつもりで「やり直し」ボタンを押してしまうのですが,この点は英語表記の方がわかりやすいですね.
JMPの表記に限ったことではないのですが,英語表記を知ってその正確な意味がわかるような例がたくさんあります.例えば,「拡張計画」は「Augment Design」です.拡張はAugmentの一つの形態であって,例えばaugment children’s performance などと言ったりします.日本語にない言葉なのでこれは仕方ないのかもしれません.
セミナーの話に戻りますと,先ほどのエクセルwizardのところでは,10000行より多いデータで使うことを推奨されていたり,寄率与と自由度調整済み寄与率との差は小さい方が望ましいという説明ではその値は0.1%以下という値を示していたり,具体的な数字を出してくるあたりにBillさんが実務家であるという印象を受けました.具体的な数字についての質問は私もよく受けるのですが,これがなかなか難しいところです.多変量のデータ分析に経験がそれほど多くはない私がVIFはいくつ以下であればいいのかと聞かれても,ものの本にはということをお伝えするのがせいぜいです.一方で,多くの経験がある実験計画では,例えばモデル寄与率について聞かれれば,計測精度や実験環境にもよりますが,具体的な数字を出してお答えできます.
一つ気になったのは,カスタム計画を作成する際に,実験数がリソースよりも多い場合に「if possible」(日本版では「必要な場合のみ」)を適用せよと言われていたことです.私はこれには反対です.「必要な場合のみ」はそのリスク(交絡)を知った上で最後の手段としてであれば「あり」ですが,とりあえず『RSM』で効果を仮定して実験数が多ければ「必要な場合」にするというのは,交絡がグシャグシャになって,わけがわからなくなる可能性大です.Billさんの経験からはそれでうまくいったこともあったのかもしれません.この点についてはご本人にメールで確認してみようと思っています.
それではまた.
posted by Tad at 13:03| Comment(0) | TrackBack(0) | JMP