2018年01月20日

訂正のお知らせ

年末年始の休暇中に本書で勉強してくださった方から質問をいただいています.その中で明らかなミスがありましたのでご報告いたします.本書ではサポートファイルを用いてJMPを操作しつつ自習でき,そのことを類書と比較しての特徴の一つとして企画しました.読者に実習してもらうという形式を採用するにあたって,経験者からは問題点もコメントいただいていました.まず,誤魔化しがきかなくなるので校正が大変になるということ,そして読者のJMP操作のスキルによっては説明が不親切になりかねないということ.書籍ではマニュアルのように丁寧な操作手順を示すのには限界があります.それらを踏まえてもJMPの面白さは自分で手を動かさなければ伝わらないと考えた末にサポートファイルを準備しました.念を入れたつもりではありますが,いくつかの不備が(やはり)出てしまったことをお詫びいたします.

1.p202の「グラフビルダー」のグラフ
サンプルファイルを使うとこのグラフはこのようになりません.ここはデータを作るのにおそらく本書執筆で一番手間のかかったところです.試行錯誤でサンプルデータをつくる際に別バージョンのデータによるグラフと入れ替わってしまったようです.実際,計太くんが「収率で実験ブースの寄与があったのも気になるんだけど」と言ってますけれど,p200の「列の寄与」では「実験ブース」の寄与は「収率」「副生成物」ともに0となっています.
現在のサポートファイルからは「実験ブース」の寄与に関する部分は導出できません.サポートファイルをこのバージョンのものに入れ替えることは可能ですので,機会を見つけて差し替えたいと思います.とはいえ確認作業が必要ですので,しばらくお時間をいただければありがたいです.

2.p207の「EMPシステム分析」のグラフ
上記と全く同じ理由で,今のサポートファイルではこのグラフのようになりません.上記と同じく,ここは分析の流れだけを見て頂ければと思います.あまり重要な部分ではないのですが,サポートファイルの訂正も検討します.

3.p229の統子ちゃんのセリフ
「このように入力すればいいのね」ではなく,「このようにチェックを入れればいいのね」がより正確です.下の図では「触媒」「反応時間」がそれぞれ最低値に変更されていませんので.手順としてはチェックを入れた後に,それらの値を変更する必要があります.ちょっと紛らわしいですね.すいません.

もう一つ質問をいただいていますが,実は本日体調不良でして,続きは来週中ということにさせてください.

それでは.

2018年01月13日

品質工学とパラメータ設計

今週は大雪の降る金沢にいっていました.以前米国の豪雪地域に住んでいたので,あの雪かきの苦労も身にしみていて雪には慣れているのですが,今回雪雷というのを初めて見ました.「鰤起こし」といってこの時期に富山湾の氷見鰤が捕れるのだとか聞いたことがありますが,あれがそうだったのでしょうか.関東で夏に発生する雷とは明らかに違うのは落雷の瞬間がとても明るいことです.日本海側で発生する雪雷は高度がとても低いからだそうです.
さて,今回は某所で統計的問題解決の触りをお話ししてきました.本書では統計的問題解決と名前をつけましたが,巷では使いにくい言葉です.漠然としていますし,先週お話ししたように,現状では統計という言葉の持つ意味についていろいろな捉え方があるからです.本書で呼ぶ統計的問題解決の実態は,実験計画によるデータから得た統計モデリングをベースとしたパラメータ設計にすぎません.本書ではワンワードで呼びたかったのでこのように命名しましたが,通常は統計的問題解決という言葉は使わずに単にパラメータ設計で済ませます.そうすると品質工学と何が違うのかと言う質問をときどき頂きます.
この質問に答えるとどうしても品質工学を否定するように捉えられてしまう恐れがあります.そこで,あまり具体的には踏み込まないで,最適化という山の頂上に登るのにそれぞれ別の登山口から異なった登山道を歩くようなものですとお答えすることにしています.基本的に好きなルートを採用すればいいのです.しかしながら,少なくとも私の知っている範囲では品質工学の登山道ではガイドを伴わない単独登頂での遭難事故が多発しています.
統計的問題解決と品質工学との違いは技術的にはいろいろとありますけれど,ここで少しだけドグマについてお話します.まず重要なこととして,品質工学は製品の源流に立ち戻るという基本思想からおわかりのようにメカニズムドリブンであるということです.これに対して統計的問題解決はデータドリブンです.品質工学が「かくあるべき」であるならば,統計的問題解決は「あるがまま」ということでしょうか.これらのドグマの違いはシステムの交互作用に対峙する姿勢の違いとなって表出します.即ち,品質工学では交互作用は潰すべき対象として邪魔者であるのに対し,統計的問題解決では交互作用は見出す対象であり,それはむしろ宝であると考えます.
更に,統計学を使うという姿勢にも違いがあります.品質工学は他の手法との比較が原則としてなされていないクローズな手法であるのに対し,統計的問題解決では最新の統計学の成果を積極的に利用します.例えば,決定的スクリーニング計画もそれが使える状況であればどんどん使うというオープンな手法です.オープンであるが故に事例ではケースバイケースの対応が可能で,これこれこういう場合にはこうしなければならないとは言えません.その点では品質工学のほうが初学者には入りやすいかもしれません.JMPのような多機能なソフトを必要としないのも品質工学の特徴ですが,わたしはこれはむしろデメリットと思っています.
このように統計的問題解決はオープンな手法ですから,より多くの技術者の皆さんと議論をし,手法の比較検討検討をして,より良い手法を開拓していく必要があります.今まで品質工学しかやったことがないという方にもせひ挑戦して頂きたいのです.そのための良い参考書が河村・高橋(2013)『統計モデルによるロバストパラメータ設計』,日科技連です.著者の一人の島根大学の河村先生は当時在籍なさっていた統計数理研究所のコラムで次のように書かれています.
品質工学会の会員の多くは、電気系・機械系・化学系などの実験系工学出身者であるため、統計学あるいは実験計画法をベースにデータ解析を行っている技術者は数少ない(日本の工学系の教育カリキュラムにSQC やタグチメソッドを導入している学科は極めて少ない)。そのため、学会発表では一方通行的なタグチメソッドを用いた成功事例が多く、他のデータ解析手法と比較検討した事例、失敗事例を別観点からの改善検討事例、またタグチメソッドの統計的観点による理論研究などの話題は少なく、これらは今後の課題となってくるであろう。(引用ここまで)
河村・高橋(2013)はこのために品質工学から統計モデリングによるロバストパラメータ設計(本書でいうロバスト最適化に限定した統計的問題解決)への橋渡しを意図して書かれています.この本の中では明示されていませんが,紹介されている事例の多くは品質工学の事例として有名なものでそれらをJMPを用いて最適していますが,実はJMP単独ではスクリプトを書くでもしないと困難なことがあって,アドインを用いています.HOPEアドインという名称で,『JMPではじめる統計的問題解決入門』でも言及しました.(因みに河村先生は別の書籍ではSRPDアドインという派生版を使っておられます.)近いうちにHOPEについてはこの場で紹介しますので,しばしお待ちください.

それではまた.
タグ:統計学
posted by Tad at 14:18| Comment(0) | TrackBack(0) | 統計的問題解決

2018年01月06日

訂正についてのお知らせ

新年早々になりますが,本書についていくつかご質問を頂いていますので,その結果判明しました一部の訂正も含めてお知らせします.

1.P105の曲面プロットのところで,このとおりにやってもデータテーブルが作成されないとのご質問がありました.ここに示した手順が不親切だったようです.計算式を入力した後に行メニューから「行の追加」を実施して出てきたウィンドウの「追加する行数」に100といれて『OK』してください.これで所望のデータ テーブルになります.もちろん,100回エンターして新規の行を作っていってもいいです.

2.P131の下から三つ目のJMPくんのセリフを「(前略)14と入力してから『計画の作成』を押すと計画が作成できるよ.そうしたら下にある『テーブルの作成』を押してみて.」と訂正いたします.この部分は当初計太くんとのやりとりが以下のように入っていました.

JMPくん「(前略)『計画の作成』を押してみて」
計太「これが計画なの?どこに実験データ入れればいいんだろ?」
JMPくん「一番下の『テーブルの作成』を押してみて.」

原稿のページ数圧縮のために,この部分を削除したのですが,前後の繋がりがおかしくなったままになっていました.

3.上記の例題では,p133の「検出力プロット」についてのご質問も頂いています.検出力はどの程度あればよいのかということで,簡単に言うと14実験のほうを採用してはダメなのかという質問です.検出力はそこにも書きましたようにその項の効果が存在するかについて検定した結果として得られています.ですからこの質問は帰無仮説の棄却を判断する基準としてp値=5%が妥当であるのかという疑問と根っこは同じです.一つの考え方として得られるであろうモデルの精度がコインを投げて決めるよりも大きくなければ実験計画の価値は低く,主効果であればやはり寄与率と同等にできれば70%程度以上の検出力は確保したいところです.とはいえ,「計画の比較」はあくまでも比較に用いるべきです.ここでは実験数を6増やすと格段に検出力が増加するという情報そのものが重要です.例題では示していませんが,15実験であれば検出力の増加はそれほど大きくはなりません.ここで重要なのが実験のコストです.統計モデルの精度即ち最適解の予測精度を得るためにどれだけのリソースが投入できるかで決定するのが現実的でしょう.
実験数の決定は検出力を見るよりも,最小実験数+αとした場合のαをもとに判断するした方が簡明なのでお奨めします.本書ではα=1を最小とすることを標準としましたが,できればα=4とするほうがベターです.それはなぜかと理解するにはF分布の自由度による関数形を知らなければならず,やはり統計的検定の原理に立ち入らなければならなりません.ここに簡単に書くのは大変というよりも舌足らずで誤解を招くといけないので,別の機会にでもお話しすることにします.

4.最後にp198のExcelファイルを変換するところで使う「既存データ.xlsx」はオーム社のサイトにアップして頂いたサポートファイルは修正前のバージョンであることが判明しました.実際にファイルを開いていただくとおわかりのように一番上の行に「列見出し」が記入されていません.ファイル更新のミスで次のタイミングでサポートファイルは差し替えを依頼することにしますが,既にダウンロードしてくださっている皆様には申し訳ないのですが,「既存データ.jmp」から実習をはじめていただければと思います.

5.本書の問題ではありませんが,オーム社のHPがリニューアルされたとのことで,今年からサポートファイルがダウンロードできるURLが変更になっています.既に本ブログの該当記事は修正入れていますが,あたらめてご注意をお願いいたします.

以上のように訂正させていただくとともに,わたしの不注意によりご迷惑をお掛けしましたことをお詫びいたします.

他にもご質問やご指摘ございましたら,このブログのコメントにご記入いただければ幸いです.コメントは私のところで一度止まりますので,公開を望まれない方はその旨お書きください.既に複数名の方からコメントをいくつか頂いているのですが,それらのコメントは公開していません.但し,質問等に回答を望まれるかたで,この場での公開返信を望まれない場合は,コメント入力フォームにメールアドレスを入れてくださるようにお願いいたします.

それでは本年もよろしくお願いいたします.
タグ:Q&A