UA-115498173-1

2018年01月20日

訂正のお知らせ

年末年始の休暇中に本書で勉強してくださった方から質問をいただいています.その中で明らかなミスがありましたのでご報告いたします.本書ではサポートファイルを用いてJMPを操作しつつ自習でき,そのことを類書と比較しての特徴の一つとして企画しました.読者に実習してもらうという形式を採用するにあたって,経験者からは問題点もコメントいただいていました.まず,誤魔化しがきかなくなるので校正が大変になるということ,そして読者のJMP操作のスキルによっては説明が不親切になりかねないということ.書籍ではマニュアルのように丁寧な操作手順を示すのには限界があります.それらを踏まえてもJMPの面白さは自分で手を動かさなければ伝わらないと考えた末にサポートファイルを準備しました.念を入れたつもりではありますが,いくつかの不備が(やはり)出てしまったことをお詫びいたします.

1.p202の「グラフビルダー」のグラフ
サンプルファイルを使うとこのグラフはこのようになりません.ここはデータを作るのにおそらく本書執筆で一番手間のかかったところです.試行錯誤でサンプルデータをつくる際に別バージョンのデータによるグラフと入れ替わってしまったようです.実際,計太くんが「収率で実験ブースの寄与があったのも気になるんだけど」と言ってますけれど,p200の「列の寄与」では「実験ブース」の寄与は「収率」「副生成物」ともに0となっています.
現在のサポートファイルからは「実験ブース」の寄与に関する部分は導出できません.サポートファイルをこのバージョンのものに入れ替えることは可能ですので,機会を見つけて差し替えたいと思います.とはいえ確認作業が必要ですので,しばらくお時間をいただければありがたいです.

2.p207の「EMPシステム分析」のグラフ
上記と全く同じ理由で,今のサポートファイルではこのグラフのようになりません.上記と同じく,ここは分析の流れだけを見て頂ければと思います.あまり重要な部分ではないのですが,サポートファイルの訂正も検討します.

3.p229の統子ちゃんのセリフ
「このように入力すればいいのね」ではなく,「このようにチェックを入れればいいのね」がより正確です.下の図では「触媒」「反応時間」がそれぞれ最低値に変更されていませんので.手順としてはチェックを入れた後に,それらの値を変更する必要があります.ちょっと紛らわしいですね.すいません.

もう一つ質問をいただいていますが,実は本日体調不良でして,続きは来週中ということにさせてください.

それでは.
posted by Tad at 12:14| Comment(0) | TrackBack(0) | お詫びと訂正

2018年01月13日

品質工学とパラメータ設計

今週は大雪の降る金沢にいっていました.以前米国の豪雪地域に住んでいたので,あの雪かきの苦労も身にしみていて雪には慣れているのですが,今回雪雷というのを初めて見ました.「鰤起こし」といってこの時期に富山湾の氷見鰤が捕れるのだとか聞いたことがありますが,あれがそうだったのでしょうか.関東で夏に発生する雷とは明らかに違うのは落雷の瞬間がとても明るいことです.日本海側で発生する雪雷は高度がとても低いからだそうです.
さて,今回は某所で統計的問題解決の触りをお話ししてきました.本書では統計的問題解決と名前をつけましたが,巷では使いにくい言葉です.漠然としていますし,先週お話ししたように,現状では統計という言葉の持つ意味についていろいろな捉え方があるからです.本書で呼ぶ統計的問題解決の実態は,実験計画によるデータから得た統計モデリングをベースとしたパラメータ設計にすぎません.本書ではワンワードで呼びたかったのでこのように命名しましたが,通常は統計的問題解決という言葉は使わずに単にパラメータ設計で済ませます.そうすると品質工学と何が違うのかと言う質問をときどき頂きます.
この質問に答えるとどうしても品質工学を否定するように捉えられてしまう恐れがあります.そこで,あまり具体的には踏み込まないで,最適化という山の頂上に登るのにそれぞれ別の登山口から異なった登山道を歩くようなものですとお答えすることにしています.基本的に好きなルートを採用すればいいのです.しかしながら,少なくとも私の知っている範囲では品質工学の登山道ではガイドを伴わない単独登頂での遭難事故が多発しています.
統計的問題解決と品質工学との違いは技術的にはいろいろとありますけれど,ここで少しだけドグマについてお話します.まず重要なこととして,品質工学は製品の源流に立ち戻るという基本思想からおわかりのようにメカニズムドリブンであるということです.これに対して統計的問題解決はデータドリブンです.品質工学が「かくあるべき」であるならば,統計的問題解決は「あるがまま」ということでしょうか.これらのドグマの違いはシステムの交互作用に対峙する姿勢の違いとなって表出します.即ち,品質工学では交互作用は潰すべき対象として邪魔者であるのに対し,統計的問題解決では交互作用は見出す対象であり,それはむしろ宝であると考えます.
更に,統計学を使うという姿勢にも違いがあります.品質工学は他の手法との比較が原則としてなされていないクローズな手法であるのに対し,統計的問題解決では最新の統計学の成果を積極的に利用します.例えば,決定的スクリーニング計画もそれが使える状況であればどんどん使うというオープンな手法です.オープンであるが故に事例ではケースバイケースの対応が可能で,これこれこういう場合にはこうしなければならないとは言えません.その点では品質工学のほうが初学者には入りやすいかもしれません.JMPのような多機能なソフトを必要としないのも品質工学の特徴ですが,わたしはこれはむしろデメリットと思っています.
このように統計的問題解決はオープンな手法ですから,より多くの技術者の皆さんと議論をし,手法の比較検討検討をして,より良い手法を開拓していく必要があります.今まで品質工学しかやったことがないという方にもせひ挑戦して頂きたいのです.そのための良い参考書が河村・高橋(2013)『統計モデルによるロバストパラメータ設計』,日科技連です.著者の一人の島根大学の河村先生は当時在籍なさっていた統計数理研究所のコラムで次のように書かれています.
品質工学会の会員の多くは、電気系・機械系・化学系などの実験系工学出身者であるため、統計学あるいは実験計画法をベースにデータ解析を行っている技術者は数少ない(日本の工学系の教育カリキュラムにSQC やタグチメソッドを導入している学科は極めて少ない)。そのため、学会発表では一方通行的なタグチメソッドを用いた成功事例が多く、他のデータ解析手法と比較検討した事例、失敗事例を別観点からの改善検討事例、またタグチメソッドの統計的観点による理論研究などの話題は少なく、これらは今後の課題となってくるであろう。(引用ここまで)
河村・高橋(2013)はこのために品質工学から統計モデリングによるロバストパラメータ設計(本書でいうロバスト最適化に限定した統計的問題解決)への橋渡しを意図して書かれています.この本の中では明示されていませんが,紹介されている事例の多くは品質工学の事例として有名なものでそれらをJMPを用いて最適していますが,実はJMP単独ではスクリプトを書くでもしないと困難なことがあって,アドインを用いています.HOPEアドインという名称で,『JMPではじめる統計的問題解決入門』でも言及しました.(因みに河村先生は別の書籍ではSRPDアドインという派生版を使っておられます.)近いうちにHOPEについてはこの場で紹介しますので,しばしお待ちください.

それではまた.
タグ:統計学
posted by Tad at 14:18| Comment(0) | TrackBack(0) | 統計的問題解決

2018年01月06日

訂正についてのお知らせ

新年早々になりますが,本書についていくつかご質問を頂いていますので,その結果判明しました一部の訂正も含めてお知らせします.

1.P105の曲面プロットのところで,このとおりにやってもデータテーブルが作成されないとのご質問がありました.ここに示した手順が不親切だったようです.計算式を入力した後に行メニューから「行の追加」を実施して出てきたウィンドウの「追加する行数」に100といれて『OK』してください.これで所望のデータ テーブルになります.もちろん,100回エンターして新規の行を作っていってもいいです.

2.P131の下から三つ目のJMPくんのセリフを「(前略)14と入力してから『計画の作成』を押すと計画が作成できるよ.そうしたら下にある『テーブルの作成』を押してみて.」と訂正いたします.この部分は当初計太くんとのやりとりが以下のように入っていました.

JMPくん「(前略)『計画の作成』を押してみて」
計太「これが計画なの?どこに実験データ入れればいいんだろ?」
JMPくん「一番下の『テーブルの作成』を押してみて.」

原稿のページ数圧縮のために,この部分を削除したのですが,前後の繋がりがおかしくなったままになっていました.

3.上記の例題では,p133の「検出力プロット」についてのご質問も頂いています.検出力はどの程度あればよいのかということで,簡単に言うと14実験のほうを採用してはダメなのかという質問です.検出力はそこにも書きましたようにその項の効果が存在するかについて検定した結果として得られています.ですからこの質問は帰無仮説の棄却を判断する基準としてp値=5%が妥当であるのかという疑問と根っこは同じです.一つの考え方として得られるであろうモデルの精度がコインを投げて決めるよりも大きくなければ実験計画の価値は低く,主効果であればやはり寄与率と同等にできれば70%程度以上の検出力は確保したいところです.とはいえ,「計画の比較」はあくまでも比較に用いるべきです.ここでは実験数を6増やすと格段に検出力が増加するという情報そのものが重要です.例題では示していませんが,15実験であれば検出力の増加はそれほど大きくはなりません.ここで重要なのが実験のコストです.統計モデルの精度即ち最適解の予測精度を得るためにどれだけのリソースが投入できるかで決定するのが現実的でしょう.
実験数の決定は検出力を見るよりも,最小実験数+αとした場合のαをもとに判断するした方が簡明なのでお奨めします.本書ではα=1を最小とすることを標準としましたが,できればα=4とするほうがベターです.それはなぜかと理解するにはF分布の自由度による関数形を知らなければならず,やはり統計的検定の原理に立ち入らなければならなりません.ここに簡単に書くのは大変というよりも舌足らずで誤解を招くといけないので,別の機会にでもお話しすることにします.

4.最後にp198のExcelファイルを変換するところで使う「既存データ.xlsx」はオーム社のサイトにアップして頂いたサポートファイルは修正前のバージョンであることが判明しました.実際にファイルを開いていただくとおわかりのように一番上の行に「列見出し」が記入されていません.ファイル更新のミスで次のタイミングでサポートファイルは差し替えを依頼することにしますが,既にダウンロードしてくださっている皆様には申し訳ないのですが,「既存データ.jmp」から実習をはじめていただければと思います.

5.本書の問題ではありませんが,オーム社のHPがリニューアルされたとのことで,今年からサポートファイルがダウンロードできるURLが変更になっています.既に本ブログの該当記事は修正入れていますが,あたらめてご注意をお願いいたします.

以上のように訂正させていただくとともに,わたしの不注意によりご迷惑をお掛けしましたことをお詫びいたします.

他にもご質問やご指摘ございましたら,このブログのコメントにご記入いただければ幸いです.コメントは私のところで一度止まりますので,公開を望まれない方はその旨お書きください.既に複数名の方からコメントをいくつか頂いているのですが,それらのコメントは公開していません.但し,質問等に回答を望まれるかたで,この場での公開返信を望まれない場合は,コメント入力フォームにメールアドレスを入れてくださるようにお願いいたします.

それでは本年もよろしくお願いいたします.
タグ:Q&A
posted by Tad at 12:43| Comment(0) | TrackBack(0) | お詫びと訂正

2017年12月30日

統計とは

問題解決のコンサルテーションをしていて,ときどき統計をお教えすることもあります.統計は知らなくても問題解決できるという考えには変わりはありませんが,統計を知っていればより深いレベルで問題解決に挑めるのは間違いありません.そのときに必要になるのは良い教科書ですが,技術者に使える統計を教えたいというわたしの目的に合うものがなかなか見つからずに困っています.
多くの企業で実施されている社内教育ではパワーポイントの資料(あるいはそれを製本したもの)で済ませることがほとんどですが,これでは生徒の予習,復習ができません.良い大学の授業では,(基本はその先生がお書きになった)教科書があって,それを生徒が読んでいるという前提でパワーポイントを使って(あるいは今でも板書して)講義が進められます.パワーポイントには教科書と同じことを書くのではなく,それの理解を深めるような内容でなければ生徒は授業に興味を失ってしまいます.ですから教科書は適度に難しいことも重要です.しかしながら,これは学生相手だからなのであって,一般の技術者には「限られた学習時間で」という制約があることも考慮しなければなりません.
そこでここ数ヶ月,わたしの求める良い教科書を探して統計の本を洋書和書かまわずに手当たり次第に読んでいます.その中で気づいたことがあって,統計とは何かについての説明がそれぞれの本で微妙に異なっているのです.比較的難易度が低い和書でいくつか紹介しますと,例えば栗原伸一他(2017)『統計学図鑑』,オーム社,では「統計学とは,データを統計量(平均など)や図・表にまとめて,その特徴をとらえる学問です(p2)」という統計は手法であるという立場ですが,同じ著者でも,栗原伸一(2017)『入門統計学』,オーム社では「実験や調査を行って得られたなんらかの数値データを統計と呼ぶ(P2)」と書かれていて,こちらではデータそのものが統計という見方です.続けると,小島寛之(2006)『完全独習 統計学入門』,ダイヤモンド社,では「「生の現実」から,何かその分布の特徴や癖を引き出すための手法(p17)」と『統計学図鑑』と同じく統計とは手法であると書かれています.涌井良幸他(2015)『統計学の図鑑』,技術評論社,では「ある集団についての傾向や特徴を知るために「観測」したり,「調査」をしたり,実験した結果を「数字」や「文字」でまとめたものを統計と呼びます(p10)」と統計とはデータそのものであるという説明です.林雄亮他(2017)『SPSSによる実統践計分析』,オーム社,には「社会科学(特に社会学)における統計分析には,関心のある社会現象の「記述」と「説明」という二つのねらいがある(p3-4)」という趣旨のことが書かれています.この本は社会科学系の統計を解説している本なので社会現象と限定していますが,これを自然現象と言い換えても良いと思います.
わたしが思っている統計に一番しっくりくる説明は青本として有名な,東京大学教養学部統計学教室編(1992)『自然科学の統計学』,投稿大学出版会,の序文にあります.そこには「統計学とは何かということについては,昔からいろいろ面倒な議論がある」と書かれていて,その上で「簡単にいえば,それは数字データというものを,どのように分析し,どのような判断をくだしたらよいかを論ずる学問であるといってよい」とあります.
このようないろいろな統計の捉え方があって,それらのどれもが間違いではありません.とはいえ,この状況は「群盲像を触る」というインドの寓話を思い出させます.昔インドの6人の盲人が像のそれぞれ異なった部位を触って,それぞれ樹木の幹(足)や大蛇(鼻)のようなものだと主張したというお話はご存知でしょう.この話は学生時代に勉強したDavid Bohm(1989),“Quantum Theory”,でも(7人の盲人が鼻はロープで足は木と,細部は微妙に異なっていましたが)光の定義にこの寓話が引かれていて,Can we find a single concept that will unify our different experiences with light?と問いかけるフレーズを鮮明に覚えています.
今改めて,Can we find a single concept that will unify our different experiences with statistics?と思うのです.上述したそれぞれの統計のイメージは間違いではありませんが,わたしには何か物足りない気がしています.統計現象の観察,記録である数値を統計情報に変換して,それをもとに意思決定をくだし,それに従って行動する,この一連の流れすべてが統計であり,それを研究する学問が統計学ではないでしょうか.
残念ながら,青本の中身は序文と少し乖離していて,必ずしもこの流れに沿った本ではないことと,(赤本同様に)扱っている範囲が広く,何よりもこの本は東大生の教科書ですから,1コマとして年間30回の講義によるサポートを受けられない一般の技術者には敷居が高いのも事実です.洋書にはいくつか良い本があるのですが,自分の専門分野でもない英語の本を昨今の技術者に読めというのも現実的ではありません.良い教科書探しをこの年末年始に続けます.その結果次第ではありますが,本書の執筆で懲りてはいるのですが,自ら執筆することも検討するかもしれません.
それでは皆様良いお年をお迎えください.
タグ:統計
posted by Tad at 12:29| Comment(0) | TrackBack(0) | 統計教育

2017年12月23日

Global OptimizationとTotal Optimization

先日のSUMMITでの発表についてのアンケート結果をSAS社からフィードバックしていただきました.少々詰め込みすぎた内容で皆様にうまく伝わったかを心配していましたが,思ったよりも好意的な反応を頂けたようで安心しました.ほとんどのコメントが「解から理解へ」というメッセージに言及してくださっていて,多くの皆様に賛同して頂けたことが何よりも嬉しいですね.
頂いたコメントを拝見して,Global OptimizationとTotal Optimizationとについての違いを(おそらく)意識していない方がおられることに気づきました.わたしの発表でもここらへんについては曖昧でしたし,巷でも厳密に両者を使い分けるケースはむしろ稀です.ですが,異なる意味を持つ概念に異なる言葉をつける必要があるのは「可視化」と「視覚化」との使い分けが必要なのと同じことです.そこで,この場で今一度説明します.
まずは言葉を定義します.単一の最大値や最小値が存在する同じ実験空間内のシステムが複数寄せ集まった拡大システムを考えます.この拡大システムは個々のシステムの実験空間の拡張空間になります.英語では前者をLocal System,後者をGlobal Systemと呼び,このときのそれぞれのシステムの最適化をLocal Optimization,Global Optimizationと定義します.厳密にはLocal Systemには単一の極大点が内包されていると考えていいでしょう.
ここまでは明快なのですが,これを日本語に訳すときに混乱が生じます. Localを局所的とするのはいいとして,Globalを全体と訳すとこの後でお話しするTotal Optimizationとの区別がつきにくくなってしまいます.そこでGlobalには大域的という訳をあてます.この日本語訳であればLocalとGlobalとでは基本的に同質の実験空間に存在するものということが明確になります.
一方,異質なシステムが寄せ集まった複合システムを考え,それらの最適化も考えられます.例えば,紙ヘリコプターを例にとると,紙ヘリコプターの製造メーカーが材料の紙の製造も一緒にしているとします.このとき,飛行時間の最適化の設計因子の一つである紙の厚みは紙の製造工程の特性(の一つ)になります.ですから,このメーカーが紙ヘリコプターの設計と紙の製造工程を総動員して目指す最適化が全体最適化で,英語ではTotal Optimizationとなります.個別のシステムの最適化はいわゆる普通の最適化なので特定の名称はついていませんが,全体最適化を意識して部分最適化あるいは個別最適化と呼ぶことがあります.部分最適化を英語に訳すとPart Optimizationになるのでしょうか.聞いたことはありませんけど.
実験空間と抽象化すると大域的最適化も全体最適化も同じことをしているにすぎませんが,重要なことは大域的最適化では同じ特性が隅々まで行き渡っているのに対し,全体最適では様々な特製のごった煮であるということです.別の見方をすると大域的最適化は全体最適化の一つであるということもできます.
大域的最適化はCAEソルバーによるシミュレーション実験と相性が良く,最適化ソフトと連成してGA(遺伝的アルゴリズム)法やSA(シミュレーテッド アニーリング:焼きなまし)法,粒子群法などの各種アルゴリズムで最適化を目指します.これが実実験の場合となると山あり谷ありの地形を探検するようなもので,真の最適化に辿り着くのはなかなか困難です.ここでものを言うのが技術者の勘と経験です.
一方,全体最適ではそれを支配するモデル式を作成するために最大の問題となるのが壁の存在です.例えば一つの企業をシステムと捉えれば,企業内にはそれぞれ異なったミッションを持つ組織が個別システムとして共存しています.それぞれのシステムの最終的なゴールは共有されているものの,ときとして利害が対立することがあります.全体システムで収益や顧客満足度の最大化を目指すには,個別システムの最適化に先駆けてそれらの利害関係を調整することが必須なのです.この調整に必須となるのが交渉です.このことは一般的な製品や製造工程のシステムでも同じことです.この場合の交渉を本書では技術的交渉と呼びました.
勘と経験それに交渉といった人間固有の能力が必要になることがとても興味深いですね.統計的問題解決ではこれら人間固有の能力に頼るのではなく積極的に活用するという立場です.
それではまた.
タグ:問題解決
posted by Tad at 13:10| Comment(0) | TrackBack(0) | 統計的問題解決