2017年09月02日

書店にて

サポートファイルのダウンロードのご案内が流れてしまわないようにブログの更新は控えていました.ここにもう一度書いておきます.

サポートファイルとMCDAアドインのダウンロードについては「ファイル・ダウンロード」のカテゴリーの記事を御覧ください.

さて,先日のことですが,三井正(2017)『JMPではじめる 統計的問題解決入門』オーム社が書店にあるのを見かけました.印刷所,運送会社,書籍卸,そして書店の皆様,多くの人の手でこの棚に置かれていることを素直にありがたいと思いました.統計ソフトのコーナーにはSPSSやRあるいはEXCELの本などが並んでいて,比較的大きなお店なのですが,その中でJMPの本は私のもの以外には下記の2冊のみでした.
内田治(2015)『JMPによるデータ分析(第2版)』東京図書
田久浩志,小島隆矢,林俊克(2006)『JMPによる統計解析入門』オーム社
前者は第1版が私の書棚にあります.どちらかといえばJMPのマニュアル本として書かれているようなので,ある程度JMPを知っている方には物足りないかもしれません.田久先生の本も2002年の第1版第1刷を持っています.例題がプランニングとかマーケティングに取られているので今一つ技術者向けとしてはピンとこなかったと言うのが正直なところですが,当時はこれ以外にJMPについての書籍はほとんどなかったように思います.
書店に行ってこれらの本と並んでいる自分の本を手に取ると,自分が書いた本とはいえ不思議と客観的に評価していることに気づきます.この本を買う価値があるか,自分に合っているか...文字が少し小さめで詰まっているな.これは好み.マンガがあって易しいようには見えるけれど中はどうだろう.他の本とは違ってJMPの操作は手取り足取りという感じではないけれど,JMP操作は一通りは知っているからそれでもいいかな.内容はちょっと変わったことが書いてある.統計の本というわけではなさそうだ,そういえば統計的問題解決ってなんだろう...等々.
はい,少なくともJMP操作については親切な本ではありませんことは自覚しています.ですが,例えば上の内田先生の本(第1版)では仮説検定で締めくくられていて,そこからリレーでその先を技術者向けに解説する本があっても良いのではないかと考えました.JMP操作を含め,統計学としての初歩を解説したこれらの本があるのですから,屋上屋を課すのは誰のためにもなりません.
その書店には他にも医学コーナーに以下の2冊がありました.
内田治,平野綾子,石野祐三子(2012)『JMPによる医療系データ分析』東京図書
長田理(2016)『JMP医学統計マニュアル』オーエムエス出版
前者は先ほどと同じ著者によるもので,医療系に関連深いJMPの機能はこちらの本で解説されているようです.日本ではページ数が厚い本は売れないとのことなので,2冊に分けたのでしょうか?こちらでは実験計画についても簡単に説明されていたりします.後者はStatViewで有名な長田先生の本です.(そういえば内田先生もSPSSの本を書かれています.)MacユーザーとしてStatViewにもお世話になりました.1冊だけ本を持っていたのですが,時代からおそらく長田先生の本ではなかったかと思っています.こちらはマニュアルと題していても(JMPの)マニュアル本ではなくJMPを使った検定手法等をはじめとする医学(医療)統計のマニュアルという構成です.医学統計の論文を読む(書く)のであれば,最低限これだけは知っておいて欲しいというスタンスで書かれた本だと思います.従って,実験計画についてはサンプルサイズや検出力についての関連したことが解説されているだけなので,技術者向けには少々物足りないのは致し方ありません.長田先生の本は内容が濃いのですけれど,私には医学統計は向かないということがよくわかりました.数多ある検定の種類を使い分けることは医学統計では必須のようですが,今のわたしには必要ありません.
医学統計という独立した名称が確立していることからも明らかなように,統計学の位置付けは医学と工学とにおいて異なっています.因みに工業統計という用語は存在しますが,その意味するところは工業に関する数値データを示しています.この違いはどこから来るのでしょうか?医学というのは基本的に対象が人間という限定されたシステムであり,固有の知見も確立されているので,手法の使い分けが(比較的)しやすいという状況もあるでしょう.一方,技術分野ではそもそも何をシステムと置くのかという問題が真っ先にあって,検定手法の使い分けまで気が回らないという言い訳もできます.とはいえ,一番の違いは(一部を除き)工学分野では統計で情報を伝達するという文化が医学に比べて圧倒的に遅れているからと私は考えます.
まだ出版されて間もないので,しばらくしたらもう少し実のあることを書きます.それではまた.

2017年08月25日

サポートファイルのダウンロード

『JMPではじめる統計的問題解決入門』で使用するサポートファイルのダウンロードについてお知らせします.

サポートファイルはなくても本書をお読みいただくことはできますが,実際にJMPを操作することで言葉ではお伝えし切れていないことも理解しやすいでしょう.また,JMPのグラフやレポート等も本書の白黒画像と異なり実際にカラーの画面を見ていただいた方が格段にわかりやすいはずです.サポートファイルのほとんどはJMPテーブルですが,一部エクセルやその他の種類のものもあります.合計でファイル数が55になるので,読者の便を考えて講毎にフォルダーに収めたものを一つの圧縮ファイルとして提供します.個々のファイルの内容については本書を参照してくださるとして,補足的な説明は今後このブログにアップしていく予定です.ファイルのダウンロードに際して,幾つかご了承いただきたいことがあります.

ファイルのダウンロードに際しての注意

ファイルのダウンロードは本書購入者に限定させていただく取り決めとなっていますことをご了承ください.会社等で購入された場合でも,代表者1名のみがファイルをダウンロードできます.ダウンロードしたファイルは配布不可ですけれども,代表者のPCの画面をプロジェクターで映したり,共有したりして複数人で一緒に議論しながら実習していただくことは可能です.

免責事項について

ファイルをダウンロードした時点で,次の免責事項を了承したものとみなします.
「サポートファイルをダウンロード及び利用したことに起因する直接的及び間接的ないかなる損害についても筆者は一切の責任を負わないものとします.」

サポートファイルの著作権について

サポートファイルの著作権は著者に属します.本書の読者の自習用途以外のいかなる利用,及び改編や再配布を禁止させていただきます.また,本書中でも示しているように,一部のファイルはJMPのサンプルファイルを参考に作成したもので,オリジナルのサンプルファイルの著作権はSAS Institute Japan INC.に属するものです.その他,大阪市の区域シェープファイルとしてマップナビおおさかオープンデータCC(クリエイティブコモンズ)ライセンスにおけるCC-BYで提供されているデータを利用しました.

ファイルのダウンロード及び利用に際し,上記の注意及び免責事項と著作権についてご了承いただける場合のみ,下記からサポートファイルをダウンロードしてください.ファイルをどこに置くかは色々と迷いました.当初はGoogle Driveにファイルを置くことを検討しましたが,会社からですとアクセスできないというような状況も考えられるので,当面の間はオーム社のサイトにファイルを置かせていただくことにしました.

オーム社の 書籍連動/ダウンロードサービス

2017年08月24日

MCDAアドインのダウンロードについて

本日は本書専用のJMPアドインのダウンロードについてお知らせします.このJMPのアドインはMCDAアドインという名称で,今回初めて一般に公開されるものです.開発の経緯については後日このブログでお話しします.
先日お知らせしたサポートファイルと異なり,このアドインはSAS社の要望もあって,SAS社の専用ページからダウンロードしていただきます.その際にSAS社の規定のフォームに幾つかの情報を入力していただく必要があります.アドインの配布をしている他の書籍でも同様な方法をとっており,この点についてご了承いただければありがたいです.

ダウンロードはここからどうぞ.
MCDAアドインの申し込みページ(SAS社のサイトに飛びます.)

2017年08月19日

見本刷り

本日見本刷りが自宅に届きました.印刷の乾き具合が天候の影響を受けるのだとか聞いていましたが,予定通りに無事出来上がったようです.パラパラとめくったところでは大きな問題はなさそうです.チェックを漏れてしまったミスもあるかと思いますので,なにか見つけたらこのブログで訂正します.ついでなので,,本書の目次を以下に紹介します.

第1講 JMP ではじめる―20% でもこれだけできる
1.1 準備する
1.2 メニューを眺める
1.3 使ってみる
1.4 用語について
第2講 JMP で分析する―データから発見する
2.1 データの下ごしらえをする
2.2 データを吟味する
2.3 データを概観する
2.4 データを探る
2.5 データの規則を発見する
2.6 データを見せる
第3講 JMP で問題解決する―統計的問題解決とは?
3.1 統計的問題解決の背景
3.2 実験計画を立てる
3.3 モデリングする
3.4 最適化する
第4講 JMP で実戦に挑む―統計的問題解決の実際
4.1 統計的問題解決の手引き
4.2 演習 化合物合成工程の最適化
第5講 JMP でイノベーションを目指す―KKD からサイエンスへ
5.1 意思決定する
5.2 壁を越える

第1講と第2講とでは,統計的問題解決の準備段階で使うJMPのデータ分析機能がテーマです.更に,第3講では統計的問題解決に必須なJMPの機能の解説に重点を置きます.第4講で「統計的問題解決の手引き」を示し,それを基にした例題を実習します.第5講では,統計的問題解決の高度な応用例を示しています.この講は少しだけ他よりも内容が難しいかもしれません.入門と銘打っているので,編集段階でこの部分を割愛してビッグデータ関連の講と差し替えることも考えましたが,悩んだあげく,入門者が目指す最高峰を示すのも入門書の役目と考え,敢えて残しました.
ページ数の関係で説明も急ぎ足になっていますので,必要な皆様には何らかの形でこの部分を補足説明する予定でいます.今考えているのはSAS社との共催で,問題解決ゼミのようなものを開催することです.更に,JMPer’s Meetingとして本書の出版記念セミナーも開催していただけくことになっていて,その場でも第5講に関して実演して補足説明する予定です.オフサイトミーティングもして頂けるとのことで今から楽しみにしています.このセミナーについては詳細を後日このブログに載せます.

それではまた.
タグ:JMP

2017年08月17日

使うための統計とは

昨日に続いての呟きです.
本書のタイトルには統計的とついているので,統計が勉強できると思った人は当てが外れたら申しわけないと思っています.「統計を知らなくても,統計を使って問題解決に挑もう」という趣旨で書いた本なので,統計の説明はしていません.統計学を勉強するには時間も労力も費やさなければならないのは他の学問と同じです.統計学を日常的に使う必要のある医療関係やデータ分析関連の業務に従事されている方々であれば,それは必要なことと諦めるしかありません,しかしながら,本書が対象としている一般の技術分野の皆さんには,最初に統計学の勉強に取り組むことで息切れしてしまい,本業の勉強が疎かになったり肝心の問題解決に十分なリソースを投入できないという状況は避けてほしいのです.
それは山登りで例えるならば,アプローチ(交通機関から登山口までの行程)で体力を費やしてしまい,登頂を断念するようなものです.駅から登山口まではスニーカーで歩き,そこで登山靴に履き替えれば,登山するための体力が温存できます.問題解決という山に登る場合でも,できるだけアプローチを楽にするためにJMPを使って技術者のリソースを温存するというのが本書の提案なのです.ですから,統計を最初から説明すると,いたずらに読者の消耗を招き,本末転倒になってしまうということを懸念していました.
もちろん医療関係者に限らず,誰にとっても統計学の勉強は投資に見合うので,JMPで統計を勉強することに価値はあります.多くの書籍がありますが,いずれも統計が目的になっている視点で書かれているようです. 一方で,統計(という道具)を使うことを目的とした書籍は(少なくとも技術者向けには)そう多くはないように思えました.『JMPではじめる統計的問題解決入門』を執筆したというのはこのような理由からです.
例をあげます.以下では既に問題がきちんと定義されているものとします.例えば,カスタム計画を使って製品を最適化するには,JMPとその最低限の操作を覚えさえすれば,実験のリソースと既存の知見さえあれば十分です.どこにも統計は出てきませんし,全く統計を知らなくても問題解決は可能です.問題によっては平均とか分散といった初歩の概念は知っておいたほうが無難ですが,それさえ知らずとも問題解決できる可能性があります.本書に書いたように,カスタム計画の実験数は「最小実験数」に最低でも1を加えたものという決まりを知っていさえすれば,既存の知見をもとに実験計画が作成でき,その実験データをもとに問題を解くことができます.ここまでは,統計はJMPの処理アルゴリズムの中にあるものの,おもてには出てきません.ところが,ある程度上級者になってくると,何故+1なのかと疑問を抱くようになります.この疑問に答えるのが統計学なのです.
「モデルのあてはめ」でのパラメータ推定の検定における誤差の自由度を考慮しなければならないため,というのがその答えです.JMPの提示する最小実験数で実験すると誤差の自由度は0になってしまいます.シミュレーション実験ではない一般の実験ではデータには必ずばらつきがあるので,この状況では(方程式の数が少なくて)パラメータ推定の計算ができません.それでは+1でいいのかというと,自由度3以上でF分布に極値が出現するため,統計学的には+4が望ましいと言われています.根拠は定かでないのですが,+6とする先生もいらっしゃると聞きました.もちろん実験数は多ければそれに越したことはありませんが,簡単に実験数を増やせない状況も多々あります.統計学はその実験がどれだけ大変なことなのかとか実験に許されているリソースを知りません.最適化の結果によって得られるコストが実験のコストを上回るくらいなら,何もしない方がマシかもしれません.実験数は統計学だけでは決められないのです.そこで+1から始めてJMPの「計画の評価」をもとに横目で実験のリソースを睨みながら落とし所を見つけるというのが本書で提案している手法です.ここには(少なくとも表だっては)統計は出てきません.
いずれにしても,必要な実験数を統計学として理解するには,確率分布から始めてF分布から検定へと勉強しなければならず,勉強し終わる頃には今起こっている問題が手遅れになるかもしれません.私が実験計画で問題を解決することを優先し,統計の勉強は必要になった時点でもいいのではないかと考えるのはこのような理由からです.仮に余分なリソースがあったとしても,自らの専門分野の勉強を優先するほうが賢いでしょう.統計を知らないと,とんでもない結果を出してしまいかねないと危惧される方もおられるかもしれませんが,実戦的な実験計画ではその結果の信頼性の検証というセーフティネットが控えているので安心です.
但し,医療関係の分野では事情は少々異なります.それはこの分野では統計学が共通言語として確立されているので,それを知らないとレポートが書けないどころではなく,論文の一つも読めないからです.更には,一般の技術分野と異なって医療分野では実験計画という実戦的な手法が比較的採用しにくいという事情も関係あるかもしれません.再現実験というセーフティネットがなければ結果の信頼性は統計学に頼るしかありませんから.SASの本ですが,大橋渉(2012)『統計を知らない人のためのSAS入門』オーム社という書籍があります.本書の企画段階で出会った本で,統計を知らない人のためのとあるので,興味を惹かれて読んでみました.冒頭のマンガで主人公が先輩に「あなたは正しく統計学を理解したうえで,SASの使い方を学んだほうがいいわ」と言われます.やはりSASを使って統計を知らない人が統計を勉強するための本なのでした.SASのユーザー事例によると著者は東京医科歯科大学にいらっしゃる医療分野の先生だそうです.やはり医療分野においては統計学というのは始めに統計ありきとして必須のものなのでしょう.
他にもAmazonで「JMP」をキーにして検索するといろいろな書籍が出てきます.例えば,長田理(2016)『JMP医学統計マニュアル』星雲社内田治,石野祐三子,平野綾子(2012)『JMPによる医療系データ分析』東京図書がJMPの本で売れているようですが,両方とも医療関係者を対象として書かれた本です.そういえば,今年のDSJ(Discovery Summit Japan)でも医療関係の発表が多いのです.産業分野からの発表をもっと期待したいのですが,本書を読んで出した結果を発表してくださる方がいらしたら嬉しいのですけれど.

それでは.