2017年08月21日

サポートファイルのダウンロードについて

『JMPではじめる統計的問題解決入門』の発売日も迫ってきたので,サポートファイルのダウンロードについてお知らせします.当初はオーム社に著者ページを作っていただいてそこからダウンロードしていただくことを考えていたのですが,後々のファイルの修正に対応しやすいように,ファイルはGoogleドライブに置いて,このブログからリンクを貼ることにしました.念のため,オーム社の方にもバックアップとしてファイルを置かせていただくことにしました.従って,サポートファイルは次の二箇所からダウンロードできます.

1.著者のGoogle Drive
2.オーム社のサイト(本書発行予定の8/24以降に外部からのアクセスが可能となります.)

今後サポートファイルは改良される可能性もあります.その際,オーム社のサイトの方の更新は遅れることもあるので,基本的にGoole Driveからダウンロードしてください.サポートファイルのほとんどはJMPテーブルですが,一部エクセルやその他の種類のものもあります.合計でファイル数が55になるので,読者の便を考えて講毎にフォルダーに収めたものを一つの圧縮ファイルとして提供することにしました.個々のファイルの内容については本書を参照してくださるとして,補足的な説明は今後このブログにアップしていく予定です.ファイルの利用に際し,下記の免責事項と著作権についてのご了承いただけましたら幸いです.

免責事項について

ファイルをダウンロードした時点で,以下の免責事項を了承したものとみなします.サポートファイルをダウンロード及び利用したことに起因する直接的及び間接的ないかなる損害についても筆者は一切の責任を負わないものとします.

サポートファイルの著作権について

サポートファイルの著作権は,オリジナルのJMPテーブルについては著者に属します.本書の読者の自習用途以外のいかなる利用,及び改編や再配布を禁止させていただきます.また,本書中でも示しているように,一部のファイルはJMPのサンプルファイルを参考に作成したもので,オリジナルのサンプルファイルの著作権はSAS Institute Japan INC.に属するものです.その他,大阪市の区域シェープファイルとしてマップナビおおさかオープンデータCC(クリエイティブコモンズ)ライセンスにおけるCC-BYで提供されているデータを利用しました.
【ファイル・ダウンロードの最新記事】

2017年08月19日

見本刷り

本日見本刷りが自宅に届きました.印刷の乾き具合が天候の影響を受けるのだとか聞いていましたが,予定通りに無事出来上がったようです.パラパラとめくったところでは大きな問題はなさそうです.チェックを漏れてしまったミスもあるかと思いますので,なにか見つけたらこのブログで訂正します.ついでなので,,本書の目次を以下に紹介します.

第1講 JMP ではじめる―20% でもこれだけできる
1.1 準備する
1.2 メニューを眺める
1.3 使ってみる
1.4 用語について
第2講 JMP で分析する―データから発見する
2.1 データの下ごしらえをする
2.2 データを吟味する
2.3 データを概観する
2.4 データを探る
2.5 データの規則を発見する
2.6 データを見せる
第3講 JMP で問題解決する―統計的問題解決とは?
3.1 統計的問題解決の背景
3.2 実験計画を立てる
3.3 モデリングする
3.4 最適化する
第4講 JMP で実戦に挑む―統計的問題解決の実際
4.1 統計的問題解決の手引き
4.2 演習 化合物合成工程の最適化
第5講 JMP でイノベーションを目指す―KKD からサイエンスへ
5.1 意思決定する
5.2 壁を越える

第1講と第2講とでは,統計的問題解決の準備段階で使うJMPのデータ分析機能がテーマです.更に,第3講では統計的問題解決に必須なJMPの機能の解説に重点を置きます.第4講で「統計的問題解決の手引き」を示し,それを基にした例題を実習します.第5講では,統計的問題解決の高度な応用例を示しています.この講は少しだけ他よりも内容が難しいかもしれません.入門と銘打っているので,編集段階でこの部分を割愛してビッグデータ関連の講と差し替えることも考えましたが,悩んだあげく,入門者が目指す最高峰を示すのも入門書の役目と考え,敢えて残しました.
ページ数の関係で説明も急ぎ足になっていますので,必要な皆様には何らかの形でこの部分を補足説明する予定でいます.今考えているのはSAS社との共催で,問題解決ゼミのようなものを開催することです.更に,JMPer’s Meetingとして本書の出版記念セミナーも開催していただけくことになっていて,その場でも第5講に関して実演して補足説明する予定です.オフサイトミーティングもして頂けるとのことで今から楽しみにしています.このセミナーについては詳細を後日このブログに載せます.

それではまた.
タグ:JMP

2017年08月17日

使うための統計とは

昨日に続いての呟きです.
本書のタイトルには統計的とついているので,統計が勉強できると思った人は当てが外れたら申しわけないと思っています.「統計を知らなくても,統計を使って問題解決に挑もう」という趣旨で書いた本なので,統計の説明はしていません.統計学を勉強するには時間も労力も費やさなければならないのは他の学問と同じです.統計学を日常的に使う必要のある医療関係やデータ分析関連の業務に従事されている方々であれば,それは必要なことと諦めるしかありません,しかしながら,本書が対象としている一般の技術分野の皆さんには,最初に統計学の勉強に取り組むことで息切れしてしまい,本業の勉強が疎かになったり肝心の問題解決に十分なリソースを投入できないという状況は避けてほしいのです.
それは山登りで例えるならば,アプローチ(交通機関から登山口までの行程)で体力を費やしてしまい,登頂を断念するようなものです.駅から登山口まではスニーカーで歩き,そこで登山靴に履き替えれば,登山するための体力が温存できます.問題解決という山に登る場合でも,できるだけアプローチを楽にするためにJMPを使って技術者のリソースを温存するというのが本書の提案なのです.ですから,統計を最初から説明すると,いたずらに読者の消耗を招き,本末転倒になってしまうということを懸念していました.
もちろん医療関係者に限らず,誰にとっても統計学の勉強は投資に見合うので,JMPで統計を勉強することに価値はあります.多くの書籍がありますが,いずれも統計が目的になっている視点で書かれているようです. 一方で,統計(という道具)を使うことを目的とした書籍は(少なくとも技術者向けには)そう多くはないように思えました.『JMPではじめる統計的問題解決入門』を執筆したというのはこのような理由からです.
例をあげます.以下では既に問題がきちんと定義されているものとします.例えば,カスタム計画を使って製品を最適化するには,JMPとその最低限の操作を覚えさえすれば,実験のリソースと既存の知見さえあれば十分です.どこにも統計は出てきませんし,全く統計を知らなくても問題解決は可能です.問題によっては平均とか分散といった初歩の概念は知っておいたほうが無難ですが,それさえ知らずとも問題解決できる可能性があります.本書に書いたように,カスタム計画の実験数は「最小実験数」に最低でも1を加えたものという決まりを知っていさえすれば,既存の知見をもとに実験計画が作成でき,その実験データをもとに問題を解くことができます.ここまでは,統計はJMPの処理アルゴリズムの中にあるものの,おもてには出てきません.ところが,ある程度上級者になってくると,何故+1なのかと疑問を抱くようになります.この疑問に答えるのが統計学なのです.
「モデルのあてはめ」でのパラメータ推定の検定における誤差の自由度を考慮しなければならないため,というのがその答えです.JMPの提示する最適実験数で実験すると誤差の自由度は0になってしまいます.シミュレーション実験ではない一般の実験ではデータには必ずばらつきがあるので,この状況では(方程式の数が少なくて)パラメータ推定の計算ができません.それでは+1でいいのかというと,自由度3以上でF分布に極値が出現するため,統計学的には+4が望ましいと言われています.根拠は定かでないのですが,+6とする先生もいらっしゃると聞きました.もちろん実験数は多ければそれに越したことはありませんが,簡単に実験数を増やせない状況も多々あります.統計学はその実験がどれだけ大変なことなのかとか実験に許されているリソースを知りません.最適化の結果によって得られるコストが実験のコストを上回るくらいなら,何もしないという手もあります.実験数は統計学だけでは決められないのです.そこで+1から始めてJMPの「計画の評価」をもとに横目で実験のリソースを睨みながら落とし所を見つけるというのが本書で提案している手法です.ここには(少なくとも表だっては)統計は出てきません.
いずれにしても,必要な実験数を統計学として理解するには,確率分布から始めてF分布から検定へと勉強しなければならず,勉強し終わる頃には今起こっている問題が手遅れになるかもしれません.私が実験計画で問題を解決することを優先し,統計の勉強は必要になった時点でもいいのではないかと考えるのはこのような理由からです.仮に余分なリソースがあったとしても,自らの専門分野の勉強を優先するほうが賢いでしょう.統計を知らないと,とんでもない結果を出してしまいかねないと危惧される方もおられるかもしれませんが,実戦的な実験計画ではその結果の信頼性の検証というセーフティネットが控えているので安心です.
但し,医療関係の分野では事情は少々異なります.それはこの分野では統計学が共通言語として確立されているので,それを知らないとレポートが書けないどころではなく,論文の一つも読めないからです.更には,一般の技術分野と異なって医療分野では実験計画という実戦的な手法が比較的採用しにくいという事情も関係あるかもしれません.再現実験というセーフティネットがなければ結果の信頼性は統計学に頼るしかありませんから.SASの本ですが,大橋渉(2012)『統計を知らない人のためのSAS入門』オーム社という書籍があります.本書の企画段階で出会った本で,統計を知らない人のためのとあるので,興味を惹かれて読んでみました.冒頭のマンガで主人公が先輩に「あなたは正しく統計学を理解したうえで,SASの使い方を学んだほうがいいわ」と言われます.やはりSASを使って統計を知らない人が統計を勉強するための本なのでした.SASのユーザー事例によると著者は東京医科歯科大学にいらっしゃる医療分野の先生だそうです.やはり医療分野においては統計学というのは始めに統計ありきとして必須のものなのでしょう.
他にもAmazonで「JMP」をキーにして検索するといろいろな書籍が出てきます.例えば,長田理(2016)『JMP医学統計マニュアル』星雲社内田治,石野祐三子,平野綾子(2012)『JMPによる医療系データ分析』東京図書がJMPの本で売れているようですが,両方とも医療関係者を対象として書かれた本です.そういえば,今年のDSJ(Discovery Summit Japan)でも医療関係の発表が多いのです.産業分野からの発表をもっと期待したいのですが,本書を読んで出した結果を発表してくださる方がいらしたら嬉しいのですけれど.

それでは.

2017年08月16日

Amazonでの「内容紹介」について思うこと

『JMPではじめる統計的問題解決入門』がAmazonに登場したとしばらく前に書きましたが,そこに掲載されている内容紹介は以下のとおりです.

JMPを使った「仕事の流儀」の入門書!
実務に使える強力なアドインを初公開!
本書は、「消化の仕組みが理解できていなくても美味しく食事ができるのと同様、統計を理解できていなくても統計を使ってその恩恵にあずかることはできる」という考えの基、JMPによる統計的データ分析の方法を解説します。
JMPの入門書でもありますが、操作手順だけではなく、「どんなときに何をどう使うのか」、「なぜその手法が必要なのか」という背後にある考え方について重きを置き、問題に対処できる応用力を身につけることができます。
さらに、本書購入者は、実務に使える強力なアドインは本書購入者を対象にSAS社のサイトから入手できます.(お申込みフォームに所定の情報を入力していただくことが必要です) 原文ママ

これは,私が書いたものではなくて,オーム社の編集の方が本書の「はじめに」を参照して書かれたようです.(一部,日本語が変なのでオーム社経由で修正をお願いしているのですが,何しろあれだけの書籍数ですから修正に時間がかかるようです.)この内容紹介ですが,間違いではないのですけど,いささかミスリーディングがあるかもしれません.
「仕事の流儀」というと,どんな仕事にも通用するビジネス一般におけるハウツー的な本のようです.現代の技術者は「今までとは違う仕事」に向き合わなければならないので,そのためには「今までとは違う流儀」に従うべきというような意味のことを「はじめに」に書いています.ある意味では「仕事の流儀の入門書」ではあるかもしれませんが,あくまでも本書の対象読者は問題解決に挑む(あるいはその必要に迫られている)人を想定しました.
問題解決の入門ではあってもJMPの入門書と名乗るのも少しおこがましいかもしれません.本書ではある程度JMPの操作をご存知の方を前提にして,技術者が使いこなすべきJMPの機能を説明しているからです.とはいっても,「はじめてのJMP」という付属マニュアルの最初の三章(JMP12の日本語版ではp77まで)に目を通していただければそれ以外の参考書は不要ですし,JMP以前のデータ分析の一般的な手順にも言及していますので,入門書としてもお使いいただけるかとは思います.そもそもマニュアル本を書く気は全くありませんでした.世にあるJMP関連本がどちらかというとJMPを使った統計本で,それらはそれで価値があるとはいえ,JMPらしさという点では十分にはアピールできていないと考え,そこを埋めることを意図しました.そのために最新版のJMP13をもとにして書きました.(一度JMP12で書いた原稿を書き直しています.)
ミニマルなJMPの説明という割には本書はA5より大判で320ページと類書中ではボリュームがある本です.それはJMPの操作説明を対話式にしたことに加え,JMPとは直接関係ない話もいろいろ書かせていただいたからです.そもそも本書のオリジナル原稿は私が講演やセミナー等でお話ししたことをまとめたものなので,講演などでは聴衆を飽きさせないために入れるエピソードが数多挿入されていました.これでも随分と割愛しましたが,余計な説明が多すぎると感じる方もいらっしゃるでしょう.とはいえ,下手な「解説」よりも一つのうまい「格言」で目が開かれることもありますし,そこにはエピソード記憶として留めて欲しいいうメッセージがあります.
「実務に使える強力なアドイン」というのも大げさですが,間違いなくJMPの機能拡張として実験計画によるパラメータ設計に大いに役に立つものです.今回このアドインを読者限定とはいえ一般に公開できたことは社会に貢献できたと自負しています.とはいえ,JMPでデータ分析をするだけならば使いどころが限られてきますので,このアドインについては,その使いどころなどを後日もう少し紹介します.ブログを開設することで,従来よりも補足説明を加えることが容易にできるのは大変ありがたいです.
以上いろいろと書いたことは,書店でパラパラとページをめくれば判断つくはずですが,ネット販売ではそれも困難ですね.Amazonの「なか見!検索」もこの分野の本にはないものがほとんどです.このような事情で,特にAmazonでは書籍のレーティングが割れやすいのではないでしょうか.ネット書店で購入した本には思っていたのと違うという不満も出やすいですから.いわゆる当てが外れたというやつです.当てが外れたということに関しては常々思っていることがあるのですが,本日は長くなってしまったので次回にします.

2017年08月14日

Stat Spotting

先日のStat Spottingカテゴリーの記事で,そもそもSpot Spttingとは何かについてお話しするのを忘れていました.Stat Spttingとは私の知る限りでは,Joel Best(2008), Stat-Spotting: A Field Guide to Identifying Dubious Data, University of California Pressで最初に使われた言葉のように思います.今調べたら日本語訳も出ていました.ジョエル・ベスト (2011),林大 (訳)『あやしい統計フィールドガイド―ニュースのウソの見抜き方』白揚社です.翻訳者はタイトルを訳されるのに苦労なさったと想像しますが,Stat-Spottingをそのまま訳すのは避けたようです.
イギリスというかスコットランドを舞台とした有名な青春(といっては陰鬱な)映画にユアン・マクレガー 出演のトレインスポッティングがありました.(そういえば続編の「T2 Train Spotting」が今年公開されましたね.)現地の鉄道操車場跡に薬物中毒者らが集っていたことから,彼ら不良のことをTrain Spotting(鉄道ファン)と現地のスラングで呼んだということをどこかで読んだ記憶があります.Spottingのそもそもの意味は偵察ですし,レーダー探知で敵を発見したときなどもSpottingと言います.電車を見ると目がついそちらに行ってしまう,いわゆる鉄オタ趣味のことをTrain Spottingというのですね.
というわけでStat Spottingは直訳すると統計(情報)の偵察とでもいいましょうか.あるいは統計で偵察するというのでも意味としては良さそうです.具体的に何を偵察するかというと,統計的に表現された世の中の(ときとして怪しげな)言説や報道及びそれらに使用されているグラフなどの統計情報をチェックするのです.TVや新聞等のメディアだけでなく電車の吊り広告などもStat Spottingのターゲットになります.世の中を見回してどこかにこのようなターゲットがないかを探す趣味がStat Spottingなのです.
Stat Spottingを趣味とする人は世の中にたくさんいらして,私もその一人なのですが,ちょうど今Spttingした広告に関する論文を読んでいるところです.近いうちにStat Spottingのカテゴリーで紹介したいと思います.

それでは.
posted by Tad at 12:08| Comment(0) | Stat Spotting