UA-115498173-1

2019年01月26日

文旦v.s.デコポン

本日は最近わたしが遊んでいることをJMPerの皆様にシェアしたいと思います.初心者にJMPを教えたりするときに面白がってもらえるので,皆さんも試してみてください.
きっかけは他愛のないことでした.自宅でカボスを育てているのですが,その近くに別の柑橘系の木があって何を植えたのか思い出せなかったのですが,今年初めて小さいのが三つほどですけれど,実がなったんです.熟したら収穫しようと思っていたのですが,色が薄いままだったので,おかしいなと首を傾げていました.多分デコポンだろうと思っていたのですが,オレンジ色が濃くならずレモンよりも薄いクリームイエローのような色のままです.これはおかしいと,先日ついに一つだけ収穫してみたのですが,持ってみると妙に軽い.腐ってしまったかと割ってみたところ,皮というか実と皮との間のわた状の部分が厚いのです.専門用語では中果皮(アルベド)と言います.これに対して,外側の皮は外果皮(フラベト)と呼びます.
このフラベトの厚さの割にアルベトが厚いのは文旦の特徴です.だから見かけよりは軽いんですね.文旦を植えた記憶はないのですが,匂いも文旦で間違いありません.文旦の割には実が小さいですけど,生育不良なのかもしれません.そこで文旦はどこで栽培されているのか調べようと思ったのですが,ただ検索するのは面白くないのでGoogleトレンドを使ってみました.
ご存知のようにGoogleトレンドはWEBコンテンツのクリエーターにとって必須のツールです.指定した期間での検索キーの推移を可視化できるのです.地域別のインタレストもわかるので「文旦」というキーワードがどの地域で多用されているのかを知ることができます.
全期間(2014年から現在)の「文旦」のキーワードの結果を見ると,なるほど,高知県が文旦の本場のようですね.ブラウザ上に日本地図で検索数の相対値(最大を100として)が濃淡で示されています.これだけですと面白くないので,「デコポン」というキーワードと比較してみたのがこちらの結果です.
せっかくなのでこのデータをJMPに持ってきて,可視化してみます.それには「地方で比較した内訳」のところの右上にある下向き矢印のアイコンをクリックしてCSVデータをダウンロードします.このCSVファイルをJMPで開いてグラフビルダーで作成したのが下の図です.デフォルトでは「国/地域」という列名になっている都道府県名を「地図シェープ」にドロップしてください.
105-1.png
105-2.png
ものの見事に文旦の高知県とデコポンの熊本県という勢力図になっていますね.ダッシュボードでサイドバイサイドに比較もしてみました.
105-3.png
因みに少しカラースキームが違いますが,こちらは「カボス」です.
105-4.png
やはりカボスは大分県ですが,よく見ると福井県にもカボスの検索数が多いのです.これはなぜだかわかりますか?調査の結果,福井県には勝木書店という企業があってWikiによれば,そこが「KaBoS」という書籍・文具に加えてCD、DVD、ゲームソフトなどを扱う新業態店舗も展開しているようです.面白い遊びを見つけたので,ここのところわたしは最近このやり方でそばv.s.うどんや吉田松陰v.s.宮沢賢治などを調べて遊んでます.そもそもデータをJMPに持ってきたのは検索数を人口で割る方が良いのではないかと考えたからで,今日は時間がなくてやってませんが,お時間ある方はぜひトライしてみてください.
それでは本日はこれで.
タグ:JMP
posted by Tad at 19:00| Comment(0) | TrackBack(0) | JMP

2019年01月19日

産業分野における実験計画の活用

来月のJMPer’s Meetingでお話しすることになりましたと先日リークしました.今週それが正式にアナウンスされたので,改めてこの場で紹介しようと思っていたのですが,先ほど見ましたら既にキャンセル待ちになっていました.因みに,こちらが申し込みフォームです.
2019年第1回 JMPer's Meeting 産業分野における実験計画の活用

Summit2018での講演の延長戦という趣旨なので,本来はもう一人別の講演者にご登壇いただくのが筋ですが,期が変わってからの方がご都合がよろしいとのことで,わたしが前座を務めることになりました.前座がこういうのもおかしいですが,多くの皆様にお越しいただけるのはありがたいことです.キャンセル待ちになってしまいましたが,もしも参加希望の方がいらっしゃいましたらコメントでお知らせください.講演者割り当て分があるので,おそらく数名くらいであればはなんとかできるのではないかと思います.

時間は90分いただいているので,何をお話しようかを今から考えているところです.事前に講演内容を聞かれたので,以下のようにお返事して,それがそのままプログラムに掲載されています.

「産業分野でなぜ実験計画が必須なのかをテーマとして、実践的な実験計画の基本的な考え方とそれを実施する具体的な手順についてお話しします。更に、技術開発に有効なパラメータ設計のためのJMPアドインについてデモを交えて紹介する予定です。」

ここで言っているJMPアドインとはMCDAアドインのことです.後半のジャパンセミコンダクターの坂本さんの講演を実践編として,そこで適用例を紹介するので,それに繋げるようにMCDAアドインの使い方について解説する予定にしています.時間の制約もあるのでどこまで踏み込めるかはわかりませんが,わたしの力及ばず本書だけではMCDAアドインの使いどころが今ひとつわからないという声も聞いているので,今回はこの点は頑張ってお話したいと思います.因みに,MCDAアドインは本書にバンドルして配布することを許可されているのですが,JMPer’Meeting参加者限定でも配布できるバージョンを検討しています.(来月なのでちょっと時間がないかもしれません.)
わたしの講演では実験計画の基本的な手順も合わせて解説します.あくまでも実践的な実験計画であって統計学の一分野の実験計画ではありませんし,具体的な手順にどこまで踏み込めるかは当日の雰囲気によります.
何れにせよ,今回のテーマはAI流行りの産業界に向けたアンチテーゼにあります.わかりやすく書くと,「AIによるビッグデータ分析で技術開発ができる」というテーゼに対して「(少なくともそれだけでは)できない」というのがわたしの主張です.この結果のアウフヘーベンとしてあるのが実験計画なのだという主張でもあります.これが,どういう意味なのかは講演でじっくりとお話します.
SAS社のご好意でネットワーキングと称したお茶会も開催していただけますので,ぜひ皆様とお会いしてお話できたらありがたいです.

本日は短いですが,ここまで.それではまた.
タグ:問題解決 JMP
posted by Tad at 19:00| Comment(0) | TrackBack(0) | JMP

2019年01月12日

万年筆と最適化設計

実は最近アクセス記録を見てしまったので,このブログにも結構な人がいらしてくださることを自覚してしまいました.あまり迂闊なことも書けないなと思いを新たにしていますが,本日は暇ネタを書かせてください.
わたしは日常的に万年筆を使っています.他の筆記具ではどうにも書きにくいのです.滑らかだと定評のある水性ポールペン(ジェットストリームやアクロボール)でさえ,筆圧をかけなければ書けないので,長い時間書いているととても疲れます.ボールペンは構造上ペンの先の衝撃がダイレクトに手に伝わってくるのでそれも疲れる理由の一つです.そこで万年筆がわたしには疲れにくい筆記具なのです.
司法試験の筆記試験にも万年筆がよいということで,専用の万年筆が売られていたりします.何しろ数時間もの間ひたすら書き続ける過酷な試験ですから, 疲れない筆記具は必須のようです.そもそも法務省の司法試験に関するQ&Aにも,「指定の筆記具は黒インクのボールペン又は万年筆(ただし,インクがプラスチック製消しゴム等で消せないものに限る。)」とあります. 
この万年筆にも重要な多目的最適化がなされているのですが,本日はこの話をしたいと思います.万年筆のペンポイントの材質は何だかご存知でしょうか?メーカーのロゴと一緒に14kとか18kと小さく書かれているのを見たことがあるかもしれませんので金と思われているかもしれませんが,この文字が書かれている部分はペン先です.ニブとも言いますが,その先に小さい金属(球体)が溶接されていて,そこが紙にあたって書けるのです.この金属の球をペンポイントと言って,材質はイリドスミンというイリジウム(Ir)合金が一般的です.オスミウム(Os)共々硬い金属の代表です.何しろこの二つの元素は全元素中一番目と二番目に比重が大きいのです.イリジウムとオスミウムの天然合金をオスミリジウムと言い,その中の白金属元素鉱物の一つがイリドスミン(Rutheniridosmine) と呼ばれてペンポイントの材質として使われてきました.(因みに,白金属元素鉱物の命名に関する決まりが変更されて,イリドスミンは現在は自然オスミウムと呼ぶのが正式ですが,万年筆業界ではいまだにイリドスミンで通っています.)
ペンポイントに必要な特性はまず摩耗に強いこと,すなわち硬いことです.イリドスミンのモース硬度は6−7です.白金の硬度が4−4.5で,ガラスの硬度が5ですからかなり硬い合金です.国内でもイリドスミンの需要が高まった頃でしょうか,あの宮沢賢治が岩手県で砂金の中に入っている白い物質がイリドスミンであることを発見し,イリドスミンの採鉱を目指していたが叶わなかったということです.佐藤隆房(2012)「宮沢賢治ー素顔のわが友」,富山房企畫そういえば,宮沢賢治の詩集「春と修羅 第二集」の三六六に鉱染とネクタイという詩があります.「こゝらのまっくろな蛇紋岩にはイリドスミンがはいってゐるぞ」という一節があるのを思い出しました.
話が逸れました.このペンポイントですが,現在では必ずしもイリジウムとは限らないそうです.その材質は企業機密とのことですが,成分は分析すれば簡単にわかることなので製法などにも色々ノウハウがあるのかもしれません.何れにしてもペンポイントの硬度が高ければそれだけ摩耗に強いということで,長持ちする万年筆になります.(もちろんペン先の交換は可能ですが,凝った軸でもない限りおそらく買い換えた方が安いです.)その長持ちするペン先のトレードオフにあるのが書き味です.
万年筆の使い始めはペンポイントがまだ尖っていて,その部分が紙を引っ掻くことで,インクが滲み字幅が太くなっています.この時点ではまだ書き味も悪く,こんなものかと使うのをやめてしまう初心者もいます.ですが,我慢して使い続けているうちに角がとれ,自分の書き癖に馴染んだ形状にペンポイントが摩耗していきます.この時点で一番細く書けるペンポイントになります.更に書き続けていくと,徐々に摩耗が進み字幅は太くなっていきます.
字幅が太くなると,一定のインク容量あたりの書ける線の長さが短くなります.この線の長さを一定の字の数で換算したものを字数曲線と呼ぶんだそうです.横軸に時間,縦軸に字数で万年筆の特性を表現できるわけです.この字数曲線は上に凸の関数になっていてその頂点の近傍で万年筆(のペン先)は線幅が最も細くなり書き味もこなれてくることになります.
万年筆メーカーによってこの頂点をどの時点に設計するかがとても重要です.日本の万年筆メーカーは実用性を優先して硬いペンポイントになっているので,万年筆がこなれてくるまでに時間がかかります.ハードに使っても半年はかかるでしょうか.通常使用であれば,おそらく数年はかかります.一方,外国メーカーではもっと柔らかいペンポイントが付いているように思います.最初からユーザーに優しい万年筆なのです.しかしながら.末長く良い状態を保てるのは国産の万年筆です.しかも,国産メーカーのペン先はロバストです.外国製のように当たり外れがほとんどありません.性能として優秀な国産万年筆ですが,それが売り上げに結びついているとは言いがたい状況です.それはなぜかというと新品時の書き味で購入評価をされてしまうからです.
文房具屋に万年筆を買いに行くと,試筆に新品を出してくるお店がありますが,そういうお店ではどうしても外国メーカーの万年筆が好まれるようです.何しろ最初から書き味が良いのですから.大きいお店では,パイロットやセーラーの試し書き専用の万年筆がありますが,それらは何ともこなれたいい書き味になっていたりします.国産メーカーも最初から柔らかいペンポイントの万年筆を出せばいいとは思うのですけど.国産万年筆のペンポイントが硬いのは,漢字を書くための細い線幅にはペンポイントを小さくする必要があり,摩耗もそれだけ大きくなるからではないかと考えています.
耐久性(耐摩耗性)と書き心地の二つの特性を最適化した製品が万年筆であって,国内外の多くの万年筆メーカーのそれぞれの製品がその最適解の一つなのです.このように,製品には複数の特性があるのが普通です.ぜひ皆さんの製品にも複数の特性を見出してみてください.今まで見えなかったユーザーのニーズが見えてくるはずです.
本日は暇ネタですいません.
それではまた.
タグ:問題解決
posted by Tad at 19:00| Comment(0) | TrackBack(0) | 雑記

2019年01月05日

初JMP

今年もよろしくお願いいたします.本年最初に何を書こうかとニュースを漁っていたところに目に留まったのがこちらの記事です.
Windows 10 tops Windows 7 as most popular OS
リリースは3年前でしたのにまだWindows10のシェアはまだ4割にも満たないんですね.あっという間に9を飛ばして10に入れ替わったこともあってWIndows8のシェアが低いのは何となくわかります.8.1が出たときのゴタゴタが尾を引いているのでしょうか.因みに,WIndows9というネーミングが飛ばされたのは,( Windows95や98であることを認識するために)「Windows9」 という文字列を前方一致で検索するコードが存在するからと聞いたことがあります.
実はこのブログにもアクセス解析の機能が備わっています.アクセス数はたまに見ることはありますが,おまけ機能なので正確ではないし,何よりもせっかく来てくださる方の情報を覗くのは趣味ではないので見ていません.そもそもわたし自身がかなり強力なプライバシーフィルタをかけているので主義に反する行為なのです.とはいえ,このニュースを読んで,このブログの訪問者のOSシェアに興味を持ったので,調べてみました.情報を皆様に開示するならば許されるかなと思っています.
クローラもカウントしているので,この数字の信頼性は低いものの,予想よりも多くの方に訪れていただいているようで何となく安心しました.個人の日記とはいえ訪問者が誰もいないというのは寂しいものです.
念のために補足しますと,ブログをお持ちの方はご存知と思いますが,この「さくらのブログ」のような個人向けブログサイトの「アクセス記録」ではブラウザの自己申告情報を集計しているだけです.どこから来たのかといういわゆるリファラもその一つですが,サーバーのログを解析することまではできませんので,どの検索エンジンから来たか程度しかわかりませんし,わたしも通常はアクセス記録を覗かないことにしていますのでのでご安心ください.
さて,12月のアクセス記録からOSシェアを計算しました,全アクセス数から「不明」を除いて,モバイル環境の方も結構いらっしゃるので,PCとモバイルとに分けます.データを目前にすると何かしてみたくなるのがJMPerの性分です.手始めに,見やすくするためにOSはWindows,Mac OS,Linuxに三分類して実際のOSシェアとを比較してみました.その結果がこちらです.

1.png

圧倒的にWIndowsユーザーが多いのは会社から訪問してくださっている人が多いからと推察します.更にWIndowsの種類で可視化してみますとこのような結果になりました.書き忘れましたが,Net Applicationsというのは毎月1日にブラウザとOSの世界中の利用状況を発表している米国の調査会社です.以前から調査結果に疑問をお持ちの方もいらっしゃるようですが,他に引っ張ってこれるデータもないので.参考

2.png

この円グラフの上が本ブログで下が世界平均です.一見してWin8ユーザーが多いのはなぜでしょうか?検定にかけてみるとやはり当ブログの訪問者のOS分布は歪んでいるようです.

3.png

本来は日本のOSシェアと比較すべきところです.モバイルOSではiOSのシェアが日本では世界よりも高いと聞いていますし,実際このブログでもiOSユーザーの方がAndroidよりも多いです.
新年早々あまり役立つ情報は得られませんでしたが,初JMPということでお許しください.それでは.
タグ:JMP
posted by Tad at 19:00| Comment(0) | TrackBack(0) | JMP

2018年12月29日

第二刷の修正箇所について

先週予告しましたように本日は『JMPではじめる統計的問題解決入門』の第2刷で修正箇所についてご報告します.今回は増刷なので,改訂版と違って通常は大幅な修正はできませんが,気付いている限りの修正をオーム社に無理を通してお願いしました.複数のページにまたがるような大幅な変更(例えば注釈を追加,削除したりも含みます)は断念せざるをえませんでしたが,以下ではそれらも交えて報告します.ですので,以下の記述は第1刷をお持ちの皆様のためのもので,第2刷での実際の記述とは異なっていることご注意ください.(念のため既にご報告している修正点も掲載しています.)

1.p11の下のエクセルデータの図を下図と差し替えています.(左のデータの右側が50代になっていますが30代の間違いでした.)
1-1.png 1-2.png

2.p65の2行目のJMPくんの台詞で「降水量をY軸に,平均気温をX軸に...」を「降水量をX軸に,平均気温をY軸に...」に修正しています.(XとYとを入れ替えています.)

3.p80の下から4行目には「JMP実習」の見出しをつけても良かったのですが,この後にも「JMP実習」が来るのでここは明示していません.「以下では...」から実習が始まるものとご理解ください. 

4.p85の2行目のJMPくんの台詞で,「表示形式」のところで「データ点はオフ」を選択するとデータ点が見えるよ...」を「...データ点が消えるよ」に訂正しています.

5.P106下から5行目のJMPくんの台詞の前に以下を付け加えています. 
「計算式が入力できたら,行メニューから「行の追加」で「追加する行数」に100をいれて『OK』するのを忘れないでね.これで所望のデータテーブルができるから,「グラフ>曲面プロット」でグラフを描いてみようよ...(後略)」

6.p125の脚注は「...ではなく,Binomial(二項分布)という用語の頭文字にすぎません.」に修正しました.Binormalはタイポなので注意.

7.p131の下から11行目のJMPくんのセリフを「前略...この場合,「ユーザ定義」にチェックをいれてから14と入力して『計画の作成』を押すと計画が作成できるよ.そうしたら,実験計画のウィンドウの下にある実験の順序を「左から右へ並べ替え」に変更して『テーブルの作成』を押してみて.」と訂正しました.

8.p131の下から8行目の計太くんの台詞「テーブルができたぞ.」の後に次の脚注を入れようと思ったのですが,上述の理由で断念しました.
「カスタム計画は乱数をもとに作成されるので,ここで作成した計画は必ずしもサポートファイルと同じ計画になるとは限りませんのでご注意ください.」
その代わりに,P131 下から11行目のJMPくんの台詞を以下と差し替えています.
「実験の誤差を考慮してそれに1を加えた14が実質的な最小実験数だよ.「ユーザ定義」をチェックして14と入力してから『計画の作成』を押してみて.毎回同じ計画ができるわけではないから注意してね.」

9.p140ページの統子ちゃんの台詞を「...モデルでRMSE(Root Mean Square Error)が最小に...」に修正しました.RSMEとあるのはタイポですので注意.

10.P202 3行目の計太くんの台詞以降ですが,この部分はサンプルデータを作るのにとても苦労しました.いろいろと試行錯誤を繰り返しているうちに,本書に採用したデータを先祖返りしたデータで上書きしてしまうというミスをしていました.申し訳ございません.そこで今回は現在の(先祖返りした)サンプルデータに合わせて本文を修正しています.今回は時間がなくこのような手を打ちましたが,オリジナルのサンプルデータの方が面白かったので,第1刷をお持ちの皆様のためにいずれサンプルデータの方を修正したいと考えています.

P202 3行目の計太くんの台詞以降を次に差し替えてください.
計太 「そういえば,二人ともいつも同じブースを使ってたかも.」
JMPくん 「それも「グラフビルダー」で見てみよう.」
10.png
計太 「なるほど,実験者による違いは実験ブースの違いが原因かもしれないな.何か問題があったのかな?」

11.上と同じ理由で,p207以降の「EMPシステム分析」のグラフ・テーブルを以下と差し替えています.数が多いのですが,出てくる順に並べてあります.(サムネール表示がぼやけてますが,クリックすると別ウィンドウで開きます.)

P207上 11-1.png

P207下 11-2.png

P208上 11-3.png

P208中 11-4.png

P208下 11-5.png

P209上 11-6.png

P209二番目 11-7.png

P209三番目 11-8.png

P209下 11-9.png

P210上 11-10.png

P210下 11-11.png

12.p209の一番下のJMPくんの台詞の最後に以下の脚注をつけようと思ったのですが,修正の制約で断念しています.
*JMP14では「バイアスの比較」「繰り返し誤差の比較」というより分かりやすい名称に変更されています.

13.p229 4行目の計太くんの台詞 「触媒量」を「触媒」に訂正しました.

14.p229 8行目の統子ちゃんの台詞
「このように入力すればいいのね」を「このようにチェックを入れてから,「触媒」と「反応時間」の現在の値にそれぞれ0.005と8を入力すればいいのね」と訂正しました.

15.p255 7行目 目をつむる → 目をつぶる
目を瞑るというのは間違いではないですが,何となく.

16.p259の4行目の「...のままで構いません.」で改行して,以降の「通常の...作成しました.」の2行を次の段落と差し替えようと思ったのですが,帰って読者を混乱させてしまうかもしれないと思い直し,制約もギリギリだったこともあって修正は見送っています.

更に,2018年11月時点での最新版のMCDAアドイン(バージョン180214)では,最適化アルゴリズムに改良が加わったために,本書に掲載している開発版のアドインで計算した最適解の一部で,それとは異なる結果が得られます.そもそもJMPによる最適化のしくみから,微妙な環境(JMPのバージョンやOS等のPC環境,更には統計モデルや最適化設計の状況)の違いによって必ずしも同じ最適解が得られるとは限りません.使用するOSの種類やJMPのバージョン全ての組み合わせの結果を網羅することは現実的でないため,ここに掲載した最適解は参考に留め,最適解を得る流れを追ってください.
このように最適解がいろいろと出てきてしまうことに不安を持たれるもしれません.この状況はソフトのバグというわけではなく,どのような状態を最適とするかというプログラム上の定義(の違い)によるものです.「最適化はJMP(PC)がやるものではなく技術者自らがやるものだ」ということを認識して頂くために,ノイズ因子が複数あるというあえて複雑な問題を事例にとって,敢えてこのような実情を露呈させています.しかしながら,通常はこのような状況に遭遇することは多くないので安心してください.

17.p280 3行目のJMPくんの台詞に以下を追加しています.
それから最適化の赤三角から「予測変数の表示設定」を実行して「MIN」と「MAX」とにチェックをいれよう.

18.P280の二つの設計画面を以下と差し替えました.
18-1.png
18-2.png

19.p288の16行目 「Y 予測式」を「予測式 Y」に訂正しました.

20.p291の3行目 JMPくんの台詞に以下を追加しています.
「...してみようよ.それには設定画面で「予測式Yu1」と「予測式Yu2」を「予測式」に「Zu」を「ノイズ因子」に割り当てるんだ.」

21.p294 下から2行目のJMPくんの台詞で,「設定画面で「予測式Yu1」を「予測式」に,..」は「設定画面で「予測式Yu1」と「予測式Yu2」を「予測式」に,..」に訂正しています.

22.p295の下から6行目のJMPくんの台詞「...得られない解*32だよ.」と脚注を挿入しています.

*32 この解はWindows版のJMP13上で開発版のMCDAアドインを用いて出しましたが,現在ダウンロードできる最新版のアドインでは違った最適解が得られます.この状況はソフトのバグというよりも,どのような状態を最適とするかというプログラム上の定義の変更によるものです.どちらが正しいというわけでもないので,以下の説明での辻褄を合わせる都合から,そのまま掲載していますのでご注意ください.

23.ここまでページ順に番号を振っていましたが,期限間際に以下の修正を追加したことを思い出しました.すいません.

P47 下から8行目 「花粉Data2.jmp」を「花粉データ2.jmp」に訂正.
P53 3行目 「データの吟味は...」を「「列ビューア」で標準偏差が0の「Time」列と,二つのデータ行を「非表示かつ除外」にできましたか.結果を...」に修正しています.
P300 6行目 『統計モデルによるロバストパラメータ設計』の閉じ括弧を二重括弧に訂正しました.

皆様にはいろいろご不便おかけして申し訳ございませんでした.心からお詫び申し上げます.その他にも何か不具合を見つけられたならば,ぜひご一報ください.本書やJMPについての質問でも構いません.以前もお話しましたように,コメントに開示しないように書いてくださった方のコメントは非公開にしていますので,ご安心ください.

それでは皆様良いお年をお迎えください.
posted by Tad at 19:00| Comment(2) | TrackBack(0) | お詫びと訂正