2017年11月18日

産業界の皆様へ

昨日のDISCOVERY SUMMIT JAPANでは多くの方々とお会いできて楽しかったです.運営に関与するものとして参加してくださった皆様にお礼をいたします.あれだけの規模のイベントをJMP Japanのマーケット部門の女性三人が中心となって成功させたのです.リーダーのかたはデフォルトが笑顔という素敵な方ですが,昨日は笑顔が消えていましたが,懇親会の場でお見かけしたときは笑顔が戻っていたので安心しました.
私も発表させていただきましたがこのブログでもお話ししたように代打での登壇だったので本来50分枠のテーマを25分枠に押しこんでしまい,質問もお受けできずもうしわけございませんでした.デモもじっくりやりたかったのですがやはり時間切れで忙しかったですね.「階層型クラスター分析」の操作について懇親会の場でご質問いただいたので,後日このブログで説明しますとお答えしたのですが,見てくださってますか?来週までお待ちください.
昨日参加できなかった方もいらっしゃると思いますので,私の発表で特に産業界の技術者にお伝えしたかったメッセージを以下に再掲します.冒頭では医薬系分野とその他の産業分野との比較をして来年はもっと後者からエントリーを増やしたいという前置きをしています.書き起こしではなく覚えている限りなので微妙に違っているかもしれませんが,その点はお許しください.
ここから
このような発表で構いませんので,来年は皆様からもエントリーをお待ちしています.もちろん,社外発表することが我々の目的ではありませんが,アイデアがあれば発表することで手法のアラが見えてくるということは実感しています.自分のアイデアに磨きをかける機会はとても貴重です.更に重要なこととして,まずはJMPを用いた実験計画にトライしてみてください.日本の産業界に実験計画をはじめとした統計的手法がもっと普及して欲しいと願っています.
こんなことを言うのも,私たちの製品はお互いに依存し合っているからなのです.半導体メーカーの作ったパワーデバイスはインバーターに使われ,それはモーターに使われ,電気自動車に使われる,それが交通システムという更に上位の製品を形成する.その一つ一つのドメインにいて,我々はときに協し力ときにしのぎを削りつつ最適化していく必要があります.とはいえ,これは部分最適化です.明らかなことはそれぞれの製品をよりよく作っていくには全体最適化を目指さなければならないということです.そのためには一つの大きな実験計画が必要です.ところが,半導体の製造工程も1,000を超え,自動車の部品も3万点以上と聞きます.一つの大きな実験計画を組むことは現実には不可能です.
この状況の中で我々に必要なのは,単なる局所的な解ではなく,個々の製品のシステムを理解することです.解から理解へ.単なる解を得るだけならば近い将来AIがやってくれるようになるでしょう,我々に残された仕事はシステム,製品を理解すること,そのためにはJMPを使ったデータ結果の探索がますます重要になっていくはずです.
ここまで
メッセージを入れた発表でしたが,アイデアとしても役に立つものと思っています.言及はしませんでしたが,あの最適化はMCDAアドインで実施可能です.詳細が知りたい方は後日開催予定の「統計的問題解決フォローアップセミナー」にいらして下さい.ただ,開催日時は全く未定なので,お急ぎの方は直接お問い合わせください.
それではまた.
タグ:JMP
posted by Tad at 08:03| Comment(0) | TrackBack(0) | JMP

2017年11月12日

いよいよ来週はDISCOVERY SUMMIT JAPAN 2017

いよいよ来週はDISCOVERY SUMMIT JAPAN(DSJ)2017が開催されます.このところ週末になると天気が崩れるので当日の天気が気になりますが,このところ天気運には恵まれているので大丈夫ではないかと期待しています.何しろ先月の出版記念セミナーでは,前日まで東京では127年ぶり15日連続で10月に雨が降ったそうですが,当日の26日は良い天気に恵まれました.
DSJでは私もポスターと口頭発表させていただくことになっていまして,先日発表資料を提出したところです.今回の発表は産業分野の皆様の手本となればとも思い,SAS社指定のテンプレートを使いました.本年のテーマカラーは緑のようですね.実は普段はこのようなテンプレートはできるだけ使わないようにしています.チャートジャンクならぬPPTジャンクとでもいいましょうか.必要ない情報は見るのに邪魔なだけでなく余白の美しさを台無しにするものです.某社のプレゼンでは毎ページに目立つ色とデザインで精神的なスローガンが入っていて,見ているだけで疲れてしまいました.
DSJ 2017のテンプレートには下部中央にコピーライト表示が入っていて,デフォルトではこのようになっています.
Copyright コピーライトマーク 2017 SAS Institute Inc. All rights reserved.
このコピーライト表示は各自で資料作成者の名前や(業務上の著作物は会社に帰属することになっている場合は)会社名などに差し替えます.学会の投稿論文のように印刷やWEB送信を前提とするものは基本的に著作権は学会に譲渡することが多いのですが,プレゼン資料の著作権までは譲渡しません.資料の著作権をSAS社に譲渡するとそれを社内で使うには著作権利用許諾が必要になってしまいます.
ところでこのテンプレートのコーピーライト表示にはおかしいところがありますが,お分かりでしょうか.まず第一に,コピーライトマークはCopyrightの省略記号なので,両者を同時に表紙する必要はありません.ダブっているとおかしいので コピーライトマークまたはCopyright だけを残すべきです.さらに.All rights reservedはブエノスアイレス条約に調印していない日本では意味(効力)がありませんから省くべきです.おそらくUS本社指定のテンプレートだからでしょうが,米国でも既に実質的な意味合いはありませんので,最近では表示しません.
前にもお話ししたかもしれませんが,私は今年もSteering Committeeを拝命しているので,今年は「統計的問題解決入門」の紹介のポスターを景気付けに展示させていただくだけにして,自ら発表する予定はありませんでした.ところが,海外からエントリーで都合がつかなくなったという方が出て急遽その穴埋めに抜擢されたのです.
常々,産業分野のJMPユーザーをもっと活発にしたいと考えていたので,この機会に来年のSUMMITへの発表をお誘いするようなお話をすることにしました.今年の米国でのSUMMITは先月St. Louisで開催されました.講演者数を比較すると米国が総勢72名(内4名は基調講演)に対し日本は26名(基調講演は2名)です.そもそも4日間に渡って開催されるという日本とは規模が違うイベントなので,講演者数が少ないのは当たり前ですが,講演内容を見ると日本では圧倒的に医薬関連の発表が多いのが特徴です.発表数は米国のおよそ2倍あるので,発表総数では三分の一近いことを考えると如何にアンバランスであることがわかります.当然それだけ産業分野からの発表は日本では少ないということです.また,開発拠点のある米国ではSAS社からの発表も多く,今年もあのDSDの考案者(の一人)のBradley Jonesさんも自ら発表されたようです.
その他,米国の発表には色々とバラエティに富んでいるのも特徴的です.個人的に注目しているのは3人のUS Armyからの発表です.Army Sniper Munition Optimization: A Comprehensive Dispersion Response Analysis Using a Custom Split-Plot Design, Loglinear Variance and Graphical Analyses
というChristopher DrakeさんとDouglas Rayさんの発表ですが,要旨によれば,JMPを使って高性能ライフルのスナイパー弾の命中精度を改善するという事例です.FPSゲームをやっている人ならばammoといえばお分かりこういうやつです.カスタム計画を使った予測モデルによるパラメータ最適化設計の事例で,得られた最適解をグラフビルダーなどで可視化してじっくりと考察されているようで,ぜひ詳しい内容が知りたく,SAS社に発表内容を問い合わせてみます.
日本の発表にも興味深いものがありますので楽しみにしています.当日お会いできる方はポスターにお立ち寄りいただいて,ぜひ声をかけてください.参加できない方も後日になりますがこの場で報告しますのでお待ちいただければと思います.
それではまた.
タグ:JMP
posted by Tad at 11:32| Comment(0) | TrackBack(0) | JMP

2017年11月04日

JMPとIoT

最初にセミナーでお配りしたPDFの印刷物について補足します.プレゼンソフトのkeynoteから40枚のうちの8枚を抜粋したごく簡単なものですが,なんとかA4一枚に納めたかったので文字サイズや色を修正してオリジナル版を作成しました.一枚の資料にしたかったのは紙をめくる音が好きでないということもありますが,アニメーションを多用しているので,PDFにするとわけが分からなくなってしまうページや写真などの著作物を引用したページを間引くと配布できるようなページがあまり残らないという事情がありました.比較的重要なページを選んで作り直しましたが,特に後半の第二部はあれだけでは説明不足かもしれません.実際の問題解決では綺麗ごとでは済まされないという状況があり,そのためには統計学の枠組みを超えることも必要です.このことだけは是非とも皆様に知って頂きたかったので近いうちにこのブログでもう一度お話しさせてください.
一つ重要なことを思い出しました.配布資料には間違いが入れてありますとお話ししたきり,時間配分の都合で第二部の後半を急いだために正解をお伝えするのを忘れてしまいました.間違いを入れたのは掟破りの問題解決のページです.破る掟は,Principle,Standard,Protocol,Rule,Regulationの五つですが,そのうちのStandardは配布資料に書いてある「現実の再定義」ではなくて,Principleと同じく「理想状態の再定義」が正解です.Standardは「基準」ですから,理想状態を定義する数値です.基準を変えることで問題を解決するという荒技がここで意味していることです.
ちなみにこのStandardは基準と訳していますが,MCDAにおける多基準の基準はCriteriaとなります.本書では「基準」という漢字を採用しましたが,Standardの基準と区別して多規準としたほうがよかったかもしれません.この両者の違いを知るには,この文献が参考になります.
以上のことはセミナーに参加されなかった方々には何を言っているのかわからないと思いますが,上述したようにいずれこのブログで紹介しますので,そのときまでお待いただければありがたいです.
さて,前置きが長くなりましたが,先日IoT関連のコンファレンスに参加してきましたのでJMPに絡めて考えてみます.統計的問題解決ではIoTデータを直接扱うことはあまりないかもしれませんが,分析結果としてデータから因果関係が抽出するという点では,本書でも解説した量産データ分析と変わりはありません.もちろん,IoTデータはビッグデータなので,JMPで分析するには少々敷居が高いかもしれませんが,JMPでもかなりのことができます.IoTデータが入手できるならばやってみるべきです.
やるならば,CPUは64bitであることと搭載メモリを可能な限り増やすことが必須となります.32bit版のJMPでは扱えるメモリは最大2GBまでなので,データのファイルサイズとして500MBを一つの目安とし,それ以上のデータを扱う場合は64bit版のJMPまたはJMP Proを使って2GB以上をアサインすることを推奨されています.意外と知られていないのが,WINDOWSの場合,シングルユーザーライセンスのJMPは32bit版であるということで,64bit版を使うには年間ライセンスが必要ということです.
一方,Macでは64bitマシン(Core 2 Duo以降)では確かJMP12からはシングルユーザーライセンスでも64bit版JMPのはずです.今年のWWDC(世界開発者会議)でAppleは今後はApp Storeでは32bitアプリケーションのサポートを終了(最新のOSであるHigh Sierraが最後)していく方針を発表し,JMPのようなStore以外で購入するソフトについても64bit化することを推奨していますが,JMPはいち早くこの要求に応えたようです.個人でビッグデータを扱うならばMac版JMPを使うのが良いということになります.
そもそも対話的な操作を特徴とするJMPにとって,ビッグデータ分析は分析者が介在しにくいという意味で相性は良くないように思います.例えば,普段何気なく実行している「多変量の相関」なども変数の数が増えると指数関数的に負荷が増大し,出力結果の認性も著しく低下します.個々のデータをクリックして,様々な処理を実施することができるJMPのインターフェイスの宿命とも言えます.
とはいえ,一昨年のDSJ2016ではJohn Sallさんが基調講演でJMPでビッグデータを分析して見せてくれました.SAS社としてもSASとJMPとの棲み分けがあるようで,ビッグデータはSASのテリトリーというのが暗黙の了解事項のようで(私の推測です),JMP事業部も積極的にビッグデータ分析をアピールしてはいませんが,JMP10あたりからビッグデータを意識した機能が加わってきています.上述した64bitにより扱えるデータサイズがほぼ無制限になったことや,JMP13には新機能の一つに「仮想結合」が加わりました.JMPのデータはメモリ内に展開されますが,リンクを張るような機能だと思うのですが,これによって大きなテーブルの結合でメモリ不足を回避することができます.その他,サンプルサイズの大きいデータを扱う際に知っておいて便利なのは「工程のスクリーニング」です.この機能は説明変数が多いときに使います.挙動が似ている変数同士をクラスタリングしてくれます.同じようなことは「多変量の相関>」でもできますが,この機能を使えばクラスタリングした結果を「モデルのあてはめ」に持っていけるので分析フローを重要視するならば,大変重宝します.その他,「テキストエクスプローラ」などもビッグデータを意識した機能ですね.JMP13では残念ながら英語にしか対応していませんが,JMP14では部分的に日本語対応するとも聞いていますので,それまではMeCab(日本語形態素解析システム)などを使えばいろいろ面白いことができるように思ってはいるのですが,なかなか時間が取れないでいます.どなたか試してみませんか?
それではまた.
タグ:JMP
posted by Tad at 09:39| Comment(0) | TrackBack(0) | JMP