UA-115498173-1

2018年10月27日

等高線を読む際のヒント

紅葉の季節が近づいてきました.どこかに山登り(といっても本格的な登山ではないです)にでもいこいうかなと地図を眺めていて思ったことを本日は.
「モデルのあてはめ」は実験データを表現する数式を導出してくれるJMPの代表的な機能です.ですから,モデルとは数式そのものを指しています.一方,モデルには日本語で模型という意味もあります.わたしはモデルを考えるときは常に模型のイメージを大切にしています.模型といっても,いわゆる工作模型の類です.応答関数の性質やその挙動を把握するのには実験データを仲介としてシステムを模型化するという考え方が重要です.この意味では,予測プロファイルよりも曲面プロファイルの方が直感的に理解しやすいので,必ず曲面も見ることにしています.一度に見れるのは二因子までに限定されますが,他の因子を色々と切り替え,スライドさせて,それこそ捻くり回すのです.
工作模型は偽物ではありますが,特に精密にできた模型には本物以上の魅力があります.ときには本物以上の機能が備わっていたりします.誤解のないように補足しますと,本物では検証不可能なことが模型を使って可能である,というような意味です.例えば,何らかのシステム開発ではUMLを用いて分析・設計を実施します.UMLで表記したビジネスモデルをオブジェクト指向で分析するのはシステム開発では必須の手順です.一方で,技術開発ではまだまだ実験計画によるデータに基づくモデリングは必須のものとはなっていません.システム開発のように技術開発もすべきである,というのがわたしの持論です.
JMPの一連のプロファイルはこのために欠かせないツールです.松岡正剛さんは千夜千冊の書評で,松井広志(2017)『模型のメディア論』青弓社を取り上げて,「モデリングの真骨頂は可塑的であることだ。」と看破されていますが,わたしもJMPのプロファイルの長所は応答関数を可塑的に変化させることができる点にあると考えています.
ところで,曲面プロファイルは,模型のイメージには近いのですが,応答が複数になると手に負えなくなります.そこで多目的最適化では等高線プロファイルが活躍します.とはいえ,しょせん二次元モデル(マップ)なのでその情報を三次元に再構築する能力がわたしたちに必要となります.サイクリングで峠に登るコースを選ぶときなどで,等高線を読むのに慣れているのでわたし自身は問題ないのですが,経験的に,これが苦手な人がいらっしゃいます.そこでちょっとした小技をお教えしましょう.
データは何でもいいのですが,サポートファイルの「MCDAデモ事例.jmp」を使って説明します.まずは,グラフメニューから等高線プロファイルを選んで,「予測式_膜厚」_を「Y,予測式」に割り当てます.このときN2とSiH4を誤差因子にも割り当てるのが味噌です.(この例では他の因子は無視します.)水平はN2,垂直はSiH4をチェックしてから,Y軸をダブルクリックして範囲を最小−1000,最大を3000とし,同様にしてX軸の範囲も最小−300,最大300に変更します.あくまでも等高線プロファイルの例として示しているだけで,範囲を拡張しているので現実的な例では全くありませんので,この点はご注意ください.
さて,予測式(この場合膜厚)の応答関数が赤線で示されていますが,もっとわかりやすくするために赤三角から「等高線グリッド」を設定(デフォルトで構いません)します.この時点で既にお気付きのように青と緑の線が示されています.これらは膜厚の予測式をそれぞれSiH4とN2とで偏微分した係数の予測式(∂予測式)であり,即ち応答関数の曲面の傾き(の等高線)を示しています.デフォルトでは0の等値線が示されているので,これは山の尾根線に相当するのものです.青線の線上ではSiH4の変動に対する膜厚(の予測値)の変化は0になっています.二次までの応答関数を仮定した場合限定ですが,山の尾根道,山登りの用語でいうといわゆる乗越(のっこし)ですね.もちろんか谷道の場合もあります.(三次までを仮定するならば,林道のような片側が崖で片側が山のような道というケースもあります.)そして,両者が混じった点が山の頂上あるいは谷底,あるいはいわゆる鞍部になります.
この2つの∂予測式が応答関数の把握に役に立ちます.このためには2つの∂予測式の等高線グリッドを挿入してみます.
92−1.png
ここから応答曲面が再構築できますか?わからないという人は,膜厚の下限をスライダーで変化させるとこの曲面は鞍部の形状になっていることがわかります.曲面プロファイルだとこんな感じです.
92−2.png
このプロファイルに誤差因子を割り当てるのは,本来はロバスト設計のための機能です.ここでは「満足度の最大化」は実施していませんが,膜厚を最大に,両方の∂予測式を0に制約することでロバスト解が得られることになります.それだけでなく,通常の内乱でなく外乱の影響を考えるときに役に立ちます.例えば,SiH4とN2のガス流量の変動に対しては,2つの∂予測式の上加減をそれぞれN2は±3, SiH4は±0.5などと入力するとこのようになります.
92−3.png
この図の白抜きの領域がガス流量の変化にロバストになっています.費用をかけてガス流量の安定を図るならば,SiH4の方が効果が高いということがわかります.
簡単な例ですが,JMPのプロファイルの素晴らしさが伝われば幸いです.秋深くなってまいりました.皆様も風邪など召されませんよう.それでは. 
タグ:JMP
posted by Tad at 20:00| Comment(0) | TrackBack(0) | JMP

2018年10月20日

中国のSummit(Discovery Summit China 2018)

いよいよ今年のDiscovery Summit Japan2018も来月に迫りました.わたしは今年もコミッティメンバーとして参加します.ここを読まれているかたで参加される方がいらっしゃいましたら,ぜひ当日声をかけてください.
今年のユーザーセッションは全部で20ありますが,発表者の所属やタイトルからラフに分類しますと,アカデミック系が4件,薬学関連が5件,SASからの発表が3件,その他が4件で産業分野からの発表が4件となかなかバランスが取れているようです.AGC(株)旭硝子からの発表は要旨を拝見するに,純粋な製造分野のご発表ではなさそうなので(もちろん発表は楽しみにしてます),これを数に入れなければ,日本ゴア(株),(株)日本触媒,キリン(株),(株)ジャパンセミコンダクターの4件が産業分野の発表となります.このうちの1件はわたしが関与しているのですけど,他の皆さんの発表を楽しみにしています.
本音を言うと,産業分野からの発表はもっと増えて欲しいなとは思ってます.それと言うのも,今年4月に上海で開催されたDiscovery Summit China 2018には数で負けているからです.DSC2018(と言うのでしょうか?)は,今年で4回目になるので日本での初開催の翌年から始まり,今年もたいへん盛況だったときいています.参加者は300人以上とのことなので,規模はほぼ日本と同じでしょうか.ユーザーセッションが全部で12あって,そのうち2つはSASからの発表なので,発表数はそれほど多くはありませんが,発表企業の分野が偏っていることが特徴的です.半導体が5件,バイオ・医薬が4件,残りは化学が1件だけです.実質的に産業系製造業はほぼすべて半導体ということで中国の半導体分野にかける意気込みが感じられます.それとEvent Highlightsの写真を見ると薬学系のセッションでの女性の参加が目に付きますね.
以下,簡単に要旨を読んでみましょう.
 
1.Yangtze Memory Technologies,Data Analysis in NAND Flash Development and Testing
ご存知のように,YMTCは紫光集団(Tsinghua Unigroup)が中国大手の国有半導体メーカ―である武漢新芯集成電路製造(XMC)の株式の過半を取得て誕生した中国国内最大の半導体メモリメーカーです.発表内容そのものには目新しいことはありませんが,意気込みは感じます.3DNANDフラッシュの量産工場を建設中で,DRAMやファウンドリのラインも計画していると聞いていますから,その勢いのあらわれでしょうか.
2.Western Digital China,Commonality Analysis in Manufacturing Applications of Big Data and Predictive Quality Assessments
あのWestern Digitalからは予測品質評価にJMPを使うという発表がありました.こうして見るとやはりBig Data関連が多いですね.まだ開発業務にはJMP活用はされていないのかもしれません.
3.The Standardization of Big Data Analysis and JMPレジスタードマーク Experimental Flow
この発表者は台湾の大手メーカーとだけで所属企業が伏せられています.ということは宣伝目的ではないということですが,内容はJMPのデモではないかと思われます.中国ではJMP初心者が多いのでしょう.興味はありますが,ちょっと内容は不明です.このようなチュートリアル的な発表は米国では結構目につきます. 
4.Design of Experiments: The Efficient Method to Predict the System Signal Integrity Performance in Volume Production,Intel
実験計画でSignal Integrityの最適化を図るという内容で,シミュレーションにもJMPによるDOEを導入しているようです.何しろあのインテルですから.因みに,ご存知ない方のために付け加えると,Integirityは訳すと「まとまり」「一体」となりますが,Signal Integrityと言ったときは「完全無欠の綺麗な信号波形」を意味します.回路の信号配線は反射で波形が乱れるのですが,回路設計を工夫することで綺麗な波形を得る技術がSignal Integrity(SI)なのです.LCR回路の計算計算ではSPICEという有名なソルバーがありますが,こういうソフトを使ってDOEで回路設計を最適化するという事例のようです.詳細が知りたいですね.
5.Big Data Mining in IC Manufacturing: Defect Prediction Model,SMIC
SMICからはウェハ受け入れ検査にJMPを使うという発表がありました.因みに,要旨にあるWATとはwafer acceptance testの略です.欠陥予測とバーチャルメトロロジーという以前日本でも流行した技術にJMPを使うという内容のようで,個人的にはとても興味あります.
 
中国の発表から伺うに,少なくとも中国の半導体メーカーではJMP導入に積極的であるようです.その理由として推察するに,米国の半導体大手がJMPを使っているからと考えています.

それではまた来週.
タグ:JMP
posted by Tad at 19:00| Comment(0) | TrackBack(0) | JMP

2018年10月13日

統計リテラシー

「統計リテラシー」についてお話することが度々ありまして,以前よりネタを目にするたびに拾い集めています.「Stat Spotting」同様,趣味みたいなものですが,自らの「統計リテラシー」を鍛えるのに役立っています.といっても,話そのものは当たり前なので,わざわざブログに取り上げる意味はないのかもしれません.
一月ほど前にNEWSポストセブンで拾った記事ですが,女性セブン2018年9月27日号によれば「自宅の蔵書多いと子供の算数の成績が上がる、新聞も重要」ということだそうです.全国の小学6年生と中学3年生の200万人を対象に,毎年実施されている「全国学力テスト」の2017年度版の結果が7月末に公表されたわけですが,今回は「保護者アンケート」も同時に実施されたそうです.アンケートの対象は,テストを受けた小6と中3の保護者から12万人をランダムサンプリングしたとのことでかなり大掛かりです.家庭環境や経済状況とテスト正答率との相関関係を調査するというようなことは昔からよくやられています.わたしも「統計リテラシー」のセミナーの題材にしたります.
例えば,よく引き合いに出すのは農林水産省の「めざましごはんキャンペーン」です.食料の自給率向上を目指すに,朝食抜きや食べてもパン食が多いことに対して朝ごはんを食べましょうという政策に則ったキャンペーンです.このPDFの資料の表示に掲載されている「平成23年度めざましごはんキャンペーンポスター」を見ると,小林幸子がお米大使というのはさておき,その下にグラフが掲載されています.少し見にくいのですが,左側には「朝食の摂取習慣」と「テスト」の関係が示されていて,日毎食べると正答率69%,食べないと48%となっています.まあ,正しくは「朝食の摂取習慣」と「テストの平均点」の関係だとは思うのですが,そこは置いときます.統計リテラシーのない親がこれを見たら「うちの子にも毎朝朝食を食べさせなくては」と思うかどうかは定かではありませんが,もちろんこれは疑似相関を示す良い例です.背後に「親の(子供に対する)関心」というような隠れた因子が存在してその影響による疑似相関である可能性が高いことは,言われてみれば誰でも気づくことです.
もう一つ問題があって,相関があるからといってそれが因果関係を示すわけではないということです.朝食を毎日食べるとテストの点が上がるわけではないということです.少なくともこのグラフだけからはその結論は導き出せません.この例のように現象が目に見える馴染み深いものであればこそ常識を頼りに正しく判断できるかもしれませんが,わたしたち技術者の扱う問題では「隠れた因子」を見つけにくく,因果関係を判断する常識も不足している状況が多いものです.
話が逸れましたけれど,上記を踏まえて女性セブンの記事を読んで見ます.面白いのは,この記事に「家庭の蔵書数が多いほど、子供は算数が得意になる」という見出しがつけられていることです.「おやっ」と思い記事をよく読むと,データを調査されたお茶の水女子大学文教育学部の浜野隆教授の話として以下のように書かれています.
「学校で実施されるどの教科のテストも、『問題文を読むこと』から始まります。いわば活字文化の学校において『読む力』はさまざまな学力に直結します」
浜野先生の発言をどう解釈すれば「蔵書数が多いほど、子供は算数が得意になる」となるのでしょうか.この記事を書いたライターは「蔵書数の多い家庭ほど、読書の機会が多いはずで、その分、子供の学力が高くなるのだ。」と考え,「普段から本を読んで書いてあることを理解しようとしている子供は、算数に求められる『論理的思考』能力も磨かれるのでしょう」という教育ジャーナリストの意見をもとに因果関係を想像したようです.親の蔵書数が多い → 子供が本を読む → 「読む力」が向上する → 「論理的思考」の能力が向上する → 算数が得意になる という一連のロジックには,個々に見るとそれなりの説得力があるように思えますが,クリティカルに一つ一つ考察して見ます.
親が本をたくさん持っていれば子供が本を読むようになると言われているのは事実です.おそらくそういう因果関係は特に幼少期にはあるかもしれません.とはいえ,逆に,二宮金次郎は薪を背負っても本を読んでいたわけなので,そういう子供が多ければ相関関係はそれほど高くはなならいはずです.その次の,多くの本を読んでいさえすれば「読解力」が向上する,ことについては『AI vs. 教科書が読めないこどもたち』では否定されていましたし,この記事にあるように Repeating stories is the best way to broaden toddlers' vocabulary.(幼児への絵本の読み聞かせには一冊を繰り返すことが多くの語彙を増やす最善の方法である.)幼児期の研究とはいえ蔵書数は語彙の学習能力にはあまり関係ない,という研究報告もあります.
ここまでは良しとしても「読解力」があると「論理的思考能力」も向上するというのは少し乱暴です.「論理的思考能力」がないと「読解力」もないというのならまだわかりますが.論理的思考能力があると算数が得意になる,という部分はまあそうなのかなとは思いますが,「1ふくろ 8こ入りの チョコレートが 7ふくろと、ふくろに 入っていない チョコレートが 17こあります。ぜんぶで チョコレートは 何こありますか。」という問題に73こと答えた子がバツになる教育をされているとすれば論知的能力があるとむしろ算数の点は下がってしまうかもしれません.(参考
『算数』小2問題 「8×7+17=73」 は間違いなのか?ネットで話題に!
何が言いたいのかというと「蔵書数が多い親の子供は算数の点が高い」という相関関係を示すデータだけから「親の蔵書数を増やせば子供は算数が得意になる」という因果関係を導くのは無理があるのではないかということです.このように「風が吹けば桶屋が儲かる」的な連想の要素ロジックを専門家の意見でサポートして,最もらしい因果関係を仕立て上げそれに断定的な見出しをつけるのはマスコミの常套手段です.
その動機は利益誘導とまでは言い過ぎですが,自らの都合の影響は多分にあるでしょう.例えば,女性セブンは小学館という大手出版社が発行しています.その購読者層は表紙を見れば明らかなように主婦層です.(さだまさしとか小泉今日子ってまだいるんですね.)日本人は本を読まなくなったと言われますが,子供の算数の成績をあげたかったら本を買いましょう,というメッセージを主婦層にアピールしているのです.この行為が不正であるとまでは思いませんが,因果関係にまで踏み込んだ記事には多分にその統計情報の発信者の都合や意図が入っていることをわたしたちは肝に命じるべきです.これは統計リテラシーの基本です.
もう一つ.頭のいい人ほど因果関係の連鎖を想像できるということにも注意が必要です.全然関係ないと思っていた変数間に相関が見出された場合,経験や知識量が多い優秀な技術者ほどその間を繋ぐのがうまいものです.いわば,何らかの仮説を打ち出すことができてしまうのです.今思い出した例があって,面白いので来週書くことにします.このネタは続く可能性があるので「統計リテラシー」というカテゴリーをこの機会に作ります.「Stat Spotting」との区別が曖昧ですがこちらは,日常生活の中で目につく広告が対象ということにしようと思います.
それではまた.
タグ:統計
posted by Tad at 19:00| Comment(0) | TrackBack(0) | 統計リテラシー