UA-115498173-1

2018年10月20日

中国のSummit(Discovery Summit Chine 2018)

いよいよ今年のDiscovery Summit Japan2018も来月に迫りました.わたしは今年もコミッティメンバーとして参加します.ここを読まれているかたで参加される方がいらっしゃいましたら,ぜひ当日声をかけてください.
今年のユーザーセッションは全部で20ありますが,発表者の所属やタイトルからラフに分類しますと,アカデミック系が4件,薬学関連が5件,SASからの発表が3件,その他が4件で産業分野からの発表が4件となかなかバランスが取れているようです.AGC(株)旭硝子からの発表は要旨を拝見するに,純粋な製造分野のご発表ではなさそうなので(もちろん発表は楽しみにしてます),これを数に入れなければ,日本ゴア(株),(株)日本触媒,キリン(株),(株)ジャパンセミコンダクターの4件が産業分野の発表となります.このうちの1件はわたしが関与しているのですけど,他の皆さんの発表を楽しみにしています.
本音を言うと,産業分野からの発表はもっと増えて欲しいなとは思ってます.それと言うのも,今年4月に上海で開催されたDiscovery Summit China 2018には数で負けているからです.DSC2018(と言うのでしょうか?)は,今年で4回目になるので日本での初開催の翌年から始まり,今年もたいへん盛況だったときいています.参加者は300人以上とのことなので,規模はほぼ日本と同じでしょうか.ユーザーセッションが全部で12あって,そのうち2つはSASからの発表なので,発表数はそれほど多くはありませんが,発表企業の分野が偏っていることが特徴的です.半導体が5件,バイオ・医薬が4件,残りは化学が1件だけです.実質的に産業系製造業はほぼすべて半導体ということで中国の半導体分野にかける意気込みが感じられます.それとEvent Highlightsの写真を見ると薬学系のセッションでの女性の参加が目に付きますね.
以下,簡単に要旨を読んでみましょう.
 
1.Yangtze Memory Technologies,Data Analysis in NAND Flash Development and Testing
ご存知のように,YMTCは紫光集団(Tsinghua Unigroup)が中国大手の国有半導体メーカ―である武漢新芯集成電路製造(XMC)の株式の過半を取得て誕生した中国国内最大の半導体メモリメーカーです.発表内容そのものには目新しいことはありませんが,意気込みは感じます.3DNANDフラッシュの量産工場を建設中で,DRAMやファウンドリのラインも計画していると聞いていますから,その勢いのあらわれでしょうか.
2.Western Digital China,Commonality Analysis in Manufacturing Applications of Big Data and Predictive Quality Assessments
あのWestern Digitalからは予測品質評価にJMPを使うという発表がありました.こうして見るとやはりBig Data関連が多いですね.まだ開発業務にはJMP活用はされていないのかもしれません.
3.The Standardization of Big Data Analysis and JMPレジスタードマーク Experimental Flow
この発表者は台湾の大手メーカーとだけで所属企業が伏せられています.ということは宣伝目的ではないということですが,内容はJMPのデモではないかと思われます.中国ではJMP初心者が多いのでしょう.興味はありますが,ちょっと内容は不明です.このようなチュートリアル的な発表は米国では結構目につきます. 
4.Design of Experiments: The Efficient Method to Predict the System Signal Integrity Performance in Volume Production,Intel
実験計画でSignal Integrityの最適化を図るという内容で,シミュレーションにもJMPによるDOEを導入しているようです.何しろあのインテルですから.因みに,ご存知ない方のために付け加えると,Integirityは訳すと「まとまり」「一体」となりますが,Signal Integrityと言ったときは「完全無欠の綺麗な信号波形」を意味します.回路の信号配線は反射で波形が乱れるのですが,回路設計を工夫することで綺麗な波形を得る技術がSignal Integrity(SI)なのです.LCR回路の計算計算ではSPICEという有名なソルバーがありますが,こういうソフトを使ってDOEで回路設計を最適化するという事例のようです.詳細が知りたいですね.
5.Big Data Mining in IC Manufacturing: Defect Prediction Model,SMIC
SMICからはウェハ受け入れ検査にJMPを使うという発表がありました.因みに,要旨にあるWATとはwafer acceptance testの略です.欠陥予測とバーチャルメトロロジーという以前日本でも流行した技術にJMPを使うという内容のようで,個人的にはとても興味あります.
 
中国の発表から伺うに,少なくとも中国の半導体メーカーではJMP導入に積極的であるようです.その理由として推察するに,米国の半導体大手がJMPを使っているからと考えています.

それではまた来週.
タグ:JMP
posted by Tad at 19:00| Comment(0) | TrackBack(0) | JMP

2018年10月13日

統計リテラシー

「統計リテラシー」についてお話することが度々ありまして,以前よりネタを目にするたびに拾い集めています.「Stat Spotting」同様,趣味みたいなものですが,自らの「統計リテラシー」を鍛えるのに役立っています.といっても,話そのものは当たり前なので,わざわざブログに取り上げる意味はないのかもしれません.
一月ほど前にNEWSポストセブンで拾った記事ですが,女性セブン2018年9月27日号によれば「自宅の蔵書多いと子供の算数の成績が上がる、新聞も重要」ということだそうです.全国の小学6年生と中学3年生の200万人を対象に,毎年実施されている「全国学力テスト」の2017年度版の結果が7月末に公表されたわけですが,今回は「保護者アンケート」も同時に実施されたそうです.アンケートの対象は,テストを受けた小6と中3の保護者から12万人をランダムサンプリングしたとのことでかなり大掛かりです.家庭環境や経済状況とテスト正答率との相関関係を調査するというようなことは昔からよくやられています.わたしも「統計リテラシー」のセミナーの題材にしたります.
例えば,よく引き合いに出すのは農林水産省の「めざましごはんキャンペーン」です.食料の自給率向上を目指すに,朝食抜きや食べてもパン食が多いことに対して朝ごはんを食べましょうという政策に則ったキャンペーンです.このPDFの資料の表示に掲載されている「平成23年度めざましごはんキャンペーンポスター」を見ると,小林幸子がお米大使というのはさておき,その下にグラフが掲載されています.少し見にくいのですが,左側には「朝食の摂取習慣」と「テスト」の関係が示されていて,日毎食べると正答率69%,食べないと48%となっています.まあ,正しくは「朝食の摂取習慣」と「テストの平均点」の関係だとは思うのですが,そこは置いときます.統計リテラシーのない親がこれを見たら「うちの子にも毎朝朝食を食べさせなくては」と思うかどうかは定かではありませんが,もちろんこれは疑似相関を示す良い例です.背後に「親の(子供に対する)関心」というような隠れた因子が存在してその影響による疑似相関である可能性が高いことは,言われてみれば誰でも気づくことです.
もう一つ問題があって,相関があるからといってそれが因果関係を示すわけではないということです.朝食を毎日食べるとテストの点が上がるわけではないということです.少なくともこのグラフだけからはその結論は導き出せません.この例のように現象が目に見える馴染み深いものであればこそ常識を頼りに正しく判断できるかもしれませんが,わたしたち技術者の扱う問題では「隠れた因子」を見つけにくく,因果関係を判断する常識も不足している状況が多いものです.
話が逸れましたけれど,上記を踏まえて女性セブンの記事を読んで見ます.面白いのは,この記事に「家庭の蔵書数が多いほど、子供は算数が得意になる」という見出しがつけられていることです.「おやっ」と思い記事をよく読むと,データを調査されたお茶の水女子大学文教育学部の浜野隆教授の話として以下のように書かれています.
「学校で実施されるどの教科のテストも、『問題文を読むこと』から始まります。いわば活字文化の学校において『読む力』はさまざまな学力に直結します」
浜野先生の発言をどう解釈すれば「蔵書数が多いほど、子供は算数が得意になる」となるのでしょうか.この記事を書いたライターは「蔵書数の多い家庭ほど、読書の機会が多いはずで、その分、子供の学力が高くなるのだ。」と考え,「普段から本を読んで書いてあることを理解しようとしている子供は、算数に求められる『論理的思考』能力も磨かれるのでしょう」という教育ジャーナリストの意見をもとに因果関係を想像したようです.親の蔵書数が多い → 子供が本を読む → 「読む力」が向上する → 「論理的思考」の能力が向上する → 算数が得意になる という一連のロジックには,個々に見るとそれなりの説得力があるように思えますが,クリティカルに一つ一つ考察して見ます.
親が本をたくさん持っていれば子供が本を読むようになると言われているのは事実です.おそらくそういう因果関係は特に幼少期にはあるかもしれません.とはいえ,逆に,二宮金次郎は薪を背負っても本を読んでいたわけなので,そういう子供が多ければ相関関係はそれほど高くはなならいはずです.その次の,多くの本を読んでいさえすれば「読解力」が向上する,ことについては『AI vs. 教科書が読めないこどもたち』では否定されていましたし,この記事にあるように Repeating stories is the best way to broaden toddlers' vocabulary.(幼児への絵本の読み聞かせには一冊を繰り返すことが多くの語彙を増やす最善の方法である.)幼児期の研究とはいえ蔵書数は語彙の学習能力にはあまり関係ない,という研究報告もあります.
ここまでは良しとしても「読解力」があると「論理的思考能力」も向上するというのは少し乱暴です.「論理的思考能力」がないと「読解力」もないというのならまだわかりますが.論理的思考能力があると算数が得意になる,という部分はまあそうなのかなとは思いますが,「1ふくろ 8こ入りの チョコレートが 7ふくろと、ふくろに 入っていない チョコレートが 17こあります。ぜんぶで チョコレートは 何こありますか。」という問題に73こと答えた子がバツになる教育をされているとすれば論知的能力があるとむしろ算数の点は下がってしまうかもしれません.(参考
『算数』小2問題 「8×7+17=73」 は間違いなのか?ネットで話題に!
何が言いたいのかというと「蔵書数が多い親の子供は算数の点が高い」という相関関係を示すデータだけから「親の蔵書数を増やせば子供は算数が得意になる」という因果関係を導くのは無理があるのではないかということです.このように「風が吹けば桶屋が儲かる」的な連想の要素ロジックを専門家の意見でサポートして,最もらしい因果関係を仕立て上げそれに断定的な見出しをつけるのはマスコミの常套手段です.
その動機は利益誘導とまでは言い過ぎですが,自らの都合の影響は多分にあるでしょう.例えば,女性セブンは小学館という大手出版社が発行しています.その購読者層は表紙を見れば明らかなように主婦層です.(さだまさしとか小泉今日子ってまだいるんですね.)日本人は本を読まなくなったと言われますが,子供の算数の成績をあげたかったら本を買いましょう,というメッセージを主婦層にアピールしているのです.この行為が不正であるとまでは思いませんが,因果関係にまで踏み込んだ記事には多分にその統計情報の発信者の都合や意図が入っていることをわたしたちは肝に命じるべきです.これは統計リテラシーの基本です.
もう一つ.頭のいい人ほど因果関係の連鎖を想像できるということにも注意が必要です.全然関係ないと思っていた変数間に相関が見出された場合,経験や知識量が多い優秀な技術者ほどその間を繋ぐのがうまいものです.いわば,何らかの仮説を打ち出すことができてしまうのです.今思い出した例があって,面白いので来週書くことにします.このネタは続く可能性があるので「統計リテラシー」というカテゴリーをこの機会に作ります.「Stat Spotting」との区別が曖昧ですがこちらは,日常生活の中で目につく広告が対象ということにしようと思います.
それではまた.
タグ:統計
posted by Tad at 19:00| Comment(0) | TrackBack(0) | 統計リテラシー

2018年10月06日

話術の話

今週は依頼を受けて某所で「統計リテラシー」のセミナーを開催しました.本来のわたしのスタイルは実験計画などの事例指導を兼ねて,自らも技術者の一員として一緒に問題解決に挑むというものなので,通常はセミナーなどを自主的に実施することはありません.もちろん,要望があれば,実習形式のセミナーでJMPの操作なども教えたりしていますが,単なるセミナーはあまりやりたくないのです.講演するならば他にもっとうまい人がいるし,そもそも人前で話すのが苦手だからです.よく「そうは見えない」と言われますが,いつも人前で話すのはとても緊張します.
ロバート・ライト(2017)『なぜ今,仏教なのか』早川書房によれば,お釈迦様も「五つの恐怖」の一つに「集会で恥をかくことの恐怖」をあげておられます.この類の恐怖は社交性が高い人間ほど自らの血統の生存競争に有利であったという事実を踏まえると,人前で話すことに失敗することの不安,即ち社会的な将来性に対する不安に対しての遺伝子に組み込まれた本質的な応答なのです.
と,頭ではわかっていても,やはり,講演が終わった後も,言い足りなかったことや,手順を間違えたことなど,あんなこと言わなければよかったという後悔の念に苛まれます.この性分は話すのが苦手だからとずっと思っていたのですが,徳川夢声(2018)『話術』新潮文庫で夢声さんでもやはり講演のあとは憂鬱になると書かれていて,それ以来あんな話術の名人でもそうなんだと知って,気が楽になりました.この徳川夢声という人物,税務署に提出する書類の職業欄に「雑」と記入していたそうです.わたしも名前は知っていましたが,色々なコンテクストで名前が出てくるので俳優だかナレーターかはたまた作家なのか不明で,いわゆるタレント業と思っていました.この本を読んで漫談家というのが一番近いようです.
色々な話し方の本を読んでいますが,その中でも『話術』はわたしにも得るところ多かったです.久米宏が先輩から新米アナウンサーが読むべき本として推薦されたというだけあって,プロの評価も高いことを知りました.久米宏によるあとがきには,乱暴を承知でこの本の結論をまとめるとして,次の三つがあげられています.
1.人間性を向上させる
2.考える力を磨く
3.人の話をよく聴く
話が上手くなるための三つの要件というところでしょうか.よく考えて人の話を聞くことは心がけていますが,人間性を向上させるなどということが果たして可能かはわかりません.シャガールが良い絵を描くなんて簡単なことだ,それは良い人間であればいいのだから,というような趣旨のことを言っていた記憶があるのですが,確かにピカソなどと比較しても技巧的には優れているとは思えない彼の絵は理屈抜きに良いと感じます.確かに,この本にしかとと書いてあるわけではありませんが,夢声さんも上手く話すなんて簡単だよ,良い人間であればいいんだからなどと語っているように思えてきます.
もう一つ,わたしが話し方を勉強するのにやっていることは,声を出してメールを読むことです.メールといっても広告系の類のものが良いです.これをセミナーの1週間くらい前から,セミナーで想定する声の大きさで話します.そのときラバーダッキングならぬこちらの自作のカモの置物に向かってやります.
IMG_0075.JPGIMG_0076.JPG
厳密にいうとこれはアビという大型の水鳥です.アメリカではルーンと呼び,目が赤く美しく鳴き声に特徴があることでとても人気があります.この置物は凝って作ったので背中のヒナ(この鳥にはそういう習性があります.)が蓋になって中に小物が収納できるようになっています.そういえば,いつだったかのブログでも別のカモを紹介しましたね.少し脱線しましたが,これをやるようになってから人前で話すのが楽になりました.気のせいかもしれませんけれど.皆様も一度お試しください.

それでは本日は簡単ですが.これで失礼します.
タグ:books
posted by Tad at 19:00| Comment(0) | TrackBack(0) | 雑記

2018年09月29日

暗黙知と問題解決

先週の続きを書こうとしたのですが,三週続くと飽きるので急遽話題を変えることにしました.そこで本日は「暗黙知」について解説します.元々は3年ほど前のJMPer’s Meetingで発表した際の配布資料で,(ページ数の制約から最終的に原稿からカットしましたが)『統計的問題解決入門』の第5講のオリジナル原稿の一部にもなっていました.それに少し修正を加えて以下に掲載します.

暗黙知という言葉をご存知でしょうか?どこかで聞いたことあるという方も多いかと思います.「大事なことは言葉では表せない」というようなコンテクストで使われることが今の日本では一般的で,以心伝心とか拈華微笑などとも同意です.因みに,拈華微笑とは,金波羅華の花を拈って見せたお釈迦様に,十大弟子の一人の大迦葉だけがにっこりと微笑んだという説話からきていて,これによりお釈迦様は大迦葉に仏教の真髄が伝わったことを知るわけです.このような話が不言実行を美徳とする日本人のベースにあったのでしょう,経営学者の野中郁次郎先生が,野中郁次郎『知識創造企業』東洋経済新報社で徒弟制度の伝統に由来するノウハウ的な知識の存在を日本的経営の強みとして世界に紹介したとき,それは直ちに日本で流行したのです.その際,この「言葉に表せない知識」を暗黙知と名付けたたことから混迷が始まります.なぜならば,暗黙知とはもともとハンガリーの物理科学者マイケル・ポランニーのTacit knowingの訳語として使われており,両者は全く異なった概念であるからです.
試みに,Googleで暗黙知を検索した最初の3ページの結果を下表に示します.(3年前の結果です.)
88-1.png
この表で並記としているのは,Wikiやコトバンクのような辞書系のページが多く,その他とあるのは,暗黙知の中身には触れていないAmazonのページです.斜め読みですので判別の間違いはあるかもしれませんが,概ね日本では野中先生の暗黙知が主流になっているようです.この中にはポランニーを参照しながら,その説明は野中先生の暗黙知であったりする,やっかいな解説もありました.野中先生の暗黙知がこれだけ広まってしまった以上,私はポランニーの暗黙知は強いて訳さずTacit knowingと英語のままにするのがよいように思いますが,わたしとしては暗黙知という語感が好きなので,ポランニーの暗黙知として今後も使い続けていくつもりです.
それでは,ポランニーの暗黙知とはどういうものでしょうか?実は,これがなかなか説明しにくい概念なのです.実際.マイケル・ポランニー,高橋勇夫訳『暗黙知の次元』ちくま学芸文庫を読んでも「暗黙知とは〜である」とははっきりとは書かれていないので,読んでいてもどかしさを感じます.もともと,1962年のイェール大学における講義を元にして書かれているというだけあって,哲学書というほどではありませんが,やや難解な本ではあります.暗黙知についての解説はわたしの能力を超えていますが,「暗黙知の次元」に出てくる煉瓦職人の例を私なりに以下に解説してみます.
ここに一人のレンガ職人がいて,日夜良いレンガを作ろうと様々な工夫を凝らし,職人としての腕を磨いているとしましょう.彼にとっての良いレンガとは,耐久性に優れた丈夫で安価なレンガであって,そのためにレンガの製造工程では工業技術的原則や彼の経験による原則の制約を受けています.このレンガが何に使われるかに視点を移すと,そこにはこのレンガを使って良い家を建てようとしている建築家がいます.良い家とは,安全性,居住性を兼ね備えたものであり,そのため建築プロセスは建築学で記述されている原則に支配されています.更にこの家の集合体としての街に視点を移すと,そこにも良い街を作ろうとしている都市設計家がいて,やはり都市設計として従うべき原則に支配されています.一方,レンガ職人の下位に視点を移せば,そこにはレンガの材料を供給する会社の技術者がいて,その製造プロセスは物理学や化学の原理に支配されています.以上の記述を表にまとめておきます.
88-2.png
ここで,この階層システムに次の法則が成り立っていることがわかります.
1. それぞれの階層は次の二重の原理に支配される.
a) 各階層の諸要素それ自体の原理
b) 各階層の諸要素によって形成される包括的な存在を支配する原理
2. 下位のシステムはすぐ上のシステムに制限を課す.
3. 直下のシステムが上位システムの支配を免れるとその上位システムは機能しない
4. 下位システムの諸要素を支配する原理によって,より上位システムの原理を表すことはできない.
包括的な存在とは,下位システムから見て上位システムを包含したシステムのことです.これが『問題解決入門』で包括システムと呼んでいるものの正体です.ここには,物理,化学だけでは住み良い街は設計できないという,要素還元主義に対する批判があり,もともとポランニーの議論はそこを目的としていたようです.この議論の過程で,このような階層性こそがシステムの本質であり,この一連の階層性の中で順々に上位のシステムに至る人間の知の動的プロセスを発見したポランニーは,それを暗黙知と呼んだのです.即ち,ポランニーの暗黙知とは,次々と新しく高次のレベルの認知が形成されていくという一連の進化のダイナミズムであって,「言葉にできないものの知ることができる」という人間の生得的な認知能力なのです.

暗黙知の議論にはそこから生成される創発という現象が大変重要です.わたしは創発こそイノベーションへの鍵と考えています.創発についての話は次週とさせてください.

また台風が近づいていますね.皆様もご用心ください.

それではまた.
posted by Tad at 19:00| Comment(0) | TrackBack(0) | 統計的問題解決

2018年09月22日

AI vs. 教科書が読めないこどもたち(その2)

先週の続きです.『AI vs. 教科書が読めないこどもたち』p73の表1-1は「10-20年後になくなる職業トップ25」というリストで,その第4位に「コンピューターを使ったデータの収集・加工・分析」があって.それを見た人からJMPを勉強しても無駄になるのか?と質問を受けました.日本人は本を読まなくなったとはいえ,売れている本の影響力はまだまだたいしたものだと思った次第です.
さて,短い答えを先に言うと,これは誤訳です.この表の出典は松尾豊「人工知能は人間を超えるか」角川EPUB選書とのことで,更にその原典は先週も引用しましたC.B.Frey and M.A.Osborne (2013), "THE FUTURE OF EMPLOYMENT: HOW SUSCEPTIBLE ARE JOBS TO COMPUTERISATION?"  ということは『AI vs. 教科書が読めないこどもたち』にも明記されています.
この論文を読むのは長いのでやや骨が折れましたけれど,リストがどこになるかと探すとAppendix(p61)に,各種職業の将来コンピュータ化されるであろう予測確率が ‘0’ をコンピュータ化されない(not computerisable),‘1’ をコンピュータされる(computerisable)として示されています.ここではコンピュータ化されにくい順に並べてあるので,第1位はレクリエーション療法士です.そして,例の表1-1の第4位に対応するのは699位のMathematical Techniciansであることがわかります.
日本ではTechnicianという言葉は馴染みはないかもしれませんが,米国では厳密にEngineerと区別されていて,わたしも米国赴任中は多くのTechniciansに大変お世話になりました.強いて訳せば技術者に対する技能者というところかもしれませんが,日本語の技能者には解釈はあっても定義はありませんのでTechnicianとそのまま理解しておいた方が無難です.これにMathematicalという限定がつくと,ここ
に書かれているような職業を指します.
1) Translate data into numbers, equations, flow charts, graphs, or other forms.
2) Confer with scientific or engineering personnel to plan projects.
即ち,
1.データを数値,数式,フローチャート,グラフなどのフォーマットに変換する.
2.プロジェクトの計画を練るために研究者や技術者と打ち合わせる.
のがMathematical Techniciansなのであって,それがどうして「コンピューターを使ったデータの収集・加工・分析」と訳されたのかは不明です.「データの収集・加工の作業者」くらいに訳すべきです.分析を含めるにしても定型的な分析業務くらいを考えるべきですね.
『AI vs. 教科書が読めないこどもたち』では「コンピュータを使ったデータの収集・加工・分析の仕事」をホワイトカラーと呼ばれてきた事務系の仕事としているので,おそらくビジネスデータをエクセルで集計したりグラフを書いたりしてまとめる類の仕事をイメージしているのでしょうか.これは引用元の誤訳を読んで著者が勘違いなされたように思います.このような仕事ならばRPA大流行ですから,AIに置き変わるのは既に始まっています.人間を駆逐するのには10年もかからないように思います.
従って,最初の質問に戻ると,「コンピューターを使ったデータの収集・加工・分析」 はおそらく誤訳で「コンピューターを使ったデータの定型的な収集・加工」 を意味しているであろうこと,その上でJMPを使うのであっても,エクセルに代表されるようなデータ集計,視覚化ソフトでもできるようなことをするならば状況は同じであり,JMPを使うならば,JMPならではのことに積極的に取り組んでいかなければならない,というのがわたしの考えです.JMPならではのことの一つに「統計的問題解決」があると考えていますが,我田引水でもあるのでこれについては後日にして,以下ではこの引用の問題点について考えてみます.
引用文献「人工知能は人間を超えるか」は読んだことはないのですが,Math Technisianの仕事を「コンピュータを使ったデータの収集・加工・分析の仕事」と訳すのは間違いです.それをチェックせずに書籍に引用掲載してしまったのは,この本が広く読まれているということを考えると残念です.このことは脇に置くとしても,そもそもC.B.Frey and M.A.Osborne (2013)を(このような形で)引用すべきでないと考えます.
C.B.Frey and M.A.Osborne (2013)は有名な論文なので方々で引用されています.例えば,内閣府の資料「産業社会・労働市場の未来の姿と 求められる人材像」 では「今後20年で,現在のアメリカの雇用者の47%が就く職業がコンピューター化により消滅する.」などと国民を煽っていますが,上述のC.B.Frey and M.A.Osborne (2013)のリストをコンピュータ化されやすい職業のリストとして切り取って掲載しています.このリストは先にも述べましたように,コンピュータ化されにくい順に並んでいるので,それをわざわざ逆にして示すのは少なくとも著者の意図するところではないでしょう.しかも,第12位のデータ入力作業員までは確率0.99で横並びです.因みに34位までは0.98となっていて,順位を議論する意味は全くありません.従って,C.B.Frey and M.A.Osborne (2013)をコンピュータ化される職業のランキングとして引用するのは不適切です.
そもそもMath Technisianの仕事がAIに駆逐されるかというと,かなり怪しいとわたしは考えています.オックスフォード大学の学者の論文であろうとも,中身を確認することが大切です.そうすればこのリストは次の手法で作成されていることがわかります.P33以降を読んでみると次のように書かれています.

First, together with a group of ml researchers, we subjectively hand-labelled 70 occupations, assigning 1 if automatable, and 0 if not.
Second, we use objective o∗net variables corresponding to the defined bottlenecks to computerisation.

ようするに,機械学習で分類する教師データはオックスフォードの研究者が自らの主観に基づいて作成したものなのです.その上で,O*netのデータベースにリストアップされている職業の特徴量の中でコンピュータ化におけるボトルネック(難所)と考えられるものをやはり主観的に選択しています.(p31のTable I参照)その上で,このデータをもとにして機械学習でモデルを作成し,それを他の職業に適用してコンピュータ化される確率を出しています.
技術系の例えをするならば,製品の合否を1,0判定した結果を教師データとして,合否に関係が深いと考えられる製品の特徴量(例えば,特定箇所の線幅とか特定工程の欠陥数であるとか)で名義ロジスティック回帰を実施し,そのモデルで製品の合否を(特徴量をもとに)予測するということをしているわけです.おそらくJMPでもできる処理です.
ですから,『統計的問題解決入門』でもお話ししましたように,得られたモデルの信頼性は現実に照らして確認しなければなりません.この論文で20年後に消滅すると予想された職業が本当に消滅していれば,このモデルが正しかったと判断できるわけですが,残念ながら未来の予測は確認実験をすることができません.
このようなケースはわたしたち(技術系の)仕事でも良くあるケースですが,こういうときは(ある意味危険を承知の上で)技術者の経験と常識を杖にするしかありません.この際,注意すべきことはこのリストにあるは「10年から20年後に残る仕事,なくなる仕事」ではないということです.その仕事がロボット化されて職人を駆逐するのでもなければ,技術の向上,文化習慣の変化によってその仕事が消滅するというのでもなく,その仕事は高い確率でコンピュータ化されると予測されているにすぎません.この意味ではAI化されるといったほうが正確です.WEBではこのことを誤って認識されている方がいましたので補足しておきます.
ところで,時計修理職人の仕事がAI化されると思いますか?その他にも,3位の「手縫いの仕立て屋」13位にもまた出てくる「時計の組立・調整工」はO*netの定義では「時計修理工」と区別されているようですが,いずれにせよAI化はむしろ難しい職業のように個人的には感じます.19位の「スポーツの審判員」なども微妙なところです.今でもビデオ判定などは一部のスポーツに導入されてはいますが,審判に要求されるのは視覚による判断だけではありません.テニスのコードバイオレーションは最近も物議を醸していますけれど,コード・オブ・コンダクトには9項目もあって,その中にはAI化が困難な項目もあります.Unsportsmanlike Conduct(スポーツマンシップに反する行為)などは主審の主観的要素も多分に影響されるといってよいでしょう.AIが審判すればプレーヤーがそれに従うとも思えません.最近このことは実証されたばかりです.そもそも,時計修理工の仕事 にはFinger Dexterity(指先の器用さ)が必要とされていて,それはAI化のボトルネックの特性とされているにも関わらずリストの第6位にあるのはなぜでしょうか.
以上を踏まえると,この論文で作成されたモデルの信頼性は如何なものかとわたしは思うのです.コンピュータ化される職業のリストはオックスフォード大学の機械学習の研究者の主観的な主張が色濃く反映されたものです.その主張とは,結論でもあってそれはp40に書かれているように,コンピュータ化の流れに打ち勝つにはcreative and social intelligenceが重要だということです.このような主観で教師データを作成したならば,それによるモデルはその主観を数式で表現したものにすぎません.
そもそも『AI vs. 教科書が読めないこどもたち』では機械学習にネガティブな主張がなされています.東ロボくんの英語チームはディープラーニングを使っていたそうですが,既存手法よりもよい成果が得られられなかったとのことです.この失敗を「ディープラーニングの限界を目撃した瞬間」とまで言っています.因みに,ディープラーニングは機械学習の一つで「教師データなし」で,高速かつ低コストに精度良く予測できる可能性がある手法というだけのことです.p33には「機械学習で大切なのは特徴量をどう設計するかであって,それが現実世界をうまく反映していれば判定精度は上がりますが,そうでなければデータを撫養しても無駄」「人間の直感を頼りにすると,思い込みに惑わされることもあれば,意外な漏れもあります.」と正しく認識されているのにもかかわらず,機械学習の結果である「10-20年後になくなる職業トップ25」を主張の根拠の一つとして無批判に使ってしまっています.オックスフォードの研究者の論文というだけで」盲目的に信じてしまっている訳ではないと思いますが,人は見たいものを見るものですから,自分に都合の良い論説は信じてしまうものです.このことを自らの戒めとして再認識しました.良い本なのにこの点だけは残念に思います.
ところで,今回の記事のカテゴリーは「書評」ではなく「Stat Spotting」にしたのですが,それには訳があります.記事を書く機会に,読み返してみていくつか気が付いたことがあったからです.本日は長くなりましたので一旦筆を置き,続きはそのうち書こうとと思います.

それではまた.
posted by Tad at 19:00| Comment(0) | TrackBack(0) | Stat Spotting