UA-115498173-1

2018年08月11日

台風とJMP

アドインの話の続きを書こうと思ったのですが,同じ話が続くのは避けて本日は台風の話でも.
先日の台風は,合同台風警報センター(JTWC)ではかなり前から上陸はしないとの予報でしたが,気象庁の予報では数日前まで関東直撃でした.個人的にはJTWCの予報の方が当たるような気がしているのですが,まっすぐに関東地方に向かってくるのでどうなるかと興味深く観察していました.結局,JTWCの予報通りになり,何事もなかったように過ぎ去ったわけですが,犬吠埼に最接近した以降の後半の進路は定性的には気象庁の予報に近かったようにも思います.気象庁も予測精度については米軍に引けは取らないのでしょうけれど,台風の進路の長期予報をしてくれないのが難点ですね.おそらく予報が外れ(国民生活に大きな影響が出)ることを恐れているのでしょう.それと,ワーストケースを想定して予報を出しているのかもいるのかもしれません.その予報をもとに市町村が防災対策を立てるので,予報を信じて対策を怠るようなことのないようにという配慮もあるのかと勘繰りたくなります.狼と少年という童話もありますし,おそらく,そのようなことはないと思いますが.
知り合いと話していて,梅雨明けが早かったり,この時期に台風が来たりとどうも季節が早まっているのではないかと言うので,そうかな?と思って調べてみました.今日はその話です.
私の感覚でも台風は9月のものなので,それはなぜかと考えるにおそらく夏目漱石の二百十日にあるのではないかと思い当たりました.このほぼ会話文からなる物語は漱石の実体験に基づいたものだそうで,タイトルの二百十日とは立春から数えて210日目のことで,今年は9月1日になります.この日は台風が来る確率が高い日と言われていて,実際,物語で主人公は台風に遭遇します.おそらくデータに基づいたものではなく台風の備えを怠るなという農家の警戒標語のようなものだったのではないでしょうか.
9月1日に日本に到来するということは発生は8月ということになります.このことをデータをもとにJMPで10分可視化してみます.このブログをご覧になっている方にJMP歴半年未満のかたもいらっしゃるということを最近知りましたので,少し丁寧に手順も書いておきます.
まずデータは気象庁の「台風の統計資料」にあります.ここには統計を開始した昭和26年(1951年)以降の台風の発生数,接近数,上陸数がテーブルで表示されていて,2017年までに記録はCSVフィルでも提供されています.このデータをJMPに取り込むのにもっとも簡単なのは「ファイル>インターネットから開く」でURL入力画面を出して,例えば発生数ならば「https://www.data.jma.go.jp/fcd/yoho/typhoon/statistics/generation/generation.html
を入力することです.「OK」でそのアドレスにあるテーブルの種類が表示されますので,「2017年まで...」のほうを選択して「OK」です.
さて,このJMPテーブルを分析・可視化するにはもうひと手間かけなければなりません.まずは「年間」列は集計値なので削除します.次にデータを名義尺度から連続尺度に変換しますが,ここらへんがノウハウと言うのかもしれませんが,いきなり「列情報」を呼び出すよりも,先に「テーブル>列の積み重ね」を実施しておきます.(もっとも,「列属性の一括設定」を使えばたいした手間の違いはないのですが.)それから尺度を変換して,その際欠測値になったデータに0を入力します.もちろん「列>再コード化」を使ってください.「年」列は名義尺度のままでかまいませんが,「年」という値が入っている行を選択してでそれらを削除します.積み重ねを先に実施しておくと,データフィルタを使わないでも下の方にまとまっているのでこういうときに便利です.同様に接近数と上陸数も加工しておいてから,「テーブル>結合」です.
さて,ここまでくれば後は楽しいグラフ作成のお時間です.グラフビルダーでどんなグラフを描こうか考えるとワクワクしますね.色々トライ&エラーを繰り返しつつ,今回は発生数,接近数,上陸数というデータがあるので,それらを積み上げた棒グラフにしようと思いつきました.そのためには,発生数から上陸数と接近数とを差し引いた数を「その他」と定義して日本に関わらなかった台風の数を計算しておきます.そうするとこんなグラフが描けます.この図で青が接近数,赤が上陸数,緑がその他です.
image001.png
一つ注意があって,この「その他」の定義では月をまたいだ台風の活動が正確にカウントされません.ですので,値がマイナスになったりもしますが,平均値にするとそこらの粗は隠れますし,まあ,とりあえず積み重ね棒グラフにしたかったので細かいことは目を瞑ります.この図から読みとれることは,台風の発生は8月が一番多いこと,9月は上陸数は8月と同程度であること,10月は7月並みに台風は発生するけれど日本に関わらないものが多い,などなど.
 これだけでは面白くないので年を読み込みます.異常気象などと絡めるならば別の気象データが必要になりますが,この場では「グループY」にドロップします.水準を三つにしたのがこの図です.
image002.png
 どうでしょう.予想に反して,1974年以前と比較して近年(1996年以降)はむしろ9月に台風が多くなっているようです.特に上陸した台風の数は9月の方が多くなっているくらいです.従って,台風に関する限り季節はむしろ遅れていることになります.
 とはいえ,データからは台風は8月のものと言ってもいいようです.とはいえ,私たちの意識では台風は9月のイメージ.この解離はなぜかと気象庁のデータを見ならが考えるに,9月が台風の月と思われている理由を見つけました.中心気圧が低い台風 (統計期間:1951年〜2018年第5号まで)ワースト10が載っていますが,このうち8月上陸は2つ,9月7つ10月が1つとなっています.9月の台風は過去に大きな被害をもたらしたのでそれだけ人々の意識に残っているのでしょうか.
まだまだ二百十日まで間があり,これから本格的な台風シーズンを迎えることになりますが,皆様も対策怠りなきよう.
それではまた.
タグ:JMP
posted by Tad at 19:00| Comment(0) | TrackBack(0) | 雑記

2018年07月14日

あひる三題


それほど気温が高いというわけではないのですが,日中歩いていると体力を消耗する日々ですが皆様いかがお過ごしでしょうか.PCに向かうのも怠いので今週は暇ネタにしようと思案しつつ,ツイナビを眺めていたら,「あひるが見える人は病院へ」という見出しが目にとまりました.その写真には確かに二羽のあひるが見えます.これはまずい...実はわたしは鴨とかあひるとかの水鳥が好きで観察に出かけて写真を撮ったり,カービングで木工作品を作ったりしています.たまたま昔作った写真が手元にありましたので,始めた手の頃でまだ下手なのでお恥ずかしいのですがこんなのを作ってます.
かも.jpg
胴体に線が入っているのがお分かりと思いますが,ここで二つに別れるようになっていて,頭部が蓋で胴体が小物入れになっている仕様です.色は塗っていませんが,チェリーのブロックを使ったので経時変化で赤くなっています.
さて,このブログとあひるを強引に紐付けると,本書p175のひとやすみで書いた「醜いあひるの子の定理」があります.この定理を命名した背景は定かではありませんが,おそらく渡辺先生はこの世のいかなる差別をも主観のなせるものと看破することを意識して証明されたのではないでしょうか.問題解決の観点から考えると意思決定には主観が必ず入るということが証明されているということです.考えてみれば,仮設検定にも有意水準という主観的な要素が入っている訳で,このことからもF検定で導かれる統計モデルにも主観的な要素が入っていることに気付かされます.
問題解決にはもう一羽あひるがいます.問題をロジカルに考えるときに使う手法のラバーダッキングです.手法と言っても簡単なもので,誰かにその問題について教えることで構造を整理しつつバグや解決法を見出すことです.プログラミング分野以外ではあまり使われないかもしれませんが,何かの問題を考えるときはとても有効な手法です.その誰かはなんでもよく例えば赤ん坊がお風呂に浮かべて遊ぶ玩具のゴム製のあひる(ラバーダック)であってもいいわけです.事実,あのエニグマの解読で有名なチューリングもこのブログ記事によれば,PorgyというTeddy Bearを前にしてラバーダッキングしていたそうですチューリングの不遇な最後を思うに,醜いあひるの子の定理がもう少し早く証明されていればと考えてしまいます.コンピュータ科学に偉大な足跡を残した科学者が,エリザベス2世女王の名をもって正式に恩赦されたのは2013年ですからまだ記憶に新しいところです.
チューリングの場合は講義の練習でラバーダッキングしていたそうですが,このようにプログラミングに限らず,人にものを教える過程でいろいろな粗に気づくことはわたしも常に経験しています.皆様も一度お試しください.
最初に「あひる三題」と名前をつけてしまったので,もう一羽のあひるを探しています.最近どこかで見かけたのですが...思い出しました.あひる本です.Stanを少し勉強しようかと思って松浦(2016)『StanとRでベイズ統計モデリング』共立出版に行き着いたのですが,この本はあひる本と呼ばれています.その理由はお分かりでしょうか?表紙のレゴブロックの構造物があひるだからだそうです.うーんちょっと見えないです.最初のツイナビの写真の方がアヒルに見えました.

三連休暑い日が続くようです.皆様も体調にお気をつけください.それではまた.
タグ:問題解決
posted by Tad at 19:00| Comment(2) | TrackBack(0) | 雑記

2018年06月16日

シンギュラリティなるもの

今の時期はいろいろな会社のカンファレンスが目白押しで,先日もIBMの統合イベントに参加してきました.去年まではクラウド系のイベントとWatson Summitという別のイベントを分散して開催していました.クラウドあってのWatsonで参加者も被るでしょうから自然な流れとはいえます.私自身はクラウドでシステムを構築するような仕事はしませんが,コンサルテーションでときどきこういった知識が必要になることもあります.前日にはデベロッパー向けのイベントも開催されて,私もその端くれとして参加しました.IBMはデベロッパーを育て,スタートアップ企業を支援する懐の深い会社と毎度のように感心します.今年はこれらのイベントを「Think」というキーワードのもとに一つに統合しました.
Thinkと言えばIBMがThinkPadをレノボに売却したのが2005年,あのときから今のクラウドの時代を見据えていたとすれば,先を予測することがいかに重要性なのかがわかります.とはいえ,7年間にわたって米IBMと一緒に仕事していたわたしにとって,昔のIBMが変わっていくのは寂しい気もしています.少し前に当時の同僚というかルームメイト(あちらでは執務環境として個室あるいは2人部屋が与えられていました.)と連絡とりあったら,彼はもう半導体には関わっていないでIT関連のマネージャーをやっているとのことでした.
少し前にBOXのイベントもあってそちらにも参加してきたのですが,そこにIBMが出展していたので「呉越同舟」なのではとも思いましたが,聞けばIBMはプライベートクラウドとパブリッククラウドとをわけて考えていて,それらを統合したハイブリッドクラウドが自社の強みと考えているようです.確かに大企業では既にクラウド上で構築したシステムが稼働しているでしょうし,セキュリティ面でも現実的なソリューションだと思います.
基調講演はこの4月に社長になったばかりのエリー・キーナンさんからスタートしました.前のポール与那嶺さんは米国籍の日系三世とのことで日英語ネィティブなので流暢な日本語で話されていましたが,キーナンさんは英語です.とはいえ大変聞きやすい英語で,しかも話し方がうまいですね.その後に登壇した某日本企業の講演が原稿を読んでいたのに比べると対照的でした.BOXのCEO兼共同創業者のアーロン・レビーさんの講演も自分の言葉で話していることがよくわかりました.何よりもお二人のスピーチは勢いがありました.これに比べると,日本人の講演はリズムが感じられません.自らの話し方についても反省するところあります.
セッションの講演内容はここでお話しするには少しズレているのでやめておきますが,一つだけ言及しておきます.電気通信大学大学院 人工知能先端研究センターの坂本真樹先生の「AIの進化・ビッグデータ活用がもたらす近未来予想」に興味があり,会場もキャンセル待ちが出るほど人気だったのですが,一般人向けの市民大学講座というような内容で,あのイベントにくるレベルの人には少し物足りない内容でした.第3次AIブームとかはどうでもいいので,ご自身が研究されている「感性」に関するお話を中心にして下さったほうが面白かったと思います.気になったことが一つ.シンギュラリティを説明するくだりで,AIが人間を超えるとかAIによって職を失うとかの危機感をあおるマスコミ論調が垣間見えたことが気になりました.
シンギュラリティは特異点ですが,この文脈で使うシンギュラリティはレイ・カーツワイルが使いだしました.この人,神出鬼没というか得体のしれない天才です.その昔,わたしが入社して初めてのボーナス(+α)で買ったのがKurzweilという電子ピアノでした.Kurzweilはカーツウェルと呼ばれていたので最近まで気付かなかったのですが,Wikiによればなんでもカーツワイルさんがスティービー・ワンダーに乞われてKurzweilの電子ピアノを開発したのだそうです.YAMAHAやRoland,KORGでなく,なぜこのメーカーのものにしたかと言うと,圧倒的にピアノの音質が良く,しかも鍵盤のタッチが生ピアノに大変近かったからです.このKurzweilが故障して修理してくれたサービスマンにMacintoshを勧められて,それ故にJMPユーザーになって今に至るということを思い起こせば,カーツワイルさんがいらっしゃらなければこのブログを書いていることもなかったかもしれません.
私は自分のセミナーでもAIの話をすることがありますが,そこでシンギュラリティの話は避けて通れません.そこではシンギュラリティ(技術的特異点)とはAIが人間の知能を超える時点(2045年とされています)であるというマスコミの論調は間違いであること,正しくは人類の能力が無限大になる(特異点)であって,それにより生物的進化速度を技術(AI)で加速することなのだと言っています.著作をよむと彼は非常にオプチミストとわかりますから,AIは人類に明るい未来をもたらすものであって脅威にはなり得ないとお考えでしょう.Ray Kurzweil(2005),The Singularity Is Nearにはシンギュラリティ以降の世界として,脳のスキャンによるデジタル化とかナノボットで臓器が不要になるとか現時点ではSFの技術が出てきますが,五感全てを組み込んだ完全没入型のVRというのは最近ではSFとも言えないようになってきました.人間は騙すのは簡単ですから.
人間とAIの競争という点で言えば,人間がAIに囲碁で負けたと聞いて驚いても,人間がF1マシンに100m走で負けたと聞いて驚きますか?という点につきます.いわば負けるのが当たり前と思います.但し,消費電力は人間の脳が20WでGoogleのアルファ碁が25万Wといいますから,単位電力当たりでは間違いなく人間の勝ちです.最近はボタン電池で稼働する低消費電力マイコンなどもありますが,20Wでは一手指すのにどれくらい時間がかかるのか.名人戦のリーグ戦では5時間ある持ち時間もNHK杯戦では「なし」ですから.AIが電気的なスイッチでなく,人間の脳のような化学的スイッチを採用したコンピューターに実装されれば,そこらへんも変わってくるかもしれません.けれどこのときは,人間並みの遅さになるように予想します.もちろん,今の人間の脳が最適解というわけではないのですが..
私のセミナーでは,シンギュラリティにはじまって強いAI(あるいはAGI)へと展開し,今の時代の技術者はどうあるべきかをお話ししているのですが,今日は時間になったので,そのうちここで書こうと思います.
本日は完全に無駄話でした.それでは,また.
posted by Tad at 19:00| Comment(0) | TrackBack(0) | 雑記