以前の記事で、ネット上のスポーツやグルメ、旅行やニュースといった、いろいろなジャンルのコラムや記事をEvernoteにクリップして、コレクションしているということを書きました。
クリップするときに、記事にはタグをつけて整理するようにしています。それこそ上にあげたように、グルメ、トラベル、レシピ、ブログ、スポーツ、話題、IT、ニュースといった具合。で、野球の記事は特にたくさん読むので、野球という独立した一つのタグにしています。
さらに、野球関係の記事には、プロ野球、高校野球、大学野球、社会人野球といったタグも同時につけて細分化し、高校野球関係の記事には、さらに都道府県のタグもつけています。なので、こないだ春の選抜で優勝した東海大相模の記事があったとしたら、「野球」「高校野球」「神奈川」という三つのタグがつくわけですね。
このタグですが、ある程度たくさんクリップしたら、WebクリッパがAIで予測して表示してくれます。で、その通りだったらそのままクリップするし、間違っていたら修正してクリップする。これでまたAIが学習する、といった具合です。しかしこれがなかなかの的中率で、競馬の記事なんかだと、大抵「スポーツ」「競馬」というタグを出してくれます。もちろん完璧じゃないので、サッカーの記事なのに「野球」「プロ野球」というタグを出してきたりもしますけど、それはまあ致し方ないところであります。
そして、今日もいそいそとクリップに励んでいて、プロ野球の記事をクリップしたら、AIが「高校野球」「香川」というタグを出してきたんです。普段は「高校野球」のタグが出てきても、都道府県まで特定することは稀。なんでそんな自信満々に香川とまで特定してきたのかと考えたら… その記事が中日ドラゴンズの高松選手の記事だったからだと察してしまいました!
わっはっは!確かに、香川の高校野球の記事では高松商の記事が多かったかもしれん!それで、「高松」=「高校野球」&「香川」と学習してしまったわけか!AIもなかなか可愛いところがあるじゃないか!と笑ってしまったわけです。なんというか、そのポカの単純さと、最先端のテクノロジーとの乖離が面白くて、可愛くて、愛おしくなってしまった、というお話でした。
ちなみに、私もAIの勉強は少ししたことがあって、AIを使った何かを作ってみたいということで、プロ野球パ・リーグの選手の顔写真を読み込ませて、私自身や有名人の写真を入力し、「一番どの球団っぽいか?」というのを判定させるプログラムを作ったことがあります。その結果によると、私は西武顔だそうです。まさか、中村選手、山川選手の顔だけで判定してないよね…(作った当時は渡部選手は入団前)