source:  lifehacker.jp スタンフォード大学博士課程の学生である Richard Socher さんは、Googleや他の会社が構築しようとしてきた「人間の言葉を理解する神経ネットワーク」のことを評価しながらも、こう考えていました。「自分た...

11:18 by aceartacademy
source: lifehacker.jp





スタンフォード大学博士課程の学生であるRichard Socherさんは、Googleや他の会社が構築しようとしてきた「人間の言葉を理解する神経ネットワーク」のことを評価しながらも、こう考えていました。「自分たちの研究の方が、もっと役に立つ」。

そして彼らは、望む人すべてに自分たちのコードをシェアしようとしています。

Socherさんは、機械学習の専門家やコーセラの共同設立者であるAndrew Ng教授も含むスタンフォード大学の研究チームとともに、文章に込められた感情の85%を正確に分類できるコンピュータモデルを開発しました。

このモデルは、文章全体のトーンがポジティブなのかネガティブなのかを見極めることができるもので、すでにこれまで、最高で約80%の精度を誇っていたといいます。この手の分野では、通常1%でも向上すれば御の字というところなので、開発を経て5%も上がったのは大したものです。

さらにこれは、ビジネスにおいても大きな意味をもちます。というのも、オンラインで人々がどんなことを言っているのかを理解する作業を、これまで以上に自動化しようというのです。ツイート、感想、ブログ記事など、自分の意見を表明するものすべてを逐一見て、意見をいくつかに分類したり、データベースに入れたりすることに人間を雇うのは、間違いなく非効率的です。感情や分析や、ソーシャルメディアの監視に対する初期のアプローチは、文脈をとらえていないひとつの言葉に捕われてしまううこともよくあり、かなり大雑把なものでした。

Socherさんのチームは、ひとつの言葉に捕われるのではなく、文章全体で文脈を捉えることに成功しました。オンライン上にある約1万1000点の映画の感想(主に米大手映画レビューサイト「 Rotten Tomatoes」のもの)を使い、「Sentiment Treebank」を作りました。Sentiment Treebankの目新しさは、1万1000もの文章を21万5000以上のフレーズに分け、それから人間がそれぞれのフレーズを、Amazon Mechanical Turkを使って「とてもネガティブ」から「とてもポジティブ」まで分類しているところです。

研究チームはさらに、「Recursive Neural Tensor Network」という新しいモデルを構築しました(「Recursive Neural Networks」という既存のモデルを進化させたもの)。すべての単語やフレーズを数字に置き換え、お互いがどのような関係にあるのかを計算するというものです。

映画レビューのような言語的に複雑な内容の文章を処理する時は、文章全体の意味を形成するために互いの単語がどのように作用しているかを、きちんと理解することができるモデルが必要だと、Socherさんは説明していました。映画の感想のような文章では、単語の順番や、単語同士の結びつき方が、とても重要な意味を持つからです。

Socherさんの言葉を端的に表す例を挙げましょう。

「まったりとして、同じ事を繰り返す部分があったが、しかしそれが興味を惹き付けるスパイスになっている」

こうした文章では、「"しかし"の後にくる言葉は、"しかし"の前にくる言葉よりも重要です。ひとつの単語やひとつのフレーズに焦点を当てるモデルでは、この辺りの文意を拾い上げることができません」(Socherさん)



やがては絵文字も解析!?

Socherさんは、このモデルの精度を95%まで上げることができると考えているようです。ただし完ぺきにはできないだろうとも思っています。しかし、常に決まった単語の組み合わせで、文章の構造や専門用語や隠語などもなければ、このモデルは効果的にパターンを認識できます。

たとえば映画の感想を解析する練習では、絵文字はほとんど使われていなかったので、Socherさんの研究チームは絵文字の入った文章も追加しています。

他にも、単語の形態を分析するアルゴリズムも開発しなければなりませんでした。たとえば「absurdly(ばかばかしいほどに、驚くほど)」という単語は、そこまで頻繁に使われる単語ではありませんが、このアルゴリズムは「ly」が接尾辞として付いている単語であればまったく新しい単語として登録しなくても、予測をして判別できます。

Socherさんと研究チームが長年研究してきた、新しいモデルとSentiment Treebankは、より幅広い意味をとることができるようになっています。GoogleやFacebook、Microsoftなどの会社が、画像認識や、音声認識、言語理解というような分野で公表してきた研究のお陰でもあります。(SocherさんはMicrosoft Researchの研究員でもあります)先日IBMは、4つの有名大学との共同研究として、この分野をさらに深く研究したものを発表していました。

Socherさんは、自分たち以外でも素晴らしい仕事がなされているのは認めていますが、ひとつの単語や画像認識において、商業的な実用性どれだけあるのかは、(少なくとも今のところは)確信していません(Googleやその他の会社はおそらくこの意見に反対でしょうが)。Socherさんとスタンフォードの共同研究社たちは、感情の分析はさておき、フレーズや文章に焦点を当ててきたので、このモデルは機械翻訳や文法解析、論理的思考のような分野の性能を上げるだろうと語っています。

「単語ごとに置き換えるような翻訳はしません。実際には文章全体や長いフレーズを、単語の並び方を無視することなく、ベクトル空間に吐き出すのです」(Socherさん)。