書籍レビュー:『自然言語処理』著:黒橋禎夫

★★★★☆

放送大学の教材です。一度見送った試験の受験資格が半期後まだ切れていなかったので、ダメもとで受けることにしました。

自然言語処理、とは機械による言語処理のことです。ぼくは言語をうまいこと理解できないので、機械が理解できるように言語を理解できれば、楽になるのでは?という期待をもってこの教科を取りました。

機械が言語を理解する方法は、私たちが学ぶ文法と全然違います。日本語・英語どちらの解釈にも「主語」「述語」なんて存在しませんでした。英語の5文型っていったい何だったんだろう?機械にとっては人間用の文法って曖昧すぎるんですね。

機械ではまず文を単語に分解して、句を作って、意味を考えると句と句がどこに係っていくのかを解析し…というような、ボトムアップの手段を使います。人間が機械に意味を教えてやるのは手間がかかりすぎるので、機械学習でweb上から大量の文章をインプットして、その結果『「包丁」と「切る」は親和性があるな』などという情報をスコア化して保存する、といった作業を高速・大量に続ける地道な方法を取らざるを得ないようです。コンピュータが発達したからこそ可能になったことですね。

200P程度では概論しかわからなかったので、実際の処理も作ってみたいです。

ここら辺を参考にして、twitterにそれっぽい文章を自動で投稿するbotを作ってみたいです。


コメントを残す

メールアドレスが公開されることはありません。