書籍レビュー:『自然言語処理』著:黒橋禎夫

★★★★☆

放送大学の教材です。一度見送った試験の受験資格が半期後まだ切れていなかったので、ダメもとで受けることにしました。

自然言語処理、とは機械による言語処理のことです。ぼくは言語をうまいこと理解できないので、機械が理解できるように言語を理解できれば、楽になるのでは?という期待をもってこの教科を取りました。

機械が言語を理解する方法は、私たちが学ぶ文法と全然違います。日本語・英語どちらの解釈にも「主語」「述語」なんて存在しませんでした。英語の5文型っていったい何だったんだろう?機械にとっては人間用の文法って曖昧すぎるんですね。

機械ではまず文を単語に分解して、句を作って、意味を考えると句と句がどこに係っていくのかを解析し…というような、ボトムアップの手段を使います。人間が機械に意味を教えてやるのは手間がかかりすぎるので、機械学習でweb上から大量の文章をインプットして、その結果『「包丁」と「切る」は親和性があるな』などという情報をスコア化して保存する、といった作業を高速・大量に続ける地道な方法を取らざるを得ないようです。コンピュータが発達したからこそ可能になったことですね。

200P程度では概論しかわからなかったので、実際の処理も作ってみたいです。

ここら辺を参考にして、twitterにそれっぽい文章を自動で投稿するbotを作ってみたいです。


書籍レビュー:『英文法・語法のトレーニング 基礎講義編』著:風早寛

★★★★★

語学は慣れが全てだと思っています。誰でも慣れればマスターすることができます。なぜならこの文章を読んでいるあなたは日本語を慣れだけでマスターしているからです。でも慣れだけだと時間がかかります。だってあなたが日本語をまともに話せるようになるには少なくとも10年はかかりましたものね。

ここで登場するのが文法です。文法はある言語についてネイティブが無意識にやっている慣習をまとめて体系化したものです。「最低限これだけ覚えとけばいいよ!」という骨組みのようなものです。どんな言語でも、必要最低限の文法を学ぶのには1年もかかりません。文法をまず最初に覚えると楽です。文法は語学学習のショートカットのためのツールです。

文法は慣習ですので、どうしても覚えるしかないことがたくさんでてきます。例えば「giveは第4文型を作る」「I am possibleという英語はない」のはなぜか?という理由としては、突き詰めると「みんながそうしているから」としか言えません。

日本語だって慣用のかたまりです。

あんまり知られてない?! 日本語で外国人がくじけるとこ

英語と比べると日本語は文の形は自由だし活用はむちゃくちゃだし主語はいらないしフリーダムです。英語って文型5つしかないんだよ、必ずだよ、楽だよね。

ということを授業で話そうかなと思いながら読んでいました。

本書は「基礎講義編」と銘打っているように中学修了程度の生徒が読むことを想定しています。易しく読めますが対話形式にもかかわらず内容は深く、覚えるしかない表現も相当カバーされているので、これ1冊を数回まわしたらセンター英語の文法問題は9割以上解けちゃうんじゃないかな、という印象を受けました。5文型、分詞、仮定法の解説に特にページが割かれています。Lesson50の分詞「長文読解に応用する」は英文に慣れていないとつまづきやすい「これは分詞なの?述語動詞なの?どっちなの」かを解決する方法が明快に説明されていました。大学受験用の英文法で使う用語を全部忘れたので復習用に読んだのですが、面白い本でした。

あとで気がつきましたが、著者は速読英単語と同じ風早寛さんでした。速読英単語は受験時代にお世話になった単語集ですので懐かしいです。

 


書籍レビュー: 日本語使いは空気読まないと死ぬ『日本語学入門』 著:近藤安月子

★★★★☆

 

新年3冊目です。このペースでは年100冊に到達できるかどうかギリギリですね。

から九時まで五時です

私は日本語が上手ではないという自覚がありますので、日本語に関する本をいくつも読んでいきたいと思っています。外国語学習が趣味なので、言語をシステマチックに分析するのも大好きです。そんな欲望を満たすのにうってつけなのが外国語学習者が手に取る日本語学習本です。日本人だとアタリマエに思っていることは外国人からするとすべてアタリマエではないということが分かります。

例えば英語圏の人がよくやる間違いは次のようなものだそうです。

郵便局は、から九時まで五時です。(P2)

これは”The post office is open from 9 a.m. to 5 p.m.”をそのまま訳したことによる間違いです。でもなぜだめなんでしょう?語順を変えて「郵便局は、九時から五時までです。」なら問題ありません。文の要素は全く同じなのに上の例だと文になりません。これは日本語が後置詞型言語といって、「から」や「まで」などの接続詞を名詞のあとに持ってくる言語だからだそうです。英語は逆にfrom~やto~などを名詞の前に持ってくる前置詞型言語です。そういえば学校では後置詞なんて習いませんでしたね。

日本語は活用形多すぎ

外国人から見た日本語、のように日本語を客観的な学問の体系として組み立てた「日本語学」は私達が中学校で習う文法とはいくつか違いがあります。

例えば形容動詞。「きれいだ」「元気だ」など「だ」がついたことで私達を惑わせたうっとおしい品詞でしたが、日本語学に形容動詞は存在しません。日本語学では

「名詞+だとほぼ同じじゃん?区別する意味なし」

と判断されています。また、助動詞もありません。これらは全て動詞の活用として扱われます。ですので動詞の活用は次のようなとんでもない数に膨れ上がります。

辞書系:書く

マス形:書きます

テ形:書いて

タ形:書いた

タラ形:書いたら

タリ形:書いたり

否定形・ナイ形:書かない

受け身形:書かれる

使役形:書かせる

使役受身形:書かせられる

可能形:書ける

バ形:書けば

意向形:書こう

(P8)

13もあります!私たちが習った五段活用と比べるとずっと多いですね。フランス語やドイツ語の活用の数多すぎだろとごねるのはやめます。日本語の方が難しいです。英語に至っては活用なんて過去形と過去分詞くらいしかないしちょろいもんですよね。

常に空気読まされる日本語

日本語に特徴的に多い助詞が終助詞です。「ね」「よね」「よな」「な」などを文末につけて、どのように出来事をとらえているか、どのように聞き手に伝えたいかを表します。

日常会話から「ね」「よね」「よな」「な」などの終助詞を無くすと、伝達に支障をきたす恐れがあります。「いい天気ですね」ではなく「いい天気です」、「そこに段差がありますよ」ではなく「そこに段差があります」と言われたら、聞き手は一瞬反応に戸惑うことでしょう。(P123)

終助詞は、日本語使いに空気を読むことを強いています。終助詞が断定なのか疑問なのか同意なのかにいつも耳を澄まさなければいけませんし発話のたびに毎回適切な終助詞を選ばなければいけません。例えば次の天気についてのよくある会話のバックグラウンドについての解説をご覧ください。

(1) A:いい天気です。 B:そうです

(中略)

(1)では、Aは、Bが知っているはずの情報についてBの同意を求めています。このような場合には、AもBもネを使わないと、伝達に支障をきたします。言うまでもなく、いい天気であることはAとBが会話の場で共有している情報で、新しくはありませんが、それを確認することを通してAはBに共同注意を促したり、BはAに対する共感を表明したりすることができます。このような場合のネは、対人コミュニケーション上必須の要素です。(P125)

いい天気ですねそうですねって言ってるだけなのに実はここまでのコンテキストを解釈しないと適切に会話できないのです。こりゃー難しいわ。

余談ですが「~ナリ!」「~だわさ」などなど特殊な終助詞を使ってあるキャラを表すという効果をあげたり「~やな」「~だがや」で住んでいる(育った)地域を表すような例もありますね。

うなぎ文

もう一つ日本語の特徴として文脈依存性の高さがあります。文脈に応じて語の意味文の意味が変わったり、大胆に省略したり通常あり得ない文も意味が通るようになるのです。典型的なのが次の「うなぎ文」と呼ばれるものです。

A:何にする?

B:僕はうなぎにする。

A:君はうなぎか。じゃあ、僕もうなぎだ。(P32)

「僕もうなぎだ」は僕=うなぎという意味ではありません。「僕もうなぎを注文する」という意味です。英語ではありえない構文です。この文の意味は文脈によってさまざまに変わります。例えば劇でうなぎの役を何人にも割り当てていれば「僕はうなぎの役をする」という意味になりますし、アナゴチームウナギチームなどの名前で団体競技をやっていれば「僕はうなぎチームが勝つのに100万円賭ける」という意味になるかもしれません。同じように「ここはだれ?」「僕はどこ?」という意味不明の文も文脈によっては有効になります。

文脈依存性が高い=空気が読めないと話についていけないということです。日本語は根本的にKY人間を締め出す構造の言語でした。まいったまいった。

 

本書は日本語学のイントロということでこれでもかというくらい要素が詰め込まれていますが、いかんせん200Pに満たないため文量が少ないのが欠点です。図が全くないので日本人が読むのも辛く外国人が読むことはまず不可能でしょう。また、日本語学の教授(しかも東大大学院)なのに所々日本語がおかしく文章が読みづらいです。 日本語学を極めても読みやすい文章が書けるようになるわけではないということなのでしょうか??

また、たまたまなのですが翻訳の副業をすることになるにあたり、日本語学は自然な文章の書き方を教えてくれるものとして非常に有効であると分かりました。この手の本をもっと読みこむ必要があります。

 

 

関連書籍

もっとわかりやすい本を読みたい。次はこれですね。定評もあるようです。

初級を教える人のための日本語文法ハンドブック

初級を教える人のための日本語文法ハンドブック

  • 作者: 庵功雄,松岡弘,中西久実子,山田敏弘,高梨信乃
  • 出版社/メーカー: スリーエーネットワーク
  • 発売日: 2000/05
  • メディア: 単行本
  • 購入: 5人 クリック: 15回
  • この商品を含むブログ (7件) を見る
 

 

中上級を教える人のための日本語文法ハンドブック

中上級を教える人のための日本語文法ハンドブック

  • 作者: 庵功雄,中西久実子,高梨信乃,山田敏弘,白川博之
  • 出版社/メーカー: スリーエーネットワーク
  • 発売日: 2001/10
  • メディア: 単行本
  • 購入: 4人 クリック: 17回
  • この商品を含むブログ (6件) を見る
 

 

 動詞について。

「する」と「なる」の言語学―言語と文化のタイポロジーへの試論 (日本語叢書)

「する」と「なる」の言語学―言語と文化のタイポロジーへの試論 (日本語叢書)

 

 

 日本語学習の最難関と言われるらしい「のだ」について。著者が野田なのはなぜだ

「の(だ)」の機能 (日本語研究叢書 (9))

「の(だ)」の機能 (日本語研究叢書 (9))

 

 

 敬語の定番テキスト。ほしい

敬語 (講談社学術文庫)

敬語 (講談社学術文庫)