人工知能の限界2

翻訳ソフトで物語の翻訳がうまく行かない理由のひとつに、言語そのもののルールが極めて複雑だということがある。
それぞれの言語には、その言語に特有のルールがある。
この場合のルールというのは、学校で習うような文法のことではない。
文法など知らなくても、人間は生まれた国、あるいは地域で話されている言葉を自然に習得し、意思疎通が出来るようになる。
子供は、周りで使われている言語の特性なり,ルールをひとりでに習得するからだが,そのルールというのが,どういうものかを、それを話している人間が言語なり,何かの形で外在化させることが出来ていない。
自然と身に付くことを外在化することはとても難しいのだろう。
外在化できていないから、この能力をプログラム化して、コンピュータに教え込むことは出来ない。
コンピュータに教え込むことが出来るのは、個々バラバラの単語の意味を大量にデータとして保存させることだけ。
定型的表現なら、文を丸ごとデータで保存すればいいが,要するにそれだけのこと。
学校で習うような文法をデータ化して教え込むことは、かなりの線まで可能だろうが,先に翻訳させた例では,文法のデータ化にも今のところ成功していないようだ。
翻訳となると、もうひとつ別の言語でも、その言語のルールを教え込まなくてはならないが,全然別のルールになるから,ひとつのコンピュータに違う言語ルールを教え込まなくてはならず,これはかなりハードルが高そうだ。
ある言語のルールを習得することは,とりもなおさず,その言語で話されたことや,書かれていることを理解することに等しい。
そのルールをコンピュータは習得できない。つまり,コンピュータは一言一句、書かれたものなら,一行たりとも理解などしていない。
言語を理解の出来ないコンピュータに翻訳などできるわけがない。
話が抽象的で分かりにくいので、具体的な例で示そう。
次の引用は「日本人の英作文2015-9」の課題文と、これをGoogle翻訳サービスで翻訳したものだ。

日本語入力
「よかったね、つんちゃん」
「つんちゃん?」
「うん、名前つけたの。つばめのつんちゃん」
まりちゃんとサリーちゃんは、遊ぶのもわすれて,毎日つんちゃんを見てすごしました。
英語出力
"It was good, picking-chan"
"Deaf-chan?"
"Yeah, the name of the attached. Swallow the picking-chan"
Mari-chan and Sally-chan, forget also to play, was spent looking at the picking-chan every day.

小学校低学年向けに書かれた童話で,子供でも簡単に内容が理解できる。
しかし、翻訳された英語は論評するのもバカらしいぐらいのでたらめ英語。
コンピュータをバカ呼ばわりするのは,コンピュータに知性はあるが,それがまだ十分でないときで,翻訳ソフト,あるいはコンピュータには知性はかけらもない。
つまり、コンピュータをバカ呼ばわりするのは,力はあるが、何も考えられないブルドーザーをバカ呼ばわりするのに等しい。
ちなみに、「つんちゃん」を翻訳ソフトは"picking-chan"それから、"Deaf-chan"と訳しているが、それが何故なのかをすぐ分かった人はなかなかの語学センスを持っていると思う。