赤鼻のトナカイに見る日本語と英語の単位時間あたり情報量

街中はクリスマスムードでいっぱい。今日も「赤鼻のトナカイ」がどこかで流れていて、ふと、その英語と日本語の歌詞の情報量の差に呆然。

日本語で

♪真っ赤なお鼻の♪

と歌う間に英語はこれだけ入ってます:

♪Rudolf, the red-nosed reindeer♪

つまり、「真っ赤なお鼻のトナカイさんのルドルフが」。日本語に比べて、「トナカイ」と「ルドルフ」という2アイテム多い情報伝達がなされるわけ。

日本語の遊びの部分をなくして

「赤鼻トナカイのルドルフが」

と言ったとしても、♪真っ赤なお鼻の♪のメロディーのところにこれだけ詰め込むことは不可能ですな。

この先、曲全体でも、英語版の歌詞は物語の状況表現が多い。

「他のトナカイたちは、ルドルフを笑い者にし、ひどい名前で呼んで、トナカイゲームにも入れてあげなかった。」

トナカイゲームって何だろう。

あと、最後は

「赤鼻トナカイのルドルフ、お前は歴史に残るよ!と他のトナカイたちは喜びに満ちて叫んだ。」

長いね。逆に、日本語で新たに登場している情報が、ルドルフが「いつも泣いてた」ということ。そうです、元歌ではルドルフは泣かないのだ。

***

ドレミの歌、なんかでもこの「単位時間あたり情報伝達量の違い」が出ます。

♪ドはドーナツのド=Doe, a deer, a female deer
「ドゥは鹿、雌の鹿。」これくらいなら日本語も同じメロディに乗せられる。

♪レーはレモンのレ=Ray, a drop of golden sun
「レイは金色の太陽の一滴。」ちょっと厳しくなってきたぞ。

♪ミはみんなのミ=Me, a name I call myself
「ミィは私が自分を呼ぶ名前。」かなり苦しい。

♪ファはファイトのファ=Far, a long long way to run
「ファーは長く長く走る道。」む、無理です。。。

(ちなみに、残りは
Sew, a needle pulling thread
La, a note to follow sew
Tea, I drink with jam and bread
That will bring us back to do…oh oh oh
同じことを日本語であのメロディに詰め込んだら、早口の呪文みたいですね。)

***

この間日本で、日本のシティバンクのカスタマーサポートに電話したら、録音メッセージがナビゲートするタイプだった。しかし、アメリカで日頃使っているものに比べて、あまりに一つ一つの選択肢を言われている時間が長いので、イライラして途中でギブアップ。例えば、

「日本語をご希望の方は、1、を押してください」

というのに多分4秒強かかると思われ。同じことが英語の録音音声だと

「If you would like to proceed in English, please press one」

という感じ。長そうだが、多分3秒弱くらい。30%違うのね。これに耐えられず。(ま、そもそも、録音メッセージナビゲート自体が、言語に関わらずいらだつのですが。)

もちろん、同じものをさしていても、英語より日本語の方が短い時間で言える単語もある。あるのではあるが、一般的には、ある程度の長さの情報を口頭で伝えようと思ったら、少なくとも日本語の方が3割方長めにかかる気がする。(これ、きっとどこかにきちんとした調査・分析をされてる方がいると思うんですが、ご存知の方がいたら教えてください。)

日本語は全ての音が「子音+母音」で成立しているが、英語では、子音が母音と独立して存在、一つの母音に、様々なバリエーションの複数の子音をくっつけられる。一方で、一つの母音を発音している時間は日本語と英語でそれほど変わらないので、単位時間あたりの情報量に差が出ると、そういうことだと推測してるんですがどうでしょうね。2進法と3進法、みたいな差でしょうか。

赤鼻のトナカイに見る日本語と英語の単位時間あたり情報量」への24件のフィードバック

  1.  そもそも、1文字にこめられる情報量は英語の方が多いですよね。
     日本語の「い」は「い」としか読めませんが、英語の「I」は「アイ」「イ」と読める、これだけで2倍の情報量をもっていると言えなくもないです。英語の方が圧縮率が高いというか。
     そうなると、理論的には英語の方がエンコード/デコード作業が重くなるはずですが、はてさて……。

    いいね

  2. このあいだ日本のNPOがYahoo!jpの登録変更手続をするのにネットで調べたら典型的なネット間たらい回し構造+個人情報保護法でまずどこに聞けばいいのかも不明。
    ようやく適切な電話番号を聞き出したあげく電話交渉にはいったら入ったで提示可能なセットの種類全部をきちんと提示してこないのでchikaさんでなくても憤死しそうになりました。冗談でなく1ヶ月かかった。

    いいね

  3. うーん。ドレミの歌はどうですかねえ?
    実際に歌ってみると、日本の歌がトロいのに対し、英語の歌が早口なだけのような気がするのですが。
    同じ内容のニュースをアナウンサーにしゃべらせるというのが比較しやすいかも。

    いいね

  4. これは私もちゃんとした統計があったら知りたいです。
    漢語は密度が高いと思うので、書き言葉やフォーマルなスピーチなどではそんなに差がでないのではないかと思いますが、話し言葉は日本語の方が長くなる傾向が多いと思います。
    撮影現場で時々英語の台詞を渡されて「この内容を日本語でよろしく」と言われることがあるんですが、同じリズムで同じ内容を詰め込むのにかなり悩みます。
    (ただ、あらかじめ日本語で最適化されている場合—俳句が極端な例だと思いますが—については英語の方が冗長になる感じがします。)

    いいね

  5. なるほど!
    日本語は文字上の情報が多いわけですね。で、音声上の情報は少ないと。
    そのへんは日本特有の曖昧表現やインクリメンタルサーチでカバーするわけですね。
    だから公な録音メッセージが冗長すぎると。

    いいね

  6. 日本語の問題というより、台詞の選択・作成の問題だと思うのですが。
    つまり、簡潔な質問にしてくれ、丁寧に言わなくてよい。
    日本語にまで問題を持ち込むと、言いがかりのように聞こえます。
    >倍速言語
    歌にすると、リズムに制約されて、倍速言語の特徴が出ないと。
    外国人の日本語に対する感想で、早口に聞こえるというのがありますが、的を得ていたのですね。

    いいね

  7. 「日本語と英語の単位時間あたりの情報量」とは、同じ情報を日英それぞれがいくつの、より少ない音節で表現できるかにあるのではと思います。(前提として、一つの音節を発するのに要する時間は日英で同じだとして)
    で、数えてみました。
    「日本語をご希望の方は、1、を押してください」⇒23音節
    「If you would like to proceed in English, please press one」⇒13音節
    これだと英語の方が半分強の時間で同じ内容を伝えられることになります。まぁ、「日本語」と「English」を統一すればもう少し差は縮みそうですし、言い回しの違いもあるとは思いますが。

    いいね

  8. ドイツ語でも同様の点が指摘されていて、ドイツ語では英語の約1.3倍時間がかかると聞いたことがあります。
    また、ドイツ語は文字数も多いので、UIを設計するときにはドイツ語の文字数を基準にして幅をきめてます。ドイツ語多難です。

    いいね

  9. 中国語だと英語よりもはるかに短いです。
    「吃飯(=ご飯を食べる)って、日本語で何ていうの?」
    と向こうのウェイターのお姉さんに言われ、
    「ご飯を食べる」
    と言ったら、
    「何でそんなに長いの~」 と言って笑われました。
    母音+子音に加え、同じ音でも発音が4通りあるので、
    3進法どころか12進法、といった感じでしょうか。
    ただ、短時間で意味を伝える効率は、
    その言語の習得にかかるエネルギーや、
    意味内容伝達の際のエラー発生率と反比例すると思うので、
    いちがいにいい・悪いは言いにくいと思いますが。

    いいね

  10. ITシステム開発の現場で通訳・翻訳をしております。
    会議通訳中に日本語→英語に変換する際、相対的な文章量が短くなり、ちゃんと訳しているのかと疑われることがあります。(あっさりしている印象があるようです。)
    極力、日英共に話者と同じ時間はなそうとしていますが、偉い人の話は長いようで、わりと内容が薄かったりするので、頭を悩ませております。

    いいね

  11. 単語単語では日本語のほうが短いものも稀にあるんですけどね。
    高校生の頃、日本に来ていた留学生同士が、
    “I’m going to EKI!”
    といっていました。
    The stationよりEKIの方が簡単だからですね。
    とはいえ、全体ではやはり英語の方が短い時間で表現できるようです。

    いいね

  12. コミュニケーションにおいては、真意が伝わるかどうかが最も重要です。表層の意味情報の量だけでなく、真意まで含めた情報の量で比較すると、また違った見方ができるかもしれません。

    いいね

  13. これは興味深いトピックですよね。自分も日頃なんとなく気になっていました。
    他の方も指摘されているように、書き言葉だと表意文字(表語文字、と厳密にはうようですが)である漢字も含まれるために大した差はないのかな?という印象ですが、話し言葉という完全に音声による情報伝達になると、英語のほうに分がある感じがしなくもないです。完全に感覚的なものですが。
    日本語には助詞、助動詞がきちんとないと正式な感じがしないですしね。
    きちんとしたリサーチ結果が知りたいです。

    いいね

  14. 数式ではどうでしょう。例えば1234+4321=5555 を
    one thousand two hundred thirty four plus….
    と律儀に読み上げるんでしょうか。それとももう少し簡略化した
    手法が定着しているんでしょうか。
    これと関連して、英語で長い単語があると省略記法が定着してしまうと
    いう可能性はないでしょうか。Representational State Transferを略して
    RESTとか、Software as a serviceを省略してSaasのように。日本語で
    「自己中心的な人」を略して「ジコチュー」と呼ぶ人(主に若者?)も
    いますが、定着しているとは言い難いと思います。東京証券取引所で東証
    とかもありますけど、さて全体としてはどうなんでしょうね?

    いいね

  15. 文章に関しては、日本語の方が短そうですね、その音声ガイドの文も日本語の分の方が短いですし。
    日本の漫画を翻訳するときに、英語だとフキダシに収まらないから、苦労するというのは聞いたことがあります。
    日本語はかなり省略可能な言語だと思うので、口語でも正式な場では日本語の方が遅そうですが、日常的な場では、同じくらいにはなるのかも。(省略してる時点で情報が減ってますが、英語は構造上省略出来ない言語ともいえるので)
    中学生の時、英語の”私は私の手を私の・・”ってすごく不自然に思ったのを思い出しました。
    日本に来た留学生が、”いってきます”(コレは挨拶ですが)を聞いて”誰が””どのに”を言わないのを不自然に感じたのと反対ですね。
    youtubeにファンタのCMがありますが、これを英語に訳したら時間が余ったりするのかな??

    いいね

  16. chikaです。
    えっと、「書き言葉の文字あたり情報量」と「話し言葉の単位時間あたり情報量」は別の話です。
    ひらがな、カタカナ、漢字という違うモードの文字を混合して使う日本語は、書き言葉の単位当たり情報量は相当高い、と私は思ってます。(これもちゃんとした統計を見たことはないですが。でも、書き文字としての日本語が、英語に比べてエンコード/デコードに負荷(というか、知識の蓄積といいますか)がかかるのは確かですよね。)
    英語の文章を逐語訳で日本語にした際長くなってしまうのは、「ほら、だから英語は長い」ということではなくて、「同じこと」を表現するのに、英語の方が速いからということの逆の現れの可能性もあります。
    たとえば、「私の手」は日本語でいうと5拍(モーラ)ですが、英語でmy handというと2シラブルです。他の方のコメントのリンク先によると、モーラ/シラブルあたりの発音される長さは
    「英語は 0.244 秒、日本語は 0.145 秒」
    とのこと。つまり「一つの音」を発音する時間は日本語が7割速い、と。そうすると、
    「私の手」=5×0.145秒=0.725秒。
    my hand=2 x 0.244=0.488秒で、
    ということで、日本語の「私の手」に相当する情報を英語で伝達するのにかかる時間は、日本語の35%。わざわざがんばって「私の」=myという情報を落とさずとも、短い時間で情報が伝わっちゃう、ということでもあるかと。
    日本語では「私の手」といわずに「手」というからいいのだ、ということだと、やっぱりここで「私の」という情報量が少なくなり、その分を想像で補うという曖昧さが生じるかと。
    なお、人類の発展の歴史においては、発音の種類というのはだんだん少なくなっていく傾向があるらしい。ということは日本語は進化した言葉なのかも。とすると、ハワイ語はもっと進化した言葉なのかも・・・。

    いいね

  17. chikaさんの意見に同意です。
    発話単位時間あたり情報量は英語の方がかなり多いのは間違いないように思えます。
    ただ、chikaさんの提示した主題とはズレてくるかもしれませんが、英語は日本語と比べて省略することが文法上”出来ない”とすると、またニュアンスがちがってきませんか?一歩ひいて言語全体のスピードを比べるときに。(特に日常会話で)
    「私は私の手を私のポケットに」とか「私は貴方を愛しています」なんて日本語話者ならまず絶対に言わないですよね。というか悪文です。”I love you”は普通「好きだよ」とかそんなでしょう。英語はIとyouを言わないと文として成り立たない。
    ”普通の”日本語を普通の英語に訳すときには、無理にでも、いろいろ付け”なきゃならない”。足した情報は、曖昧さを補ったとも言えますが、話者は曖昧さを取り除きたかったからではなく、英語上そう表現しないと不自然だからしかたなく、とも言えますよね。
    ま、足した情報に価値があると見るのか見ないかの差なんですが(笑)
    あるいは、”省略”というのが、そもそも英語を基準にしている考えで、日本語話者は省略とは感じていない。主語や目的語、人称代名詞や所有形容詞をちりばめなければ文章として成立たないのはそちらのお家事情だろうと(笑)(この辺の物言いは、金谷武洋という方の著書の受け売りです。言語学的にどうなのかは分かりませんが、読み物として面白いですよ)
    それでも単位時間当たりの情報量に圧倒的な差があるので、英語の方が早く言い終わる場面が多そうですね。
    (話は脱線しますが、「お茶が入りましたよ」は美しい日本語表現だと思います(^o^))

    いいね

  18. 日本語は、イタリア語(&スペイン語)と並んで「最も歌いやすい言語」といわれます。
    http://www.tamakimasayuki.com/musica/bn_18.htm
    >イタリア語、日本語とも、母音はa,e,i,o,uという単純な音のみであり、
    >子音同士の重なり合いもなく、大きな声での発声(歌うこと)に適した言語といえる。
    >じっさい、現代の「三大テナー」と称されたパヴァロッティ、ドミンゴ、カレーラスは、
    >口を揃えて、「最も歌いやすい言語はイタリア語(とスペイン語)と日本語」と語っている
    >(ちなみに、最も歌いにくい言語が「英語」であることでも3人の意見は一致している。
    >イギリスはシェークスピアの演劇や詩は発達させたが、英語の歌はなかなか発達せず、
    >英語がアメリカに渡ってアフリカのリズムと出逢い、ブルースやジャズ、
    >さらにロックンロールが生まれて初めて「英語の歌」が誕生したと考えられる

    いいね

  19. 専門的なことは分らないけど、
    上記の例に関して言えば、元の歌詞に対する日本語訳にセンスがないだけなのでは・・・

    いいね

  20. 非常におもしろい考察ですが、もう一つ別の面からいうと、音素以外に、単語という圧縮方法があるのでは?
    残念ながら色々な国の言葉を知っている訳ではありませんが、方位をあらわす東、英語ではEast、タイ語ではตะวันออก。、ตะวันが太陽、ออกが出る、太陽が出る方向と言うことで、続けて書くと東。(ちなみに西は、「太陽が落ちる」です)。
    よく言われていることですが、身近な物は単語が多いと言われています。日本語だと雨に関する単語は多いですが、雪は少ないとか。また、科学と哲学を自分の国の言葉で語れるのはそれほど多くないとも聞きます。
    哲学の一文を各言語で表したときはどの程度の文字数/音素数になるのかも気になるところです。

    いいね

コメントする

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中