2008年度森基金活動報告書

周波数帯を利用した音の理論の外国語学習への応用

慶應義塾大学大学院 政策・メディア研究科 修士課程 1年
中村 智栄
80824937
arumakan@sfc.keio.ac.jp

1. はじめに

 言語には音調パタン、アクセント、リズムといった要素の特徴があり、外国語を喋る際にはこうした言語の持つ音声的特徴を敏感に察知、認識し、発生する必要性がある。Wong, Patrick C. M. et al., (2007)[19] によれば、音楽家と非音楽家の脳幹の言語的音調パタンに対する頻度追随応答を調べたところ音楽家は非音楽家に比べ信頼性の高いコード化をしているということが明らかとなっている。人間の耳が聞き取れる周波数は16Hz〜16000Hz程度であると言われているが、言語によって優先的に使われる周波数域(パスバンド)には大きな違いがある。母音を中心とした言語で単語の最後の母音がしっかりと発音される日本語やスペイン語は低周波数帯域を多く含むのに対し、アメリカ英語、フランス語、イタリア語は中周波数帯域、子音の特徴が強いイギリス英語は高周波数帯域を多く含む。  本研究では、異なる周波数帯域を含む言語の聞き取りにおける反応の違いを比較する為イギリス英語、日本語がそれぞれ特徴とする高周波数帯、低周波数帯のみを残し英語音声にfftフィルターをかけることで「イギリス英語的英語」「日本語的英語」を作成し被験者に呈示する実験を行った(実験1)。また実験2においては、実験1と同様の方法を用いモーツァルト音楽にイギリス英語、フランス語、日本語がそれぞれ特徴とする高周波数帯、中周波数帯、低周波数帯を残した「イギリス英語的モーツァルト」、「フランス語的モーツァルト」、「日本語的モーツァルト」の音源を作成し、被験者に呈示する実験を行った。なお、両実験とも被験者はミュージシャン、ノンミュージシャン、バイリンガル、ノンバイリンガルの4グループとした。

2. 言語の音声的特徴

 言語の音韻的特徴としてプロソディーが挙げられる。プロソディーとはアクセント、リズム、イントネーションなどの総称であり、言語をその言語らしい響きにする役割を担っている。実際に使える外国語を身につけるためには、情報を目で追うだけの学習法ではなく音を耳で聞く学習が必要である。楳垣(1961)[18]は、「われわれの言語生活で最も大切なのは、ひとつひとつの子音・母音の発音でもなく、ひとつひとつの単語の発音でもない。それよりもはるかに大切なのは、文全体の調子・リズム・イントネーションと適度な速度なのだ」と述べ、個々の母音や子音を正しく学習することばかりに注目しすぎた教育よりも英語のプロソディーの習得に重点を置く外国語の教授法を提言している。  言語学の分野で音韻構造やアクセントの違いについて研究がなされているように、言語にはそれぞれの音が持つ特徴や違いがあり、学習した外国語を流暢にあやつる人とそうでない人では、対象言語における発音、会話の進め方、ノリ、運びなどの要素を柔軟に自分の内に取り込み、適応し実践する能力の差が大きい。例えば言語教育で有名なトマティスメソッドにおいては、「聞こえない音は発音できない」という大前提のもとに耳による学習が重要視され、各言語にそれぞれ優先的に使われる周波数帯に耳を合わせることで目標言語が聞きやすくなるような訓練がなされる。  言語へのアプローチにおいて「音」の占める重要性は非常に大きい。どのようなバックグラウンドを持つ人がより外国語の音に敏感な耳を持ち、それがどのように外国語能力に寄与しているのだろうかという疑問が本研究の出発点である。

2.1 言語が特徴とする周波数帯の違い

 人間の耳が聞き取れる周波数は16Hz〜16000Hzぐらいであると言われているが、言語によって優先的に使われる周波数域(パスバンド)には大きな違いがある。高周波音は子音の摩擦音(f, v, s, zなど)や破裂音(p,b,t,dなど)のように口を閉じて発音される音であるのに対し、低周波音は口を開く母音(ア、エ、オなど)である。語音を母音と子音に分けたとき、母音「ア、イ、ウ、エ、オ」はそれぞれ音声的に特徴のある波の集まりで区別することができる。この際母音を決める特徴的な周波数成分をフォルマントといい、これは声道(口、咽喉、鼻)の形により決定される。子音も同様に周波数成分の違いにより聴き分けられる。Tomatis,Alfred[15][16][17]は、民族言語の音声に対し音を細分化するソナグラフやパトラマ分析器を用いた音声分析を行い、それぞれの言語が特徴とするパスバンドを抽出した。例えばスペイン語には低音周波数帯が最も含まれ、母音を中心とした言語で単語の最後の母音がしっかりと発音される日本語もこのグループに属する。それに対し、アメリカ英語、フランス語、イタリア語は中周波数帯、子音の特徴が多いイギリス英語は高周波数帯と、言語により優先的に音声に使用されている周波数域の違いを明らかとした。 普段聞き慣れている言語が特徴とする周波数帯とは異なる周波数帯を聴いた時、それに敏感に反応できるかどうかは外国語のリスニングにおいて非常に大切な要素であり、さらに言えば日本人は日常生活において高周波数帯の音を聞く機会が少ないために、高周波数域を多く含むイギリス英語が聞き取りづらいのではないかと考えられる。それに対し、幼少の頃から音楽に触れ、様々な周波数帯の音を聞き慣れているミュージシャン(音楽家)は、ノンミュージシャン(非音楽家)に比べ、それぞれの言語が特徴とする周波数帯の違いにも敏感であり、日本語ではなじみの薄い高周波数域帯への認知度も高いと言えるのではないだろうか。 以上の仮説を踏まえ、異なる周波数域に対する認知の違いを調べるため、ミュージシャン、ノンミュージシャン、複数の言語を喋ることのできるバイリンガル、1言語のみを話すノンバイリンガルの4グループを被験者として各言語が特徴とする周波数帯に合わせた音声、音楽を呈示し、被験者グループによる反応の違いをアンケート方式で記録した。

3. 実験

3. 1 実験方法

a)実験1  Podcastで配信されているBBC Radio 4の音声をWAV形式で保存。音声ファイル編集ソフトaudacityを使い、イギリス英語が特徴とする周波数帯(高周波数帯;2000Hz〜12000Hz)、及び日本語が特徴とする周波数帯(低周波数帯;125Hz〜1500Hz)の各周波数域のみを残してfftフィルターをかける。この際、1回フィルターをかけても目的の周波数帯の部分だけが切り出せないため、5回ほど繰り返すことで各言語が特徴とする周波数帯の形に近づける(fig. 1a〜1c)。これらをA「イギリス英語的英語」、及びB「日本語的英語」とし順番に被験者に呈示し、被験者はどちらの音声が聞き取りやすいかを5段階で回答する。この際、被験者は音源に関する情報を一切知らされていない。


b) 実験2  モーツァルト作曲“Konzert fur Horn und Orchester No. 3 Es-dur KV 447 – Allegro”をWAV形式で保存したたものに、実験1と同じ方法を用いてα:高周波数帯(2000Hz〜12000Hz)、β:中周波数帯(100Hz〜300Hz, 1000Hz〜2000Hz)、γ:低周波数帯(125Hz〜1500Hz)のみを残してフィルターをかける(fig. 2a〜2d)。これら3つをα:イギリス英語的モーツァルト、β:フランス語的モーツァルト、γ:日本語的モーツァルトとし、被験者に呈示する。被験者は聴いた時の違和感の有無を5段階評価で回答。この際、被験者は音源に関する情報を一切知らされていない。


3. 2 実験データ

•被験者 a)実験1 1.ミュージシャン 9人  定義:音楽教育を12歳より前に始め、少なくとも6年以上継続したトレーニングを受けた(ている)経験を持つ者。 2. ノンミュージシャン 10人 定義:人生において3年以上音楽的トレーニングを受けた経験がない者。 3.バイリンガル 9人 定義:母国語以外に一つ以上併用できる言語がある者。 4.ノンバイリンガル 10人 定義:母国語のみの言語を話す者

b)実験2 1.ミュージシャン且つバイリンガル (M&B) 2.ミュージシャン且つノンバイリンガル (M&NB) 3.ノンミュージシャン且つバイリンガル (NM&B) 4.ノンミュージシャン且つノンバイリンガル (NM&NB) (各グループの定義は実験1に同じ)

•各言語が特徴とする周波数域 英語2000Hz〜12000Hz フランス語100Hz〜300Hz、1000〜2000Hz 日本語125Hz〜1500Hz

4. 実験結果

    a) 実験1  3.1で記述したとおり、イギリス英語の周波数帯のみを残した英語の音声はよりイギリス英語の特徴を強く表したイギリス英語的英語であるのに対し、日本語の周波数帯のみを残した英語の音声は日本語の特徴を表した日本語的英語であると言える。これらの刺激に対し、被験者全体の58%がBの日本語的英語が聞きやすいと回答した。それに対し、Aのイギリス英語的英語が聞きやすいと回答したのは全体の20%のみである(fig. 3a)。ミュージシャン、ノンミュージシャン、バイリンガル、ノンバイリンガルのグループ別に見た時も全グループに共通してBが聞きやすいと回答している(fig. 3b)。
     B(日本語的英語)が聞き取りやすいと回答した被験者の感想としては、「Aは子音が強く聞こえるのに対し、Bは母音の部分がよく聞こえた。例えば”competition”という単語ではAにおいて”tition”の部分だけ強調されているのに対し、Bにおいては”om”,”e”,”ion”の部分がよく聞こえた。意味を捉えるには母音の部分が聞こえたほうが単語がわかりやすいのでBのほうが聴きやすいと感じた。」というものや、「Aは声が高すぎ、イントネーションがわかりづらい。Bは低くくぐもっているが、イントネーションが明確に聞き取れる。」などの回答が見受けられた。


    b) 実験2 実験1と同様、α、β、γの音声ファイルはそれぞれイギリス英語、フランス語、日本語が特徴とする周波数帯のみを残したものであることから、αはイギリス英語的モーツァルト、βはフランス語的モーツァルト、γは日本語的モーツァルトであると言う事ができる。 実験2の回答に関して、ミュージシャン且つバイリンガル(以下M&B),ミュージシャン且つノンバイリンガル(以下M&NB)、ノンミュージシャン且つバイリンガル(以下NB&B)、ノンミュージシャン且つノンバイリンガル(NM&NB)のグループ別に見た結果、有意差があるものはαイギリス英語的モーツァルト(p値<0.0157)とβフランス語的モーツァルト(p値<0.0154)の2つであった。γ(日本語的モーツァルト)に関して有意差は認められなかった。さらに、M&BグループとNM&NBグループの2つがα、βの音声に対し強く違和感を示した一方、M&NB、M&Bの2グループはあまり違和感を示さなかった(fig. 4)。


5. 考察

実験1では全体の58%が英語的英語に比べ日本語的英語が聞きやすいと回答した。実験2においては英語的モーツァルト、フランス語的モーツァルトの結果に有意差が出たのに対し、日本語的モーツァルトには有意差が認められなかった。これらの結果は共に、普段聞き慣れている言語が特徴とする周波数帯(日本語)に対して被験者が違和感を感じにくいことを示している。 実験1のイギリス英語的英語、実験2のイギリス英語的モーツァルトのスペクトルは他の比較言語に比べ周波数域が最も広く、fftフィルターで目的の周波数帯を切り出す前のオリジナルのスペクトルに非常に近い形をしているにも関わらず、被験者が最も違和感を強く感じる結果となった(fig. 1a〜1c、2a〜2d)。それに対し、日本語的英語、日本語的モーツァルトはオリジナルのスペクトルの中の限られた1部分のみしか残していないにも関わらず最も聞きやすいと回答している。このことから、バイリンガルを含め、被験者の母語であり日常的に使っている日本語が特徴とする周波数帯を優先的に聞いている可能性が示唆される。 また、実験2の結果ついて、M&BグループとNM&NBグループは最も対照的なグループである為刺激に対する反応も対照的になると予測していた。しかし、有意差を示したα(イギリス英語的モーツァルト)とβ(フランス語的モーツァルト)に関して、M&BとNM&NBが同じような反応を示しU字型グラフ描く結果となった(fig. 4)。これに対する考察として、同じように「違和感を感じる」という回答でもM&BグループとNM&NBグループでは違和感の感じ方に差があった可能性が考えられる。日常的に幅広い周波数帯に親しんでいる可能性の高いM&Bグループが既に知っている周波数帯の差に反応したのに対し、被験者グループの中で日常的に触れる周波数帯が最も狭い可能性のあるNM&NBは聞き慣れない周波数帯に反応したのではないだろうか。つまり、M&Bグループがより分析的に周波数帯の違いに反応したのに対し、NM&NBグループはより感覚的に反応した可能性が考えられる。先行研究においても、非音楽家は右脳で全体や形を理解、あるいは情動的処理を行うのに対し音楽家は分析的処理を行うため左脳を使うという理論に対する検証や、和音と旋律を課題として聴かせたところ、音楽家は左前頭側頭葉で処理していたが、非音楽家は両側頭葉と右側頭葉で処理していたという結果[2][11]など、音楽家と非音楽家における音の刺激に対する脳内処理におけるプロセスの違いが報告されている。

6. まとめ

本研究の結果として日常的に使う言語が特徴とする周波数帯の影響力の強さが示唆されたが、これを検証する為には日本語以外の外国語を母語とする被験者に実験を行う必要がある。また、実験2の結果から「違和感」を感じるプロセスがM&BグループとNM&NBグループでは違うのではないかという考察が得られたが、被験者が感じる違和感の差を明らかにできるような設問項目とするために被験者の主観的評価に頼りすぎない設問の工夫が改善点として挙げられる。 音楽経験と外国語(L2)習得の関係性を探る研究は脳科学、認知科学、心理学など様々な分野からの注目を集めている。Sleve, L Robert & Akira Miyake(2006)[10]の研究によれば、 音楽的能力はL2能力の要素である音韻受容、音韻産出に有意であるという。これに関連して、音楽的刺激の分析、区別、想起に長けている被験者は、そうでない被験者に比べL2言語の音の理解、発声に有利であり、音楽的音構造を分析する能力は母語にないL2特有の音韻構造の分析を得心するという結果が報告されている。 プロソディーは音楽においてピッチレベル、テンポの変化によって特定される音楽の独自性を保持しる役割を持つ一方、言語においては意味的、感情的情報の重要な発信源となる。言語における音楽的要素(プロソディー)で表されるのが話し手の情動状態を伝えるパラ言語的要素であるとするならば、音楽的能力は音韻、単語レベルよりも会話を進める上での推測能力に寄与するのではないだろうか。これに関する研究として、Thompson, W. F., Schellenberg, E.G., & Husain, G.(2003,2004) [13][14]は、音楽的教育が言語(発話)知覚に対して正の転移を及ぼす可能性を検証する実験を行っている。短いフレーズにおけるピッチインフォメーションの抽出の正確さを、音楽的訓練経験を持つ被験者と音楽的訓練経験を持たない被験者に対し行った実験では、母国語、外国語どちらの実験においても音楽的訓練経験を持つ被験者グループのほうが高い正解率を示したことから、音楽処理に関わるメカニズムは音楽に関連した特徴の変化により特性化される他の複合的な聴覚信号にも拡張することが示唆された。 今後の課題としては、被験者の音楽経験の内容を楽器の種類、開始年齢、経験年数別に分け、さらにL2能力もリーディング、ライティング、リスニング、スピーキング別の到達度や得意意識の調査を行うことで細分化し、どの項目に相関が見られるかを検証することを目標とする。

参考文献

[1]Baddeley, A. D. (1986) Working memory Oxford: Oxford University Press [2]Benson, William(2005)『音楽する脳』角川書店 [3]Gottfried, Schlaug et al.,(2005) "Effects of music traing on the child's brain and cognitive development" 2005 New York Academy of Science [4]村瀬邦子(1996)『トマティス流最強の外国語学習 法』日本実業出版社 [5]太田聡(1998)『音韻構造とアクセント』研究者出 版 [6]Patel, A.D.(1998)”Syntactic Processing in Language and Music: Different Cognitive Operation, Similar Neural Resources?” Music Perception, 16, 27-42 [7]Patel, A.D. et al.,(1998) “Processing Prosodic and Musical Patterns: A Neuropsychological Investigation” Brain and Language 61, 123-144 [8]Patel, A.D. et al.,(2003) “An empirical comparison of rhythm in language and music” Cognition, 87, 35-45 [9]Pechmann, T., & Mohr, G. (1992) "Interference in memory for tonal pitch: Implications for a working-memory model" Memory & Cognition, 20, 314-320 [10]Sleve, L Robert & Akira Miyake(2006) "Individual differences in second-language proficiency-Does musical ability matter?" Psychological science 17, 8 [11]Snider, Bob(2003)『音楽と記憶 認知心理学と 情報理論からのアプローチ』音楽の友社 [12]Tanaka, Akihiro & Kuninori Nakamura(2004) "Auditory memory and proficiency of second language speaking: a latent variable analysis approach" Psychological Reports 2004, 95, 723-734 [13]Thompson W. F. et al., (2003) “Perceiving Prosody in Speech Effects of Music Lessons” New York Academy of Sciences [14]Thompson W. F. et al., (2004) "Decoding speech prosody: Do music lessons help?" Emotion 2004 4, 46-64 [15]Tomatis, Alfred(1997) The Ear and Language Moulin Pub. [16]Tomatis, Alfred(1993)『人間はみな語学の天才 である』トマティス研究会 [17]Tomatis, Alfred(1994)『モーツァルトを科学する ー心とからだをいやす偉大な音楽の秘密に迫 るー』トマティス研究会 [18]楳垣実 (1961)『日英比較語学入門』大修館書 店 [19]Wong, Patrick C. M., Erica Skoe, Nicole M Russo, Tasha Dees & Nina Kraus (2007) “Musical experience shapes human brainstem encoding of linguistic pitch patterns” Nature neuroscience 10, 420-422