Ngram viewerでしらべてみよう! 英語のうつりかわり
もうかなりむかしですが,Googleで英単語や熟語,collocationをてがるにしらべられるようになったころ,1日じゅういろんなことを検索して用例を採集したり件数をしらべていたものです。このブログでもいつもGoogleにはおせわになっています。
いまでも1日に検索回数が100回をこえてしまうことがよくあり,ときどきGoogleに「おまえがロボットでないことを証明しろ」といわれます(みなさんにはこの経験ありますか?)。
さてそんなぼくがことしはまっているのがGoogleのサイト,Ngram viewerです!
ここの検索ボックスにすきな単語やフレーズをいれると,Google Booksのぼう大な本のデータを解析して,それらの時間軸にそった出現頻度をグラフで表示してくれるのです!
複数のitemを検索するときはカンマでくぎります。分析対象としたい年代はbetween □ and □ で指定できます。
ではさっそく単語をいくつかしらべてみましょう!
いかがでしょう?いきなりcolorfulでgraphicな単語ですみません。でもやっぱりこういうのをしらべてみたくなりますね。1960年あたりからshit, bitch, fuck, assholeなどが急激にのびはじめています。ここでなにがおこったのでしょう?
ではもうすこしまじめに。
社会の問題意識と語句の頻度は当然相関しています。
たとえばozone depletionとglobal warming。前者は最近あまり話題になりませんよね。どうなんでしょう?
1995年あたりをピークに,どんどんへってきていますね。
つぎはacid rain「酸性雨」。これもちかごろあまりききません。
★つぎにglobal warming。
これは地球の平均気温とおなじようにいまもどんどん上昇中です!
★もうすこし英作文に役にたちそうなことをしらべましょう。
「 ~まで」をtillにしようかuntilにしようかまよったことはありますか?どっちが優勢なんでしょう?
あかがuntil, あおがtillです。19世紀はじめに優勢だったtillはどんどん衰退し,1850年代についに逆転され,2000年には大差がついてしまいました。
入試のデータでは過去15年間でtill 416回に対し,untilは4624回と,10倍以上おおいです。
もう「until一択」でよさそうですね。
ただし,Ngramのdataは書物のデータベースですから,かならずしも会話などでの実際の使用頻度をしめしてはいません。tillはややくだけた英語とされています。
★youtubeのコメントなどでやたらにみかける形容詞awesome。ほめことばの盛衰ははげしいようです。
おなじく「すばらしい」を意味するterrificとくらべてみましょう。
あおがawesomeです。ふえてきていますね。でもterrificも一度没落してまたもりかえしつつあります。
意味が同じ単語や似た単語はおなじnicheをうばいあうrivalどうしのようにはげしい競争をくりひろげてきたようですね。
文法・語法的なことも探求してみましょう。
★英語をかいていてregret のあとに完了形の動名詞having + Ved(過去分詞)をおくべきか,ただのVingにしようか,まよったことはありませんか?
regret saying(あか)とregret having said(あお)をくらべました。sayingにしとけばOKみたいですね。
入試では完了形having+Ved 20件に対し,Ving44件でした。Ngramはけっこう入試データと一致していますね。
★It has been a long time since ~とIt is a long time sinceはどんな比率でしょうか?まえのはアメリカ英語で,あとのはイギリス英語といわれますが。
まず英語一般のデータです。
1960年代からはっきりとhas beenのほうがひろがりはじめ,isのほうは衰退の一途です。むかし八幡大学の入試でhas beenをつかった文の「あやまりをなおせ」という問題がでてあきれたことがあります。これをつくったのは「保守派」の先生だったんでしょうね。
ではアメリカ英語とイギリス英語をくらべてみましょう。
まずアメリカ英語から。
はやくも1930年ごろにhas beenがisをうわまわっています。
イギリス英語ではどうでしょう。
has beenが勝ったのは1980と,アメリカ英語におくれること約50年でhas beenが逆転をはたしています。現代でもisはアメリカ英語よりだいぶおおいですが,やはりhas beenが優勢です。
そういえばiイギリスのバンドLed Zeppelinの曲Rock and Roll(1971) にはすでにIt's been a long time since I rock and rolledという歌詞がありました。時代をさきどりしていたんですね。
★My job is のうしろをVingにしようかto Vにしようか,まよったことはありませんか?
うえのほう,あおがjob is to teachのデータ,したがjob is teachingです。圧倒的にto Vですね。もちろん,かずのちがいだけでなく,たぶんニュアンスのちがいもあるとはおもいます。あるnativeにたずねたら「Vingだと『いろいろやってることのひとつ』という感じがするけど,to Vだと『自分の唯一の職業(sole occupation)』という感じ」だそうです。微妙な感覚ですね。
いっぽう,hobby is Vingとhobby is to Vはつぎのようでした。
この問題はぼくの本「見える英文法」でも探求しました。
★have enough money to Vとhave money enough to Vはどちらもただしいとされています。辞書にはどちらものっていますね。
あおがhave enough money to, あかがhave money enough toです。19世紀には後者がおおかったのに,1920年代に逆転し,いまではhave enough money toがほぼ圧勝しています。have money enough toは絶滅寸前です。
入試ではenough money390件に対し,money enoughは3例しかありませんでした・
★前置詞たちにも熾烈な戦いの歴史があるようです。
be surprised は+at~とおそわりましたか?
あかがat, あおがbyです。最近byがおいあげてきて,2000年時点でほぼ互角になっています。いまではbe surprised byも普通なんですね。
入試では be surprised at 152に対し,be surprised by160とわずかにbyがまさっています。
★identical「同一の」につく前置詞はどうでしょう。
ごらんのようにかつてはidentical +withが圧倒的だったのに,1970年代のおわりにidentical + toに逆転され,現代でもtoが支配的です。ひょっとすると,むかしはidentify A with Bとの関連が意識されていたのに,いまはsimilar to, equal to, resemblance toなどのカテゴリーの一員と認識されているのかもしれません。
★「なんともおもわない」をあらわすI couldn't care lessに対し,おなじ意味をあらわすのにI could care lessというひとがかなりいて変だというはなしも「見える英文法」であつかいましたが,これらの比率はどうでしょう?
あおがcouldn't care lessです。どちらもかなり最近つかわれだした表現なんですね。1960年ごろcould care lessが出現してかなり増加中です。でも絶対にこれをみとめないひともいますよ。
たとえばこのひととか。
Phrases I Hate by TJ Kirk
2:20あたりからI could care lessへのきびしい批判がはじまります。(わかりやすいアメリカ英語なのできいてみてください I love this guy !)ぼくが「見える英文法」でしている説明とほぼ同じことをおっしゃっています。
ぼくはこれを多重否定への否定的意識から来る,過剰修正(hypercorrection)的な表現だとおもいますが,よくわかりません。(ちょっとまえ、ChatGPTにたずねたら「それは皮肉っぽい表現だ」というこたえがかえってきました。)
★ヒット商品名や,英語でつかわれるようになった日本語の単語をしらべるのもおもしろいです。
SONYのwalkmanがいかに人気だったかよくわかります。
★cool Japan(←この表現だいきらい)なことばもいくつかみてみましょう。
★KARAOKE「きゃりおーきー」です。
★OTAKUです。英語ならnerdかgeekにちかいですね。
★HENTAIです。もう完全に英語になっています。
★最近世界に爆発的に拡散した日本文化のひとつに EMOJI がありますが,
Ngramは書物のデータなので,さすがにまだグラフにはでてきませんでした
あと10年もすればきっとでてきますよ。予言します。
★補足 予言的中です!emojiがNgramに出てきました。!2021年2月25日サーチ。
みなさんもいろいろしらべてみてください。
今回は画像のサイズの問題でカットしていますが,しらべるときはグラフのひだりのはしにある頻度目盛もちゃんとみましょう。曲線がぎくしゃくしてみにくいときはsmoothingの数値をいじってみましょう。corpusの種類もいろいろきりかえてくらべてみましょう。
ではSee you around!