Ngramでしらべてみよう!

Ngram viewerでしらべてみよう! 英語のうつりかわり

もうかなりむかしですが,Googleで英単語や熟語,collocationをてがるにしらべられるようになったころ,1日じゅういろんなことを検索して用例を採集したり件数をしらべていたものです。このブログでもいつもGoogleにはおせわになっています。

いまでも1日に検索回数が100回をこえてしまうことがよくあり,ときどきGoogleに「おまえがロボットでないことを証明しろ」といわれます(みなさんにはこの経験ありますか?)。

さてそんなぼくがことしはまっているのがGoogleのサイト,Ngram viewerです!

 

f:id:spotheory:20170603023411j:plain

    Google Ngram Viewer

 

ここの検索ボックスにすきな単語やフレーズをいれると,Google Booksのぼう大な本のデータを解析して,それらの時間軸にそった出現頻度をグラフで表示してくれるのです!

複数のitemを検索するときはカンマでくぎります。分析対象としたい年代はbetween □ and  □ で指定できます。

 

ではさっそく単語をいくつかしらべてみましょう!

f:id:spotheory:20170603030807j:plain

 

いかがでしょう?いきなりcolorfulでgraphicな単語ですみません。でもやっぱりこういうのをしらべてみたくなりますね。1960年あたりからshit, bitch, fuck, assholeなどが急激にのびはじめています。ここでなにがおこったのでしょう?

 

ではもうすこしまじめに。

社会の問題意識と語句の頻度は当然相関しています。

 

たとえばozone depletionglobal warming。前者は最近あまり話題になりませんよね。どうなんでしょう?

 

★まずozone depletion「オゾン層破壊」。

f:id:spotheory:20170603031357j:plain

1995年あたりをピークに,どんどんへってきていますね。

 

 つぎはacid rain「酸性雨」。これもちかごろあまりききません。

f:id:spotheory:20180221044346j:plain

 

 

 

 

★つぎにglobal warming。

f:id:spotheory:20170603031424j:plain

これは地球の平均気温とおなじようにいまもどんどん上昇中です!

 

 

 

 

★もうすこし英作文に役にたちそうなことをしらべましょう。

「 ~まで」をtillにしようかuntilにしようかまよったことはありますか?どっちが優勢なんでしょう?

f:id:spotheory:20170603032306j:plain

あかがuntil, あおがtillです。19世紀はじめに優勢だったtillはどんどん衰退し,1850年代についに逆転され,2000年には大差がついてしまいました。

入試のデータでは過去15年間でtill 416回に対し,untilは4624回と,10倍以上おおいです。

もう「until一択」でよさそうですね。

ただし,Ngramのdataは書物のデータベースですから,かならずしも会話などでの実際の使用頻度をしめしてはいません。tillはややくだけた英語とされています。

 

 

 

youtubeのコメントなどでやたらにみかける形容詞awesome。ほめことばの盛衰ははげしいようです。

おなじく「すばらしい」を意味するterrificとくらべてみましょう。

f:id:spotheory:20170603032917j:plain

あおがawesomeです。ふえてきていますね。でもterrificも一度没落してまたもりかえしつつあります。

 

意味が同じ単語や似た単語はおなじnicheをうばいあうrivalどうしのようにはげしい競争をくりひろげてきたようですね。

 

 

文法・語法的なことも探求してみましょう。

 

★英語をかいていてregret のあとに完了形の動名詞having + Ved(過去分詞)をおくべきか,ただのVingにしようか,まよったことはありませんか?

f:id:spotheory:20170603031924j:plain

regret saying(あか)とregret having said(あお)をくらべました。sayingにしとけばOKみたいですね。

入試では完了形having+Ved 20件に対し,Ving44件でした。Ngramはけっこう入試データと一致していますね。

 

★It has been a long time since ~とIt is a long time sinceはどんな比率でしょうか?まえのはアメリカ英語で,あとのはイギリス英語といわれますが。

 

まず英語一般のデータです。

f:id:spotheory:20170615012155j:plain

 1960年代からはっきりとhas beenのほうがひろがりはじめ,isのほうは衰退の一途です。むかし八幡大学の入試でhas beenをつかった文の「あやまりをなおせ」という問題がでてあきれたことがあります。これをつくったのは「保守派」の先生だったんでしょうね。

ではアメリカ英語とイギリス英語をくらべてみましょう。

 

まずアメリカ英語から。

f:id:spotheory:20170615013651j:plain

はやくも1930年ごろにhas beenがisをうわまわっています。

 

イギリス英語ではどうでしょう。

f:id:spotheory:20170615013750j:plain

has beenが勝ったのは1980と,アメリカ英語におくれること約50年でhas beenが逆転をはたしています。現代でもisはアメリカ英語よりだいぶおおいですが,やはりhas beenが優勢です。

 

そういえばiイギリスのバンドLed Zeppelinの曲Rock and  Roll(1971) にはすでにIt's been a long time since I rock and rolledという歌詞がありました。時代をさきどりしていたんですね。

 

 

★My job is のうしろをVingにしようかto Vにしようか,まよったことはありませんか?

f:id:spotheory:20170603033436j:plain

うえのほう,あおがjob is to teachのデータ,したがjob is teachingです。圧倒的にto Vですね。もちろん,かずのちがいだけでなく,たぶんニュアンスのちがいもあるとはおもいます。あるnativeにたずねたら「Vingだと『いろいろやってることのひとつ』という感じがするけど,to Vだと『自分の唯一の職業(sole occupation)』という感じ」だそうです。微妙な感覚ですね。

 

いっぽう,hobby is Vingとhobby is to Vはつぎのようでした。

f:id:spotheory:20170604201528j:plain

 

この問題はぼくの本「見える英文法」でも探求しました。

 

★have enough money to Vとhave money enough to Vはどちらもただしいとされています。辞書にはどちらものっていますね。

f:id:spotheory:20170603033813j:plain

あおがhave enough money to, あかがhave money enough toです。19世紀には後者がおおかったのに,1920年代に逆転し,いまではhave enough money toがほぼ圧勝しています。have money enough toは絶滅寸前です。

 

入試ではenough money390件に対し,money enoughは3例しかありませんでした・

 

★前置詞たちにも熾烈な戦いの歴史があるようです。

be surprised は+at~とおそわりましたか?

f:id:spotheory:20170603034129j:plain

あかがat, あおがbyです。最近byがおいあげてきて,2000年時点でほぼ互角になっています。いまではbe surprised byも普通なんですね。

入試では be surprised at 152に対し,be surprised by160とわずかにbyがまさっています。

 

★identical「同一の」につく前置詞はどうでしょう。

f:id:spotheory:20170607102002j:plain

 ごらんのようにかつてはidentical +withが圧倒的だったのに,1970年代のおわりにidentical + toに逆転され,現代でもtoが支配的です。ひょっとすると,むかしはidentify A with Bとの関連が意識されていたのに,いまはsimilar to, equal to, resemblance toなどのカテゴリーの一員と認識されているのかもしれません。

 

 

★「なんともおもわない」をあらわすI couldn't care lessに対し,おなじ意味をあらわすのにI could care lessというひとがかなりいて変だというはなしも「見える英文法」であつかいましたが,これらの比率はどうでしょう?

f:id:spotheory:20170603034602j:plain

あおがcouldn't care lessです。どちらもかなり最近つかわれだした表現なんですね。1960年ごろcould care lessが出現してかなり増加中です。でも絶対にこれをみとめないひともいますよ。

 

たとえばこのひととか。

www.youtube.com

Phrases I Hate by TJ Kirk

 2:20あたりからI could care lessへのきびしい批判がはじまります。(わかりやすいアメリカ英語なのできいてみてください I love this guy !)ぼくが「見える英文法」でしている説明とほぼ同じことをおっしゃっています。

ぼくはこれを多重否定への否定的意識から来る,過剰修正(hypercorrection)的な表現だとおもいますが,よくわかりません。(ちょっとまえ、ChatGPTにたずねたら「それは皮肉っぽい表現だ」というこたえがかえってきました。)

 

 

 

★ヒット商品名や,英語でつかわれるようになった日本語の単語をしらべるのもおもしろいです。

 

 

walkman

f:id:spotheory:20170603035030j:plain

SONYwalkmanがいかに人気だったかよくわかります。

 

 

cool Japan(←この表現だいきらい)なことばもいくつかみてみましょう。

 

 

KARAOKE「きゃりおーきー」です。

f:id:spotheory:20170603035426j:plain

 

 

 

 

OTAKUです。英語ならnerdgeekにちかいですね。

f:id:spotheory:20170603035526j:plain

 

 

 

★HENTAIです。もう完全に英語になっています。

f:id:spotheory:20170603035610j:plain

 

 

 

★最近世界に爆発的に拡散した日本文化のひとつに EMOJI  がありますが,

Ngramは書物のデータなので,さすがにまだグラフにはでてきませんでした

あと10年もすればきっとでてきますよ。予言します。

 

 

★補足 予言的中です!emojiがNgramに出てきました。!2021年2月25日サーチ。

 

f:id:spotheory:20210225215112p:plain

 

 

みなさんもいろいろしらべてみてください。

 

今回は画像のサイズの問題でカットしていますが,しらべるときはグラフのひだりのはしにある頻度目盛もちゃんとみましょう。曲線がぎくしゃくしてみにくいときはsmoothingの数値をいじってみましょう。corpusの種類もいろいろきりかえてくらべてみましょう。

 

ではSee you around!