2014年7月18日金曜日

気になる事実!人は夜中の2時にエロくなるらしいぞ! Yahoo!リアルタイム検索のビッグデータで 明らかに

人は夜中の2時にエロくなることがビッグデータ で明らかになりました。Twitterでよくつぶやかれ る言葉を抽出し、時間帯ごとに集計すると、人の 感情の移り変わりが浮かび上がってきたのです。 その結果……「エロい」を含むつぶやきのピークは 2時台という調査結果が出ました。

【拡大画像や他の画像】

調査をしたのは「Yahoo!検索(リアルタイ ム)」を提供しているヤフーです。彼らによる と、1カ月間の全体ツイート数は5時台が最も少な く、12時台に一旦増え、その後落ち込んだ後に夜 に向け再び上昇し、22時台がピークとなるそうで す。では特定のワードのツイート量・割合はどん な風に変化するのでしょうか。調べれば日本人の 感情や感覚の推移を可視化できるのでは——という のが今回の目的であります。

例えば「疲れた」という言葉。

で“ツイート量”が最も多かったのは22時台でし た。ただこれは「全体のツイート量に影響された 値」であり、「疲れた」が22台を代表する言葉か というとそうは言い切れません。

間帯別“ツイート割合”を調べると、

台でした。学校や仕事が一段落する夕方、

も疲労がたまっていそうな時間帯に増えているの が面白いです。

続いて、各時間帯を代表するワードを抽出する ことでTwitterを利用する日本人の24時間の特徴を

ちょっと細かいですが、

あぶり出していきます。

ワードの選定はこんな風にやっているそうです。

(1)ツイート文から形態素解析(文章から意味の ある単語などを自動抽出する技術)により抽出し たワード(名詞および形容詞)と、Web検索の検 索数上位ワードから作成した辞書を組み合わせて ワードリストを生成

(2)そのリストを元に2014年2月の総ツイート文 からワードを再抽出

(3)各時間帯の総ツイート数に占める各ワードを 含んだツイート文の割合を計算し、各時間帯を代 表するワードを選定

時間帯ごとに特にツイート割合が高い傾向にあ る言葉上位5つは次の通り。例えば朝6時台は「明 るい」「眠い」と1日の始まりを感じるワードが並

お昼の12時台は「お腹すいた」

びます。

ぐ」ですが、13時台になると「満腹」が増えま す。17時台になると「帰ろう」や先ほどの「疲れ た」がつぶやかれ、18時台には「お疲れ様です」 といった言葉も。

注目は夜中2時台。1位から順に「怖い」

「たのしい」

「やかましい」

い」

ここへ来て「エロい」があらわれた!

やー皆さん楽しい夜をお過ごしのようで。

に23時〜0時台は「素晴らしい」

「幸せです」など楽しげな言葉が多いのですが、 夜が深まるとネガティブなワードが増えていき、4 時台の1位は「死ね」でした。
livedoor参照

0 件のコメント:

コメントを投稿