最近、「ビッグデータ」と呼ばれる技術が人々に注目される焦点となる。クラウドコンピューティングとデータマイニングを基づくビッグデータ技術は、人々の観念を大きく変えて、同時にサンプル調査法を基づく統計学にチャレンジを発起する。世界の有名なコンサルティング会社は、「ビッグデータは競争の重要な基礎になって、新しい生産力発展、革新と消費者剰余の波を補強する」とビッグデータを評価する。
ビッグデータに関して、Google、Facebook、Linkedin、Microsoftを代表とするインターネット会社も自分の分野で研究をして始めている。言語研究の分野で、一番有名なのはgoogleの翻訳サービスだ。
本論文は、TwitterのAPIに基づいて、「爆買い」の受容度を調査するものである。「爆買い」というのは2015年2月の春節休暇に訪日中国人が日本で様々な商品を大量に買い込む社会現象である。現れた後、その言葉は日本人に速く認められて、2015年ユーキャン新語・流行語大賞の年間大賞となった。本論文では「爆買い」の起源及び発展を調査して、ビッグデータに基づいて、その言葉が社会現象の専用語から一般の言葉までに変化する原因を検討する。文献综述
2。 ビッグデータについて
2。1 ビッグデータは何か
2009年春頃、H1N1亜型という種類の型のインフルエンザウイルスは短い時間で世界中に流行した。どのようにインフルエンザの情報を速く獲得するのは疫病を予防する鍵になる。インフルエンザが爆発した数週間前、Google会社のエンジニアは科学雑誌「Nature」で、「Detecting influenza epidemics using search engine query data」という論文を発表した。その論文はサーチエンジンを基づくインフルエンザの趨勢を予測する原理を紹介して、世界を驚けた。Googleのエンジニアたちは検索記録を観察して、5000万件の頻繁に使う見出し語と疾病管理予防センターの季節性インフルエンザのデータを比べて、数学模型を介して、人がインフルエンザを患うかどうかを判断した。その得た結果はほぼCDCのデータと同じだった。すると、インフルエンザが爆発した時、停滞した公式データと比べて、Google会社の予測結果はより速い情報になって、インフルエンザの予防に役割を果たした。
その予測システムに使用された技術は現在の社会では特有の新しい能力だ。未曾有の方式として、ビッグデータを基づいて、大容量データの分析を介して、大きい価値がある産物を獲得する。