33
東東東東東東東東東東 Twitter 東東東東東東東東 東東 東東 東東 東東 東東 東東 † 東東東東東東東東東東東東東 ‡東 東東東東東東東 西

東日本大震災に おける Twitter の利用傾向の分析

  • Upload
    emmy

  • View
    85

  • Download
    4

Embed Size (px)

DESCRIPTION

東日本大震災に おける Twitter の利用傾向の分析. 宮部 真衣 † , 荒牧 英治 † , 三浦 麻子 ‡ † 東京大学知の構造化センター ‡ 関西学院大学文学部. 発表順序. 研究背景 検証仮説 対象データセット ツイートの種類 ツイートの発信地 引用関係の定義 分析 結果 分析 1 :各地域 において, Twitter はどのように利用 されたのか? 分析 2 :被災地 から発信された情報は ,他の 地域で拡散されたのか ? まとめ. 研究背景. - PowerPoint PPT Presentation

Citation preview

Page 1: 東日本大震災に おける Twitter  の利用傾向の分析

東日本大震災におけるTwitter の利用傾向の分析

宮部 真衣†,荒牧 英治† ,三浦 麻子‡

† 東京大学知の構造化センター‡ 関西学院大学文学部

Page 2: 東日本大震災に おける Twitter  の利用傾向の分析

2Center for Knowledge Structuring, The University of Tokyo.

発表順序

1.研究背景2. 検証仮説3. 対象データセット

a. ツイートの種類b. ツイートの発信地c. 引用関係の定義

4. 分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?

5. まとめ

Page 3: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

研究背景• マイクロブログの普及– Twitter 利用者数: 1491 万人( 2011 年 7

月)

• 東日本大震災( 2011 年 3 月 11 日)– Twitter などのマイクロブログが重要な情報イ

ンフラの 1 つとして活用された

3

今回の震災において活用された Twitterの利用傾向を分析し,今後のシステム開発などのための知見を抽出

Page 4: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 4

関連研究( 1/2 )• 人々の感情変化の分析– Cohn ら( 2004 ), Back(2010)• 災害・事件:アメリカ同時多発テロ事件( 2001

年)• 分析対象:ブログ

• デマの発信・拡散についての分類–Mendoza ら( 2010 )• 災害・事件:チリ地震( 2010 年)• 分析対象: Twitter

Page 5: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 5

関連研究( 2/2 )• ツイート発信者の分類や,ツイートで引用された

URL の参照内容に関する分析– Longueville ら (2009)

• 災害・事件:フランスにおける森林火災( 2009 年)• 分析対象: Twitter

• 伝搬していった情報に関する分析– Vieweg ら( 2010 )

• 災害・事件:オクラホマの火事,レッドリバーでの洪水( 2009 年)

• 分析対象: Twitter– Qu ら( 2010 )

• 災害・事件:青海地震( 2010 年)• 分析対象:オンラインフォーラム( BBS )

Page 6: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 6

目的• 東日本大震災発生後に Twitter へと投稿され

たツイートを分析

• 本研究のポイント–比較的長期間( 20 日間)のデータを用いる–地域性を考慮した分析を行う

震災発生時の Twitter 利用傾向などを明らかにする

Page 7: 東日本大震災に おける Twitter  の利用傾向の分析

7Center for Knowledge Structuring, The University of Tokyo.

発表順序

1. 研究背景

2.検証仮説3. 対象データセット

a. ツイートの種類b. ツイートの発信地c. 引用関係の定義

4. 分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?

5. まとめ

Page 8: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 8

メディアと情報伝達• マスメディア

– 情報発信者:メディア運営者

一方通行

双方向

• ソーシャルメディア– 情報発信者:各個人

Page 9: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

検証仮説( 1/2 )• 東日本大震災–被害の範囲が広く,マスメディアでも全体を報

じきれない–被害が深刻でないものの,支援が必要な地域を

対応しきれない [1]• マスメディアで対応しきれない被災地の状

況を,ソーシャルメディアにより各個人が発信できる可能性

9[1] 小林啓倫:災害とソーシャルメディア~混乱、そして再生へと導く人々の「つながり」~,毎日コミュニケーションズ(2011).

Page 10: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

検証仮説( 2/2 )1. 情報発信者の状況によって利用方法に違いが

あるのではないか?

2. 被災地から発信された情報は,全国的に広まるのではないか?

10

各地域において, Twitter はどのように利用されたのか?

被災地から発信された情報は,他の地域で拡散されたのか?

RQ1

RQ2

Page 11: 東日本大震災に おける Twitter  の利用傾向の分析

11Center for Knowledge Structuring, The University of Tokyo.

発表順序

1. 研究背景2. 検証仮説

3.対象データセットa. ツイートの種類b. ツイートの発信地c. 引用関係の定義

4. 分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?

5. まとめ

Page 12: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

対象データセット (1/2)• 本研究では,以下の 5種類のデータを利用

– 震災時• 2011 年 3月 11 日から 30 日までのツイート

– 「地震」というキーワードを含むツイートを収集

– 平常時 A• 震災以前( 2010 年 3月)のツイート

– 平常時 B• 震災発生から約4か月後( 2011 年 7 月)の,地震以外のトピックに関して収集

したツイート– 「風邪」および関連キーワードを含むツイートを収集

– 平常時 C• 震災発生から約4か月後( 2011 年 7 月)の,地震以外のトピックに関して収集

したツイート– 「見える」および「聞こえる」を含むツイートを収集

– 平常時 D• 震災発生から約4か月後( 2011 年 7 月)の,地震以外のトピックに関して収集

したツイート– 症例キーワード(「頭痛」など)を含むツイートを収集

12

Page 13: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

対象データセット (2/2)データセット 取得期間 ツイート数 収集キーワード 位置情報

震災時 2011 年 3月 1,612,074 「地震」 あり

平常時 A 2010 年 3月

99,765,808 なし なし

平常時 B

2011 年 7月

493,597 「風邪」など

あり平常時 C 1,278,581 「見える」「聞こえる」

平常時 D 4,238,627 症例(「頭痛」など)

13

Page 14: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

ツイートの種類• 本研究では,以下のツイートを扱う– リツイート( RT )

• 他ユーザのツイートを自分のフォロワーに転送する行為 – “RT @ユーザ名”が含まれる

(非公式RT )※公式RT は全体の 2.6% であったため,今回は非公式RT のみを用いる

– リプライ• 特定のユーザ宛のツイート

– “@ユーザ名”から始まる

14

情報拡散行動

対話行動

35%

3%17%

46%

各ツイートの割合

非公式 RT公式 RTリプライその他

Page 15: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

ツイートの発信地( 1/2 )• 以下の 4 つの地域に分類

– AREA1 :大災害地域• 宮城県,岩手県,福島県

– AREA2 :災害地域• AREA1 に隣接した都道府県• 青森県,秋田県,山形県,新潟県,栃木県,茨城県,群馬県

– AREA3 :間接的災害地域• AREA2 を除いた東京電力管

内の都道府県• 東京都,千葉県,埼玉県,山梨県,神奈川県,静岡県

– AREA4 :非災害地域• AREA1 ~ 3 以外の都道府県

15

被害

Page 16: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

ツイートの発信地( 2/2 )

16

• 発信地の特定手順– 位置情報が付与されている場合

• 逆ジオエンコーディングにより都道府県を特定

– 位置情報が付与されていない場合• ユーザのプロフィールから文字列マッチ

ングにより都道府県を抽出

ユーザ数 ユーザ比率 ツイート数1 人当たりのツイート数

AREA1 18,964 人 5.3% 51,791 2.73

AREA2 24,693 人 6.9% 60,097 2.43

AREA3 216,741 人 60.8% 497,831 2.30

AREA4 96,087 人 27.0% 221,961 2.31

Page 17: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

引用関係の定義• RT 投稿者と RT されたツイートの投稿者(被 RT 者)の扱い

17

本研究では,ツイート内容から取得可能な最古のツイート投稿者を被 RT 者とする

時間 A ○○らしい

B RT @ユーザ A ○○ らしい

C RT @ユーザ B RT @ユーザ A ○○らしい

D RT @ユーザ C RT @ユーザ B RT @ユーザ A ○○ らしい

E RT @ユーザ A ○○ らしい

A

B

C

D EA の RT と見なす

Page 18: 東日本大震災に おける Twitter  の利用傾向の分析

18Center for Knowledge Structuring, The University of Tokyo.

発表順序

1. 研究背景2. 検証仮説3. 対象データセット

a. ツイートの種類b. ツイートの発信地c. 引用関係の定義

4.分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?

5. まとめ

Page 19: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

分析結果の概要• 本発表では,以下の 2 つの調査結果につい

て報告

19

各地域において, Twitter はどのように利用されたのか?( RQ1 )

分析 1被災地から発信された情報は,他の地域で拡散されたのか?( RQ2 )

分析 2

Page 20: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 20

分析 1 :各地域において, Twitter はどのように利用されたのか?

• 震災時の各地域における利用傾向をRT率(情報拡散行動)とリプライ率(対話行動)から分析• 災害時の特徴の確認• 平常時との違いはあるか?• 時間経過に伴い,どのような変化をしている

か?• 被害の大きさによる違いの確認• 各地域での違いはあるか?

Page 21: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

AREA

1AR

EA2AR

EA3AR

EA4

平常

時A

平常

時B

平常

時C

平常

時D

0%10%20%30%40%50%

25%29%

33%42%

8%16%

8%13%

RT率(情報拡散行動)

RT率とリプライ率

21

震災時は,情報拡散行動が活発化し,対話行動が抑制される

AREA

1AR

EA2AR

EA3AR

EA4

平常

時A

平常

時B

平常

時C

平常

時D

0%10%20%30%40%50%

20%19%17%16%

36%28%

32%

22%

リプライ率(対話行動)

Page 22: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 22

RT率・リプライ率の時系列変化

地震発生直後は,情報拡散行動( RT )が最も活性化し,対話行動(リプライ)が最も抑制

11 14 17 20 23 26 290%

10%

20%

30%

40%

50%

60%

70%

RT率(情報拡散行動)

AREA1AREA2AREA3AREA4

11 14 17 20 23 26 290%

10%

20%

30%

40%

50%

60%

70%

リプライ率(対話行動)

AREA1AREA2AREA3AREA4

Page 23: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 23

都道府県別の RT率・リプライ率

(a)RT率(情報拡散行動) (b) リプライ率(対話行動)

Page 24: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 24

RQ1 について

• 平常時と比較して,震災時は情報拡散行動( RT )が活発化• RT率とリプライ率には負の相関あり(相関係数: -0.822 )

各地域において, Twitter はどのように利用されたのか?RQ1

RT率(情報拡散) リプライ率(対話)

AREA1 25.0% 20.0%

AREA2 28.8% 18.7%

AREA3 33.4% 17.2%

AREA4 42.0% 15.8%

被害

被害の大きかった地域では対話行動が,被害の小さかった地域では情報拡散行動がなされた

Page 25: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 25

分析2:被災地から発信された情報は,他の地域で拡散されたのか?

• 被災地から発信された情報の拡散傾向を,RT ・被 RT の位置関係から分析• RT における位置関係の確認• 各地域のツイートは,各地域でどれだけ RT され

たか?– 他地域で RT された割合の確認• 各地域の情報は,どれだけ他地域で RT された

か?

Page 26: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

RT における位置関係( 1/2 )

26

A ○○らしい

B RT @ユーザ A ○○ らしい

AREA1

AREA3

被 RT 者と RT 投稿者の位置関係から,各地域のツイートがどの地域で

RT されたかを調査

この場合,

被 RT 者の地域:AREA1 (ユーザ A )

RT 投稿者の地域:AREA3 (ユーザ B )

Page 27: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 27

RT における位置関係( 2/2 )

• 本研究では,ツイート移動率(TTR )を定義– 各地域の発言が,他地域でどれだけRTされたか?

RT 投稿者

AREA1 AREA2 AREA3 AREA4 計

被 RT 者

AREA1 12,470 3,136 26,323 14,989 56,918AREA2 1,430 10,517 19,527 13,160 44,634AREA3 26,239 45,042 527,516 280,054 878,851AREA4 6,047 10,778 99,789 110,062 226,676

計 48,186 69,473 673,155 418,265 1,207,079

𝑇𝑇𝑅=他地域でのRT 数

ある 地域の 被 RT数

例: AREA1 の場合

= 0.7809…• AREA1の被RT数– 56918

• 他地域でのRT数– 3136+26323+14989

= 44448

Page 28: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 28

TTR 変化率• TTR は地域の大きさの影響を受ける

被引用者の地域 AREA1 AREA2 AREA3 AREA4TTR 変化率 116.5% 88.9% 94.0% 95.6%

地域ごとに,平常時のTTR との違い( TTR 変化率)を検証

※比較対象として,平常時 D のデータを用いた

AREA1 (大災害地域)は,他地域と比較して TTR 変化率が高い

𝑇𝑇𝑅変化率=震災時のTTR平常時のTTR

Page 29: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 29

11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 300%

20%

40%

60%

80%

100%

120%

140%

160%

AREA1AREA2AREA3AREA4

TTR 変化率の時系列変化

震災発生から数日間は, AREA1 , AREA2 , AREA3 における TTR

変化率が高い

Page 30: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo. 30

RQ2 について

• 大災害地域( AREA1 )は,平常時と比較してツイート移動率が高い

• 震災発生後数日間は,非災害地域( AREA4 )を除いた地域におけるツイート移動率が高い

被災地から発信された情報は,他の地域で拡散されたのか?RQ2

特に被害の大きい地域のツイートについては,他地域で拡散される割合が多い

Page 31: 東日本大震災に おける Twitter  の利用傾向の分析

31Center for Knowledge Structuring, The University of Tokyo.

発表順序

1. 研究背景2. 検証仮説3. 対象データセット

a. ツイートの種類b. ツイートの発信地c. 引用関係の定義

4. 分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?

5.まとめ

Page 32: 東日本大震災に おける Twitter  の利用傾向の分析

Center for Knowledge Structuring, The University of Tokyo.

まとめ• 概要– 東日本大震災後のツイート( 2011 年 3 月 11 日~ 30 日)

の傾向について調査• 分析結果– 地域によって, Twitter での行動傾向が異なる– 特に被害の大きい地域で発信された情報は,他地域へと移動し,拡散される傾向がある

• 今後の課題– 災害時の利用における問題点への対応の検討– 3 月以降の傾向の分析

• 現在,継続してツイートを収集中– ツイート内容を含めた分析

• 重要な情報が拡散されていたか?

32

Page 33: 東日本大震災に おける Twitter  の利用傾向の分析

33Center for Knowledge Structuring, The University of Tokyo.

ご清聴ありがとうございました

連絡先: [email protected]

本研究で用いた地震に関するツイートデータは,以下の URL から取得・利用できます.http://mednlp.jp/resource.html