東日本大震災に おける Twitter の利用傾向の分析

Preview:

DESCRIPTION

東日本大震災に おける Twitter の利用傾向の分析. 宮部 真衣 † , 荒牧 英治 † , 三浦 麻子 ‡ † 東京大学知の構造化センター ‡ 関西学院大学文学部. 発表順序. 研究背景 検証仮説 対象データセット ツイートの種類 ツイートの発信地 引用関係の定義 分析 結果 分析 1 :各地域 において, Twitter はどのように利用 されたのか? 分析 2 :被災地 から発信された情報は ,他の 地域で拡散されたのか ? まとめ. 研究背景. - PowerPoint PPT Presentation

Citation preview

東日本大震災におけるTwitter の利用傾向の分析

宮部 真衣†,荒牧 英治† ,三浦 麻子‡

† 東京大学知の構造化センター‡ 関西学院大学文学部

2Center for Knowledge Structuring, The University of Tokyo.

発表順序

1.研究背景2. 検証仮説3. 対象データセット

a. ツイートの種類b. ツイートの発信地c. 引用関係の定義

4. 分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?

5. まとめ

Center for Knowledge Structuring, The University of Tokyo.

研究背景• マイクロブログの普及– Twitter 利用者数: 1491 万人( 2011 年 7

月)

• 東日本大震災( 2011 年 3 月 11 日)– Twitter などのマイクロブログが重要な情報イ

ンフラの 1 つとして活用された

3

今回の震災において活用された Twitterの利用傾向を分析し,今後のシステム開発などのための知見を抽出

Center for Knowledge Structuring, The University of Tokyo. 4

関連研究( 1/2 )• 人々の感情変化の分析– Cohn ら( 2004 ), Back(2010)• 災害・事件:アメリカ同時多発テロ事件( 2001

年)• 分析対象:ブログ

• デマの発信・拡散についての分類–Mendoza ら( 2010 )• 災害・事件:チリ地震( 2010 年)• 分析対象: Twitter

Center for Knowledge Structuring, The University of Tokyo. 5

関連研究( 2/2 )• ツイート発信者の分類や,ツイートで引用された

URL の参照内容に関する分析– Longueville ら (2009)

• 災害・事件:フランスにおける森林火災( 2009 年)• 分析対象: Twitter

• 伝搬していった情報に関する分析– Vieweg ら( 2010 )

• 災害・事件:オクラホマの火事,レッドリバーでの洪水( 2009 年)

• 分析対象: Twitter– Qu ら( 2010 )

• 災害・事件:青海地震( 2010 年)• 分析対象:オンラインフォーラム( BBS )

Center for Knowledge Structuring, The University of Tokyo. 6

目的• 東日本大震災発生後に Twitter へと投稿され

たツイートを分析

• 本研究のポイント–比較的長期間( 20 日間)のデータを用いる–地域性を考慮した分析を行う

震災発生時の Twitter 利用傾向などを明らかにする

7Center for Knowledge Structuring, The University of Tokyo.

発表順序

1. 研究背景

2.検証仮説3. 対象データセット

a. ツイートの種類b. ツイートの発信地c. 引用関係の定義

4. 分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?

5. まとめ

Center for Knowledge Structuring, The University of Tokyo. 8

メディアと情報伝達• マスメディア

– 情報発信者:メディア運営者

一方通行

双方向

• ソーシャルメディア– 情報発信者:各個人

Center for Knowledge Structuring, The University of Tokyo.

検証仮説( 1/2 )• 東日本大震災–被害の範囲が広く,マスメディアでも全体を報

じきれない–被害が深刻でないものの,支援が必要な地域を

対応しきれない [1]• マスメディアで対応しきれない被災地の状

況を,ソーシャルメディアにより各個人が発信できる可能性

9[1] 小林啓倫:災害とソーシャルメディア~混乱、そして再生へと導く人々の「つながり」~,毎日コミュニケーションズ(2011).

Center for Knowledge Structuring, The University of Tokyo.

検証仮説( 2/2 )1. 情報発信者の状況によって利用方法に違いが

あるのではないか?

2. 被災地から発信された情報は,全国的に広まるのではないか?

10

各地域において, Twitter はどのように利用されたのか?

被災地から発信された情報は,他の地域で拡散されたのか?

RQ1

RQ2

11Center for Knowledge Structuring, The University of Tokyo.

発表順序

1. 研究背景2. 検証仮説

3.対象データセットa. ツイートの種類b. ツイートの発信地c. 引用関係の定義

4. 分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?

5. まとめ

Center for Knowledge Structuring, The University of Tokyo.

対象データセット (1/2)• 本研究では,以下の 5種類のデータを利用

– 震災時• 2011 年 3月 11 日から 30 日までのツイート

– 「地震」というキーワードを含むツイートを収集

– 平常時 A• 震災以前( 2010 年 3月)のツイート

– 平常時 B• 震災発生から約4か月後( 2011 年 7 月)の,地震以外のトピックに関して収集

したツイート– 「風邪」および関連キーワードを含むツイートを収集

– 平常時 C• 震災発生から約4か月後( 2011 年 7 月)の,地震以外のトピックに関して収集

したツイート– 「見える」および「聞こえる」を含むツイートを収集

– 平常時 D• 震災発生から約4か月後( 2011 年 7 月)の,地震以外のトピックに関して収集

したツイート– 症例キーワード(「頭痛」など)を含むツイートを収集

12

Center for Knowledge Structuring, The University of Tokyo.

対象データセット (2/2)データセット 取得期間 ツイート数 収集キーワード 位置情報

震災時 2011 年 3月 1,612,074 「地震」 あり

平常時 A 2010 年 3月

99,765,808 なし なし

平常時 B

2011 年 7月

493,597 「風邪」など

あり平常時 C 1,278,581 「見える」「聞こえる」

平常時 D 4,238,627 症例(「頭痛」など)

13

Center for Knowledge Structuring, The University of Tokyo.

ツイートの種類• 本研究では,以下のツイートを扱う– リツイート( RT )

• 他ユーザのツイートを自分のフォロワーに転送する行為 – “RT @ユーザ名”が含まれる

(非公式RT )※公式RT は全体の 2.6% であったため,今回は非公式RT のみを用いる

– リプライ• 特定のユーザ宛のツイート

– “@ユーザ名”から始まる

14

情報拡散行動

対話行動

35%

3%17%

46%

各ツイートの割合

非公式 RT公式 RTリプライその他

Center for Knowledge Structuring, The University of Tokyo.

ツイートの発信地( 1/2 )• 以下の 4 つの地域に分類

– AREA1 :大災害地域• 宮城県,岩手県,福島県

– AREA2 :災害地域• AREA1 に隣接した都道府県• 青森県,秋田県,山形県,新潟県,栃木県,茨城県,群馬県

– AREA3 :間接的災害地域• AREA2 を除いた東京電力管

内の都道府県• 東京都,千葉県,埼玉県,山梨県,神奈川県,静岡県

– AREA4 :非災害地域• AREA1 ~ 3 以外の都道府県

15

被害

Center for Knowledge Structuring, The University of Tokyo.

ツイートの発信地( 2/2 )

16

• 発信地の特定手順– 位置情報が付与されている場合

• 逆ジオエンコーディングにより都道府県を特定

– 位置情報が付与されていない場合• ユーザのプロフィールから文字列マッチ

ングにより都道府県を抽出

ユーザ数 ユーザ比率 ツイート数1 人当たりのツイート数

AREA1 18,964 人 5.3% 51,791 2.73

AREA2 24,693 人 6.9% 60,097 2.43

AREA3 216,741 人 60.8% 497,831 2.30

AREA4 96,087 人 27.0% 221,961 2.31

Center for Knowledge Structuring, The University of Tokyo.

引用関係の定義• RT 投稿者と RT されたツイートの投稿者(被 RT 者)の扱い

17

本研究では,ツイート内容から取得可能な最古のツイート投稿者を被 RT 者とする

時間 A ○○らしい

B RT @ユーザ A ○○ らしい

C RT @ユーザ B RT @ユーザ A ○○らしい

D RT @ユーザ C RT @ユーザ B RT @ユーザ A ○○ らしい

E RT @ユーザ A ○○ らしい

A

B

C

D EA の RT と見なす

18Center for Knowledge Structuring, The University of Tokyo.

発表順序

1. 研究背景2. 検証仮説3. 対象データセット

a. ツイートの種類b. ツイートの発信地c. 引用関係の定義

4.分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?

5. まとめ

Center for Knowledge Structuring, The University of Tokyo.

分析結果の概要• 本発表では,以下の 2 つの調査結果につい

て報告

19

各地域において, Twitter はどのように利用されたのか?( RQ1 )

分析 1被災地から発信された情報は,他の地域で拡散されたのか?( RQ2 )

分析 2

Center for Knowledge Structuring, The University of Tokyo. 20

分析 1 :各地域において, Twitter はどのように利用されたのか?

• 震災時の各地域における利用傾向をRT率(情報拡散行動)とリプライ率(対話行動)から分析• 災害時の特徴の確認• 平常時との違いはあるか?• 時間経過に伴い,どのような変化をしている

か?• 被害の大きさによる違いの確認• 各地域での違いはあるか?

Center for Knowledge Structuring, The University of Tokyo.

AREA

1AR

EA2AR

EA3AR

EA4

平常

時A

平常

時B

平常

時C

平常

時D

0%10%20%30%40%50%

25%29%

33%42%

8%16%

8%13%

RT率(情報拡散行動)

RT率とリプライ率

21

震災時は,情報拡散行動が活発化し,対話行動が抑制される

AREA

1AR

EA2AR

EA3AR

EA4

平常

時A

平常

時B

平常

時C

平常

時D

0%10%20%30%40%50%

20%19%17%16%

36%28%

32%

22%

リプライ率(対話行動)

Center for Knowledge Structuring, The University of Tokyo. 22

RT率・リプライ率の時系列変化

地震発生直後は,情報拡散行動( RT )が最も活性化し,対話行動(リプライ)が最も抑制

11 14 17 20 23 26 290%

10%

20%

30%

40%

50%

60%

70%

RT率(情報拡散行動)

AREA1AREA2AREA3AREA4

11 14 17 20 23 26 290%

10%

20%

30%

40%

50%

60%

70%

リプライ率(対話行動)

AREA1AREA2AREA3AREA4

Center for Knowledge Structuring, The University of Tokyo. 23

都道府県別の RT率・リプライ率

(a)RT率(情報拡散行動) (b) リプライ率(対話行動)

Center for Knowledge Structuring, The University of Tokyo. 24

RQ1 について

• 平常時と比較して,震災時は情報拡散行動( RT )が活発化• RT率とリプライ率には負の相関あり(相関係数: -0.822 )

各地域において, Twitter はどのように利用されたのか?RQ1

RT率(情報拡散) リプライ率(対話)

AREA1 25.0% 20.0%

AREA2 28.8% 18.7%

AREA3 33.4% 17.2%

AREA4 42.0% 15.8%

被害

被害の大きかった地域では対話行動が,被害の小さかった地域では情報拡散行動がなされた

Center for Knowledge Structuring, The University of Tokyo. 25

分析2:被災地から発信された情報は,他の地域で拡散されたのか?

• 被災地から発信された情報の拡散傾向を,RT ・被 RT の位置関係から分析• RT における位置関係の確認• 各地域のツイートは,各地域でどれだけ RT され

たか?– 他地域で RT された割合の確認• 各地域の情報は,どれだけ他地域で RT された

か?

Center for Knowledge Structuring, The University of Tokyo.

RT における位置関係( 1/2 )

26

A ○○らしい

B RT @ユーザ A ○○ らしい

AREA1

AREA3

被 RT 者と RT 投稿者の位置関係から,各地域のツイートがどの地域で

RT されたかを調査

この場合,

被 RT 者の地域:AREA1 (ユーザ A )

RT 投稿者の地域:AREA3 (ユーザ B )

Center for Knowledge Structuring, The University of Tokyo. 27

RT における位置関係( 2/2 )

• 本研究では,ツイート移動率(TTR )を定義– 各地域の発言が,他地域でどれだけRTされたか?

RT 投稿者

AREA1 AREA2 AREA3 AREA4 計

被 RT 者

AREA1 12,470 3,136 26,323 14,989 56,918AREA2 1,430 10,517 19,527 13,160 44,634AREA3 26,239 45,042 527,516 280,054 878,851AREA4 6,047 10,778 99,789 110,062 226,676

計 48,186 69,473 673,155 418,265 1,207,079

𝑇𝑇𝑅=他地域でのRT 数

ある 地域の 被 RT数

例: AREA1 の場合

= 0.7809…• AREA1の被RT数– 56918

• 他地域でのRT数– 3136+26323+14989

= 44448

Center for Knowledge Structuring, The University of Tokyo. 28

TTR 変化率• TTR は地域の大きさの影響を受ける

被引用者の地域 AREA1 AREA2 AREA3 AREA4TTR 変化率 116.5% 88.9% 94.0% 95.6%

地域ごとに,平常時のTTR との違い( TTR 変化率)を検証

※比較対象として,平常時 D のデータを用いた

AREA1 (大災害地域)は,他地域と比較して TTR 変化率が高い

𝑇𝑇𝑅変化率=震災時のTTR平常時のTTR

Center for Knowledge Structuring, The University of Tokyo. 29

11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 300%

20%

40%

60%

80%

100%

120%

140%

160%

AREA1AREA2AREA3AREA4

TTR 変化率の時系列変化

震災発生から数日間は, AREA1 , AREA2 , AREA3 における TTR

変化率が高い

Center for Knowledge Structuring, The University of Tokyo. 30

RQ2 について

• 大災害地域( AREA1 )は,平常時と比較してツイート移動率が高い

• 震災発生後数日間は,非災害地域( AREA4 )を除いた地域におけるツイート移動率が高い

被災地から発信された情報は,他の地域で拡散されたのか?RQ2

特に被害の大きい地域のツイートについては,他地域で拡散される割合が多い

31Center for Knowledge Structuring, The University of Tokyo.

発表順序

1. 研究背景2. 検証仮説3. 対象データセット

a. ツイートの種類b. ツイートの発信地c. 引用関係の定義

4. 分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?

5.まとめ

Center for Knowledge Structuring, The University of Tokyo.

まとめ• 概要– 東日本大震災後のツイート( 2011 年 3 月 11 日~ 30 日)

の傾向について調査• 分析結果– 地域によって, Twitter での行動傾向が異なる– 特に被害の大きい地域で発信された情報は,他地域へと移動し,拡散される傾向がある

• 今後の課題– 災害時の利用における問題点への対応の検討– 3 月以降の傾向の分析

• 現在,継続してツイートを収集中– ツイート内容を含めた分析

• 重要な情報が拡散されていたか?

32

33Center for Knowledge Structuring, The University of Tokyo.

ご清聴ありがとうございました

連絡先: mai.miyabe@gmail.com

本研究で用いた地震に関するツイートデータは,以下の URL から取得・利用できます.http://mednlp.jp/resource.html

Recommended