Upload
emmy
View
85
Download
4
Embed Size (px)
DESCRIPTION
東日本大震災に おける Twitter の利用傾向の分析. 宮部 真衣 † , 荒牧 英治 † , 三浦 麻子 ‡ † 東京大学知の構造化センター ‡ 関西学院大学文学部. 発表順序. 研究背景 検証仮説 対象データセット ツイートの種類 ツイートの発信地 引用関係の定義 分析 結果 分析 1 :各地域 において, Twitter はどのように利用 されたのか? 分析 2 :被災地 から発信された情報は ,他の 地域で拡散されたのか ? まとめ. 研究背景. - PowerPoint PPT Presentation
Citation preview
東日本大震災におけるTwitter の利用傾向の分析
宮部 真衣†,荒牧 英治† ,三浦 麻子‡
† 東京大学知の構造化センター‡ 関西学院大学文学部
2Center for Knowledge Structuring, The University of Tokyo.
発表順序
1.研究背景2. 検証仮説3. 対象データセット
a. ツイートの種類b. ツイートの発信地c. 引用関係の定義
4. 分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?
5. まとめ
Center for Knowledge Structuring, The University of Tokyo.
研究背景• マイクロブログの普及– Twitter 利用者数: 1491 万人( 2011 年 7
月)
• 東日本大震災( 2011 年 3 月 11 日)– Twitter などのマイクロブログが重要な情報イ
ンフラの 1 つとして活用された
3
今回の震災において活用された Twitterの利用傾向を分析し,今後のシステム開発などのための知見を抽出
Center for Knowledge Structuring, The University of Tokyo. 4
関連研究( 1/2 )• 人々の感情変化の分析– Cohn ら( 2004 ), Back(2010)• 災害・事件:アメリカ同時多発テロ事件( 2001
年)• 分析対象:ブログ
• デマの発信・拡散についての分類–Mendoza ら( 2010 )• 災害・事件:チリ地震( 2010 年)• 分析対象: Twitter
Center for Knowledge Structuring, The University of Tokyo. 5
関連研究( 2/2 )• ツイート発信者の分類や,ツイートで引用された
URL の参照内容に関する分析– Longueville ら (2009)
• 災害・事件:フランスにおける森林火災( 2009 年)• 分析対象: Twitter
• 伝搬していった情報に関する分析– Vieweg ら( 2010 )
• 災害・事件:オクラホマの火事,レッドリバーでの洪水( 2009 年)
• 分析対象: Twitter– Qu ら( 2010 )
• 災害・事件:青海地震( 2010 年)• 分析対象:オンラインフォーラム( BBS )
Center for Knowledge Structuring, The University of Tokyo. 6
目的• 東日本大震災発生後に Twitter へと投稿され
たツイートを分析
• 本研究のポイント–比較的長期間( 20 日間)のデータを用いる–地域性を考慮した分析を行う
震災発生時の Twitter 利用傾向などを明らかにする
7Center for Knowledge Structuring, The University of Tokyo.
発表順序
1. 研究背景
2.検証仮説3. 対象データセット
a. ツイートの種類b. ツイートの発信地c. 引用関係の定義
4. 分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?
5. まとめ
Center for Knowledge Structuring, The University of Tokyo. 8
メディアと情報伝達• マスメディア
– 情報発信者:メディア運営者
一方通行
双方向
• ソーシャルメディア– 情報発信者:各個人
Center for Knowledge Structuring, The University of Tokyo.
検証仮説( 1/2 )• 東日本大震災–被害の範囲が広く,マスメディアでも全体を報
じきれない–被害が深刻でないものの,支援が必要な地域を
対応しきれない [1]• マスメディアで対応しきれない被災地の状
況を,ソーシャルメディアにより各個人が発信できる可能性
9[1] 小林啓倫:災害とソーシャルメディア~混乱、そして再生へと導く人々の「つながり」~,毎日コミュニケーションズ(2011).
Center for Knowledge Structuring, The University of Tokyo.
検証仮説( 2/2 )1. 情報発信者の状況によって利用方法に違いが
あるのではないか?
2. 被災地から発信された情報は,全国的に広まるのではないか?
10
各地域において, Twitter はどのように利用されたのか?
被災地から発信された情報は,他の地域で拡散されたのか?
RQ1
RQ2
11Center for Knowledge Structuring, The University of Tokyo.
発表順序
1. 研究背景2. 検証仮説
3.対象データセットa. ツイートの種類b. ツイートの発信地c. 引用関係の定義
4. 分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?
5. まとめ
Center for Knowledge Structuring, The University of Tokyo.
対象データセット (1/2)• 本研究では,以下の 5種類のデータを利用
– 震災時• 2011 年 3月 11 日から 30 日までのツイート
– 「地震」というキーワードを含むツイートを収集
– 平常時 A• 震災以前( 2010 年 3月)のツイート
– 平常時 B• 震災発生から約4か月後( 2011 年 7 月)の,地震以外のトピックに関して収集
したツイート– 「風邪」および関連キーワードを含むツイートを収集
– 平常時 C• 震災発生から約4か月後( 2011 年 7 月)の,地震以外のトピックに関して収集
したツイート– 「見える」および「聞こえる」を含むツイートを収集
– 平常時 D• 震災発生から約4か月後( 2011 年 7 月)の,地震以外のトピックに関して収集
したツイート– 症例キーワード(「頭痛」など)を含むツイートを収集
12
Center for Knowledge Structuring, The University of Tokyo.
対象データセット (2/2)データセット 取得期間 ツイート数 収集キーワード 位置情報
震災時 2011 年 3月 1,612,074 「地震」 あり
平常時 A 2010 年 3月
99,765,808 なし なし
平常時 B
2011 年 7月
493,597 「風邪」など
あり平常時 C 1,278,581 「見える」「聞こえる」
平常時 D 4,238,627 症例(「頭痛」など)
13
Center for Knowledge Structuring, The University of Tokyo.
ツイートの種類• 本研究では,以下のツイートを扱う– リツイート( RT )
• 他ユーザのツイートを自分のフォロワーに転送する行為 – “RT @ユーザ名”が含まれる
(非公式RT )※公式RT は全体の 2.6% であったため,今回は非公式RT のみを用いる
– リプライ• 特定のユーザ宛のツイート
– “@ユーザ名”から始まる
14
情報拡散行動
対話行動
35%
3%17%
46%
各ツイートの割合
非公式 RT公式 RTリプライその他
Center for Knowledge Structuring, The University of Tokyo.
ツイートの発信地( 1/2 )• 以下の 4 つの地域に分類
– AREA1 :大災害地域• 宮城県,岩手県,福島県
– AREA2 :災害地域• AREA1 に隣接した都道府県• 青森県,秋田県,山形県,新潟県,栃木県,茨城県,群馬県
– AREA3 :間接的災害地域• AREA2 を除いた東京電力管
内の都道府県• 東京都,千葉県,埼玉県,山梨県,神奈川県,静岡県
– AREA4 :非災害地域• AREA1 ~ 3 以外の都道府県
15
大
小
被害
Center for Knowledge Structuring, The University of Tokyo.
ツイートの発信地( 2/2 )
16
• 発信地の特定手順– 位置情報が付与されている場合
• 逆ジオエンコーディングにより都道府県を特定
– 位置情報が付与されていない場合• ユーザのプロフィールから文字列マッチ
ングにより都道府県を抽出
ユーザ数 ユーザ比率 ツイート数1 人当たりのツイート数
AREA1 18,964 人 5.3% 51,791 2.73
AREA2 24,693 人 6.9% 60,097 2.43
AREA3 216,741 人 60.8% 497,831 2.30
AREA4 96,087 人 27.0% 221,961 2.31
Center for Knowledge Structuring, The University of Tokyo.
引用関係の定義• RT 投稿者と RT されたツイートの投稿者(被 RT 者)の扱い
17
本研究では,ツイート内容から取得可能な最古のツイート投稿者を被 RT 者とする
時間 A ○○らしい
B RT @ユーザ A ○○ らしい
C RT @ユーザ B RT @ユーザ A ○○らしい
D RT @ユーザ C RT @ユーザ B RT @ユーザ A ○○ らしい
E RT @ユーザ A ○○ らしい
A
B
C
D EA の RT と見なす
18Center for Knowledge Structuring, The University of Tokyo.
発表順序
1. 研究背景2. 検証仮説3. 対象データセット
a. ツイートの種類b. ツイートの発信地c. 引用関係の定義
4.分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?
5. まとめ
Center for Knowledge Structuring, The University of Tokyo.
分析結果の概要• 本発表では,以下の 2 つの調査結果につい
て報告
19
各地域において, Twitter はどのように利用されたのか?( RQ1 )
分析 1被災地から発信された情報は,他の地域で拡散されたのか?( RQ2 )
分析 2
Center for Knowledge Structuring, The University of Tokyo. 20
分析 1 :各地域において, Twitter はどのように利用されたのか?
• 震災時の各地域における利用傾向をRT率(情報拡散行動)とリプライ率(対話行動)から分析• 災害時の特徴の確認• 平常時との違いはあるか?• 時間経過に伴い,どのような変化をしている
か?• 被害の大きさによる違いの確認• 各地域での違いはあるか?
Center for Knowledge Structuring, The University of Tokyo.
AREA
1AR
EA2AR
EA3AR
EA4
平常
時A
平常
時B
平常
時C
平常
時D
0%10%20%30%40%50%
25%29%
33%42%
8%16%
8%13%
RT率(情報拡散行動)
RT率とリプライ率
21
震災時は,情報拡散行動が活発化し,対話行動が抑制される
AREA
1AR
EA2AR
EA3AR
EA4
平常
時A
平常
時B
平常
時C
平常
時D
0%10%20%30%40%50%
20%19%17%16%
36%28%
32%
22%
リプライ率(対話行動)
Center for Knowledge Structuring, The University of Tokyo. 22
RT率・リプライ率の時系列変化
地震発生直後は,情報拡散行動( RT )が最も活性化し,対話行動(リプライ)が最も抑制
11 14 17 20 23 26 290%
10%
20%
30%
40%
50%
60%
70%
RT率(情報拡散行動)
AREA1AREA2AREA3AREA4
11 14 17 20 23 26 290%
10%
20%
30%
40%
50%
60%
70%
リプライ率(対話行動)
AREA1AREA2AREA3AREA4
Center for Knowledge Structuring, The University of Tokyo. 23
都道府県別の RT率・リプライ率
(a)RT率(情報拡散行動) (b) リプライ率(対話行動)
Center for Knowledge Structuring, The University of Tokyo. 24
RQ1 について
• 平常時と比較して,震災時は情報拡散行動( RT )が活発化• RT率とリプライ率には負の相関あり(相関係数: -0.822 )
各地域において, Twitter はどのように利用されたのか?RQ1
RT率(情報拡散) リプライ率(対話)
AREA1 25.0% 20.0%
AREA2 28.8% 18.7%
AREA3 33.4% 17.2%
AREA4 42.0% 15.8%
大
小
被害
被害の大きかった地域では対話行動が,被害の小さかった地域では情報拡散行動がなされた
Center for Knowledge Structuring, The University of Tokyo. 25
分析2:被災地から発信された情報は,他の地域で拡散されたのか?
• 被災地から発信された情報の拡散傾向を,RT ・被 RT の位置関係から分析• RT における位置関係の確認• 各地域のツイートは,各地域でどれだけ RT され
たか?– 他地域で RT された割合の確認• 各地域の情報は,どれだけ他地域で RT された
か?
Center for Knowledge Structuring, The University of Tokyo.
RT における位置関係( 1/2 )
26
A ○○らしい
B RT @ユーザ A ○○ らしい
AREA1
AREA3
被 RT 者と RT 投稿者の位置関係から,各地域のツイートがどの地域で
RT されたかを調査
この場合,
被 RT 者の地域:AREA1 (ユーザ A )
RT 投稿者の地域:AREA3 (ユーザ B )
Center for Knowledge Structuring, The University of Tokyo. 27
RT における位置関係( 2/2 )
• 本研究では,ツイート移動率(TTR )を定義– 各地域の発言が,他地域でどれだけRTされたか?
RT 投稿者
AREA1 AREA2 AREA3 AREA4 計
被 RT 者
AREA1 12,470 3,136 26,323 14,989 56,918AREA2 1,430 10,517 19,527 13,160 44,634AREA3 26,239 45,042 527,516 280,054 878,851AREA4 6,047 10,778 99,789 110,062 226,676
計 48,186 69,473 673,155 418,265 1,207,079
𝑇𝑇𝑅=他地域でのRT 数
ある 地域の 被 RT数
例: AREA1 の場合
= 0.7809…• AREA1の被RT数– 56918
• 他地域でのRT数– 3136+26323+14989
= 44448
Center for Knowledge Structuring, The University of Tokyo. 28
TTR 変化率• TTR は地域の大きさの影響を受ける
被引用者の地域 AREA1 AREA2 AREA3 AREA4TTR 変化率 116.5% 88.9% 94.0% 95.6%
地域ごとに,平常時のTTR との違い( TTR 変化率)を検証
※比較対象として,平常時 D のデータを用いた
AREA1 (大災害地域)は,他地域と比較して TTR 変化率が高い
𝑇𝑇𝑅変化率=震災時のTTR平常時のTTR
Center for Knowledge Structuring, The University of Tokyo. 29
11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 300%
20%
40%
60%
80%
100%
120%
140%
160%
AREA1AREA2AREA3AREA4
TTR 変化率の時系列変化
震災発生から数日間は, AREA1 , AREA2 , AREA3 における TTR
変化率が高い
Center for Knowledge Structuring, The University of Tokyo. 30
RQ2 について
• 大災害地域( AREA1 )は,平常時と比較してツイート移動率が高い
• 震災発生後数日間は,非災害地域( AREA4 )を除いた地域におけるツイート移動率が高い
被災地から発信された情報は,他の地域で拡散されたのか?RQ2
特に被害の大きい地域のツイートについては,他地域で拡散される割合が多い
31Center for Knowledge Structuring, The University of Tokyo.
発表順序
1. 研究背景2. 検証仮説3. 対象データセット
a. ツイートの種類b. ツイートの発信地c. 引用関係の定義
4. 分析結果分析 1 :各地域において, Twitter はどのように利用されたのか?分析 2 :被災地から発信された情報は,他の地域で拡散されたのか?
5.まとめ
Center for Knowledge Structuring, The University of Tokyo.
まとめ• 概要– 東日本大震災後のツイート( 2011 年 3 月 11 日~ 30 日)
の傾向について調査• 分析結果– 地域によって, Twitter での行動傾向が異なる– 特に被害の大きい地域で発信された情報は,他地域へと移動し,拡散される傾向がある
• 今後の課題– 災害時の利用における問題点への対応の検討– 3 月以降の傾向の分析
• 現在,継続してツイートを収集中– ツイート内容を含めた分析
• 重要な情報が拡散されていたか?
32
33Center for Knowledge Structuring, The University of Tokyo.
ご清聴ありがとうございました
連絡先: [email protected]
本研究で用いた地震に関するツイートデータは,以下の URL から取得・利用できます.http://mednlp.jp/resource.html