Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
電子情報通信学会複雑性研究会2007.4.13
複複雑ネットワーク:雑ネットワーク:構構造と造と機機能からの分析能からの分析
An Analysis Method for Complex Network from the Viewpoint of Structure and Function
白山 晋 (東京大学人工物工学研究センター)e-mail: [email protected]
内田 誠 (東京大学大学院工学系研究科)e-mail: [email protected]
社会的制約条件への影響と価値観の変化を考慮した人間活動モデル
・事象,現象依存(マルチシナリオ,マルチフィジックス)
・時間・空間依存(マルチスケール)・概念依存(マルチパラダイム)
問題の複雑性
SSocial Systemocial System
New New EEnergy nergy WWebeb
NNatural atural EEnvironmentnvironment 問題解決のための,人間(活動)を含む総合的なモデリング論の構築
Artifacts
環境との調和と価値創出
Huma
n Web
Huma
n Web
II nfo
rmat
ion
Web
nfor
mat
ion
Web
第4の科学的手法
Background
PPhenomena and Events on a WWebeb
・・移流拡散に関連する現象・事象・・相互作用と創発が鍵となる事象・現象
・・伝染病,コンピュータウィルス・・脳内の情報伝達・・食物連鎖,棲み分けなどの生態系関連・・流行などの経済現象,活動(口コミによる世論形成等)
・・交通網,物流など
Background
個々人の集合によって生じる個々人の集合によって生じる現象は,固有現象は,固有のの「行動(属性)」「行動(属性)」だけではなく,他との相互作用だけではなく,他との相互作用によるによる「「環境(構造)環境(構造)」」によってによっても規定も規定される.される.
⇒⇒ 社会における様々な現象を社会における様々な現象を理解し,理解し,計算機計算機シミュレーションなどの手法シミュレーションなどの手法によってより精確に予測するためによってより精確に予測するためにに
は,個々人は,個々人のの「群」としてのネット「群」としてのネットワークの構造ワークの構造を知り,そのを知り,その上での上での現象を解明すること現象を解明することが有効.が有効. 相互作用
創発・共創
行動(属性)
環境(構造)
Background
「群」としてのネットワークへの注目
人工物工学的視点
複雑ネットワーク構造複雑ネットワーク構造現実の人的(社会的)ネットワークは完全に規則的でも現実の人的(社会的)ネットワークは完全に規則的でも完全に無秩序でもでもない複雑な構造を完全に無秩序でもでもない複雑な構造をしている.している.
そこで発生する現象は非常にそこで発生する現象は非常に複雑で,予測が難しい.複雑で,予測が難しい.
規則的 (e.g. 格子) 無秩序(ランダム)
not Regular, not Random
Background
不均一なネットワーク不均一なネットワーク: : ハブとコミュニティハブとコミュニティ現実のネットワークの特徴: 不均一性・不完全性
その上で発生する現象は非常に複雑になる.
構造の特徴を記述すること自体が難しい(特徴量の不足).
⇒ そのため,いまだ明らかになっていない性質が多く存在する.
現実のネットワークの特徴現実のネットワークの特徴: : 不均一性不均一性・・不完全性不完全性その上で発生する現象は非常に複雑その上で発生する現象は非常に複雑になる.になる.
構造の特徴を記述すること自体が難しい(特徴量の構造の特徴を記述すること自体が難しい(特徴量の不足).不足).
⇒⇒ そのため,いまだそのため,いまだ明らかになっていない性質が多く明らかになっていない性質が多く存在する.存在する.
密なコミュニティ
ハブ
疎遠
繋がりが強 不均一なネットワーク
ある空手クラブでの友人関係[Newman2003]
Background
近年,複雑ネットワークの科学と称されるものは,従来の社会科学や離散数学の分野で行われているネットワーク研究とは趣を異とする.非常に大きなネットワークを視野に入れているためである.このため,個々の要素間の関係性を詳細に検討することよりも,ネットワーク全体を統計的な視点や,位相的構造から捉えることの比重が大きいようである.本稿では,はじめに,複雑ネットワークの統計的指標と,統計的指標を再
現するように設計され提案されたいくつかのネットワークモデルについて説明する(この中でネットワークの攻撃耐性の考え方についてもふれる).次に,既存研究において不足している事柄を示し,ここで,マクロ的指標
に注目する.我々の最近の研究目標は,複雑ネットワークに対する新たなマクロ的指標を提案することにある.以降,(1) 可視化によるネットワークの分類,(2) ネットワークの機能からの構造分析,(3) ネットワークモデルを利用した構造分析という3つのトピックを紹介する.次に,マクロ的構造とミクロ的構造を結びつけることを目的として,ネットワークの大局的な性質から局所的な性質に目を転じる.ネットワークの局所構造に関係するコミュニティに着目し,大局的な構造の中に存在するコミュニティの顕在化手法について説明する.また,我々が提案するコミュニティの類型化手法を紹介する.最後に,簡単ではあるが,将来展望を紹介する.
Summary of today’s talk 複雑ネットワーク研究複雑ネットワーク研究
(Complex Network (Complex Network ResearchResearch))
大規模大規模なネットワークなネットワークでは,個々では,個々の関係性を調べることや,視覚的の関係性を調べることや,視覚的に構造を捉えることに構造を捉えることが難しいとさが難しいとされており,統計的れており,統計的なな特徴量が模索特徴量が模索されてきた.されてきた.
ノードが持つエッジの次数分布ノードが持つエッジの次数分布
平均経路長平均経路長LLクラスタ率クラスタ率CC ,・,・・・・・etc.etc.
ネットワークの例(N=1381)
複雑で不均一,大規模なネットワークについて,複雑で不均一,大規模なネットワークについて,その構造や機能を知るための分析手法およびその構造や機能を知るための分析手法およびその研究その研究 [[Newman2003Newman2003などなど]]
Nature, Science, PNAS, Physical review letter, Social networks,Physical review E, Physica A, European journal of physics B など
AAdjacentdjacent MatrixMatrixV (Vertex or Node) E (Edge or Link)
v1
v2
v6
v7
v8
v3
v4
v5
v9
v10
v11v12
v13
v14v15
v16
v17
v18
v19
v20
v21
v22
0110000000000000000000101011000000000000000011010100000000000000000010110000000000000000010101000000000000000001111011100110111011000000010000001000000000000001000000000000000000000100000000010000000000000000000100000000000000000000010000000000000100000000010000000000011000000001011000000000000110000100000000000100000000010010000000010010011110101000000001000000000100001000000000000010000010000000010000001011010101000001000000000000100000000000000000001000010000000000000000001010
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
vvvvvvvvvvvvvvvvvvvvvv
22212019181716151413121110987654321 vvvvvvvvvvvvvvvvvvvvvv
0110000000000000000000101011000000000000000011010100000000000000000010110000000000000000010101000000000000000001111011100110111011000000010000001000000000000001000000000000000000000100000000010000000000000000000100000000000000000000010000000000000100000000010000000000011000000001011000000000000110000100000000000100000000010010000000010010011110101000000001000000000100001000000000000010000010000000010000001011010101000001000000000000100000000000000000001000010000000000000000001010
v1
v2
v6
v7
v8
v3
v4
v5
v9
v10
v11v12
v13
v14v15
v16
v17
v18
v19
v20
v21
v22
SShortest pathhortest path between two verticesbetween two vertices
3344
66
4),( =tsdGs
t?),( =tsdG
s
t
3),( =tsdG
),( tsdG
MMean geodesic (ean geodesic (i.e., shortesti.e., shortest) distance) distance
∑∈−
=Vts
G tsdnnL
,),(
2/)1(1
ss
2
2
2
2
1
1
2
1
21 1
1
22
2
3
2
2
21
1
DDegree egree distributiondistributionn : : total number of verticespk : : the probability that a vertex chosen
uniformly at random has degree k
nnp kk =
ln k
ln pk
1 10 102 103
10-1
10-2
10-3
α−≈ kpk
Example of scale-free
CCentralityentrality indicesindices
∑∈
=
VtG
C tvdvC
),(1)(・・CClosenessloseness
centralitycentrality
・・GGraph centralityraph centrality
・・SStress centralitytress centrality
・・BBetweeness etweeness centralitycentrality
),(max1)(
tvdvC
GVt
G
∈
=
∑∈≠≠
=Vtvs
stS vvC )()( σ
∑∈≠≠
=Vtvs st
stB
vvCσ
σ )()(
vi
vj
vk
2),( =kjG vvd
1)(
3
=
=
ivv
vv
vkj
kj
σ
σ
BBetweeness etweeness Centrality Centrality ∑∈≠≠
=Vtvs st
stB
vvCσ
σ )()(
ikj vvvtvs === ,,
Random graph ModelRandom graph Model [Erdös, Rényi1959]Static network model, number of nodes is constant.Static network model, number of nodes is constant.
WSWS (Watts(Watts--Strogatz) Strogatz) ModelModel [[Watts, StrogatzWatts, Strogatz19981998]]ネットワークの狭さネットワークの狭さとと高い凝集性高い凝集性を再現を再現..
BABA (Bara(Barabbáássii--Albert) Albert) ModelModel [Ba[Barabrabáási, Albertsi, Albert19991999]]Growing network model, based on Growing network model, based on ““rich gets richerrich gets richer”” conceptconcept..ReproducingReproducing Power-law degree distribution andand small-world property..
KE (KlemKE (Klemmm--EgEguuíílluuz) z) ModelModel [Klemm, Equ[Klemm, Equííluz2002]luz2002]Growing network model, based on Growing network model, based on ““node deactivationnode deactivation”” concept concept ..ReproducingReproducing Power-law degree distribution andand high clustering coefficient..
FitnessFitness // ThresholdThreshold ModelModel [Cardareli[Cardareli20020000などなど]]ノードに重みを与え,それによってエッジの生成規則を定める成長モデル.ノードに重みを与え,それによってエッジの生成規則を定める成長モデル.
次数分布の冪乗則次数分布の冪乗則ととネットワークの狭さネットワークの狭さを再現.を再現.
CNNCNN ((CConnecting NNearest NNeighbor) Model) Model [V[Váázzquezquez20032003]]Growing network model with local rulesGrowing network model with local rules..
ReproducingReproducing Power-law degree distribution andand high clustering coefficient ..ノード数:一定
Random graph modelRandom graph model
degree = 3
m0=4
m=2
BABA (Barab(Barabáásisi--AlbertAlbert ModelModel)) KE KE (Klemm(Klemm--EguEguííluz Model)luz Model)
m0=2
m=2
Active node
Deactivated node
CNN CNN (Connecting Nearest Neighbor)(Connecting Nearest Neighbor)
Real edgePotential edge
Network of Network of peoples peoples Link forms after mutual acceptance.Link forms after mutual acceptance.363,819 nodes 3,813,702363,819 nodes 3,813,702 edges.edges.
SSocial ocial NNetworking etworking SServiceervice
Network of weblog entries.Network of weblog entries.Crawled from WWW.Crawled from WWW.Regarding entries as nodes and trackbacks as edgesRegarding entries as nodes and trackbacks as edges..26,558 nodes and 67,828 edges.26,558 nodes and 67,828 edges.
BBlogologosspherephere
……
……
…
……
……
…
: entry of weblog: trackback: crawling path
0.6245.589.99359,97036,000KEKE ModelModel
0.0024.009.99359,97036,000BABA ModelModel0.4026.2710.2360,00035,085CNN CNN ModelModel
0.00034.8010.0360,00036,000RandomRandom
CLmn
Basic Basic properties of properties of NNetworksetworks
0.335.4810.53,813,702363,819Real Network((SNSSNS))
0.30 13.295.3135,65625,668Real Network(Blogosphere)(Blogosphere)
CLmn
Power-law DistributionPoisson
Distribution
DDegree egree distributionsdistributionsRandom graph BA
CNN KE
Power-law Distribution
Power-law Distribution
区分型の冪分布
DDegree egree distributions#2distributions#2
SNS
ある次数ある次数kkの頂点の隣接頂点の次数平均.の頂点の隣接頂点の次数平均.⇒⇒ ハブ同士の結合性の高さを評価する指標.ハブ同士の結合性の高さを評価する指標.
Random BA
CNN
KE
実データ(SNS)
正相関
負相関
無相関無相関
正相関
平均結合相関平均結合相関 kknnnn((kk))他ノードへの平均距離のヒストグラム他ノードへの平均距離のヒストグラム
⇒⇒ ノードのトポロジ的な中心度とその分布(集中具合)を表す.ノードのトポロジ的な中心度とその分布(集中具合)を表す.
Random
KECNN
BA
実データ(SNS)
ノード間平均距離の分布ノード間平均距離の分布
複雑ネットワークの”構造”と”機能”
位相的構造
構造的特徴の発見
Small-worldScale-free次数相関
階層性
Modularity, Community Structure
構造モデルの提案
Small-worldWatt-Strogatz (WS) Model (1998)Great Circle Model (1997)Davidsen Model (2002)
…etc.
Scale-freeBarabasi-Albert Model (1999)階層的モデル (2001)適応度モデル (2001)閾値モデル(2002) , …etc.
位相的位相的構造構造
構造的特徴の発見構造的特徴の発見
SmallSmall--worldworldScaleScale--freefree次数相関次数相関
階層性階層性
Modularity,Modularity, Community Community StructureStructure
構造モデルの提案構造モデルの提案
SmallSmall--worldworldWattWatt--StrogatzStrogatz (WS) (WS) ModelModel (1998)(1998)Great CircleGreat Circle ModelModel (1997)(1997)DavidsenDavidsen ModelModel (2002)(2002)
……etc.etc.
ScaleScale--freefreeBarabasiBarabasi--Albert Model (1999)Albert Model (1999)階層的モデル階層的モデル (2001)(2001)適応度モデル適応度モデル (2001)(2001)閾値モデル閾値モデル((2002) , 2002) , ……etc.etc.
構造上のダイナミクス = 機能
Epidemics (伝染病伝播)PercolationContact Process
ネットワーク上の同期現象
Network Flow (流量)パケット通信
電子スピン系モデル
セル・オートマトンの構造的拡張
マルチエージェントダイナミクス
構造上構造上のダイナミクスのダイナミクス == 機能機能
EpidemicsEpidemics (伝染病伝播)(伝染病伝播)PercolationPercolationContact ProcessContact Process
ネットワーク上の同期現象ネットワーク上の同期現象
Network FlowNetwork Flow (流量)(流量)パケット通信パケット通信
電子スピン系モデル電子スピン系モデル
セル・オートマトンの構造的拡張セル・オートマトンの構造的拡張
マルチエージェントダイナミクスマルチエージェントダイナミクス
・・どのような規模のネットワークに対しても同様の手法で分析できるか
・・ネットワークを測る指標は十分にわかっているか
・・部分から全体を類推できるか
数万~数十万ノードのネットワークに対する新たなマクロ的指標を探す
(i)可視化を利用したパターン抽出
(i)可視化を利用したパターン抽出
パターン → マクロ的指標
RRequirementsequirements
・・グラフ距離グラフ距離に応じてエッジの長さを均等化する
・・グラフ距離グラフ距離の近いものを近くに配置する
・・ノード全体を均質的に配置する
・・ノードやエッジの重なりを避ける
・・配置計算パラメータ非依存性+
A B
CD
1
1
13
∑=j G
jipi dL
rkf )log('
0
,
pi
si ffdt
dcdtdm +=+ ii rr2
2
∑=j
jisi d
rkf )log(
0
,
r1 r2
r3r4
力学モデル 大規模なネットワークの描画に対して,ガイドを利用した方法が提案されている.Adai, T.A. et al.: LGL Creating a Map of Protein Function with an Algorithm forVisualizing Very Large Biological Networks, J. Mol. Biol., No.340, 2004.
1. 適当に起点(根)となるノードを決めて,木構造を作る.
root上記の文献では,最小全域木を使っている
概念図(適当にノードを配置)
2. 起点(根)となるノードを画面の中央において,Step by Stepでノード位置を移動させる. Network Visualization 2NNetwork etwork VVisualization 2isualization 2
① Edges connected to vertices of low degree are expressed by a cold (bluish) color, and those of high degree by a warm (reddish) .
② Edges within communities are colored according to community.
Edges are coloredaccording to a certain quantity.
(ii)機能からの構造分析(ii)機能からの構造分析
提案手法:機能からの特徴分析
Network analysisby the static structure
Network analysisby the dynamic function
従来の複雑ネットワーク分析フロー
Static structural indices• Degree distribution• Average path length• Clustering coefficient• Community structure• Centrality indices
Visualization of the static structure
Visualization of the dynamic function
Dynamic structural indices• Patterns of diffusion• Convergence• Oscilation
本研究で追加的に提案する手法
静的な構造のみに着目した特徴分析
機能に着目した特徴分析
1
10
11
12
13
14
15
16
17
18
19
2
20
21
22
23
24
25
26
2728
29
3
30
31
32
33
34
4
5
6
7
8
9
Network Structure
伝播ダイナミクスのモデル
( )( ) ( )
( ) ( )⎪⎪⎩
⎪⎪⎨
⎧
=
≠⎭⎬⎫
⎩⎨⎧
=+
∑
∑∑
0:
0:Sgn1
N
jjiji
N
jjij
N
jjij
i
tct
tctct
σσ
σσσ
⎩⎨⎧
==の間にエッジがないと
の間にエッジがあると
ji
jijiij vv
vvcc
01
Step t
⇒初期状態とネットワーク構造のみに依存する決定論的なダイナミクス
Step t+1 Step t+2
伝播ダイナミクスのパラメータ
⇒状態変化をシステムとして考える.
入力
出力
Diffusion on a given network structure.
•初期状態の2状態(±1)の比率•ノードのミクロ的特徴による初期状態の2状態(±1)の分布
•各時刻ステップごとの2状態の比率•初期状態と,安定的な終状態における2状態の比率との関数関係.
(初期状態とネットワーク構造に対応した伝播ダイナミクスの特徴量)
初期条件(割合と分布)
• ノードに関する構造指標に基づいて,上位の割合rのノードに初期状態+1を与える.– 中心性による分布
• Degree (次数)• Closeness (他ノードへの平均距離の逆数)• Betweeness (他ノード同士の媒介性)• クラスタ係数 (隣接ノード同士の接続性)
– コミュニティ構造による分布• コミュニティ内次数係数 Z• コミュニティ間分散度 P
– ランダム分布
初期状態と終状態の関係
①片方の状態が消滅するパターン(ステップ関数的).
ランダムグラフ,ランダムな初期状態分布
BAモデル,Degree順の初期状態分布
0 1
1
Initial Ratio of +1
Con
verg
ence
Rat
io o
f +1
rc
0 1
1
Initial Ratio of +1
Con
verg
ence
Rat
io o
f +1
0 1
1
Initial Ratio of +1
Con
verg
ence
Rat
io o
f +1
rc
0 1
1
Initial Ratio of +1
Con
verg
ence
Rat
io o
f +1
0 1
1
Initial Ratio of +1
Con
verg
ence
Rat
io o
f +1
rc1 rc2
0 1
1
Initial Ratio of +1
Con
verg
ence
Rat
io o
f +1
rc
(a) (b) (c) (d) (e)
初期状態の分布
(b)(c)(c)(b)(e)(d)(b)Weblog Network
(c)(c)(c)(b)(d)(d)(b)SNS Network
(c)(d)(c)(b)(d)(d)(b)CNN Model
(b)(a)(c)(c)(e)(a)(b)KE Model (μ=0.1)
--(e)(c)(e)(a)(b)KE Model (μ=0)
--(a)(a)(a)(a)(a)BA Model
(b)(b)(b)(b)(c)(b)(b)WS Model
--(a)(a)(a)(a)(a)Random Graph
--(b)(b)(b)(b)(b)Regular Lattice
PZBetweenessClusterClosenessDegreeRandom
構造モデル
実データ
構造モデルの推定
• SNSネットワークとCNNモデルは,機能の観点からの特徴も類似している点が多い.
⇒SNS上で生じる現象を,CNNモデルおよびその改良を通じて分析,予測できると考えられる.
– 本研究の提案手法は,現象の予測のための構造モデルの高度化の指針を与えるものであると考えられる.
(c)(c)(c)(b)(d)(d)(b)SNS Network
(c)(d)(c)(b)(d)(d)(b)CNN Model
PZBetweenessClusterClosenessDegreeRandom
入力 出力
i o
0 1
1
Initial Ratio of +1
Con
verg
ence
Rat
io o
f +1
0 1
1
Initial Ratio of +1
Con
verg
ence
Rat
io o
f +1
rc
0 1
1
Initial Ratio of +1
Con
verg
ence
Rat
io o
f +1
0 1
1
Initial Ratio of +1
Con
verg
ence
Rat
io o
f +1
rc1 rc2
0 1
1
Initial Ratio of +1
Con
verg
ence
Rat
io o
f +1
rc
(a) (b) (c) (d) (e)
),),,(( iruleEVGfo =
local rule+G(V,E)
パターンの発見 → マクロ的指標
(iii)ネットワークモデルを利用した構造分析
(iii)ネットワークモデルを利用した構造分析
ネットワークモデルの課題1
Measuring Fundamental Properties of Real-World Complex Networks(2006)
INET,p2p,WEB,IPの次数分布
領域ごとに異なる特徴を有するネットワークに対して画一的にベキ乗則を当てはめ,それを再現するモデルを考える
環境海洋工学専攻
世田谷区在住
ラグビー部テニススクール
相互作用
ネットワークモデルの課題2
現実のネットワークに存在する(陽な※)コミュニティを扱うモデルが少ない
CNNモデル
u
1- uA B
C
1- u
B
D (CNN)
D
1- u
i
j
CNNモデル
i
b
j
CNN拡張モデル
C)
i i
a a
cn cn
i i
A)
a a
cn cn
b b
コミュニティ形成1
u
r
コミュニティ形成2
i
B)
ij j
cn cn
b b
D)
i ia a
cncn
j j
q
1-u-q-r0.000001
0.00001
0.0001
0.001
0.01
0.1
1
1 10 100 1000
kP(k)
11≦k≦49
γ=1.18
指数分布
3領域に分かれる。
次数分布(友人数の確率分布)
部分的にベキ分布である。
低次領域の分布は指数分布である。
横軸:友人数縦軸:確率分布両対数プロット(以下同様)
実験結果1
設定条件u=1/21q=4/21r =1/81N=360000
コミュニティ相互作用モデル群の概要
Aさん
コミュニティ
コミュニティで知り合う
Bさん
Cさん
友人になる コミュニティに入る
知人効果(友人効果)
A:友人を介して友人になる
B:友人を介して コミュニティに入る
コミュニティ効果C:コミュニティを介して
友人になるD:コミュニティに入る
(友人の有無に因らず)
要因
過程(プロセス)
コミュニティ相互作用モデル群の体系
98通りのモデルが考えられる。(相互作用あり:84通り、なし:14通り)数値実験(36000ノード)を行い、モデルの特徴を分析する。(AとCの両方が選択される場合には、A:C=1:1、
BとDの両方が選択される場合には、B:D=1:1 とした。)
次数(規模)優先的
ランダム
コミュニティを B1 B2ノードを B3 B4
次数(規模)優先的
ランダム
コミュニティを C1 C2ノードを C4
過程(プロセス)
コミュニティ効果
選択
コミュニティを(ノードはランダム選択)
友人になる コミュニティに入る選択
要因
知人効果(友人効果) A
D1 D2
コミュニティ相互作用モデル群の類型化
B3 B2 B4なし D2 D1 D1 なし D2 D1 D2
C4 指数 指数C1 指数+線形
C2なし 指数+ベキC1C2 指数+指数 ベキ ベキC4
C4C1C2なしC1C2C4
C4C1C2なしC1C2C4
線形
指数
B1
次数分布
コミュニティ
参加数
指数+線形
なしB2 B4
D1B3
コミュニティ
規模
なし
A
なし
A
なし
指数+指数
ベキ+ベキ ベキ+ベキベキ+ベキ
指数
指数+
ベキ
線形+
指数+
線形
指数+
線形
ベキ指数+
ベキ
指数指数+
線形
指数+
指数
指数+
線形
ベキ+
線形
要素名
ベキ指数+
線形
指数+線形 指数+線形
D2なし
A
ベキ ベキ+ベキ 指数+指数指数+ベキ 指数+線形 ベキ+線形指数 線形 数値実験 設定条件
• アルゴリズムの各確率の設定u =1/21, q =4/21, r =1/81(実SNSの、平均次数:約10、 平均コミュニティ参加数:約16、ユーザ数:コミュニティ数=4:1に近づけ、シミュレーションの条件を合わせるため)
• 初期条件ノード数:1 コミュニティ数:0
• 終了条件ノード数:360000
B3 B2 B4なし D2 D1 D1 なし D2 D1 D2
C4 指数 指数C1 指数+線形
C2なし 指数+ベキC1C2 指数+指数 ベキ ベキC4
C4C1C2なしC1C2C4
C4C1C2なしC1C2C4
線形
指数
B1
次数分布
コミュニティ
参加数
指数+線形
なしB2 B4
D1B3
コミュニティ
規模
なし
A
なし
A
なし
指数+指数
ベキ+ベキ ベキ+ベキベキ+ベキ
指数
指数+
ベキ
線形+
指数+
線形
指数+
線形
ベキ指数+
ベキ
指数指数+
線形
指数+
指数
指数+
線形
ベキ+
線形
要素名
ベキ指数+
線形
指数+線形 指数+線形
D2なし
A
モデルによる分析(事例:SNS)次数分布
SNS モデルAB3C4D2
共通点領域ごとにベキ分布となる。次数と共にベキ指数が大きくなる。
友人を介して知り合う。コミュニティで知り合う。(友人の数に因らない)
0.000001
0.00001
0.0001
0.001
0.01
0.1
1
1 10 100 1000
kP(k)
k≦1011≦k≦49
50≦k
γ=1.07
γ=2.12
γ=2.28
0.000001
0.00001
0.0001
0.001
0.01
0.1
1
1 10 100 1000
kP(k)
k≦1011≦k≦49
50≦k
γ=1.07
γ=2.12
γ=2.28
B3 B2 B4なし D2 D1 D1 なし D2 D1 D2
C4 指数 指数C1 指数+線形
C2なし 指数+ベキC1C2 指数+指数 ベキ ベキC4
C4C1C2なしC1C2C4
C4C1C2なしC1C2C4
線形
指数
B1
次数分布
コミュニティ
参加数
指数+線形
なしB2 B4
D1B3
コミュニティ
規模
なし
A
なし
A
なし
指数+指数
ベキ+ベキ ベキ+ベキベキ+ベキ
指数
指数+
ベキ
線形+
指数+
線形
指数+
線形
ベキ指数+
ベキ
指数指数+
線形
指数+
指数
指数+
線形
ベキ+
線形
要素名
ベキ指数+
線形
指数+線形 指数+線形
D2なし
A
SNS モデルAB3C4D2
共通点中次、高次でのベキ乗則次数と共にベキ指数が大きくなる。
コミュニティへの参加の過程は、B1∧D1B1∧D2B3∧D2 のいずれかに絞れる
モデルによる分析(事例:SNS)コミュニティ参加数
0.000001
0.00001
0.0001
0.001
0.01
0.1
1
1 10 100 1000
コミュニティ参加数(j)
確率
分布
11≦j≦49
50≦j
γ=1.93
γ=2.14
0.00001
0.0001
0.001
0.01
0.1
1
1 10 100 1000 10000
コミュニティ規模(n)
確率
分布
50≦n
γ=1.68
B3 B2 B4なし D2 D1 D1 なし D2 D1 D2
C4 指数 指数C1 指数+線形
C2なし 指数+ベキC1C2 指数+指数 ベキ ベキC4
C4C1C2なしC1C2C4
C4C1C2なしC1C2C4
線形
指数
B1
次数分布
コミュニティ
参加数
指数+線形
なしB2 B4
D1B3
コミュニティ
規模
なし
A
なし
A
なし
指数+指数
ベキ+ベキ ベキ+ベキベキ+ベキ
指数
指数+
ベキ
線形+
指数+
線形
指数+
線形
ベキ指数+
ベキ
指数指数+
線形
指数+
指数
指数+
線形
ベキ+
線形
要素名
ベキ指数+
線形
指数+線形 指数+線形
D2なし
A
SNS モデルAB3C4D2
0.00001
0.0001
0.001
0.01
0.1
1
1 10 100 1000 10000コミュニティ規模 (n )
確率
分布
nn
n
≤≤≤
≤
504911
10
γ= 1.41
γ= 1.27
0.00001
0.0001
0.001
0.01
0.1
1
1 10 100 1000 10000コミュニティ規模 (n )
確率
分布
nn
n
≤≤≤
≤
504911
10
nn
n
≤≤≤
≤
504911
10
γ= 1.41
γ= 1.27
共通点低次領域における指数分布中次領域以降、ベキ指数が大きくなる。
指数分布指数分布
•友人を介してコミュニティに入る。(起こりやすさは友人の数に比例)•ランダムにコミュニティに入る。(規模の大小、友人の有無問わない)
モデルによる分析(事例:SNS)コミュニティ規模 1
10
11
12
13
14
15
16
17
18
19
2
20
21
22
23
24
25
26
2728
29
3
30
31
32
33
34
4
5
6
7
8
9
現実のネットワーク(形成過程,構造は未知)
現象(例:疫病の伝染、
口コミの伝播)
シミュレーション(例:疫病伝染、情報伝播)
モデルによるネットワーク(形成過程,
構造は観測可能)
再現
真の因果関係
対応付け分析 ネットワークモデルを用いた現象のモデリング
マクロとミクロをつなぐものマクロとミクロをつなぐもの
- コミュニティ分割とコミュニティ分類 -
構造の類似度に着目
コミュニティ分割 リンク密度
構造
着眼点
Newman法
類似度行列を用いた方法
Leichtら(2006)によって提案された概念.
各頂点間の類似度を要素に持った行列.
類似度行列 基本コンセプト
頂点i が隣接する頂点v を持ち,v がj に似ているのであれば,i はjに似ている
i
v
j
∑ +=v
ijvjivij SAS ψδφ隣接行列i, v 接続 1
なし 0類似度行列
v, j の類似度デルタ関数
i = v 1else 0
係数
再帰的に定義
∑ +=v
ijvjivij SAS ψδφ
L+++≈
−= −
22
1][AAI
AISφφ
φ
IASS ψφ +=行列で表し
φ をどう決める?
)1(][0
L∑∞
=
=l
ijlij
lij CS A
)2(2 11 L+−= l
ji
ijl kk
mC λ
11
1
112
−
−
−⎟⎟⎠
⎞⎜⎜⎝
⎛−= DAIDSλαλm
1λ Aは の最大固有値)(ik iは頂点 の次数)(
ijiij kD δ=( )α は減衰ファクター)(
1=ψ
IDSDADSD += )(1λαS S
具体的に・・・
IDSDADSD += )(1λαS S
左図のグラフでは・・・
95.0, == α0DSD を初期値として100回繰り返し演算
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=
13,131,13
1,2
13,12,11,1
SS
SSSS
LL
MOM
MO
L
S
12
36
4
87
9
10 11
5
12 13
(ex.)
15.068.0
2,10
12,10
=
=
SS
Newman法,類似度行列の比較
• 2部グラフ
2
6
4
87
9
10 11
512 13
1
3
14
6
2
3 5
7
S’
1 6
3
7 82
5 9
4
(大規模)ネットワーク
いくつかのコミュニティNewman法
各コミュニティのパターン類似度行列と可視化
(i) コミュニティ分割
コミュニティ1
コミュニティ2
コミュニティ3
Newman法
各々のコミュニティに対して類似度行列によるコミュニティ分割を行う
(ii) コミュニティの類型化
コミュニティ1
コミュニティ2
コミュニティ3
クラスタ1 クラスタ2 クラスタ3
効果的な使い方(提案手法)
ブログデータ
• 個々のページをノード,トラックバックをリンクとしたページ群のネットワーク
• ノード数:181,714リンク数:626,365
ブログのコミュニティ(全体像)
②機能からのマクロ的指標
①可視化からのマクロ的指標
③ ネットワークモデル
マクロ的分析
マクロ的指標に基づくパラメータ同定
ネットワークモデルに基づくメソ,ミクロ構造の分析
④H
PCによる効率化
ネットワークを知る,使う,作る・デザインするネットワークを知る,使う,作る・デザインする
知る・測るための指標は未だ不足-大規模性の問題-階層性の問題
複雑なネットワークでも階層構造として分離できる可能性は高いミクロ・メソ・マクロ間の関係性が未だ不明確(相似性の有無等)
-時間依存性の問題
・局所から全体を予測することの難しさ-確率的手法はどの程度有効か
使う・透明性?
本当に見えているのか
作る・デザインする・リンクの意味づけ(MAS系のもので不明確なものが多い)・大規模性,複雑性・何を最適とするのか(評価指標)
すべての項目は関係する.例えば,リンクの意味づけは「知る」ことにとっても重要である.敢えて分けると・・・