18
電子情報通信学会複雑性研究会2007.4.13 雑ネットワーク: 雑ネットワーク: 造と 造と 能からの分析 能からの分析 An Analysis Method for Complex Network from the Viewpoint of Structure and Function 白山 (東京大学人工物工学研究センター) e-mail: [email protected] 内田 (東京大学大学院工学系研究科) e-mail: [email protected] 社会的制約条件への影響と価値観の変化を考慮した人間活動モデル ・事象,現象依存(マルチシナリオ,マルチフィジックス) ・時間・空間依存(マルチスケール) ・概念依存(マルチパラダイム) 題の複雑性 S S ocial System ocial System New New E E nergy nergy W W eb eb N N atural atural E E nvironment nvironment 問題解決のための, 人間(活動)を含む総合的な モデリング論の構築 Artifacts 環境との調和と値創出 Human Web Human Web I I nformation Web nformation Web 第4の科学的手法 Background P Phenomena and Events on a W W eb eb ・移流拡散に関連する現象・事象 ・相互作用と創発が鍵となる事象・現象 伝染病,コンピュータウィルス 脳内の情報伝達 食物連鎖,棲み分けなどの生態系関連 流行などの経済現象,活動 (口コミによる世論形成等) 交通網,物流など Background 個々人の集合によって生じる 個々人の集合によって生じる 現象は,固有 現象は,固有 「行動(属性)」 「行動(属性)」 だけではなく,他との相互作用 だけではなく,他との相互作用 による による 環境(構造) 環境(構造) によって によって も規定 も規定 される. される. 社会における様々な現象を 社会における様々な現象を 理解し, 理解し, 計算機 計算機 シミュレーションなどの手法 シミュレーションなどの手法 によってより精確に予測するため によってより精確に予測するため は,個々人 は,個々人 「群」としてのネット 「群」としてのネット ワークの構造 ワークの構造 を知り,その を知り,その 上での 上での 現象を解明すること 現象を解明すること が有効. が有効. 相互作用 創発・共創 行動(属性) 環境(構造) Background 「群」としてのネットワークへの注目 人工物工学的視点

Background henomena and Events on a Web 「群」 …csbn/program/papers/ATT00114.pdfe b I nformation Web 第4の科学的手法 Background Phenomena and Events on a Web ・移流拡散に関連する現象・事象・

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • 電子情報通信学会複雑性研究会2007.4.13

    複複雑ネットワーク:雑ネットワーク:構構造と造と機機能からの分析能からの分析

    An Analysis Method for Complex Network from the Viewpoint of Structure and Function

    白山 晋 (東京大学人工物工学研究センター)e-mail: [email protected]

    内田 誠 (東京大学大学院工学系研究科)e-mail: [email protected]

    社会的制約条件への影響と価値観の変化を考慮した人間活動モデル

    ・事象,現象依存(マルチシナリオ,マルチフィジックス)

    ・時間・空間依存(マルチスケール)・概念依存(マルチパラダイム)

    問題の複雑性

    SSocial Systemocial System

    New New EEnergy nergy WWebeb

    NNatural atural EEnvironmentnvironment 問題解決のための,人間(活動)を含む総合的なモデリング論の構築

    Artifacts

    環境との調和と価値創出

    Huma

    n Web

    Huma

    n Web

    II nfo

    rmat

    ion

    Web

    nfor

    mat

    ion

    Web

    第4の科学的手法

    Background

    PPhenomena and Events on a WWebeb

    ・・移流拡散に関連する現象・事象・・相互作用と創発が鍵となる事象・現象

    ・・伝染病,コンピュータウィルス・・脳内の情報伝達・・食物連鎖,棲み分けなどの生態系関連・・流行などの経済現象,活動(口コミによる世論形成等)

    ・・交通網,物流など

    Background

    個々人の集合によって生じる個々人の集合によって生じる現象は,固有現象は,固有のの「行動(属性)」「行動(属性)」だけではなく,他との相互作用だけではなく,他との相互作用によるによる「「環境(構造)環境(構造)」」によってによっても規定も規定される.される.

    ⇒⇒ 社会における様々な現象を社会における様々な現象を理解し,理解し,計算機計算機シミュレーションなどの手法シミュレーションなどの手法によってより精確に予測するためによってより精確に予測するためにに

    は,個々人は,個々人のの「群」としてのネット「群」としてのネットワークの構造ワークの構造を知り,そのを知り,その上での上での現象を解明すること現象を解明することが有効.が有効. 相互作用

    創発・共創

    行動(属性)

    環境(構造)

    Background

    「群」としてのネットワークへの注目

    人工物工学的視点

  • 複雑ネットワーク構造複雑ネットワーク構造現実の人的(社会的)ネットワークは完全に規則的でも現実の人的(社会的)ネットワークは完全に規則的でも完全に無秩序でもでもない複雑な構造を完全に無秩序でもでもない複雑な構造をしている.している.

    そこで発生する現象は非常にそこで発生する現象は非常に複雑で,予測が難しい.複雑で,予測が難しい.

    規則的 (e.g. 格子) 無秩序(ランダム)

    not Regular, not Random

    Background

    不均一なネットワーク不均一なネットワーク: : ハブとコミュニティハブとコミュニティ現実のネットワークの特徴: 不均一性・不完全性

    その上で発生する現象は非常に複雑になる.

    構造の特徴を記述すること自体が難しい(特徴量の不足).

    ⇒ そのため,いまだ明らかになっていない性質が多く存在する.

    現実のネットワークの特徴現実のネットワークの特徴: : 不均一性不均一性・・不完全性不完全性その上で発生する現象は非常に複雑その上で発生する現象は非常に複雑になる.になる.

    構造の特徴を記述すること自体が難しい(特徴量の構造の特徴を記述すること自体が難しい(特徴量の不足).不足).

    ⇒⇒ そのため,いまだそのため,いまだ明らかになっていない性質が多く明らかになっていない性質が多く存在する.存在する.

    密なコミュニティ

    ハブ

    疎遠

    繋がりが強 不均一なネットワーク

    ある空手クラブでの友人関係[Newman2003]

    Background

    近年,複雑ネットワークの科学と称されるものは,従来の社会科学や離散数学の分野で行われているネットワーク研究とは趣を異とする.非常に大きなネットワークを視野に入れているためである.このため,個々の要素間の関係性を詳細に検討することよりも,ネットワーク全体を統計的な視点や,位相的構造から捉えることの比重が大きいようである.本稿では,はじめに,複雑ネットワークの統計的指標と,統計的指標を再

    現するように設計され提案されたいくつかのネットワークモデルについて説明する(この中でネットワークの攻撃耐性の考え方についてもふれる).次に,既存研究において不足している事柄を示し,ここで,マクロ的指標

    に注目する.我々の最近の研究目標は,複雑ネットワークに対する新たなマクロ的指標を提案することにある.以降,(1) 可視化によるネットワークの分類,(2) ネットワークの機能からの構造分析,(3) ネットワークモデルを利用した構造分析という3つのトピックを紹介する.次に,マクロ的構造とミクロ的構造を結びつけることを目的として,ネットワークの大局的な性質から局所的な性質に目を転じる.ネットワークの局所構造に関係するコミュニティに着目し,大局的な構造の中に存在するコミュニティの顕在化手法について説明する.また,我々が提案するコミュニティの類型化手法を紹介する.最後に,簡単ではあるが,将来展望を紹介する.

    Summary of today’s talk 複雑ネットワーク研究複雑ネットワーク研究

    (Complex Network (Complex Network ResearchResearch))

    大規模大規模なネットワークなネットワークでは,個々では,個々の関係性を調べることや,視覚的の関係性を調べることや,視覚的に構造を捉えることに構造を捉えることが難しいとさが難しいとされており,統計的れており,統計的なな特徴量が模索特徴量が模索されてきた.されてきた.

    ノードが持つエッジの次数分布ノードが持つエッジの次数分布

    平均経路長平均経路長LLクラスタ率クラスタ率CC ,・,・・・・・etc.etc.

    ネットワークの例(N=1381)

    複雑で不均一,大規模なネットワークについて,複雑で不均一,大規模なネットワークについて,その構造や機能を知るための分析手法およびその構造や機能を知るための分析手法およびその研究その研究 [[Newman2003Newman2003などなど]]

    Nature, Science, PNAS, Physical review letter, Social networks,Physical review E, Physica A, European journal of physics B など

  • AAdjacentdjacent MatrixMatrixV (Vertex or Node) E (Edge or Link)

    v1

    v2

    v6

    v7

    v8

    v3

    v4

    v5

    v9

    v10

    v11v12

    v13

    v14v15

    v16

    v17

    v18

    v19

    v20

    v21

    v22

    0110000000000000000000101011000000000000000011010100000000000000000010110000000000000000010101000000000000000001111011100110111011000000010000001000000000000001000000000000000000000100000000010000000000000000000100000000000000000000010000000000000100000000010000000000011000000001011000000000000110000100000000000100000000010010000000010010011110101000000001000000000100001000000000000010000010000000010000001011010101000001000000000000100000000000000000001000010000000000000000001010

    22

    21

    20

    19

    18

    17

    16

    15

    14

    13

    12

    11

    10

    9

    8

    7

    6

    5

    4

    3

    2

    1

    vvvvvvvvvvvvvvvvvvvvvv

    22212019181716151413121110987654321 vvvvvvvvvvvvvvvvvvvvvv

    0110000000000000000000101011000000000000000011010100000000000000000010110000000000000000010101000000000000000001111011100110111011000000010000001000000000000001000000000000000000000100000000010000000000000000000100000000000000000000010000000000000100000000010000000000011000000001011000000000000110000100000000000100000000010010000000010010011110101000000001000000000100001000000000000010000010000000010000001011010101000001000000000000100000000000000000001000010000000000000000001010

    v1

    v2

    v6

    v7

    v8

    v3

    v4

    v5

    v9

    v10

    v11v12

    v13

    v14v15

    v16

    v17

    v18

    v19

    v20

    v21

    v22

    SShortest pathhortest path between two verticesbetween two vertices

    3344

    66

    4),( =tsdGs

    t?),( =tsdG

    s

    t

    3),( =tsdG

    ),( tsdG

    MMean geodesic (ean geodesic (i.e., shortesti.e., shortest) distance) distance

    ∑∈−

    =Vts

    G tsdnnL

    ,),(

    2/)1(1

    ss

    2

    2

    2

    2

    1

    1

    2

    1

    21 1

    1

    22

    2

    3

    2

    2

    21

    1

    DDegree egree distributiondistributionn : : total number of verticespk : : the probability that a vertex chosen

    uniformly at random has degree k

    nnp kk =

    ln k

    ln pk

    1 10 102 103

    10-1

    10-2

    10-3

    α−≈ kpk

    Example of scale-free

  • CCentralityentrality indicesindices

    ∑∈

    =

    VtG

    C tvdvC

    ),(1)(・・CClosenessloseness

    centralitycentrality

    ・・GGraph centralityraph centrality

    ・・SStress centralitytress centrality

    ・・BBetweeness etweeness centralitycentrality

    ),(max1)(

    tvdvC

    GVt

    G

    =

    ∑∈≠≠

    =Vtvs

    stS vvC )()( σ

    ∑∈≠≠

    =Vtvs st

    stB

    vvCσ

    σ )()(

    vi

    vj

    vk

    2),( =kjG vvd

    1)(

    3

    =

    =

    ivv

    vv

    vkj

    kj

    σ

    σ

    BBetweeness etweeness Centrality Centrality ∑∈≠≠

    =Vtvs st

    stB

    vvCσ

    σ )()(

    ikj vvvtvs === ,,

    Random graph ModelRandom graph Model [Erdös, Rényi1959]Static network model, number of nodes is constant.Static network model, number of nodes is constant.

    WSWS (Watts(Watts--Strogatz) Strogatz) ModelModel [[Watts, StrogatzWatts, Strogatz19981998]]ネットワークの狭さネットワークの狭さとと高い凝集性高い凝集性を再現を再現..

    BABA (Bara(Barabbáássii--Albert) Albert) ModelModel [Ba[Barabrabáási, Albertsi, Albert19991999]]Growing network model, based on Growing network model, based on ““rich gets richerrich gets richer”” conceptconcept..ReproducingReproducing Power-law degree distribution andand small-world property..

    KE (KlemKE (Klemmm--EgEguuíílluuz) z) ModelModel [Klemm, Equ[Klemm, Equííluz2002]luz2002]Growing network model, based on Growing network model, based on ““node deactivationnode deactivation”” concept concept ..ReproducingReproducing Power-law degree distribution andand high clustering coefficient..

    FitnessFitness // ThresholdThreshold ModelModel [Cardareli[Cardareli20020000などなど]]ノードに重みを与え,それによってエッジの生成規則を定める成長モデル.ノードに重みを与え,それによってエッジの生成規則を定める成長モデル.

    次数分布の冪乗則次数分布の冪乗則ととネットワークの狭さネットワークの狭さを再現.を再現.

    CNNCNN ((CConnecting NNearest NNeighbor) Model) Model [V[Váázzquezquez20032003]]Growing network model with local rulesGrowing network model with local rules..

    ReproducingReproducing Power-law degree distribution andand high clustering coefficient ..ノード数:一定

    Random graph modelRandom graph model

    degree = 3

  • m0=4

    m=2

    BABA (Barab(Barabáásisi--AlbertAlbert ModelModel)) KE KE (Klemm(Klemm--EguEguííluz Model)luz Model)

    m0=2

    m=2

    Active node

    Deactivated node

    CNN CNN (Connecting Nearest Neighbor)(Connecting Nearest Neighbor)

    Real edgePotential edge

    Network of Network of peoples peoples Link forms after mutual acceptance.Link forms after mutual acceptance.363,819 nodes 3,813,702363,819 nodes 3,813,702 edges.edges.

    SSocial ocial NNetworking etworking SServiceervice

  • Network of weblog entries.Network of weblog entries.Crawled from WWW.Crawled from WWW.Regarding entries as nodes and trackbacks as edgesRegarding entries as nodes and trackbacks as edges..26,558 nodes and 67,828 edges.26,558 nodes and 67,828 edges.

    BBlogologosspherephere

    ……

    ……

    ……

    ……

    : entry of weblog: trackback: crawling path

    0.6245.589.99359,97036,000KEKE ModelModel

    0.0024.009.99359,97036,000BABA ModelModel0.4026.2710.2360,00035,085CNN CNN ModelModel

    0.00034.8010.0360,00036,000RandomRandom

    CLmn

    Basic Basic properties of properties of NNetworksetworks

    0.335.4810.53,813,702363,819Real Network((SNSSNS))

    0.30 13.295.3135,65625,668Real Network(Blogosphere)(Blogosphere)

    CLmn

    Power-law DistributionPoisson

    Distribution

    DDegree egree distributionsdistributionsRandom graph BA

    CNN KE

    Power-law Distribution

    Power-law Distribution

    区分型の冪分布

    DDegree egree distributions#2distributions#2

    SNS

  • ある次数ある次数kkの頂点の隣接頂点の次数平均.の頂点の隣接頂点の次数平均.⇒⇒ ハブ同士の結合性の高さを評価する指標.ハブ同士の結合性の高さを評価する指標.

    Random BA

    CNN

    KE

    実データ(SNS)

    正相関

    負相関

    無相関無相関

    正相関

    平均結合相関平均結合相関 kknnnn((kk))他ノードへの平均距離のヒストグラム他ノードへの平均距離のヒストグラム

    ⇒⇒ ノードのトポロジ的な中心度とその分布(集中具合)を表す.ノードのトポロジ的な中心度とその分布(集中具合)を表す.

    Random

    KECNN

    BA

    実データ(SNS)

    ノード間平均距離の分布ノード間平均距離の分布

    複雑ネットワークの”構造”と”機能”

    位相的構造

    構造的特徴の発見

    Small-worldScale-free次数相関

    階層性

    Modularity, Community Structure

    構造モデルの提案

    Small-worldWatt-Strogatz (WS) Model (1998)Great Circle Model (1997)Davidsen Model (2002)

    …etc.

    Scale-freeBarabasi-Albert Model (1999)階層的モデル (2001)適応度モデル (2001)閾値モデル(2002) , …etc.

    位相的位相的構造構造

    構造的特徴の発見構造的特徴の発見

    SmallSmall--worldworldScaleScale--freefree次数相関次数相関

    階層性階層性

    Modularity,Modularity, Community Community StructureStructure

    構造モデルの提案構造モデルの提案

    SmallSmall--worldworldWattWatt--StrogatzStrogatz (WS) (WS) ModelModel (1998)(1998)Great CircleGreat Circle ModelModel (1997)(1997)DavidsenDavidsen ModelModel (2002)(2002)

    ……etc.etc.

    ScaleScale--freefreeBarabasiBarabasi--Albert Model (1999)Albert Model (1999)階層的モデル階層的モデル (2001)(2001)適応度モデル適応度モデル (2001)(2001)閾値モデル閾値モデル((2002) , 2002) , ……etc.etc.

    構造上のダイナミクス = 機能

    Epidemics (伝染病伝播)PercolationContact Process

    ネットワーク上の同期現象

    Network Flow (流量)パケット通信

    電子スピン系モデル

    セル・オートマトンの構造的拡張

    マルチエージェントダイナミクス

    構造上構造上のダイナミクスのダイナミクス == 機能機能

    EpidemicsEpidemics (伝染病伝播)(伝染病伝播)PercolationPercolationContact ProcessContact Process

    ネットワーク上の同期現象ネットワーク上の同期現象

    Network FlowNetwork Flow (流量)(流量)パケット通信パケット通信

    電子スピン系モデル電子スピン系モデル

    セル・オートマトンの構造的拡張セル・オートマトンの構造的拡張

    マルチエージェントダイナミクスマルチエージェントダイナミクス

    ・・どのような規模のネットワークに対しても同様の手法で分析できるか

    ・・ネットワークを測る指標は十分にわかっているか

    ・・部分から全体を類推できるか

    数万~数十万ノードのネットワークに対する新たなマクロ的指標を探す

  • (i)可視化を利用したパターン抽出

    (i)可視化を利用したパターン抽出

    パターン → マクロ的指標

    RRequirementsequirements

    ・・グラフ距離グラフ距離に応じてエッジの長さを均等化する

    ・・グラフ距離グラフ距離の近いものを近くに配置する

    ・・ノード全体を均質的に配置する

    ・・ノードやエッジの重なりを避ける

    ・・配置計算パラメータ非依存性+

    A B

    CD

    1

    1

    13

    ∑=j G

    jipi dL

    rkf )log('

    0

    ,

    pi

    si ffdt

    dcdtdm +=+ ii rr2

    2

    ∑=j

    jisi d

    rkf )log(

    0

    ,

    r1 r2

    r3r4

    力学モデル 大規模なネットワークの描画に対して,ガイドを利用した方法が提案されている.Adai, T.A. et al.: LGL Creating a Map of Protein Function with an Algorithm forVisualizing Very Large Biological Networks, J. Mol. Biol., No.340, 2004.

    1. 適当に起点(根)となるノードを決めて,木構造を作る.

    root上記の文献では,最小全域木を使っている

    概念図(適当にノードを配置)

  • 2. 起点(根)となるノードを画面の中央において,Step by Stepでノード位置を移動させる. Network Visualization 2NNetwork etwork VVisualization 2isualization 2

    ① Edges connected to vertices of low degree are expressed by a cold (bluish) color, and those of high degree by a warm (reddish) .

    ② Edges within communities are colored according to community.

    Edges are coloredaccording to a certain quantity.

    (ii)機能からの構造分析(ii)機能からの構造分析

  • 提案手法:機能からの特徴分析

    Network analysisby the static structure

    Network analysisby the dynamic function

    従来の複雑ネットワーク分析フロー

    Static structural indices• Degree distribution• Average path length• Clustering coefficient• Community structure• Centrality indices

    Visualization of the static structure

    Visualization of the dynamic function

    Dynamic structural indices• Patterns of diffusion• Convergence• Oscilation

    本研究で追加的に提案する手法

    静的な構造のみに着目した特徴分析

    機能に着目した特徴分析

    1

    10

    11

    12

    13

    14

    15

    16

    17

    18

    19

    2

    20

    21

    22

    23

    24

    25

    26

    2728

    29

    3

    30

    31

    32

    33

    34

    4

    5

    6

    7

    8

    9

    Network Structure

    伝播ダイナミクスのモデル

    ( )( ) ( )

    ( ) ( )⎪⎪⎩

    ⎪⎪⎨

    =

    ≠⎭⎬⎫

    ⎩⎨⎧

    =+

    ∑∑

    0:

    0:Sgn1

    N

    jjiji

    N

    jjij

    N

    jjij

    i

    tct

    tctct

    σσ

    σσσ

    ⎩⎨⎧

    ==の間にエッジがないと

    の間にエッジがあると

    ji

    jijiij vv

    vvcc

    01

    Step t

    ⇒初期状態とネットワーク構造のみに依存する決定論的なダイナミクス

    Step t+1 Step t+2

    伝播ダイナミクスのパラメータ

    ⇒状態変化をシステムとして考える.

    入力

    出力

    Diffusion on a given network structure.

    •初期状態の2状態(±1)の比率•ノードのミクロ的特徴による初期状態の2状態(±1)の分布

    •各時刻ステップごとの2状態の比率•初期状態と,安定的な終状態における2状態の比率との関数関係.

    (初期状態とネットワーク構造に対応した伝播ダイナミクスの特徴量)

    初期条件(割合と分布)

    • ノードに関する構造指標に基づいて,上位の割合rのノードに初期状態+1を与える.– 中心性による分布

    • Degree (次数)• Closeness (他ノードへの平均距離の逆数)• Betweeness (他ノード同士の媒介性)• クラスタ係数 (隣接ノード同士の接続性)

    – コミュニティ構造による分布• コミュニティ内次数係数 Z• コミュニティ間分散度 P

    – ランダム分布

  • 初期状態と終状態の関係

    ①片方の状態が消滅するパターン(ステップ関数的).

    ランダムグラフ,ランダムな初期状態分布

    BAモデル,Degree順の初期状態分布

    0 1

    1

    Initial Ratio of +1

    Con

    verg

    ence

    Rat

    io o

    f +1

    rc

    0 1

    1

    Initial Ratio of +1

    Con

    verg

    ence

    Rat

    io o

    f +1

    0 1

    1

    Initial Ratio of +1

    Con

    verg

    ence

    Rat

    io o

    f +1

    rc

    0 1

    1

    Initial Ratio of +1

    Con

    verg

    ence

    Rat

    io o

    f +1

    0 1

    1

    Initial Ratio of +1

    Con

    verg

    ence

    Rat

    io o

    f +1

    rc1 rc2

    0 1

    1

    Initial Ratio of +1

    Con

    verg

    ence

    Rat

    io o

    f +1

    rc

    (a) (b) (c) (d) (e)

    初期状態の分布

    (b)(c)(c)(b)(e)(d)(b)Weblog Network

    (c)(c)(c)(b)(d)(d)(b)SNS Network

    (c)(d)(c)(b)(d)(d)(b)CNN Model

    (b)(a)(c)(c)(e)(a)(b)KE Model (μ=0.1)

    --(e)(c)(e)(a)(b)KE Model (μ=0)

    --(a)(a)(a)(a)(a)BA Model

    (b)(b)(b)(b)(c)(b)(b)WS Model

    --(a)(a)(a)(a)(a)Random Graph

    --(b)(b)(b)(b)(b)Regular Lattice

    PZBetweenessClusterClosenessDegreeRandom

    構造モデル

    実データ

    構造モデルの推定

    • SNSネットワークとCNNモデルは,機能の観点からの特徴も類似している点が多い.

    ⇒SNS上で生じる現象を,CNNモデルおよびその改良を通じて分析,予測できると考えられる.

    – 本研究の提案手法は,現象の予測のための構造モデルの高度化の指針を与えるものであると考えられる.

    (c)(c)(c)(b)(d)(d)(b)SNS Network

    (c)(d)(c)(b)(d)(d)(b)CNN Model

    PZBetweenessClusterClosenessDegreeRandom

    入力 出力

    i o

    0 1

    1

    Initial Ratio of +1

    Con

    verg

    ence

    Rat

    io o

    f +1

    0 1

    1

    Initial Ratio of +1

    Con

    verg

    ence

    Rat

    io o

    f +1

    rc

    0 1

    1

    Initial Ratio of +1

    Con

    verg

    ence

    Rat

    io o

    f +1

    0 1

    1

    Initial Ratio of +1

    Con

    verg

    ence

    Rat

    io o

    f +1

    rc1 rc2

    0 1

    1

    Initial Ratio of +1

    Con

    verg

    ence

    Rat

    io o

    f +1

    rc

    (a) (b) (c) (d) (e)

    ),),,(( iruleEVGfo =

    local rule+G(V,E)

    パターンの発見 → マクロ的指標

  • (iii)ネットワークモデルを利用した構造分析

    (iii)ネットワークモデルを利用した構造分析

    ネットワークモデルの課題1

    Measuring Fundamental Properties of Real-World Complex Networks(2006)

    INET,p2p,WEB,IPの次数分布

    領域ごとに異なる特徴を有するネットワークに対して画一的にベキ乗則を当てはめ,それを再現するモデルを考える

    環境海洋工学専攻

    世田谷区在住

    ラグビー部テニススクール

    相互作用

    ネットワークモデルの課題2

    現実のネットワークに存在する(陽な※)コミュニティを扱うモデルが少ない

    CNNモデル

    u

    1- uA B

    C

  • 1- u

    B

    D (CNN)

    D

    1- u

    i

    j

    CNNモデル

    i

    b

    j

    CNN拡張モデル

    C)

    i i

    a a

    cn cn

    i i

    A)

    a a

    cn cn

    b b

    コミュニティ形成1

    u

    r

    コミュニティ形成2

    i

    B)

    ij j

    cn cn

    b b

    D)

    i ia a

    cncn

    j j

    q

    1-u-q-r0.000001

    0.00001

    0.0001

    0.001

    0.01

    0.1

    1

    1 10 100 1000

    kP(k)

    11≦k≦49

    γ=1.18

    指数分布

    3領域に分かれる。

    次数分布(友人数の確率分布)

    部分的にベキ分布である。

    低次領域の分布は指数分布である。

    横軸:友人数縦軸:確率分布両対数プロット(以下同様)

    実験結果1

    設定条件u=1/21q=4/21r =1/81N=360000

  • コミュニティ相互作用モデル群の概要

    Aさん

    コミュニティ

    コミュニティで知り合う

    Bさん

    Cさん

    友人になる コミュニティに入る

    知人効果(友人効果)

    A:友人を介して友人になる

    B:友人を介して コミュニティに入る

    コミュニティ効果C:コミュニティを介して

     友人になるD:コミュニティに入る

    (友人の有無に因らず)

    要因

    過程(プロセス)

    コミュニティ相互作用モデル群の体系

    98通りのモデルが考えられる。(相互作用あり:84通り、なし:14通り)数値実験(36000ノード)を行い、モデルの特徴を分析する。(AとCの両方が選択される場合には、A:C=1:1、

    BとDの両方が選択される場合には、B:D=1:1 とした。)

    次数(規模)優先的

    ランダム

    コミュニティを B1 B2ノードを B3 B4

    次数(規模)優先的

    ランダム

    コミュニティを C1 C2ノードを C4

    過程(プロセス)

    コミュニティ効果

    選択

    コミュニティを(ノードはランダム選択)

    友人になる コミュニティに入る選択

    要因

    知人効果(友人効果) A

    D1 D2

    コミュニティ相互作用モデル群の類型化

    B3 B2 B4なし D2 D1 D1 なし D2 D1 D2

    C4 指数 指数C1 指数+線形

    C2なし 指数+ベキC1C2 指数+指数 ベキ ベキC4

    C4C1C2なしC1C2C4

    C4C1C2なしC1C2C4

    線形

    指数

    B1

    次数分布

    コミュニティ

    参加数

    指数+線形

    なしB2 B4

    D1B3

    コミュニティ

    規模

    なし

    A

    なし

    A

    なし

    指数+指数

    ベキ+ベキ ベキ+ベキベキ+ベキ

    指数

    指数+

    ベキ

    線形+

    指数+

    線形

    指数+

    線形

    ベキ指数+

    ベキ

    指数指数+

    線形

    指数+

    指数

    指数+

    線形

    ベキ+

    線形

    要素名

    ベキ指数+

    線形

    指数+線形 指数+線形

    D2なし

    A

    ベキ ベキ+ベキ 指数+指数指数+ベキ 指数+線形 ベキ+線形指数 線形 数値実験 設定条件

    • アルゴリズムの各確率の設定u =1/21, q =4/21, r =1/81(実SNSの、平均次数:約10、 平均コミュニティ参加数:約16、ユーザ数:コミュニティ数=4:1に近づけ、シミュレーションの条件を合わせるため)

    • 初期条件ノード数:1 コミュニティ数:0

    • 終了条件ノード数:360000

  • B3 B2 B4なし D2 D1 D1 なし D2 D1 D2

    C4 指数 指数C1 指数+線形

    C2なし 指数+ベキC1C2 指数+指数 ベキ ベキC4

    C4C1C2なしC1C2C4

    C4C1C2なしC1C2C4

    線形

    指数

    B1

    次数分布

    コミュニティ

    参加数

    指数+線形

    なしB2 B4

    D1B3

    コミュニティ

    規模

    なし

    A

    なし

    A

    なし

    指数+指数

    ベキ+ベキ ベキ+ベキベキ+ベキ

    指数

    指数+

    ベキ

    線形+

    指数+

    線形

    指数+

    線形

    ベキ指数+

    ベキ

    指数指数+

    線形

    指数+

    指数

    指数+

    線形

    ベキ+

    線形

    要素名

    ベキ指数+

    線形

    指数+線形 指数+線形

    D2なし

    A

    モデルによる分析(事例:SNS)次数分布

    SNS モデルAB3C4D2

    共通点領域ごとにベキ分布となる。次数と共にベキ指数が大きくなる。

    友人を介して知り合う。コミュニティで知り合う。(友人の数に因らない)

    0.000001

    0.00001

    0.0001

    0.001

    0.01

    0.1

    1

    1 10 100 1000

    kP(k)

    k≦1011≦k≦49

    50≦k

    γ=1.07

    γ=2.12

    γ=2.28

    0.000001

    0.00001

    0.0001

    0.001

    0.01

    0.1

    1

    1 10 100 1000

    kP(k)

    k≦1011≦k≦49

    50≦k

    γ=1.07

    γ=2.12

    γ=2.28

    B3 B2 B4なし D2 D1 D1 なし D2 D1 D2

    C4 指数 指数C1 指数+線形

    C2なし 指数+ベキC1C2 指数+指数 ベキ ベキC4

    C4C1C2なしC1C2C4

    C4C1C2なしC1C2C4

    線形

    指数

    B1

    次数分布

    コミュニティ

    参加数

    指数+線形

    なしB2 B4

    D1B3

    コミュニティ

    規模

    なし

    A

    なし

    A

    なし

    指数+指数

    ベキ+ベキ ベキ+ベキベキ+ベキ

    指数

    指数+

    ベキ

    線形+

    指数+

    線形

    指数+

    線形

    ベキ指数+

    ベキ

    指数指数+

    線形

    指数+

    指数

    指数+

    線形

    ベキ+

    線形

    要素名

    ベキ指数+

    線形

    指数+線形 指数+線形

    D2なし

    A

    SNS モデルAB3C4D2

    共通点中次、高次でのベキ乗則次数と共にベキ指数が大きくなる。

    コミュニティへの参加の過程は、B1∧D1B1∧D2B3∧D2 のいずれかに絞れる

    モデルによる分析(事例:SNS)コミュニティ参加数

    0.000001

    0.00001

    0.0001

    0.001

    0.01

    0.1

    1

    1 10 100 1000

    コミュニティ参加数(j)

    確率

    分布

    11≦j≦49

    50≦j

    γ=1.93

    γ=2.14

    0.00001

    0.0001

    0.001

    0.01

    0.1

    1

    1 10 100 1000 10000

    コミュニティ規模(n)

    確率

    分布

    50≦n

    γ=1.68

    B3 B2 B4なし D2 D1 D1 なし D2 D1 D2

    C4 指数 指数C1 指数+線形

    C2なし 指数+ベキC1C2 指数+指数 ベキ ベキC4

    C4C1C2なしC1C2C4

    C4C1C2なしC1C2C4

    線形

    指数

    B1

    次数分布

    コミュニティ

    参加数

    指数+線形

    なしB2 B4

    D1B3

    コミュニティ

    規模

    なし

    A

    なし

    A

    なし

    指数+指数

    ベキ+ベキ ベキ+ベキベキ+ベキ

    指数

    指数+

    ベキ

    線形+

    指数+

    線形

    指数+

    線形

    ベキ指数+

    ベキ

    指数指数+

    線形

    指数+

    指数

    指数+

    線形

    ベキ+

    線形

    要素名

    ベキ指数+

    線形

    指数+線形 指数+線形

    D2なし

    A

    SNS モデルAB3C4D2

    0.00001

    0.0001

    0.001

    0.01

    0.1

    1

    1 10 100 1000 10000コミュニティ規模 (n )

    確率

    分布

    nn

    n

    ≤≤≤

    504911

    10

    γ= 1.41

    γ= 1.27

    0.00001

    0.0001

    0.001

    0.01

    0.1

    1

    1 10 100 1000 10000コミュニティ規模 (n )

    確率

    分布

    nn

    n

    ≤≤≤

    504911

    10

    nn

    n

    ≤≤≤

    504911

    10

    γ= 1.41

    γ= 1.27

    共通点低次領域における指数分布中次領域以降、ベキ指数が大きくなる。

    指数分布指数分布

    •友人を介してコミュニティに入る。(起こりやすさは友人の数に比例)•ランダムにコミュニティに入る。(規模の大小、友人の有無問わない)

    モデルによる分析(事例:SNS)コミュニティ規模 1

    10

    11

    12

    13

    14

    15

    16

    17

    18

    19

    2

    20

    21

    22

    23

    24

    25

    26

    2728

    29

    3

    30

    31

    32

    33

    34

    4

    5

    6

    7

    8

    9

    現実のネットワーク(形成過程,構造は未知)

    現象(例:疫病の伝染、

    口コミの伝播)

    シミュレーション(例:疫病伝染、情報伝播)

    モデルによるネットワーク(形成過程,

    構造は観測可能)

    再現

    真の因果関係

    対応付け分析 ネットワークモデルを用いた現象のモデリング

  • マクロとミクロをつなぐものマクロとミクロをつなぐもの

    - コミュニティ分割とコミュニティ分類 -

    構造の類似度に着目

    コミュニティ分割 リンク密度

    構造

    着眼点

    Newman法

    類似度行列を用いた方法

    Leichtら(2006)によって提案された概念.

    各頂点間の類似度を要素に持った行列.

    類似度行列 基本コンセプト

    頂点i が隣接する頂点v を持ち,v がj に似ているのであれば,i はjに似ている

    i

    v

    j

    ∑ +=v

    ijvjivij SAS ψδφ隣接行列i, v 接続 1

    なし 0類似度行列

    v, j の類似度デルタ関数

    i = v 1else 0

    係数

    再帰的に定義

    ∑ +=v

    ijvjivij SAS ψδφ

    L+++≈

    −= −

    22

    1][AAI

    AISφφ

    φ

    IASS ψφ +=行列で表し

    φ をどう決める?

    )1(][0

    L∑∞

    =

    =l

    ijlij

    lij CS A

    )2(2 11 L+−= l

    ji

    ijl kk

    mC λ

    11

    1

    112

    −⎟⎟⎠

    ⎞⎜⎜⎝

    ⎛−= DAIDSλαλm

    1λ Aは の最大固有値)(ik iは頂点 の次数)(

    ijiij kD δ=( )α は減衰ファクター)(

    1=ψ

    IDSDADSD += )(1λαS S

  • 具体的に・・・

    IDSDADSD += )(1λαS S

    左図のグラフでは・・・

    95.0, == α0DSD を初期値として100回繰り返し演算

    ⎟⎟⎟⎟⎟

    ⎜⎜⎜⎜⎜

    =

    13,131,13

    1,2

    13,12,11,1

    SS

    SSSS

    LL

    MOM

    MO

    L

    S

    12

    36

    4

    87

    9

    10 11

    5

    12 13

    (ex.)

    15.068.0

    2,10

    12,10

    =

    =

    SS

    Newman法,類似度行列の比較

    • 2部グラフ

    2

    6

    4

    87

    9

    10 11

    512 13

    1

    3

    14

    6

    2

    3 5

    7

    S’

    1 6

    3

    7 82

    5 9

    4

    (大規模)ネットワーク

    いくつかのコミュニティNewman法

    各コミュニティのパターン類似度行列と可視化

    (i) コミュニティ分割

    コミュニティ1

    コミュニティ2

    コミュニティ3

    Newman法

    各々のコミュニティに対して類似度行列によるコミュニティ分割を行う

    (ii) コミュニティの類型化

    コミュニティ1

    コミュニティ2

    コミュニティ3

    クラスタ1 クラスタ2 クラスタ3

    効果的な使い方(提案手法)

  • ブログデータ

    • 個々のページをノード,トラックバックをリンクとしたページ群のネットワーク

    • ノード数:181,714リンク数:626,365

    ブログのコミュニティ(全体像)

    ②機能からのマクロ的指標

    ①可視化からのマクロ的指標

    ③ ネットワークモデル

    マクロ的分析

    マクロ的指標に基づくパラメータ同定

    ネットワークモデルに基づくメソ,ミクロ構造の分析

    ④H

    PCによる効率化

    ネットワークを知る,使う,作る・デザインするネットワークを知る,使う,作る・デザインする

    知る・測るための指標は未だ不足-大規模性の問題-階層性の問題

    複雑なネットワークでも階層構造として分離できる可能性は高いミクロ・メソ・マクロ間の関係性が未だ不明確(相似性の有無等)

    -時間依存性の問題

    ・局所から全体を予測することの難しさ-確率的手法はどの程度有効か

    使う・透明性?

    本当に見えているのか

    作る・デザインする・リンクの意味づけ(MAS系のもので不明確なものが多い)・大規模性,複雑性・何を最適とするのか(評価指標)

    すべての項目は関係する.例えば,リンクの意味づけは「知る」ことにとっても重要である.敢えて分けると・・・