1
文脈自由文法のいくつかの部分クラスの Distributional Learning に基づく正例からの PAC 学習 柴田 千尋 東京工科大学 研究の背景 文脈自由言語(CFLs)自体の学習は決定論の意味でも 確率学習(PAC)の意味でも理論的には困難 [Abe+’92 etc.] Distributional Learning クエリを用いた学習 (MAT学習) (Shirakawa+’93, Clark’10) 正例のみからの学習 (Clark & Eyraud ’09, etc.) クエリと正例の両方を用いた学習 (Clark+’09, Clark’10, Yoshinaka’12 etc.) クエリを使った学習 Congruential CFGs (Clark ’10) Unambiguous NTS CFGs (Clark ’06) Context-deterministic CFGs (Shirakawa & Yokomori ’93) Unambiguous linear context-deterministic CFGs CFGs with the FCP (Clark ’10, Yoshinaka ’12) Linear CFGs with 1-CP CFGs with the FKP (Clark & Eyraud ’09, Yoshinaka ’12) CFGs with 1-KP 部分文字列 u ∈ Σ* 文脈 l□r where l, r ∈ Σ* 文脈と部分文字列の関係を観察 観察表 L = { a n b n | n 0 } λ a b ab aab aabb 1 0 0 1 0 1 a0 0 1 0 0 0 b 0 1 0 0 1 0 1 0 0 0 0 0 1 0 0 1 0 1 0 1 0 0 0 0 (a□b) L = {λ, ab, aabb, .... } Σ* 吉仲 亮 京都大学 形式言語の学習の近年の発展 Distributional Learning とは 学習可能なサブクラスの探求 ab□ a□b □abb 正例からのPAC学習 対象とした文法のクラス 正例からのPAC学習とは Σ* L(G) L(G) L(H) L(H) 普通のPACだと… 正例からのPAC 負例がないので確率が0 常にL(H)がL(G)の部分集合 となるようにHを構成 G : 学習対象の文法 H : 学習した文法 注:どちらの場合も確率分布の近さは問わない (差分にあたる部分の確率のみ考慮) 正例からのPAC学習 次の ①~③ のクラスについて一定の条件のもとPAC学習可能であることを示した。 D-19 Chihiro Shibata and Ryo Yoshinaka, “PAC Learning of Some Subclasses of CFGs with Basic Distributional Properties from Positive Data.” In proc. of ALT (LNAI 8139), pp.143-157, 2013.

文脈自由文法のいくつかの部分クラスの D-19 Distributional ...文脈自由文法のいくつかの部分クラスの Distributional Learning に基づく正例からの

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

  • 文脈自由文法のいくつかの部分クラスの Distributional Learning に基づく正例からの PAC 学習 柴田 千尋 東京工科大学

    研究の背景

    文脈自由言語(CFLs)自体の学習は決定論の意味でも確率学習(PAC)の意味でも理論的には困難 [Abe+’92 etc.]

    Distributional Learningクエリを用いた学習 (MAT学習) (Shirakawa+’93, Clark’10)正例のみからの学習(Clark & Eyraud ’09, etc.)

    クエリと正例の両方を用いた学習(Clark+’09, Clark’10, Yoshinaka’12 etc.)

    クエリを使った学習

    Congruential CFGs(Clark ’10) ⊃

    Unambiguous NTS CFGs(Clark ’06)

    Context-deterministic CFGs(Shirakawa & Yokomori ’93) ⊃

    Unambiguous linearcontext-deterministic CFGs

    CFGs with the FCP(Clark ’10, Yoshinaka ’12) ⊃ Linear CFGs with 1-CPCFGs with the FKP

    (Clark & Eyraud ’09, Yoshinaka ’12) ⊃ CFGs with 1-KP

    部分文字列 u ∈ Σ* 文脈 l□r where l, r ∈ Σ*文脈と部分文字列の関係を観察

    観察表

    L = { anbn | n ≥ 0 }

    λ a b ab aab aabb□ 1 0 0 1 0 1a□ 0 0 1 0 0 0□b 0 1 0 0 1 0

    1 0 0 0 0 01 0 0 1 0 10 1 0 0 0 0

    (a□b)L = {λ, ab, aabb, .... }

    Σ*

    吉仲 亮 京都大学

    形式言語の学習の近年の発展

    Distributional Learning とは

    学習可能なサブクラスの探求

    ab□a□b□abb

    正例からのPAC学習

    対象とした文法のクラス

    正例からのPAC学習とは

    Σ*

    L(G)L(G)L(H) L(H)

    普通のPACだと… 正例からのPAC

    負例がないので確率が0 常にL(H)がL(G)の部分集合となるようにHを構成

    G : 学習対象の文法 H : 学習した文法

    注:どちらの場合も確率分布の近さは問わない (差分にあたる部分の確率のみ考慮)

    正例からのPAC学習

    次の ①~③ のクラスについて一定の条件のもとPAC学習可能であることを示した。

    D-19

    Chihiro Shibata and Ryo Yoshinaka, “PAC Learning of Some Subclasses of CFGs with Basic Distributional Properties from Positive Data.” In proc. of ALT (LNAI 8139), pp.143-157, 2013.