1
文章中の語彙の初出課を判定するシステム 中野光 北村達也(甲南大学知能情報学部) 単語レベル判定システムに関連する先行研究 単語リスト:単語を課とともに表示 デモあり 語彙チェッカー (川村, 1998) 単語親密度チェッカー (川村, 北村, 2008) IDFに基づくシステム (北村, 川村, 2009) J-LEX (松下, 2014) これやさしいか (伊藤ら, 2014) かぶとエディタ (住田, 北村, 2014) 謝辞 本研究は,(株) スリーエーネットワークの協力を得て行われた.本研究の一部は,平成26年度科研費基盤研究(B)(24320096) および私立 大学等経常費補助金特別補助「大学間連携等による共同研究」の支援を得て行われた.また,甲南大学知能情報学部 田中豪君の協力を得た. 「みんなの日本語初級 I 第2版」,「同 II 第2版」に準拠した既習/未習判定システム 『みんなちぇっかー (仮)』を開発 (連語にも対応) 入力エリア 課を指定 (プルダウンメニュー) 1 Webブラウザ上で動作します (1) 連語に対応していない (2) 既習,未習がわかれば十分という意見あり (3) メジャーな教科書に準拠したシステムが必要 みんなちぇっかー (仮) 2 出力エリア: みんなの日本語のWebページからアクセス可 チェックボタン 指定した課に対して既習語 を黒,未習語を赤で表示 ご注意とお願い 5 基本的に文型は判定対象外です 形態素解析の誤りによる誤判定が生じ得ます Facebookページにフィードバックをお寄せください 処理の流れ 3 文章 形態素解析 単語リスト内の連語の照合 色分け表示 MeCab を利用 リスト表示 形態素と単語リストの照合 「みんなの日本語初級 I 第2版」, 「みんなの日本語初級 II 第2版」 の語彙リスト 処理例 4 連語の高速な照合を実現 連語の末尾が活用しても照合可能 10課で判定した結果 25課で判定した結果 既習語は黒 未習語は赤 単語リストPDFファイルへのリンク 既習語は黒 未習語は赤

文章中の語彙の初出課を判定するシステム デモあり · 「みんなの日本語初級 i 第2版」, 「みんなの日本語初級 ii 第2版」 の語彙リスト

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

文章中の語彙の初出課を判定するシステム 中野光 北村達也(甲南大学知能情報学部)

 単語レベル判定システムに関連する先行研究

単語リスト:単語を課とともに表示

デモあり

•  語彙チェッカー (川村, 1998) •  単語親密度チェッカー (川村, 北村, 2008) •  IDFに基づくシステム (北村, 川村, 2009) •  J-LEX (松下, 2014) •  これやさしいか (伊藤ら, 2014) •  かぶとエディタ (住田, 北村, 2014)

謝辞 本研究は,(株) スリーエーネットワークの協力を得て行われた.本研究の一部は,平成26年度科研費基盤研究(B)(24320096) および私立大学等経常費補助金特別補助「大学間連携等による共同研究」の支援を得て行われた.また,甲南大学知能情報学部 田中豪君の協力を得た.

「みんなの日本語初級 I 第2版」,「同 II 第2版」に準拠した既習/未習判定システム『みんなちぇっかー (仮)』を開発 (連語にも対応)

入力エリア

課を指定 (プルダウンメニュー)

1

Webブラウザ上で動作します

(1)  連語に対応していない (2)  既習,未習がわかれば十分という意見あり (3)  メジャーな教科書に準拠したシステムが必要

 みんなちぇっかー (仮) 2

出力エリア:

みんなの日本語のWebページからアクセス可

チェックボタン

指定した課に対して既習語を黒,未習語を赤で表示

 ご注意とお願い 5 •  基本的に文型は判定対象外です •  形態素解析の誤りによる誤判定が生じ得ます •  Facebookページにフィードバックをお寄せください

 処理の流れ 3 文章

形態素解析

単語リスト内の連語の照合

色分け表示

MeCab を利用

リスト表示

形態素と単語リストの照合

「みんなの日本語初級 I 第2版」,「みんなの日本語初級 II 第2版」 の語彙リスト

 処理例 4

•  連語の高速な照合を実現 •  連語の末尾が活用しても照合可能

10課で判定した結果 25課で判定した結果

既習語は黒 未習語は赤

単語リストPDFファイルへのリンク

既習語は黒 未習語は赤