Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
文章中の語彙の初出課を判定するシステム 中野光 北村達也(甲南大学知能情報学部)
単語レベル判定システムに関連する先行研究
単語リスト:単語を課とともに表示
デモあり
• 語彙チェッカー (川村, 1998) • 単語親密度チェッカー (川村, 北村, 2008) • IDFに基づくシステム (北村, 川村, 2009) • J-LEX (松下, 2014) • これやさしいか (伊藤ら, 2014) • かぶとエディタ (住田, 北村, 2014)
謝辞 本研究は,(株) スリーエーネットワークの協力を得て行われた.本研究の一部は,平成26年度科研費基盤研究(B)(24320096) および私立大学等経常費補助金特別補助「大学間連携等による共同研究」の支援を得て行われた.また,甲南大学知能情報学部 田中豪君の協力を得た.
「みんなの日本語初級 I 第2版」,「同 II 第2版」に準拠した既習/未習判定システム『みんなちぇっかー (仮)』を開発 (連語にも対応)
入力エリア
課を指定 (プルダウンメニュー)
1
Webブラウザ上で動作します
(1) 連語に対応していない (2) 既習,未習がわかれば十分という意見あり (3) メジャーな教科書に準拠したシステムが必要
みんなちぇっかー (仮) 2
出力エリア:
みんなの日本語のWebページからアクセス可
チェックボタン
指定した課に対して既習語を黒,未習語を赤で表示
ご注意とお願い 5 • 基本的に文型は判定対象外です • 形態素解析の誤りによる誤判定が生じ得ます • Facebookページにフィードバックをお寄せください
処理の流れ 3 文章
形態素解析
単語リスト内の連語の照合
色分け表示
MeCab を利用
リスト表示
形態素と単語リストの照合
「みんなの日本語初級 I 第2版」,「みんなの日本語初級 II 第2版」 の語彙リスト
処理例 4
• 連語の高速な照合を実現 • 連語の末尾が活用しても照合可能
10課で判定した結果 25課で判定した結果
既習語は黒 未習語は赤
単語リストPDFファイルへのリンク
既習語は黒 未習語は赤