Upload
swenbe
View
108
Download
2
Embed Size (px)
Citation preview
A Survey of Automated Text Simplifica6on Ⅱ.D〜Ⅳ Ma9hew ShardlowInterna6onal Journal of Advanced Computer Science and Applica6ons, Special Issue on Natural Language Processing, pp.58–70, 2014. 1
プレゼンテーション
野口真人
Ⅱ.D SMTを用いたアプローチ
0 機械翻訳は言語処理の分野で確立された手法である 0 平易化を難解語から平易語への翻訳と考える 0 英語・ブラジルのポルトガル語・ドイツ語での取り組み
が行われている 0 Mosesを利用している 0 難解語と平易語の組み合わせを作るのは難しい
0 人手による作成 0 WikipediaとSimple Wikipediaをコーパスとして作成
0 BLEUを使って評価 0 最近の研究では人手で評価することも多い
2
SMTを用いた平易化の論文
3
Ⅱ.E 英語以外の言語におけるアプローチ
0 英語以外でもテキストの平易化は行われている 0 KURAプロジェクト(日本):聾者のためのテキスト平易化 0 PorSimplesプロジェクト(ポルトガル):多くの分野に貢献 0 Simplextプロジェクト(スペイン):進行中・失読者のためのもの
0 大部分のプロジェクトでは新しい技術を作り出すことはせず,既存の手法をそれらの言語に実装している 0 言語それぞれに特徴があるため 0 それらの特徴を分析することは重要である
4
英語以外の平易化プロジェクト
5
Ⅲ. 課題の調査
0 ここまでは今までに明らかになっいる分野を示した
0 ここからは研究の将来のための(3つの)方向性を提示する 0 リソース(Ⅲ.A)
0 評価方法について 0 コーパスについて
0 システム(Ⅲ.B) 0 平易化システム開発の必要性
0 手法(Ⅲ.C) 0 新しいアルゴリズム開発の必要性
6
Ⅲ.A リソース
0 自動評価の方法開発の必要性 0 「読みやすさ」の自動評価は今の所できない 0 人手による評価は正確とは限らない 0 平易化は明らかな正解がないので難しい
0 新しいコーパス開発の必要性 0 テキスト平易化は一組のコーパスだけでは評価しづらい 0 多くの参照テキストと比較することで広い範囲の評価が可能
となる
7
Ⅲ.B システム
0 テキスト平易化のアプリケーションは以下のレベルで適用される 0 ユーザーレベル(FACILITAプロジェクトなど)
0 複数の言い換えを出す 0 ユーザーがその中から一つを選択する
0 著者が事前に言い換えを用意する 0 自動的に言い換えを用意する 0 著者が自身で読みやすい文章も作成
0 商業的な取り組みも必要
8
Ⅲ.C 手法
0 テキスト平易化のための改善点 0 語義曖昧性解消
0 語彙の平易化のため必要 0 文脈をみることで判断できる
0 平易化候補からの選択 0 平易化の候補は2つ以上ある場合が多い 0 その中から選択するのは難しい 0 複雑さの分類器を作成することが重要
9
Ⅳ. 結論
0 テキスト平易化は難しいタスクである 0 テキスト平易化は機械翻訳の前処理や失語症の人の
助けになるテクノロジーである 0 読みやすさとわかりやすさを高めることが必要 0 平易化への多くのアプローチ
0 語彙レベルの平易化 0 熟語の平易化 0 構文を変える平易化 0 MTを使った平易化
0 平易化は日常的なアプリケーションになってきている
10