10
A Survey of Automated Text Simplifica6on .D〜Ⅳ Ma9hew ShardlowInterna6onal Journal of Advanced Computer Science and Applica6ons, Special Issue on Natural Language Processing, pp.58–70, 2014. 1 プレゼンテーション 野口真人

A survey of_automated_text_simplification_Ⅱ_d~Ⅳ

  • Upload
    swenbe

  • View
    108

  • Download
    2

Embed Size (px)

Citation preview

Page 1: A survey of_automated_text_simplification_Ⅱ_d~Ⅳ

A  Survey  of  Automated  Text  Simplifica6on  Ⅱ.D〜Ⅳ Ma9hew  ShardlowInterna6onal  Journal  of  Advanced  Computer  Science  and  Applica6ons,  Special  Issue  on  Natural  Language  Processing,  pp.58–70,  2014. 1

プレゼンテーション  

野口真人

Page 2: A survey of_automated_text_simplification_Ⅱ_d~Ⅳ

Ⅱ.D  SMTを用いたアプローチ

0 機械翻訳は言語処理の分野で確立された手法である  0 平易化を難解語から平易語への翻訳と考える  0 英語・ブラジルのポルトガル語・ドイツ語での取り組み

が行われている  0 Mosesを利用している  0 難解語と平易語の組み合わせを作るのは難しい  

0 人手による作成  0 WikipediaとSimple  Wikipediaをコーパスとして作成  

0 BLEUを使って評価  0 最近の研究では人手で評価することも多い  

2

Page 3: A survey of_automated_text_simplification_Ⅱ_d~Ⅳ

SMTを用いた平易化の論文

3

Page 4: A survey of_automated_text_simplification_Ⅱ_d~Ⅳ

Ⅱ.E  英語以外の言語におけるアプローチ

0 英語以外でもテキストの平易化は行われている  0 KURAプロジェクト(日本):聾者のためのテキスト平易化  0 PorSimplesプロジェクト(ポルトガル):多くの分野に貢献  0 Simplextプロジェクト(スペイン):進行中・失読者のためのもの  

0 大部分のプロジェクトでは新しい技術を作り出すことはせず,既存の手法をそれらの言語に実装している  0 言語それぞれに特徴があるため  0 それらの特徴を分析することは重要である

4

Page 5: A survey of_automated_text_simplification_Ⅱ_d~Ⅳ

英語以外の平易化プロジェクト

5

Page 6: A survey of_automated_text_simplification_Ⅱ_d~Ⅳ

Ⅲ. 課題の調査

0 ここまでは今までに明らかになっいる分野を示した  

0 ここからは研究の将来のための(3つの)方向性を提示する  0 リソース(Ⅲ.A)  

0 評価方法について  0 コーパスについて  

0 システム(Ⅲ.B)  0 平易化システム開発の必要性  

0 手法(Ⅲ.C)  0 新しいアルゴリズム開発の必要性  

6

Page 7: A survey of_automated_text_simplification_Ⅱ_d~Ⅳ

Ⅲ.A リソース

0 自動評価の方法開発の必要性  0 「読みやすさ」の自動評価は今の所できない  0 人手による評価は正確とは限らない  0 平易化は明らかな正解がないので難しい  

0 新しいコーパス開発の必要性  0 テキスト平易化は一組のコーパスだけでは評価しづらい  0 多くの参照テキストと比較することで広い範囲の評価が可能

となる  

7

Page 8: A survey of_automated_text_simplification_Ⅱ_d~Ⅳ

Ⅲ.B  システム

0 テキスト平易化のアプリケーションは以下のレベルで適用される  0 ユーザーレベル(FACILITAプロジェクトなど)  

0 複数の言い換えを出す  0 ユーザーがその中から一つを選択する  

0 著者が事前に言い換えを用意する  0 自動的に言い換えを用意する  0 著者が自身で読みやすい文章も作成  

0 商業的な取り組みも必要  

8

Page 9: A survey of_automated_text_simplification_Ⅱ_d~Ⅳ

Ⅲ.C  手法

0 テキスト平易化のための改善点  0 語義曖昧性解消  

0 語彙の平易化のため必要  0 文脈をみることで判断できる  

0 平易化候補からの選択  0 平易化の候補は2つ以上ある場合が多い  0 その中から選択するのは難しい  0 複雑さの分類器を作成することが重要

9

Page 10: A survey of_automated_text_simplification_Ⅱ_d~Ⅳ

Ⅳ. 結論

0 テキスト平易化は難しいタスクである  0 テキスト平易化は機械翻訳の前処理や失語症の人の

助けになるテクノロジーである  0 読みやすさとわかりやすさを高めることが必要  0 平易化への多くのアプローチ  

0 語彙レベルの平易化  0 熟語の平易化  0 構文を変える平易化  0 MTを使った平易化  

0 平易化は日常的なアプリケーションになってきている  

10