10
− 49 − テレビの緊急報道番組に付与されたリアルタイム字幕 および字幕中の地名に関する調査 福 島 孝 博 A survey on real-time closed captions of emergency TV programs and place names in the captions Takahiro FUKUSHIMA 1.は じ め に テレビ番組への字幕付与は、聴覚障害者への情報保障の柱の 1 つであり、総務省の行政指針 に従い NHK、民放各局によりテレビ字幕の普及が進められている 1 。この字幕普及の取り組 みの中、2011 3 11 日に東日本大震災が発生した。地震発生直後から多くの緊急報道番組 が断続的に放送され、それらのいくつかは、生字幕付きの放送となった。 本研究では、昨年度の研究に引き続くものであるが、調査対象をより長時間にして、テレビ 緊急番組に付与された生字幕の調査と分析を行った 2 。調査対象は、3 11 日大震災当日の 夕方 16 時台に放送された緊急の報道番組、NHK と民放の番組、それぞれ約 1 時間分である。 それらの番組の音声の書き起しと字幕の書き写しをデータとして、基本的な統計調査、および テキスト中に出現する地名(place name)に着目しての分析を実施した。 基本調査には、テキストの基本単位を文字数だけでなく、形態素を単位とした調査も含めて いる。これは、米国での字幕に関する研究で使われた単語単位での調査と比較をするためであ る。形態素分割には、日本語のための形態素解析プログラムを用いた。 地名などのテキスト中の固有名( Named Entity )に関しては、1980 年代後半から 90 年代にか けて、日米において、情報抽出技術における要素技術として、固有名の抽出に関する研究が進 められた 3 ]、[4 。本論文では、英語および日本語テキストにおける固有名抽出、特に、地名に ついての知見を基に、緊急報道に出現する地名に関する分析を実施した。 以下では、調査の対象、方法の詳細と調査結果を報告し、地名に関する分析結果を述べる。

テレビの緊急報道番組に付与されたリアルタイム字 …テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: テレビの緊急報道番組に付与されたリアルタイム字 …テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

− 49 −

テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

福   島   孝   博

A survey on real-time closed captions of emergency TV programs and place names in the captions

Takahiro FUKUSHIMA

1.は じ め に

 テレビ番組への字幕付与は、聴覚障害者への情報保障の柱の 1 つであり、総務省の行政指針

に従い NHK、民放各局によりテレビ字幕の普及が進められている[1]。この字幕普及の取り組

みの中、2011 年 3 月 11 日に東日本大震災が発生した。地震発生直後から多くの緊急報道番組

が断続的に放送され、それらのいくつかは、生字幕付きの放送となった。

 本研究では、昨年度の研究に引き続くものであるが、調査対象をより長時間にして、テレビ

緊急番組に付与された生字幕の調査と分析を行った[2]。調査対象は、3 月 11 日大震災当日の

夕方 16 時台に放送された緊急の報道番組、NHK と民放の番組、それぞれ約 1 時間分である。

それらの番組の音声の書き起しと字幕の書き写しをデータとして、基本的な統計調査、および

テキスト中に出現する地名(place name)に着目しての分析を実施した。

 基本調査には、テキストの基本単位を文字数だけでなく、形態素を単位とした調査も含めて

いる。これは、米国での字幕に関する研究で使われた単語単位での調査と比較をするためであ

る。形態素分割には、日本語のための形態素解析プログラムを用いた。

 地名などのテキスト中の固有名(Named Entity)に関しては、1980 年代後半から 90 年代にか

けて、日米において、情報抽出技術における要素技術として、固有名の抽出に関する研究が進

められた[3]、[4]。本論文では、英語および日本語テキストにおける固有名抽出、特に、地名に

ついての知見を基に、緊急報道に出現する地名に関する分析を実施した。

 以下では、調査の対象、方法の詳細と調査結果を報告し、地名に関する分析結果を述べる。

Page 2: テレビの緊急報道番組に付与されたリアルタイム字 …テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

− 50 −

2.調 査 対 象

 調査の対象としたテレビ番組は、以下の 2 番組である。

  ・ NHK 緊急報道番組:2011 年 3 月 11 日午後 4 時台から 5 時台にかけての 1 時間。正確には、

音声が 1 時間 05 秒、字幕調査対象が 1 時間 00 秒である。

  ・ フジテレビ系列、「緊急報道番組」:2011 年 3 月 11 日午後 4 時台から 5 時台にかけての 1

時間弱である。民放番組であるが、緊急報道番組であるため CM は入っていない。但し、

字幕が付かない地方局からの報道が 7 分間程含まれるため、その部分は対象外としてい

る。正確には、音声の対象が 49 分 16 秒、字幕が 48 分 54 秒である。

 以下では、前者を「NHK」、後者を「フジ」とする。

3.調 査 方 法

 各番組から音声を書き起こし文字化したもの(以下「音声データ」)とその番組にリアルタイ

ムで付与された字幕を書き写したもの(以下「字幕データ」)を作成した。

 音声データには、句読点はなく、「え」、「えー」などのフィラーを文字化したものを含めて

いない。字幕データは、字幕そのものを書き写したものであり、句読点や話者情報などが含ま

れている。話者情報は、字幕の読み手に話者が分かるようにするもので、話者が切り替わった

時に「>>」(数学での大なりの記号の二連続)などが使われている。

 基本統計調査の項目は、各データの文字数、形態素数、要約率、速度である。要約率と速度

については、文字数、形態素数からの 2 種類を計算している。各項目の詳細は以下のとおりと

なる。

  ・ 文字数:各データの文字数。音声データは、句読点なし。字幕データは、句読点、話者情

報を含む。

  ・ 形態素数:日本語形態素解析プログラム、JUMAN を使用して、データを形態素解析し、

その結果を利用して形態素数を算出している[5]。

  ・ 要約率(文字数):音声データに対する字幕データの文字数での割合。

  ・ 要約率(形態素数):音声データに対する字幕データの形態素数での割合。

  ・ 速度(文字数):発話速度と字幕表示速度の 2 種類を算出した。発話速度は、1 分間あたり

音声の文字数であり、字幕表示速度は、1 分間あたりの字幕の文字数である。

  ・ 速度(形態素数):文字数での速度と同様であるが、単位を形態素として算出する。

Page 3: テレビの緊急報道番組に付与されたリアルタイム字 …テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

福   島   孝   博

− 51 −

JUMAN を用いた形態素解析の結果を以下にその一部を示す。

 この形態素解析は、文字列「岩手県釜石現在の様子です」を入力とした結果である。ここで

は、入力文が、「岩手」「県」「釜石」「現在」「の」「様子」「です」の 7 個の形態素に分割されて、

かつ、それぞれ形態素にその読みや品詞情報などが付いている。

 JUMANでは、プログラムを実行するさいに、種々の設定ができるが、今回は、ベストパス(プ

ログラムがベストだと判断するもの)を、そのまま形態素解析結果として採用している。

4.調 査 結 果

4. 1 文字数、形態素数

 2 番組の文字数と形態素数は以下のとおりである。

表 1 文字数と形態素数

NHK フジ

音声文字数 18961 15567

字幕文字数 19452 14045

音声形態素数 10656 8715

字幕形態素数 11879 8100

 NHK のデータは、文字数、形態素数の両方において字幕データが音声データより大きな値

となっている。

Page 4: テレビの緊急報道番組に付与されたリアルタイム字 …テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

− 52 −

4. 2 要約率と速度

 次に、要約率と速度を、文字数と形態素数を使って算出した。結果は以下のとおりとなる。

表 2 要約率(文字数と形態素数)

NHK フジ

要約率(文字数) 1.026 0.902

要約率(形態素数) 1.115 0.929

 NHK のデータでは、文字数、形態素数ともに要約率が 1.0 を超えている。フジのデータにお

いても、90%を超える高い数値となっている。これは、リアルタイムで入力された字幕が、音

声に追い付いていることを示している。NHK のデータの場合、字幕には句読点、話者情報が

入るため、1.0 を超える値となった。

表 3 速度(文字数と形態素数)

速 度 NHK フジ

発話速度(文字数) 315.58 315.97

字幕表示速度(文字数) 324.25 287.22

発話速度(形態素数) 177.35 176.89

字幕表示速度(形態素数) 197.98 165.64

 文字数での発話速度、字幕表示速度を他のテレビ番組(リアルタイム字幕付与スポーツ番組)

と比較すると以下のグラフとなり、今回のデータの速度が速めであることがわかる[6]。特に、

NHK データの字幕表示速度は、どのスポーツ番組の字幕速度より速いものとなっている。

図 1 発話速度と字幕表示速度の比較

Page 5: テレビの緊急報道番組に付与されたリアルタイム字 …テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

福   島   孝   博

− 53 −

 米国でのテレビ字幕の速度に関する研究では、30 秒の短いビデオに付与された字幕である

が、その単語数を 1 分間当たり 145(Words Per Minute)程度で読みやすいと判断されると報告

されている[7]。日本語データの場合は、これと直接は比較しにくいが、形態素が単語に相当す

るものとみなすと、字幕の速度が NHK で 198、フジで 166 となり、速いものとなっている。

 また、福島、井上は、テレビのコマーシャル(CM)に付与された字幕の速度について実験を

し、CM 字幕の読みやすい速度として、1 分当たりの形態素数で、118 から 130 であると報告

している[8]。そこでは、形態素数の集計に句読点や字幕で使用される記号を除いている。同様

に、NHK およびフジの字幕データから句読点や記号を除いて、1 分間当たりの形態素数を計算

すると、それぞれ 173 と 153 となり、やはり読むには速い字幕表示となっていることがわかる。

5.地名に関する分析

 東日本大震災直後の緊急報道において、固有名詞(人名、地名、組織名など)が重要な情報

となっており、データ中に多く出現している。ここでは、その中でも特に多く出現している地

名(place name)について注目して、分析を行う。

 新聞記事やニュース記事から固有名詞をコンピュータのプログラムを使って、自動的に抽出、

つまり固有名詞がどこにあり、どんな種類のものであるかを特定する研究が米国および日本

で、1980 年代から 1990 年代にかけてコンピュータプログラムでの抽出精度を競うコンテスト

形式で行われた。アメリカでは、Message Understanding Conference (MUC)のもとに実施された。

MUC においては、固有名詞は、固有名 (Named Entity)と呼ばれ、コンテストを実施するに当

たり、固有名の詳細な定義が公開された。地名は、その中の 1 種類であった[4]。MUC6 のサイ

トにて詳しく公開されているが、固有名抽出は、Named Entity Recognition として、コンテスト

のタスクの 1 つとして位置づけられて、どのような場合に固有名を特定するかがタスクの内容

として詳細に定義されている。

 同様の研究が日本においても、その対象を日本語テキスト、新聞記事などのニュース記事

を対象に固有名を抽出するコンテストが行われた[3]。このコンテストは、Information Retrieval

and Extraction Exercise(IREX)と呼ばれた。固有名の定義については、IREX のサイトに掲載さ

れている。

 今回のデータには、単に県名や市町村名だけではなく、多くの種類の場所を表す表現が登場

しているが、MUC および IREX のルールを参考にして、以下の表現を地名とした。

Page 6: テレビの緊急報道番組に付与されたリアルタイム字 …テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

− 54 −

表 4 地名の区分と実例

区分 実例(実際にデータ中に出現したもの)地方名 東北地方県名 宮城県区市町村名 仙台市、涌谷町地域名 九十九里、外房港名 釜石港河川名 江戸川、名取川沖、湾名 三陸沖、仙台湾建物名 九段会館空港名 仙台空港駅名 新宿駅路線名 横浜線道路名 東富士五湖道路、八王子バイパスその他(1):上記以外の地域を示す表現 太平洋沿岸、インド洋その他(2): 本来組織名や施設名であるが場所とし

て使われているもの宮城県庁、NHK 仙台放送局、若林消防署、千葉製油所

 地名の特定にあたっての注意した事項を以下に記述する。

1. 区分「その他(2)」は、「宮城県庁付近では」などのように場所を示している場合に該当す

る。「横浜市消防局によりますと」などのように組織名が本来の組織名の意味で使われて

いる場合は、地名としていない。

    これに関連する事項が MUC6 の Named Entity Recognition Task の Guidelines に説明され

ている。そこでは、組織名(Organization Names)の定義において、大学名や施設名などが、

場所を示すものとして使われている場合は、Organization としないとしている。

“Miscellaneous types of proper names referring to facilities (e.g., factories, hotels,

universities, airports, hospitals, churches) will be tagged as ORGANIZATION unless

(1) the name is clearly the name of the structure/place and not of an organization,

or (2) the name is known to be the name of an organization but is used only in

reference to the facility as a structure/place. Some of the tagged strings may be

marked optional in the answer key if the annotator thinks that it’s highly unlikely (but

not inconceivable) that the name represents an organization.”[9]

   区分の「その他(2)」は、MUC6 の定義に沿っており、施設名である「千葉製油所」は、

施設名として扱わず地名としている。

2. 県名+市名などのように連続して表記されていて、前者が後者を含む関係となっている場

合は、その連続した地名は 1 つの地名とする。

Page 7: テレビの緊急報道番組に付与されたリアルタイム字 …テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

福   島   孝   博

− 55 −

  例「宮城県石巻市」

   これは、IREX の定義に従うものである。IREX では、連続固有表現について、次のように

定義している。

   「連続固有表現はそれぞれが独立した固有表現で、前のものが、後のもののスーパークラ

スになっている場合は分割しない。ただし、並列な固有表現が連続している場合にはそれ

らは分割する。また、部分的な並列表現で分割すると違った意味のものを生んでしまう場

合には分割しない。」[3]

  IREX では 1 地名の事例として「東京銀座」「中南米」などが紹介されている。

3. 2 つの地名が助詞「の」によって続けて現れる場合は、それらの地名は別個の扱いとし、2

つの地名とする。

  例「岩手県の釜石港」

  これも、IREX の定義に従うものである。

   IREX では、「助詞の「の」や特殊記号の「,.・/ (スペース)」等は固有表現を分割し、

いずれの固有表現もそれを含まない。ただし、慣用的にそのような物を含む表現や、人名

で苗字と名前を記号で継げるような場合には、それを含む。」としている[3]。

 NHK とフジのデータに出現した地名の総数は以下のとおりであり、地名が多く出現してい

ることがわかる。NHK 音声データでは、532 回出現しており、これを 1 分間当たりに換算する

と 8.85 回となり、6.78 秒に 1 回の割合で出現していることになる。この値からも地名を正確に

捉えることが、地震などの緊急報道では重要であることがわかる。

表 5 音声および字幕データの地名数

NHK フジ

音声 字幕 音声 字幕

地名数 532 462 420 340

 次に、その重要な地名情報がどれだけ正確に字幕化されているかを分析した。その正確さを

測る尺度として、情報検索の分野で使用されている適合率(Precision)と再現率(Recall)を利

用した。音声データにおける地名を正解とし、字幕データにおける地名を情報検索結果に見立

てる。すると、適合率と再現率は以下の式で表わされる。

    適合率 = 字幕データ中の正確な地名数 / 字幕データ中の地名の総数

    再現率 = 字幕データ中の正確な地名数 / 音声データ中の地名の総数

Page 8: テレビの緊急報道番組に付与されたリアルタイム字 …テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

− 56 −

 つまり、適合率では、字幕データ中の地名で、正確に地名として字幕化されたものの割合で

あり、再現率は、全地名数(音声データ中の地名の総数)に占める字幕データ中の正確な地名

の割合となる。また、適合率と再現率を統合する尺度として使われる F 値 (F-measures) も算出

した。F 値は、以下の式で計算される。

    F 値 = 2 x (再現率 x 適合率)/(再現率 + 適合率)

 これら、Precision, Recall, F-measures は、MUC で固有名抽出の評価尺度として採用され、

IREX においてもシステムの評価に用いられた。算出の結果は以下のとおりである。

表 6 地名の適合率、再現率と F値

NHK フジ

適合率 0.991 0.998

再現率 0.861 0.807

F 値 0.922 0.892

 適合率は、非常に高く問題はない。1.0 とならないのは、若干ではあるが、字幕中の地名が正

確な地名となっていないものがあったからである。一方、再現率を見ると、80% 台であり決し

て高いものではなく、音声データ中の地名は、8 割程度しか字幕化されていないことがわかる。

情報検索では、適合率と再現率は相反するものとして知られており、一方を高くするともう一

方が低くなる傾向がある。そこで、どちらかの精度を上げるよりも、それらの統合尺度である

F 値を高くすることが求められる。ここでは、適合率は問題のないレベルであるので、再現率

を高くすることが課題となる。今後どのようにして F 値を 1.0 に近づけるかが課題となる。

 今回のデータに出現した地名は、その出現箇所で大きく分けると、地震直後の震度に関する

情報、各地の津波と地震の被害に関する情報、空港、鉄道、道路に関する情報部分の 3 種類と

なる。震度に関する情報での地名は、県名、地域名が中心であり、被害に関する情報中の地名は、

特定の区分ではなく、「仙台湾」「名取川」「九段会館」「千葉製油所」などの種々の区分の地名

が登場し、空港、鉄道・道路の情報中では、空港名、鉄道の路線名、駅名、幹線道路名が現れ

ていた。今後、地名の字幕化の精度を上げるには、普段から緊急放送で扱われる情報に特化し

た地名の収集および準備、慣れが大切であるといえる。

6.今後の課題

 テレビ番組への字幕付与は、着実に進んできている。東日本大震災後の緊急報道番組におい

Page 9: テレビの緊急報道番組に付与されたリアルタイム字 …テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査

福   島   孝   博

− 57 −

ても、普段より多くの番組にて字幕が付与された。今回の調査では、その緊急報道番組での字

幕を調査し、分析した。緊急時ではあったが、概ね良好な字幕となっていたと言える。

 今後は、字幕制作の現場の状況を考えての字幕付与の効率化や、日本では、まだまだ普及し

ていないテレビコマーシャルへの字幕付与について研究を進める予定である。

参考文献[1] 視聴覚障害者向け放送普及行政の指針の概要,総務省,平成 19 年 10 月 30 日策定,  (http://www.soumu.go.jp/main_content/000030361.pdf), 2007.

[2] 福島孝博,東日本大震災に関するテレビ報道番組のリアルタイム字幕の分析,追手門学院大学国際教養学部紀要第 5 号,pp. 67-76,2012 年 1 月 .

[3] IREX(Information Retrieval and Extraction Exercise)固有表現抽出(Named Entity)  http://nlp.cs.nyu.edu/irex/NE/

[4] Message Understanding Conference 6, http://cs.nyu.edu/faculty/grishman/muc6.html, Named Entity Recognition  http://cs.nyu.edu/faculty/grishman/NEtask20.book_1.html

[5] 日本語形態素解析プログラム JUMAN (a User-Extensible Morphological Analyser for Japanese Ver 7.0). 2012. Department of Intelligence Science and Technology, Graduate School of Informatics, Kyoto University Kurohashi and Kawahara Laboratory.

[6] 福島孝博,テレビ生放送番組の字幕の評価に向けての基本調査,電子情報通信学会 信学技報 IEICE Technical Report HSC2011-27 pp. 1-4. 2011.

[7] Jensema, Carl. 1998. “Viewer Reaction To Different Television Captioning Speeds”. American Annals of the Deaf 143(4) pp. 318-324.

[8] 福島孝博,井上滋樹、テレビ CM のクローズド・キャプションによる字幕の有効性に関する研究④ −テレビ CM 字幕の表示速度と読みやすさに関する分析−,第 4 回国際ユニヴァーサルデザイン会議 2012 in 福岡,2012 年 10 月.

[9] MUC6 Named Entity Recognition Task Guidelines (Guidelines That Pertain Only to ORGANIZATION)  http://cs.nyu.edu/faculty/grishman/NEtask20.book_8.html#HEADING29

Page 10: テレビの緊急報道番組に付与されたリアルタイム字 …テレビの緊急報道番組に付与されたリアルタイム字幕および字幕中の地名に関する調査