22
1 ToBI (Tone and Break Indices) Тоны и показатели просодических швов (стыков, брейков)

T oBI (Tone and Break Indices) Тоны и показатели просодических швов (стыков, брейков)

  • Upload
    wirt

  • View
    60

  • Download
    4

Embed Size (px)

DESCRIPTION

T oBI (Tone and Break Indices) Тоны и показатели просодических швов (стыков, брейков). ToBI (1992-1996). - PowerPoint PPT Presentation

Citation preview

Page 1: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

1

ToBI

(Tone and Break Indices)

Тоны ипоказатели просодических

швов (стыков, брейков)

Page 2: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

2

ToBI (1992-1996)

Стандартная транскрипционная система для интонации американского варианта английского языка (AE), разработанная и протестированная международной группой исследователей (Silverman et al. 1992).

Цели стандартизации

• Создание единой теоретической и практической парадигмы для дальнейших научных исследований и технологических разработок, которая позволила ли бы разным лабораториям и рабочим коллективам интерпретировать и использовать накопленные данные по интонации английского языка в его главных вариантах (АЕ, АА, АB ).

• Создание ресурсов для разработки и использования он-лайновых баз данных с просодически размеченной и затранскрибированной речью.

Page 3: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

3

Вопросы для дальнейшего обсуждения

Теоретическая база системы ToBI

Иллюстративные примеры

Соглашения и инструкция для разметчиков;

Компьютерный инструментарий, примеры;

Структура разметочных файлов, совместимость;

Экспериментальная проверка работоспособности (валидности) системы;

Расширения парадигмы ToBI на другие языки – ToGI, ToDI, GRToBI, ToRI, + итальянский, испанский, арабский (каирский вар.).

Page 4: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

4

Теоретическая база системы ToBI

Общее направление – интонационная фонология, в ее рамках автосегментная тональная теория, метрическая теория.

1.    J. Pierrehumbert, 1980 – модель английской интонации1 ;

2.    M. Beckman & J. Pierrehumbert, 1986 - модель английской интонации;

3. J. Pierrehumbert. Tonal elements and their alignment, 2000 - модель английской интонации;

4. Goldsmith J., 1990 – общие вопросы автосегментной и метрической фонологии 2;

5.     Ladd D. R. (1983, 1996) – интерпретация явления даунстепа и тональный диапазон;

6.     Wightman C. et. al. – 1992 – интерпретация просодических стыков=швов;

7. Selkirk E. 1984, 1995 – метрическая теория и просодическое фразирование (формирование просодических составляющих).

1См.учебник «Общая фонетика» К&К; 2 К&К. Современная американская фонология.1См.учебник «Общая фонетика» К&К; 2 К&К. Современная американская фонология.

Page 5: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

5

J. Pierrehumbert. Tonal elements and their alignment, 1980 - 2000 - модель

английской интонации, АЕ

Из истории : 50-е годы ХХ в. – первые попытки фонологизации тональных явлений= интонации на материале АЕ.

• Признание автономной, супрасегментной фонетическойприроды интонации и ее отдельных элементов; слог - основное поле

реализации интонационных контрастов. Два подхода в в фонологической интерпретации интонации.

1. Trager. Smith, 1951, Pike, 1945 – декомпозиция тональных контуров в терминах 4 функционально значимых тональных уровней=уровневых тонов: L, LM, HM, H.

2. Bolinger (1951,1958), Британская фонет. школа + современные исследоваватели Liberman M. (1975), Ladd (1979).- декомпозиция контуров в терминах тональных движений- конфигураций .

Каждый подход имеет свои преимущества и недостатки.

Page 6: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

6

Современные модели J. Pierrehumbert и (1980-2000) и другие в той же парадигме - попытка интегрировать прежние подходы с учетом их недостатков.

Краткая характеристика модели • Базовый тональный контраст: H ~ L использование

верхней и нижней части голосового диапазона в качестве основных целевых зон (мишеней= targets) во всех тональных элементах системы битональная модель интонации.

Постулируется инвентарь из 6 фонологически разных тональных элементов: • Два простых L и H • Четыре сложных: L + H*, L* + H, H* + L, H+ L*Различаются по локализации во фразе и дискурсивной

функции (см. слайд 7).

    

L*, H*, L+H*, L*+H, H+L*, H*+L,

Page 7: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

7

Типы тональных элементов

Локализация

Прагматические дискурсивные Функции тон. элементов

(интонационных морфем)

H* Новая, фокусируемая И., добавляемая в общее инф. поле дискурса

L* Важная информация, но с сомнительным индексом доверия

L+H*

L*+H

И. , выбранная из небольшого числа альтернатив. причем L+H* кодирует также «добавь=add », а L*+H – «не добавляй» в общее инф. поле Д.

H+L*

ТА

H*+L

Акцентированный ударный слог слова ( маркер * )

Старая И. + инструкция идентифицировать связь передаваемой информации с информацией, кот. уже находится в общем информационном поле Д.

H- Фразовые (краевые ) тоны ФТ

L- после последнего акцентированного слога до конца промежуточной фразы

Граничные тоны H% конечные ГТ ГТ

L% Последний слог в интонационной фразы

Начальный ГТ ТТ

%Н Начальные слоги фразы

Дискурсивный статус просодической фразы в целом а не статус отдельных фокусируемых элементов фразы.

Page 8: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

8

Грамматика возможных интонационных структур английского языка (ИГ)

Интонационная структура (ИС) фразы = линейная последовательность фонологически значимых тональных элементов, ассоциированных с метрически сильными (акцентированными) слогами и границами просодических составляющих двух уровней иерархии (промежуточными и интонационными фразами) (сл. 10 ).

Грамматика, исчисляющая возможные ИС, = сеть из 3 возможных тональных состояний; любой путь через сеть порождает некоторую ИС (сл. 9).

Свойства порождаемых ИС: • Длина и сложность ИС. Фраза может иметь бесконечное к-во тональных

акцентов, это идеализация. Обычно акцентов 1 - 3, очень редко 5 . Но это ограничение не самой ИГ, а ритмометрики фразы: количество метрически сильных слогов в составляющей ограничивает кол-во тон. Акцентов в ней.

• Комбинаторика тональных элементов. Тональные акценты и граничные тоны не имеют принципиальных ограничений на комбинаторику, порождая 36 сложных тон. конфигураций в завершении фразы (сл.11). Но комбинаторика акцентов внутри одной и той же фразы имеет ограничения, как показывают исследования.

• Инвентарь нуклеарных и ненуклеарных тональных акцентов один и тот же.• Иерархия в ИС - Линейная последовательность тональных элементов,

организованных в иерархическую фразово-просодическую структуру. (сл.10)

Page 9: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

9

Интонационная порождающая грамматика

‘Х-’ ‘X%’ ‘X*’

Page 10: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

10

Линейно-иерархическая природа интонационной структуры предложения

Adelaide’s in South Australia and Sydney’s in New South Wales.

Page 11: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

11

Тональные конфигурации в завершении фразы

Тональные конфигурации в завершении фразы

ТА

ТА

Г Т

Page 12: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

12

Просодические тональные правила

1. Tone alignment rules = Постлексические правила выбора тональных элементов и их связывания с сегментным составом (слоговой последовательностью, представляющей высказывание). Связь ТА с акцентированными слогами мб объяснена общей организацией моторного контроля1.

2. Правила формирования ЧОТ-контура на основе данной ИС = реализационные правила тональной параметризации. Абстрактные тон. элементы ИС условно можно рассматривать как маршрут или схему движения в целевом ЧОТ-пространстве.

3. Есть два типа реализационных правил – таймирование и частотное шкалирование акустических событий, соотносимых с абстрактными тон. элементами. Учитывается не только исходная ИС, но и ряд других факторов – тон. диапазон фразы, взаимодействие тональных элементов, деклинационные тенденции и пр.Очень важны для автом. синтеза речи. См. э-библиотеку речевой группы ОТ и ПЛ.

Кривнова О.Ф.Генерация тонального контура фразы в системах автоматического синтеза речи // Диалог’2000 . С. 211-219.

КривноваО.Ф. Моделирование и синтез фразовой интонации на основе особых точек тонального контура // Диалог'97. М., 1997. C. 161-164.

 

1 это процесс, в кот. две руки становятся синхронизированы, если хлопать себя по голове и гладить живот одновременно.

1 это процесс, в кот. две руки становятся синхронизированы, если хлопать себя по голове и гладить живот одновременно.

Page 13: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

13

Иллюстративные примеры

[[Adelaide] [is in South Australia] ] - вверху H* H- H* L- L%

[[Adelaide] [is in South Australia?] ] - внизу H* H- L* H- H%

Page 14: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

14

[[Adelaide’s] [ in South Australia] ] - вверху H* H- H* H* L- H% [[Adelaide’s] [ in South Australia] ] H* H- H* H* H- L% 

Page 15: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

15[[Sydney isn’t in South Australia!] ] - внизу L*+H* L- H%

Page 16: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

16

ToBI Annotation Conventions (1992 )M. Beckman and J. Hirshberg

Соглашения и инструкция для разметчиков• Разметочная система ToBI обеспечивает для каждого• речевого высказывания следующую информацию:

цифровую запись звучания, ассоциированный ЧОТ-контур, собственно транскрипцию – маркеры (labels) для различных речевых событий в следующих 4 слоях (каналах):

1. Орфографический слой: w*ord 2. Тональный слой:TA; PhT; BT; !H; HiF0 3. Слой показателей просодических швов (стыков): 0,1,2,3,4-

числовой показатель фонетической выраженности словораздела;

4. Слой дополнительных комментариев (прочие события разного рода): паузы, речевые сбои, хезитации и пр.

Соглашения касаются как собственно транскрипционных файлов, так и компьютерного инструментария wavesTM , форматов речевых файлов и средств временной синхронизации разных информационных слоев.

Page 17: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

17

Компьютерный инструментарий, примеры;

• wavesTM - часть пакета ESPS (Entropic Speech Processing System, ОС Unix ) – Англия

• EMU Labeller – Австралия

• Pitchworks – SciConcord.com (сл.18, 19 + Demo)

• SA SIL ?

Page 18: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

18Рабочее окно разметчика PitchWorks

Page 19: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

19

Page 20: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

20

Структура разметочных файлов, чекеры, совместимость

wavesTM формат• Каждая строка в разметочном текстовом файле содержит несколько

полей, разделенных маркерами: field_1; field_2; field_3; field_4; field_5. С учетом содержания полей типичная строка в абстрактном виде

выглядит так::w(*)ord–tonal_marker$break_index@(time_stamp)(time_stamp); comment • В системе имеется чекер для проверки правильности состава и

структуры разметочных протоколов.

• Большинство работ с иcпользованием ToBI сделано с помощью инструментария wavesTM (ESPS) в среде Unix, в собственном формате. Для работы с ESPS-форматом, например, для изучения тренировочного материала по этой просодической разметке на сайте Ohio State Univ., под Windows требуется конвертер. См. сайт EMU-Австралия. Кроме традиционной формы разметки, EMU строит иерархическую просодическую аннотацию.

Мои данные об указанных сайтах на сегодняшний день устарели, поэтому здесь не приводятся.

Page 21: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

21

• Эксперимент по оценке валидности системы проводился с участием 26 разметчиков, на материале из 34 высказываний. По оценкам экспертов (Pitrelli et al. 1994) протоколы продемонстрировали хорошую согласованность работы экспертов при попарном сравнении протоколов с учетом транскрипционных символов на каждом слове.

• 88% согласования по наличию-отсутствию тонального маркера;

• 81 % по выбору определенного тонального маркера;• 92% согласования в пределах одного уровня фразирования

(членения) = разметки просодических швов;

• Полученный уровень согласования значительно выше, чем показывали предыдущие транскрипционные системы интонации , обеспечивает дальнейшее развитие в области создания и использования интонационных корпусов.

Экспериментальная проверка работоспособности (валидности) системы ToBI

Page 22: T oBI  (Tone and Break Indices) Тоны и показатели просодических швов  (стыков, брейков)

22

ЗаключениеОграничения ToBI Разработчики ToBI не утверждают, что система покрывает всё

содержание интонационного оформления речи. Имеющиеся слои относятся к наиболее значимым, по общему мнению, просодическим характеристикам речевых сообщений. Последний, 4-ый канал может использоваться для любой дополнительной информации, например, для наблюдений об экспрессивном использовании фонации.

Стандарт-ToBI разрабатывался под влиянием теорий для конкретного языка, но в ряде важных теоретических отношений он нейтрален.

Однако, не следует ожидать сходства тональных инвентарей и физического тождества тональных элементов в разных языках. В то же время , можно ожидать, что широкие типы тональных контрастов и тональных реализаций могут воспроизводиться в разных интонационных системах (аналогично с ситуацией в сегментной фонетике).

Это подтверждают попытки расширения парадигмы ToBI на другие языки – ToGI, ToDI, GRToBI, ToRi www.fon.hum.uva.nl/toriI, +шведский, итальянский, испанский, арабский (каирский вар.),

японский, китайский…..