Upload
wirt
View
60
Download
4
Tags:
Embed Size (px)
DESCRIPTION
T oBI (Tone and Break Indices) Тоны и показатели просодических швов (стыков, брейков). ToBI (1992-1996). - PowerPoint PPT Presentation
Citation preview
1
ToBI
(Tone and Break Indices)
Тоны ипоказатели просодических
швов (стыков, брейков)
2
ToBI (1992-1996)
Стандартная транскрипционная система для интонации американского варианта английского языка (AE), разработанная и протестированная международной группой исследователей (Silverman et al. 1992).
Цели стандартизации
• Создание единой теоретической и практической парадигмы для дальнейших научных исследований и технологических разработок, которая позволила ли бы разным лабораториям и рабочим коллективам интерпретировать и использовать накопленные данные по интонации английского языка в его главных вариантах (АЕ, АА, АB ).
• Создание ресурсов для разработки и использования он-лайновых баз данных с просодически размеченной и затранскрибированной речью.
3
Вопросы для дальнейшего обсуждения
Теоретическая база системы ToBI
Иллюстративные примеры
Соглашения и инструкция для разметчиков;
Компьютерный инструментарий, примеры;
Структура разметочных файлов, совместимость;
Экспериментальная проверка работоспособности (валидности) системы;
Расширения парадигмы ToBI на другие языки – ToGI, ToDI, GRToBI, ToRI, + итальянский, испанский, арабский (каирский вар.).
4
Теоретическая база системы ToBI
Общее направление – интонационная фонология, в ее рамках автосегментная тональная теория, метрическая теория.
1. J. Pierrehumbert, 1980 – модель английской интонации1 ;
2. M. Beckman & J. Pierrehumbert, 1986 - модель английской интонации;
3. J. Pierrehumbert. Tonal elements and their alignment, 2000 - модель английской интонации;
4. Goldsmith J., 1990 – общие вопросы автосегментной и метрической фонологии 2;
5. Ladd D. R. (1983, 1996) – интерпретация явления даунстепа и тональный диапазон;
6. Wightman C. et. al. – 1992 – интерпретация просодических стыков=швов;
7. Selkirk E. 1984, 1995 – метрическая теория и просодическое фразирование (формирование просодических составляющих).
1См.учебник «Общая фонетика» К&К; 2 К&К. Современная американская фонология.1См.учебник «Общая фонетика» К&К; 2 К&К. Современная американская фонология.
5
J. Pierrehumbert. Tonal elements and their alignment, 1980 - 2000 - модель
английской интонации, АЕ
Из истории : 50-е годы ХХ в. – первые попытки фонологизации тональных явлений= интонации на материале АЕ.
• Признание автономной, супрасегментной фонетическойприроды интонации и ее отдельных элементов; слог - основное поле
реализации интонационных контрастов. Два подхода в в фонологической интерпретации интонации.
1. Trager. Smith, 1951, Pike, 1945 – декомпозиция тональных контуров в терминах 4 функционально значимых тональных уровней=уровневых тонов: L, LM, HM, H.
2. Bolinger (1951,1958), Британская фонет. школа + современные исследоваватели Liberman M. (1975), Ladd (1979).- декомпозиция контуров в терминах тональных движений- конфигураций .
Каждый подход имеет свои преимущества и недостатки.
6
Современные модели J. Pierrehumbert и (1980-2000) и другие в той же парадигме - попытка интегрировать прежние подходы с учетом их недостатков.
Краткая характеристика модели • Базовый тональный контраст: H ~ L использование
верхней и нижней части голосового диапазона в качестве основных целевых зон (мишеней= targets) во всех тональных элементах системы битональная модель интонации.
Постулируется инвентарь из 6 фонологически разных тональных элементов: • Два простых L и H • Четыре сложных: L + H*, L* + H, H* + L, H+ L*Различаются по локализации во фразе и дискурсивной
функции (см. слайд 7).
L*, H*, L+H*, L*+H, H+L*, H*+L,
7
Типы тональных элементов
Локализация
Прагматические дискурсивные Функции тон. элементов
(интонационных морфем)
H* Новая, фокусируемая И., добавляемая в общее инф. поле дискурса
L* Важная информация, но с сомнительным индексом доверия
L+H*
L*+H
И. , выбранная из небольшого числа альтернатив. причем L+H* кодирует также «добавь=add », а L*+H – «не добавляй» в общее инф. поле Д.
H+L*
ТА
H*+L
Акцентированный ударный слог слова ( маркер * )
Старая И. + инструкция идентифицировать связь передаваемой информации с информацией, кот. уже находится в общем информационном поле Д.
H- Фразовые (краевые ) тоны ФТ
L- после последнего акцентированного слога до конца промежуточной фразы
Граничные тоны H% конечные ГТ ГТ
L% Последний слог в интонационной фразы
Начальный ГТ ТТ
%Н Начальные слоги фразы
Дискурсивный статус просодической фразы в целом а не статус отдельных фокусируемых элементов фразы.
8
Грамматика возможных интонационных структур английского языка (ИГ)
Интонационная структура (ИС) фразы = линейная последовательность фонологически значимых тональных элементов, ассоциированных с метрически сильными (акцентированными) слогами и границами просодических составляющих двух уровней иерархии (промежуточными и интонационными фразами) (сл. 10 ).
Грамматика, исчисляющая возможные ИС, = сеть из 3 возможных тональных состояний; любой путь через сеть порождает некоторую ИС (сл. 9).
Свойства порождаемых ИС: • Длина и сложность ИС. Фраза может иметь бесконечное к-во тональных
акцентов, это идеализация. Обычно акцентов 1 - 3, очень редко 5 . Но это ограничение не самой ИГ, а ритмометрики фразы: количество метрически сильных слогов в составляющей ограничивает кол-во тон. Акцентов в ней.
• Комбинаторика тональных элементов. Тональные акценты и граничные тоны не имеют принципиальных ограничений на комбинаторику, порождая 36 сложных тон. конфигураций в завершении фразы (сл.11). Но комбинаторика акцентов внутри одной и той же фразы имеет ограничения, как показывают исследования.
• Инвентарь нуклеарных и ненуклеарных тональных акцентов один и тот же.• Иерархия в ИС - Линейная последовательность тональных элементов,
организованных в иерархическую фразово-просодическую структуру. (сл.10)
9
Интонационная порождающая грамматика
‘Х-’ ‘X%’ ‘X*’
10
Линейно-иерархическая природа интонационной структуры предложения
Adelaide’s in South Australia and Sydney’s in New South Wales.
11
Тональные конфигурации в завершении фразы
Тональные конфигурации в завершении фразы
ТА
ТА
Г Т
12
Просодические тональные правила
1. Tone alignment rules = Постлексические правила выбора тональных элементов и их связывания с сегментным составом (слоговой последовательностью, представляющей высказывание). Связь ТА с акцентированными слогами мб объяснена общей организацией моторного контроля1.
2. Правила формирования ЧОТ-контура на основе данной ИС = реализационные правила тональной параметризации. Абстрактные тон. элементы ИС условно можно рассматривать как маршрут или схему движения в целевом ЧОТ-пространстве.
3. Есть два типа реализационных правил – таймирование и частотное шкалирование акустических событий, соотносимых с абстрактными тон. элементами. Учитывается не только исходная ИС, но и ряд других факторов – тон. диапазон фразы, взаимодействие тональных элементов, деклинационные тенденции и пр.Очень важны для автом. синтеза речи. См. э-библиотеку речевой группы ОТ и ПЛ.
Кривнова О.Ф.Генерация тонального контура фразы в системах автоматического синтеза речи // Диалог’2000 . С. 211-219.
КривноваО.Ф. Моделирование и синтез фразовой интонации на основе особых точек тонального контура // Диалог'97. М., 1997. C. 161-164.
1 это процесс, в кот. две руки становятся синхронизированы, если хлопать себя по голове и гладить живот одновременно.
1 это процесс, в кот. две руки становятся синхронизированы, если хлопать себя по голове и гладить живот одновременно.
13
Иллюстративные примеры
[[Adelaide] [is in South Australia] ] - вверху H* H- H* L- L%
[[Adelaide] [is in South Australia?] ] - внизу H* H- L* H- H%
14
[[Adelaide’s] [ in South Australia] ] - вверху H* H- H* H* L- H% [[Adelaide’s] [ in South Australia] ] H* H- H* H* H- L%
15[[Sydney isn’t in South Australia!] ] - внизу L*+H* L- H%
16
ToBI Annotation Conventions (1992 )M. Beckman and J. Hirshberg
Соглашения и инструкция для разметчиков• Разметочная система ToBI обеспечивает для каждого• речевого высказывания следующую информацию:
цифровую запись звучания, ассоциированный ЧОТ-контур, собственно транскрипцию – маркеры (labels) для различных речевых событий в следующих 4 слоях (каналах):
1. Орфографический слой: w*ord 2. Тональный слой:TA; PhT; BT; !H; HiF0 3. Слой показателей просодических швов (стыков): 0,1,2,3,4-
числовой показатель фонетической выраженности словораздела;
4. Слой дополнительных комментариев (прочие события разного рода): паузы, речевые сбои, хезитации и пр.
Соглашения касаются как собственно транскрипционных файлов, так и компьютерного инструментария wavesTM , форматов речевых файлов и средств временной синхронизации разных информационных слоев.
17
Компьютерный инструментарий, примеры;
• wavesTM - часть пакета ESPS (Entropic Speech Processing System, ОС Unix ) – Англия
• EMU Labeller – Австралия
• Pitchworks – SciConcord.com (сл.18, 19 + Demo)
• SA SIL ?
18Рабочее окно разметчика PitchWorks
19
20
Структура разметочных файлов, чекеры, совместимость
wavesTM формат• Каждая строка в разметочном текстовом файле содержит несколько
полей, разделенных маркерами: field_1; field_2; field_3; field_4; field_5. С учетом содержания полей типичная строка в абстрактном виде
выглядит так::w(*)ord–tonal_marker$break_index@(time_stamp)(time_stamp); comment • В системе имеется чекер для проверки правильности состава и
структуры разметочных протоколов.
• Большинство работ с иcпользованием ToBI сделано с помощью инструментария wavesTM (ESPS) в среде Unix, в собственном формате. Для работы с ESPS-форматом, например, для изучения тренировочного материала по этой просодической разметке на сайте Ohio State Univ., под Windows требуется конвертер. См. сайт EMU-Австралия. Кроме традиционной формы разметки, EMU строит иерархическую просодическую аннотацию.
Мои данные об указанных сайтах на сегодняшний день устарели, поэтому здесь не приводятся.
21
• Эксперимент по оценке валидности системы проводился с участием 26 разметчиков, на материале из 34 высказываний. По оценкам экспертов (Pitrelli et al. 1994) протоколы продемонстрировали хорошую согласованность работы экспертов при попарном сравнении протоколов с учетом транскрипционных символов на каждом слове.
• 88% согласования по наличию-отсутствию тонального маркера;
• 81 % по выбору определенного тонального маркера;• 92% согласования в пределах одного уровня фразирования
(членения) = разметки просодических швов;
• Полученный уровень согласования значительно выше, чем показывали предыдущие транскрипционные системы интонации , обеспечивает дальнейшее развитие в области создания и использования интонационных корпусов.
Экспериментальная проверка работоспособности (валидности) системы ToBI
22
ЗаключениеОграничения ToBI Разработчики ToBI не утверждают, что система покрывает всё
содержание интонационного оформления речи. Имеющиеся слои относятся к наиболее значимым, по общему мнению, просодическим характеристикам речевых сообщений. Последний, 4-ый канал может использоваться для любой дополнительной информации, например, для наблюдений об экспрессивном использовании фонации.
Стандарт-ToBI разрабатывался под влиянием теорий для конкретного языка, но в ряде важных теоретических отношений он нейтрален.
Однако, не следует ожидать сходства тональных инвентарей и физического тождества тональных элементов в разных языках. В то же время , можно ожидать, что широкие типы тональных контрастов и тональных реализаций могут воспроизводиться в разных интонационных системах (аналогично с ситуацией в сегментной фонетике).
Это подтверждают попытки расширения парадигмы ToBI на другие языки – ToGI, ToDI, GRToBI, ToRi www.fon.hum.uva.nl/toriI, +шведский, итальянский, испанский, арабский (каирский вар.),
японский, китайский…..