386
井英

JChatman

  • Upload
    deeanaf

  • View
    589

  • Download
    5

Embed Size (px)

Citation preview

Page 1: JChatman

CHILDES Manual for Japanese

Edited By Revised By

Yuriko Oshima-Takane Hidetosi Sirai (白井英俊)

Susanne Miyata (宮田 Susanne)

Brian MacWhinney Norio Naka (中 則夫)

June 1995 August 1998

McGill University The JCHAT Project

This project was supported by a grant from the Japan Foundation.

The revision editors are supported by Mombusho Grant-in-Aid for Scienti�c Research (C)10134462 1997{1999.

Page 2: JChatman

目 次

第一版のまえがき | 「日本語のための CHILDESマニュアル」の出版にむけて ix

Adapting the CHILDES System for Japanese Language Studies : : : : : : : : : : : : : : : : : : : : xiii

改訂版の刊行にあたって xxiii

第 1章 トランスクリプト作成の方法 1

1.1 トランスクリプト作成の原則 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1

1.1.1 トランスクリプトのコンピュータ・ファイル化による新しい可能性 : : : : : : : : : : : 1

1.1.2 用心すべきこと : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 2

1.1.3 転記とコーディング : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 3

第 2章 表記システム CHAT 5

2.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 5

2.2 データ表記システムの目標 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 6

2.2.1 明確さ : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 6

2.2.2 読みやすさ : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 7

2.2.3 入力のしやすさ : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 7

2.3 CHATシステムの上手な使い方 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 8

2.3.1 minCHAT : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 8

2.3.2 midCHAT : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 8

2.3.3 maxCHAT : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 9

2.3.4 どのように表記するか迷ったとき : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 9

2.3.5 データ入力に無駄な時間を使わない方法 : : : : : : : : : : : : : : : : : : : : : : : : : : 10

2.4 minCHAT : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 10

2.4.1 ファイルが満たすべき形式 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 10

2.4.2 発話が満たすべき形式 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 12

2.4.3 データ情報ファイル (documentation �le) : : : : : : : : : : : : : : : : : : : : : : : : : : 14

2.4.4 ファイル形式のチェック : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 15

2.5 JCHATと minJCHAT : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 15

2.5.1 ファイルが満たすべき形式 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 16

2.5.2 発話が満たすべき形式 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 16

第 3章 ローマ字表記:ヘボンと訓令 21

3.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 21

3.1.1 日本語のローマ字表記:ローマ字の綴り方の歴史 : : : : : : : : : : : : : : : : : : : : : : 21

3.1.2 訓令式ローマ字:ヘボン式、日本式との相違 : : : : : : : : : : : : : : : : : : : : : : : : 22

3.1.3 ローマ字の綴り方:訓令式そえがきとヘボン式表記 : : : : : : : : : : : : : : : : : : : : : 25

JCHATローマ字表記ルールと適用例 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 26

i

Page 3: JChatman

第 4章 ファイル・ヘッダー 33

4.1 不可欠のヘッダー : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 33

4.2 変更のないヘッダー : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 34

4.3 変更可能なヘッダー : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 35

第 5章 分かち書き 39

5.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 39

5.2 学校文法における「分かち書き」 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 39

5.3 JCHATにおける「分かち書き」:基本的合意事項 : : : : : : : : : : : : : : : : : : : : : : : : : : 40

第 6章 語をどのように転記するか 45

6.1 言語習得者が使う独自の語 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 45

6.2 聞き取りにくい語 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 47

6.3 省略・脱落した部分 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 48

6.4 固定した表現 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 49

6.5 文字・数字など : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 50

6.5.1 文字 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 50

6.5.2 頭字語 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 50

6.5.3 数字 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 50

6.5.4 方言 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 51

6.5.5 バイリンガル・データ : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 51

第 7章 メイン・ラインに形態素をどのように表記するか 53

7.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 53

7.2 形態素分析:オプショナル : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 53

7.2.1 形態素化のためのコード : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 53

7.2.2 接頭辞と接尾辞 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 54

7.2.3 角括弧の中に形態素を記入する置き換え記号 (Replacement Symbol) : : : : : : : : : : 56

7.2.4 用言の形態素分析 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 56

動詞の活用の種類:学校文法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 56

ローマ字表記に基づく南式分析 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 58

森川式形態素分析方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 62

第 8章 発話の区切り方と調子単位 73

8.1 基本的な終端記号 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 73

8.2 調子単位の表記の仕方 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 73

8.2.1 発話の終端部での調子単位 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 73

8.2.2 発話中での調子単位 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 74

8.3 コンマの使い方 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 74

8.4 休止と持続 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 75

8.5 特殊な終端記号 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 75

8.6 発話の区切り方 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 76

8.6.1 繰り返し : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 77

8.6.2 列挙 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 78

ii

Page 4: JChatman

第 9章 語内の韻律 79

9.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 79

9.1.1 強勢の表記法 (英語など) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 79

9.1.2 音節の長音化 (英語) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 80

9.1.3 音節間の間断 (英語) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 80

9.2 日本語のアクセントの特徴と表記の試み : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 80

9.2.1 モーラ・音節、語の長音化 (日本語) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 81

9.2.2 モーラ・音節間の間断 (日本語) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 81

第 10章スコープ記号 83

10.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 83

10.2 ポスト・コード : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 87

第 11章ディペンデントティア 89

11.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 89

11.2 標準的なディペンデントティア : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 89

11.3 独自のディペンデントティアを作る : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 93

11.4 同時関係 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 93

11.5 コードスイッチングとボイススイッチング : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 94

第 12章日本語のためのUNIBET 97

12.1 UNIBETとは : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 97

12.2 日本語の UNIBET表 (第 1版) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 98

第 13章日本語のためのエラー・コーディング 101

13.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 101

13.2 言い誤りの定義 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 102

13.2.1 収集方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 103

13.2.2 コーディングの形態 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 103

第 14章 JCHATファイルの具体例 109

14.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 109

14.2 複雑さの異なるファイルの例 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 109

14.3 ヘボン式ローマ字表記による JCHATフアイルの例 : : : : : : : : : : : : : : : : : : : : : : : : 113

14.4 訓令式ローマ字表記のファイルの例 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 118

14.5 仮名ファイル、仮名漢字ファイルの例 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 120

第 15章 JCHAT記号一覧表 127

第 16章 CLANエディターによる入力 133

16.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 133

16.2 データの入力 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 133

16.3 スピーカーコードの登録と短文登録:マクロ作成 : : : : : : : : : : : : : : : : : : : : : : : : : : 135

16.3.1 方法 1:スピーカーコードの登録 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 135

16.3.2 方法 2:マクロ短文登録 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 136

16.4 保存と終了 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 137

16.5 編集 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 137

16.6 作業ディレクトリー (フォルダー)の作り方 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 137

iii

Page 5: JChatman

16.7 CHECKプログラム : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 138

16.8 仮名ファイルの入力 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 138

第 17章日本語のスクリプト : 文字体系 141

17.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 141

17.2 文字の起源 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 141

17.2.1 漢字 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 141

17.2.2 ひらがな・カタカナ : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 142

17.2.3 ローマ字 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 143

17.2.4 JCHATのローマ字表記 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 143

17.3 現代日本語の文字使用 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 144

17.4 おわりに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 145

第 18章 CHILDESのデータベース 147

第 19章 CLAN チュートリアル 167

19.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 167

19.2 CLAN に慣れる : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 167

19.2.1 Macintoshに CLAN をインストールする : : : : : : : : : : : : : : : : : : : : : : : : : 167

19.2.2 Windowsに CLAN をインストールする : : : : : : : : : : : : : : : : : : : : : : : : : : 168

19.2.3 CLAN を起動する : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 169

19.2.4 ディレクトリを設定する : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 169

19.2.5 CLAN コマンド : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 169

19.2.6 リダイレクション (ファイルの書き出し指定) : : : : : : : : : : : : : : : : : : : : : : : : 170

19.2.7 シェルコマンド : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 171

19.2.8 オンラインヘルプ : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 172

19.2.9 CLAN のテスト : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 172

19.2.10バグリポート : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 172

19.2.11プログラム改良へのリクエスト : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 173

19.2.12日本語対応および国内サポート : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 173

19.3 CLAN チュートリアル : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 174

19.3.1 コマンドを直接入力する : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 178

19.3.2 ワイルドカード : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 178

19.3.3 出力ファイル : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 179

19.3.4 代表的な5つのコマンドの練習 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 180

19.3.4.1 FREQ : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 180

19.3.4.2 MLU : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 181

19.3.4.3 COMBO : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 182

19.3.4.4 KWAL : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 183

19.3.4.5 GEM : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 183

第 20章 CLANエディター 185

20.1 エディターモード : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 185

20.1.1 File, Edit, Font メニュー : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 185

20.1.2 検索 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 186

20.1.3 キーボードコマンド : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 186

20.1.4 ティアメニュー : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 186

iv

Page 6: JChatman

20.1.5 ティア除外のしかた : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 186

20.1.6 エディター内で CHECK を使用する : : : : : : : : : : : : : : : : : : : : : : : : : : : : 187

20.2 特殊文字とキーボード : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 187

20.2.1 ローマン文字セット : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 187

20.2.2 非ローマンスクリプト : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 187

20.2.3 フォントの設定 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 188

20.3 エディター設定とオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 188

20.4 モード切り替え : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 189

20.5 Sonic CHAT : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 190

20.6 Sonic作成モード : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 190

20.7 Sonic 再生モード : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 191

20.8 ビデオモード : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 192

20.9 候補選択モード : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 192

20.10コーダーモード : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 192

20.10.1コードの入力 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 193

20.10.2コードファイルの作り方 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 194

第 21章 CHECK | データの表記法のチェック 197

21.1 CHECKの動作 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 197

21.2 dep�le.cutの作成 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 197

21.3 CHECKを走らせる : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 198

21.4 CHECKを使うためのヒント : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 199

21.5 CHECKのオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 199

第 22章 COMBO | ブール関数を用いた検索 201

22.1 検索文字列の指定方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 201

22.2 検索文字列の例 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 202

22.3 ファイルに収めた検索文字列を参照する場合 : : : : : : : : : : : : : : : : : : : : : : : : : : : : 203

22.4 COMBO におけるクラスターペア : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 203

22.5 クローズメイトの検索方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 203

22.6 文末にある単語の検索方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 204

22.7 ファイルの最初にある語の検索方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 204

22.8 除外する文字列の追加 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 204

22.9 COMBO を使った分析範囲の制限のしかた : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 205

22.10COMBOのオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 205

第 23章 FREQ | 出現頻度計算 209

23.1 FREQが無視するもの : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 209

23.2 特定の語彙を計算する場合 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 209

23.3 FREQ とワイルドカードの併用のしかた : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 209

23.4 FREQ の出力先の指定方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 211

23.5 FREQ の適用を制限する方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 212

23.6 共用されている語彙を調べる : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 213

23.7 FREQのオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 214

23.8 FREQMERG | FREQ の出力ファイルを結合する : : : : : : : : : : : : : : : : : : : : : : : 214

v

Page 7: JChatman

第 24章 KWAL | キーワードと行 217

24.1 KWAL の適用を制限する方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 217

24.2 KWALのオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 218

第 25章MLU | 平均発話長 219

25.1 MLUのデフォルト : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 219

25.2 MLUを走らせてみよう : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 220

25.3 MLUと MLTでの発話の取り込みと除去 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 220

25.4 MLUのオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 221

第 26章 CLANプログラムの共通オプション 223

26.1 オプション機能の説明 (アルファベット順) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 223

26.2 検索用のメタキャラクタ : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 229

第 27章 CLANのいろいろなプログラム 231

27.1 CHAINS { インタラクションコードの追跡 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 231

27.1.1 例題の実行 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 232

27.1.2 CHAINSのオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 235

27.2 CHIP | インタラクションの分析 | Je� Sokolov : : : : : : : : : : : : : : : : : : : : : : : : : 236

27.2.1 ティア作成システム : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 236

27.2.2 コード化システム : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 237

27.2.3 語彙クラス分析 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 238

27.2.4 総合統計 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 239

27.2.5 CHIPのオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 241

27.3 CHSTRING | ファイル内の文字列変換 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 242

27.4 COOCCUR | 共起分析 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 244

27.5 DIST | コードや単語間の距離 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 244

27.6 DSS | 文発達指標 (Developmental Sentence Score) : : : : : : : : : : : : : : : : : : : : : : : 245

27.6.1 CHAT ファイル形式に関する条件 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 245

27.6.2 50発話分のコーパスの選択 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 245

27.6.3 DSS の自動計算 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 246

27.6.4 対話モードによる計算 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 246

27.6.5 DSS 出力 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 247

27.6.6 DSS サマリー : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 248

27.6.7 DSSのオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 250

27.7 GEM | 必要な部分にタグをつける : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 250

27.7.1 GEMを使った分析範囲の制限のしかた : : : : : : : : : : : : : : : : : : : : : : : : : : : 252

27.7.2 GEMのオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 252

27.8 GEMFREQ | 行動の種類による出現頻度計算 : : : : : : : : : : : : : : : : : : : : : : : : : : 252

27.9 GEMLIST | ファイル内の GEM 分布の一覧 : : : : : : : : : : : : : : : : : : : : : : : : : : 253

27.10 KEYMAP | 偶然性の分析 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 254

27.10.1KEYMAPの実行例 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 254

27.10.2KEYMAPオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 255

27.11 MAXWD | 文字列の長さを計算 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 255

27.12 MLT | 平均ターン長 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 256

27.12.1MLTのデフォルト : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 256

27.12.2実行例 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 257

vi

Page 8: JChatman

27.12.3MLTのオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 257

27.13MODREP | ティア間の単語一致検索 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 258

27.13.1分析への取り込みと除外 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 259

27.13.2%mod 行の使い方 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 259

27.13.3MODREP と COMBO | ティア間での COMBO 応用 : : : : : : : : : : : : : : : : : 260

27.13.4MODREPのオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 260

27.14MOR | 形態素解析 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 261

27.14.1MORオプション : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 262

27.14.2MOR辞書 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 263

27.15PHONFREQ | 音韻頻度分析 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 263

27.16RELY | コードの信頼性を測定 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 264

27.17SALTIN | SALT 形式のファイルを変換 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 265

27.18STATFREQ | 統計分析を出力 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 265

27.19TEXTIN | 構造化されていないテクストを CHATに変換する : : : : : : : : : : : : : : : : : 266

27.20TIMEDUR | ポーズと重複の計量 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 267

27.21WDLEN | 単語長のグラフ : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 267

第 28章ユーティリティ|便利なツール 269

28.1 COLUMNS { CHAT ファイルのコラム表示化 : : : : : : : : : : : : : : : : : : : : : : : : : : : 269

28.2 DATES | 年齢と日付の計算 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 271

28.3 FLO | メインラインを簡素にする : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 271

28.4 LINES | 行番号を挿入 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 271

28.5 MAKEDATA |他のプラットフォームのためのファイルの作成 : : : : : : : : : : : : : : : : : 271

第 29章WAKACHI98

| 分かち書きガイドライン 273

29.1 まえがき : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 273

29.2 品詞一覧表 | Word Class List : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 274

29.2.1 名詞 | Nouns : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 275

29.2.2 動作名詞|Verbal Nouns : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 276

29.2.3 ナ形容詞 (形容動詞)| Nominal Adjectives : : : : : : : : : : : : : : : : : : : : : : : : : 277

29.2.3.1 ナ形容詞活用 | Nominal Adjective In ection : : : : : : : : : : : : : : : : : 277

29.2.4 イ形容詞 | Adjectives : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 278

29.2.4.1 イ形容詞活用 | Adjective In ection : : : : : : : : : : : : : : : : : : : : : : : 279

29.2.5 形容詞・連体詞 | Adnominals : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 279

29.2.6 動詞|Verbs : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 279

29.2.6.1 母音動詞 (v:v) | Vowel Verbs : : : : : : : : : : : : : : : : : : : : : : : : : : 279

29.2.6.2 母音動詞活用 | Vowel Verb In ection : : : : : : : : : : : : : : : : : : : : : : 280

29.2.6.3 子音動詞 (v:c) | Consonant Verbs : : : : : : : : : : : : : : : : : : : : : : : 281

29.2.6.4 子音動詞活用 | Consonant Verb In ection : : : : : : : : : : : : : : : : : : : 281

29.2.6.5 変異動詞 (v:ir) | Irregular Verbs : : : : : : : : : : : : : : : : : : : : : : : : 282

29.2.6.6 変異動詞活用 | Irregular Verb In ection : : : : : : : : : : : : : : : : : : : : 282

29.2.7 複合動詞・テ型複合動詞 | Compound Verbs : : : : : : : : : : : : : : : : : : : : : : : 285

29.2.8 判定詞・助動詞 | Copula and Auxiliaries : : : : : : : : : : : : : : : : : : : : : : : : 286

29.2.8.1 助動詞 (v:aux) | Auxiliaries : : : : : : : : : : : : : : : : : : : : : : : : : : : 286

29.2.8.2 判定詞 (v:cop) | Copula : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 286

vii

Page 9: JChatman

29.2.8.3 判定詞活用 | Copula In ection : : : : : : : : : : : : : : : : : : : : : : : : : 287

29.2.9 副詞 | Adverbs : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 288

29.2.10擬声擬態語 | Onomatopoeia : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 288

29.2.11幼児語|Motherese : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 289

29.2.12疑問詞|Question Words : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 289

29.2.13不定詞|Inde�nite Demonstratives : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 290

29.2.14指示名詞 (こそあ)|Demonstratives : : : : : : : : : : : : : : : : : : : : : : : : : : : : 291

29.2.15指示形容詞 (こそあ) | Demonstrative Adjectives : : : : : : : : : : : : : : : : : : : : 291

29.2.16数詞|Numerals : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 292

29.2.17格助詞 | Case Particles : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 293

29.2.18提題助詞 | Topic Particles : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 294

29.2.19取立助詞 | Focus Particles : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 294

29.2.20終助詞 | Final Particles : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 295

29.2.21接続助詞 | Conjunctive Particles : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 296

29.2.22接続詞|Conjunctions : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 297

29.2.23接尾辞・接頭辞 | Su�xes and Pre�xes : : : : : : : : : : : : : : : : : : : : : : : : : : 298

29.2.24助数辞 | Classi�ers : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 299

29.3 一覧表 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 300

29.3.1 幼児語 | Motherese : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 300

29.3.2 挨拶用語一覧表 | Greetings : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 301

29.3.3 肯否定語・間投詞・感動詞一覧表 | Communicators : : : : : : : : : : : : : : : : : : : 302

29.3.4 擬音語・擬態語 | Onomatopoeic Words : : : : : : : : : : : : : : : : : : : : : : : : : 303

29.4 品詞コード|JMOR Word Class Codes : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 314

29.4.1 形態素コード : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 314

29.4.2 JMOR形態素コード | JMOR Morpheme Codes : : : : : : : : : : : : : : : : : : : : : 316

第 30章第一版のあとがき|JCHATプロジェクト:組織、活動、今後の課題 319

第 31章改訂版のあとがき 323

付 録A 記録、電子化、書き起こしの技法 327

A.1 記録のための技法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 327

A.2 録音機材 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 327

A.3 書き起こしのための機材 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 328

A.4 音声のデジタル化 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 328

A.5 ビデオのデジタル化 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 329

付 録B 日本語マニュアルと英語マニュアルの対照表 333

付 録C Wakachi98用レファレンス 337

viii

Page 10: JChatman

第一版のまえがき| 「日本語のためのCHILDESマニュアル」の出版にむけて

大嶋百合子自然な会話場面における子供の自発的な発話に基づいて、その発達過程をたどっていく言語発達研究は、デー

タ収集とその文字化に膨大な時間がかかるため、従来、一人とか二人というような少数のケースに基づく研究

しかできなかった。この限界を打開し、言語発達研究が真の科学として発展していくのに不可欠な三つの手段

の開発を提唱したのが、コンピュータを利用した国際的な言語データ共有システムCHILDES(Child Language

Data Exchange System)プロジェクトである。つまり、

1. 世界中の研究者がこつこつと収集したデータをコンピュータ化しお互いに共有できるような国際的な言語

データ共有システムをつくる。

2. 言語データをコンピュータに共通の方式で入力するためのフォーマットを開発する。

3.コンピュータ化した言語データを自動的に分析するプログラムを開発する。

というのが、CHILDESの三つの最大目標である。1984年にカーネギーメロン大学の Brian MacWhinneyと

ハーバード大学の Catherine Snowの両氏を中心にして確立されて以来、年々CHILDESに提供されるデータ

は増大し、分析プログラムも研究者のニーズにあわせて続々開発され、欧米の言語発達研究の中心的役割を果

たしている。

また、CHILDESは、いわゆる言語発達研究者だけでなく、社会言語学、失語症や言語障害、外国語学習など

の研究者の間でも広く利用されている。最近のコンピュータの飛躍的な進歩を背景に言語データをコンピュー

タ化するシステムやグループが CHILDES以外にも出現しているが、CHILDESほど、広く利用されている言

語データ共有システムはないといっても過言ではないであろう。

「日本語のデータが集まらずに困っている。CHATの日本語版の開発を手伝ってもいいと思っているのだが」

とMacWhinney氏に言われたのは、1992 年の 12月末のことだ。私自身は、CHILDESの入力方式と分析プロ

グラムが始めて使用可能になった 1988 年から英語の発話データの転記と分析に使用していた。近い将来、日

本の子供の発話データを収集して、英語を話すカナダの子供のデータと比較したいと思っていたが、日本にお

ける子供の発話データの状況は、全くわからなかった。また、CHILDESを使用している研究者の状況もわか

らなかった。そこで、「どういう状況なのか日本の研究者にコンタクトしてもいいですよ。」と、引き受けて始

まったのが、JCHAT Japanese CHILDESプロジェクトである。「日本には、たぶん 10人ぐらい CHATを使っ

ている研究者がいると思うが、誰からも連絡がない。日本の研究者は閉鎖的ではないか。」と MacWhinney氏

にいわれて、日本の研究者がそういふうに見られているのは、非常に残念な気がして、そうでないことを示さ

ねばという気持も大きく働いたのだと思う。反響は意外と大きく、翌年の 4月末には、電子メールや郵便で送っ

たアンケートに対する回答が 15人を超え、1993年 5月初旬に JCHATグループとして名乗りをあげてからは、

メンバー数は雪だるま式に増え、現在では、北米、ヨーロッパ、オーストラリア、日本のメンバーをあわせる

と、80人を超す大所帯となった。

CHILDESのデータベースには、現在、英語を始め全部で 22カ国語の発話データが収められているが、日本

語のデータは、このプロジェクトが開始するまでは、デンマーク大学の林真理子氏により提供されたデンマー

ク語と日本語のバイリンガルの子供のデータ以外は、皆無であった。アンケート調査 から日本語の入力ファ

ix

Page 11: JChatman

イルを作る方法が確立していないことがその主な原因であることが判明したので、1993年 5月に JCHATプ

ロジェクトとして発足して以来、日本語の入力方式の開発が本プロジェクトの活動の中心となっている。愛知

淑徳短期大学の宮田 Susanne氏が、ヘボン式ローマ字を使用して、また、ハーバード大学の南雅彦氏は訓令式

ローマ字を使用して、既に日本語の発話データを入力しておられたので、両方式を叩き台にして、電子メール

で CHATの日本語版の開発のためのディスカッションが行われた。特に、6月にカンザス大学の森川尋美氏が

電子メールネットワークのマネージャーを引き受けてくださってからは、宮田 (愛知淑徳短期大学)、南 (ハー

バード大学)、中 (大阪学院大学)、森川 (カンザス大学)、松岡 (コネチカット大学)、MacWhinney(カーネーギー

メロン大学)の各氏と私 (マッギル大学)の 7人の JCHATメンバーの間で毎日のように活発なディスカッショ

ンが行われた。この電子メールのディスカションでこのマニュアルの原型ができあがったといってもよいだろ

う。その 8月に日本に一時帰国した時には、11、12日の 2日間、大津由紀雄氏の主催で、慶応義塾大学で日本

の有志メンバーと第一回 JCHAT会議を開いた。電子メールで話し合われた問題を整理し、CHATの日本語版

JCHATの最小限必要な基準 minJCHATの合意事項をはじめ、ローマ字表記、単語の表記の仕方、日本語の

音韻表記UNIBET、分かち書きや形態素分割など様々な問題が話し合われた。また、プロジェクトとしてどう

進めて行くか、助成金はどのように調達するかなど、管理面の問題も話し合われ、JCHATプロジェクトの原

型ができあがったといえよう。この会議に出席されたメンバーのうち、特に、大津由紀雄 (慶応義塾大学)、佐

野けい子 (慶応義塾大学)、栗山容子 (国際其督教大学)、岩立志津夫 (静岡大学)、寺尾康 (常葉学院短期大学)、

宮田 Susanne(愛知淑徳短期大学)、中則夫 (大阪学院大学)、小椋たみ子 (神戸大学)の各氏には、それ以後も、

日本在住の有志メンバーとしていろいろな形でこのプロジェクトのために貢献していただいている。

この JCHAT会議以後もメンバー有志によりマニュアル作成の準備が続けられたが、1994年 7月より 1995

年 6月までの一年間の日本国際交流基金の助成により、日本語の発話データのローマ字による入力方式の開発

とその解説書の出版のための活動が軌道にのった。その活動の一貫として、1994年 8月 9日から 11日まで、

宮田、大野、両氏の主催で、愛知淑徳短期大学で第二回 JCHAT会議が 開かれ、日本語のマニュアルの編集会

議、及び、日本語のデータを入力する予定の会員向けの小講習会が行われた。編集会議には、各章の担当者を

はじめ、コメンターとして大津、佐野、岩立、大野、小椋、の各氏が参加された。マニュアルについては、当

初は日本語だけに適用される基準、ルールだけを補遺のような形でまとめる予定であったが、第一回 JCHAT

会議で日本語に適用される基準、ルールだけでなく、CHAT、CLAN、データベースのすべてについて、日本

語による簡単な解説書がほしいという要望がでた。

幸い国際交流基金から、マニュアル出版のための編集会議と出版費を含めた研究助成が出たので、大嶋、

MacWhinneyの共同編集で、英語のマニュアルの全内容を取り入れた、独立したマニュアルとして出版するこ

とになった。

マニュアルの構成と使い方

マニュアルは入力方式の解説に焦点をあわせた第 1部と CLAN分析プログラムおよびその使い方を解説し

た第 2部からなる1。CHILDESにおさめられたデータベースは膨大なので、今回は時間の関係上、簡単に一

覧表の形にまとめて、第 19章2に含めた。また、あとがきに、JCHATプロジェクトの組織、活動、今後の課

題をまとめた。このまえがきに続けて、共同編集者であるMacWhinney氏により、CHILDESプロジェクトの

歴史、理念、活動、将来、および、言語発達研究における CHILDESプロジェクトと JCHATプロジェクトの

意義がわかりやすくまとめられている。このマニュアルを利用する方には、必ず読んでいただきたい。第 1章

から第 18章までの入力方式に関する解説は、著者の方々に、日本語のデータを入力することを念頭において

解説するようにしていただいた。従って、英語のマニュアルの内容にもとづいていても、章によっては、構成

も、内容も、解説の仕方もかなり違う。たとえば、このマニュアルの第 2章にまとめられているminJCHATの

ルールは、日本語だけにあてはまる基本的合意事項で、プロジェクト発足当初の電子メールのディスッカショ

1これは第一版のマニュアルの話であり、改訂版では二部だてをとっていない。また第二部に相当する部分は時間の関係上、かなり割愛せざるをえなかった。

2本書では 18 章に収録してある。

x

Page 12: JChatman

ンをまとめたもので、英語のマニュアルにはない内容である。もちろん、minJCHAT以外の部分は、英語のマ

ニュアルの第 2章「The CHAT transcription system」にそって解説されている。

第 6章の「語をどのように転記するか」に含まれている様々なリストは、宮田氏が日本語のデータを入力す

るために既に作成していたリストを、電子メールディスカッションに基づいて追加、改訂したものである。バ

イリンガルデータを扱っている研究者の便宜をはかって、バイリンガルデータの表記の仕方についても、この

章の最後に簡単にまとめられてあるが、これは、英語のマニュアルの第 4章「Transcribing Words」には含ま

れていない内容である。

第 7章「メインラインに形態素をどのように表記するか」の南式、森川式は、南、森川、各氏が、それぞれ

の理論、立場にもとづいて日本語の用言に焦点をあてて JCHAT用に開発していただいたものである。JCHAT

メンバーの要請にこたえて、いわゆる、学校文法に基づく形態素分割についても、南氏にまとめていただい

た。発話を語に分かち書きするのは、JCHATの基本合意事項で、日本語のデータの入力の際に皆さんにまもっ

ていただきたいルールだが、さらに形態素に分割するかどうかは、オプショナルである。JCHATとしては、

CHILDESと同様に、どれか一つの理論や立場にたってガイドラインを出すのではなく、どういう立場の研究

者でも、それぞれの研究の目的に従って形態素分割をすることができるような手だてを提供することにつとめ

た。従って、理論的立場によって異なる用言の形態素分割は、必ず自動置き換え括弧の中だけで行うことにし、

括弧の中の形態素分割は自由とした。その適用例として、学校文法方式、南式、森川式の 3つの方式を紹介し

ているが、どの方式もまだ、開発途上で、今後、修正される可能性もある。実際の発話データを一つの方法で誤

りなく一貫して形態素に分割するということはかなり、難しい作業である。現在、中氏が、MacWhinney氏と

協力して日本語のための自動形態素分割プログラム JMORを開発中である3。これが、実用化されると、一貫

した信頼性のある形態素分割が短時間で可能になり、特に、発達の指標として平均発話長 (MLU: Mean Length

of utterance)を計算するのが目的の研究者には、強力な手段となるであろう。もちろん、計算されたMLUが

果たして日本語の発達の指標として妥当かどうかということは、今後、日本語の発達研究者がデータに基づい

て明らかにしていかなければならい課題である。

第 9章の「語内の韻律」では、英語にはない、日本語特有のアクセントの記号化の試みが行われている。第

12章の「日本語のための UNIBET」は、電子メールのディスカッションで話し合われた内容をふまえて寺尾氏

にまとめていただいた。英語のマニュアルの第 10章「UNIBETs」に、他の言語の UNIBET表といっしょに

寺尾氏の日本語の UNIBET表がのっているが、本マニュアルのように詳しい解説がついていない。UNIBET

の応用編ともいえる第 13章の「日本語のためのエラーコーディング」も、寺尾氏の幅広い日本語の言い誤り

のデータをもとに JCHAT用にまとめていただいた。従って、エラー・コーディングに使用される記号とその

説明以外は、英語のマニュアルの第 12章「error coding」と対応しない。

第 14章の「JCHATの具体例」では、異なるタイプのファイルを紹介し、それぞ れのファイルに使用され

ている CHAT/JCHATの記号の説明を加えた。記号の使い方は、具体的なファイルでどういう目的で、どのよ

うに使われているか見るのが、一番わかりやすいのではないかと、これまでの経験から判断したからである。

これは、英語のマニュアルにはない試みである。

一方、日本語特有の問題を扱うために、英語のマニュアルにはない章も加えた。たとえば、第 3章の「ロー

マ字表記」、第 5章の「分かち書き」、第 17章の「JCHANGE」、第 18章の「日本語のスクリプト:文字体系」

などがそれにあたる。ローマ字表記に関しては、ヘボン式にするか訓令式にするかで電子メールでもかなり議

論された問題だが、最終的には、中氏が、CLANプログラム CHSTRINGを利用してヘボン式と訓令式の相互

変換ができるファイル JCHANGEを作成、どちらかの方式を一貫して使えば、どちらのローマ字表記でもよ

いことになった。また、仮名表記からローマ字表記の変換ファイルも加えられ、仮名表記による入力も可能に

なった。この JCHANGEの使い方については、第 17章にわかりやすくまとめられている。また、ローマ字表

記については、第 3章に、ローマ字の歴史とともに、JCAHTで採用されたヘボン式と訓令式の両方式がまと

められている。なお、第 18章に、漢字仮名を使用した日本語のデータの入力方式が近い将来開発されるのを

期待して、日本語の複雑な文字体系について簡単に解説をした「日本語のスクリプト:文字体系」も加えられ

3その成果の一部が本書の 29 章である。

xi

Page 13: JChatman

た。また、初心者の便宜を考えて、CHILDES専用につくられたエディターの使い方をやさしく解説した第 16

章の「CEDによる入力」も加えた4。

その他の章 (第 1章、第 4章、第 8章、第 10章、第 11章、第 15章)は、だいたい、英語のマニュアルのそ

れぞれ対応する章にしたがって、まとめられている。ただし、日本語のためのマニュアルなので、できる限り

日本語の例文を使用した。

第 2部の CLAN分析プログラムの解説は、中氏に、英語のマニュアルにそってまとめていただいた5。当初

の予定では、日本語の例を使って、使いやすいものを作りたいと考えていたが、第 1部の入力編の準備に時間

がかかり、今回は、CLAN分析プログラム編の準備に十分時間をかけることができなかった。ただし、内容に

関しては、中氏が、自らテストして解説をしているので、正確である。

CHILDES入力方式であるCHAT/JCHATをはじめて利用する初心者は、第 2章の「表記システムのCHAT」、

第 5章の「分かち書き」と、第 14章の「JCHATファイルの具体例」を読んで、第 16章の「CEDによる入

力」に従って簡単なファイルをまず入力することをすすめる。もちろん、ローマ字を使用する場合は、ヘボン

式か、訓令式のどちらかに決めなければいけないので、第 3章の「ローマ字表記:ヘボンと訓令」を読む必要

がある。そして、できあがったファイルに、第 2部の解説を頼りに、平均発話長を計算するMLUや単語の頻

度計算をする FREQのような基本的な分析プログラムをかけてみよう。CHAT/JCHATや CLANは、このよ

うにまず、使ってみないと、解説書に書いてあることが、なかなかピンとこない。使ってみて、ある程度、イ

メージできたら、他の章を読もう。実際に、録音された発話データを転記する場合は、発話の流れをどのよう

に区切ったらよいか迷うことがしばしばある。第 8章の「発話の区切り方」に簡単なガイドラインがまとめて

あるので、参考にするとよいだろう。また、第 1章の「トランスクリプト作成の方法」に、転記する際に注意

すべきことがまとめられているので、ぜひ読んでいただきたい。第 6章の「語をどのように転記するか」に紹

介されている様々なリストは、実際に転記する時におおいに役に立つはずだ。あとは、研究の目的に従って、

他の章も必要があれば読みすすんでほしい。

英語のマニュアルの単なる翻訳ではなく、日本語のための CHILDESのマニュアルをつくるということは、

予想以上にたいへんな作業だった。各章担当者および編集者が、日本、米国、カナダと分散していたため、電

子メールやファクッスに頼って進めていかなければならなかったからである。編集者としては、マニュアルと

いう性格上、第 1部の第 1章から第 18章までは、内容が正確であること、分かりやすいことを第一に、英語

のマニュアルに照らし合わせてチェックして、必要があれば著者に何度も書きなおしていただいた。それでも、

思い違いや、見過ごして、まだ、間違いがあるかもしれない。また、各章の調整や、用語の統一が、時間的に

余裕がなく十分できなかった。これについては、今回、解決がつかなかった問題といっしょに、利用者の皆さ

んのご批判を待ってから、改訂版の出版の時に改善できればと考えている。このマニュアルの出版をきっかけ

に、できるだけ多くのメンバーの方々に一日も早く入力作業を開始していただいて、日本語のデータベースの

構築を推進して行っていただきたいと考えている。

謝辞

このマニュアルを作るにあたって、直接、間接に大勢の方々の援助を受けた。まず、忙しい中を貴重な時間

をさいて、このマニュアルのために執筆してくださった著者の方々に、謝意を表したい。また、編集の過程で、

共同執筆を快く引き受けて下さった岩立志津夫、中則夫、寺尾康の各氏、データベースの一覧表を作成するの

を快く引き受けて下さった小椋たみ子氏、また、草稿を読んでコメントをして下さった方々に謝意を表したい。

特に、分かち書きと形態素の章については、佐野けい子氏に、終始、ていねいに草稿を読んでいただき貴重

なコメントをいただいた。この一番難しい章を担当し、最後まで直し続けて下さった著者の南雅彦、森川尋美、

両氏と佐野けい子氏に心から謝意を表したい。松岡和美氏は、第一回 JCHAT 会議のために電子メールのディ

スカションで話し合われた内容をまとめる作業を手伝ってくださった。その後、博士論文の研究で忙しく、積

極的に活動に参加していただけないが、JCHAT発足当時の協力者の一人である。ここに、謝意を表したい。静

4改訂版では第一版の第 17 章は割愛し、第 16 章は多少修正を加えてある。5改訂版では第 2 部を割愛し、19章以降を中氏と宮田氏に付け加えていただいた。

xii

Page 14: JChatman

岡大学の岩立志津夫氏は、さまざまなフォーマットで準備された原稿を統一したフォーマットに直してマニュ

アルとしてまとめて下さった。岩立氏の協力のおかげで、内容的な編集に専念することができた。ここに、心

から感謝の意を表したい。また、中則夫氏は、大阪学院大学に就職されたばかりの忙しい時にもかかわらず、

CLAN分析プログラムの執筆を快く引き受けて下さった。中氏が引き受けて下さらなければ、今回、第一部と

共に出版することができなかったであろう。ここに、謝意を表したい。このプロジェクトは、1994年 7月より

1995年 6月までの一年間、国際交流基金日本研究リサーチ会議助成プログラムの援助を受けた。この助成がな

ければ、日本語のための独立したマニュアルとして出版することはできなかったであろう。ここに謝意を表し

たい。最後に、このマニュアルの編集を引き受けてから、週末に仕事をするのを許してくれた家族の協力に心

から感謝したい。

Adapting the CHILDES System for Japanese Language Studies

Brian MacWhinney

The publication of this new manual for the transcription of Japanese language transcripts is an impor-

tant and welcome event. Although chapters of the CHILDES manual have been translated into Dutch,

French, Italian, Portuguese, and Spanish, this is the �rst complete translation of all the core materials of the

CHILDES system. This translation of the system into Japanese is all the more important because it comes

at a time when Japanese researchers are striving to build a solid, new database that is representative of the

acquisition of Japanese at a variety of ages and across a variety of contexts.

Of all the major languages included in the CHILDES database, Japanese is perhaps the one that can

most advance the crosslinguistic study of child language acquisition (Slobin, 1985a; Slobin, 1985b). The

grammatical structure of Japanese provides important data on a wide range of acquisitional issues from

both a formalist (Lust & Wakayama, 1979; Mazuka, 1991) and a functionalist perspective (Clancy, 1985;

Kuno, 1972). The development of the semantics of reference and discourse (Clancy, 1981; Hinds, 1980)

in Japanese contrasts in many interesting ways (Kamio, 1994) with corresponding structures in European

languages. The study of the acquisition of literacy in Japanese o�ers a markedly di�erent perspective on

reading and language disorders (Makita, 1968; Stevenson et al., 1982; Watamori & Sasanuma, 1978). And

the study of Japanese-English bilingualism in both children and adults promises to teach us a great deal

about the processing of both languages (Ito & Tahara, 1985; Kilborn & Ito, 1989). But perhaps the most

interesting crosscultural comparisons of all are those that relate the shape of early language acculturation

in Japanese with the ways in which children are socialized into language in the West (Oshima-Takane et al.,

1982; Oshima-Takane & Muto, 1993).

These crosslinguistic comparisons can tell us a great deal about the ways in which society and the human

mind constrain and facilitate the acquisition of language. But if we are to realize the great potential of

the study of Japanese child language, we will need to improve our techniques for crosslinguistic comparison

and we will need to dramatically expand the shape and size of the Japanese database. This core database

must focus on the primary evidence regarding language learning that children provide in the context of

naturalistic interactions. Much can be learned by using experiments and standardized tests to evaluate a

child's language abilities, but research cannot end with formal evaluations and experiments. Eventually we

need to look at the rich and complex patterns of conversational interactions where \he rubber hits the road"

and the child engages in the real-life use of language. To do this, we need to observe, record, and analyze

spontaneous language samples. However, the study of spontaneous language samples involves an enormous

time commitment to data collection, transcription, and analysis.

xiii

Page 15: JChatman

The CHILDES system was constructed to address these needs. The system includes a wide variety of

programs and codes that have been extensively applied to all of the core problems in language acquisition

research (Higginson & MacWhinney, 1990; Higginson & MacWhinney, 1994; MacWhinney, 1991a; MacWhin-

ney, 1991b; MacWhinney, 1993; MacWhinney, 1994a; MacWhinney, 1994b; MacWhinney, 1994c; MacWhin-

ney, 1995; MacWhinney & Snow, 1985; MacWhinney & Snow, 1990; MacWhinney & Snow, 1992). Linked

to this system of programs and codes, is an extensive database of transcripts from 22 di�erent languages.

Included in the database are data from normally-developing children, children with language disorders, adult

aphasics, second language learners, and early childhood bilinguals. Although the largest number of users of

the CHILDES system comes from the child language research community, the system is also used extensively

by students of child language disorders, aphasia, second language learning, computational linguistics, literacy

development, narrative structures, and adult sociolinguistics.

In order to understand more deeply the reasons for the creation of this database, we need to trace over

the key developments in the study of language learning. I will examine these events in terms of �ve major

periods of language observation that range from studies of the rulers of ancient times to the the most recent

computational breakthroughs.

The Five Periods of Language Observation

Period 1: Pharoahs and Philosophers. The observational study of language development has a long

and interesting history. The �rst attempt to study language development was conducted by the Egyptian

pharoah Psammeticus. This study was documented by the Greek historian Herodotus in his Histories.

Psammeticus was involved in a dispute with the king of Phrygia regarding whether the original human

language was Egyptian or Phrygian. To settle the dispute, Psammeticus decided to entrust two speechless

infants to the care of shepherd who was given instructions never to speak to the boys, but to wait until

the children had uttered their �rst words without assistance from any other human being. Eventually, the

shepherd returned to the Pharoah and reported that the boys had indeed uttered their �rst word and that

it was \bekos". Since this was the Phrygian word for \bread" the Pharoah was forced to grant the greater

antiquity of Phrygian. He apparently never considered the possibility that the sound \bek" might be an

excellent imitation of the bleating of sheep. Quite possibly, the boys had decided to learn the language of the

sheep, since at least the animals were willing to talk with them. Experiments of this type would hardly pass

through our modern Human Subject review committees. Moreover, they involved only the most primitive

observational techniques. All the shepherd had to do in this case was to record a single word.

A few centuries later we see a more elaborate attempt at naturalistic observation in a remarkable passage

from St. Augustine, who reported in his Confessions that he remembered how he had learned language:

This I remember; and have since observed how I learned to speak. It was not that my elders

taught me words (as, soon after, other learning) in any set method; but I, longing by cries and

broken accents and various motions of my limbs to express my thoughts, that so I might have my

will, and yet unable to express all I willed or to whom I willed, did myself, by the understanding

which Thou, my God, gavest me, practise the sounds in my memory. When they named anything,

and as they spoke turned towards it, I saw and remembered that they called what they would

point out by the name they uttered. And that they meant this thing, and no other, was plain

from the motion of their body, the natural language, as it were, of all nations, expressed by

the count- enance, glances of the eye, gestures of the limbs, and tones of the voice, indicating

the a�ections of the mind as it pursues, possesses, rejects, or shuns. And thus by constantly

hearing words, as they occurred in various sentences, I collected gradually for what they stood;

xiv

Page 16: JChatman

and, having broken in my mouth to these signs, I thereby gave utterance to my will. Thus I

exchanged with those about me these current signs of our wills, and so launched deeper into the

stormy intercourse of human life, yet depending on parental authority and the beck of elders.

Augustine's fanciful recollection of his own language acquisition remained the high water mark for child

language studies through the Middle Ages and even the Enlightenment.

Period 2: Baby biographies. The second period of child language studies was stimulated by the

enormous impact of Charles Darwin. By using notecards and �eld books to track the distribution of hundreds

of species and subspecies in places like the Galapagos and Indonesia, Darwin was able to collect an impressive

body of naturalistic data in support of his views on natural selection and evolution. In his study of gestural

development in his son, Darwin showed how these same tools for naturalistic observation could be adopted

for the study of human development. By taking detailed daily notes, Darwin showed how researchers could

build baby biographies documenting virtually any aspects of human development. Following on Darwin's

lead, scholars such as Ament, Preyer, Gvozdev, Szuman, Stern, Ponyori, Kenyeres, and Leopold created

monumental baby biographies detailing the development of their own children. Perhaps the most imaginative

of these projects were those initiated by Szuman in Krakow just before and after World War II, combining

�lm, drawings, and language samples to gain full pictures of the development of language and personality.

Period 3: Transcripts. The limits of the baby biography were always quite apparent. Even the most

highly trained observer cannot keep pace with the rapid ow of speech that emerges between children and

their caretakers. Instead, observers end up focusing on a few cute words or interesting sounds or phrases,

rather than larger features such as discourse and narrative. The emergence of the taperecorder in the 1950

's provided a way around these limitations and ushered in the third period of child language studies. This

period was characterized by multi-investigator projects which collected large datasets of taperecordings. As

long as there was su�cient funding available, these tapes were transcribed either by hand or by typewriter.

Typewritten copies were reproduced by dittomaster, stencil, or mimeograph. Comments and tallies were

written into the margins of these copies and new, even less legible copies were then made by thermal

production of new dittomasters. Every investigator devised a project-speci�c system of transcription and

project-speci�c codes.

The single most important study of this third period was the study of the development of Adam, Eve, and

Sarah conducted by Brown (1973) and his students. It was Brown who initiated the idea of data-sharing by

allowing dittoed copies of his entire corpus to be shipped to other researchers. In some cases, these other

investigators (e.g. Moerk, 1983) attempted to disprove the conclusions drawn from those data by Brown

himself. By exposing his work to this type of critical examination, Brown secured a lasting preeminent

stature in the child language �eld. However, the dissemination of mimeographed and photocopied transcript

data also cast a spotlight on the weak underbelly of our analytic techniques in language acquisition research.

As we began to compare hand-written and typewritten transcripts, problems in transcription methodology,

coding schemes, and cross-investigator reliability became more apparent.

Period 4: Computers. Just as these new problems were coming to light, a major technological opportu-

nity was emerging in the shape of the powerful, a�ordable microcomputer. Microcomputer word-processing

systems and database programs allowed researchers to enter transcript data into computer �les which could

then be easily duplicated, edited, and analyzed by standard data-processing techniques. The possibility of

utilizing shared transcription formats, shared codes, and shared analysis programs shone at �rst like a faint

glimmer on the horizon, against the fog and gloom of handwritten tallies, fuzzy dittoes, and idiosyncratic

coding schemes.

In 1984 a meeting of 16 researchers in child language and language disorders formally launched the

CHILDES system. The initial focus of the CHILDES project was on the collection of a non-standardized

xv

Page 17: JChatman

database of computerized corpora. As the database grew, it soon became apparent that researchers needed

more than a disparate set of corpora transcribed in a confusing diversity of styles. They needed a consistent

set of standards both for the analysis of old data and for the collection and transcription of new corpora. The

CHILDES system addressed these needs by developing three separate, but integrated, tools. The �rst tool

was the database itself, the second tool was the CHAT transcription and coding format, and the third tool

was the CLAN package of analysis programs. By 1991, the basic shape of these three tools was completed.

The full system is presented in detail in this manual and illustrated through practical examples in Sokolov

and Snow (1994). Researchers who plan to make use of the CHILDES tools will want to consult both of

these resources.

Period 5: Connectivity. Since 1981, when the CHILDES Project was �rst conceived, the world of

computers has gone through a series of remarkable revolutions, each introducing new opportunities and

challenges. The processing power of the home computer now dwarfs the power of the mainframe of the

0's, new machines are now shipped with built-in audiovisual cabilities, and devices such as CD-ROM's,

DAT tapes, and optical disks o�er enormous storage capacity at reasonable prices. More importantly,

microcomputers all across the world are now connected with each other through a global high-speed network

that supports the movement of all sorts of information, including text, sound, and video. Sitting in my o�ce

at Carnegie Mellon, I can retrieve pictures, sounds, and text from dozens of sites across Japan in seconds.

The implications of this type of connectivity for the development of a scienti�c database are enormous. This

connectivity between computers is also matched by an increasing interactivity between the operating system

and individual programs. The user can record a sound in one program, take it immediately to another for

detailed acoustic analysis, and then to a third for database storage.

In this �fth period of observational analysis, the CHILDES plans to make use of these new patterns of

connectivity. But, before we outline our plans for the future, we need to explain to the reader the detailed

shape of the tools that are currently available.

The Database

The �rst major tool in the CHILDES workbench is the database itself. Through CD-ROM or FTP,

researchers now have access to the results of nearly a hundred major research projects in over a dozen

languages across the last 25 years. Using this database, a researcher can directly test a vast range of

empirical hypotheses against either this whole database or some logically de�ned subset.

The database includes a wide variety of language samples from a wide range of ages and situations. Target

speakers include children with language impairments, adults with aphasia, second language learners, and

bilingual children. Most importantly, almost all of the data represent real spontaneous interactions in natural

contexts, rather than some simple list of sentences or test results. Although more than half of the data come

from English speakers, there is also a signi�cant component of non-English data. All of the major corpora

have been formatted into the CHAT standard and have been checked for syntactic accuracy. The total size of

the database is now approximately 160 million characters (160 MB). The corpora are divided into six major

directories: English, non-English, narratives, books, language impairments, and bilingual acquisition. In

addition to the basic texts on language acquisition, there is a database from the Communicative Development

Inventory (Dale, Bates, Reznick & Morisset, 1989) and a bibliographic database for Child Language studies

(Higginson & MacWhinney, 1990).

Membership in CHILDES is open. Members are listed in a standard database and receive electronic mes-

sages through the [email protected] electronic bulletin board. In order to be o�cially included

in the info-childes electronic mailing list and database, researchers should send email to [email protected]

xvi

Page 18: JChatman

with their computer address, postal address, a�liations, and phone number. Users are asked to abide by

the rules of the System. In particular, they should abide by the stated wishes of the contributors of the

data and should acknowledge all uses of the data and the programs. Any article that uses the data from a

particular corpus must cite a reference from the contributor of that corpus. The exact reference is given in

the CHILDES manual (MacWhinney, 1991b). In addition, researchers should cite the 1991 version of the

manual, since this allows us to track references in the literature.

All of the CHILDES materials can be obtained without charge by anonymous FTP to poppy.psy.cmu.edu

in Pittsburgh and atila-ftp.uia.ac.be in Antwerp. The procedure for transferring �les and programs

depends on the type of machine you are using and the type of �les you wish to retrieve. It is best to always

set binary mode for transfer. The data �les are combined into larger �les using the tar program and you

will need to obtain that program to extract them. If you are not familiar with the details of the process of

transfer using FTP, it is best to get help from someone more familiar with the process.

For users without access to the InterNet, as well as for those who want a convenient way of storing the

database, we have published (MacWhinney, 1993) a CD-ROM in High Sierra format which can be read

by Macintosh, UNIX, and MS-DOS machines which have a CD-ROM reader. The disk contains the whole

database, the programs, and the CHILDES/BIB system. One directory contains the materials in Macintosh

format and the other contains the materials in UNIX/DOS format. The CD-ROM, the printed manual,

and the research guide are available at nominal cost through Lawrence Erlbaum Associates, 365 Broadway,

Hillsdale NJ 07642 and the phone number for orders is (201) 666-4110.

CHAT

All of the �les in the database use a standard transcription format called CHAT. This system is designed

to accommodate a large variety of levels of analysis, while still permitting a barebones form of transcription

when additional levels of detail are not needed. The system is grounded on three basic principles.

1. Each utterance is transcribed as a separate entry in the system. Even in cases when a speaker continues

for several utterances, we ask the transcriber to enter each new utterance on a new line. This is

important, since it greatly facilitates the matching of additional information to the \main line".

2. Coding information is separated out from the basic transcription and placed on separate \dependent

tiers" below the main line. The CHILDES manual presents coding systems for phonology, speech acts,

speech errors, morphology, and syntax. The user can created additional coding systems to serve special

needs.

3. On the main line, the main goal of the transcription is to enter a set of standard language word forms

that correspond as directly as possible to the forms produced by the learner. Of course, learner forms

di�er from the standard language in many ways and there are a wide variety of techniques in the CHAT

system for notating these divergences, while still maintaining the listing of word forms to facilitate

computer retrieval.

One of the main goals of the current Japanese version of the CHILDES manual is the formulation of

speci�c rules for the transcription of Japanese.

CLAN

For the last few years, the main emphasis of new developments in the CHILDES system has been on the

writing of new computer programs. Currently, there are two major components of the CHILDES programs.

xvii

Page 19: JChatman

The �rst is the set of programs for searching and string comparison called clan (Child Language Analysis).

The second is a set of facilities built up around an editor called CED (CHILDES Editor). The editor can

play a particularly important role in supporting the inclusion of Japanese data in full Kana script.

Let us �rst take a look at the capabilities of the clan programs. These programs have been designed to

support four basic types of linguistic analysis (Crystal, 1982; Crystal, Fletcher & Garman, 1989): lexical

analysis, morphosyntactic analysis, discourse analysis, and phonological analysis.

Lexical analyses. The programs for lexical analysis focus on ways of searching for particular strings.

The strings to be located can be entered in a command line, one at a time, or put together in a master

�le. The strings can contain wild cards and words can be combined using Boolean operators such as \and"

\not" and \or". Together, these various capabilities give the user virtually complete control over the nature

of the patterns to be located, the �les to be searched, and the way in which the results of the search should

be combined into �les or even reduced into data fro statistical analysis. Scores of studies have appeared in

the published literature using these techniques to track the development of lexical �elds, such as morality,

kinship, gender terminology, mental states, causative verbs, and modal auxiliaries. It is also possible to track

words of a given length or a given lexical frequency.

Morphosyntactic analyses. Many of the most important questions in child language require the de-

tailed study of speci�c morphosyntactic features and constructions. Typically, this type of analysis can be

supported by the coding of a complete %mor line in accord with the guidelines speci�ed in Chapter 14 of

the CHILDES Manual. Once a complete %mor tier is available, a vast range of morphological and syn-

tactic analyses become possible. However, hand-coding of a %mor tier for the entire CHILDES database

would require perhaps twenty years of work and would be extremely error-prone and non-correctable. If the

standards for morphological coding changed in the middle of this project, the coders would have to start

over again from the beginning. It would be di�cult to imagine a more tedious and frustrating task | the

hand-coder's equivalent of Sisyphus and his stone.

To address this problem, we have built an automatic coding program for CHAT �les, called mor. Although

the system is designed to be transportable to all languages, it is currently only fully elaborated for English,

Japanese, Dutch, and German. The Japanese implementation of mor has been designed by Norio Naka at

the Osaka Gakuin University. The language-independent part of mor is the core processing engine. All of

the language-speci�c aspects of the systems are built into �les which can be modi�ed by the user. In the

remarks that follow, we will �rst focus on ways in which a user can apply the system for English. The

mor program takes a CHAT main line and automatically inserts a %mor line together with the appropriate

morphological codes for each word on the main line. Although you can run mor on any CLAN �le, in order

to get a well-formed %mor line, you often need to engage in signi�cant extra work. In particular, users of

mor will often need to spend a create deal of time engaging in the processes of lexicon building and ambiguity

resolution. To facilitate lexicon building, there are several options in mor to check for unrecognized lexemes

and to add new items. To facilitate ambiguity resolution, we have integrated a system for sense selection

into the CED editor.

Construction of a full %mor line using mor also makes possible several additional forms of analysis. One is

the automatic running of the dss program which computes the Developmental Sentence Score pro�le of Lee

(1974). Parallel systems of analysis will eventually be developed for systems such as IPSYN (Scarborough,

1990) or LARSP (Crystal et al., 1989). The %mor line can also be used as the basis for CLAN programs

such as cooccur which examines local syntactic structures and chip which examines recasts, imitations, and

structural reductions.

Discourse and narrative. The most important CLAN tool for discourse analysis is the system for data

coding inside the CED editor. CED provides the user with not only a complete text editor, but also a

systematic way of entering user-determined codes into dependent tiers in CHAT �les. In the coding mode,

xviii

Page 20: JChatman

CED allows the user to establish a predetermined set of codes and then to march through the �le line by

line making simple key stroke movements that enter the correct codes for each utterance selected.

Once a �le has been fully coded in CED, a variety of additional analyses become possible. The standard

search tools of freq, kwal, and combo can be used to trace frequencies of particular codes. However, it is also

possible to use the chains, dist, and keymap programs to track sequences of particular codes. For example,

keymap will create a contingency table for all the types of codes that follow some speci�ed code or group of

codes. It can be used, for example, to trace the extent to which a mother's question is followed by an answer

from the child, as opposed to some irrelevant utterance or no response at all. Dist lists the average distances

between words or codes. chains looks at sequences of codes across utterances. Typically, the chains being

tracked are between and within speaker sequences of speech acts, reference types, or topics. The output

is a table which maps, for example, chains in which there is no shift of topic and places where the topic

shifts. Wolf, Moreton, and Camp (1994) apply chains to transcripts that have been coded for discourse

units. Yet another perspective on the shape of the discourse can be computed by using the mlt program

which computes the mean length of the turn for each speaker.

Phonological analyses. Currently, phonological analysis is a bit of a step-child in clan, but we

have great plans for correcting this situation. These plans involve two types of developments. One is the

ampli�cation of standard programs for inventory analysis, phonological process analysis, model-and-replica

analysis, and other standard frameworks for phonological investigation. Currently, the two programs adapted

to phonological analysis are phonfreq which computes the frequencies of various segments, separating out

consonants and vowels by their various syllable positions and modrep which matches %pho tier symbols with

the corresponding main line text. For more precise control of modrep, it is possible to create a separate

%mod line in which each segment on the %pho corresponds to exactly one segment on the %mod line.

Digitized audio. Although inclusion of a complete %pho line is a powerful tool, even this form of two-tier

transcription misrepresents the full dynamics of the actual audio record. On the Macintosh, the CED editor

allows the transcriber direct access to digitized audio records that have been stored using an application such

as Sound Edit 16. In the next months, we hope to implement similar utilities for the Windows platform.

Using this system which we call \sonic CHAT", one can simply double-click on an utterance and it will play

back in full CD quality audio. Moreover, the exact beginning and end points of the utterance are coded

in milliseconds and the pause program can use these data to compute total speaker time, time in pausing

between utterances, and overlap duration time.

The Future

Our plans for the future development of the CHILDES system are based on the view of the �fth stage

of observational research as being the period of connectivity. Our �rst priority for this period is to make

full use of the facilities of the World-Wide Web (WWW) to provide multimedia access to the database,

the bibliographic system, and the manual. Using currently available tools such as NetScape, Macintosh AV

facilities, and HTML formatting programs, it is now possible for a user to use a sequence of mouse clicks to

open up pages of the CHILDES manual, search for particular �les in particular corpora, open up those �les,

and hear the sounds in each. It is even possible to have pictures of the children and parents accessible over

the net.

Equally important is the growth of connectivity between programs on a single computer. An example of

the type of development we are currently supporting is the linkage of the CED editor to high-level speech

analysis tools such as Signalyze on the Macintosh or WAVES on UNIX. We also plan to have access to a

reference database of IPA sounds, as well as audio examples of speci�c uses of CHAT symbols and codes.

xix

Page 21: JChatman

The Logome. The emergent connectivity of the InterNet has opened up an even more exciting prospect

that few have yet appreciated. This is the potential for the establishment of the Logome database. Much

like the Human Genome database, the creation of a set of standards for data transcription and transmission

will allow us to access a wide variety of data on not just language learners, but also adult conversations,

huge databases of written texts, phone conversations, schoolroom lessons, and all manner of human language

production by all types of speakers in all languages. Of course, we will never encode the full contents of

the Human Logome, but we can devise tools that will allow us to understand the patterns involved in the

enormous diversities of behaviors that we can human language.

Successful formation of this important new resource will require an overt commitment from researchers

acting as individuals and through their professional societies and journals. In �elds such as the sequencing

of proteins in DNA, researchers, journals, and the government have set the requirement that only data

which are publicly available in the Human Genome database can be published. A similar policy for language

development studies would insure the stable and continued development of the CHILDES database and the

gradual emergence of the

Logome database. Until such a policy is developed, voluntary acceptance of these responsibilities will

guarantee continued growth of the database. In this area, data from children and adults with language

disorders are some of the most important data to be included. For this reason, we look forward with great

hope to the general acceptance of the CHILDES system and the Logome database by researchers in language

disorders.

The place of Japanese research in the CHILDES system

There are a number of ways in Japanese language researchers can contribute to the development of a richer,

more extensive database. Given the high technological sophistication of Japanese researchers, there is good

reason to believe that Japanese researchers can play a pivotal role in the elaboration of new technologies

for the computational analysis of transcripts. The creation of a Japanese version of mor by Norio Naka is

a good example of this type of development. We would also expect to see Japanese researchers involved in

the initiatives to display and link computer audio and video to the CHAT transcript, and to provide tools

for automatic analysis of the digitized audio record. We can also work with Japanese researchers to develop

a full bibliography of work in Japanese child language in the format of the CHILDES/BIB system and to

provide good WWW (World Wide Web) access to these new tools.

However, the single most important task now facing us is the elaboration of the transcript database for

Japanese. Put quite simply, we need more data from more children at more ages. There is room for data

on early language acquisition, possibly in the form of the maternal inventory checklist of the CDI system

(Dale et al., 1989). But we also need data from children with language disorders, children from lower-class

families, childhood bilinguals, and adult second language learners. To some degree, it may be possible to

enter in older published data sets, but we will also need fresh new data with full audio and video records.

The task is clear, the tools are ready, and we look forward to beginning this important e�ort.

References

1. Bornstein, M. H., Tal, J., Rahn, C., Galperin, C. Z., P~cheux, M.-G.,Lamour, M., Azuma, H., Toda,

S., Ogino, M., & Tamis-LeMonda, C. S. (1992). Functional analysis of the contents of maternal speech

toinfants of 5 and 13 months in four cultures: Argentina, France, Japan, and the United States. Devel-

opmental Psychology, 28, 593-603.

xx

Page 22: JChatman

2. Bornstein, M. H., Tamis-LeMonda, C. S., Tal, J., Ludemann, P., Toda, S.,Rahn, C., P~cheux, M.-G.,

Azuma, H., & Vardi, D. (1992). Maternal responsiveness to infants in three societies: The United States,

France,and Japan. Child Development, 63, 808-821.

3. Clancy, P. M. (1981). Referential choice in English and Japanese narrative discourse. In W. L. Chafe

(Ed.), The pear stories, . Norwood, New Jersey: Ablex Publishing Corporation.

4. Clancy, P. M. (1985). The acquisition of Japanese. In D. I. Slobin (Ed.), The crosslinguistic study of

language acquisition: Volume 1. The data. Hillsdale, NJ: Lawrence Erlbaum.

5. Crystal, D. (1982).Pro�ling linguistic disability. London: Edward Arnold.

6. Crystal, D., Fletcher, P., & Garman, M. (1989). The grammatical analysis of language disability. Second

Edition. London: Cole and Whurr.

7. Dale, P., Bates, E., Reznick, S., & Morisset, C. (1989). The validity of a parent report instrument.

Journal of Child Language, 16, 239-249.

8. Higginson, R., & MacWhinney, B. (1990). CHILDES/BIB: An annotated bibliography of child language

and language disorders. Hillsdale, NJ:Erlbaum.

9. Higginson, R., & MacWhinney, B. (1994). CHILDES/BIB 1994 Supplement. Hillsdale, NJ:Lawrence

Erlbaum.

10. Hinds, J. (1980). Japanese conversation, discourse structure, and ellipsis. Discourse Processes, 3, 263{

286.

11. Ito, T., & Tahara, S. (1985). A psycholinguistic approach to the acquisition of multifuncionality in

Japanese particles wa and ga. Descriptive and Applied Linguistics, 18, 121{131.

12. Kamio, A. (1994). The theory of territory of information: The case of Japanese. Journal of Pragmatics,

21, 67{100.

13. Kilborn, K., & Ito, T. (1989). Sentence processing in Japanese-English and Dutch-English bilinguals.

In B. MacWhinney & E. Bates (Eds.), The crosslinguistic study of sentence processing. New York:

Cambridge University Press.

14. Kuno, S. (1972). Functional sentence perspective: a case study from Japanese and English. Linguistic

Inquiry, 3, 269-320.

15. Lee, L. (1974). Developmental Sentence Analysis. Evanston, IL:Northwestern University Press.

16. Lust, B., & Wakayama, T. K. (1979). The structure of coordination in children's �rst language ac-

quisition of Japanese. In F. R. Eckman & A. J. Hastings (Eds.), Studies in �rst and second language

acquisition. Rowley, Massachusetts: Newbury House Publishers, Inc.

17. MacWhinney, B. (1991a). The CHILDES database. Dublin, OH: Discovery Systems.

18. MacWhinney, B. (1991b). The CHILDES project: Tools for analyzing talk. Hillsdale, NJ: Erlbaum.

19. MacWhinney, B. (1993). The CHILDES Database: Second Edition. Dublin, OH:Discovery Systems.

20. MacWhinney, B. (1994a).The CHILDES Project: Tools for Analyzing Talk (Second Edition). Hillsdale,

NJ: Lawrence Erlbaum Associates.

21. MacWhinney, B. (1994b). Computational tools for analyzing language. In P. Fletcher & B. MacWhinney

(Eds.), Handbook of child language research. London: Blackwells.

22. MacWhinney, B. (1994c). New horizons for CHILDES research. In J. Sokolov & C. Snow (Eds.), Hand-

book for research in language development using CHILDES. Hillsdale, NJ: Lawrence Erlbaum Associates.

23. MacWhinney, B. (1995). The CHILDES system. In W. Ritchie & T. Bhatia (Eds.), Handbook of

language acquisition. New York: Academic Press.

24. MacWhinney, B., & Snow, C. (1985). The Child Language Data Exchange System. Journal of Child

Language, 12, 271{295.

25. MacWhinney, B., & Snow, C. (1990). The Child Language Data Exchange System: An update. Journal

of Child Language, 17, 457-472.

xxi

Page 23: JChatman

26. MacWhinney, B., & Snow, C. (1992). Tools for analyzing child language corpora. In A. Mackie, T.

McAuley, & C. Simmons (Eds.), For Henry Kucera: Studies in Slavic philology and computational

linguistics. Ann Arbor: Michigan Slavic Publications.

27. Makita, K. (1968). The rarity of reading disability in Japanese children. American Journal of Orthopsy-

chiatry, 38, 599{614.

28. Mazuka, R. (1991). Processing of empty categories in Japanese. Journal of Psycholinguistic Research,

20, 215{232.

29. Oshima-Takane, Y., Miyake, N., Dickson, W.P., Azuma, H., & Hess, R.D. (1982). Description styles in

a referential communication task: a comparison between mother and teacher in Japan and the United

States. Journal of Japanese Psychology, 53, 207{213.

30. Oshima-Takane, Y. & Muto, T. (1993) Analysis of question-asking behaviors: A comparison between

Japanese and Canadian students. Poster presented at the Annual Meeting of Canadian Psychological

Association, May,Montreal.

31. Scarborough, H. S. (1990). Index of productive syntax. Applied Psycholinguistics, 11, 1{22.

32. Slobin, D. (1985a). The crosslinguistic study of language acquisition. Volume 1: The data. Hillsdale,

N. J.: Lawrence Erlbaum Associates.

33. Slobin, D. I. (1985b). The crosslinguistic study of language acquisition. Volume 2: Theoretical issues.

Hillsdale, NJ: Lawrence Erlbaum Associates.

34. Sokolov, J., & Snow, C. (Eds.). (1994). Handbook of research in language development using CHILDES.

Hillsdale, NJ: Erlbaum.

35. Stevenson, H., Stigler, J., Lucker, G., Lee, S., Hsu, C., & Kitamura, S. (1982). Reading disabilities:

The case of Chinese, Japanese, and English. Child Development, 53, 1164{1181.

36. Watamori, T., & Sasanuma, S. (1978). The recovery processes of two English-Japanese bilingual apha-

sics. Brain and Language, 6, 127{130.

37. Wolf, D., Moreton, J., & Camp, L. (1994). Children's acquisition of di�erent kinds of narrative discourse:

Genres and lines of talk. In J. Sokolov & C. Snow (Eds.), Handbook of research in language development

using CHILDES. Hillsdale, NJ:Lawrence Erlbaum Associates.

xxii

Page 24: JChatman

改訂版の刊行にあたって

中 則夫1995年に刊行された初版 CHILDES 日本語マニュアルは、約二年で 300 部を頒布して在庫がなくなりまし

た。その結果、マニュアルなしでは新規に CHILDESを利用なさる方や、技術講習会で著しい不便が生じるこ

とが分かりました。将来的には、より使いやすいマニュアルを作成することが JCHATプロジェクトスタッフ

で話し合われており、本格的な改訂を行う予定ですが、JCHAT/CHILDES の普及活動に空白ができることの

ないように、急遽 CHILDES/JCHAT 年次大会に合わせて、初版に最小限の修正を施した改訂版マニュアルと

刊行することになりました。

改訂版編集に際して白井英俊さんに大幅な時間を割いていただき、レイアウト、印刷、校正を行っていただ

きました。特に、HTML 版マニュアルの作成や、マニュアル組版に LaTeXを導入していただくなど、将来の

マニュアル整備に大きな道を開いていただきました。白井さんのご協力がなければ、改訂版の出版はさらに遅

れていたことでしょう。ここにお礼を申し上げます。

時間的な制約により、初版のコマンドレファレンスは本書に含めることはできませんでしたが、別冊の形で

本書と共に増刷する予定です。合わせてご利用ください。本書では、項目が探しにくいという読者のご意見を

反映して、白井さんに新規に索引を導入していただきました。本書をご使用になってお気付きの点がありまし

たら、どんなささいなことでも JCHATプロジェクトまでお知らせください。使いやすいマニュアルの実現は、

みなさんの協力が不可欠です。ご意見、ご感想は、

[email protected]

まで email をお送り頂ければ幸いです。みなさんの声をお待ちしています。

xxiii

Page 25: JChatman

第1章 トランスクリプト作成の方法

森川尋美

1.1 トランスクリプト作成の原則

CHAT及び JCHATは、会話的相互作用のトランスクリプトをコンピュータ・ファイルとして作成するフォー

マット・システムである。会話的相互作用とは、例えば、幼児と親、医師と患者、教師と第二言語を学ぶ学生

達の間などで行なわれる会話のやりとりである。これらの相互作用のタイプはそれぞれに特有な性格を持つが、

その反面、共通する特徴も充分見られるので、この様な一般的な転記方法が可能となるのである。ここで提案

されるフォーマットは、正常な被験者集団、障害のある被験者集団の両方に使えるように開発されている。ま

た、どのタイプの言語習得者 (幼児、第二言語学習者、失語症から回復しつつある成人、等)にも使えるもので

ある。このフォーマットでは、基本として発話の流れをそのまま転記するだけでも良いし、詳細な音韻的分析や

形態素分析を行なうこともできる。CHATは、Codes for the Human Analysis of Transcriptsの頭字語であり、

JCHATという名称は「日本語版 CHAT」を意味する。CHAT、JCHATは共に、CHILDES(Child Language

Data Exchange System)プロジェクトの標準転記フォーマットとして使われるものである。JCHATフォーマッ

トはこのマニュアルで初めて紹介されるが、CHATフォーマットの方は、CHILDESデータベースに収められ

た転記資料の大部分に使われている。また、現在、世界各国で言語データを収集している研究グループの多く

も、その転記方法として CHATフォーマットを採用している。CHATや JCHATフォーマットで入力された

トランスクリプトについては、「CLANプログラム」と呼ばれる種々のコンピュータ・プログラムで自動的な

分析を行なうことができる。CLANコンピュータ・プログラムの使用法は、本マニュアルの第 2部1・英語の

マニュアルである The CHILDES Project: Tools for Analyzing Talk (MacWhinney, 1991)やその CD-ROM

版に説明されている。

1.1.1 トランスクリプトのコンピュータ・ファイル化による新しい可能性

科学が真に発展する為には、どの実験データも、公開の場で検討される必要がある。残念ながら言語研究の

分野では、データを開放的に共有したり交換し合うことは、あまり行なわれて来なかった。初期の研究者には、

自分の研究対象の言語コミュニティから採集したフィールド・ノートを公開せず、他の研究者達と共有するこ

とを拒む者が多かった。これには、様々な言い訳けがあった。「他人には、自分の採集したデータの本当の特

性は分らないだろう」、「データの示す重要なパターンを不正確に捉えるに違いない」、もっと一般的には、「そ

のコミュニティ或いは相互作用に実際に参加した者にしか、その言語や相互作用の実態は分らない」という言

い分である。場合によっては、これらは事実であり重大な制約となる。しかし、この様にデータ共有を制限し

ていては、科学的な言語研究は、なかなか発展することができない。

最近の言語獲得研究の分野では、データ共有は、それに関わる危険性に比べて利点の方がはるかに大きいと

考えられるようになった。現在の課題は、「データを共有すべきかどうか」というよりも、「どうすれば信頼性

と責任のあるデータ共有が行なえるか」である。トランスクリプトをコンピュータ・ファイル化することによっ

て、これまでは不可能だった様々な形のデータ共有が可能になってきている。しかし、この可能性をフルに利

用するには、標準化されたデータ転記と分析の方法が必要である。1本書では 19 章、20章に述べられている

1

Page 26: JChatman

第 1章 トランスクリプト作成の方法

1.1.2 用心すべきこと

CHATシステムを検討する前に、まず、トランスクリプトのコンピュータ・ファイル化に関わる種々の危険

性を考慮する必要がある。これらの危険性は、「会話は複雑な言語・非言語メッセージの集合体であるのに、コ

ンピュータ入力手段に制約されることによって、筆記言語の形に変換しなければならない」、ということに起

因する。これは、タイプライターや手書きによる転記の場合にも起る問題である。以下、この事について検討

してみよう。

1.書き言葉の影響

トランクリプト作成での最大の危険性は、話し言葉を書き言葉と同じように扱ってしまうこ

とだろう。「音声の連なりを書き言葉の形へ変換する」という作業で最も陥りやすい問題は、幼

児、失語症患者、第二言語学習者のどの被験者であれ、その言語習得者の発する音声形態 (非標

準的なものも含めて)を、全部、標準的な成人語の語彙に当てはめようとすることである。例え

ば、日本語を獲得している或る幼児の「プーンで食べる」という発話を、転記者が \supuun de

taberu" と転記したとする。これは、「スプーン」が単にカタコトで「プーン」という形になっ

た、と仮定したからである。この様に、成人語の標準語彙に基づいた調整 (regularization)を行

なうと、幼児の実際の語彙形態を見誤ってしまうことになりかねない。実際には、この幼児が

「プーン」と「スプーン」を全く異った物に対して使用している可能性があるからである (Clark,

1987; MacWhinney, 1989 参照)。例えば、この幼児が、自分のスプーンだけを特別に「プーン」

と読んでいるのかもしれない。

このような状況では、二種類の誤りが起り得る。ひとつは、成人語の中に該当する表現が存

在しない場合でも、言語習得者の発した音声形態を、成人語の語彙項目に当てはめようとする

ことである。これは「過大調整 (overregularization)」という問題である。二番目の問題は、言

語習得者の発した音声形態を、成人語の中に該当する表現が存在するのに、成人語の語彙項目

に当てはめないことである。これは「過小調整 (underregularization)」である。転記者は、どち

らの種類の誤りもできる限り避けなければならないが、これは決して容易な事ではない。転記

システムは、この様な誤りがある程度回避し易いように作られてはいるが、それでも完全な回

避を保障できるものではない。転記者の注意深い配慮が必要である。

また、転記者には、言語習得者の発した音声の形を、成人の形態・統語論的なパターンにのっ

とった形に当てはめようとする傾向もある。例えば、日本語では頻繁に「おばーちゃんのうち」

を「おばーちゃんち」と発音する。つまり、所有を表わす格助詞の「の」と名詞の「うち」が

「(ん)ち」という形に短縮される。しかし、月齢の極めて低い幼児には、その両者が同一のもの

であることをまだ認識していない可能性がある。もし幼児の発した短縮形を \no uchi" (ヘボン

式の場合)と転記してしまうと、その幼児の語彙構造を誤った形で表わすことになる。

CHATや JCHATでは、これらの問題に対する色々な対処の仕方が工夫されている。最も正

確で一貫した解決策は、発話を音韻的に表記することである。CHAT・JCHATには、UNIBET

と呼ばれる簡潔な音素表記システムが含まれている。UNIBETを使えば、「んち」を/NtSi/と

表記することができる (UNIBET に関しては第 12章を参照)。音韻的な転記は、他のどの方法

よりも正確な表記法であり、あまり幅広く使われていないのは残念なことであるが、音素表記に

かかる手間を考えると無理もないと言えよう。この様な手間を避けたい場合には、非標準的な語

形を設定することもできる。例えば \nchi" や \chi"を、\no uchi"の短縮形を表すつづり方で

ある、と指定してもよい。第 6章に、標準的でない語形の表記の仕方が詳しく説明されている。

2.標準的句読点の誤用

転記者は、書き言葉の句読点使用法にしたがって、話し言葉を転記しようとする傾向があ

る。書き言葉は、読点、句点、その他の記号によって、節や文に分けられる。一方、話し言葉は、

2

Page 27: JChatman

1.1. トランスクリプト作成の原則

休止 (pause) やイントネーションの上がり下がりによって、抑揚の単位に分けられる (Crystal,

1969; 1975; Halliday, 1966; 1967; 1968)。

文生産の談話論的な基盤を検討した研究 (Chafe, 1980; 1987; Je�erson, 1984; MacWhinney,

1985) で、抑揚単位と思考の単位が密接に関連するものであることが示されている。言い直し

(retracing: 発話内でさかのぼって繰り返したり言い直したりすること)、休止、強調、種々のイ

ントネーション形は、発話形成時点の心理的プロセスを様々な面から表わすものである。それ

に加えて、これらの特徴は、重要な社会言語学的な情報をも伝達する。しかし、特殊記号や句

読点を使用しても、相互作用におけるこれらの重要な側面を直接的に表示することは難しい。

句読点使用法への偏向に対する最も強力な対処方法としては、UNIBET音韻表記法を UNI-

BETプロソディー記号で補う方法がある。この UNIBETプロソディー記号は、音声の高低に

よる強調やイントネーションの上がり下がりを示す。これらの記号は、標準言語表記法と音韻

表記法とのどちらとも組み合わせて使用することができ、抑揚の単位や形状を詳細に示すもの

である。また、CHAT・JCHATフォーマットには、言い直し、休止、エラーなどをコーディン

グする記号セットが含まれている。

3.ビデオテープ使用の利点

どの様な形式で転記を行なったとしても、相互作用中に起こったことを完全に記録すること

は不可能である。相互作用を転記した資料は、もとの録音テープに全面的に取って代るものでは

ない。録音テープの方が、実際に起こった相互作用の詳細をはるかに正確に記録しているから

である。同様の理由で、音声の録音記録よりも、高精度の音声トラックを持つビデオ録画の方

が、相互作用をより詳細に記録できると言える。非言語的なやりとりは、多くの場合、会話的

相互作用の中心をなすものであるが、このやりとりは録音では捉えられない。この様に、音声

記録でも、相互作用をフルに解釈する為に欠かせない情報源の一部が除外されてしまう。ビデ

オテープも完璧とは言い難いが、現在使われている相互作用記録方法の中では、最も正確な方

法であると言えるだろう。相互作用の詳細を余すところ無く転記しようとするならば、この転

記はビデオテープから行なうべきであり、その後も分析が完了するまで、何回でもビデオテー

プに戻って確認を行なう必要がある。

1.1.3 転記とコーディング

転記とコーディングの間の相違点は何だろうか。転記の役目は、(たとえ不完全な形であっても)相互作用の

筆記記録を作成することである。転記は、音声テープ、より望ましくはビデオテープから直接行なわれなけれ

ばならない。一方、コーディングは、転記された発話の中に現れる現象を認識、分析し、それらに注目するプ

ロセスである。ある種のコーディングは、転記されたトランスクリプトのみに基づいて行なうことができる。

例えば、品詞のコーディングは、多くの場合、音声テープを聴かなくても、トランスクリプトから直接行なう

ことができる。スピーチ・アクト等、他の種類のコーディングは、必ずもとのビデオテープを見ながら行なう。

CHAT・JCHATフォーマットは、転記方法とコーディング方法の両方を含んでいる。初心者は、まず転記

方法の収得に集中すると良い。CHAT・JCHATフォーマットには、様々なオプションを含んだコーディング

方法が用意されているが、これらを全面的に駆使する転記者はまず無いと思われる。しかし、いわゆる「メイ

ン・ライン」で行なわれる転記の方法には、どの転記者も充分に慣れておく必要がある。コーディングは、殆ん

どの場合、「ディペンデントティア」と呼ばれる二次的なラインで行なう。発話の転記に慣れるにつれて、段々

とコーディングのオプションを利用し始めるのも良いが、CHAT・JCHAT の初心者は、まず、メイン・ライ

ンでの転記方法が正確に使えるようになることに専念することである。このマニュアルの第 14章に、JCHAT

フォーマットで入力されたトランスクリプトの例がいくつか紹介されている。

3

Page 28: JChatman

第 1章 トランスクリプト作成の方法

文献

1. Chafe,W. (Ed.). (1980).The Pear stories: Cognitive, cultural, and linguistic aspects of narrative produc-

tion. Norwood, NJ: Ablex.

2. Chafe, W. (1987). Cognitive constraintson information ow. In R.Tomlin (Ed.), Coherence and ground-

ing in discourse.. Philadelphia: Benjamins.

3. Clark, E. (1987). The principle of Contrast: A constraint on language acquisition. In B. MacWhinney

(Ed.), Mechanisms of Language Acquisition. Hillsdale, NJ: Erlbaum.

4. Crystal, D. (1969). Prosodic-systems and intonation in English. Cambridge: Cambridge University

Press.

5. Crystal, D. (1975). The English tone of voice: Essays in intonation, prosody and paralanguage. London:

Edward Arnold.

6. Halliday, M. (1966). Notes on transitivity and theme in English: Part 1. Journal of Linguistics, 2,37{71.

7. Halliday, M. (1967). Notes on transitivity and theme in English: Part 2. Journal of Linguistics, 3,177{

274.

8. Halliday, M. (1968). Notes on transitivity and theme in English: Part 3. Journal of Linguistics, 4,

153{308.

9. Je�erson, G. (1984). Transcript notation. In J. Atkinson, & J. Heritage (Eds.), Structures of social

interaction: Studies in conversation analysis. Cambridge: Cambridge University Press.

10. MacWhinney, B. (1985). Grammatical devices for sharing points. In R. Schiefelbusch (Ed.), Commu-

nicative competence: Acquisition and intervention. Baltimore: University Park Press.

11. MacWhinney, B. (1989). Competition and lexical categorization. In R. Corrigan, F. Eckman, & M.

Noonan (Eds.), Linguistic categorization. New York: Benjamins.

12. MacWhinney, B. (1991). The CHILDES Project: Tools for analyzing talk. Hillsdale, NJ: Erlbaum.

4

Page 29: JChatman

第2章 表記システムCHAT

宮田Susanne・中則夫

2.1 はじめに

1. 表記システム CHATと分析プログラム CLANは表裏一体をなしている。

2.そのため、CLANを使ってデータを分析する際には、CHAT の構造に慣れる必要がある。

CHATとは、CHILDESで採用されているデータファイル形式のことである。ここでのファイル形式とは、

データの入力形式に課せられる制約のことであると概ね考えてよい。したがって、データの入力は、ある一定

の規定を満たしながら行うことになる。なぜ、このような制約が設けられているかというと、そうすることに

よって次節で述べるようなさまざまな利点が得られるからである。それらのうち最も重要な点は、CLANは

CHATが使用されていることを前提としている点である。CLANは、語彙の出現頻度計算 (FREQ)、MLU計

算 (MLU)、形態素解析 (MOR)のほか言語研究に特化したさまざまな分析方法をサポートしている。これらの

複雑な処理は、すべて CHATに依存しながら行われており、また CHAT システムは CLANの能力を最大限

に引き出すように最適化されている。そのため、もし CHATを使用してデータを入力しないと CLANがもつ

能力を発揮できないことはもちろん、基本的な CHATの規則が守られていない場合には、CLANが正常に動

作することさえ望めないことになる。したがって、すべての CHILDESのデータベースは、少なくとも CHAT

の最低限の要件 (内容は以下で詳述)を満たしたものでなければならないというのが原則である。このように、

CHATと CLANは、CHILDESでは表裏一体をなしているので、CLAN を用いてデータを活用する際には、

CHAT システムを理解し、そのデータ構造に慣れる必要がある。

CHATの大きな特徴は、高度に構造化された形式を備えている点である。データが構造化されていること

でデータベース中の情報を取り出すことが極めて容易になるが、その結果、次のようなさまざまな利点が生ま

れる。

1.そのデータが元来含む情報 (ここでは発話内容)のほか、発話者、場面描写など極めて多くの付加情報が一

定のルールの下で表現可能である。

2. 形式に一定の規則性が維持されるということによって、コンピュータを用いた効率的な分析が容易に実現

できる。

3. 複数の研究者による入力にばらつきがなくなり、データの互換性、汎用性が著しく高まる。

4. CHILDESとは独立の別のデータベースシステムとのデータコンバートが、コンピュータを使ってスムー

ズに行える。

これらの利点は、CHATのような形式が考案されていなかった時代には、データベースを扱う際の問題点に

なっていた。CHILDESでは、これらの問題点を克服し、多くの研究者が貴重な言語データを広く利用できる

ことを可能にするために、大がかりなデータの規格化を行ったのである。

この章では、CHATシステムが一体どのようなものであるかを概観し、その性質を理解することが目標とな

る。特に、CHATシステムの基本であるminCHAT、およびその日本語モジュール minJCHATの具体的項目

を理解し、実際にデータを利用できるようにすることが必要である。第 2.2節では、発話データの表記体系が

もつ概念的意味合いを概観する。第 2.3節では、CHATにおける最低限の要件 (MinCHAT)を中心に CHAT

5

Page 30: JChatman

第 2章 表記システム CHAT

形式の簡単な説明を各項目にわたって行い、第 3章以降の各論への導入となっている。また、CHATで日本語

を扱う方法についてもここで検討する。なお、難しい話は抜きにして、いち早く CHATシステムの具体的内

容に入りたい場合には、次節を飛ばして第 2.3節へ読み進んでいただいて差し支えない。

2.2 データ表記システムの目標

キーポイント

1.データベースは、互いに相反する 3つの目標を達成しなければならない。

2. CHATは、それらの目標のすべてを高度なレベルで実現しようとしている。

3.そのために、豊富な表記法を提供し、データの閲覧、作成を支援する方策を提供している。

発話データベースは、ある文脈の中で実際に発話された音声を文字表記にしなければならない。一般に、文

字情報は音声情報に比べて伝達できる情報が少なく、音声を文字に変換した時点でデータのもつ性質が変化し

てしまう。このように、媒体を変化させることに伴う問題点がいくつか発生するので、テキストデータベース

を設計、構築する際にはそれらの点を考慮に入れる必要がある。実際に問題となるのは次の点である。

1.明確さ

2.読みやすさ

3.入力のしやすさ

これらは互いに相反し、ひとつを重視すると他の要素が軽視されてしまうというジレンマが生じる。以下で

は、これらの問題を整理し、CHATシステムがそれらをどのように解決しているかをみていこう。

2.2.1 明確さ

明確さの基準となるのは、次の 2つである。

1.事実を過不足なく正確に記述していること

2.表記が一貫していること

事実を正確に記述するというのは、一体どのようなことだろうか。まず、発話データを利用する際には、実

際に発話されたことばの指示対象や、その発話が何を意味しているかなどが解釈できなければ研究の役には立

たない。しかし、本来あいまいな発話 (たとえば解釈がふたつある場合など)を無理にひとつの発話表記に代表

させ、発話データが実際の発話と異なってしまっては元も子もない。したがって、そのような選択肢しか提供

できない表記システムは明らかに役不足といえる。そこで、表記システムは、これらのあいまいな発話内容を

ありのまま表記できる手段を潜在的に備えている必要がある。つまり、表記システム自体が、データ作成者に

無理なデータの作成を強いることのないように、幅広い表現手段を提供できなければならないのである。多様

な解釈の可能性をもった発話データの解釈は、実際にデータを利用する研究者の研究方針に依存するものであ

る。したがって、データ作成時には、主観的な解釈を無理に行うよりも、むしろあいまいな発話はそのままあ

いまいに表記し、その代わりに、発話データの解釈に役立つような非言語的情報を含めるほうがよい。CHAT

では、あいまい性、不明瞭性を表示するさまざまなオプションを提供して、このような目標を達成している (以

下本章で略述。より詳しくは、第 3章以降を参照)。

一方、表記の一貫性とは、あるコーパス内で使われるコード、記号、文字、語などが首尾一貫して使われて

いることをいう。もし、同一コーパス内でその一貫性が損なわてしまうと、データをコンピュータを用いて分

析、利用する際に、その効率が極端に下がってしまうことになる。したがって、特定のコードや記号などは一

義的な意味をもつようにし、その意味は他のコードや記号の存在に依存しないようにするのが理想的である。

さらに、一貫性が同一コーパス内だけでなくすべてのコーパスで保たれると、データを体系的に利用できる可

6

Page 31: JChatman

2.2. データ表記システムの目標

能性が著しく高まることになり、その利点は数多い。このように一貫性の問題は、コンピュータを用いた分析

の際には特に重要なポイントである。そこで、CHATではさまざまな研究目的に応じた記号やコードを最初か

ら用意してある。そのため、人によって表記法がばらつくことがないし、データ入力もかなり容易になるのが

特長である。

2.2.2 読みやすさ

発話データは、CLANなど、コンピュータを用いて処理するためだけに利用されるわけではない。データそ

のものを閲覧し、そこから仮説を導き出したり、分析方法を検討したりすることも重要である。こうした利用

法を考慮すると、データは読みやすいものであることが望ましい。ところが、読みやすさと上で述べた明確さ

は両立しない。CHATでは、発話データとしてのあいまい性をできる限りありのまま捉えようとしたため、必

然的に表記が複雑にならざるを得ないからである。さらに、さまざまなディペンデントティア (後述)は、研究

目的に合わせて拡張できるので便利だが、その数が増すにしたがってデータはますます見づらくなる。

CHILDESでは、上記の問題を解決するために CLANでいくつかのコマンドを用意している。たとえば、

FLOというコマンドは、メイン・ライン (後述)に付け加えられたほとんどの CHATコードや記号を取り去

ることができる。そのため、オリジナルの未加工のデータの読みやすさも維持することができる。ディペンデ

ントティアが多すぎてみにくいときや、特定の発話者の行だけを見たいときは、CLANエディターを使うとよ

い。任意の行を消したり、表示させたりすることが自由にできる。そのほかにもいくつかのコマンドが用意し

てあり、これらを利用することで、データの高い情報量を維持しつつも、読みやすい環境を自由に作り出すこ

とができるようになっている。

2.2.3 入力のしやすさ

これまでみたように、CHATが達成しようとしている目標は高い。そのため、できるだけ多くの解釈の可能

性を表現できる表記法をとると、コーパス内に含まれる記号の数は増えざるを得ない。ところが実際のデータ

ベース作成では、発話データ部分を入力するだけでもたいへんな作業なのに、さらに複雑なコードを埋め込む

のはデータ作成者にとって大きな負担である。また、入力ミスも招きやすい。一般に、同じコードの入力や間

違い探しなどの単純作業の繰り返しはコンピュータを用いて効率的に行うのが最適である。そこで CLANに

は、コーパス作成者の負担を軽減するために次のような 3つのプログラムが用意されている。

1. CHECK

2. CLANエディター

3. MOR

CHECKは、データファイルが CHATが満たすべき基本的な構造にしたがっていない場合に、どこがどう

間違っているかを教えてくれる。そのため、わざわざ間違い探しに長い時間を割かなくてすむ。CLANエディ

ターは、CHATファイル作成に最適化されたエディターで、各種コードを呼び出し、それをデータの任意の場

所に挿入することができるので、同じコードをいちいち入力する必要がない。また、CHECKを CLANエディ

ター上で実行することもできるので、間違いがあればその場で訂正することもでき、たいへん効率がよく便利

である。MORは、自動的に形態素解析を行うコマンドで、解析結果を%mor行に出力できるので、メイン・ラ

インの語をひとつずつ形態素に分ける手間を省いてくれる。

このように、CHATシステムはデータベースが満たすべき 3つの重要な要素をすべて高度なレベルで実現し

ようとし、実際にそれに対する具体的な方策をいくつか提供している。CHILDESユーザーは、データ作成の

際に「明確さ」の要素を重視してデータを入力し、CLANを利用して作業効率を上げ、「入力のしやすさ」を

追求できるようになっている。また、データ利用の際には CLANのコマンドを上手に利用し、「読みやすさ」

を高めるとよいだろう。

7

Page 32: JChatman

第 2章 表記システム CHAT

2.3 CHATシステムの上手な使い方

キーポイント

1. CHATは複雑な表記システムだが、そのほとんどがオプショナルである。

2.レベルを基本的な部分 (minCHAT)とそれ以外に分けてあり、初心者にも分かりやすい。

3.最初は minCHATからスタートし、徐々に上のレベル (midCHAT, maxCHAT)に移行するとよい。

4.日本語の場合は、minCHATに加え、さらに日本語モジュールの minJCHAT を必要とする。

この節では、CHATシステム全体のしくみを理解し、より効率的に使う方法について簡単に説明する。ここ

では、CHATを用いたデータを、通常の発話データに発話者の特定、コメント、付加情報、各個別研究に特化

したさまざまなコードなどが埋め込まれたものであると理解してよい。CHATには、従来の発話表記システム

にはみられないいくつかの特長がある。前節でみたように、非常に豊富で複雑な表記体系を採用して、種々の研

究要請に答えられる潜在能力をもっているのが、その第一の特長である。したがって、システム全体をくまな

く理解するには時間がかかるのは、やむを得ないところである。しかし、初心者でも苦労することなく CHAT

を使い始められるように、CHATはシステムレベルを基本的に二段階に分け、初心者と熟練者のニーズを同時

に満たすように工夫されている。これが第二の特長である。以下では、この特長について説明していくことに

する。

2.3.1 minCHAT

CHAT は、さまざまな表記法を提供しているわけだが、実は、その表記法のほとんどがオプショナルであ

る。したがって、各研究者が必要に応じて表記法を選択し、利用することができる。逆にいえば、必要ない、

あるいはよく分からない表記を無理に使わなくても、CLANの優れた性質は十分引き出すことが可能である。

ただし、それには条件があり、分析されるデータファイルが CHAT の最低限の形式を満たしていなければな

らない。このような義務的な形式を minCHATという。上で述べた二段階のレベルとは、minCHATとそれ以

外の形式のことをさしている。そこで、CHATになじみのないユーザーは、まず 2.4で説明するminCHATに

慣れるとよい。minCHATが十分理解できるようになり、minCHATでは物足りないと感じられてきたら、順

次上のレベルに移行するのである。このように、無理せず、基本的で簡単な部分から使い始めるのが、CHAT

システムを理解し CLANを利用するための早道である。なお、日本語については、通常の CHATに加えて、

日本語特有の表記を処理する JCHATも用意してある。その中でも、minCHATに対応するminJCHATを必

須条件として使用しなければならないので注意すること (詳しくは、2.4節で解説)。

2.3.2 midCHAT

minCHATが理解できたところで、次の段階として midCHATに移るとよい。midCHATは、データを閲覧

するときはもちろん、ほとんどすべての分析において利用頻度が高い、基本的なコード、記号である。事実上

このレベルまで習熟すると、CHATや CLANがもつ長所の大部分を活用することができ、CHILDESの恩恵

を十分に受けることができる。また、実際にデータ入力を行う際には、事実上このレベルの表記を使いたくな

る場合が多い。しかし、このレベル以上の表記は完全にオプショナルであり、使用が義務づけられているわけ

ではない。したがって、必要に応じて次のような具体的な項目を参照し、研究目的に合わせて利用するとする

とよいだろう。

1.不明瞭な語、特殊な語、省略などの記述方法 (第 6章)

2. メイン・ラインにおけるスコープ記号を用いたコメントの記述法 (第 10章)

3.接頭辞、接尾辞などメイン・ラインでの簡単な形態素表示 (第 7章)

4.語内のポーズ、アクセントなどの韻律情報 (第 9章)

8

Page 33: JChatman

2.3. CHATシステムの上手な使い方

5. 不完全、あるいは特殊な文の終わり方の記述 (第 8章)

6. 発話の重なり、言い直し、繰り返しなど (第 10章)

7. メイン・ラインでの簡単な誤用の表示法 (第 11章, 第 13章)

なお、名前が分からない特定のコード、記号を見出しとして、その説明部分を参照したい場合には、第 15章

の CHAT記号一覧を利用すると非常に便利である。

2.3.3 maxCHAT

以上の midCHATで対応しきれない場合は、maxCHATを利用する必要がある。maxCHATは、特定の研

究目的に特化した特殊な記号、コードを含むフルスペックのシステムである。そのほとんどが独自のディペン

デントティア (次節で詳述)を設定し、メイン・ラインとの相互関係を利用することが特徴である。maxCHAT

を必要とする研究は、以下のようなものがある。

1. 音韻表記。第 12章の UNIBETを参照。IPAについては、英語版マニュアル第 11章の PHONASCIIを参

照のこと。

2.スピーチアクト。英語版マニュアル第 13章のスピーチアクトコードを参照。

3. 誤用分析。第 13章のスピーチエラーの分析を参照。

4.タイミング分析。第 11章%tim行を参照。

5. 形態素分析。第 7章の形態素分析、英語版マニュアル第 14章の%mor行を参照。

以上のような maxCHATの表記法では不十分だと感じた場合は、第 11章に示してある方法でユーザー独自

のコードを定義し、使用することができる。つまり、maxCHATはユーザー自身が拡張するものであり、その

可能性は無限である。

2.3.4 どのように表記するか迷ったとき

実際のデータ作成作業では、発話をどう表記したらよいか迷うことが少なくない。その理由のひとつに、幼

児の発話が非常に不完全なケースが多いことがあげられる。たとえば、対応するおとなの語彙に結びつけるこ

とが困難だったり、欠落している要素がある場合でも省略なのか誤用なのか判然としないときがよくある。こ

のような場合、無理に特定の解釈、たとえば欠落要素は主語だという解釈、を与えないほうがよい。代わりに、

できるだけ元の状態のままでデータを入力することが大切である。あいまいな発話データの解釈のしかたは、

特定の研究仮説や理論的立場によって異なるので、無理な解釈をせず、代わりに非言語的な情報や、文脈情報

を可能な限り盛り込むようにする。これらの情報は、あいまいな発話の解釈の参考になる場合が多く、重要で

ある。そして、最終的な解釈は、各研究者の判断に委ねたほうがよい。

データ入力の基本的な原則は、次のようにまとめられる。

キーポイント

1.どうしたらよいか分からないときは、そのまま表記する。

2. 分からないわけではないが、複数の可能性をしぼり込めないときは、可能性をすべて表記する。

3.データの最終的な解釈は、データの利用者に任せる。

1のようなとき、原則として最低限必要な記号 (後述)以外に何らかの記号を無理に使う必要はまったくない。

また、発話が聞き取りにくい場合は、その旨をコメントを使って説明するか、推定の記号 [?]を用い利用者に

注意を喚起する。コメントの書き方は、メイン・ライン上に追加する方法 [= text](第 10章のスコープ記号を

参照)と、新たにコメント行 %comを設ける方法 (第 11章のディペンデントティア参照)がある。また、表記に

慣れていれば、UNIBETや PHONASCIIを用いて音形をそのまま表示してもよい。(2)のようなときは、コメ

9

Page 34: JChatman

第 2章 表記システム CHAT

ントかブラケット [=? text]を用いて代案を表記する (第 10章参照)。CHATでは、あいまい性を表記できる

オプションを用意し、ほとんどの場合に対処できるようになっている。

2.3.5 データ入力に無駄な時間を使わない方法

CHATの構造がざっとつかめたところで、実際に自分のデータを一気に CHATファイルにしたいと思う人

もいるだろう。確かに、実際に CHATを使ってみるのが、CHATに慣れるためには一番の近道だといってよ

い。しかし、いきなり複数の、しかも大きなデータファイルを入力し始めるのはあまり得策ではない。という

のも、まだ CHATによく慣れていない初期の段階では、ささいな思い違いから、それまでに入力したファイル

を大幅に変更する必要に迫られることがあるからである。一般に、データファイルの修正にかかる時間は膨大

で、その時点までに作成したファイルが長ければ長いほど、また多ければ多いほどその作業は悲惨なものとな

る。そこで、最初は、短いファイルをひとつだけ使い、データ入力と CLANの使い方の練習をするのがうまい

方法である。さらに、これから行おうとするコード入力や分析方法が、自分の研究にとって効果があるかにつ

いて事前に確かめる必要がある。手順としては、次のようになる。

1.自分のデータを入力し、簡単な CHATファイルをひとつ作成する。

2. CLANエディター上でそのファイルに CHECKを走らせて、間違いを一通り確認し、修正する。

3. CLANを用いて各自の分析を行うには、どのようなコードを使えばよいか予め考える。

4.実際に CLANを動かして、出てきた結果が各自の仮説の検証に役立つかどうか検討する。

2のように、CHECKを使ってみるだけでも驚くほどいろいろなことに気づき、データ入力に関する認識が

きっと変わることだろう。また、事前にこのような予備調査を行うことによって、データ入力にかかる無駄な

時間や労力を大幅に防ぐことができる。自分の研究にとってのデータ作成のポイントをつかんだ後で初めて、

大量のデータ入力とコード入力が安全で確実なものになるのである。

2.4 minCHAT

キーポイント

1. minCHATは、CHATファイルが満たさなければならない最低限の形式である。

2.その制約は、ファイル形式、発話形式、データ情報ファイル、の 3つに大別される。

3. minCHATの条件を満たすと、CLANのもつ優れた性質の多くを利用できる。

4.ただし、日本語の場合には、minCHATに加えてさらに後述の minJCHATが必要 (2.5節を参照)。

この節では、すべての CHATファイルが満たすべき最低限の条件であるminCHATについて解説する。そ

れらの要件を満たされたとき、そのファイルに対して CLANが効果的に適用できるようになる。その条件は、

主に次の 3種類に大別される

1.ファイルが満たすべき形式

2.発話が満たすべき形式

3.データファイルに関するデータ情報ファイルの記述

以下では、各項目について詳しく説明する。

2.4.1 ファイルが満たすべき形式

まず簡単な CHATファイルの具体例を示しておこう。なお、この章では例文を便宜上ヘボン式で表記して

いるが、訓令式で表記してもかまわない。

10

Page 35: JChatman

2.4. minCHAT

@Begin

@Participants: ASU Asuka Child, KUM Kumiko Mother

*ASU: basu atta !

*ASU: basu koko ?

%act: basu o toriage, okaasan ni miseru

*KUM: kono kono aida obaasan ni moratta ano akai hako

ni shiyoo ka ?

@End

@Begin

@Participants: ASU Asuka Child, KUM Kumiko Mother

*ASU: バス アッタ !

*ASU: バス ココ ?

%act: バスを取り上げお母さんに見せる

*KUM: この この あいだ お婆さん に もらった あの 赤い 箱 に

しよう か ?

@End

これは、CHATファイルのごく簡単な例だが、必要な条件はすべて満たされている。具体的なイメージがつ

かめたところで、個別規則の説明に入ろう。

1. 文字が、全角の仮名漢字あるいは半角のローマ字でなければならない。

2.ファイルの先頭行は、@Beginで始める。これによって、CLANはファイルが開始することを認識する。

3. すべての行は、改行コード (リターン、キャリッジリターンなどともいう)で終わる。改行によって、CLAN

は行の終わりを認識する。

4.ファイルの中に出てくる人物を @Participants行で定義する。

@Participants: ASU Asuka Child, KUM Kumiko Mother

ここでは、登場する人物を示す 3文字のコード、その人物の名前、その役割の 3つを順番に記述する。上

の例では、コードは名前を短縮したものを使っているが、役割を短縮したものでもよい。これらの具体例

などさらに詳しくは、第 4章を参照。なお、このヘッダーは、@Beginの次の、第 2行目に書くのが慣例

であるので注意のこと。CLANエディターなどは、@Participants行の情報を参照してさまざまな操作

を実行するので、この行は非常に重要である。

5. 実際の発話文は、アスタリスク (asterisk、*) で始まる行に入力する。

*ASU: basu atta !

*ASU: バス アッタ !

このような行をメイン・ライン (main line) という。CLANは、行頭のアスタリスクがあると、そこから

発話が始まると認識する。メイン・ラインには、発話文はひとつだけしか書けない。同一人物の発話が 2

文以上にわたる場合は、そのまま複数の文を続けずに改行し、独立したメイン・ラインを順次作成する。

11

Page 36: JChatman

第 2章 表記システム CHAT

*ASU: basu atta !

*ASU: basu koko ?

6.アスタリスクの次には、登場する人物を表す 3文字のコード、コロン、タブを入力する。

*ASU: basu atta !

3文字のコードは、@Participants行で指定したものを大文字で使用する。ひとつのメイン・ラインで使

用できる人物コードは、ひとつだけである。

7.発話内容は、タブの次から入力する。

*ASU: basu atta !

タブがスペース何文字分に相当するかは、各ワープロ、エディターで異なるし、自由に設定できる場合も

ある。しかし、タブコードさえ入っていれば、何文字分に相当してもかまわない。通常は、8文字分程度

で十分である。

8.パーセント (percent、%)で始まる行には、いろいろな情報を記入できる。

%act: basu o toriage, okaasan ni miseru

このような行を、ディペンデントティア (dependent tier) という。通常は、ここにさまざまなコードや、

コメントなどが記入される。

9.パーセントの次には、3文字のティアコード、コロン、タブを入力する。

%act: basu o toriage, okaasan ni miseru

ティアコードは、使用するティアのタイプによって特定のものを 3文字の小文字で使用する。たとえば、

コメント行は%comなどとする。具体例や、細かな使い分けについては、第 11章のディペンデントティア

を参照。

10.各行が長くなる場合には、途中で改行し、次の行に送ってから先頭にタブを入れる。

*KUM: kono kono aida obaasan ni moratta ano akai hako

ni shiyoo ka ?

改行は何文字目に入れてもかまわない。改行後の文頭にタブが挿入されることで、CLANは、行がまだ完

結していないと認識するようになっている。

11.ファイルの最終行は、@Endで終わる。このマークで、CLANはファイルが終了したことを認識する。

2.4.2 発話が満たすべき形式

以上のファイル形式に加えて、メイン・ラインでの発話と語の形式についても、いくつかの制約がある。

1. メイン・ラインでの発話は、発話の終わりを表す記号 (utterance terminator) で終わる(半角文字)。

*ASU: basu atta !

発話の終わりを示す記号のうち基本的なものは、ピリオド (period、.)、感嘆符 (exclamation mark、!)、

疑問符 (question mark、?)の 3つである。この他の特殊な発話の終わりを表す記号については、第 8章

を参照すること。

12

Page 37: JChatman

2.4. minCHAT

2.コンマの使用は、できるだけ避ける。通常の句読点としてのコンマは使用しない。実際には、特殊な例を

除いてほとんど使われないと考えてよい。日本語の場合については、2.5 minJCHATの項を参照すること。

3. 大文字は、固有名詞や英語の \I"などの場合を除いて、できる限り使用しないようにする。

*ASU: kore Asuka no da yo !

したがって、英語などの言語でも文頭の文字を大文字にする必要はない。大文字は、原則として固有名詞

の特定をしやすくするために使用する。また、「おかあさん」などの親族名は、呼称として使われた場合

には、固有名詞と解釈して大文字で始める。それ以外の場合には、大文字にしない。

*ASU: nee Okaasan.

*ASU: asoko obasan ga matteru.

%act: ningyoo o eki no mae ni narabete

4. 聞き取れない語は、xxxと表記する(半角文字)。

*ASU: basu xxx ?

*ASU: バス xxx ?

CLANは、xxxを語としてカウントしない。MLU などの計算に含ませたい場合などについては、第 6章

参照。

5. 不完全、断片的な音声は、アンパサンド (ampersand、&) の次に書いてもよい。(半角文字)

*ASU: &ko &ko kore nani ?

& は、語とは認めたくない断片的な音声を表記するために用いる。具体的には、どもったとき、いいよど

んだとき、間違って言い始めたときなどに使われる。音声表記という性格から、&の次は UNIBETを使う

のが基本だが、通常のローマ字を用いてもよい。CLANには、語として扱われないので注意すること (詳

しくは、第 6章参照)。

6. 不完全な語は、省略部分をかっこで補ってもかまわない (オプショナル)。

*MOT: ne so(o) shiyo(o) ?

*ASU: Obaasan n(o) toko(ro) .

かっこを使って補った場合には、完全な語として扱われるのがデフォールト設定になる。発話通りに解釈

させる場合など、詳しくは第 6 章を参照すること。

ここで説明した記号やコード、およびこれ以上のさまざまな記号を使った事例については、第 14章のサンプ

ルファイルを参照のこと。また、ここでは取り上げなかったが、他に実際場面でよく必要になるものとして、

発話の重なり (Overlap, [<])、繰り返し (Retracing,[/])、言い直し (Retracing with Correction, [//])、複数

の解釈 (Alternative Transcription, [=? text])の表示などがある。これらについての解説は、10章のスコー

プ記号を参照のこと。

以上の規定を満たしながら実際にデータを入力する場合に便利なノウハウについて章末で補遺としてまとめ

たので、ぜひ参照してほしい。

13

Page 38: JChatman

第 2章 表記システム CHAT

2.4.3 データ情報ファイル (documentation �le)

キーポイント

1.各コーパスには、データ情報ファイル (00readme.doc)を付加する。

2.データ情報ファイルには、データ固有のさまざまな情報を利用者向けに記述する。

データファイルは単一のファイルではなく、ほとんどの場合複数のファイルによって構成される。縦断的研

究の場合には、異なった日時に採集された複数のファイルの集合であり、横断的研究の場合には、いろいろな

年齢のグループからなるこどものファイルの集合になる。これらの複数のデータファイルで構成される発話

データをコーパス (corpus)と呼ぶ。各コーパスには、データ情報ファイルを付加する。このファイルの名称

は、慣例的に \00readme.doc"となっている。ここには、データベースの利用者がデータを適切に解釈するこ

とができるように、必要な各種の情報を記述する。いわば、データ作成者からデータ利用者へのメッセージで

ある。記述する内容に制限はなく、データ作成者が必要と思われることは何でも書いてかまわない。しかし、

少なくとも以下に挙げる事項は、最少限必要な項目として入れたほうがよいであろう。具体例については、現

在 CHILDESから供給されているコーパスに付属の 00readme.docを参照されたい。

1.謝辞 (Acknowledgements)

当該のコーパスの利用した場合に、データ利用者に特定の文献を関連論文として引用することを義務付

けることができる。たとえば、Brownのコーパスを利用したときは Brown(1973)を引用することが指定

されている。また、CHILDESのデータを利用するユーザーはすべて、MacWhinney and Snow(1990)を

CHILDESの情報元として引用しなければならない。

2.利用制限 (Restrictions)

データ作成者は、CHILDESに提供した自分のデータに対して、利用に関する制限を加えることができる。

たとえば、当該のデータを利用して論文が作成された場合、利用者に論文のコピーを送るように指定する

こともある。しかし、利用に関する制限をしていない研究者も多い。

3.使用上の注意 (Warnings)

当該のデータの利用法に関する注意を記述する。たとえば、データ作成においてスピーチエラーを正確に

記述するように配慮されなかった場合、それを記述し、利用者の注意を喚起したほうがよいだろう。

4.匿名に関する情報 (Pseudonyms)

インフォーマントが、データの利用に同意しているかどうか、また登場人物の匿名性を尊重するため仮名

が使われているかどうかを明記する。一般に、本名は仮名に置き換えられることが多い。自分のこどもの

場合は、本名を使用する場合が多い。

5.経緯 (History)

プロジェクトの経緯について、できるだけ詳しい情報を説明する。たとえば、次のようなものが考えられ

る。プロジェクトに対する助成金の入手方法、研究の目的、資料収集法、標本抽出 (sampling) のしかた、

どのようにデータを入力したのか、データ入力者は熟練者かどうか、入力データはどの程度チェックを受

けているか、なんらかのコード化をしているのか、またしているとしたらどういうコードかなどである。

6.記号類 (Codes)

プロジェクトに独自の記号、コードを使用した場合は、ここで説明を行う。

7.個人情報に関するデータ (Biographical Data)

もし可能であれば、インフォーマントについて詳細な人口統計学的、方言学的、心理測定学的なデータを

記述できるとよい。具体的には、年齢、性別、兄弟、学歴、社会階級、職業、以前の住所、宗教、趣味、

友人などについて説明があるとよい。親が育った場所、家族が前にどこに住んでいたかなどの情報は、言

語変化、地域的特質、方言などに関する社会言語学的な研究に非常に有効である。

14

Page 39: JChatman

2.5. JCHATと minJCHAT

8. 内容一覧 (Table of Contents)

コーパスに含まれるデータファイルの簡単な索引を、ここに掲載するとよい。形式に制限はないが、デー

タの日付とこどもの年齢を一覧形式でのせることが多い。もし MLU値が分かれば、併せて掲載するとな

およい。これらの情報は、当該のデータが特定の研究にどの程度有効なのかについて、データ利用者が判

断する際に非常に便利なものとなる。

9. 場面描写 (Situational Descriptions)

家の構造や部屋の間取りなどの一般的な状況設定は、ここで説明を行うとよい。つまり、コーパス全体を

通して変わらない情報をここで記述し、ファイルによって変わる場面情報などは各ファイルにそれぞれ記

述する。

2.4.4 ファイル形式のチェック

キーポイント

1. CHATファイルの作成、変更を行った際には、必ず CHECKを適用する。

2. CHECKは CLANエディターの中から呼び出して行うと非常に便利である ( ESC に続けて Lを押す)。

ファイルに CHAT形式上の間違いがあると、CLANは正常に動作しないことがある。CLAN の各コマンド

自体にも、ファイル形式に関するごく簡単なチェックを自動的に行う機能があるが、不十分なことも多い。そ

こで CLANには、不適切な CHAT形式を見つけ出し、修正方法を指示してくれるコマンドが用意されている。

これが CHECKである。CHECKは、肉眼によるチェックでは絶対に見落としてしまうような間違いでも、ご

く短時間に残らず探し出してくれる。そのため、結果的にデータ作成の手間を大幅に軽減できることになり、

たいへん便利である。また、のちのちの CLAN利用におけるトラブルも未然に防げるため、ファイルに変更を

加えた際には必ず使用するようにしたい。ぜひ一度 CHECKを動かして、動作の感覚をつかんでほしい。

なお、CHECKは、単独でも間違った箇所を行番号つきで出力できるが、現在では CLANエディター上で

CHECKを起動できるようになった。間違いが見つかったらその場で修正ができるため、作業効率が格段によ

いのが特長である。ぜひ、CLANエディター上での CHECKを体験してほしい。使用方法については、第 20

章を参照。

2.5 JCHATとminJCHAT

現在まで CHILDESに提供された発話データは、すべてアルファベット言語であり、簡単な修正を施すこと

によって ASCII文字で表記することができた。また、文はもともと語ごとに分節されているため、各言語の

正書法をそのまま CHAT 形式の中に生かすことは、ごく容易なことであった。ところが、日本語は文を語に

分けない表記法を用い、膠着言語のため語に別の語が接続していく複雑な構造をしているため、そのままでは

CHAT形式の中に表現するには問題が多い。

そこで、CHATがもつ長所をそのまま維持しながらも、日本語を表記できるようにした表記システムが

JCHAT(Japanese CHAT)である。JCHATは、CHATの基本的な規格に日本語を表記する追加規則を補ったも

のであると考えてよい。つまり、JCHATは、日本語の表記をCLANで分析できるように最適化した、CHATの

拡張フォーマットである。JCHATのうち、CLANが適切に動くための最低限の制約がminJCHATで、日本語の

CHAT形式のデータファイルはすべてこの形式を満たしていなければならない。この節では、このminJCHAT

の説明を行う。基本的な制約は、CHATの場合と同じように次のような 3つの項目に大別される。

1.ファイルが満たすべき形式

2. 発話が満たすべき形式

3.データファイルに関するデータ情報ファイルの記述

15

Page 40: JChatman

第 2章 表記システム CHAT

2.5.1 ファイルが満たすべき形式

ファイル形式は、CHATの場合とほとんど同じである。そのため、以下では JCHATに特有な制約について

解説する。

ファイルで使用しているローマ字表記の種類を、@Codingヘッダーで宣言する。

@Coding: JCHAT 1.0 Hebon (ヘボン式の場合)

これは、使用が認められているローマ字の種類がふたつあるためで、データ利用者が混乱しないように各ファ

イルごとに記述する。ヘボン式、訓令式のどちらを使用しているかをはっきりと明記すること。

2.5.2 発話が満たすべき形式

語や、文の形式については制限が多いので注意する必要がある。

1.文字は半角ローマ字と半角記号、または仮名、仮名漢字の全角文字を使用する。

*ASU: kore Asuka no da yo !

*ASU: これ あすか の だ よ !

*ASU: これ 明日香 の だ よ !

漢字仮名混じりファイルや、仮名ファイルからローマ字への変換は、第 17章で説明されている JCHANGE

を用いるとよい1。一括してローマ字に変換することができるので便利である。

2.ローマ字表記は、ヘボン式か訓令式のどちらかを使用する。ローマ字ならば、なんでも自由に表記してい

いというわけではないので注意する。特に、ヘボン式と訓令式を混同して独自のローマ字体系を使用して

いる人がいるが、注意すること。この制約は、データの利用時に混乱が起こらないようにするために必要

な措置なので厳守しなければならない。特殊なローマ字表記については、第 17章のローマ字一覧表を参

照するとよい。なお、仮名で入力したデータを JCHANGEを使用して一括してローマ字に変換すると、

ローマ字表記が統一できるので便利である。

3.訓令式を使用するときは、固有名詞でもヘボン式を使用しないこと。

*KUM: zya Sesamii no Zyenifaa ni denwa suru ?

これは、前項 2の補足である。訓令式であっても固有名詞はヘボン式で書く慣例があるが、訓令式とヘボ

ン式を混在させないこと。訓令式とヘボン式が混ざっていると、両者間でのデータ形式の変換が困難にな

るためである。

4.文は、分かち書きをして各語を半角スペースで分ける。

*KUM: ja gareeji ni irete ne .

*KUM: じゃ ガレージ に 入れて ね .

ここでいう語とは、名詞、動詞、形容詞、形容動詞、副詞、判定詞、接続詞、助詞、間投詞などをいう。

活用する語については、主要部である動詞、形容詞、形容動詞から時制要素までをひとまとめにすると考

えてよい。したがって、助動詞は前の活用語に接続し、それ自体分かち書きをしない。以上はあくまでも

原則であって、分かりにくい事例もあるので、JCHATにおける分かち書きのルールと語の定義について

は、第 5章の分かち書きを参照。

5.助詞も、自立語として独立して表記する。

*KUM: sore ga koko ni atta yo.

1第 17 章「JCHANGE」は本書では割愛した。

16

Page 41: JChatman

2.5. JCHATと minJCHAT

助詞は、助動詞と同様に付属語だが、活用しないので JCHATでは分けて表記するのを原則とする。しか

し、研究目的によっては、分けたくない場合があるかもしれない。そこで JCHANGEでは、JCHAT形式

を満たしたファイルに対して、自動的に助詞を分けないファイルを自動的に生成する変換方法を第 17章

で解説しているので参照のこと2。

6. 発音と五十音表での表記が一致しない格助詞は、発音通りに表記する。

は (ha) ! wa

を (wo) ! o

へ (he) ! e

発話された通りに正確に記述することと、データ閲覧時の自然さを重視して、文字とつづりの一致関係は

あきらめる。直接ローマ字で入力する際には、普段の入力方法に引きずられてうっかり間違えないように

注意すること。

7. 助詞と音形が同じ名詞、間投詞は、グロスを用いて助詞と区別をする。

助詞 音形 音形が同じ名詞 表記

へ e 柄 e=handle

絵 e=picture

が ga 蛾 ga=moth

か ka 蚊 ka=mosquito

から kara 空 kara=empty

殻 kara=shell

ね ne 値 ne=price

根 ne=root

に ni 二 ni=two

の no 野 no=�eld

を o 尾 o=tail

と to 戸 to=door

は wa 輪 wa=circle

よ yo 夜 yo=night

世 yo=world

助詞はデフォールトであるので、グロスはつけずにそのまま表記する。助詞以外の同音異義語は、=の直後

に上記のグロスを挿入する。汎用性を維持するため、独自のグロスは可能な限り使用しないようにする。

やむを得ず独自の形式を使用した場合には、00readme.docにその旨を明記すること。語とかっこの間に

スペースが入ると、両者が独立の語と解釈されてしまうので注意する。

*ASU: yoochien e itte takusan e=picture o kaita yo.

これらの区別はオプションではなく、義務的である。したがって、原則的にすべてのデータファイルは、

この区別を行うこととする。これは、助詞に関する同音異義語の区別が、他の一般名詞に関する区別と比

べて効率がよいだろうという判断に基づく。しかし、コーパスの規模が膨大で対処しきれないなど、この

作業が障害となってデータベースの公開ができなくなる場合などはこの限りではない。このような場合は、

その旨を 00readme.docに必ず明記すること。一般に、ローマ字を使うことによって同音意義語の区別が

つかなくなる場合、JCHATではかっこを用いて同音意義語の区別を行う。形式は、助詞の場合と同様で

ある。

ame=sweets

ame=rain

2本書では割愛した。

17

Page 42: JChatman

第 2章 表記システム CHAT

これら通常の同音異義語の区別は、オプションであり、必ずしも行う必要はない。

補足

入力しているときは、同音異義語であることが意外に気がつきにくい。そこで、入力が終わってからまとめ

て探したほうが確実で効率がよい。上の助詞をエディターの助詞を検索、置換コマンドで探し、必要なと

きだけ =textのついた形に書き換える(第 17章の解説3を参照)。CLANの形態素解析プログラム (MOR)

の日本語モジュール (JMOR)で、以上の区別が disambiguation-ruleを用いて%mor行である程度自動的に

生成できる。

8.コンマの使用は、呼びかけと外置 (dislocation) の場合に限る。

*ASU: Mama, kore mite ! 呼びかけ

*ASU: Mama mita ? 主語

*ASU: mita,, kore ? 外置

呼びかけや外置の用法は実際の発話では頻出するが、通常の主語の用法と紛らわしいためコンマによって

その使用を区別する。主語はデフォールトの用法で、コンマを使用せずにそのまま表記する。呼びかけの

用法は、コンマを入れて主語と区別する。外置は、コンマをふたつ入れて、さらにそれらと区別をする。

これらの区別は、実際の発話場面や音声情報に強く依存するので、これらの情報にアクセスできるデータ

入力者によって区別されるのが理想的である。判定が難しい場合は、無理にコード化を行わないようにす

る。外置の用法については、Martin(1975)の \afterthought"を参照。

補足

入力する際に、新しい記号の必要性を感じ始めたり、標準的な使い方とは違った記号の使い方することが多

くある。このようなときは、気づいたことをコメントとして一時的に、@Codingヘッダーに入力しておくと便

利である。このヘッダーは、本来CHATフォーマットのバージョンを記述する場所だが、このようにリマイン

ダーとしても利用し、データ入力が終わってから全ファイルのフォーマットをそろえるときに役立つ。なお、

特殊な記号やコードを使った場合は、00readme.docでもその旨を必ず明記すること。

補遺

CHAT 形式のうち、定型部分を自動的に入力する方法

*ASU: TAB とか%com: TAB といった IDをいちいちタイプする必要はない。この手の作業は、やればやる

ほどうんざりするものだが、できるだけ入力の手間を省く方法がいくつかある。ここでは、ファイル作成のノ

ウハウを 3種類紹介しよう。

1.ワープロやエディターの置換コマンドを利用する。

2.ワープロやエディターの短文登録機能を利用する。

3. CLANエディターを使う。

これらは、それぞれ一長一短であり、各自の好みに応じて最適の方法を見つけ出すとよい。

1.ワープロやエディターの置換コマンドを利用する。

基本的にエディターの検索置換能力を利用する。まず、登場人物が明日香ちゃんだと仮定する。入力する

ときに発話内容の前に \aaa"を挿入する。文字列は、他の記号と混同する恐れがなければ基本的にどんな

文字列でもよく、タブを何回か連続させるのも使いやすいだろう。ファイルが一通りできた時点で、先ほ3本書では割愛した。

18

Page 43: JChatman

2.5. JCHATと minJCHAT

どの文字列を \*ASU: "に置換する。都合、登場人物の数だけ作業を行う必要があるが、ファイルが長

くなればなるほど、この方法の恩恵を実感できるはずである。

2.ワープロ、エディター、FEP の短文登録機能を利用する。

問題の文字列を短文として登録し、必要なときにワンタッチで呼び出すようにする。最近の主要なワー

プロの多くが、短文登録に類する機能を備えているはずである。ソフトによって、登録のしかた、登録

できる内容、登録数などは異なる。また、仮名漢字変換ソフト (FEP)もこの機能をもっている場合があ

り、ない場合でも変換対象の文字列を直接辞書登録すれば、変換キーを押すだけで目的の文字列に変換

できる。仮名で入力する人には使いやすいだろう。たとえば、Macの EGWordの場合には次のようにな

る。まず、*ASU: TAB などをマウスで選択し、Command+Cキーを押してクリップボードにコピーす

る。次に挿入メニューから「短文」を選ぶ。すると、選択した短文に対応する呼び出しキーを受け付け

る状態になるので、適当な文字を選んで登録は完了である。例えば \a"を指定したときは、 挿入した

いカーソル位置でファンクションキー +aを押すだけで*ASU: TABが画面に現われる。発話者の IDの

他に、[=! warau]や%gpx: TAB yubisasuのように各自が頻繁に使うコードや、子どもがよく使う表現

(\omocha no chachacha")を登録すると入力が速くなり、入力ミスも減るので便利である。FEPの辞書に

登録する場合は、辞書を編集する機能 (どの FEPにも必ずある)を呼び出して、「あすか」という入力の変

換候補に \*ASU: "を登録する。その後、文頭で「あすか」と打った後で変換キー (通常はスペースキー)

を押すと「飛鳥」などの候補が出てくるが、何回か候補を出して先ほど登録した文字列を呼び出す。

3. CLANエディターを使う。

すでに述べた通り、CLANエディターは CHAT用のエディターである。基本的に 2の方法と同じロジッ

クを使うが、登場人物の IDは@Participants:の情報を参照して自動的にコード部分を生成する点でさら

に洗練されている。ヘッダー部分を完成した後、speakersメニューから updateを選ぶと、自動的に登場

者の IDがマクロコマンドとして登録され、コマンドキーと該当の番号を押せば自動的に呼び出すことが

できる。より詳しい解説や具体例は CLANエディターの項を参照のこと。

これまでにも述べてきたが、CLANエディターは CHATファイルを扱う際にいろいろな利点がある優れたエ

ディターである。普段使用するエディターがとくに決まっていない人は、CLANエディターを利用するとよい。

また、すでに愛用のエディターがある人でも、一度試しに使ってみることをお勧めする。CLANエディターを

利用した入力方法については、19章を参照。

後書き

1. 例は、すべてヘボン式で書かれている。

2.この原稿の作成にあたって、大野清幸さん (愛知淑徳短期大学)、岩立志津夫さん (静岡大学)に貴重なコメ

ントを頂きました。ここに記して感謝致します。

文献

1. Brown, R. (1973). A �rst language: The early stages. Cambridge, MA:Harvard.

2. MacWhinney, B., & Snow, C. (1990). The Child Language Data Exchange System: An update. Journal

of Child Language, 17, 457{472.

3. Martin, Samuel E. (1975). A Reference Grammar of Japanese, New Haven:

19

Page 44: JChatman
Page 45: JChatman

第3章 ローマ字表記:ヘボンと訓令

南雅彦

3.1 はじめに

この章では、まず最初に表音文字としてのローマ字の綴り方の歴史をたどりながら、主にヘボン式と訓令式

の違いを解説する。それを基にして、ヘボン式と訓令式の JCHATへの適用を考察する。最後に、発話データ

を入力するときに、利用しやすいよう JCHATローマ字表記ルールと適用例をまとめる。

3.1.1 日本語のローマ字表記:ローマ字の綴り方の歴史

ローマ字の綴り方は、おおむね、ヘボン式、訓令式、そして日本式に分類することができる。ヘボン式は、

明治時代に米国人宣教師 James Curtis Hepburn(1815-1911)が編纂した辞書「和英語林集成」によって広まっ

たものである。ところが、日本語に適したローマ字の綴り方を使用すべきだという主張も一方で根強くあり、

いわゆる日本式として広まっていった。下記の表 3.1では、ヘボン式と日本式の違いについてのみ表記してあ

るが、最も大きな違いは、ヘボン式が、音声レベルでの違い (phonetic distinction)に基づいているのに対し

て、日本式は、日本語の音の体系としての五十音図を重視し、それにローマ字を振り当てたのである。言い換

えれば、ヘボン式は、実際に音に区別がないなら、表記方法に区別はない、たとえば、「じ」と「ぢ」は同じ音

であるので区別はしないで、\ji"と表記する。同様に、「ず」と「づ」も音声レベルでの区別がないのでヘボン

式では \zu"と表記することになる。ところが、日本式の場合は、五十音を基にしているのでたとえ「じ」と

「ぢ」、また「ず」と「づ」になんら音に違いがなくとも、これらを区別することになる (表 3.1参照)。

こうしたなかで、ローマ字の綴り方に関して 1937年の内閣訓令「国語ノローマ字綴方ニ関スル件」が出さ

れた。これによってローマ字の統一化を図ろうとしたのであるが、これが、訓令式の始まりである。

下記の表 3.2は、訓令式に基づくローマ字綴り表であり、これは後に述べる訓令式の第 1表でもある。ここ

で分かるのは、訓令式は、日本式とも、ヘボン式とも異なり、抽象的な音素レベル (phonemic level)を基にし

ているということである。つまり、訓令式では、日本式とは異なり、「ず」と「づ」の区別は行なわないし、ま

た、「じ」と「ぢ」の区別も行なわない。

訓令式とヘボン式の大きな違いは、ヘボン式が上述したように、音声レベル (phonetic level)であるのに対

して、訓令式が、もっと抽象的な音素レベル (phonemic level)であるということである。どんな言語にも、同

一の音素の成因、すなわち異音 (allophone)が存在する。それぞれ異なった音声環境にあるため調音点が多少

異なっていて音声学的には同一の音ではないが、その言語のなかにおいては同じだ、と見なさる音である。た

とえば、外来語はさて置き、[shi]と [si]の音は、日本語においては区別されない。日本語では [s]と [sh]は/s/

という同一の音素の成員とみなされるからである。音素/s/は前舌母音 (front vowel)[ i ]が後に続く場合には、

口蓋化 (palatalization)による同化 (assimilation)をおこして、[sh]となる。したがって、訓令式ではヘボン式

と異なり、「し」を、\shi"ではなく \si" と表記する。また、五十音図の配列から考えると、\sa,shi,su,se,so"

よりも、\sa,si,su,se,so"とする方が、規則性が高いという利点もある。

同様に、日本語では [ch]、[ts]、[t]は/t/という同一の音素の成員とみなされるので、訓令式では、「ち」を

\chi"ではなく \ti"、「つ」を \tsu"ではなく \tu"と表記する。音素/t/は前舌母音 (front vowel)[ i ]が後に続く

場合には、口蓋化 (palatalization)による同化 (assimilation)をおこして、[ch]となるのである。一方、音素/t/

21

Page 46: JChatman

第 3章 ローマ字表記:ヘボンと訓令

表 3.1: ヘボン式と日本式の相違

ヘボン式 日本式

し shi si

じ ji zi

ち chi ti

ぢ ji di

つ tsu tu

づ zu du

ふ fu hu

しゃ sha sya

しゅ shu syu

しょ sho syo

じゃ ja zya

じゅ ju zyu

じょ jo zyo

ちゃ cha tya

ちゅ chu tyu

ちょ cho tyo

ぢゃ ja dya

ぢゅ ju dyu

ぢょ jo dyo

は後舌母音 (back vowel)[u]が後に続く場合には、同化 (assimilation)をおこして、[ts]となるのである。さら

に、\ta,chi,tsu,te,to"よりも、\ta,ti,tu,te,to"の方が、規則性が高いという利点もある (表 3.2参照)。

つまり、「し」、「ち」、「つ」の音は、音声レベルのヘボン式では、\shi"、\chi"、\tsu"と表記するが、外来

語はさて置き、日本語に関する限り、音素レベルの訓令式では、これらの音は \si"、\ti"、\tu"と表記する。

ただし、外来語は多く存在するので、たとえば、英語では、\ti"と \chi"は、明らかに異なるのであるから、

訓令式でのそうした扱いを考慮しなければならない。それに関しては、この章の後半で考察する。

3.1.2 訓令式ローマ字:ヘボン式、日本式との相違

1954年 12月 9日、国語審議会の建議にもとづいて、内閣告示「ローマ字の綴り方」、並びに内閣訓令「ロー

マ字の綴り方の実施について」が出され、そこで、現代表記で用いるローマ字の綴り方が定められた。この改

訂版では、1937年に定められた旧来の訓令式を第 1表とした。さらに、それにもれた書き方で一般に使用され

ているもの、すなわち、ヘボン式、日本式で異なって示されているものを第 2表として追加したのである。内

閣告示は「一般に国語を書き表す場合は、第 1表に掲げた綴り方によるものとする」と定めているので、やは

り、従来の訓令式が基本原則と言える。

それにもかかわらず、訓令式・ヘボン式・日本式という折衷的な現象が生まれたのは、第 2次世界対戦後の

連合国最高司令部が、地名の英文による表記に関してヘボン式を採用していたこと (連合国最高指令第 2 号)、

またその影響で、外務省や運輸省関係のローマ字には、ヘボン式が使われていたため、そのことを無視できな

い状況にあったからである。前書きの第 2項に「国際関係その他従来の慣例をにわかに改めがたい事情にある

場合に限り、第 2表に掲げたつづり方によっても差しつかえない」と記したのはそのためである (表 3.3参照)。

訓令式第 2表 (この章の表 3.3)の内、表 3.4に記した 14綴りが、訓令式とヘボン式の相違点である。ところ

22

Page 47: JChatman

3.1. はじめに

が、訓令式第 2表には、他にも訓令式とは異なる綴りが列挙されている。それらの内、表 3.5に記した 6つの

綴りが、訓令式と日本式の相違点である。

表 3.2: 訓令式ローマ字綴り表

あ い う え お

a i u e o

か き く け こ きゃ き ゅ きょ

ka ki ku ke ko kya kyu kyo

さ し す せ そ しゃ しゅ しょ

sa si su se so sya syu syo

た ち つ て と ちゃ ちゅ ちょ

ta ti tu te to tya tyu tyo

な に ぬ ね の にゃ にゅ にょ

na ni nu ne no nya nyu nyo

は ひ ふ へ ほ ひゃ ひゅ ひょ

ha hi hu he ho hya hyu hyo

ま み む め も みゃ みゅ みょ

ma mi mu me mo mya myu myo

や い ゆ え よ

ya (i) yu (e) yo { { {

ら り る れ ろ りゃ りゅ りょ

ra ri ru re ro rya ryu ryo

わ い う え よ

wa (i) (u) (e) (o) { { {

n

が ぎ ぐ げ ご ぎゃ ぎゅ ぎょ

ga gi gu ge go gya gyu gyo

ざ じ ず ぜ ぞ じゃ じゅ じょ

za zi zu ze zo zya zyu zyo

だ ぢ づ で ど ぢゃ ぢゅ ぢょ

da (zi) (zu) de do (zya) (zyu) (zyo)

ば び ぶ べ ぼ びゃ びゅ びょ

ba bi bu be bo bya byu byo

ぱ ぴ ぷ ぺ ぽ ぴゃ ぴゅ ぴょ

pa pi pu pe po pya pyu pyo

(注)1937年の表と 1954年の第 1表は、原則的に同じであるが、ここに掲げた表は、1937年の表よ

りは、1954年の表に近いものである。

23

Page 48: JChatman

第 3章 ローマ字表記:ヘボンと訓令

表 3.3: ローマ字の綴り方・第 2表 (1954年 12月 9日内閣告示)

しゃ し しゅ しょ

sha shi shu sho

tsu

ちゃ ち ちゅ ちょ

  cha chi chu cho

fu

じゃ じ じゅ じょ

ja ji ju jo

 ぢ づ ぢゃ ぢゅ ぢょ

di du dya dyu dyo

くぁ

kwa

ぐぁ

gwa

wo

表 3.4: 訓令式とヘボン式の相違

訓令式 ヘボン式

しゃ sya sha

し si shi

しゅ syu shu

しょ syo sho

つ tu tsu

ちゃ tya cha

ち ti chi

ちゅ tyu chu

ちょ tyo cho

ふ hu fu

じゃ zya ja

じ zi ji

じゅ zyu ju

じょ zyo jo

24

Page 49: JChatman

3.1. はじめに

表 3.5: 訓令式と日本式の相違

訓令式 日本式

ぢ zi di

づ zu du

ぢゃ zya dya

ぢゅ zyu dyu

ぢょ zyo dyo

を o wo

3.1.3 ローマ字の綴り方:訓令式そえがきとヘボン式表記

内閣告示「ローマ字のつづり方」にはさらに「そえがき」があり、その中で、JCHATの訓令表記に密接な

関係のある 4点に関して述べることにする。

1. 撥音 (syllabic nasal)、つまり跳ねる音「ん」は全て \n"と書くことが訓令表記であるが、ヘボン式では、

撥音が \m・b・p"の前に来る場合には、\m"を用いて表す。JCHATでも、それぞれ同様の扱いとする。

たとえば、「喚問/関門」という言葉は、訓令式では \kanmon"だが、ヘボン式では \kammon"となる。

同様に、「伝聞/電文」という言葉は、訓令式では \denbun"となるが、ヘボン式ではこれが \dembun"と

なる。また、「憲法/拳法」は、訓令式では \kenpoo"だが、ヘボン式では \kempoo"となる。

なお、撥音 (syllabic nasal)をあらわす \n"と次に来る母音、または準母音 (semivowel)\y"とを切り離す

場合には「 ’」を入れることになっている (内閣告示「ローマ字のつづり方」の「そえがき 2」)。これは、

訓令式だけではなく、JCHATにおいては、ヘボン式でも同様の扱いとする。たとえば、「かんい (簡易)」

は \kan'i"と表記しないと \kani"「かに (蟹)」と区別がつかない。また、「かんえん (肝炎)」は \kan'en"

と表記しないと \kanen"「かねん (可燃)」と区別がつかない。同様に、「満員」、「原因」、「完訳/簡約」、

「転用」、「肝油」は、それぞれ \man'in" 、\gen'in"、 \kan'yaku"、 \ten'yoo"、\kan'yu"と表記する。

2. 促音 (double consonant) 、すなわち「つまる音」は最初の子音字を重ねて表すことが、内閣告示「ローマ字

のつづり方」の「そえがき 3」で決まっている。たとえば、「圧迫」、「国会」、「突進」はそれぞれ \appaku"、

\kokkai"、\tossin"(訓令)/ \tosshin"(ヘボン)とする。JCHATでは、訓令式表記、ヘボン式表記に関わ

らず、促音は最初の子音字を重ねて表すこととする。ただし、ヘボン式では \ch"と表記される音の前で

は、\t"を用いる。

3. JCHATでは、長母音 (long vowel) は母音を繰り返すことで表現する。訓令式では、長母音 (long vowel)

は母音の上に長音符号を付けて示してもよいが、内閣告示「ローマ字のつづり方」の「そえがき」は「お

おむね」という語によってゆとりがもたせてあるので、たとえば、おばあさん \obaasan"、空路 \kuuro"、

映画 \eega"、通り \toori"とすることでなんら問題はない。したがって、訓令式表記、ヘボン式表記に関

わらず、JCHATにおいては、長母音 (long vowel)は母音を繰り返すことで表現する。

4. JCHAT訓令表記における特種音の扱い

この章の初めの方で、日本語においては、異音、たとえば、\ti"と \chi"の音は区別されないので、訓令

式では、\chi"ではなく \ti" と表記すると述べた。

ところが、日本語には、外来語が多く存在する。たとえば、英語では、\ti"と \chi"は、明らかに異なる

のであるから、その扱いを考えなければならない。内閣告示「ローマ字のつづり方」の「そえがき」は特

種音に関して、自由としながらも、原則 7で次のように指針が示されているので、JCHATの訓令表記で

もそれにしたがうことにする。

1.「クァ・クィ・クェ・クォ」は \kwa, kwi, kwe, kwo"とする。

2.「シェ・チェ・ジェ」は \sye, tye, zye"とする。

25

Page 50: JChatman

第 3章 ローマ字表記:ヘボンと訓令

3.「ツァ・ツェ・ツォ」は \twa, twe, two"とする。

4.「ティ・トゥ」は \t'i, t'u"とする。

5.「ディ・デュ」は \di, dyu"とする。

6.「ファ・フィ・フェ・フォ・フュ」は \fa, �, fe, fo, fyu"とする。

7.「ウィ・ウェ・ウォ」は \wi, we, wo"とする。

たとえば、(イ)の「チェ」を用いると「チェーン」は訓令式では \tyeen" と表記されるが、ヘボン式では

\cheen"である。同様に、(ウ)の「ティ」を用いると訓令式では「コーティング」は \koot'ingu"と表記

されるが、ヘボン式では \kootingu"と表記される。ヘボン式では、外来語を表記する場合に、特別な表記

法を設ける必要がないということを、ここに付け加えておく。

JCHATローマ字表記ルールと適用例

ヘボン式表記と訓令式表記

規則 1:(下記の訓令式とヘボン式の対比表参照)

訓令式 ヘボン式

しゃ sya sha

し si shi

しゅ syu shu

しょ syo sho

つ tu tsu

ちゃ tya cha

ち ti chi

ちゅ tyu chu

ちょ tyo cho

ふ hu fu

じゃ zya ja

じ zi ji

じゅ zyu ju

じょ zyo jo

以下の適用例は、訓令式とヘボン式で転記資料 (トランスクリプト) を作ったときの相違を示している。

訓令式 *MOT: sore ga itiban hurui kioku desu.

ヘボン式 *MOT: sore ga ichiban furui kioku desu.

訓令式 *CHI: boku sitteru kedo moo osimai.

ヘボン式 *CHI: boku shitteru kedo moo oshimai.

規則 2:訓令表記では撥音 (syllabic nasal)、つまり跳ねる音「ん」は全て \n"と表す。ヘボン式では、撥音

が \m・b・p" の前に来る場合には、\m"を用いて表す。

26

Page 51: JChatman

3.1. はじめに

(例)

撥音 訓令式 ヘボン式

かんもん (喚問/関門) kanmon kammon

しんまい (新米) sinmai shimmai

しんぶん (新聞) sinbun shimbun

えんばん (円板) enban emban

でんぶん (伝聞/電文) denbun dembun

けんぽう (憲法/拳法) kenpoo kempoo

ダンプカー danpukaa dampukaa

ピンポン pinpon pimpon

ポンプ ponpu pompu

ランプ ranpu rampu

以下の適用例は、訓令式とヘボン式で転記資料 (トランスクリプト) を作ったときの相違を示している。

訓令式 *CHI: denpoo ga todoita .

ヘボン式 *CHI: dempoo ga todoita .

訓令式 *MOT: kotosi no sinmai wa oisii .

ヘボン式 *MOT: kotoshi no shimmai wa oishii .

規則 3:訓令式表記、ヘボン式表記に関わらず、JCHATにおいては、撥音 (syllabic nasal) をあらわす\n"

の直後に母音、または準母音 (semivowel)が来る場合、\n"と \y"とを切り離すために「'」を入れる。

撥音 訓令式 ヘボン式

かんい (簡易) kan'i kan'i

かんえん (肝炎) kan'en kan'en

かんやく (完訳/簡約) kan'yaku kan'yaku

かんゆ (肝油) kan'yu kan'yu

げんいん (原因) gen'in gen'in

でんあつ (電圧) den'atu den'atsu

てんよう (転用) ten'yoo ten'yoo

てんいん (店員) ten'in ten'in

まんいん (満員) man'in man'in

以下の適用例は、訓令式とヘボン式で転記資料 (トランスクリプト) を作ったときの相違を示している。

訓令式 *CHI: densya ga man'in da .

ヘボン式 *CHI: densha ga man'in da .

訓令式 *MOT: gen'in wa nan desyoo .

ヘボン式 *MOT: gen'in wa nan deshoo .

27

Page 52: JChatman

第 3章 ローマ字表記:ヘボンと訓令

規則 4:訓令式表記、ヘボン式表記に関わらず、JCHATにおいては、促音 (double consonant)は最初の子

音字を重ねて表す。

促音 訓令式 ヘボン式

っじゃ zzya jja

っじゅ zzyu jju

っじぇ zzye jje

っじょ zzyo jjo

っふ hhu �u

っじ zzi jji

ただし、ヘボン式では \ch"と表記される音の前では、\t"を用いる

促音 訓令式 ヘボン式

みっちゃく (密着) mittyaku mitchaku

ねっちゅう (熱中) nettyuu netchuu

しゅっちょう (出張) syuttyoo shutchoo

以下の適用例は、訓令式とヘボン式で転記資料 (トランスクリプト) を作ったときの相違を示している。

訓令式 *CHI: hasittyatta no .

ヘボン式 *CHI: hashitchatta no .

訓令式 *MOT: asita kara otoosan wa syuttyoo yo .

ヘボン式 *MOT: ashita kara otoosan wa shutchoo yo .

規則 5:訓令式表記、ヘボン式表記に関わらず、JCHATにおいては、長母音 (long vowel)は母音を

繰り返すことで表現する。

撥音 訓令式 ヘボン式

おばあさん obaasan obaasan

おじいさん oziisan ojiisan

にいがた (新潟) Niigata Niigata

タクシー takusii takushii

くうろ (空路) kuuro kuuro

ふうせつ (風説) huusetu fuusetsu

じゅんびちゅう (準備中) zyunbityuu jumbichuu

えいが (映画) eega eega

ケーブル keeburu keeburu

エレベーター erebeetaa erebeetaa

せいぎょ(制御) seegyo seegyo

むこう mukoo mukoo

けしょうしつ (化粧室) kesyoositu keshooshitsu

ひじょうぐち (非常口) hizyooguti hijooguchi

とおり (通り) toori toori

おおきい (大きい) ookii ookii

28

Page 53: JChatman

3.1. はじめに

以下の適用例は、訓令式とヘボン式で転記資料 (トランスクリプト) を作ったときの相違を示している。

訓令式 *CHI: oziityan wa genki da .

ヘボン式 *CHI: ojiichan wa genki da .

訓令式 *MOT: kesyoositu wa doko desu ka .

ヘボン式 *MOT: keshooshitsu wa doko desu ka .

文献

1. Jorden E.H., & Noda, M. (1987). Japanese: The spoken language, Part I.New Haven, CT: Yale Univer-

sity Press.

2. Ladefoged,P. (1982). A course in phonetics. New York: Harcourt Brace Jovanovich.

3. Masuda, K. (1974). New Japanese-English dictionary (4th ed.). Tokyo: Kenkyusha.

4. Minami, M. (1991). Coding rules for the CHAT system in Japanese. Unpublished manuscript, Harvard

University.

5. Shibatani, M. (1990). The languages of Japan. Cambridge, UK: Cambridge University Press.

6. 武部良明. (1979). 日本語の表記. 角川書店.

後書き

本章は、1994年 JCHAT meetingにおける口頭発表の内容に加筆・修正を施したものである。加筆・修正に

関して、マッギル大学の大嶋百合子氏をはじめ、meetingに参加された JCHAT会員の方々に大変有意義なご

助言をいただいた。記して感謝の意を表したい。また、校正、編集の過程で大変お世話になった静岡大学の岩

立志津夫氏にもこの場を借りて感謝の意を表したい。

用語説明

訓令式第 1表 1937 年に定められた旧来の訓令式。

訓令式第 2表 訓令式第1表にもれた書き方で一般に使用されているもので、ヘボン式、日本式で、訓令式と

は異なって示されているもの。

ヘボン式 明治時代に米国人宣教師 James Curtis Hepburn (1815-1911)が編纂した辞書「和英語林集成」によっ

て広まったローマ字の綴り方。

日本式 日本語に適したローマ字の綴り方を考案すべきだということで、考案されたローマ字の綴り方。

異音 (allophone) それぞれ異なった音声環境にあるため調音点が多少異なっていて音声学的には同一の音で

はないが、その言語のなかにおいては同じだ、と見なさる音。たとえば、外来語はさて置き、[shi]と [si]

の音は、日本語においては、その差は何の意味もないので、日本語では [s]と [sh]は/s/という同一の音

素の成員 (allophonic variants)とみなされる。

同化 (assimilation) ある音が、隣接 (近接)するほかの音の影響で、それに類似した音や、それと同一の音に

置き換えられること。

後舌母音 (back vowel) 舌のどの部分が最も高くなっているかによって、母音を分類した場合の一種。

促音 (つまる音)(double consonant) \appaku"、\kokkai"、\tossin"(訓令)/ \tosshin"(ヘボン)など。

29

Page 54: JChatman

第 3章 ローマ字表記:ヘボンと訓令

前舌母音 (front vowel) 舌のどの部分が最も高くなっているかによって、母音を分類した場合の一種。

長母音 (long vowel) おばあさん \obaasan"、委員会 \iinkai"、空路 \kuuro"、映画 \eega"、通り \toori"など。

口蓋化 (palatalization) 子音を発音する場合、前舌面が硬口蓋に向かって持ち上げられ、その子音に [j]また

は [i]のような音が加わること。

phonemic distinction 抽象的な音素レベルでの違い。

phonetic distinction 音声レベルでの違い。

撥音 (syllabic nasal) 跳ねる音「ん」。

30

Page 55: JChatman

3.1. はじめに

表 3.6: JCHAT用ヘボン式ローマ字表

あ い う え お

a i u e o

か き く け こ きゃ きゅ きょ

ka ki ku ke ko kya kyu kyo

さ し す せ そ しゃ しゅ しょ

sa shi su se so sha shu sho

た ち つ て と ちゃ ちゅ ちょ

ta chi tsu te to cha chu cho

な に ぬ ね の にゃ にゅ にょ

na ni nu ne no nya nyu nyo

は ひ ふ へ ほ ひゃ ひゅ ひょ

ha hi fu he ho hya hyu hyo

ま み む め も みゃ みゅ みょ

ma mi mu me mo mya myu myo

や い ゆ え よ

ya (i) yu (e) yo { { {

ら り る れ ろ りゃ りゅ りょ

ra ri ru re ro rya ryu ryo

わ い う え よ

wa (i) (u) (e) (o) { { {

n

が ぎ ぐ げ ご ぎゃ ぎゅ ぎょ

ga gi gu ge go gya gyu gyo

ざ じ ず ぜ ぞ じゃ じゅ じょ

za ji zu ze zo ja ju jo

だ ぢ づ で ど ぢゃ ぢゅ ぢょ

da ji zu de do (ja) (ju) (jo)

ば び ぶ べ ぼ びゃ びゅ びょ

ba bi bu be bo bya byu byo

ぱ ぴ ぷ ぺ ぽ ぴゃ ぴゅ ぴょ

pa pi pu pe po pya pyu pyo

31

Page 56: JChatman

第 3章 ローマ字表記:ヘボンと訓令

表 3.7: JCHAT用訓令式ローマ字表

あ い う え お

a i u e o

 か き く け こ きゃ きゅ きょ

ka ki ku ke ko kya kyu kyo

さ し す せ そ しゃ しゅ しょ

sa si su se so sya syu syo

た ち つ て と ちゃ ちゅ ちょ

ta ti tu te to tya tyu tyo

な に ぬ ね の にゃ にゅ にょ

na ni nu ne no nya nyu nyo

は ひ ふ へ ほ ひゃ ひゅ ひょ

ha hi hu he ho hya hyu hyo

ま み む め も みゃ みゅ みょ

ma mi mu me mo mya myu myo

や い ゆ え よ

ya f(i) yu (e) yo { { {

ら り る れ ろ りゃ りゅ りょ

ra ri ru re ro rya ryu ryo

わ い う え よ

wa (i) (u) (e) (o) { { {

 n

が ぎ ぐ げ ご ぎゃ ぎゅ ぎょ

ga gi gu ge go gya gyu gyo

ざ じ ず ぜ ぞ じゃ じゅ じょ

za zi zu ze zo zya zyu zyo

だ ぢ づ で ど ぢゃ ぢゅ ぢょ

da (zi) (zu) de do (zya) (zyu) (zyo)

ば び ぶ べ ぼ びゃ びゅ びょ

ba bi bu be bo bya byu byo

ぱ ぴ ぷ ぺ ぽ ぴゃ ぴゅ ぴょ

pa pi pu pe po pya pyu pyo

32

Page 57: JChatman

第4章 ファイル・ヘッダー

宮田Susanne・岩立志津夫ファイル・ヘッダー (File Headers)とは、形式的には最初に@がついた行を指し、ファイルに関する情報、例

えば登場人物や発話場面などについての情報を示すために使われる。主に 3つの種類がある。第 1が、必ず記

入しなければならないもので、不可欠のヘッダー (Obligatory Headers)と呼ばれている。第 2が、不可欠では

ないがファイル全体に関わる情報を記載するためのもので、変更のないヘッダー (Constant Headers)と呼ばれ

ている。第 3が、1つのファイルの中でその内容が随時変化しうるもので、変更可能なヘッダー (Changeable

Headers)と呼ばれている。

4.1 不可欠のヘッダー

全ての CHATファイルには 3つのヘッダー (@Begin、@Participants:、@End)を書く必要がある。この 3

つのヘッダーがないと CLANプログラムが動作しない。

次にそれぞれのヘッダーの役割と記載の方法について述べる。

@Begin

第 1行に書いて、ファイルの始まりを知らせる。コロンはつかない。

@Participants:

第 2行に書いて、ファイルに登場する登場者を定義する。3つの大文字 (スピーカ IDコード )・名前・役

割の 3つの要素から構成される。3つの要素間には半角空白をいれる。登場人物の場合は、カンマで区

切ってつなげる。役割や名前が 2つの語からできている場合には、_(下線文字)でつなぐ (Target_Child

のように)。

@participants: ASU Asuka Target_Child, HIM Himiko Mother,

JUN Junko Observer

@Participants: CH1 Haruhiko Child1, MO1 Kyoko Mother1

@Participants: CHI Shoko, MOT Sachiko

補足

1. スピーカ IDコードは登場者を他の登場者と区別するもので、必ず 3つの文字で表記する。そうしな

いと CLANプログラムは IDコードとして認識してくれない。一般的に名前の最初の 3文字をとる

ことが多いが、最初の 3文字が一致する場合、例えば母親が Junkoで子どもが Junichiの場合には、

この方法はとれないので注意する。横断的な研究では、CHI や MOT のような役割を示す記号を使

う場合もある。CH1,CH2のように数字を一部に使うことも可能である。

2. 名前を省略することも可能である。しかし、発話の中で登場者について述べる時不便なので、名前

を匿名化したい場合には、本名ではなく仮の名を使う方がいいだろう。

3. 役割としては次のようなものがある。

Target_Child, Child, Mother, Father, Brother, Sister, Sibling,

Grandmother, Grandfather, Aunt, Uncle, Cousin, Family_Friend,

33

Page 58: JChatman

第 4章 ファイル・ヘッダー

Playmate, Visitor, Student, Teacher, Investigator, Examiner,

Observer, Camera_Operator, Doctor, Nurse, Patient, Client, Subject,

Unidentified, Adult, Teenager, Non_Human, OffScript, Narrator

これらのものは Dep�leと呼ばれる特殊なファイルに 94/10現在登録されているものである。これ

以外のもの (日本語のローマ字表記も含む。例えば Hahaoya)を使うことも可能である。しかしその

場合には Dep�leに登録する必要がある。登録しないと CHECKプログラムの分析でエラーがでる。

@End

ファイルの最後の行に書き、ファイルの終わりを知らせる。コロンはつけない。

4.2 変更のないヘッダー

変更のないヘッダーは、不可欠のヘッダー (@Beginと@Participants:)と発話を記述するメイン・ラインの

間に置かれる。したがって、このヘッダー・ラインの始まりは 3行目からで、ファイル全体に関する補足的な

情報を提供するためのものである。ファイルの途中で変更することのない情報を提示するという意味で、変更

のないヘッダーと呼ばれる。このヘッダーには最後にコロンがつく。コロンがある場合には何らかの情報が書

かれる。ファイルの種類によって不用なものもあるので、研究の目的に合わせて適当に選択する。主なものに

次のようなものがある。

@Age of XXX:

登場者の年齢を示す。年月日の順で記入する。

@Age of ASU: 6;4.18

@Birth of XXX:

登場者の生年月日を、日・月・年の順で記入する。月は JAN FEB MAR APR MAY JUN JUL AUG SEP OCT NOV

DEC として書き、年には西暦年を使う。

@Birth of AKI: 23-JAN-1990

@Coding:

JCHAT のバージョンやローマ字表記法を記入する。ヘボン式の場合は Hebon、訓令式の場合は Kunrei

とする。

@Coding: JCHAT 1.0 Hebon

@Coding: JCHAT 1.0 Kunrei

@Coder:

転写者名を記入する。転写者とは、ファイルを書き込み、記号化した人の名前である。

@Education of XXX:

登場者の教育水準を教育を受けた年数で記入する。0から 12までは小、中、高等学校、13 から 16まで

は大学を意味する。例は 12+2= 14で短大卒という意味である。

@Education of HIM: 14

34

Page 59: JChatman

4.3. 変更可能なヘッダー

@Filename:

ファイルの名前を記入する。この記入があると、間違って違うファイル名で保存してしまった時や、コ

ピーする時に便利である。

@ID:

STATFREQという CLANプログラムで分析をするためのコードを記入する。様々な登場者に関する情

報をコード化して、順番に入れることができる。次の例の場合には、スピーカー IDが KOOという登場

者の性別は 1で、年齢段階は 25で、発達段階は 4であることを示している。

@ID: 1.25.4.23=KOO

@Language:

転写するのに使う言語を記述する。

@Language: Japanese

@Language of XXX:

登場者が使う言語が複数の場合、主に使われる言語を示すのに使用される。特定の相互交渉の場面で使

用された言語を示すのには、@bgや@egを使う。そうすれば GEMプログラムを使うことができる。言語

交代が頻発する場合には、ディペンデントティアの%lan:を使って使用言語を区別する (詳しくは第 11章

を参照)。

@SES of XXX:

登場者の社会経済的階層 (socioeconomic status)を記入する。例えば、欧米ではwelfare(生活保護), lower(下

層), working(労働階層),lower-middle(中下層), middle(中層), upper-middle(上中層), upper(上層)などの

分類がある。これに関しては DEPFILE に指定がないので記入の形式が自由である。

@SES of TAM: working

@Sex of XXX:

登場者の性別を記入する。女性の場合 female、男性の場合 male を使う。

@Sex of KOO: female

@Warning:

ファイルの持つ欠点・特徴・注意点などを記入する。典型的ものとして次の 5つがある。

1. 発話がなされた場面に関する情報が含まれていない。

2. 言い直しや言いよどみなどが正確に記録されていない。

3. 同時発話の記号化が正確に行われていないため、同時発話の分析には向いていない。

4.ファイルがダブルチェックされていない。

5.ファイルが CHECKを通していない。

4.3 変更可能なヘッダー

変更可能なヘッダーは、ファイルのはじめだけでなく途中でも随時つけられる。ファイルの中で変化する情

報を提供するもので、情報が変化した時点で挿入する。変更可能なヘッダーがないことは、それまでの状態が

続いていることを意味する。主なものとして次のものがある。

35

Page 60: JChatman

第 4章 ファイル・ヘッダー

@Activities:

発話場面での主な活動を記述するために使われる。@Situation:は発話の全体的な状況や場面を記述す

る時に使われるのに対して、@Activities:はその場面で行われた具体的な活動内容を列挙する。

@Activities: kutsu o haite kaban o shotte genkan o deru.

@Bgと@Bg:

GEMプログラムが対象にする部分の始まりを指示するために使われる。GEMプログラムは、ファイル

の特定の場所を指定してそこを分析するために使われる。分析の始まり部分を@Bgと@Bg:で、終わりの

部分を@Eg and @Eg:で指示する。使い方の詳細は「マニュアル・パート IIプログラムの GEM」を参照

して欲しい。分析コードがつく場合、コロンがついた@Bg:が使われる。

@Bck:

日誌的なデータを JCHAT形式で入力しなおす時に、発話の背景となる情報をこのヘッダーを使って記

述する。特に、発話の背景となる情報が発話の前、間、後のどこに当てはまるか不明の場合に使用する。

@Bck: hashi ni hasande, haha no kuchimoto e

*CHI: tabete !

@Comment:

いろいろな注釈を書く時に使われる。ファイル全体に対する注釈の場合には最初の発話の前に書く。ファ

イルの途中に入れても構わない。特定の発話の注釈のためには別に%com:が用意されている。多目的コメ

ントラインとして使える。

@Date:

資料収集の日付を書く。@Birthと同様に日・月・年の順で記述する。

@Date: 15-OCT-1994

@Eg and @Eg:

GEMプログラムが対象にする部分の終わりを指示する。

@G:

gemに重なりがない場合に使う。GEMの +n オプションとともに使う。

@Location:

資料収集の場所を示す。例えば、縦断的研究で、引っ越しや旅行などが起きた場合に使われる。

@Location: Nagoya, Aichi, Japan

@New Episode

記録の途中で中断があった場合、その再開を示すのに使われる。コロンがつかない。

@Room Layout:

部屋の構造や家具などの配置を示したい時に使われる。特に、実験的研究において必要となる。

@Situation:

発話状況の全体的な情報を述べる際に使われる。読み手がその場面を想像しやすいように書く。

36

Page 61: JChatman

4.3. 変更可能なヘッダー

@Situation: Okaasan ga daidokoro de gohan no shitaku o

shiteiru.Asuka ga yuka ni suwatte kisha de

asondeiru.

@Tape Location:

テープの番号や面などを書いておきたい時に使う。

@Tape Location: tape74, side a, 104

@Time Duration:

資料収集の時間を示す。

@Time Duration: 12:30-13:30

@Time Start:

資料収集の始まりを示す。収集が始まってからの経過時間を記入したい時には、%tim:を併用する。すな

わち、@Time Start:で始まりの時間を示して、%tim:で経過時間を示す。

@Time Start: 12:30

37

Page 62: JChatman
Page 63: JChatman

第5章 分かち書き

南 雅彦

5.1 はじめに

この章で説明する中心事項は、JCHATでは、なぜ「分かち書き」のルールが必要か説明することである。つ

まり、英語では語単位で独立して書き表されるため問題とならないことが、日本語では必ずしもそうではない

ために生じる問題である。ここでは、まず学校文法における「分かち書き」の説明から始める。つぎに JCHAT

の「分かち書き」ルールを例を挙げて説明する。特に、JCHATで「分かち書き」という場合、学校文法で言

う文節に基づく「分かち書き」よりも細分化された単位であることが多いことに注意して欲しい。JCHATの

「分かち書き」ルールだけ知りたい人は、第二節の一般的な説明のセクションを飛ばして、第三節へ読み進ん

で欲しい。

5.2 学校文法における「分かち書き」

JCHATの「分かち書き」に関する合意事項を説明する前に、まず、学校文法では、語がどのように分類さ

れ、どのように「分かち書き」されているか見てみよう。学校文法によると、語は文法上の性質によって、次

の三段階に分けることが出来る。

1.それだけで文節を作ることが出来るかどうか (自立語と付属語)

2. 活用するかどうか (例:活用する動詞、活用しない名詞)

3. 文中でどういう役目をするか (例:動詞、形容詞、名詞、助詞)

学校文法では、文節とは「文の意味をこわさない、もしくは発音上、不自然にならない程度に短く切った文

中の一区切り」と定義されている。第一段階の分け方は、「それだけで文節を作ることが出来るかどうか」とい

う文法上の性質によって語を分類する方法で、自立語と付属語に分類することができる。自立語とはそれだけ

で文節を作ることのできる語、または、文を組み立てる単位である文節の頭に来ることが出来る語である (例:

海、夏、泳ぐ、楽しい、静かだ)。付属語とは、それだけで文節を作ることが出来ないで、いつも自立語の後に

ついて、それと一緒に文節を作る語である (例:が、て、だ)。文節は、その終わりに「ね」、「さ」、「よ」など

を付けて区切ることが出来る。こうした表記法は、小学校低学年の教科書や読み物にのみ用いられる「分かち

書き」と呼ばれるもので、区切れごとにまとまった意味を持ち、その部分は続けて発音される。例えば、「桜

の 花が 咲いた」などのようである。この例からも分かるように、学校文法では、付属語は、それだけで文

節を作ることが出来ないので分かち書きされない。

さらに、第二段階の分け方として、動詞 (例:来る)、形容詞 (例:美しい)、形容動詞 (例:元気だ)のように、

語の形が下に続く言葉によって変化する、すなわち、活用する自立語と、名詞 (例:富士山)、代名詞 (例:僕、

これ)、副詞 (例:すぐに、とても、すっと、もし)、連体詞 (例:おかしな、たった)、接続詞 (例:だから、ま

た)、感動詞 (例:ああ)のように語形が変化しないもの、すなわち、活用しない自立語とに分類することがで

きる。付属語も、第二段階の分け方の「活用するかしないか」で分類することが出来る。付属語には、下に続

く言葉によって活用して意味を付け加えたり、話し手の判断を表したりする助動詞 (例:れる、です)と、語の

39

Page 64: JChatman

第 5章 分かち書き

表 5.1: 品詞の種類

自立語

動作・作用・存在を表す (ウ段で終る) 動詞

活用する 述語になる (用言) 性質・状態を表す 「い」で終る 形容詞

「だ・です」で終る 形容動詞

主語になる (体言) 動作を表す 名詞

物事を指し示す 代名詞

活用しない 修飾語になる 主として用言を修飾する 副詞

体言だけを修飾する 連体詞

接続語になる 主として文と文を繋ぐ 接続詞

独立語になる 感動・呼びかけ・応答を表す 感動詞

付属語

活用する 意味を付け加えたり、話しての判断を表したりする 助動詞

活用しない 語と語の関係を示したり、意味を付け加えたりする 助詞

形が変化しないで語と語の関係を示したり、意味を付け加えたりする助詞 (例:が、の)がある。

さらに、第三段階の分け方として、ここで詳しく述べたように、動詞、形容詞、名詞、助動詞といったよう

に語が「文中で、どういう役目をするか」によって、分類することが出来る。付属語は、活用する助動詞 (例:

褒められる)と、活用しない助詞に分けられるが、助詞をさらに細分化すると、格助詞 (例:桜が咲く)、接続

助詞 (例:秋になると紅葉する。遊ぶけれど勉強もする)、副助詞 (例:今年は雨が少ない)や終助詞 (例:明日

の用意は出来たか)のような助詞に分類される (表 5.1参照)。これらは、さらに細分化されて示された語の種

類である。

5.3 JCHATにおける「分かち書き」:基本的合意事項

(注)29節を参照して欲しい。

上述した助詞と助動詞は付属語であり、学校文法では「分かち書き」されない。しかし JCHATでは、自立

語のなかで活用しない語 | すなわち主語になりえる体言 (名詞、代名詞)、主語にならないが修飾語になる副

詞 (主に用言を修飾する)と連体詞 (体言を修飾する)、接続語になる接続詞、独立語になる感動詞 |だけでは

なく、付属語でも活用しない語は、分かち書きされることが前提となっている。語の頻度計算の様な語単位の

分析をする CLANプログラムも、語が分かち書きされていることが、前提となっている。そこで JCHATでは

以下の例のように自立語も、活用しない付属語 (助詞)も、同様に独立した語として取り扱い、メイン・ライン

に分かち書きする。

しかし、用言については、準拠する文法により、分析の仕方が異なるので、主要 (自立語)部分である動詞、

形容詞、そして形容動詞及び、それに接続する付属語部分の助動詞をひとまとめにして分かち書きしない。

学校文法 sakurano hanaga saita .

JCHAT sakura no hana ga saita .

MINJCHATでは、これ以上の細分化は義務づけられていないが、MLU計算や、形態素分析を行なう場合

は語を形態素に分割することが必要になる (形態素分割については、7章「メイン・ラインに形態素をどのよう

に記入するか」を参照して欲しい)。

以下に助詞の含まれた発話の「分かち書き」例を示す。

40

Page 65: JChatman

5.3. JCHATにおける「分かち書き」:基本的合意事項

1. 格助詞

が (ga) sakura ga saku .

sakura ga saita .

の (no) kodomo no toki no omoide wa utukusii .

を (o) hon o yomu .

hon o yonda .

に (ni) Kyoto ni tuku .

Kyoto ni tuita .

え (e) Tokyo e yuku .

と (to) Kanatyan to asobu .

Kanatyan to asonda .

より (yori) Takakun wa boku yori ookii .

から (kara) Kayotyan wa asa kara ie ni ita .

で (de) enpitu de kaku .

enpitu de kaita .

や (ya) Kanatyan ya Kayotyan to asobu .

2. 接続助詞

と (to) aki ni naru to kooyoosuru .

けれど (keredo) warawareta keredo heiki da .

のに (noni) natu da to yuu noni mada samui .

が (ga) zikan o kaketa ga mada owaranai .

ので (node) zutto okiteta node tukareta .

から (kara) hareta kara soto ni deta .

し (si) atui si taihen da .

なり (nari) kare wa sore o miru nari nakidasita .

ものの (monono) sirabeta monono wakaranai .

ところで (tokorode) sirabeta tokorode wakaranai .

ただし、終止形につかない接続助詞「ば」「て」「たり」「ても」「ながら」に関しては、日本語形態素自

動解析プログラムの便宜上、分かち書きしない。これらの接続助詞を分かち書きする場合には、その旨

00readme.docに記しておいて欲しい。

ば (ba) Kanatyan ga ikeba boku mo iku .

ても (temo) kiitemo osienai yo .

て (te) Norikun wa yasasikute sinsetuda .

ながら (nagara) terebi o minagara benkyoosuru .

たり (tari) tabetari netari .

3. 副助詞

は (wa) kotosi wa ame ga ooi .

こそ (koso) kyoo koso benkyoo suru .

も (mo) zyuusu mo nonda .

41

Page 66: JChatman

第 5章 分かち書き

さえ (sae) yuki sae hutta .

でも (demo) dare demo dekiru .

しか (sika) kore sika omoitukanai .

まで (made) kuzi made ni neru koto .

ばかり (bakari) Marityan wa dekaketa bakari yo .

だけ (dake) Takakun dake yo .

ほど (hodo) iti zikan hodo kakaru .

くらい (kurai) sore kurai boku wa heiki sa .

だの (dano) aa dano koo dano to urusai .

の (no) are no kore no to urusai .

など (nado) kudamono ya zyuusu nado ga aru ne .

なり (nari) yuku nari kaeru nari ziyuu desu yo .

やら (yara) nan no koto yara sappari wakaranai .

か (ka) nan ka taberu mono aru ?

なんて (nante) yasai nante kirai da .

きり (kiri) hitori kiri ne .

ずつ (zutu) hitotu zutu tabete ne .

だって (datte) boku datte tabeta .

4.終助詞

か (ka) asita no yooi wa dekita ka ?

かしら (kasira) asita no yooi wa dekita kasira ?

な (na) asita no yooi wa dekita ka na ?

なあ (naa) kirei da naa !

とも (tomo) kirei da tomo !

や (ya) sugoi ya .

ぞ (zo) siranai zo .

の (no) doosite sonna koto sita no ?

よ (yo) atarimae yo .

わ (wa) omosiroi wa .

ね/ねえ (ne/nee) daizyoobu ka nee ?

さ (sa) gaman suru sa .

研究の目的によっては、JCHATとは異なる分かち書きをする必要があるかも知れない。そうした場合には、

JCHATの分かち書きのルールと異なる点を 00readme.docに記述する必要がある。なお、助詞を分かち書きし

ないデータファイルを希望する研究者のために JCHATでは、JCHAT形式を満たしたファイルに対して、自動

的に助詞を分けないファイルを作成する変換方法を提供しているので、詳しくは該当の章を参照して欲しい1。

文献

1.栗原一登・飛田多喜雄・井上靖 (監修). (1992). 国語 1. 光村図書.

2.栗原一登・飛田多喜雄・井上靖 (監修). (1992). 国語 2. 光村図書.

3.栗原一登・飛田多喜雄・井上靖 (監修). (1992). 国語 3. 光村図書.

4.武部良明. (1979). 日本語の表記. 角川書店.

5.とうほう. (不明). ことばのきまり. 東京法令出版.

1第一版の 17 章のことであるが、本書では割愛した。

42

Page 67: JChatman

5.3. JCHATにおける「分かち書き」:基本的合意事項

後書き

本章は、1994年 JCHAT meetingにおける口頭発表の内容に加筆・修正を施したものである。加筆・修正に

関して、マッギル大学の大嶋百合子氏をはじめ、meetingに参加された JCHAT会員の方々に大変有意義なご

助言をいただいた。記して感謝の意を表したい。また、校正、編集の過程で大変お世話になった静岡大学の岩

立志津夫氏にもこの場を借りて感謝の意を表したい。

用語説明

自立語 それだけで文節を作ることのできる単語、または、文を組み立てる単位である文節の頭に来ることが

出来る単語である (例:海、夏、泳ぐ、楽しい、静かだ)。

付属語 それだけで文節を作ることが出来ないで、いつも自立語の後について、それと一緒に文節を作る単語

である。付属語には、下に続く言葉によって変化して意味を付け加えたり、話し手の判断を表したりす

る助動詞 (例:れる、です)と、語の形が変化しないで語と語の関係を示したり、意味を付け加えたりす

る助詞 (例:が、の)がある。

文節 学校文法では、とは「文の意味をこわさない、もしくは発音上、不自然にならない程度に短く切った文

中の一区切り」と定義されている。

43

Page 68: JChatman
Page 69: JChatman

第6章 語をどのように転記するか

宮田Susanne

CHATファイルでは、発話はメイン・ラインと呼ばれる行に記載される。全てのメイン・ラインはアステリ

スク (*)で始まり、3文字の発話者 ID、コロン (:)、タブ記号が続き、その後に実際の発話が書かれる。発話

は空白で分けられた語から構成されている。

語の頻度などをコンピュータを使って算出する際、いくつかの問題が生じる。特に、語の発音がまだ固定し

ていない言語発達初期の幼児の場合そのことが言える。例えば、お茶のことを「チャ」と言ったり、不明瞭な発

音で言ったりした場合、それをどのように転記するべきだろうか。確かに発音通りに転記するのも 1つの道だ

が、そうすると微妙に発音が違っている語が 2つあった場合、機械的に処理すると子どもは同じ対象について

述べているのに別々の語として処理されてしまう。また、だからと言って「チャ」という発話を全て「オチャ」

と転記したのでは実際に発話されたものとのズレが大きくなって、新たな問題が生じてしまう。

そこで、JCHATでは研究者の意図にあった分析が可能なようにいくつかの工夫がなされている。この章で

はこの工夫のいくつかについて説明する。具体的には次の 5つの点について述べる。

1. 言語習得者が使う独自の語の扱い

2. 聞き取りにくい語の扱い

3. 省略・脱落した部分の扱い

4. 固定した表現の扱い

5. 文字・数字などの扱い

6.1 言語習得者が使う独自の語

JCHATでは、一群の語を分類するために「Special Learner Form Marker」と呼ばれる特殊な分類マーカー

が使われる。これはアットマーク (@)と 1から 3文字の組み合わせ記号からなるもので、現在考えられている

マーカーには表 6.1のものがある。

これらの分類マーカーは次のように使用される。

*CHI: keechan shinjoko@c noru .

なお、これらの分類マーカーを使用する場合、転記者は原則的には自分で 0lexicon.cutと呼ばれるファイル

をそれぞれの子ども毎に作成する必要がある。また、これらの分類マーカーは固定されたものではなく、研究

者が必要に応じて取捨選択することができる。

上にあげた分類マーカーの中の主なものは、次のような語群を指している。既存のどの分類にも分類できな

いものには、「その他」の意味で「一般的な特別形」が使われる。

1. 喃語

喃語は初期のなん語にも、すでにしゃべっている子どもの言葉遊びにも使われる。後者の場合、形は意味

を持たず、音遊びを表わしていることが多い。

2. 子どもの新造語

子どもが常に使っている語で、標準語にないものである。

45

Page 70: JChatman

第 6章 語をどのように転記するか

表 6.1: JCHATでの分類マーカー

記号 分類内容 ヘボン式 訓令式 説明

@b 喃語 addada@b addada@b

@c 子どもの新造語 shinjoko@c sinzyoko@c 新幹線のこと

@d 方言 yattokame@d yattokame@d お久しぶり

@f 家族専用語 baburu@f baburu@f バブのお風呂へ入る

@i 間投詞 yeei@i yeei@i 喜びを表わす

@l 文字 esu@l esu@l 「S」を表す。

@lh 平仮名 ka@lh ka@lh 「か」を表す。

@lk カタカナ shi@lk si@lk 「シ」を表す。

@lc 漢字 ka@lc ka@lc 蚊

@lr ローマ字 eichi@lr eiti@lr 「H」を表す。

@n 新造語 abukunai@n abukunai@n 危なくない

@o 擬音・擬声語 shaa@o syaa@o 水の音

@p 音声的に安定し

た形

aga@p aga@p 意味不明だが、よく「アガ」と言う

場合

@pr 固定的な繰り返

korewa@pr korewa@pr 「コレワ」を繰り返す

@s 第 2言語 one@s one@s 英語の"1"

@sl 手話 tisshu@sl tissyu@sl 手話で「ティッシュ」

@sas 手話と語 churippu@sas tyurippu@sas 手話のほかにその語が発音される

@t 実験用の語 wug@t wug@t 無意味綴り語

@u UNIBET hiNgudtu@u hiNgudtu@u 「ヒングル」のように聞こえる

@x 排除する単語 aan@x aan@x 「アーン」というフィラーを分析か

ら除く

@ 一般的な特別形 gonga@ gonga@

46

Page 71: JChatman

6.2. 聞き取りにくい語

3. 方言

方言の発音を記号化するのは一般的にできる限り避ける。00readme.docで音声的な特徴をまとめて述べる。

4. 家族専用語

家族専用語は子どもの新造語に似ているが、家族全員で使われている点に特徴がある。対象の子ども以外

の家族メンバーによって作られたものも多い。

5. 間投詞

29.3.3節参照

6. 文字

文字の書き方に関しては 6.5.1を参照

7. 擬音・擬声語

擬音・擬声語のリスト「onomatop.cut」の内容、分類は大辞林の「擬声語擬態語」に従う。

8. 音声的に安定した形

音声的に安定した形は、成人標準形に対応するものがない場合に使う。意味がはっきりしないが、決まっ

た場面で使われたりする。

9. 固定的な繰り返し

主に言語の流暢性に障害がある場合に使う。

10. 第 2言語

第 2言語は日常家庭で使われている言語とは異なる言語の語である。

11. 実験用語

実験用の語は研究者によって子どもの文法的発達を調べるために作られた語である。

12. UNIBET

UNIBETは聞き取れない語を音声的に記号化したい場合に使う。聞き取れない部分が多い場合は%phoティ

ヤーを作ったほうがいい。

13. 排除する単語

フィラー (つなぎのための無意味語)などに使う。26.1節で述べる-sオプションにより排除すべき単語を

ファイルに書くことでまとめて排除することもできる。

これらの記号をつけることで、いろいろな条件での分析が可能になる。例えば、揺れの多い擬音・擬声語に

@o をつけることで、これらを含む語を日本語の標準的な 擬音・擬声語と区別して検索することができる。

すなわち、標準的な 擬音・擬声語はすでに onomatop.cut(擬音・擬声語のリスト)に登録されているので、

CLANプログラムの KWALを使って、擬音・擬声語のリストにあるものと@oのついたものを別々に拾い出す

ことが可能になる。また、freqを使うことで 擬音・擬声語のみをアルファベット順に並べることも可能である。

6.2 聞き取りにくい語

録音から CHATファイルに転記する時、文字化しにくい場合がある。例えば、録音レベルが低くて十分聞き

取れない場合、音形ははっきりしているが何の語か分からない場合、会話の相互交渉に関係ない部分を除きた

い場合、最後まで言わずに語の途中で言葉を中断した場合などである。これらの場合には、以下の記号を使い

分けることになる。

聞き取れない発話 xxx

聞き取れない発話で、これは平均発話長 (MLU)の計算から除かれる。

*CHI: xxx .

*MOT: nani ?

47

Page 72: JChatman

第 6章 語をどのように転記するか

聞き取れない語 xx

聞き取れない語で、これは MLUの計算で一語として扱われている。

*CHI: kore wa xx .

聞き取れない発話 (%phoを伴う) yyy

聞き取りにくい発話の発音を%phoで書きたい場合に使用する。

聞き取れない語 (%phoを伴う) yy ]

聞き取りにくい語の発音を%phoで書きたい場合に使用する。これは CLANプログラムによって一つの

語として扱われる。

転記しない発話 www

転記したくないあるいはできない発話 (例えば、電話で話しているとか、記録者の知らない言語が使われ

ている場合)を表わす。後続の行の%expでその説明を記入する。

*MOT: www .

%exp: denwa de taioo shiteiru

発話なしの行動 0

発話がなくて、その代わりに行動が生じた場合に使用する。これは数字のゼロ (0)でアルファベットの

オー (o)ではない。

*MOT: choodai .

*CHI: 0 .

%act: banana o watasu

断片的な発話を音声学的に記述をする場合 &

どもったり言い間違って語になっていない場合に使う。UNIBETで表現される。この記号をつけるとMLU

や頻度の計算からは除かれる。

*CHI: &koNku: da yo . (MLU=2)

*CHI: &ko &ko kore ! (MLU=1)

なお、CLANプログラムで該当部分を語として認めさせたい場合には@uを使う。

*CHI: koNku:@u da yo . (MLU=3)

転記者が予想する語 [?]

この記号については第 10章「スコープ記号」で詳しく説明される。少し疑問も残るが、そう聞こえたと

転記者が思う語や語群に対して使われる。

*CHI: booru [?] atta .

6.3 省略・脱落した部分

転写しようとする発話に省略や脱落した部分が混じっている場合には、その部分の存在を曖昧にしておくと

資料の信頼性が低くなる。また、省略されたり脱落した部分を独断的に解釈したのでは、やはり資料の信頼性

は低くなる。このような問題を回避するために CHATでは次のようの記号が使われる。

48

Page 73: JChatman

6.4. 固定した表現

( )

一部脱落したり、省略されたりして不完全だが、発話の状況から発話しようとした語が明確な場合に使う。

*CHI: ko(r)e totte .

*CHI: O#baa-san n(o) toko(ro) .

CLANプログラムでは特に指定がない場合には、この括弧の中身が存在すると仮定して分析する。した

がって、ko(r)eと koreは同じものになる。ただ、括弧内部分を除くように指定することも可能である。

0word

これは数字のゼロ (0)で、脱落した語に使う。研究者の主観的な解釈が入るため、この記号の使用は非常

に難しい。言語獲得データの転記では使用を避ける研究者が多い。しかし、言語障害・失語症の研究に

おいては研究目的によっては利用価値が大きい。

*CHI: Mama 0ga kaita .

脱落した語の推測はむずかしいので、脱落した語の代わりに次の例のように品詞を記入する方が問題は

少ない。

*CHI: Mama wa gakkoo ni 0v .

品詞の記入としては次のものが考えられる。

0v 動詞の脱落

0subj 主語の脱落

0cpart 格助詞の脱落

0*word

文法的に脱落すべきでない語が脱落している時に使用する。0wordはその語の脱落が文法的には適切で

あるかの判断なしに使用するのに対して、0*wordは文法的に正しくない場合に使用する。

*CHI: Mama 0*ni moratta .

00word

標準的な日本語の会話や談話等で省略されるのが普通で、文法的にも許容される時に使用する。脱落し

た語の品詞や文中での機能を記入する。

*MOT: 00sub dooshite 00obj kowashita no ?

%exp: seeing toy, which the child has apparently broken

6.4 固定した表現

言語獲得の初期に、複数の語があたかも一つの語のように使われることがある。これが、固定した表現 (for-

mulaic combinations)である。このような表現を大人の判断で形態素レベルで分割すると、実際より形態素の

数が増えることになり、語彙分析や平均発話数 (MLU)の計算で間違いをおかす危険がある。そこで、 JCHAT

では固定した表現を複合語と同じく+でつないで表記する。こうすると、CLANプログラムの使い方で、その

49

Page 74: JChatman

第 6章 語をどのように転記するか

固定した表現を一つのまとまりとして処理することも、あるいは分割した形で (いくつかの語の集まりとして)

処理することも可能になる。

*CHI: moo+ii+kai yaroo ka ?

6.5 文字・数字など

6.5.1 文字

日本語で文章を表記する時、4種類の文字が使われている。ひらがな、カタカナ、漢字、ローマ字である。こ

れらの 4種類の表記を意識的に表記したい時がある。その時は、JCHATでは次の 2つの方法を使うことが可

能である。

1.文字の種類にかかわらず、語に@lをつけて、文字であることをマークする。

*CHI: ki@l o kaita .

2.文字の種類を区別したい時は、@lh(ひらがな)・@lk(カタカナ)、@lc(漢字)、@lr(ローマ字)の記号を使う。

*CHI: ki@lh o kaita . 「き」

*CHI: ki@lk o kaita . 「キ」

*CHI: ki=tree@lc o kaita . 「木」

*MOT: nimben@lc de kaku yo . 「人偏」

*CHI: ai@lr o kaita . 「i」

*CHI: ai@lc o kaita . 「愛」

アルファベットの場合には a@l b@l c@l d@lの様な書き方も可能であるが、日本語での発音に従う綴り

のほうが望ましいかもしれない。アルファベットを表記する一例として『外来語辞典』(集英社,1988)のも

のを資料 6.1 として示した。

6.5.2 頭字語

英語などと違って数はそれほど多くはないが、アルファベットを使った頭字語 (Acronyms)が日本語にも存

在する。これらの語は JRのように頭字語として表記してもよいし、大文字で始めて発音通りに「Jeeaaru」と

ローマ字で書くことも可能である。

頭字語 ヘボン式 訓令式

JR Jeeaaru Zyeeaaru

NHK Enueichikee Enueitikei

ABC Eebiishii Eibiisii

UNESCO Yunesuko Yunesuko

CHILDES Chairuzu Tyairuzu

6.5.3 数字

数字は必ず文字で表記する。具体的な表記例を次に示す。

50

Page 75: JChatman

6.5. 文字・数字など

意味 ヘボン式 訓令式

260 nihyakurokujuu nihyakurokuzyuu

一本 ippon ippon

1時 ichiji itizi

2分 nifun nihun

第 8回 daihachikai daihatikai

9分の 1 kyuubun no ichi kyuubun no iti

6.5.4 方言

方言には表現のゆれが存在する。そしてこのゆれには、「語形のゆれ」とともに「発音のゆれ」がある。方

言のゆれに対しては、JCHATでは 4つの対処法が考えられる。どの方法を取るかは、研究目的の他、その方

言と共通語の間の差の大きさにもよる。

1.ファイルに出てくる方言の語を全て 0lexicon.cutと呼ばれるリストに登録し、ファイル内では方言語をそ

のまま記号なしで表記する。こうすることによって、リストに含まれる語を別に分析することができる。

2. 自動置き換え記号 [: 置き換え語] を使う方法である。すなわち、方言を書いておいてその後に標準形を

置き換え語として付記する方法である。こうすることによって、CLANプログラムで分析する際に、発音

形である方言を使うか、置き換え語である標準形を使うか選択することができる。この方法を使う際には、

CLANプログラムが正しく動くために [:の後に半角スペースを置いてから置き換え語を書く必要がある。

*CHI shinjoko@c [: shinkansen] kita .

3. UNIBET表記を使う方法である。方言の音韻分析をする場合や発話者が方言の影響を強く受けている場合

にはこの方法を使うとよいかもしれない。

4. 方言形を無視してそれに対応する標準形を書く方法である。この方法をとった場合には、その CHATファ

イルを後で利用する人が誤解することがないように、そのことを 00readme.docファイルに明確に書いて

おく必要があるだろう。

6.5.5 バイリンガル・データ

2つ以上の言語が混在する発話データの場合には、次の 4つの表記法が考えられる。

1. 2つの言語を混在させる

この方法は、特にバイリンガルの言語環境で育つ幼い子どもの場合には無難な方法である。しかしこの方

法では、同じ文字が言語によって違う発音になる場合、文字だけではどちらの言語で読めばいいのかがわ

からなくなる可能性がある1。

*CHI: I want a guruguru .

2.ヘッダー・ラインの @Languageに主言語を記入し、第 2言語を%comティヤーなどで補足する

*CHI: I want an icecream .

*CHI: choko+aisu choodai .

%com: Japanese: give me the chocolate icecream

会話の途中で、主言語の変更が生じた場合には、新しい@Language ヘッダーでそのことを明記することに

なる。1念のため付け加えれば、\I want a" までが英語であり、\guruguru"が日本語の幼児語。

51

Page 76: JChatman

第 6章 語をどのように転記するか

3.各発話に %codティヤーをつける

この方法は、両言語がほぼ同じ量を占める場合に便利である。

*CHI: kore totte .

%cod: $JAP

CHI: I want to have it !

%cod: $ENG

またこの方法では、言語が代わるスイッチングなどの現象も%codティヤーに記入できる。考えられるコー

ドとして、$SWI(スイッチング、一つの発話中、言語を切り替えた場合)、$EJS(英語から日本語にスイッチ

ングした場合)、$JES(日本語から英語にスイッチングした場合) $MIX(ミックス、主言語のままであるが、

第 2言語の語を一部で使った場合など)、$INT(インターナショナル、両方の言語で使えるもの、特に両方

の言語の発音があまり区別されていない場合)などが考えられる。

*CHI: kore totte .

%cod: $JAP

CHI: I want to have it !

%cod: $ENG $SWI

*CHI: ookii no please .

%cod: $MIX

*CHI: kukkii .

%cod: $INT

4.第 2言語の各語に @sをつける

この方法は、第 2言語の部分が少ない場合に便利である。

*CHI: one@s two@s san go ten@s !

%com: learning English counting from Sesame Street

なお、第 2言語の部分を翻訳したい場合には [:=x text] 、または%engなどのディペンデントティアを

使うことができる。

*CHI: kore totte please [:=e choodai] .

*CHI: kore choodai .

文献

1.集英社. (1988). 外来語辞典.

後書き

原稿作成に際して岩立志津夫 (静岡大学)・大野清幸 (愛知淑徳短期大学)・小川雅魚 (椙山短期大学)の各氏に

貴重なコメントをいただきました。記して感謝いたします。

52

Page 77: JChatman

第7章 メイン・ラインに形態素をどのように表記するか

南雅彦・森川尋美(注)29節も参照して欲しい。

7.1 はじめに

形態素は、言語において語を構成する意味を担った最小単位と考えられる。この章では、言語発達のなかで

も形態素の発達に興味のある人のために、JCHAT では、形態素をどのように表記すればよいかを解説する。

形態素の分析を行なう方法には、メイン・ラインで行なう方法と、ディペンデントティア、%morで分析を行な

う方法がある。ここでは、メイン・ラインで形態素の分析を行なう方法について述べる。

この章の前半では、まずオプションの形態素分析について解説する。具体的に言うと、形態素分析のために

JCHATが、用意している 6つのコードについてまず説明し、JCHATで使用され 00depadd.cutに登録されて

いる接尾辞、接頭辞等についても言及する。さらに、置き換え記号を使用した角括弧の中に形態素を記入する

方法についても述べる。

この章の後半では、用言の形態素の分析に主に焦点を合わせ、3つの形態素分析の方法を紹介する。まず、学

校文法にしたがった場合の用言の形態素の分析を論じる。次に、ローマ字表記にしたとき初めて可能になる分

析を紹介する。ここでは、特に活用する品詞の例として、動詞の形態素の分析に主に焦点を合わせて解説する。

最後に、形態素数の算出や、活用語の終止形・連体形を採用して入力、分析エラーをおさえる目的で作られた

分析方法である森川方式を紹介する。なお、ローマ字化は、森川方式の紹介部分を除いて、全て訓令式に則っ

ている。

7.2 形態素分析:オプショナル

7.2.1 形態素化のためのコード

以下、形態素分析のために JCHATが用意している 6つのコード (-、#、+、~、&、0)について簡単に説明

する。そのうち JCHATでよく使用されると思われるものに関しては、例を挙げて説明する。形態素は語を構

成する意味をもった最小単位なので、語よりも小さい単位である。

たとえば、語をさらに細分化した接頭辞 (pre�x)や接尾辞 (su�x)などの接辞 (a�x)は、一つの形態素で

ある。

1. 接尾辞記号 -

語幹に付された接尾辞を示すにはダッシュを用いる。

*CHI: Yamada-san ga kita .

2. 接頭辞記号 #

接頭辞のあとには#を付ける。

53

Page 78: JChatman

第 7章 メイン・ラインに形態素をどのように表記するか

*CHI: kore ga o#baa-tyan .

3.複合語記号 +

「鳥かご」は、「鳥」という名詞と「かご」という名詞が組み合わさって出来た複合名詞である。この場

合、「鳥」と「かご」を複合語記号でつないで、「tori+kago」と表記することができる。言語発達の研究

において『接頭辞や接尾辞が形態素として独立していると捕えることができる段階に到達していない』と

考えることが妥当な場合がある。そういう場合には、接辞記号のかわりに+マークでつないで複合語とし

て表記すると、MLU計算プログラムでは、+マークを形態素の境界とはみなさないようにプログラムされ

ている。

(A) *CHI: kore ga o+baa+tyan .

(B) *CHI: kore ga o#baa-tyan .

上記 (A)のMLU計算をすれば形態素の数は 3となり、もし発話がこれ一つだけであれば、発話当たりの

形態素の数も 3となる。同様に、(B)の MLU計算をすれば形態素の数は 5となり、もし発話がこれ一つ

だけであれば、発話当たりの形態素の数も 5となるのである。

4.融合 (fusion)記号 &

もし「mi-ta」(見た)や「ne-ta」(寝た)のような語幹が母音で終わる「母音動詞」だけでなく、「yon-da」

(読んだ)のような語幹が「yom」という子音で終わる「子音動詞」(詳しくは、7.2.4.B用言の形態素分析を参

照)も形態素化したい場合、&マークを使うことができる。この & マークを使うと、「yon-da」は「yom&ta」

となる。こうすれば、かりに音便 (n ! m, t ! d)が起こっても、一種類の形態素を使うことができるの

で便利である。

*CHI: o#kaa-san to hon o yom&ta .

*CHI: okaasan ga boku o yob&ta .

JCHATでは、メイン・ラインでは形態素に分割しないで、発音どおりに表記し、置き換え記号の中だけ

で、分割するのが基本的合意事項であるので、実際にはメイン・ラインには発音どおりに表記し、後に述

べる置き換え記号の中だけで、形態素分析をする。

5.省略された接辞 -Oaffix (-O = Omitted)

省略されている接尾辞をマークしたい場合、-Oマークを使うことができる。しかし、ある言葉が省略され

ているかどうかを判断することは、困難であるし、誤った解釈をする可能性があるので、注意して使用す

る必要がある。

*CHI: akko ni tori ga ichi-0wa .

6.接語 (clitic)記号 ~

たとえば、イタリア語の形態素分析などで接語代名詞を示したいときに、テイルデ (~)を使うことができ

る。日本語分析には、余り関係がないので省略。興味のある方は、英語のマニュアル第 5章を参照して欲

しい。

7.2.2 接頭辞と接尾辞

下記に JCHATで使用され、00depadd.cutに登録されている接頭辞と接尾辞を記しておく。

54

Page 79: JChatman

7.2. 形態素分析:オプショナル

1. 接頭辞 (Su�x) #

接頭辞 訓令式 ヘボン式

go# ご#りょうしん go#ryoosin go#ryooshin

ma# ま#しょうめん ma#syoomen ma#shoomen

o# お#はし o#hasi o#hashi

su# す#あし su#asi su#ashi

2. 接尾辞 (Pre�x) -

接頭辞 訓令式 ヘボン式

dati/dachi とも-だち tomo-dati tomo-dachi

dono すずき-どの Suzuki-dono Suzuki-dono

kun たかし-くん Takasi-kun Takashi-kun

sama たなか-さま Tanaka-sama Tanaka-sama

san やまだ-さん Yamada-san Yamada-san

tyan/chan かおり-ちゃん Kaori-tyan Kaori-chan

「本 3冊」のように語分類上の所属を示す分類辞も接尾辞である。

接頭辞 訓令式 ヘボン式

dai いち-だい iti-dai ichi-dai

hai に-はい ni-hai ni-hai

hiki に-ひき ni-hiki ni-hiki

hon に-ほん ni-hon ni-hon

huku/fuku ご-ふく go-huku go-fuku

kan きゅう-かん kyuu-kan kyuu-kan

kasyo/kasho さん-かしょ san-kasyo san-kasho

ken に-けん ni-ken ni-ken

ko さん-こ san-ko san-ko

mai いち-まい iti-mai ichi-mai

maki ひと-まき hito-maki hito-maki

mei ろく-めい roku-mei roku-mei

mon いち-もん iti-mon ichi-mon

nin ご-にん go-nin go-nin

satu さん-さつ san-satu san-satsu

seki さん-せき san-seki san-seki

soo に-そう ni-soo ni-soo

soku ろく-そく roku-soku roku-soku

syuu/shuu ろく-しゅう roku-syuu roku-shuu

too さん-とう san-too san-too

tuu/tsuu ご-つう go-tuu go-tsuu

tyaku/chaku に-ちゃく ni-tyaku ni-chaku

tyoo/choo さん-ちょう san-tyoo san-choo

wa いち-わ iti-wa ichi-wa

zen いち-ぜん iti-zen ichi-zen

zyoo/joo はち-じょう hati-zyoo hachi-joo

55

Page 80: JChatman

第 7章 メイン・ラインに形態素をどのように表記するか

7.2.3 角括弧の中に形態素を記入する置き換え記号 (Replacement Symbol)

以下のように、角括弧内に形態素を記入する方法がある。

*CHI: kore ga obaatyan [: o#baa-tyan] .

CLANプログラムでは、角括弧の直前に表記されたものは角括弧内に表記されたものと、自動的に置き換え

られることになっている。だから、上記のMLU計算をすれば、形態素の数は 5となり、もし、発話がこれ一

つだけであれば、発話当たりの形態素の数も 5となるのである。

さらに、もし、この自動置き換えを好まないのであれば、オプションの +r5スイッチをコマンドに付け加え

ることで、自動置き換えを防ぐことができる。このようにして MLU計算をすれば、形態素の数は 3となり、

もし、発話がこれ一つだけであれば、発話当たりの形態素の数も 3となる。

また分類辞の中で、「san-bon」のような濁音や「ro-ppon」の促音のように、基本形「hon(本)」が、音便で

変化する場合がある。そうした場合には、角括弧の中に形態素を記入する置き換え記号 (Replacement Symbol)

を使用した方法を使って、sanbon [: san-hon]、roppon [: roku-hon]とするのも一案である。こうすれ

ば、かりに音便が起こっても、同一の形態素として扱うことができるので便利である。

ただし、用言は、「分かち書き」しないで、発音通りメイン・ラインに転写し、[: ]内でのみ形態素に分け

る。だから、まず実際の発音で表記し、その直後に基本形 (基本系)の語幹を角括弧の中に表示するのが、基本

的合意事項である。

7.2.4 用言の形態素分析

ここまでは、他の語に続いたり言い切ったりするとき、語の形が規則的に変化する活用については、余りふ

れなかった。しかし、このことは形態素化を考える場合、重要な問題であり、避けては通れないことである。

そこで、ここでは、主に、動詞に焦点を合わせながら、用言の形態素分析のための方法として (A)学校文法、

(B)日本語文法にもとづく南方式、(C)森川方式の三つの方法を紹介する。

A. 動詞の活用の種類:学校文法

ここでは、まず学校文法の活用について考察する (活用しない語に関しては、2を参照)。動詞は、事物の動

作 (「どうする」)、作用 (「どうなる」)、存在 (「ある」)の意味を表す語である。動詞は、後に続く言葉に

よって、語形が規則的に変化する (すなわち、活用する)。動詞の活用は、未然形、連用形、終止形、連体形、

仮定形、命令形の六つにまとめることが出来、これを活用形と呼んでいる。さらに学校文法によると、表 7.1

に示すように、動詞はその活用の仕方によって 5種類に分けることができる。

1.五段活用 五十音図の五つの段に活用 (例:話す)

2.上一段活用 五十音図の「イ」段にだけ活用 (例:見る、起きる)

3.下一段活用 五十音図の「エ」段にだけ活用 (例:寝る、食べる)

4.カ行変格活用「来る」一語だけの特別な活用

5.サ行変格活用「する」一語だけの特別な活用

たとえば、「話す」は、活用語尾の音が、五十音図の五つの段 (話さない「ア段」、話します「イ段」、話す

「ウ段」、話せば「エ段」、話そう「オ段」)、全部にわたって出てくる。さらに、「話す」はサ行全部の段に活用

するので、「サ行五段活用の動詞」という。同様に、「見る」は、活用語尾が五十音図のイ段にだけ活用するの

で、このような活用の仕方を上一段活用、さらに「見る」の「み」はマ行に活用しているので、「マ行上一段

活用の動詞」という。「寝る」は、活用語尾が五十音図のエ段にだけ活用するので、このような活用の仕方を

下一段活用、さらに「寝る」の「ね」はナ行に活用しているので、「ナ行下一段活用の動詞」という。「来る」

は、五十音図のカ行だけで変化し「き・く・こ」と三つの段にわたって特別な活用をするので、カ行変格活用

56

Page 81: JChatman

7.2. 形態素分析:オプショナル

表 7.1: 活用の種類と活用形 (学校文法)

活用の種類 五段活用 上一段活用 下一段活用 カ行変格

活用

サ行変格

活用

例語 話す 読む 見る 起きる 寝る 食べる 来る する

語幹 話 読 ○ 起 ○ 食 ○ ○

未然形 さ/そ ま/も み き ね べ こ し/せ/さ

{ナイ/ウ

連用形 し み/ん み き ね べ き し

マス/タ (ダ)

終止形 す む みる きる ねる べる くる する

{。

連体形 す む みる きる ねる べる くる する

{トキ/ {コト

仮定形 せ め みれ きれ ねれ べれ くれ すれ

{バ

命令形 せ め みよ/ きろ/ ねろ/ べろ/ こい しろ/

{。(命令) みろ きよ ねよ べよ せよ

という。「する」は、五十音図のサ行だけで変化し「さ・し・す・せ」と四つの段にわたって特別な活用をする

ので、サ行変格活用という。

以下に、学校文法方式による形態素分析の例を助動詞を使って示す。れる (reru) *MOT: kore to are wa musubareru [: musuba-reru] .

*MOT: sensei mo hanasareru [: hanasa-reru] .

*CHI: hitori de yukareru [: yuka-reru] .

られる (reru) *CHI: homerareru [: home-rareru] .

*MOT: o#baa-tyan ga korareru [: ko-rareru] .

*MOT: hoka ni kotae ga kangaerareru [: kangae-rareru] .

せる (seru) *MOT: o#kaa-san ni hon o kawaseru [: kawa-seru] .

させる (saseru) *CHI: Hana-tyan ni kore o akesaseru [: ake-saseru] .

たい (tai) *CHI: are o kaitai [: kai-tai] .

たがる (tagaru) *CHI: are o kaitagaru [: kai-tagaru] .

だ (da) *CHI: are ga boku no o#baa-tyan da .

です (desu) *CHI: kore desu yo .

ない (nai) *MOT: ii hoohoo ga omoitukanai [: omoituka-nai] .

まい (mai) *MOT: sonna koto wa dekimai [: deki-mai] .

う (o) *CHI: e o kakoo [: kako-o] .

よう (yoo) *CHI: mado o simeyoo [: sime-yoo] .

た (ta) *CHI: e o kaita [: kai-ta] .

そうだ (sooda) *CHI: Kana-tyan wa uresisooda [: uresi-sooda] .

ようだ (yooda) *CHI: ano gorira wa marude ningen no yooda .

らしい (rasii) *MOT: ano eega wa omosiroirasii [: omosiroi-rasii] .

ます (masu) *CHI: koko ni arimasu [: ari-masu] .

57

Page 82: JChatman

第 7章 メイン・ラインに形態素をどのように表記するか

B. ローマ字表記に基づく南式分析

ここでは、ローマ字表記にしたときに初めて可能な形態素の分析を解説する (活用しない語に関しては、2を

参照)。仮名表記のままでは、子音と母音が組み合わされているために明らかにはならないが、活用語をローマ

字に基づいて分析した日本語の文法 (以下日本語文法)によると、動詞は大きく分けて三つに大別される。

1.子音動詞/U-動詞 例 hanas-u

2.母音動詞/RU-動詞 例 mi-ru、ne-ru

3.不規則動詞 (ku-ru,su-ru)

上記の 1は、語幹が子音で終わる動詞で「子音動詞」(もしくは、U-動詞)とよばれている。たとえば、「hanas-

u」の語幹は子音の [s]で終わり、基本形の語尾は「u」である。同様に、上記の 2は、語幹が母音で終わる動

詞で、「母音動詞」(もしくは、RU- 動詞)とよばれている。たとえば、「mi-ru」の語幹は母音の「i」、「ne-ru」

の語幹は母音の「e」で終わり、基本形の語尾は、「ru」である。

母音動詞は、さらに語幹の最後の母音によって二つの形に細分化される。

1. iで終わる動詞 例 mi-ru、oki-ru

2. eで終わる動詞 例 ne-ru、ake-ru

ここで明らかなように、子音動詞は、学校文法の五段活用の動詞、また、母音動詞の中で iで終わる動詞は、

学校文法の上一段活用の動詞、eで終わる動詞は、学校文法の下一段活用の動詞にそれぞれ相当する。さらに、

不規則動詞は、学校文法のカ行変格活用の動詞 (来る)と、サ行変格活用の動詞 (する)に相当する。

表 7.2に、日本語文法に基づくと、表 7.1の学校文法の活用表の内容が接続する助詞、助動詞を含め、どのよ

うに表記されるかを示してある。ただし、後述の点については JCHATに適用するための表記に改めてある。

日本語文法では、「た (ta)」の活用形 [分析によってはその一部]は助動詞ではなくタ系活用語尾として扱わ

れ、-te、-tariも助詞ではなくタ系活用語尾の中に含まれる。また、表 7.2中、-(a)nai、-masu以外は活用語尾

として扱われる。[活用語尾として扱われる-(r)eba、-te、-tariは分かち書きしない。]このため、日本語文法の

活用表、および活用形の名称は、表 7.2とは異なるが、ここでは、学校文法との違いを呈示するために、表 1

と対応する形式とした。

さらに、JCHATでは、用言と用言に接続する助動詞は、まずまとめて発音どおりに表記することから、置

き換え記号の中での表記は、検索や頻度計算などの便宜を計り、日本語文法での一般的な表記を、次のように

改めてある。

1.子音動詞の語幹につくか、母音動詞の語幹につくかで規則的に変化するものは、同じ形態素の異形態とし

て扱い、実際には発音されない音も-(r)u のように丸括弧を用いて表示する。

2.子音動詞の語幹は、ほとんどの場合、結合する活用語尾の違いに応じて二つの形を持つ。ひとつは-(r)uな

ど基本系語尾がつくとき ( 例:yom-u、tor-u)で、もうひとつは-ta(-da)や-te(-de)などタ系語尾がつくと

きである ( 例:yon-da、tot-ta)。これら二つの形は、基本系語幹、タ系語幹と呼んで区別されることがある

が、ここでは異形態とみなし、基本系語幹により表すものとする。

3.不規則動詞の語幹は k-、s-とする。

4.子音動詞につく活用語尾-iについてはMLU計算の際、無視されるように、+iとする。

表 7.2の区分を見ても分かるように、形態素の分析に関しては、ローマ字に基づく日本語文法からアプロー

チするほうが、便利であると思われる。音素 (phonemic)レベルで動詞の分類をするために、子音と母音の間

にも語幹と活用語尾の境界を規定できる。その結果、語幹を一つの形態素とし、活用語尾のそれぞれを別個の

形態素として考えやすいからである (例:hana-su ではなく hanas-u。詳細は、下記の B.1.1 参照)。

58

Page 83: JChatman

7.2. 形態素分析:オプショナル

表 7.2: ローマ字表記に基づく日本語文法の表記:JCHAT用

子音動詞 母音動詞

活用の種類 (U-動詞) (RU-動詞) 不規則動詞 不規則動詞

(-iru動詞) (-eru 動詞)

未然形 hanas-anai mi-(a)nai ne-(a)nai k-(a)nai s-(a)nai

yom-anai oki-(a)nai tabe-(a)nai

hanas-(y)oo mi-yoo ne-yoo k-yoo s-yoo

yom-(y)oo oki-yoo tabe-yoo

連用形 hanas+i-masu mi-masu ne-masu k-masu s-masu

yom+i-masu oki-masu tabe-masu

-te(de) form hanas+i-te mi-te ne-te k-te s-te

yom-de oki-te tabe-te

-ta(da) form hanas+i-ta mi-ta ne-ta k-ta s-ta

yom-da ok-ta tabe-ta

終止形 hanas-(r)u mi-ru ne-ru k-ru s-ru

yom-(r)u oki-ru tabe-ru

仮定形 hanas-(r)eba mi-reba ne-reba k-reba s-reba

yom-(r)eba oki-reba tabe-reba

B.1 JCHATへの適用

ここまで述べてきたことを使って、ローマ字表記した日本語文法を取り入れての形態素分析では形態素をど

のように転記資料 (トランスクリプト)に記入するかを考察したいと思う。

B.1.1 転記資料 (トランスクリプト)への適用

まず、下記の転記資料 (トランスクリプト)を考察してみよう。

*CHI: kuruma ga hasitte [: hasir-te] kite [: k-te] ne dooro no ne

tonari ni saku ga atta [: ar-ta] no ne +...

*MOT: un .

*CHI: +, soko de soko ni ne asi ga butukatte [: butukar-te] ti

ga deta [: de-ta] no .

ここで注目したいのは、「走 (はし)る」のローマ字表記は「hasiru」であるということである。タ系語「hasiru」

は、学校文法によれば、ラ行五段活用の動詞であるが、ここでは、語幹を学校文法の「走 (はし)」「hasi-」で

はなく「hasir-」としてあることからも分かるように、子音動詞として区分している。「ar-」も「butukar-」も

学校文法では、どちらもラ行五段活用の動詞であるが、同様に子音動詞となる。

ところが、「deru」は、語幹 (stem)が「e」で終わっていることからも分かるように、学校文法ではダ行下一

段活用の動詞であるが、ここでは母音動詞、さらに詳しく言うと、-eru 動詞とみなしている。最後に、「来る

(kuru)」は、学校文法ではカ行変格活用であり、日本語文法でも二つある不規則動詞の一つである。

B.1.2 特に考慮を要する場合

以下の (A)と (B)、(C)と (D)を比較してみよう。

(A) *CHI: kusa o katta [: kar-ta].

59

Page 84: JChatman

第 7章 メイン・ラインに形態素をどのように表記するか

表 7.3: 基本系語幹からタ系語幹が導かれる過程

(C) (D) /yom-ta/ /yob-ta/

t ! d yomda yobda

(有声音化)

鼻音化 yomda

同化 yonda yonda

(B) *CHI: siai ni katta [: kat-ta].

(C) *CHI: nokaasan [: o#kaa-san] to hon o yonda [: yom-ta].

(D) *CHI: okaasan [: o#kaa-san] ga boku o yonda [: yob-ta].

どちらの対の動詞も、実際の発音のまま表記しただけでは、二つの区別はつかない。角括弧の中に基本系語

幹で表記すると、(A)と (B)の動詞は、それぞれ kar、katとなり、語幹末の子音により、「刈った」、「勝った」

であることが明かとなる。(C)と (D)についても同じように、yom、yobという基本系語幹により、「読んだ」、

「呼んだ」であることが明らかになる。

角括弧を用いても、学校文法の活用形では、発音どおりに表記されるため、このような区別はつけられない。

また、タ系語幹も、基本系語幹に-taなど、タ系語尾が結合したために生じる音韻上の変化と考えられるので、

発音に即した形になっている。このため、タ系語幹で表記してもあいまいなままである。(C)と (D)の動詞を

例として、基本系語幹にタ系語尾が結合し、タ系語幹が導かれる過程をみてみよう。(C)の「読んだ」の基本

系 (の)の語幹は yomであり、まずこの yomに活用語尾の taがつくと、[m]という有声音の後であるので、無

声音の [t]が有声音の [d]となり、さらに鼻音 [m]が他の鼻音 [n]に変化して [yonda]となる。(D)の「呼んだ」

の場合は、基本形 (基本系)の語幹は yobであり、まずこの yobに taが附加するが、[b]という有声音の後であ

るので、無声音の [t]が有声音の [d] となるので [yobda]となる。さらに [b]が [m]と鼻音化し、最後に鼻音 [m]

が別の鼻音 [n]となって [yonda]となると考えられる (表 7.3参照)。

上記の転記資料 (トランスクリプト)(A){(D)に見られるように、ここでは実際に発音される音は、角括弧の

直前に示してある。小さな子供の言語習得を研究する場合、特に形態素の獲得を研究する場合は、基本系 (の)

語幹で示したほうが有益であるので、それを角括弧の中に表示している。また、過去形を示す活用語尾である

taにしても、ただ単に「da」と示したのであれば、繋辞 (学校文法では助動詞)の「da」となんら区別がつか

ないので、CLANで頻度 (FREQ)を計算させるときには、区別を明示していないと不便である。

CLANプログラムでは、角括弧の直前に表記されたものは角括弧内に表記されたものと、自動的に置き換え

られることになっているので、上記の Aから Dまでを一つの転記資料 (トランスクリプト)と仮定すると、こ

のトランスクリプトのMLU計算をすれば、全体の形態素の数は 24となり、全体の発話が 4であるので、発話

当たりの形態素の数は 6となるのである。さらに、これも以前述べたように、もし、この自動置き換えを好ま

ないのであれば、+r5スイッチをコマンドに付け加えることで、自動置き換えを防ぐことができる。このよう

にしてMLU計算をすれば、形態素の数は 16となり、発話は、同じ 4であるので、発話当たりの形態素の数は

4となる。

さらに、CLANの FREQプログラムで頻度を計算させると、どうなるかを考察してみたい。CLANプログラ

ムでは、角括弧の直前に表記されたものは角括弧内に表記されたものと、自動的に置き換えられることになっ

ているので、この転記資料 (トランスクリプト)の頻度計算をすれば、その中で、使われた語の種類は、13とな

る。もし、この自動置き換えを好まないのであれば、頻度を計算させる場合にも、+r5スイッチをコマンドに

付け加えることで、自動置き換えを防ぐことができる。このようにして頻度計算をすれば、この転記資料 (ト

ランスクリプト)で使われた語の種類は、11となる。つまり、この場合には、「kar-ta」と「kat-ta」の区分、

「yob-ta」と「yom-ta」の区分を行なわない。(注:ただし、形態素の分析では、時として子供の発話を細分化し

過ぎて、子供の言語発達段階には関係のない分析をする場合があるので、注意を要する。)

60

Page 85: JChatman

7.2. 形態素分析:オプショナル

B.2 ローマ字表記の日本語文法の利点

このようにローマ字に基づく日本語文法に従って、形態素を分析してゆくと、動詞に助動詞がついて複雑化

していても対応することが出来る。

*CHI: kooen de ne mitubati ni sasareta [: sas-(r)are-ta] .

この例では、太字の部分は、動詞の語幹である sas、受け身を表す助動詞 (r)are、そして過去形を示す taから

成ることが示されるのである。以下に助動詞を含んだ文の形態素化の例を示してある。

(r)are/ (A) *CHI: inu ni kamareru [: kam-(r)are-ru] .

rare (B) *MOT: o#baa-tyan ga korareru [: k-rare-ru] .

(C) *MOT: hoka ni kotae ga kangaerareru [: kangae-rare-ru] .

mas (D) *CHI: koko ni arimasu [: ar-mas-(r)u] .

( )は頻度計算等では自動的に無視されるので、オプションを使用しない限り (r)areは rareとして扱われる。

ここで ( )を使ったのは、areを rareの異形態 (allomorph)とみなしているからである。

(A)では角括弧内に「かむ (kamu)」という子音動詞の語幹kam、その後ろに受け身を表す助動詞の語幹 (r)are、

そして ruが続いていることが、ダッシュで示されている。

(B)では角括弧内にまず不規則動詞の一つである「来る (kuru)」の語幹は k。続いて、尊敬を表す助動詞 rare、

そして、最後に ruが並んでいる。

(C)では角括弧内に「考える」という母音動詞の語幹 kangae、その後ろに可能を表す助動詞 (r)are、そして

基本形を示す ruが続いていることが、ダッシュで示されている。

(D)では角括弧内に「ある」という子音動詞の語幹 ar、それに丁寧の助動詞mas、そして (r)uが続いている

ことが、ダッシュで示されている。

以下に、学校文法で助動詞とされるものについて、日本語文法に基づく形態素表記を角括弧内に示す。

ただし、日本語文法では、助動詞として扱われず、活用語尾とされるものがある。(また、分析によっては、以

下に含まれていなくて助動詞とされるものもある。)

れる (reru) kore to are wa musubareru [: musub-(r)are-ru].

sensei mo hanasareru [: hanas-(r)are-ru].

hitori de yukareru [: yuka-(r)are-ru].

られる (rareru) homerareru [: home-rare-ru].

o#baa-tyan ga korareru [: k-rare-ru].

hoka ni kotae ga kangaerareru [: kangae-rare-ru].

せる (seru) o#kaa-san ni hon o kawaseru [: kaw-(s)ase-ru].

させる (saseru) Hana-tyan ni kore o akesaseru [: ake-sase-ru].

ここでは、seを saseの異形態 (allomorph)とみなして処理するため aseを使っている。

たい (tai) are o kaitai [: kaw-ta-i].

61

Page 86: JChatman

第 7章 メイン・ラインに形態素をどのように表記するか

だ (da) are ga boku no o#baa-tyan da.

です (desu) kore desu yo.

たがる (tagaru) are o kaitagaru [: kaw-tagar-(r)u]

ない (nai) hoohoo ga omoitukanai [: omoituk-ana-i].

ぬ (nu) hoohoo ga omoitukanu [: omoituk-anu].

ん (n) hoohoo ga omoitukan [: omoituk-an].

まい (mai) sonna koto wa dekimai [: deki-mai].

う (o) e o kakoo [: kak-(y)oo].

よう (yoo) mado o simeyoo [: sime-yoo].

た (ta) okita [: oki-ta].

saita [: sak-ta].

nonda [: nom-ta].

tonda [: tob-ta].

totta [: tor-ta].

katta [: kaw-ta].

そうだ (sooda) Kana-tyan wa uresisooda [: uresi-soo-da].

ようだ (yooda) Kana-tyan wa uresiiyooda [: uresi-i-yoo-da].

らしい (rasii) ano eega wa omosiroirasii [: omosiro-i-rasi-i].

ます (masu) koko ni arimasu [: ar+i-mas-u].

子音動詞のタ (ta)系語幹は基本形語幹の異形態 (allomorph)とみなす。同様に、過去系の活用語尾「da」は

「ta」の異形態 (allomorph)とみなす。

C. 森川式 形態素分析方法

C.1 用言の分析方法

用言は、多くの場合、二つ以上の形態素を含んでいる。より正確なMLU算出を行なう為、もしくは、用言

の種々の活用形・屈折形に焦点を当てて言語データ研究を行なう場合には、この部分を一貫した方法で分析す

る必要がある。森川式は、この分析に一貫性をもたせ、分析・入力エラーを極力押える目的で、作られたもの

である。用言以外の部分の形態素分析は、本章で既に説明された通りである。尚、このセクションでは、アル

ファベットの例文にはヘボン式を採用している。

C.2 角括弧 [: ]の使い方

本方式では、辞書で見出し語として使用される終止形 (及び同形の連体形)を活用語の基本形として扱う。し

たがって、用言として発話に含まれている動詞や形容詞が、終止形か連体形をとっている場合は、それ以上の

分析はしない。基本形以外の活用形 (未然形、連用形、仮定形、命令形がある。本章の表 1を参照のこと)及び

それに付随する形態素が続く場合に、用言の形態素分析を行なう。

既に述べた様に、この分析を置き換え記号の角括弧 [: ]を使って示すことは、JCHAT の用言分析法の全

てに共通する。森川式を使用する時は、動詞や形容詞の場合、この角括弧 [: ]内ではまずその終止形を明記

する。動詞や形容詞を、語幹のかわりに終止形で表すのは、終止形の方がエラーの可能性が少ないであろうと

いう考慮にもとづいている。その後に、他の付随形態素のコードを挿入する (下記に挙げる形態素コ―ドのリ

ストを参照のこと)。これらのコ―ドは、接尾辞記号「‐」によって分ける (下記の例 2を参照)。

また、発話の表層で、既に終止形/連体形の活用形になっている用言は、置き換え記号による形態素分けを

しないこととする (下記の例 1を参照)。

62

Page 87: JChatman

7.2. 形態素分析:オプショナル

例 1 夕方雨が降るよ。 yuugata ame ga furu yo .

例 2 今朝雨が降ったよ。 kesa ame ga futta [: furu-ta] yo .

ここで注意すべき事は、森川式の場合、置き換え記号 [: ]内で接尾辞記号「‐」に続く項目は、形態素その

ものというより、形態素コードである、ということである。多くの形態素は、動詞の活用の種類などによって、

少しずつ変型する。例えば、「可能」の形態素は、五段活用とサ行変格活用の動詞では「れる」だが、その他

の動詞では「られる」になる。また、動詞の語幹が子音で終るか母音で終るかによって、最初の /r/が落ちた

り落ちなかったりする。これらをそのままの形で置き換え記号 [: ]内に表記すると、可能の形態素は、少く

とも四つの形をとり得ることになる。これでは、入力時にエラーが起きたり、後に動詞の可能の形態素を含む

発話を検索する場合に、その手続きが複雑になってしまう。そこで、この形態素の形を一貫させる為、本方式

では、どの種類の動詞の場合でも、-reru を使用する。また、検索の際の混同を避ける目的で、「可能・自発」

は -reru、「受身・尊敬」は -rareru とコード化する (下記のリストを参照)。もう一つの例を挙げると、命令の

活用語尾は、五段活用の動詞では -e(「飲め」)、上・下一段活用の動詞では -ro(「食べろ」)になるが、全動

詞について一貫して-ro と表記する。この様に本方式では、形態素コードは、つながり得る全動詞・形容詞に

ついて一貫した形をとるので、置き換え記号 [: ]内の形が実際に発音される形とは多少異ることが多い。し

かし、一貫した形態素コードは、後の検索、頻度の計算等に大きく役立つもので、下記のリストを参照しなが

ら正確に入力する。

C.2.1 動詞・形容詞に付随する形態素

動詞・形容詞に付随する形態素 (活用語尾・接続助詞・助動詞)の大部分を下記のリストに示す (Clancy, 1985;

Kuno, 1973; 北原,1981; その他にもとづく)。このリスト中、動詞については、五段活用の「飲む」と下一段活

用の「食べる」の分析例、形容詞は、「痛い」の分析例を示した。

63

Page 88: JChatman

第 7章 メイン・ラインに形態素をどのように表記するか

形態素コード 意味 動詞例 形容詞例

五段 一段活用

-garu 状 態 ! 活 動

(Stative!Active)

nomitagaru

[: nomu-tai-garu]

tabetagaru

[: taberu-tai-garu]

itagaru

[: itai-garu]

-i 接続 (Continuative) nomi [: nomu-i] tabe [: taberu-i] itaku [: itai-i]

-ku 形容詞→副詞的 itaku [: itai-ku]

-masu 丁寧 nomimasu

[: nomu-masu]

tabemasu

[: taberu-masu]

-n 否定 noman [: nomu-n] taben [: taberu-n]

-nagara 同時の動作 nominagara

[: nomu-nagara]

tabenagara

[: taberu-nagara]

-nai 否定 nomanai

[: nomu-nai]

tabenai

[: taberu-nai]

itakunai

[: itai-nai]

-nakya 義務 nomanakya

[: nomu-nakya]

tabenakya

[: taberu-nakya]

itakunakya

[: itai-nakya]

-nasai 命令 nominasai

[: nomu-nasai]

tabenasai

[: taberu-nasai]

-nu 否定 nomanu [: nomu-nu] tabenu

[: taberu-nu]

-rareru 受身、尊敬 nomareru

[: nomu-rareru]

taberareru

[: taberu-rareru]

-reba 仮定 nomeba

[:nomu-reba]

tabereba

[: taberu-reba]

itakereba

[: itai-reba]

-reru 可能、自発 nomeru

[: nomu-reru]

taberareru

[: taberu-reru]

-ro 命令 nome [: nomu-ro] tabero

[: taberu-ro]

-saseru 使役、許可 nomaseru

[: nomu-saseru]

tabesaseru

[: taberu-saseru]

-soo 様態 nomisoo

[: nomu-soo]

tabesoo

[: taberu-soo]

itasoo [: itai-soo]

-ta 過去、完了、確認 nonda [: nomu-ta] tabeta

[: taberu-ta]

itakatta

[: itai-ta]

-tai 希望 nomitai

[: nomu-tai]

tabetai

[: taberu-tai]

-tara 仮定 nondara

[: nomu-tara]

tabetara

[: taberu-tara]

itakattara

[: itai-tara]

-tari 交互 (Alternative) nondari

[: nomu-tari]

tabetari

[: taberu-tari]

itakattari

[: itai-tari]

-te 接続 (Gerundive)依

nonde [: nomu-te] tabete

[: taberu-te]

itakute

[: itai-te]

-temo 逆説の仮定 nondemo

[: nomu-temo]

tabetemo

[: taberu-temo]

itakutemo

[: itai-temo]

-yoo 勧誘、意志、推量 nomoo [: nomu-yoo] tabeyoo

[: taberu-yoo]

itakaroo

[: itai-yoo]

64

Page 89: JChatman

7.2. 形態素分析:オプショナル

上記のリストを使用する際、下記の事項を留意すること。

1. 接続 (Continuative)の形態素 -i は、連用形が接続の形として文節の終わりに使われる場合のみ分ける。

動詞例 山に登り河を渡る yama ni nobori [: noboru-i] kawa o wataru.

形容詞例 優しく綺麗なお母さん yasashiku [: yasashii-i] kirei na o#kaa-san

2. 形容詞がメインの動詞や形容詞を修飾する (副詞的に使われる)場合、形態素の -kuを分ける。表層的には

連用形であるが、上記の接続の形として使われる場合と区別すること。

優しく頭を撫でる yasashiku [: yasashii-ku] atama o naderu.

3.「なきゃ」(義務を表す形態素 -nakya)は、文献によっては接続助詞と分類されるが、「なくちゃ」、「なけ

れば」、「なくては」という形もとり得る。これらは、発話者にとっては定式的な表現である可能性が強く、

特殊な場合を除いて、いずれの場合も一形態素として扱う。尚、これらに続く「いけない」、「いかん」、

「ならない」、「ならん」も一形態素として扱い、それ以上の分析はしない。

行かなきゃならない ikanakya [: iku-nakya] naranai.

行かなくちゃいけない ikanakucha [: iku-nakucha] ikenai.

4. 様態の -soo は、終止形に付く場合、置き換え記号 [: ]を使わない。

終止形: 雨が降るそうだ ame ga furu sooda.

連用形: 雨が降りそうだ ame ga furisoo [: furu-soo] da.

5. 形態素 -te を伴う「依頼」の形は、動詞のみに使われる。

6. 形容詞に付く形態素 -yoo は「推量」を表す為のみに使われ、「勧誘・意志」を表すことはない。

7. 活用語の基本形以外に付く形態素で上記のリストに載っていないもの: このリストは未だ完全では無く、ま

た、方言などに独特の形態素は全く除外されている。このリストに含まれない形態素がトランスクリプト

に見つかった場合には、個人の裁量で形態素分けとコード化を行っても良い。個人裁量による形態素コー

ドの追加や変更などは、00readme.docに明確に記録しておくこと。判断のつかないもの、又は、正式にリ

ストに加えるべきと判断されるものは、森川に連絡のこと。

以上の様に、メイン・ラインにおいて、個々の用言につき置き換え記号 [: ]を使ってその形態素分析を示す。

食べたくなかった tabetakunakatta [: taberu-tai-nai-ta]

来させません kosasemasen [: kuru-saseru-masu-n]

遊びたがっちゃった asobitagatchatta [: asobu-tai-garu-chau-ta]

悲しがらない kanashigaranai [: kanashii-garu-nai]

参考までに、前記の学校文法と南式での分析例と、森川式による分析例を比較してみよう。例は、尊敬の形態

素「られる」を含む、「来られる」(非過去形)と「来られた」(過去形)である。

方式 非過去 過去

学校文法 [: ko-rareru] [: ko-rare-ta]

南式 [: k-rare-ru] [: k-rare-ta]

森川式 [: kuru-rareru] [: kuru-rareru-ta]

C.2.2 動詞・形容詞に付随する形態素

次に挙げる補助動詞は、動詞の連用形に続くものである。

65

Page 90: JChatman

第 7章 メイン・ラインに形態素をどのように表記するか

補助動詞 形態素コード 例

I 接続助詞「て」を伴うもの

てあげる -te+ageru miseteageru [: miseru-te+ageru]

てある -te+aru aketearu [: akeru-te+aru]

てちょうだい -te+choodai kitechoodai [: kuru-te+choodai]

てごらん -te+goran oshitegoran [: oshi-te+goran]

ていく -te+iku kumotteiku [: kumoru-te+iku]

て (い)らっしゃい -te+(i)rasshai aruiterasshai [: aruku-te+rasshai]

ている、てる、とる -te+iru,-teru, -torumiteiru [: miru-te+iru], miteru [: miru-teru]

てくれる -te+kureru okuttekureru [: okuru-te+kureru]

てくる -te+kuru akitekuru [: akiru-te+kuru]

てみる -te+miru nondemiru [: nomu-te+miru]

てもらう -te+morau kisetemorau [: kiseru-te+morau]

ておいで、といで -te+oide, -toide totteoide [: toru-te+oide]

ておく、とく -te+oku, -toku tatandeoku [: tatamu-te+oku]

てしまう、ちゃう -te+shimau,-chau tabeteshimau [: taberu-te+shimau]

てやる -te+yaru nadeteyaru [: naderu-te+yaru]

II 接続助詞「て」を伴わないもの

あげる -ageru kakiageru [: kaku-ageru]

だす -dasu hashiridasu [: hashiru-dasu]

がたい -gatai sutegatai [: suteru-gatai]

はじめる -hajimeru furihajimeru [: furu-hajimeru]

かかる -kakaru nagurikakaru [: naguru-kakaru]

かける -kakeru tojikakeru [: tojiru-kakeru]

にくい -nikui tokenikui [: tokeru-nikui]

おえる -oeru yomioeru [: yomu-oeru]

おわる -owaru utaiowaru [: utau-owaru]

すぎる -sugiru nomisugiru [: nomu-sugiru]

samusugiru [: samui-sugiru] (形容詞)

たりない -tarinai tabetarinai [: taberu-tarinai]

とげる -togeru yaritogeru [: yaru-togeru]

やすい -yasui mitsukeyasui [: mitsukeru-yasui]

上記の様に、接続助詞「て」を伴う補助動詞の場合は、接続助詞「て」と補助動詞の間に「+」を挿入する。

この場合、「�te+補助動詞」は、形態素計算及び MLU 計算の際、一形態素として数えられる。

なお、データ・ファイル入力中、又は入力後に、CLANプログラムのひとつである CHECKプログラムを

使ってフォーマット・エラーをチェックすると、上記の「X�Y+Z」の組み合わせをエラーとみなす結果が出

てしまう。しかし、これは JCHATでは間違いではないので、この警告は無視しても良い。また、日本語用の

00depadd.cutファイルを libディレクトリに入れておくと、CHECKプログラムを走らせた際に、エラーとし

て拾われなくて済む。このファイルの詳細については、将来出版される「日本語の為の CHILDESマニュアル

II:分析プログラム」1の中の、CHECKプログラムの章を参照のこと。

「�te+補助動詞」は、接続の �te(C.2.2.1 の形態素コ―ド・リストを参照)と区別すること。後者の場合

は、メインの動詞が 2つになる。下記の例では、前者の場合は形態素の数は 3、後者の場合は形態素の数は 4

である。1残念ながら未出版である。

66

Page 91: JChatman

7.2. 形態素分析:オプショナル

補助動詞 (複合動詞)

(新しい椅子に)座ってみた suwattemita [: suwaru-te+miru-ta]

接続 (並立動作を表す)

(テレビを)座って見た suwatte [: suwaru-te] mita [: miru-ta]

なお、発話者がこの様な分析を獲得しておらず、ひとつの動詞として使用している、と判断される場合には、

MLU の過大評価を避ける為、「�」のかわりに「+」でつないでも良い。ただし、その様な場合には、%comラ

イン等にその旨をコメントとして明記しておくことが必要である。なお、下記のコメントの書き方は一例であ

り、明瞭であればどの様な書き方でも良い (英文でもローマ字でも可)。

*CHI aka-chan ga nakidasu [: naku+dasu].

%com Auxiliary verb is separated by `+' instead of `-'.

C.2.3 繁辞 (copula)の使い方

繋辞の基本形には「だ」と「です」が有る。これらは、次の様な形態素と組み合わされる。

形態素コード 意味 「だ」 「です」

-ta 過去、完了、確認 datta [: da-ta] deshita [: desu-ta]

-tara 仮定 dattara [: da-tara] deshitara [: desu-tara]

-tari 交互 (Alternative) dattari [: da-tari] deshitari [: desu-tari]

-yoo 推量 daroo [: da-yoo] deshoo [: desu-yoo]

人参が好きだったら全部食べなさい。

ninjin ga suki dattara [: da-tara] zenbu tabenasai [: taberu-nasai].

一般に「だ」は活用するものと分類されているが、このような分析を、通常、発話者 (特に幼児)が完全に行

なっているとは思われない。そこで下記の形は、分析せず個別の形態素として扱うことにする。

で (動詞・形容詞の接続 �te に相当する)

ジュースが好きで毎日飲んでいるよ

juusu ga suki de mainichi nondeiru [: nomu-te+iru] yo.

でも (動詞・形容詞の逆説の仮定 -temo に相当する)

ジュースが好きでも牛乳を飲みなさい

juusu ga suki demo gyuunyuu o nominasai [: nomu-nasai].

な (「だ」の連体形)

好きなジュース

suki na juusu.

なら (「だ」の仮定形)

ジュースが好きならあげましょう

juusu ga suki nara agemashoo [: ageru-masu-yoo].

同様に、「ではない」、「じゃない」、「でない」は、疑問文の文末を表す場合には、全体をそのまま一形態素

とする。

そろそろお昼御飯じゃない? sorosoro o#hiru+gohan janai?

67

Page 92: JChatman

第 7章 メイン・ラインに形態素をどのように表記するか

しかし、これらが否定を表わす為に用いられる場合は、否定の部分を形態素として分ける。これは、否定文

の検索などにとって重要である。原則的には、否定以外の部分は「分析されない形」として、細分化しないこ

ととする。

ではない dewanai [: dewa-nai]

じゃない janai [: ja-nai]

でない denai [: de-nai]

この他にも、下記の様な繋辞を含んだ定式的な表現が有る。これらも一語として扱い、繋辞と他の部分とを

分けないようにする (綿巻, 1994)。

助動詞 形態素コード 例

I 体言に続く

なのだ nanoda hontoo nanoda

なんだ nanda hontoo nanda

なのです nanodesu hontoo nanodesu

なんです nandesu hontoo nandesu

II 用言に続く

のだ noda ganbaru noda

んだ nda ganbaru nda

のです nodesu ganbaru nodesu

んです ndesu ganbaru ndesu

これらの助動詞的熟合語が過去形をとる場合は、上記の形態素コード・リストにあるコードを使用して接尾

辞を分ける。

hontoo nanodatta [: nanoda-ta].

これに加えて、下記のものでも名詞・名詞句や用言の終止形 (又は過去形、否定形、等)につくものは、一助動

詞として、繋辞と他の部分とを分けないようにする。

助動詞 形態素コード 例

そうだ、そうです sooda, soodesu asu wa hareru sooda.

ようだ、ようです yooda, yoodesu owatta [: owaru-ta] yooda.

みたいだ、みたいです mitaida, mitaidesu kikoenai [: kikoeru-nai] mitaida.

この様に形態素コードに分けたあとは、そのコードにもとづいて、CLANプログラム群の中の検索を行なう

プログラム COMBO(組み合わせのパターン・マッチング)や KWAL(キーワード検索)を使って、特定の形態

素を含んだ発話などを詳細に分析することができる。

文献

1. Association for Japanese-Language Teaching. (1984). Japanese for busy people,1. Tokyo: Kodansha

International.

2. Clancy, P. M. (1985). The acquisition of Japanese. In D. I. Slobin (Ed.), The crosslin-guisticstudy of

language acquisition Vol. 1: Data (pp. 373{524). Hillsdale, NJ: LawrenceErlbaum Associates.

3. Demers, R. A., & Farmer, A. K. (1986). A linguistics workbook. Cambridge, MA: MIT Press.

4. Fernald, A. & Morikawa, H. (1993). Common themes and cultural variations in Japanese and American

mothers' speech to infants, Child Development, 64, 637-636.

68

Page 93: JChatman

7.2. 形態素分析:オプショナル

5. 北原保雄他 (編).(1981).日本文法事典.東京:有精堂出版.

6. Kuno, S. (1973). The Structure of the Japanese Language. Cambridge, MA:The MIT Press.

7. MacWhinney, B. (1991). The CHILDES project: Tools for analyzing talk. Hillsdale, NJ: Lawrence

Erlbaum Associates.

8. Masuda, K. (1974). New Japanese-English dictionary (4th ed.). Tokyo: Kenkyusha.

9. Maynard, S. K. (1990). An introduction to Japanese grammar and communication strategy. Tokyo:

Japan Times.

10. Minami, M. (1991). Coding rules for the CHAT system in Japanese. Unpublished manuscript, Harvard

University.

11. Minami, M. & McCabe, A. (in press). Rice balls and bear hunts: Japanese and Caucasian family

narative patterns. Journal of Child Language.

12. Morikawa, H., Shand, N. & Kosawa, Y. (1988) Maternal speech to prelinguisitic infants in Japan and

the United States: relationships among functions, forms and referents. Journal of Child language,

15,237-256.

13. Shibatani, M. (1990). The languages of Japan. Cambridge, UK: Cambridge University Press.

14. Vance, T. J. (1987). An introduction to Japanese phonology. New York:State University of New York

Press.

15. 益岡隆志・田窪行則. (1992). 基礎日本語文法改訂版. くろしお出版.

16. 綿巻徹.(1994).日本語発話解析プログラム JUPITA.日本発達心理学会第5回大会発表原稿.

後書き

本章は、1994年 JCHAT meetingにおける口頭発表の内容に加筆・修正を施したものである。加筆・修正に

関して、マッギル大学の大嶋百合子氏、慶応大学の佐野けい子氏をはじめ、meetingに参加された JCHAT会

員の方々に大変有意義なご助言をいただいた。記して感謝の意を表したい。また、校正、編集の過程で大変お

世話になった静岡大学の岩立志津夫氏にもこの場を借りて感謝の意を表したい。 (南)

用語説明

異形態 (Allomorph)

同一の形態素 (morpheme)に属する形のこと。たとえば、英語では、複数を表す接尾辞/-s/、/-z/、/-iz/

は複数を表す形態素の異形態とみなされる。同様に、日本語では過去系を表す活用語尾/-ta/、/-da/は形

態素の異形態とみなされる。

iru動詞

日本語文法上の分類。学校文法の上一段活用の動詞に相当 (例: mi-ru, oki-ru)。

eru動詞

日本語文法上の分類。学校文法の下一段活用の動詞に相当 (例:ne-ru, ake-ru)。

(抽象的な単位の)音素レベル (phonemic level)

音声レベル (phonetic level)

カ行変格活用

学校文法上の分類。「来る」一語だけの特別な活用。

69

Page 94: JChatman

第 7章 メイン・ラインに形態素をどのように表記するか

活用形

活用語尾による活用語の形で、未然形、連用形、終止形、連体形、仮定形、命令形、等がある。

上一段活用

学校文法上の分類。五十音図の「イ」段にだけ活用 (例:見る)。

基本系語幹

子音動詞の語幹で、結合する活用語尾の違いに応じて 2つの形を持つもののひとつ。

屈折形

活用する語の種々の活用形に一つ以上の接尾辞を加えた形 (例:「走る」の場合、走った、走れる、走ら

せる、走りたかった、等)

形態素 (morpheme)

意味をもった最小単位。

繋辞 (Copula)

活用しない語に続いて、様々な活用形の変化を担う。

合同 (Fusion)

五段活用

学校文法上の分類。五十音図の五つの段に活用 (例:話す)。

語幹 (stem)

サ行変格活用

学校文法上の分類。「する」一語だけの特別な活用。

子音動詞 /u-動詞

日本語文法上の分類。語幹が子音で終わる動詞 (例:hanas-u)。学校文法の五段活用の動詞に相当。

下一段活用

学校文法上の分類。五十音図の「エ」段にだけ活用 (例:寝る)。

接辞 (A�x)

接頭辞 (Pre�x)

接尾辞 (Su�x)

タ系語幹

子音動詞の語幹で、結合する活用語尾の違いに応じて 2つの形を持つもののひとつ。「た」がつくときの語

幹。(例)咲く sak-u、sai-ta;書く kak-u、kai-ta;読む yom-u、yon-da;着く tuk-u、tui-ta;遊ぶ asob-u、

ason-da;取る tor-u、tot-ta;買う kaw-u、kat-ta。

トランスクリプト (transcript)

転記資料。

鼻音 (nasal)

子音の一種。呼気が鼻を通って生じる音。

不規則動詞

日本語文法上の分類。(ku-ru,su-ru)。学校文法のカ行変格活用の動詞 (来る)と、サ行変格活用の動詞 (す

る) に相当。

70

Page 95: JChatman

7.2. 形態素分析:オプショナル

複合語 (Compound)

分類辞 (Classi�er)

母音動詞 /RU-動詞

日本語文法上の分類。語幹が母音で終わる動詞 (例:mi-ru, ne-ru)。RU-動詞の中で-iru 動詞は、学校文法

の上一段活用の動詞、-eru 動詞は、学校文法の下一段活用の動詞に相当。

補助動詞 (auxiliary verb)

本来は動詞であるが、メインの動詞や形容詞に続いて、付随的に使用される。

無声音 (voiceless)

発声または声帯の振動を伴わない音。有声音に対する語。

有声音 (voiced)

発声または声帯の振動を伴う音。無声音に対する語。

用言

活用する語で、動詞、形容詞、形容動詞・体言に続く繋辞を含む。

71

Page 96: JChatman
Page 97: JChatman

第8章 発話の区切り方と調子単位

宮田 Susanne・岩立志津夫CHAT及び JCHATでは、1つの発話が 3段階の単位 (unit)から構成されていると考えている。この 3つの

単位を大きな順にならべると、発話 (utterance)、語 (word)、形態素 (morpheme)となる。語と形態素の区切

り方については前の 3つの章 (第 5、第 6、第 7章)で説明されているので、この章では、発話の調子単位 (tone

units)に関心のある研究者のために、発話の区切り方とともに調子単位の表記の仕方について説明する。

8.1 基本的な終端記号

「メイン・ラインには 1つの発話しか書き込まない」という原則がある。そこで、発話の終わりには必ず終

端記号 (terminators)をつけなければならない。しかし 1つの発話が 1行より長くなる場合には、発話の途中

で終端記号をつけずに改行する。そして、次の行に続きの内容をタブを入力してから記述する。なお、1つの

メイン・ラインの長さには最大 2000文字という制限がある。

発話は基本的にピリオド「.」、疑問符「?」、感嘆符「!」の3つの終端記号で区切られる。

1.ピリオド .

ピリオドは平叙文としての発話の終わりを示す時に使われる。CLANプログラムではこの記号が出てくる

と発話が終わったと解釈するので、文の途中でピリオドを使うのは避ける必要がある。例えば、英語の語

Mr.は Mr に書き直す。

*ASU: okashi taberu .

2. 疑問符 ?

疑問符は疑問発話の終わりを示す終端記号である。

*ASU: kore taberu no ?

3. 感嘆符 !

感嘆符は、命令調の発話や強い口調の発話の終わりを示す終端記号である。

*ASU: basu atta !

8.2 調子単位の表記の仕方

8.2.1 発話の終端部での調子単位

通常は 8.1節の 3つの終端記号で発話の終わりを示す。しかし、調子単位を付加して表記したくなることが

ある。そのために CHATでは次の 4つの記号が考えられている。これらは全て CLANプログラムでは発話の

終わりとして処理される。

1. 上昇疑問符 -?

これは疑問文で、最後の部分で「上昇する音調曲線」(rising contour)を 持つ発話で使われる。

73

Page 98: JChatman

第 8章 発話の区切り方と調子単位

*ASU: kore taberun -?

2.下降ピリオド -.

これは最後の部分で「下降する音調曲線 」(falling contour)を持つ発話で使われる。

3.上昇-下降ピリオド -'.

これは最後の部分で「上昇-下降の音調曲線」(rise-fall contour)を持つ発話で使われる。

4.下降上昇ピリオド -,.

これは最後の部分で「下降-上昇の音調曲線」(fall-rise contour)を持つ発話で使われる。

8.2.2 発話中での調子単位

発話の終わり部分ではなくて、発話の途中で調子が変化することがある。この変化を記述するために次の2

つの表記法がある。

1.平板型音調曲線 -,

これは発話の途中で「平板型音調曲線」(level contour)が見れらる時に使う。例えば、念を押す時や発話

がまだ続く時である。

*CHI: kore to-, kore to -, kore to -, ze:mbu motte yoochien e

iku n da yo -, .

2.低い平板型音調曲線 -_

これは「低い平板型音調曲線」(low level contour)が見られる時に使用する。

補足

日本語の場合抑揚は複雑で、アクセント (「橋」と「箸」の差)、イントネーション (発話全体の高低)、プロミ

ネンス (音声上の強弱)の 3者を区別する必要がある。今後これらを ASCII記号でどのように表記するか検討

する必要があるだろう。特に第 2言語獲得や方言のデータを扱う場合これらの区別を無視することはできない。

8.3 コンマの使い方

発話の途中で区切りをつけたい時、コンマ (,)を使う。コンマは、ピリオドと違って発話の終了を意味しな

い。JCHATでは、「呼びかけ語」「間投詞」「転置」(dislocation)に限って使用する。したがって、これ以外の

理由でコンマを利用する場合には、その使い方を 00readme.docに明記する必要がある。

1.呼びかけ語でのコンマ ,

転記された語連鎖だけでは、呼びかけ語と主語の区別がつかない。そこで呼びかけ語であることが明確な

場合にはコンマを必ずつける。

*CHI: Mama, kore mite !

*CHI: kore mite, Mama !

呼びかけだけの発話は次のように記述する。

*CHI: Mama !

%com: yobikake

呼びかけかどうかはっきりしない場合には次のように %com をつける。

*CHI: Mama yatte !

%com: yobikake ka shugo ka hakkiri shinai

74

Page 99: JChatman

8.4. 休止と持続

2. 間投詞でのコンマ ,

*CHI: un, aru yo .

間投詞の後休止が入り独立した発話と見なした方がよい場合には、別の発話として扱った方がいいだろう。

*CHI: un .

*CHI: aru yo .

3. 転置でのダブル・コンマ ,,

*ASU: kore tabeta,, kore ?

*ASU: kita yo,, Mama ga .

8.4 休止と持続

発話の途中で休止が入ったり、特定の音を伸ばす場合がある。これらに対して、JCHATでは次のような記

号を使用する。

1. 休止 #

シャープ (#)は発話内での休止を表現するのに使われる。休止が長い場合には、2つ3つとシャープをつ

なげてその程度を表現する。休止時間を正確に表現したい場合にはシャープの後に「分:秒_1/10秒」の形

式でその時間を記入することもできる。秒は必ず記入するが、分と 1/10秒は省略可能である。

*CHI: kore # wa ## koko .

*CHI: tsugi no wa #0_5 koko . 0.5秒の休止

*CHI: #1:02_5 yappari chigau . 1分 2.5秒の休止

2. 持続 -:

語を伸ばす発音に使用する。

*CHI: itai -: ! 「いたーい!」

*CHI: itai yo -: ! 「いたい よー!」

また、語内の一部の音が持続したことを示す場合にはコロン:を使う。

*CHI: i:tai . 「イータイ」

8.5 特殊な終端記号

基本的な終端記号と同様に形式的には発話の終わりを示しているが、内容的には発話が完結していない場合

がある。そのような場合には次の 4つの特殊な終端記号を使う。

1. 未完成 +...

この記号は未完成なままで発話が終わってしまった場合に使う。

*CHI: kore wa +...

2. 中断未完成 +/.

この記号は、他人や出来事が原因で発話が中断されたまま終わった発話に使う。

*CHI: kore wa +/.

75

Page 100: JChatman

第 8章 発話の区切り方と調子単位

*MOT: dame !

3.自己中断未完成 +//.

これは発話者自身が途中で発話を中断した場合に使う。

*CHI: bubu wa +//.

*CHI: dame !

4.質問・中断未完成 +/?

この記号は、質問している最中に、他人や出来事が原因で発話が中断されたまま終わった発話に使う。

*CHI: kore dare no +/?

*MOT: dame !

その他、発話を引用したり、相手の話に即答するための終端記号がある。

1.後述引用 +"/.

これは、引用する内容を後で述べる場合に使用する。英語の例と日本語の例を示す。+"/."は+"とペアで

使う。"+の後に引用される内容を書く。

*CHI: the little bear said +"/.

*CHI: +" please give me all of your honey .

*MOT: oosama ga donatte itta +"/.

*MOT: +" yamero !

2.前述引用 +".

これは、引用内容を前の行に示す場合に使用する。+".は"+とペアで使う。+"の後に引用される内容を

書く。

*MOT: +" yamero !

*MOT: to oosama ga donatte itta +".

その他終端記号ではないが、関連する記号に次のものがある。

1.引用内容 +"

引用される内容を示す。発話の最初に書く。使用方法は上の 5、6を参照。

2.即答 +^

これは相手の問いに即答する時に使う。

*MOT: nande yobureta no ?

*CHI: +^ yaburetenai yo !

8.6 発話の区切り方

言語獲得時の子どもの発話を転記する場合、「発話と発話の間にある休止やイントネーションから判断して、

一つの発話として区切るべきかどうか決める」というのが基本原則である (Bloom, & Lahey, 1978)。しかし実

際に転記していると、当該の発話を一つの発話として扱った方がいいか複数の発話として扱った方がいいか迷

う場合がしばしばある。ここでは、発話を区切る際に転記者が悩むいくつかの問題をとりあげ、それらに対す

る対処方法について述べる。

76

Page 101: JChatman

8.6. 発話の区切り方

8.6.1 繰り返し

言語発達初期の幼児は同じ発話を繰り返すことが多い。繰り返す内容には、語の場合も複数の語群の場合も

ある。例えば次の通りである。

*CHI: gohan gohan gohan gohan . 語の場合

*CHI: kore mite kore mite . 複数の語の場合

繰り返しを含むこのような発話を CHATで記述する方法には次の 5つが考えられる。例として最初のものを

取り上げる。

1. 4つの語から成る1つの発話

*CHI: gohan gohan gohan gohan .

2.コンマで区切った 4つの語から成る 1つの発話

*CHI: gohan, gohan, gohan, gohan .

3. 1つの発話として扱い、語をイントネーション記号 (第 9章)で区切る

イントネーション記号については第 9章「語内の韻律」参照。

*CHI: gohan -, gohan -, gohan -, gohan .

4. 1つの語を発音するための 3回の試み

*CHI: gohan [/] gohan [/] gohan [/] gohan .

5. 4つの独立した発話

*CHI: gohan .

*CHI: gohan .

*CHI: gohan .

*CHI: gohan .

以上の 5つの方法によって発話を記述してから、CLANを使って発話平均語数 (MLU)を計算すると次のよ

うな結果が得られる。

1の場合 MLU=4.0 発話数=1 形態素数=4

2の場合 MLU=4.0 発話数=1 形態素数=4

3の場合 MLU=4.0 発話数=1 形態素数=4

4の場合 MLU=1.0 発話数=1 形態素数=1

5の場合 MLU=1.0 発話数=4 形態素数=4

1、2、3の方法を取った場合、次のような発話と同じように扱っていることを知っておくのは MLUの計算

結果を解釈する際に重要である。もし 4つの語間に何らかの統語関係が認められないとすれば、1、2、3の方

法は避けた方がいいだろう。

*CHI: Mikkii gohan tabe-tai . MLU=4.0 発話数=1 形態素数=4

4の方法では、子どもは1つの語を 3度言おうとして 4回目にうまく言えたと解釈している。子どもがある単

語を繰り返し発音しようとしているのがが明確でない場合には、5の方法を採用するのが適切かもしれない。

しかし、5の方法をとると、言語発達の初期で繰り返しの多い子どもの場合、MLU が過小評価される。そこ

で 4で記述して、言い直しの記号を使った場合と無視した場合両方のMLUを計算して比較する方法が、この

ジレンマを逃れる一番よい方法かもしれない。

77

Page 102: JChatman

第 8章 発話の区切り方と調子単位

繰り返しを 1つの複合語として扱った方がよいと思えば、+でつなげて次のように記載することも可能で

ある。

*MOT: soo+soo .

8.6.2 列挙

繰り返しと並んで扱いに困るのが列挙である。列挙とは、次の例のように関連するものを続けて例示する場

合を指す。

*CHI: gyuunyuu juusu to ocha .

上の例のように「と」という助詞が使われていて、明らかに一つの発話と考えられる場合には一つの発話と

して転記する。しかし、それぞれの語がつながっていないと判断される場合には次のように転記して、3つの

発話として扱う。

*CHI: gyuunyuu .

*CHI: juusu .

*CHI: ocha .

また、暗唱による列挙を 1発話に全て含めると、語数が増えてしまう。MLUの計算値も高くなる。そこで、

複合語ではないが複合語記号を使用して、形態素数が増えないように工夫することができる。

*CHI: ee+bii+shii+dii+ii+efu+jii o kaita .

数字や ABCに限らず、暗唱発話はMLUの計算からはずすことが多い (Brown,1973)。なお、発話の最後に

ポストコード [+ bch]をつけて、それらの発話を除外することもできる。MLUの計算時には-s"[+ bch]" オ

プションを使う。

*CHI: < ichi san shi go juu > [=! counting] ! [+ bch]

*CHI: < saita saita chuurippu ga > [=! singing] . [+ bch]

78

Page 103: JChatman

第9章 語内の韻律

宮田Susanne・寺尾 康

9.1 はじめに

本章では語内の韻律を表記するための記号を扱う。まず、CHATで一般的に用いられてきた記号を簡単に紹

介し、そのうえで、日本語の表記法を解説していくことにする。ここで注意しなければならないのは、日本語

は英語とは言語学的に異なる高低アクセントを持っているという点である。現在まで開発されてきた記号はい

わゆる強弱アクセントを持つとされる言語のためのものがほとんどであることを考えると、それらを翻訳した

だけでそのまま採用することは難しく、記号の解釈や表記法の開発に試行錯誤的な段階が残されていることを

予め了解していただきたい。

なお、ここでいう韻律とはアクセント、音の継続時間の変化、休止によって生じる音韻的な現象全体をさす。

またアクセントとは語内での高低、強弱、長短などの音量差のことをいう。

9.1.1 強勢の表記法 (英語など)

英語をはじめとする強弱アクセントの体系を持つ言語では、強勢 (stress)がある音節は他の音節より高く、

長く、強く発音される。聞き手の立場からすると他よりも「目立って」いるととれる部分に強勢があることに

なり、一語内にいくつかの強勢がおかれることも可能であるが、中心となる強勢がおかれるのは一語内に一つ

だけというのが強弱アクセント言語の特徴である。

CHAT英語版では、次に示す三つの観点からみた強勢が記号化されている。どんな種類の強勢かはスラッ

シュの数で分類され、いずれもメイン・ライン上で強勢のある音節の直前に挿入される。記号と実例は以下に

示す通りである:

/ 語内の音節に強勢がある場合に使用される。

*CHI: rhi/noceros .

// 核強勢 (nuclear stress) 1が置かれる音節であることを示す。

*CHI: rhi//noceros .

/// 対照的な、非常に強い強勢が置かれていることを示す。

*CHI: rhi///noceros .

特定の音節ではなく、語や語の連続に付与される強勢について表記する場合にはスラッシュではなく、[!]

と [!!]という記号を用いる方法もある。その用法については第 10章を参照のこと。

1核強勢とは調子群のなかでもっとも卓立した音節に与えられる強勢のこと。調子群とは聞き手の理解しやすさを考えて話し手がピッチの変化をつける際の音声的に自然なまとまりのこと。統語的、意味的、語用論的にみても一つの自然な区切りをなすとされている。つまり、ダブル・スラッシュを付与された音節は調子群の中で最も重要な箇所にあるということになる。これを語用論的な観点からみれば、付加的な新情報の位置ということになる。同じ観点からみれば、トリプル・スラッシュを付与された音節は対照的な新情報を担っている箇所にあるということになる。

79

Page 104: JChatman

第 9章 語内の韻律

9.1.2 音節の長音化 (英語)

ある音節を長音化する場合は、その音節の直前にコロンが置かれる。

: 音節の長音化

*MOT: baby want bana:nas ?

9.1.3 音節間の間断 (英語)

音節と音節の間に間断 (pause)が認められる場合にはその部分にコロンを二つ連ねた記号を置く。

:: 音節間の間断

*MOT: is that a rhin::oceros ?

9.2 日本語のアクセントの特徴と表記の試み

本節では日本語のアクセントの特徴のいくつかを、ごく限られた方言のものではあるが2、紹介したうえで、

記号化する際の問題点および英語版の記号との接点を検討してみたい。

まず、英語のアクセント体系とは異なる高低アクセントという呼び方は日本語のアクセントではピッチ (音

の高さ)の相対的な変化が知的意味の区別等に重要な役割を演じている、というところからきている。続いて、

その特徴のいくつかをみていくと、

(i)登録されている段階差は「高」と「低」の二段階であること、

(ii)アクセントを担う単位はモーラ (拍)または音節と呼ばれる単位であること、

(iii)その単位内でのピッチの変化 (例えば北京語の四声のように)には示差的な機能はないこと、

(iv)強弱アクセントのように一つのまとまりの中に頂点となる音節が一つだけということはなく、頂点の数は

いくつでもよいこと、

が挙げられる。このうち、四つ目の特徴は日本語というより高低アクセントの言語学的特徴ということができ

る。次に具体例をみていくと、「端が」、「箸が」、「橋が」といった同音異義語句の一群はアクセントによって

共通語では意味を区別することができる。これらを前述の特徴 (i)、(ii)に基づいて一つのモーラに一つの漢字

をあてて表記すれば、それぞれ「低高高」、「高低低」、「低高低」のようになる。

しかし、この表記法は通常用いられることはなく、記述の方法として一般的であると思われるのは「高」の

部分に黒く塗りつぶした丸印を、「低」の部分に白い丸印を対応させて、「○●●」、「●○○」、「○●○」のよ

うにする方法と高さの変化に注目して「高」から「低」へ移る部分に┌ 印を、「低」から「高」へ移る部分に

┐印を与えて、「ハ┌シガ」、「ハ┐シガ」、「ハ┌シ┐ガ」のように記述する方法の二つである。

ところが、ここで既に二つの問題が生じていることに気がつく。一つは、日本語の研究では一般的だと思わ

れる二つの方法のどちらも ASCII記号では表すことができず、日本語のアクセント用の記号をすぐにも開発

しなければならないこと。もう一つは、日本語ではアクセントの頂点にあたる部分が複数現れ、しかもその中

で、どれが最も高いかのかは決められないので、前述の強勢を示すスラッシュ記号 ( / )は使いにくいという

問題である。最初の問題に関しては現在検討中である。ここで暫定的な提案の一つとして、「高」に H、「低」

に L、を対応させて括弧付きで表記するという方法が考えられる。例えば、「橋だ」は、

*CHI: hashi(LH) da(L) .

2本章では日本語の共通語とみなされている、いわゆる東京方言の特徴を中心に述べる。将来、その他の方言の表記をしていくにあたって、それ用の記号を開発しなければならないが、現段階では課題の一つにしておく。

80

Page 105: JChatman

9.2. 日本語のアクセントの特徴と表記の試み

と表記することができるかもしれない。

二番目の問題については次の点を考慮に入れなければならないように思われる。まず、日本語に強勢記号は

必要ではないのかというと、その決断は難しい。というのは意味弁別のために社会慣習的に定着した静的な意

味でのアクセントの表記には必要ないかもしれないが、JCHATが興味を持っているいわば生きた発話データ

の記録ということを考えると、個人の感情や心理的な態度に由来する本来ならイントネーションと呼ばれるべ

き音韻現象がモーラ単位で生じることも十分考えられるからである。例えば次の発話の記述には、シングル・

スラッシュあるいはトリプル・スラッシュが必要になるかもしれない。便宜上、ある種の強勢が置かれると思

われるモーラを大きな文字で書いてみた。

(1)「オバーサンジャナクテオバサンデショ」

もし、この発話を表記するとなると、通常の「高」「低」だけでは不十分で対照強勢の記号が必要になるよ

うに思われる。

(2) *MOT: obaasan janakute o///basan desho .

いずれにせよ、英語版の記号と日本語用の記号の候補との対応は今後の課題の一つであると言える。

9.2.1 モーラ・音節、語の長音化 (日本語)

次に日本語では語を対照的に強調するために、母音や子音の持続が用いられることがある点に注目してみた

い。例えば、「ボクチャン ダーレ」や「ピッッタリ!」では母音や子音を延ばすことで心理的、感情的な効果

が得られる。記号は英語版と同じコロンを用い、長音化される部分の直後に挿入される。

: モーラ・音節の長音化

*UNK: bokuchan da:re ?

*CHI: pit:tari !

この他に、語が引き延ばされる記号 -: もある。 : は語内でのみ使われるが、-: は語の後にスペースをおいて

から記入される。例えば「ボクチャンダーレ?」あるいは「ボクチャンダレー?」は次のように記述される:

-: 語全体の持続

*UNK: bokuchan dare -: .

音節ではなく、語あるいは語の連続の強調を示す場合は、[!]または [!!]が使われるが、詳細については 10章

を参照のこと。

9.2.2 モーラ・音節間の間断 (日本語)

モーラ・音節間に間断が観察された場合には英語版と同じくその部分にダブル・コロンを用いる。例えば、

子どもが「チョコ、レート」のように発話した場合は次のように記述される。

:: モーラ・音節間の間断

*CHI: choko::reeto .

この記号は長音化の記号と混同されやすいので注意されたい。

参考文献

1. 小川芳男. (1982). 日本教育事典. 東京:大修館書店.

81

Page 106: JChatman

第 9章 語内の韻律

2.城生佰太郎. (1988). 音声学. 東京: アポロン音楽工業.

3.高木捨三郎 (編). (1980). 英語学・英語教育辞典. 東京:南雲堂.

4.松浪有他 (編). (1983). 大修館英語辞典. 東京:大修館書店.

5.渡辺和幸 (1994). 英語イントネーション論. 東京:研究社.

後書き

この原稿の作成にあたって、大野清幸さん (愛知淑徳短期大学)に貴重なコメントをいただきまし

た。記して感謝いたします。

82

Page 107: JChatman

第10章 スコープ記号

宮田Susanne・中 則夫

10.1 はじめに

これまで出てきた記号は、発話文中のある一点、たとえば、発話文中の特定の語や特定の音節を指示するた

めに用いられてきた。本章では、それに加えて、発話文中の一点よりも広がりをもった部分を指示する機能を

もつスコープ記号、そして発話全体を指示する機能を持つポストコードを説明する。スコープ記号は発話内に

挿入され、ひとつの語、あるいは、発話文中の複数の語に適用させることができる。それに対して、ポストコー

ドは発話の終端記号の後に挿入され、その発話全体に適用される。

スコープ記号は、角かっこ [ ] を用いた、メイン・ライン用の記号である。角かっこで囲まれたスコープ記

号本体は、そのままでは直前の一語にしか適用しないため、複数の語にまたがるテキストに適用させたい場合

には、その部分をかぎかっこ < >で囲む。したがって、単一の語に適用させるときは、かぎかっこを省略でき

る。角かっこは、発話の終わりを示す終端記号 (.、?、!) の後で使用することはできない。

1. 非言語的データ (paralinguistic material) [=! text]

非言語的現象には、咳、笑い、泣き声などがある。これらを記述するためには、まずその部分

の直後に半角スペースを置いて、角かっこ、そして =! をタイプした後、半角スペースを置いて

から、その現象の説明を行う。テキストの書き方自体は自由で、日本語でも英語でもよい。テ

キストの最後は、必ず角かっこを閉じる。

*CHI: kore dame [=! screaming] .

この場合、子どもは、「コレ」を普通のしゃべり方で言い、「ダメ」の部分だけキーキー泣きな

がら行ったことを表わしている。「コレダメ」全体を泣きながら発話した場合は、次のように記

述する。

*CHI: <kore dame> [=! nakinagara] .

また、単なる泣き声だけで、発話がない場合は、発話のないことを示す 0(ゼロ)記号とともに用

いる。

*CHI: 0 [=! naku] .

この場合、0記号を省略してもよい。しかし、最後のピリオドは、やはり必要である。

*CHI: [=! naku] .

笑い、咳などの非言語的現象を %par 行に記述することもできる (第 11章参照)。歌う、読む、

ささやく、叫ぶというような現象も非言語的現象として扱うことができる。

2. 強勢 (stressing) [!]

この記号は、強勢が置かれた語の後で用いる。いくつかの語に強勢が置かれた場合は、それら

をすべてかぎかっこで囲めばよい。強勢については、第 9章も併せて参照のこと。

83

Page 108: JChatman

第 10章 スコープ記号

3.対照強勢 (contrastive stressing) [!!]

通常の強勢と使い方は同じである。対照強勢の場合に使用する。

*CHI: kiiro janakute aka [!!] da yo .

4.引用 (quotation mark) ["]

この記号は、ある語や語句をメタ言語的に使用した場合に用いる。

*MOT: <otete no oniisan> ["] tte doo yu koto?

他人の発話を直接話法的に引用したいときは、 +"/.と +" の記号を使用する (第 8、9章参照)。

5.説明 (explanation) [= text]

この記号は、メイン・ライン上で簡単な説明を行うときに用いる。特に、人物や事物などの指

示対象を特定するときに便利である。

*CHI: kore [= sweets] tabecha dame !

発話全体の説明も、この記号を用いて記述することが可能である。

*CHI: <Mama ageta> [= Mama ga kureta] .

説明の書き方については、%exp(説明)や

verb|ティアも参照 (第 11章)。

6.置き換え (replacement) [: text]

この記号は、主にふたつの場合に使用する。ひとつは、縮約形や方言のように通常の語形から

逸脱しているため、それを標準的な語形に変えたい時である。CLAN は、通常 (特に指定しな

い限り)角かっこ内のものを分析し、かっこの前の置き換えられる語を無視する。たとえば以下

の例では、「そいじゃ」は、デフォールトで分析されない。

*MOT: soija [: sore de wa] chotto +...

もうひとつの使い方は、メイン・ライン上での形態素分析を行う場合である (第 7章参照)。実

際に発話されたものはかっこ外、形態素に分析されたものはかっこ内に書く。コロンの後には、

必ずスペースを入れること。置き換え記号は、置き換える要素の直後に置く。

*MOT: zenzen sukunakunakatta [: sukunai-nai-ta] mon !

なお、ここでの形態素分析は森川式を使用しているが、他の方式でも同様である。

7.省略 (omission) [0 text]

この記号は、部分的に省略された語を明示したいときに使う。既に、0word、0*word、00word

の使い方を説明したが、その記号を使用すると、メイン・ラインが読みづらく感じる人もいる。

そのような場合は、[0 text]、[0* text]、[00 text](省略された語の前には、スペースが入

る)を代わりに使用することができる。記号の意味は、すでに説明した形式と同じである (第 4

章参照)。

8.翻訳 (translation) [:=x text]

この記号は、発話内で外国語が使用されたとき、それに対する日本語や英語の翻訳をつけたい場

合に使用する。 特にバイリンガルのデータに便利である。xは、どの言語が使用されているか

示す一文字の略語である。この記号は必要に応じて適宜変更できるが、特定の文字を使用した

場合には、それがどの言語のことを表わしているのか、00readme.doc で説明する必要がある。

以下の例では、eは英語を表わしている。

*SEB: kore forbidden@s [:=e kinshi] da yo .

84

Page 109: JChatman

10.1. はじめに

9. 他の転写可能性 (alternative transcription) [=? text]

この記号は、発話が不明瞭でその内容が一意に決定できないため、他の転写内容が考えられる

場合に使用する。

*CHI: kore kawaii [=? kowai] .

10. メイン・ラインでのディペンデントティア表示 (dependent tier on main line) [%xxx: text]

ディペンデントティアをメイン・ラインに挿入したい場合に使用する。第 11章で説明してある

ディペンデントティアは、すべてこの方法でも使用できる。特に、この方法は、文全体ではな

く発話の一部分だけを指示したいときに便利である。

*CHI: boku sansai [%act: lifting 3 fingers] ni nattara noreru yo .

11. メイン・ラインでのコメント表示 (comment on main line) [% text]

コメントをメイン・ラインに挿入したい場合に使用する。

*CHI: <otete no oniisan> [% hand play song] yatte .

%を省略することも可能である。

*CHI: <otete no oniisan> [hand play song] yatte .

[% text]と [text]は [%com: text]の省略であり、CLAN には同じように扱われる。しか

し、メイン・ライン上に発話以外の記号が増えると、ファイルが読みづらくなるので、必要な

ときに限って使うとよい。

12. メイン・ラインでのコード表示 (code on main line) [$text]

メイン・ラインにコードを記入したい場合に使用する。この方法は、あまり勧められないが、必

要ならば使用してもよい。通常は、

verb|

*CHI: kore wa [$WAP] ?

13. 推定 (best guess) [?]

この記号は、聞きづらい録音の場合など、発話内容を完全に聞き取ることができず、発話内容

に自信がもてないとき、疑問が残るときなどに使用する。しかし、聞こえないことまで推量し

て転写してしまうと、トランスクリプトの信頼性が落ちてしまうので、実際に聞こえたことだ

けを転写することが大切である。

*CHI: <ringo+suupu> [?] yaroo ?

14. 次行に同時発話 (overlap follows) [>]

ある発話が、他の話者の発話と重なっている場合に、その同時発話部分が次の行にあることを

示すときに用いる。次項の [<] 記号と併用される。

15. 前行に同時発話 (overlap precedes) [<]

ある発話が、他の話者の発話と重なっている場合に、その同時発話部分が前の行にあることを

示すときに用いる。前項の [>]記号と併用される。次の例では、子どもと母親の発話が、一部

同時に発話されていることを示している。

*MOT: kore <abunai kara> [>] .

*CHI: <noboru no> [<] !

85

Page 110: JChatman

第 10章 スコープ記号

16.前後の行に同時発話 (overlap follows and precedes) [<>]

ある発話が、その前の行と後ろの行の発話と同時に重なって発話されている時に使用する。 [<]

と [>]記号と併せて使われる。

*MOT: moo <sore nainai> [>] .

*INV: karapo [<>] .

*MOT: moo [<] # okatazuke shinakucha .

17.繰り返し (retracing without correction) [/]

この記号は、同じ語や語句を繰り返し発話した場合に使用する。かぎかっこ内の要素は、この

記号の後の要素とまったく同じでなければならない。

*CHI: <kore noboru> [/] kore noboru yo !

ポーズや中継ぎ要素がある場合には、繰り返しの記号を先に書いた後で、それらの記号を書く

ようにする。つまり、繰り返しの記号は、最初にくる発話要素の直後に挿入する。

*CHI: kore [/] # kore noboru [/] # eeto noboru yo !

同じ語が、間に別の要素が入らずに繰り返し出現する時は、かぎかっこでひとまとめにするこ

とができる。

*MOT: <soo soo soo soo> [/] soo !

この場合には、基本的に CLAN は繰り返しの要素をそれぞれカウントするが、MLU, MLT,

MODREP の3つのコマンドでは無視される。つまり、発話は繰り返しをもたないひとつの語、

あるいは語句として扱われる。これらのデフォールト設定を変更する方法については、23章に

あるそれぞれの CLAN コマンドの節を参照1。

18.部分的な言い直し (retracing with correction) [//]

この記号は、話者が何か言いかけて中断、その後、前に言ったことと大筋で同じにもかかわら

ず、微妙に言い方が異なる場合に用いる。繰り返しの場合と異なり、この記号の前の要素は、後

の要素と完全に同じであってはならない。つまり、一部が言い直されていなければならない。

*CHI: <kore noboru> [//] kotchi noboru yo !

場合によっては、言い直しと繰り返しが複合的に使用されるときもある。

*CHI: <kore noboru> [//] kotchi [/] kotchi noboru yo !

言語障害者のデータの場合、言い直しの部分はかなり多く、しかも複雑になり、この表記の効

用は無視できなくなるので注意しよう。

19.完全な言い直し (false start without retracing) [/-]

この記号は、話者が何か言いかけて中断、その後、全く違うものに言い直した場合に用いる。

*CHI: <kore noboru> [/-] kotchi dame yo !

20.不明瞭なタイプの繰り返し (unclear retracing type) [/?]

この記号は、SALT形式のファイルを CHATに変更する際に使われることがある記号で、日本

語の場合にはほとんど使用する場面はないだろう。詳しくは、英語マニュアルを参照。

1本書では割愛した。

86

Page 111: JChatman

10.2. ポスト・コード

21. 誤用 (error marking) [*]

ほとんどのエラーコーディングは、13章に示されている方法で %err 行で行われる。これらの

エラーコードを使用する場合は、対応する誤用要素をメイン・ラインに誤用の記号をつけなけ

ればならない。通常は、verb|[*]|を誤用の直後に挿入する。繰り返しや言い直しと同時に使

用する場合には、最初の要素が誤用の時には [/]の直前、二番目の要素が誤用の時は、もちろ

ん [/]の後になる。次の例を参照。

*UNK: nooka no <muko [*] o> [//] yome o sagasu .

%err: muko = yome $LEX $SUB ;

*UNK: nooka no <yome o> [//] muko [*] o sagasu .

%err: muko = yome $LEX $SUB ;

なお、%err行を使う場合には、メイン・ラインに必ず [*]がなければならないが、その逆は成

り立たなくてもよい。つまり、メイン・ライン上で [*]を使用しても、%err行を設ける必要は

ない。したがって、簡単なエラーコーディングは、メイン・ライン上の [*]記号だけでも十分

行えるといえる。

10.2 ポスト・コード

以上のスコープ記号は、発話内に挿入されるが、次に挙げるポストコードは、発話の終わりを示す終端記号

の後に挿入する。ポストコードは、角かっこの中で +で始まる、発話全体に適用するコードである。

1.ポストコード (postcodes) [+ text]

見ての通り、ポストコードは発話内のコメントとほとんど同じ形式である。プラス記号の次を

半角スペースで空けさえすれば、どのようなポストコードを設定してもかまわない。

*CHI: dekinakatta ? [+ neg] [+ past]

しかし、通常は読みやすさを維持するため、コードを %cod行に記入するほうがよい。

2. 分析から除く発話 (excluded utterance) [+ bch]

このコードは、本来の会話内容とは無関係の発話を表わすとき使用する。たとえば、セッショ

ン中に電話が入ったとき、それを「裏の発話」(back channel)として分析から除きたい場合に

使う。これらポストコードを使う最大のメリットは、MLU, MLT, KWAL などのコマンドを使

用する際に、特定のポストコードを含む行だけを拾い出して、個別に計算処理できる点である。

*MOT: kondo dore ni suru ?

*MOT: dete mo ii ? [+ bch]

%add: INV

%sit: denwa no oto

上の例では、[+ bch]の入れてある行を観察者へ向けての発話として排除したい場合、-s"[+ bch]"

というオプションを指定することによって、2行目の発話が計算から除外され、1 行目について

だけ計算が行われるようになる。より詳しくは、第 23章の各コマンドの説明を参照2。

3. 分析に含まれる発話 (included utterance) [+ trn]

ポストコードを使用することによって、本来分析から除かれてしまうものを無理やり分析対象

として含めることもできる。例えば、0 発話は MLU によって発話として扱われず除外される

2本書では割愛した。

87

Page 112: JChatman

第 10章 スコープ記号

が、身振りそのものがターンに該当すると思われる場合、それをひとつのターンとして扱わせ

ることが可能である。

*MOT: uma doko ?

*CHI: 0 . [+ trn]

%act: points at horse picture

MLT 計算を行なう際、+s+"[+ trn]" というオプションを指定することによって、このポスト

コードがつけられた行は、すべてMLT 計算に含まれるようになる。

後書き

1.例は全てヘボン式で書かれている。

2.この原稿の制作にあたって、小川雅魚さん (椙山短期大学)に貴重なコメントをいただきました。ここに記

して、感謝致します。

88

Page 113: JChatman

第11章 ディペンデントティア

宮田Susanne・中 則夫

11.1 はじめに

本章では、発話に付随した情報を含む、ディペンデントティア (dependent tiers) の使い方を説明する。ま

ずよく使われるディペンデントティアを紹介し、次に、独自のディペンデントティアの作り方を説明する。最

後に、発話とディペンデントティアの時間的関係を表わす記号についても述べる。

メイン・ラインとヘッダーのほかに、CHAT の三番目の要素としてディペンデントティアがある。ディペン

デントティアは、発話に付随した情報 (行動、コメント、分析コードなど)を付加するためのオプションであり、

付随するメイン・ラインの次の行に入れる。また、いくつかの異なった種類のディペンデントティアを続けて

入れることもできる。ディペンデントティアは、すべてオプショナルな要素で、使用する義務はない。データ

入力の際に、必要に応じて使用すればよい。メイン・ラインとは独立した行をわざわざ設けるのは、メイン・

ラインに発話以外の要素が入るのを極力防ぎ、読みやすさを損なわないようにするためである。これにより、

かなり大がかりなコード化を行っても、メイン・ラインは十分実用に耐える読みやすさを保つことができるよ

うになる。ディペンデントティアは、パーセント (%) で始まり、3文字のティアコードを小文字で入力、そし

てコロン、タブを入れる。メイン・ラインとは異なり、最後にピリオドなどの発話の終わりを示す終端記号を

つける必要はない (ただし、%morと%synは例外)。ディペンデントティアのテキストは、英語でも日本語でも

どちらでもよい。

*CHI: dame !

%tim: 00:03:09

%act: hon o Ree kara toriagete

具体的に読み進めると分かる通り、ディペンデントティアにはその役割が似通っていたり、一部重複するも

のが結構多い。どのティアを使うかはデータを入力する人の自由であるので、一般的なガイドラインを満たし

た上で、各自使いやすいものを使用するとよいだろう。

11.2 標準的なディペンデントティア

よく使われるディペンデントティアは、CHAT において最初から定義してあり、しかも dep�le.cut に既に

登録済みなので、すぐに使用することができる。通常では、これらのティアを使用することで十分用が足りる

はずである。以下、アルファベット順に説明を行う。

1. %act: 話し手の行動 (action)

原則として、話し手の発話に付随した行動を記述する。行動は、うなずき・指差し・手振りな

ども含むが、それらに %gpxティアを使用することも考えられる。

*CHI: dame !

%act: pushing mother away

89

Page 114: JChatman

第 11章 ディペンデントティア

発話せず、行動だけの場合は、0記号 (発話なし)と一緒に使うこともできる。

*CHI: 0 .

%act: pushing MOT away

また、第 4章で説明したように、メイン・ライン上に書くことも可能である。ただし、メイン・

ライン上に書くと、読みやすさが損われるので、なるべく避けたほうがよい。

*CHI: 0 [%act: pushing mother away] .

話し手以外の登場者の行動を記述する場合は、0記号と同時発話記号 [>],[<]の組み合わせで

記述するか、コメント用ティア %com を使用するとよい。

*MOT: <nani okotteru no> [>] ?

*CHI: 0 [<] .

%act: hitting MOT

2. %add: 話しかける相手 (addressee)

だれに話しかけたのかを記述する。人物を指示するためには、@Participantsヘッダーで定義

した、3文字の ID コードを使用する。

*MOT: okotteru ne .

%add: INV

*CHI: dame !

%add: MOT, INV

この例では、母親が研究者に「怒ってるね」と言ってから、子どもが、母親と研究者に対して

「だめ」と話しかけている。

3. %alt: 他の転写可能性 (alternative transcription)

メイン・ラインとは別の転写の可能性が考えられる場合に、その代案を記述する。一語だけに

ついて代案を書く場合には、[=? text] (10章参照)のほうが便利である。

*CHI: kore ii yo .

%alt: kore iya

4. %cod: 多目的コード (code)

多目的コード用のティアである。コードの種類は特定のものに限らなくてもよく、いろいろな

種類のものを区別せず混ぜて入れて、スペースを節約する目的で使用するとよい。各自の研究

目的に合わせたさまざまなコードをここに記入する。

*CHI: dame desu .

%cod: $KGO

この例では、子どもが「です」という敬語を使ったことが $KGOでコード化されている。

5. %com: コメント (comment)

多目的のコメント用ティアである。観察者の解説やコメントなど、気がついたらなんでもここに

記入するとよい。表記には、なるべくコードを使わないほうがよい。もし使う場合には、コー

ドをダブルクォートで囲むこと。

*CHI: kore nani ?

%com: wh pronoun appearing for the first time

90

Page 115: JChatman

11.2. 標準的なディペンデントティア

6. %eng: 英語訳 (English translation)

メイン・ラインの英語訳を記述する。語ごとに対訳をつけるのではなく、文全体に対応した自然

な翻訳を使用する。発話の終わりを示す終端記号は、必要としない。

*CHI: tabechatta .

%eng: (I) have eaten up (all)

7. %err: スピーチエラー (error)

基本的に、スピーチエラーをコード化するティアである。自由に使い方を決めることはできな

いので、13章で解説された方法にしたがって使用すること。このティアを使用する場合は、必

ずメイン・ラインにスピーチエラーの記号 [*]を付けなければならない。

8. %exp: 説明 (explanation)

説明を行うためのティアである。事物や人物などを指示するときに、その特定の手助けとなる

情報や場面情報を記述する。簡単なものは、メイン・ラインで [= text]を用いてもよい ( 13

章参照)。

*CHI: kore kowai .

%exp: saurusu no ehon

9. %fac: 表情 (facial action)

顔の表情をコード化するティアである。顔の表情のコード化の方法に関しては、Ekman &

Friesen(1978)を参照。

10. %flo: 記号を取り去った発話 ( owing)

このティアは、CLAN コマンドのひとつである FLO によって自動的に作られる。メイン・ラ

インから CHAT 記号を取り去った、発話部分のコピーである。ブラケットを多用するなど、メ

イン・ラインが読みにくくなればなるほど、このティアの効果は大きくなる。しかし、その半

面データ表記の正確さは犠牲にされるので注意すること。

*UNK: nooka no <muko [*] o> [//] yome o sagasu .

%flo: nooka no muko o yome o sagasu.

11. %gls: グロス (gloss)

分かりにくいこどもの発話を、おとなの発話に言い換えたものを記述する。特に、表現が未熟

であるため曖昧なところをはっきり説明したいときに使用する。使用言語は英語を用いる必要

はなく、各言語で分かりやすく記述したほうが適切である。

*CHI: abukunai kyuukyuusha.

%gls: kyuukyuusha de iku to abunakunai

12. %gpx: 身振りなどの情報 (gestural and proxemic material)

指差し、身振りやしぐさ、近接空間などの情報を記述する。一般的な行動は、%actを用いれば

十分であるが、指差しやうなずき、手を伸ばすなどの行動を特に区別して記述したい場合に用

いる。

*CHI: buubu .

%gpx: kuruma no e o yubisasu

91

Page 116: JChatman

第 11章 ディペンデントティア

13. %int: イントネーション (intonation)

イントネーションを、普通のことばを用いて記述したい場合に使用する。

*CHI: kore dame !

%int: saigo no onsetsu o kyokutan ni ageru

14. %jpn: 仮名漢字 (JaPaNese)

仮名漢字混じりのファイルをローマ字に変換するツール jchatizerによって自動的に出力される。

15. %lan: 使用言語 (language)

発話に使用された言語の性質について記述する。例としては、発話で使用されている言語、直

前で発話した人の言語、話し手と聞き手のよく使用する言語の性質などについてコード化した

りする。場合によっては、第一言語と会話内で使用している言語が異なったりするので、その

関係についての記述も行う。たとえば、$DGDGは、あるオランダ人が、ドイツ語で話す別のオ

ランダ人に対して返答しているときに用いるといった具合である。特にバイリンガルのデータ

の場合には便利である (6.5.5 参照)。

16. %mod: モデル (model)

%pho行と一緒に使用される。獲得中のおとなの音韻形式あるいは、各学習者の音韻形式のモデ

ルを記述する。

17. %mor: 形態素分析 (morphemic semantics)

CLAN のコマンドのひとつである MORによって自動的に生成される。英語版マニュアルの第

14章で解説されているシステムにしたがってコード化されるようになっている。日本語マニュ

アルについては、「日本語のための CHILDES」パート II第 23章1、および JMORに付属のマ

ニュアルを参照。

18. %par: 非言語的発声現象 (paralinguistic behaviors)

非言語的発声現象、つまり、咳、泣き声などの動作を記述する。読む、歌う、というような現象

もこのティアに記述できる。

*CHI: okatazuke+okatazuke !

%par: utau

19. %pho: 音韻的現象 (phonological phenomena)

音韻的現象をコード化するときに用いる。発話全体を音韻表記する場合や、スピーチエラーで

はないが非標準的な音韻を記述したい場合 (通常の形態素では表記できない場合)などがこれに

あたる。したがって、特定の音韻的な間違いだけを記述するときは、%err行を使用したほうが

適切である。表記としては、IPA の一部を ASCII で表示できる UNIBET (12章参照)を使用

するか、より厳密な表記を望む場合には、PHONASCII を用いる (英語版マニュアルの第 11章

参照)。次に挙げるのは、UNIBET を用いた例である。

*CHI: kore wa okashii .

%pho: koje a okaSi:

20. %sit: 場面情報 (situational information)

局所的な場面情報を記述する。たとえば、メイン・ラインに記述された発話の場面に関する情

報などが、これにあたる。ファイル全体にわたる場面情報や、ファイルの大部分に関係する情

報は、@Situation:ヘッダーに記述したほうが適切である (第 4章参照)。

1本書では割愛した。

92

Page 117: JChatman

11.3. 独自のディペンデントティアを作る

*CHI: gohan ?

%sit: suihanki no buzaa ga natteiru

21. %spa: スピーチアクトコード (speech act coding)

スピーチアクトコードを記述する。スピーチアクトとは、談話における発話の機能のことであ

る。スピーチアクトを記述するシステムは数多いが、英語版マニュアルの第 13章では、そのう

ちのひとつを解説してある。

22. %syn: 統語構造 (syntactic structure)

統語構造をコード化するために用いる。コード化の方法は、英語版マニュアルの第 14章で解説

されているものを使用する。

23. %tim: タイムコード (time stamp coding)

タイムコードを記述するティアである。テープに記録する際に、タイムコードが分かる場合に

は、それを記録すると便利である。タイムコードは、ファイル内の最初の発話がなされた時か

らの相対時間で記録する。最初の発話がなされた時点が 00:00:00 に設定される。録音開始時

の実際の時刻は、@Time Startヘッダーに記録する。スタートからの経過時間は、時分秒を単

位として記録する。時間の桁が不要な時 (発話が一時間に満たないときなど)は、分と秒だけに

省略しても差し支えない。

*MOT: ja, asoboo .

%tim: 00:00:00

[...]

*CHI: gohan mada ?

%tim: 00:06:35

会話が中断した時は、新しい始点をセットするほうがよい。その場合は、途中であっても改め

て @Time Startヘッダーを入れ、タイムコードもリセットすればよい。時間に関するヘッダに

ついて、第 4 章も合わせて参照のこと。

11.3 独自のディペンデントティアを作る

以上のような既成のティアでは限界があると感じた場合は、必要に応じて新しいディペンデントティアを自

由に作ることができる。たとえば、動物が登場する場合では、その泣き声を記述するために %aniのようなティ

アを作ることが考えられる。新しいティアのコードとマーキングは、ASCII 文字を使用し、コードにはダラー

マーク ($)をつけること。そして、00readme.docファイルでティアの新設を宣言し、00depadd.cutに考案し

た記号類をすべて登録して、CHECK にひっかからないようにする必要がある。00depadd.cut の記入方法に

ついては、第 21章の 21.2節を参照。

11.4 同時関係

以下の記号は、メイン・ラインとディペンデントティアの時間的関係を明確にさせるために使われている。

ディペンデントティアで記述した出来事が、メイン・ラインの前、後、途中のどの時点で起きているかが重要

になることがあるからである。ティアが追加されていない場合は、ディペンデントティアの情報はメイン・ラ

インと時間的に一致していると判断する。同時関係の記号は、通常ディペンデントティアの最初に記入する。

1. <bef> メイン・ラインの発話の直前に起こったことを表わす。

93

Page 118: JChatman

第 11章 ディペンデントティア

*CHI: ochita !

%sit: <bef> booru ga ochiru

2. <aft> メイン・ラインの発話の直後に起こったことを表わす。

*CHI: otosu yo !

%act: <aft> booru o otosu

同じ情報を、コメントとして %com行に記入することもできる。

*CHI: ochita !

%com: booru ga ochita

3. <$=n>

ディペンデントティアの内容が、付随するメイン・ラインに加えて、次の n個のメイン・ライ

ンにも当てはまる場合に使用する。以下の例では、子どもが三つの発話をしているときに辺り

を見まわしていると解釈できる。

*CHI: doko na no ?

%act: <$=2> looking around

*CHI: doko itta ?

*CHI: hon doko ?

11.5 コードスイッチングとボイススイッチング

英語版マニュアルの 9.1節を参照のこと。

参考文献

1. Ekman,P., & Friesen, W. (1969). The repertoire of nonverbal behavior: Categories, origins, usage, and

coding. Semiotica, 1, 47-98.

2. MacWhinney, Brian (1994). The CHILDES Project: Tools for analyzing talk,CD-ROM version.

3. MacWhinney, Brian (1995). The CHILDES Project: Tools for analyzing talk. Hillsdale NJ: Lawrence

Earlbaum Assoc.

後書き

1.例は全てヘボン式で書かれている。

2.この原稿の制作にあたって、小川雅魚さん (椙山短期大学)に貴重なコメントをいただきました。ここに記

して、感謝致します。

94

Page 119: JChatman

11.5. コードスイッチングとボイススイッチング

95

Page 120: JChatman

第 11章 ディペンデントティア

96

Page 121: JChatman

第12章 日本語のためのUNIBET

寺尾 康

12.1 UNIBETとは

CHILDESに収められているデータは言語の持つ様々な側面から検討が加えられるようコーディングに工夫

がこらされている。文字化されたデータ上では表しにくい音韻的側面とて例外ではなく、観察された発話を簡

単にかつ正確に記述するための記号が開発されつつある。本章で紹介する UNIBETもその一つで、特に音韻

的分析が重要な幼児音の研究、言い誤り (幼児の誤りだけでなく成人の誤りも含む)の研究、および第二言語習

得研究において貢献が期待されている。

UNIBETとは IPA(客観的音声表記のための国際音声字母)を ASCIIコードだけを用いて表すことをめざし

た記号群である。例えば、次のような幼児の発話が記録されたとしよう。

「おこーき」 (幼児は「飛行機」のことを言おうとしている)

しかも、この「お」は大人の基準の「お」とも異なって、英語でいうシュワに近い音だったとしよう。この場

合、ローマ字表記しかなければ、次のような記述が精一杯だろう。

*CHI: okooki [?] .

これでは、日本語のいわゆる共通語の「お」になってしまい、幼児が発した微妙な音に関する情報が伝えられ

ない。しかし、ここで IPAの字母が記号化できていればそれを用いて上記の例を次のように記すことができる

(注 12.1)。

*CHI: okooki .

%pho: 6ko:ki .

%phoラインで示されているのが UNIBETで、こうしておけば、記述が正確になると同時に日本語を母語とし

ない研究者にもどんな音であったのかが理解しやすくなるという利点もある。さらに、次のように記述してお

けば、飛行機のことを言いたかったのだという幼児の意図も伝えられる。

*CHI: okooki[: hikooki] .

%pho: 6ko:ki .

ここで、収集の段階からの注意をつけ加えておくならば、UNIBET表記を行って音韻的分析に利用しようとす

るならば、もとのデータは少なくともオーディオ・テープに録音してあることが必要であろう。いわゆる手書

きの転写をおこなった資料を UNIBET表記するのはデータの信頼性という観点から問題が生ずるおそれがあ

るので、後から確認ができるようにするためである。

次に UNIBETの記号としての性格について述べておきたい。まず、ファイル内のラインでは、%phoライン、

または%errライン (言い誤りの場合)に登場する。メイン・ライン内に用いることもでき、その場合は@u記号

を添える。また UNIBETは、簡潔さと使いやすさを考えて、原則として一つの IPA 字母に一つの ASCII記号

があてられており、入力の際にも語単位の分かち書きでメイン・ラインと対応させる。さらに言語学的な観点

からいうと、基本的には音素的な表示である。これらは簡潔さを求めているからで、詳細な音声的な記述を行

うためには PHONASCIIと呼ばれるさらに精密な記号体系を用いなければならない (注 12.2)。

97

Page 122: JChatman

第 12章 日本語のための UNIBET

どんな言語を記述する場合でも共通の UNIBETリストを用いることが理想ではあるが、音素的表記とする

以上、各言語ごとにリストが作成されている。もちろんリストごとに恣意的に記号が選ばれているわけではな

く、同じ (きわめて近いというのが正確か)音素には同じ記号が用いられているがそれぞれのリストが微妙に異

なるのはやむを得ないところであろう。

以下は暫定的な形ではあるが日本語の UNIBETの候補である。メイン・ラインと対応させていってほしい。

なお、表中で用いられるローマ字表記はヘボン式、訓令式を並記する形をとった。

12.2 日本語のUNIBET表 (第1版)

資料 12.1は母音に関するUNIBET表、資料 12.2は子音に関するUNIBET表である。資料 12.1と資料 12.2

の表記をローマ字表記のように組み合わせてゆけば UNIBETによる表記が可能になる。実際の幼児の発話を

例にとってみよう (注 12.3)。

*ARI: keshijomu[: keshigomu] da .

%pho: keSiZomu .

*ARI: gakko [: gakkoo] ni itte .

%pho: gak:o .

今回の表では重要な音韻的側面であるアクセント、イントネーションといった超分節音的要素の表記方法の

日本語版についてはふれることができなかった。その候補の一部は第 9章でふれられているが、まだ決定版に

はいたっていないので、機会を改めて提案を行いたい。

文献

1.城生佰太郎 (1988) 音声学. アポロン音楽工業.

2. MacWhinney, B. (Ed.) (1991) . The CHILDES Project: Tools for analyzing talk. LEA.

表 12.1: 母音 (vowels)

UNIBET IPA

表記

ローマ

字表記

実例 仮名表記 UNIBET

i i i ike いけ ike

i: i: ii iie いいえ i:e(注 12.4)

e e e eki えき eki

e: e: ee eesu エース e:su

u W u uma うま uma

u: W: uu uuru ウール u:dtu

o o o obake おばけ obake

o: o: oo ookami おおかみ o:kami

a a a atama あたま atama

a: a: aa obaasan おばあさん oba:saN

6 @ 6ko:ki@u おこうき 6ko:ki

ai(注 12.5) ai ai kaita かいた kaita

98

Page 123: JChatman

12.2. 日本語の UNIBET表 (第 1版)

表 12.2: 子音 (consonants)UNIBET

UNIBET IPA

表記

ローマ

字表記

実例 仮名表記 UNIBET

p p p papa パパ papa

b b b banana バナナ banana

m m m mame まめ mame

t t t taki たき taki

d d d daiku だいく daiku

n n n nami なみ nami

k k k kagami かがみ kagami

g g g gakkoo がっこう gak:o: (注 12.6)

N N n san さん saN

F F f fune,hune ふね Fune

s s s sakana さかな sakana

z z z zasshi,zassi ざっし zaS:i

S C sh shinsetsu,sinsetu しんせつ SiNsetsu

Z dý j jugyoo じゅぎょう zugjo:

ts ts ts kutsu,kutu くつ kutsu

tS µC ch kuchi,kuti くち kutSi

h h h hana はな hana

x �c h hiza ひざ xiza

w î w watashi,watasi わたし wataSi

dt R r remon レモン dtemoN

j j y yama やま jama

: pp happa はっぱ hap:a

kk gakki がっき gak:i

ss kossetsu,kossetu こっせつ kos:etsu

tt motto もっと mot:o

ssh ossharu,ossyaru おっしゃる oS:adtu

tch ketchaku,kettyaku けっちゃく ket:Saku

mm mamma まんま mam:a

kj kj ky kyaku きゃく kjaku

gj gj gy gyakuten ぎゃくてん gjakuteN

nj ñ ny konnyaku こんにゃく koNnjaku

pj pj py happyaku はっぴゃく hap:jaku

bj bj by byooki びょうき bjo:ki

mj mj my myaku みゃく mjaku

dtj Rj ry ryakugo りゃくご dtjakugo

? P ? ?waa っわー (注 12.7)(那覇方言: 豚) ?wa:

T T Q deTu@u です deTu

D D D Dodtaemon@u どらえもん DodtaemoN

99

Page 124: JChatman

第 12章 日本語のための UNIBET

[12.1] JCHATでは同じ発話の UNIBET表記を次のように記述することもできる。

*CHI: &6ko:ki .

(&は音韻的要素の意。ただし、この記号を用いると、6ko:kiの部分はMLUや FREQプログ

ラムでは分析の対象から除外されるので注意。)

*CHI: 6ko:ki@u .

(@u は UNIBET表記の意)

*CHI: yy .

%pho: 6ko:ki .

(yyは不明の語の意。つまり、「何の語かは不明だがこう聞こえた」ということを示している)

[12.2] PHONASCIIは複数のASCII記号の組み合わせも許して、音声的な記述まで可能にする記号体系であり、

IPAの補助記号の使用も可能となる。PHONASCIIについては英語版マニュアルの 11章 (MacWhinney,

1991)に詳しい説明がある。

[12.3] 実例では該当する部分だけを UNIBET表記してある。ただし、MODREPを使用する場合はコード化

したすべての語との 1対 1 対応の表記をしなければならないので注意されたい。また、この実例は愛知

淑徳短期大学の小野清幸氏の発話データ、ARI20000から氏の承諾を得て引用させていただいた。ここに

記して感謝したい。

[12.4] 長母音は [:]記号を用いて記述する。

[12.5] いわゆる二重母音の記述については、学者間の見解の相違、方言差、個人差を考慮して単母音の連続と

いう記述方法を暫定的にとることにする。この部分は今後の課題としたい。

[12.6] 促音については子音の長音化と捉え、[:] 記号で記述する。

[12.7] 声門閉鎖音は方言のレベルでは那覇方言で意味弁別のために機能していると報告されている音である

([wa:]は「広さ」の意。城生 1988)。また「こらっ」のような日常語、「ったくもう」のような個人語の

レベルでも観察されるのでリストに加えることにした。

[12.8] 日本語の音素とはいえないが、構音習得途中の幼児は [d]や [t]を発音するときに歯間音の (例えば、英

語の thの音)調音法で行うことがあるので、記述のために加えておいた。

100

Page 125: JChatman

第13章 日本語のためのエラー・コーディング

寺尾 康

13.1 はじめに

近年、言語心理学を中心に生身の人間が実際に行なった言語運用の結果を「外的」(external)なデータとして

積極的に利用しようという動きがみられる。中でも、話者あるいは言語学習者が起こす誤りは特に注目を集め

ているデータの一つである。その理由の一つは、実験的方法だけではアプローチが難しいとされる発話のメカ

ニズムに関する研究を行う際、自然発話の誤りをデータに用いることで、『Xと言おうとした話者が Yと言っ

てしまったのは背後に Zというメカニズムの誤作動があったからである』という現実的な議論の組み立てが可

能になるからだと思われる。ただし、このようなアプローチはまず大量の誤りの実例を収集しなければならな

いという難しさも抱えている。研究者単位での大量収集の動きはすでに 1970年代から本格的に始まっている

が1、統一された記述に基づいた資料の交換や公開はこれまでほとんど行われてこなかった。CHILDESプロ

ジェクトではこの点を改善すべく、下位部門の一つとして言い誤りをコード化する際の記述方法の開発を進め

ており、これまで英語の言い誤り (speech error)の記述例が提案されている。本章ではそれらを日本語の言い

誤りのデータベース化に応用し、JCHATの約束ごとを含めて、エラー・コーディングの JCHAT 版とでも呼

ぶべきものを提案してみたい。ここで、明らかにしておかなければならないのは、本章では筆者がかなりの数

の実例を収集しているという関係でたまたま健常な成人の言い誤りの記述方法をとりあげるが、それがすべて

ではないということである。その意味は一つには、記述方法はこれで最終版というわけではなく、今後改良し

てゆくべきものであること。もう一つは誤りを分析することで興味深い結果が得られそうな領域は多岐にわた

るということである。例えば、エラー・アナリシスという領域を持つ第二言語習得研究や失語症患者の逸脱し

た発話を扱う言語学的失語症学の分野がその代表であろう。言い誤りの記述から出発するこのコーディング方

法が確立すれば、こうした分野への応用も十分可能になると思われる。また、言語習得途上の子供の発話の誤

りの記述にも大いに利用できるであろう。

まず、成人の言い誤りの実例からみてゆこう。言い誤りとは1に示すような、意図から何らかの形で逸脱し

てしまった発話のことで、異なる言語学的レベル (例えば、音素 (phoneme)、形態素 (morpheme)、語等)でさ

まざまなタイプの誤りが生じることが知られている。

(1)「スクラムをぽーんと外に放り投げた」 (← スパイク)

(2)「イヌーピー」 (← イヌ+ スヌーピー)

(3)「けんたくさご」 (← 洗濯かご)

(4)「ボレーをよくありません、ジミー・コナーズ」 (←ボレーが)(下線部は誤り、(←)は話者の意図以下同様)

ごく簡単に分類すれば、 (1)は語彙代用の誤り、(2)は二語の混合、 (3)は分節音の交換の誤り、(4)は助詞の

代用の誤りということになるが、これらはもし十分な数の実例が収集されれば、(1)は心的語彙部門 (mental

lexicon) 内の語彙へのアクセスに関する研究に対して、(2)と (3)は音韻理論および文産出過程の音韻部門の研

究に対して、 (4)は項構造 (argument structure)の生成や文法的符号化 (grammatical encoding)の研究に対し1言い誤りと文産出の過程を扱った基本的な論文 Garrett(1975)のもとになった資料は MITコーパス、またこの分野のさきがけとなっ

た Fromkin(1971,1973)の資料 (Fromkin,1973の巻末に一部がまとめられている)は UCLAコーパスと呼ばれ、大規模な言い誤り資料として有名である。CHILDESに収められている英語の言い誤りコーパスの中心をなすのはミネソタ大学の J.P. Stemberger氏が収集した実例である。

101

Page 126: JChatman

第 13章 日本語のためのエラー・コーディング

てそれぞれ貢献できると予想される。事実、これまで英語に関しては大規模な実例の収集が行なわれ、成果を

あげてきている (Fromkin,1973,1981; Garrett,1975; Stemberger,1983等を参照)しかし、日本語に関してはそ

のような試みはほとんどなされたことはなく、興味を持った研究者は自分で実例を集めなければならないのが

現状である2。ところが、収集に自然観察法をとった場合、言い誤りは頻繁に日常生活で生じる現象ではないの

で、短期間に信頼を得るに足る量を揃えるのは難しい、という壁に直面することになる。そこで、誰もが利用で

きる、統一された記述方法を持つ大規模なコーパス構築にむけての努力が必要になってくる。既に CHILDES

のエラー・コーディングのもとでデータの蓄積が始まっている英語の記述にできるだけ近い形で日本語の言い

誤りのコード化を進めることの意義はそこにあるように思われる。

13.2 言い誤りの定義

データベース化の作業に入る前に、言い誤りとは何かを定義しておかなくてはならない。今回の紹介では以

下に示す定義を採用し、これからはずれるものは収集の段階で除外した方が望ましいのではないか、というこ

とを提案したい。

言い誤りとは、健常な言語能力を持つ、成人の、日本語を母語とする話者が、故意にではなく行なった意図

から逸脱した発話のことをいう。ただし、読み誤り、意図の変更、ためらい、吃音、ごくうちとけた場面での

不正確な発音はこれに含めない。

この中で特に注意すべきは、読み誤りを言い誤りの中に含めていないことで、「読む」ことに関する心的過

程と「言う」ことに関する心的過程は部分的に重複する部分はあると予想されるものの、異なるプロセスを含

んでいると考えての方針である。したがって、ここでいう言い誤りにはニュース等で原稿を読む際のアナウ

ンサーのとちりは加えられていない。もう一つ、定義を行なう際に考えなければならないのは方言の問題であ

るが、上記の定義には方言に関する項目は設けていない、これは、基準としているのが話者の意図であって、

東京方言からの逸脱ではないためで、筆者の持つデータベース中には東京方言以外の話者の誤りも含まれてい

る。また、例えば 2のような発話を大阪方言話者が行なった場合は (東京方言からすれば母音の関わる音韻的

誤りかもしれないが)当然のことながら、収集の段階から誤りとはしないという方針がとられている。

2「お金をひらう (東京方言では、ひろう)」

また、次の 3のような場合、話者が「我引田水」が正しいと信じて発話しているのであれば意図から逸脱し

ているわけではないので言い誤りとはみなされない。

3「それはがいんでんすいだ」(社会慣習的には「我田引水」)

さらに、同じ発話を漫才師がテレビ番組で行なった場合、今度は「故意にではなく」という項に触れて誤り

とはみなされないことになる。特にこの条件は重要で、意識が及ぶレベルでの誤りを排除することにより、通

常無意識に行われる我々の言語産出の過程を反映しているとされる言い誤りの情報としての価値を確保してい

ることになる。ところが、幼児の誤りを考えてみると、成人の定義に従うと排除すべきとみなされる誤りは予

想以上に多いように思われる。幼児の場合、次の 3通りの場合を考えなければならない。例えば、「たまご」を

「たがも」と発話したとすると、

(1)幼児が本当に「たがも」だと思って「たがも」と言っている場合、

(2)「たまご」と言うつもりが誤って「たがも」と言ってしまった成人と同じ定義による誤り、

(3)本当は「たまご」であることを知っているのだが、「たがも」というと周囲の大人が笑ってくれるのでわ

ざと「たがも」と言う、

の 3通りを区別する必要が生じる。ただし、現段階ではそれらを機械的に分類する手段がないだけでなく、各々

2筆者の知る限り、アナウンサーのとちりを中心に実例を集めた田総 (1982)が公になっている日本語の言い誤り資料集としては唯一のものである。

102

Page 127: JChatman

13.2. 言い誤りの定義

の例について確認をとることも難しいという状況にあるので、幼児の誤りについてはできるだけ観察者が確認

を行うこと、という注意を記すにとどめ、記述法等については今後の課題としたい。

13.2.1 収集方法

筆者がコーディングしようとしている日本語データベースに収められた言い誤りはすべて自然観察によって

収集された。この内、80%にあたる約 2900例は筆者が日常生活 (テレビ、ラジオの聴取を含む)で言い誤りに

遭遇した際にできるだけ速やかに前後の文脈も含めて書き取るというカード記述を行なって集めたものであり、

残りの約 600例は録音しておいたテレビ、ラジオ番組をテープ起こしして書き取ったものである。聞き間違い

や観察者の偏見といった雑音を避けるためには後者の収集方法が望ましいのは言うまでもないが、時間、労力の

確保等の都合により現段階では前者の方法が主流になっている。しかし、音韻的誤りが課題になることもある

ことを考えれば、今後、誤りの収集はオーディオ・テープやビデオ・テープに記録しながら行うべきであろう。

13.2.2 コーディングの形態

CHATのエラー・コーディングでは、一つ一つの言い誤りの実例に対して、次のことが明らかになるように

注意が払われている (MacWhinney, 1991)。まず、

(1) 話し手が実際にどう発話したのかを示す。

(2)どこが、どう誤っているのかをわかりやすい形で示す。

(3) 同時に正しい形、意図した形も的確に示す。

(4) 誤りからでも意図した形からも検索できるようにする。

(5) 言い誤りの研究で提案されている言い誤りのタイプや言い誤りが生じる言語学的レベル、等を示すことで、

言い誤り研究にとって興味深い情報を提供する。

これに加えて、JCHATのエラー・コーディングでは、日本語を母語としない使用者のために次の情報が必要

になるように思われる。まず、

(6) 前後の文脈を含めた意図した形、誤った形について形態素に分割し、それぞれに英訳と統語的範疇の分類

を与える。

次に、

(7) 意図した文脈全体を理解するための英訳を与えるラインを入れる余地を作る。

新たに加える (6)と (7) は義務的ではない点に注意されたい。

以上の項目の要求を満たすために JCHATのエラー・コーディングは一つの実例につき、次の 4つのライン

からなる記述法を提案したい。

*XXX:

%mor:

%err:

%eng:

1行目のいわゆるメイン・ラインはアステリスクに続いて発話者名の先頭の 3文字+コロンから始まる。例

えば、筆者 (寺尾)自身の誤りであれば*TER:となる。また、発話者名が確実でない場合は UNKNOWNから

とって*UNK:とする。コロン以下は一つ分のタブ・スペースの後、話者が実際に行った発話をローマ字表記す

る。この時に用いるローマ字表記法の種類と形態素分割の方法は幼児の発話資料の記述に用いたものと同じ方

法をとる。本書第 7章、第 14章を参照されたい。発話の中でどの要素が誤りであるかは、その直後 1スペー

103

Page 128: JChatman

第 13章 日本語のためのエラー・コーディング

スおき、言い誤り記号 ([*])を付与して示す。ただし、この記号を使ったからといって、ただちに %morライ

ンや%errラインを加えて分析にあたる義務が生じる訳ではない点に注意されたい。また、メイン・ラインの最

後にピリオドを打つのは幼児の発話を記述する場合と同じである。例えば、「わたしクラブを振っていた」と

言おうとして「わたしゴルフを振っていた」と誤ってしまった実例のメイン・ラインは以下のようになる:

*UNK: watashi kurabu [*] o futteita.

他のスコープト・シンボルも通常の JCHATコーディングで決められているものと同じ記号を用いる。特に

言い誤りの記述に頻繁に現れそうな記号は言い直し記号 ([//])である。この記号はどこからどこまでを言い

直したのかを示すアングル・ブラケット記号 (< >)とセットで登場する。例えば、「あいつにはがき、電話をし

た」という発話の記述は次のようになる:

*UNK: aitsu ni <hagaki [*]> [//] denwa o shita.

2行目の%mor:ラインはメイン・ラインに示された各形態素に対応させてその文法的範疇と部分的な英訳を

与えるためのラインで、日本語を母語としない使用者のための随意的なラインである。幼児の発話資料の場合

と同じ形態素分割がなされ (第 7章を参照)、文法的範疇が略語で示される (表 13.1を参照)。そしてその後ろ

にパイプ記号 (|)に続いて対応する英語が記される。例えば、前述の実例は以下のように書かれる。

表 13.1: 文法範疇の略語 (代表的なもののみを記した。詳しくは形態素化に関する章を参照されたい)

略語 文法範疇 略語 文法範疇 略語 文法範疇

N 名詞 V 動詞 ADJ 形容詞

ADV 副詞 ADN 形容動詞 AUX 助動詞

PTL 助詞 CGN 活用部分 CONJ 接続詞

PRE 接頭辞 SUFF 接尾辞

*UNK: aitsu ni <hagaki [*]> [//] denwa o sita.

%mor: N|he PTL N|postcard PTL N|telephone PTL V|do AUX

3行目の%errラインでは誤りである要素が明らかにされたうえで、言い誤り研究から得られた視点からの分

類と記述が行われる。まず、「誤った要素は実は XXXと言おうとしたものだった」という意味で、誤りを左側

に、意図した形を右側にして 1スペースずつおいて等号で結ぶ。続いて、言い誤り研究で提案されている分類

に基づいて、言い誤りが生じたレベルとタイプがこの順で略号によって記述される。このラインも誤りを特に

研究対象にしたい使用者のための随意的ラインである。前出の実例は以下のように記述される。

*UNK: aitsu ni <hagaki [*]> [//] denwa o sita.

%mor: N|he PTL N|postcard PTL N|telephone PTL V|do AUX

%err: hagaki = denwa $LEX $SUB ;

実例中、$LEXは意味的な要因から誤った語彙を選択した語彙レベルの誤り、$SUBはある要素の代わりに別

の要素を用いたという代用タイプの誤り、という意味である。これに加えて、音韻レベル、形態レベル、統語

レベルの誤りをさらに詳しく分類する記号群もある。略号とその解説は表 13.2 から表 13.5にまとめたので参

照してほしい。 また、%errラインはで、一つの誤りごとにセミコロンで記述を閉じることになるので、1ス

ペースをあけてセミコロンを打つことを忘れてはならない。

以下、別タイプの誤りをあげながら、コーディングに必要な約束ごとをみていくことにしよう。まず、実例

を示す。

104

Page 129: JChatman

13.2. 言い誤りの定義

表 13.2: 言い誤りが生じる言語学的単位とその実例

記号 言い誤りの単位 例

$PHO 音韻的単位が関わっている誤り 「ものがね歌合戦」(ものまね)

$LEX 意味的要因により違った語彙を選択した

誤り

「あなた、はいざら捨てたでしょ」(た

ばこ)

$MOR 形態的要素の誤り 「彼女はクロウトするうけ」(うけす

る)

$PTL 助詞の誤り 「僕に電報に来た」(電報が)

$MAL マラプロピズム (音韻的要因による語彙

選択の誤り)

「お豆腐のジャズ」 (ジャム)

$SYN 句以上の単位に生じた誤り 「ご注意おつけになってください」(ご

注意下さい/お気をつけになって下さ

いの混合)

4「ジャカン、ジャパンカップ」

このような音韻的な言い誤りでは、より精密な記述をするため / /記号で区切って UNIBETが用いられる。

*UNK: <jakan [*]> japankappu

%err: jakan /ZakaN/ = japan /ZapaN/ $PHO $SUB ;

これに加えて、上の誤りで興味深いのは、/pa/にとって代わった/ka/は次に現れるはずの /kappu/の/ka/で

あると推測できる点である。このような誤りはその源を文脈内に求めることができるので、「文脈的 (contextual)

誤り」と呼ばれる。どれくらい離れた所から、どちら向きに誤りが飛び込んできたのかを調べるのは、例えば

文産出の処理スパンを知る上で重要であると考えられるのでコーディングの中に組み込んでおきたい。「誤り

の源がある」は$=記号で示される。さらに、源の位置の特定は [ ]記号で行われる。また、方向はタイプコー

ドの中の$ANT(誤りが源に先行する)$PER(誤りが源に後続する)$A/P(前記二つのどちらの可能性もある場合)の

いずれかの記号を用いて記される (詳しくは表 13.3を参照のこと)。上の%errラインにこの情報を加えてみる

と以下のようになる:

*UNK: <jakan [*]> [/] japankappu

%err: jakan /zjakaN/ =japan /zjapaN/ $=/[ka]p:u/ = kappu $PHO

$ANT $SUB ;

もう一つ、日本語の音韻的誤りに特徴的なことをつけ加えておくと、日本語の場合、子音プラス母音のモー

ラと呼ばれる単位が言い誤りのにおいて無視できない役割を演じていることが既にいくつかの研究で述べられ

ている。ところが、入力の際に誤りの源を特定しようとする時にはこの単位が問題になることがある。例えば

上記の例では誤りと源の母音部分が共通であるためにモーラ単位の誤りなのか、分節音単位の誤りなのか (つ

まり、/p/ と /k/ の誤りとみた場合)を判断することは難しく、機械的な手順は見つかっていないのが現状で

ある。このような場合は以下に記す通り、二つの候補があること並記しておくという暫定的な解決策をとるこ

とにしたい3。

*UNK: <jakan [*]> [/] japankappu

%err: jakaN /zjakaN/ = japaN /zjapaN/ $=/[ka]p:u/ = kappu

$=/[k]ap:u/ = kappu $PHO $ANT $SUB $MRA/$CON ;

3実例中、$MRA/$CONはモーラ単位の誤りとも子音単位の誤りともとれることを示している。検索する際には$MRA*あるいは*$CONを使用することが望ましい。

105

Page 130: JChatman

第 13章 日本語のためのエラー・コーディング

表 13.3: 言い誤りのタイプとその実例

記号 言い誤りのタイプ 例

$ADD 要素がつけ加えられた誤り 「かれれはててるこの姿」(かれはて

てる)

$LOS 要素が欠落してしまった誤り 「青木となかじの組」(中島の組)

$SUB ある要素が別の要素に代用された誤り 「ねずみがのたくったような字」(み

みず)

$BLE 複数 (ほとんどの場合二つ)の要素が混

合してしまった誤り

「おてつかい」(おてつだい + おつか

い)

$EX1 要素が交換されてしまった誤りの前半部

「アパートのある風呂はいい」(風呂

のあるアパートはいい) では、「風呂」

への「アパート」の代用が EX1、「ア

パート」への「風呂」の代用が EX2

$EX2 要素が交換されてしまった誤りの後半部

$ANT 後から発話されるはずの要素を先取りし

てしまった誤り、しかもその要素が正し

い位置にもある場合

「ジャカン [カ]ップ」(←ジャパンカッ

プ:[ ]内は誤りの源)

$PER 既に発話された要素が源になっている誤

「長いく [ろ]かみ、しろ娘」(←しま

娘:[ ]内は誤りの源)

$A/P 源と思われる要素が前後にあって$ANT

と$PERの両方が可能な場合

「けっ[きょ]くどきょでだ [きょ]うす

るか」(結局どこで妥協するか)

$ACH 要素 X→ Y→ Z の順で誤りが受け渡し

されたように見える誤りのうち $ANT

型のもの

「おわられみ」(← おあわれみ)

$PCH 要素 X→ Y→ Zの順で誤りが受け渡し

されたように見える誤りのうち$PER型

のもの

未発見

$SCR 要素のかきまぜが起こったかのような誤

「おろしもロマン」(おもしろロマン)

$INC 発話が不完全なもの

$UNC 分析者が明確に分類できなかったもの

106

Page 131: JChatman

13.2. 言い誤りの定義

表 13.4: この表の記号は%PHOと分類された誤りを下位分類するために用いる

記号 言い誤りのタイプ 例

$VOW 母音が関わっている誤り 「ブタンかがり」(ボタンかがり)

$CON 子音が関わっている誤り 「かっきけき」(画期的)

$SYL 音節 (日本語の場合は長音節)が関わって

いる誤り

「ひょうりゅう」(流氷)

$FEA ある特定の素性が関わる誤り、多くの場

合素性値一つ違いの誤り

「かなくら」(鎌倉)

$MRA モーラ単位の誤り 「すがるシャトル」(駿河シャトル)

$NSM いわゆる非自立モーラの関わる誤り 「テープにとーた」(テープにとった)

$PTA アクセントの誤り 「健全育成にしょうがいがある」アク

セントパタンは HLLLだった

表 13.5: この表の記号は %morと分類された誤りを下位分類するために用いる

記号 言い誤りの単位 例

$CGN 活用の誤り 「気持ちをあから、あかるくして」

%eng:はその文脈全体の英訳を記すラインである。このラインも日本語話者以外の使用者の理解を助けるた

めの随意的なラインである。最後に先ほどからの例の記述を完成させてみよう。

*UNK: aitsu ni <hagaki [*] > [//] denwa o shita.

%mor: N|he PTL N|postcard PTL N|telephone PTL V|do AUX

%err: hagaki = denwa $LEX $SUB

%eng: I will call him ;

本章では上記のような 4行を一つの誤りの記述にあてるコーディングを提案した。今後、記述方法をより綿

密なものとするためにも、また、誤りという現象がが重要な役割を果たしている研究分野への応用を考えるた

めにも多くの研究者が手持ちの、あるいは新たに収集した言い誤りを記述する際に、この方法に興味を持って

くれることを望みたい。

参考文献

1. Fromkin,V.A.(1973). Speech errors as linguistic evidence. The Hague:Mouton.

2. Garrett,M.F. (1975). The analysis of sentence production. In G.Bower(Ed.), Psychology of Learning

and Motivation:Vol 9. NY:Academic Press.

3. Macwhinney,B.(Ed.) (1991). The CHILDES Project: Tools for analyzing talk. LEA.

4. Stemberger,J.P. (1983). Speech errors and theoretical phonology: A review. Bloomington: Indiana

University Linguistic Club.

5. 田総 武光. (1982). 言葉のとちり. 今井書店.

6. 寺尾康. (1992). 言い誤り資料データベース化の試み. 原口庄輔 (編),日本語のモーラと音節構造に関する

総合的研究 (1): 重点領域研究「日本語音声」研究成果発表論文集 (pp.76-83).

107

Page 132: JChatman
Page 133: JChatman

第14章 JCHATファイルの具体例

大嶋百合子

14.1 はじめに

この章では、JCHATのフォーマットで入力したファイルをいくつか紹介しよう。まず、JCHATの入力フォー

マットには、一番単純なフォーマットであるminJCHAT(CLANプログラムが動作するのに最小限必要な基準

を満たしたフォーマット)から、非常に複雑なフォーマットまであるということを、具体例で紹介する。つぎ

に、ヘボン式ローマ字表記を用いたファイル例として、愛知淑徳短期大学の宮田スザンヌさんのファイルと大

野清幸さんのファイル、訓令式のローマ字表記のファイルの例として、ハーバード大学の南雅彦さんのファイ

ルを紹介する。最後に、仮名ファイルの例として、大阪学院大学の中則夫さんによって入力された大久保デー

タ (1982)のファイルを紹介する。

14.2 複雑さの異なるファイルの例

ここでは、同じ発話データファイルを、複雑さの異なるフォーマットで 入力した例をいくつか紹介しよう。

ここで使用する発話データは、愛知淑徳短期大学の宮田スザンヌさんによって提供された子ども (CHI)と 母

親 (MOT)と研究者 (INV)) の 3人の発話データで、ヘボン式を使用している。この章のために一部変更を加

えたので、完全なオリジナルではない。

例 1

@Begin

@Participants: CHI Taroo Target_Child, MOT Hanako Mother,

INV Suuze Investigator

*CHI: a .

%act: akes the plastic case of INV's video tape

*CHI: a .

*CHI: a .

*CHI: a .

%act: puts the video case into the video bag

*CHI: a .

%act: takes pen out of the bag

*CHI: ha(i) .

%act: gives it to INV

*INV: hai choodai .

%com: CHI finds paper in the bag and looks at it

*CHI: a !

*CHI: a .

109

Page 134: JChatman

第 14章 JCHATファイルの具体例

%act: gives it to INV

*CHI: ke .

*INV: n ?

*CHI: kke .

*INV: kotchi hairan(ai) .

*CHI: a .

%act: touches camera lens

*INV: hon ga atta !

%com: CHI runs to the shelf where MOT sits

*MOT: hon misete !

*MOT: dore ?

*MOT: poppo no hon dore datta ?

%com: CHI takes train book out and opens it

*CHI: e .

*MOT: hora ookii ne .

*CHI: okki(i) .

*MOT: okkii .

%com: CHI turns pages

*CHI: gigii .

@End

例 1は、一番単純なフォーマットであるminJCHATで入力した場合である。ファイルの始まりを示すヘッダー・

ライン@Begin、ファイルに登場する登場者の ID、名前、役割を列挙する登場者ヘッダーライン@Participants、

ファイルの終りを示すヘッダーライン@Endの 3つの基本的ヘッダー・ラインが、CLANプログラムが動作す

るのに必要である。自立語および活用しない付属語である助詞は、minJCHATのルールにしたがってメイン・

ラインに分かち書きされている (JCHATの分かち書きルールについては、第 5章、第 29章を参照)。

省略した表現や不完全な発話は、hairan(ai) や okki(i) というように 省略された部分や不完全な部分を括弧

内に書いている。このように括弧を使用すると、FREQプログラムで語の頻度を計算する時、完全に発話され

た語と区別されずに、たとえば、okkiと okkii は、同じ語として頻度が計算される。もちろん、+r3 オプショ

ンを使えば、括弧が無視されて okki と okkiiは、異なる語としてそれぞれ頻度が計算される。

この例では、ディペンデント・ティアーである%actや%comで、英語を使用しているが、日本語でも構わな

い。メイン・ラインは、必ず、発話終端記号で終わらなければならないが、ディペンデント・ティアーは、終

端記号をつけないことに注意してほしい (発話終端記号については、第 8章を参照)。

例 2

@Begin

@Participants: CHI Taroo Target_Child, MOT Hanako Mother,

INV Suuze Investigator

*CHI: a@b .

%act: takes the plastic case of INV's video tape

*CHI: a@b .

*CHI: a@b .

*CHI: a@b .

%act: puts the video case into the video bag

*CHI: a@b .

%act: takes pen out of the bag

110

Page 135: JChatman

14.2. 複雑さの異なるファイルの例

*CHI: ha(i) .

%act: gives it to INV

*INV: <hai choodai> [>] .

*CHI: <0> [<].

%act: finds paper in the bag and looks at it

*CHI: a@b !

*CHI: a@b .

%act: gives it to INV

*CHI: ke@b [=! high pitch voice] .

*INV: n ?

*CHI: kke@b [=! high pitch voice] .

*INV: kotchi hairan(ai) .

*CHI: a@b .

%act: touches camera lens

*INV: <hon ga atta> [>]!

*CHI: <0> [<].

%act: runs to the shelf where MOT sits

*MOT: hon misete !

*MOT: dore ?

*MOT: <poppo no hon dore datta> [>] ?

*CHI: <0> [<].

%act: takes train book out and opens it

*CHI: e@b .

*MOT: hora ookii ne .

*CHI: okki(i) .

*MOT: okkii .

@End

例 2は、例 1の%comの内容を同時発話の記号 [>][<] を使用してトランスクリプトの精密化を試みている。

たとえば、子ども (CHI)が、ビデオバッグに入っていた紙をみつけ、何も言わずに見ている時に、研究者 (INV)

が、hai choodaiと発話したという場合を考えてみよう。例 1では、hai choodaiという研究者の発話のメイン・

ラインに、コメント・ラインである%comをつけて同時生起している子どもの行動を記述している。しかし、例

2では、子供のメイン・ラインに、発話がないことを示す 0記号を使用し、そのディペンデント・ティアーであ

る%actに、子供の非言語行動を記述している。また、研究者の発話と子供の行動が同時生起していることを、

それぞれのメイン・ラインに同時発話記号 [>] [<]を使用して示している。また、これ以外にも、子供のなん

語的発話を、なん語記号@bでマークしたり、非言語現象記号 [=! ]を使用して子供の発話音のピッチの情報

を加えたりして、トランスクリプトの精密化をしている。

例 3

@Begin

@Participants: CHI Taroo Target_Child, MOT Hanako Mother,

INV Suuze Investigator

@Age of CHI: 1;10.21

@Date: 17-JUL-1989

@Filename: TARO22.cha

@Coding: JCHAT 1.0 Hebon

111

Page 136: JChatman

第 14章 JCHATファイルの具体例

@Situation: free play at home

*CHI: a@b .

%act: takes the plastic case of INV's video tape

*CHI: a@b .

*CHI: a@b .

*CHI: a@b .

%act: puts the video case into the video bag

*CHI: a@b .

%act: takes pen out of the bag

*CHI: ha(i) .

%act: gives it to INV

*INV: <hai choodai> [>].

*CHI: <0> [<].

%act: finds paper in the bag and then looks at it

*CHI: a@b !

*CHI: a@b .

%act: gives it to INV

*CHI: ke@b [=! high pitch voice] .

*INV: n ?

*CHI: kke@b [=! high pitch voice] .

*INV: kotchi hairan(ai) [: haira-nai] .

*CHI: a@b .

%act: touches camera lens

*INV: hon ga atta [: a-ta] !

*CHI: <0> [<].

%act: runs to the shelf where MOT sits

*MOT: hon misete [: mise-te] !

*MOT: dore ?

*MOT: <poppo no hon dore datta [: da-ta]> [>] ?

*CHI: <0> [<].

%act: takes train book out and opens it

*CHI: e@b .

*MOT: hora ookii [: ooki-i] ne .

*CHI: okki(i) .

*MOT: okkii [: ooki-i] .

@End

例 3では、ヘッダー・ラインも増やしてフアイルに関する情報を加えている。また、自動置き換え記号 [: ]

を使用して用言を形態素に分割している。形態素分割は、学校文法方式を使っている (学校文法方式について

は、第 7章を参照してほしい)。MLUプログラムを使用すると、自動置き換え記号の括弧内の形態素に分割さ

れた用言に自動的に置き換わってMLUの計算がされる。ただし、+r5オプションを使用すれば、自動置き換

え記号が無視されて、括弧の外側の用言に基づいてMLUが計算される。

112

Page 137: JChatman

14.3. ヘボン式ローマ字表記による JCHATフアイルの例

14.3 ヘボン式ローマ字表記による JCHATフアイルの例

まず、宮田スザンヌさんによって提供された 2歳 3カ月の男の子の発話データ・ファイルを紹介しよう。こ

れは、縦断発話データアキコーパスの一部 (AKI22.cha) であるが、アキコーパスは、その後改訂されたため、

最終版とは表記の仕方が一部異なる。

@Begin

@Participants: AKI Akifumi Target_Child, AMO Fumiko Mother,

SUZ Susanne Investigator, REI Rei Brother

@Filename: AKI20413

@Age of AKI: 2;3.12

@Sex of AKI: male

@Date: 8-JAN-1990

@Coding: JCHAT 0.1 Hebon 93/10

@Warning: AMO's repititions are shortened partially

(AKI's utterances are completely transcribed)

@Comment: AMO reports, AKI sometimes asks "nani?" or "are nani?",

especially when watching TV

@Situation: free play at home, Amo concentrating on Aki

@Time Start: 00:10:15

*AMO: kisha+poppo kita [: kuru-ta] ?

%tim: 00:00:00

%sit: Aki has taken out big locomotive (50 cm length)

*AKI: shishapoppo [: kisha+poppo] .

*AMO: un .

*AMO: <kisha+poppo dare mo nottenai [: noru-teru-nai]> [>] ?

*AKI: <0>[<].

%act: gets up, to the garage

*AMO: Suuze ni atarashii jidoosha misete [: miseru-te] !

*SUZ: dore+dore ?

*AKI: seeshoosha [: seesoosha] !

*SUZ: sheeshosha [: seesoosha] ?

*AKI: shenshoosha [: seesoosha] .

*AMO: gomi doko ?

*AKI: gomi koko .

%gpx: pointing at garbage inside the car

*AKI: haitta [: hairu-ta] .

*AMO: haitta [: hairu-ta] .

*AMO: haitta [: hairu-ta] tte ireru no ?

*AMO: fun .

*AKI: haitta [: hairu-ta] .

*AMO: haitta [: hairu-ta] ?

*AKI: nananda [: narabu-ta] .

*AMO: naranda [: narabu-ta] ?

*AKI: naananda [: narabu-ta] .

*AMO: naranda [: narabu-ta] .

113

Page 138: JChatman

第 14章 JCHATファイルの具体例

*AKI: ichi .

*AKI: ni(two)+ san+ shi+ go+ ni(two)+ ten@s .

%gpx: counting lined up cars and train with finger

%com: English counting learned from Sesame Street

*AMO: ten@s made aru ?

*AKI: juu .

*AKI: a mina nananda [: narabu-ta] .

*AMO: mina naranda [: narabu-ta] ne .

*AKI: sheeshoosha [: seesoosha] .

*AMO: seesoosha .

*AKI: sensha !

*AMO: sensha shiteru [: suru-teru] ?

*AMO: densha mo sensha suru no ?

*AKI: kisha+poppo .

%act: gets bus

%tim: 00:03:00

*AKI: bashu [: basu] .

*AKI: bashu [: basu] .

*AMO: basu mo ?

*AKI: sensha .

*AMO: sensha ookee .

*AKI: sensha okkee [: ookee] .

*AMO: sensha shiteru [: suru-teru] no,, asoko de ?

*AKI: akai sensha .

*AMO: asoko de sensha shiteru [: suru-teru] ?

*AKI: shashashasha@o .

*AMO: shashasha@o tte yatteru [: yaru-teru] ?

*AKI: miyu [: mizu] .

*AKI: mizu shaa@o .

*AMO: <mizu de ne> [>].

*AKI: <0>[<].

%act: gets up, goes to train, sees REI's keyholder, little doll

*AKI: Rei-chan .

*AKI: denshan [: densha] .

*AKI: Rei-chan .

%gpx: putting the keyholder doll into the train

*AMO: Rei-chan kisha ni noru no ?

*AKI: kisha notta [: noru-ta] .

*AMO: kisha ni notta [: noru-ta] ?

*AKI: Rei-chan nenne .

*AMO: Rei-chan nenne shiteru [: suru-teru] ?

*AKI: un .

*AMO: Rei-chan ni mo misete+agete [: miseru-te+ageru-te] ii ?

*AKI: Rei-chan nenne .

*AKI: ima .

*SUZ: Rei-chan ni miseyoo [: miseru-yoo] ka ?

114

Page 139: JChatman

14.3. ヘボン式ローマ字表記による JCHATフアイルの例

*AMO: mitai [: miru-tai] yo tte .

*AKI: mina shensha [: sensha] .

*AMO: sensha shiteru [: suru-teru] no,, ima ?

*AMO: ja matteru [: matsu-teru] ne .

*AMO: jaajaa@o tte .

*AKI: jaajaa@o .

*AKI: shensha [: sensha] .

*AMO: sensha shiteru [: suru-teru] ?

*AKI: notteru [: noru-teru] yo .

*AMO: notteru [: noru-teru] ?

*AMO: Rei-chan notteru [: noru-teru] .

*AMO: Aki-chan mo nosete [: noseru-te] .

*AKI: Aki-chan koko .

%gpx: pointing at front of train

*AMO: un .

*AKI: Aki-chan koko .

*AKI: kisha+poppo .

%tim: 00:04:30

@End

宮田さんのファイルでは、森川方式を使用して形態素分割が行われている (森川方式については、第 7章を参

照)。複合語の記号+を用いて、kisha+popoのようないわゆる複合語だけでなく、子供の数唱の表記に利用し

ている。「ni(two)+ san+...」のように数唱が表記されていれば、MLU計算の時に、6形態素ではなく 1形態

素として扱われる。また、オプションを使用すれば、6形態素として扱うこともできる。各語の頻度を計算す

る時も、オプションを使用すれば、数字毎の頻度が計算できる。オプションを使用しないと、たとえば ni+san

は、niや sanと異なる語として扱われることに注意してほしい。もちろん、Brown (1973)の提唱にしたがっ

て、数唱は自発的な発話ではないということで、MLU計算には使用べきでないということであれば、そのメ

イン・ラインの終端記号のあとに、ポストコード [+ bch]をつけておけば、[+ bch]のついたメイン・ライン

を除いた場合のMLUも、-s"[+ bch]" オプションを使えば計算できる。

数唱の時に、数字の「10」のことを、子供が日本語の juuというかわりに、英語の tenと発話している。こ

のように、第二言語が第一言語の中に混ざっている時は、宮田さんのファイルのように、第二言語記号@sを使

用して ten@sというように、その語をマークすることができる。数字の「2」は、助詞の「に」と同様に、ロー

マ字表記の JCHATでは、niと表記されるため、語の頻度計算の時に、同じ語として扱われる。この様な混同

を避けるために、JCHATでは minJCHATの合意事項の一つとして、助詞と同音異義語の語には同音異義語

のマーキングをしなければいけない。宮田さんのファイルでも、数字の「2」には、ni(two)というように同音

異義語のマーキングがされている。これで、数字の「2」と助詞の「に」は、異なる語として頻度計算がされ

ることになる。

JCHATでは、擬声語擬態語リストにのっていない擬声語と擬態語は、擬声擬態語記号@oをつけるというこ

とになっている。、宮田さんのファイルでも、擬声擬態語リストにのっていないものは、shashasha@o、jaa@o、

shaa@oというように擬声擬態語記号を使ってマークしている。

%timは、発話された時間を記述するためのディペンデントティアーである。宮田さんのファイルのように、

ファイルの最初の発話から、どのくらい時間がたったかを記録する方法と、発話された時の実際の時間を記録

する方法の二通りがある。

次に紹介するファイルは、大野清幸さんから提供された 1歳 6カ月の女の子の発話データ・ファイルである。

@Begin

@Participants: ARI Arisa Target_Child, MOT Naoko Mother,

115

Page 140: JChatman

第 14章 JCHATファイルの具体例

FAT Kunihiko Father, INV Seiko_Fukuchi_Ono Investigator

@Age of ARI: 1;6.2

@Sex of ARI: female

@Birth of ARI: 6-JUL-1987

@Date: 8-JAN-1989

@Coding: JCHAT Hebon 7-Feb-1994

@Coder: Seiko Fukuchi Ono

@Education of MOT: 16

@Education of FAT: 16

@SES of ARI: middle

@Language: Japanese

@Location: Nagoya, Aichi, JAPAN

@Situation: ARI, MOT, FAT, and INV were at ARI's home

@Filename: ARI10602

@Situation: ARI, MOT, FAT, and INV were in the living room

*FAT: kono hito daare ?

%gpx: pointing to himself

*MOT: daare ?

%gpx: pointing to FAT

*FAT: Arisa-chan .

%com: vocative

*FAT: kuchi ni mono ga haitte iru kara .

*FAT: Arisa-chan .

%com: vocative

*MOT: daare ?

*INV: <choki dashiteru> [>] .

*CHI: <0> [<] .

%act: reaching out her right hand to INV, making a shape like a

pair of scissors

*ARI: xxx daare ?

%gpx: pointing to INV

*FAT: Arisa, janken dekiru yo nee .

*MOT: jankenpon shite .

*FAT: Arisa-chan .

%com: vocative

*ARI: xxx njapo [*] .

%err: njapo /njapo/ = jankenpon /jankenpon/ $PHO ;

%act: reaching out her left hand to INV, making a shape like a sheet

of paper

*INV: O#too-san to shite .

%add: ARI

*FAT: jankenpoi wa ?

*FAT: hai .

*FAT: jankenpoi .

%act: playing the game of 'paper, scissors, stone' with ARI .

*ARI: Mama [*] .

116

Page 141: JChatman

14.3. ヘボン式ローマ字表記による JCHATフアイルの例

%err: Mama /mama/ = Papa /papa/ $LEX ;

%act: walking to FAT

*FAT: Mama janai .

*FAT: jankenpoi wa ?

*MOT: Mama koko yo .

%act: looking back to ARI in the living room from the kitchen

*ARI: dachipon [*] .

%err: dachipon /dachipon/ = jankenpon /jankenpon/ $PHO ;

*FAT: soo da na .

*ARI: dachipon [*] .

%err: dachipon /dachipon/ = jankenpon /jankenpon/ $PHO ;

*MOT: sono hora # Arisa-chan, Gomi Taroo no hon ni iroiro

kaitearu +/.

*ARI: dachipon [*] .

%err: dachipon /dachipon/ = jankenpon /jankenpon/ $PHO ;

*MOT: Arisa-chan .

%com: vocative

*FAT: e(picture) o mite aru+teido wa wakaru .

*FAT: Arisa-chan, kore nani ?

%act: drawing a green pepper on the Magna Doodle

*ARI: xx .

*FAT: kore nani,, kore ?

%act: drawing the green pepper on the Magna Doodle

*FAT: Arisa-chan, kore naani ?

%act: drawing the green pepper on the Magna Doodle

*FAT: naani ?

%gpx: pointing to the green pepper on the Magna Doodle

*ARI: piiman .

*FAT: soo da na .

*FAT: chotto e(picture) wa heta dakedo piiman nanda .

*FAT: omoshiroi yatsu yaroo .

*MOT: kiwametsuke .

*FAT: omoshiroi yatsu .

*FAT: kore imi ga wakaru ka dooka wakannai kedo .

%act: drawing the letter M, the trademark of MacDonald's, on the

Magna Doodle

*FAT: hai .

*FAT: kore naani ?

%act: drawing the letter M, the trademark of MacDonald's, on the

Magna Doodle

*ARI: pote(to) .

*ARI: pote(to) .

*MOT: poteto da nee .

*FAT: <poteto> [.

*FAT: <poteto> ["] tte itteru .

*FAT: kore wa Makudonarudo no maaku nandesu ne .

117

Page 142: JChatman

第 14章 JCHATファイルの具体例

*FAT: honde asoko no poteto ga suki na monde kono maaku o miru

to moo <poteto> ["] tte yuu yooni natta .

*FAT: poteto tte yuu kotoba wa +/.

*ARI: poteto .

*FAT: soo ya na .

*FAT: poteto da ne .

*FAT: poteto ya na .

*ARI: xxx .

*FAT: hai+hai+hai .

@End

大野さんのフアイルでは、エラーコーデイングの記号 [*]を使用して、子どもの発音の間違いや、言い間違

いをマークしている (エラーコーデイングの仕方については、第 13章を参照)。エラー・コーデイングティアー

%errに使用されている記号$LEXは、語彙的な誤り、$PHOは、発音上の誤りを示す。子供の発音の間違いは、

自動置き換え記号 [: ]を使用して、たとえば、dachipon [: jankenpon]とメイン・ラインに表記すること

もできる。自動置き換え記号を使用した場合は、各語の頻度を計算する時には、dachiponは、jankenponとし

て扱われることに注意してほしい。もちろん +r5 オプションをつかえば、dachiponと jankenponは、エラー

コーデイングをした場合と同様に異なる語として扱われ、それぞれの頻度が計算される。自動置き換え記号を

使用する利点は、両方の場合の頻度が計算できることであろう。

助詞の「へ」は、ローマ字表記の JCHATでは、e と表記されるため、語の頻度計算の時に、「絵」や「柄」

のような同音異義語と同じ語として扱われる。この様な混同を避けるために、e(picture) というように同音意

義語のマーキングがされている。このマーキングによって、語の頻度計算では助詞の「へ」は、e として、絵

は、e(picture)として、異なる語として扱われる。

xxxという記号は、発話が、聞き取れない時に使用され、MLU計算の時に自動的に取り除かれる。発話全体

が聞き取れず、xxxとする場合は、MLU計算の時に、そのメイン・ラインが完全に取り除かれるので問題ない

が、発話の一部が聞き取れず、その部分だけ、xxxの記号で書かれていると、その部分だけ取り除かれるので

注意する必要がある。このように xxxの記号が、部分的にメイン・ラインに含まれている時は、そのメイン・

ラインの終端記号のあとに、ポスト・コード [+ bch] をつけておけば、MLU計算のときに、-s"[+ bch]"の

オプションをコマンドにつけると、そのメイン・ラインを取り除いたMLUが計算される。発話の内容は聞き

取れないが、明らかに 1形態素と言うことがわかり、しかも、その聞き取れない部分をMLU計算に含めてほ

しい場合は、xxxのかわりに、xxを使えばよい。

大野さんのファイルでは、呼びかけで名前を使用している場合と、そうでない場合を、コンマ, や、コメン

トライン%comを使用してマークしている。これは、minJCHATの合意事項で、必ずマークする必要がある。

また、外置 (dislocation) の場合は、kore nani,, koreというように、ダブルコンマを使用する。

引用記号 ["]を使用すると、< >がある場合は、< >内の発話すべてが、引用されたことになる。 大野さん

のファイルでは、potetoという語だけが引用されている。このように 直前にある語だけが引用された場合は

< >をつけなくても、CLANは、直前にある語だけが引用記号のスコープと解釈するので、つけてもつけなく

てもよい。

休止記号と接頭辞記号の両方が使用されているが、両方とも#記号なので、混同しないように注意してほし

い。休止記号の時は、#記号の前後にスペースがはいるが、接頭辞記号の時は、前後にスペースがはいらない。

メイン・ラインの終端記号に使われている+/.は、発話が中断されたことを示す。

14.4 訓令式ローマ字表記のファイルの例

南雅彦さんから提供された 5歳 6カ月の女の子の発話データファイルを紹介しよう。

118

Page 143: JChatman

14.4. 訓令式ローマ字表記のファイルの例

@Begin

@Participants: CHI Child, MOT Mother

@Sex of CHI: female

@Birth of CHI: 20-JAN-1987

@Age of CHI: 5;6.12

@Coding: JCHAT Kunrei

@Filename: Yuka.cha

@Date: 1-AUG-1992

@Language: Japanese

@Location: Sanda, Hyogo, Japan

@Transcriber: Masahiko Minami

*MOT: hai Yuka-tyan .

%com: vocative

%eng: hi Yuka-tyan

%com: vocative

*CHI: un ?

%eng: huh

*MOT: un kono mae o#tomari+hoiku itte [: ik-te] kita [: k-ta] ne .

%eng: yeah(you) went to overnight schooling the other day you know

*CHI: un +...

%eng: yeah

*MOT: un .

%eng: yeah

*CHI: +, itte [: ik-te] kita [: k-ta] kedo .

%eng: (I) went though

*MOT: nani site [: s-te] .

%eng: what were (you) doing and

*MOT: asondeta [: asob-de-ta] n(o) # o#tomari+hoiku de ?

%eng: playing at the overnight schooling

*CHI: o#tomari+hoiku yo .

%eng: it's overnight schooling

*CHI: iti+ban saisyo ni +...

%eng: first of all

*MOT: un [=! back channels] .

%eng: uh huh

*CHI: +, yoyo [//] ban+gohan tabete [: tabe-te] .

%eng: (I) ate dinner

*MOT: ban+gohan tabeta [: tabe-ta] no .

%eng: (you) ate dinner didn't (you)

*CHI: go-zi ni .

%eng: at five o'clock

*MOT: go-zi ni ban+gohan tabeta [: tabe-ta] no .

%eng: did (you) eat dinner at five o'clock

*CHI: de +...

%eng: and

*MOT: nani tabeta [: tabe-ta] no ban+gohan ?

119

Page 144: JChatman

第 14章 JCHATファイルの具体例

%eng: what did (you) eat for dinner

*CHI: +, de ebi+furai+karee to # tomato no sarada to .

%eng: and curry with fried shrimp and tomato salad

*CHI: tiisai [: tiisa-i] tomato ga ne +...

%eng: small tomatoes you know

*MOT: un [=! back channels] .

%eng: uh huh

*CHI: +, waatto nosete [: nose-te] ne +...

%eng: were all over you know

*MOT: un [=! back channels] .

%eng: uh huh

*CHI: de ato suika .

%eng: and then (there was) watermelon

*MOT: suika mo tabeta [: tabe-ta] no ?

%eng: did (you) eat watermelon too

*CHI: un .

%eng: yeah

*MOT: honto .

%eng: really

*MOT: nokosanai [: nokos-na-i] de .

%eng: (you) didn't leave (anything) unfinished

*MOT: tabeta [: tabe-ta] n(o) ?

%eng: did (you) eat

*CHI: un .

%eng: yeah

@End

南さんのフアイルでは、用言の形態素分割は日本語文法にもとずいた南方式が使用されている (南方式につ

いては、第 7章を参照)。%engのディペンデントテイアーを使用して、各発話について英訳がついているので、

日本語を知らない研究者にも、発話の内容を理解してもらえる。また、子供や母親が言いかけた発話を自分で

続けて完成している場合に、自己完成記号 ,+を使用して、発話が途中でとだえた場合と区別している。自己

完成記号は、必ず +...の記号と組み合わせで使われること、また、自己完成記号を使用すると、MLU計算

の時に、一つの発話として扱われることに注意してほしい。 言い直しの記号 [//]を使用して、子供が yoyo

を ban+ gohanに言い直しているのをマークしているが、このように、言い直された部分が一つの語の場合

は、言い直しの範囲を示すスコープ記号< >を省いてもよい。言い直しされた部分は、MLU計算や頻度の計算

の時に自動的に無視されるので、その部分も含めたい場合は、+r6 オプションをコマンドにつけなければいけ

ない。あいづちの unと肯定の意味の unを区別するために、あいづちの unに、[=! back channels]を用い

てあいづちであることをマークしている。ただし、このようにマークしても、単純な頻度計算では、あいづち

の unも肯定の unも同じ語として扱われる。un(aiduti)というように、同音異義語のマーキングを利用すれば、

異なる語としてそれぞれの頻度を計算することができる。

14.5 仮名ファイル、仮名漢字ファイルの例

仮名フアイルの例として、中則夫さんによって入力された大久保データ (1982)を紹介しよう。2歳 1カ月の

男の子と母親の会話である。ローマ字よりも正確に入力できると思う方は、まず、仮名で入力し、あとで、中さ

んによって作成された JCHANGEファイルを利用してローマ字に変換するとよいだろう (JCHANGEファイ

120

Page 145: JChatman

14.5. 仮名ファイル、仮名漢字ファイルの例

ルの使い方については、第 17章を参照のこと1)。ここでも、この仮名ファイルを JCHANGEで変換したロー

マ字フアイルを紹介する。

仮名ファイルの例

@Begin

@Participants: TAR Target_Child Child, MOT Mother Mother

@Age of TAR: 2;1.4

@Sex of TAR: male

@Birth of TAR: 03-MAR-1974

@Date: 7-MAR-1976

@Coding: JCHAT 1994

@Dat: 0307-01

@Situation: looking at Bun-chan's book

*MOT: きょう は おともだち を たくさん よんできて <おもちゃ を

たく (さん)> [/] おもちゃ を たくさん だして あそびました .

*MOT: ここ に は ひこうき が います .

*MOT: ここ に は いぬ の ぬいぐるみ .

*MOT: それから つみき も あります .

*MOT: ベル も あります .

*MOT: たいこ も あります .

*MOT: これ は トラック ダンプ それから きしゃぽっぽ も あります .

*MOT: えき でしょ ここ .

*MOT: はっしゃ ぶーん .

*MOT: <ガッタン ゴットン> [/] ガッタン ゴットン <ゴト ゴト ゴト> [/]

ゴト +... [+ bch]

*MOT: うん .

*MOT: はし .

*MOT: これ .

*MOT: また えき .

*MOT: えき .

*MOT: えき .

*MOT: とけい が ある でしょ .

*MOT: えき に とけい が ある の .

*MOT: あ そう [/] そう .

*MOT: たあちゃん も もってくる の .

*MOT: たあちゃん も もってん の ね .

*MOT: いい の よ もってこなくて も .

*MOT: そう おなじ なの .

*MOT: そうゆう の ね .

*TAR: これ くりゅま [: くるま] ない ね .

*MOT: あ これ くるま ない の .

*TAR: うん .

*MOT: じゃ たあちゃん 00が とった ん じゃない .

*MOT: どっか 00に もってきてごらん .

1第一版の 17 章は本書では割愛した。

121

Page 146: JChatman

第 14章 JCHATファイルの具体例

*MOT: くるま 00を つけたげる .

@dat: 0307-02

*TAR: ふたーちゅ [: ふたつ] .

*MOT: ふたつ ない じゃない .

*MOT: ふたつとも とった の .

*TAR: うん .

*MOT: あ そこ に みえてる .

*MOT: そこ に おちてる .

*MOT: あった ふたつ .

*MOT: あ そう ね .

*MOT: じゃ つけてあげる .

*TAR: こっち .

*MOT: あ こっち も つけてあげる .

*MOT: だいじょうぶ ふたつとも つけてあげる .

*MOT: はい .

*MOT: ううん じょうず [/] じょうず .

*TAR: ふたーち [: ふたつ] ごーごー@b .

*MOT: そう ふたつ ごーごー@b .

*TAR: うん .

*MOT: ふうん .

*TAR: わんわん いー よー .

*MOT: わんわん いい よ って わんわん ふみきり の ところ とおる の .

*MOT: せんろ とおる の .

*MOT: ふうん .

@End

仮名漢字ファイルの例

@Begin

@Participants: TAR Target_Child Child, MOT Mother Mother

@Age of TAR: 2;1.4

@Sex of TAR: male

@Birth of TAR: 03-MAR-1974

@Date: 7-MAR-1976

@Coding: JCHAT 1994

@Dat: 0307-01

@Situation: looking at Bun-chan's book

*MOT: 今日 は お友だち を たくさん 呼んできて <おもちゃ を たく (さ

ん)> [/] おもちゃ を たくさん 出して 遊びました .

*MOT: ここ に は 飛行機 が います .

*MOT: ここ に は 犬 の ぬいぐるみ .

*MOT: それから つみき も あります .

*MOT: ベル も あります .

*MOT: たいこ も あります .

*MOT: これ は トラック ダンプ それから きしゃぽっぽ も あります .

*MOT: 駅 でしょ ここ .

122

Page 147: JChatman

14.5. 仮名ファイル、仮名漢字ファイルの例

*MOT: 発車 ぶーん .

*MOT: <ガッタン ゴットン> [/] ガッタン ゴットン <ゴト ゴト ゴト> [/]

ゴト +... [+ bch]

*MOT: うん .

*MOT: 橋 .

*MOT: これ .

*MOT: また 駅 .

*MOT: 駅 .

*MOT: 駅 .

*MOT: 時計 が ある でしょ .

*MOT: 駅 に 時計 が ある の .

*MOT: あ そう [/] そう .

*MOT: たあちゃん も 持ってくる の .

*MOT: たあちゃん も 持ってん の ね .

.... 以下省略 ....

@End

さて、中さんの入力ファイルを見てまず気がつくことは、日本語の句読点やスペースを使わず、英語と同じ

書法にしてあることであろう。仮名フアイルでも、CHATや JCHATの記号、また、語と語のスペースは必ず

半角で入力する必要があることに注意しよう。また、仮名フアイルの場合、長母音のーと接尾辞記号の-と間

違いやすいので入力の際に十分注意してほしい。「< おもちゃ を たく (さん)> [/] おもちゃ を たくさん...

」のように、明らかに言い直しの場合だけでなく、「そう [/] そう」のように発話を単にくりかえしている時

にも 言い直しの記号 [/] を使用していることに気がつくであろう。これは、MLU計算する時に、言い直しの

記号を使用すると、言い直された部分が無視され、単なる言い直しやくりかえしによるMLUの値の増大を避

けることができるからである。ただし、語の頻度を計算する時は、逆に言い直しの部分が含まれることに注意

してほしい。

メイン・ラインが、「ガタン ガタンゴトン . . .」というような擬声語だけが長々と続きMLU計算にそのま

ま含めるとMLU値が不必要に高くなる恐れがある場合は、[+ bch]をつけておけば、そのメイン・ラインを

含めた場合と取り除いた場合の両方のMLU計算ができる。「わんわん」は、ここでは、犬のなきごえではな

く、犬という語の意味で使われている。なきごえと犬を区別したい場合は、犬の方に"wanwan=inu"というよ

うに、同音異義語のマーキングを利用することもできる。元の大久保データがカードによって整理されている

ため、その参照の手助けになるように、新しいヘッダーライン@Dat:を使っている。これは、同じ日の違う時

刻にデータが採られた場合によく使う方法である。このように、自分で新しいヘッダーラインやディペンデン

トティアーを加えた場合は、追加デップファイル (00depadd.cut)に登録して、00readme.docに説明を加える

必要がある。特に、このデータのように、同じ日に何回かにわけて採られたわけではなく、連続した発話の場

合は、そのことを明記する必要がある。

この仮名フアイルは、元々、JCHANGEでローマ字フアイルに変換後、中さんが現在開発中の日本語自動

形態素解析プログラム JMORにかける予定であった。したがって、JMORができることは手で入力していな

い。たとえば、擬声擬態語でも、JMOR の辞書に擬声擬態語として登録してあるものについては、擬声擬態

語マーカー@oをつけていない。また、一 部省略や標準形から離れたものも、形が一定して何度も出てくるも

のは JMORの辞書に登録して、手で入力していない。つまり、入力の手間を最小限に押えているといえよう。

JMORプログラムを使う場合は、このフアイルのように、メイン・ラインで形態素分析をすべきでない。また、

置き換え記号を使用した用言の形態素分割も避けたほうがよい。

それでは、この仮名フアイルを、まず JCHANGEで訓令式ローマ字に変換し、それに JMORプログラムを

かけて、CLANエディタの選択モードで整えたフアイルを、次に紹介しよう。各メイン・ラインにつき%morが

自動的に生成されるので、ファイルの大きさが倍以上になる。したがって、ここでは 0307-01のカードに記録

123

Page 148: JChatman

第 14章 JCHATファイルの具体例

されていた発話データだけ、サンプルとして示す。

@Begin

@Participants: TAR Target_Child Child, MOT Mother Mother

@Age of TAR: 2;1.4

@Sex of TAR: male

@Birth of TAR: 03-MAR-1974

@Date: 7-MAR-1976

@Coding: JCHAT Kunrei 1994

@Dat: 0307-01

@Situation: looking at Bun-chan's book

*MOT: kyou wa otomodati o takusan yondekite <omotya o taku(san)>

[/] omotya o takusan dasite asobimasita .

%mor: n|kyou ptl:top|wa n|o#tomodati ptl:case|o n|takusan

v|yob-tekur-INF n|omotya ptl:case|o n|takusan n|omotya ptl:case|o

n|takusan v|das-INF v|asob-POL-PAST .

*MOT: koko ni wa hikouki ga imasu .

%mor: demo:n|koko ptl:case|ni ptl:top|wa n|hikouki ptl:case|ga v|i-POL-PRES .

*MOT: koko ni wa inu no nuigurumi .

%mor: demo:n|koko ptl:case|ni ptl:top|wa n|inu ptl:case|no n|nuigurumi .

*MOT: sorekara tumiki mo arimasu .

%mor: conj|sorekara n|tumiki ptl:tori|mo v|ar-POL-PRES .

*MOT: beru mo arimasu .

%mor: n|beru ptl:tori|mo v|ar-POL-PRES .

*MOT: taiko mo arimasu .

%mor: n|taiko ptl:tori|mo v|ar-POL-PRES .

*MOT: kore wa torakku danpu sorekara kisyapoppo mo arimasu .

%mor: demo:n|kore ptl:top|wa n|torakku n|danpu

conj|sorekara n|kisyapoppo ptl:tori|mo v|ar-POL-PRES .

*MOT: eki desyo koko .

%mor: n|eki v:cop|de&POL-INT demo:n|koko .

*MOT: hassya buun .

%mor: n|hassya onoma|buun .

*MOT: <gattan gotton> [/] gattan gotton <goto goto goto> [/] goto +...

%mor: onoma|gattan onoma|gotton onoma|gattan onoma|gotton onoma|goto

onoma|goto onoma|goto onoma|goto +...

*MOT: un .

%mor: co|un .

*MOT: hasi .

%mor: n|hasi=bridge .

*MOT: kore .

%mor: demo:n|kore .

*MOT: mata eki .

%mor: adv|mata n|eki .

*MOT: eki .

%mor: n|eki .

124

Page 149: JChatman

14.5. 仮名ファイル、仮名漢字ファイルの例

*MOT: eki .

%mor: n|eki .

*MOT: tokei ga aru desyo .

%mor: n|tokei ptl:case|ga v|ar-PRES v:cop|de&POL-INT .

*MOT: eki ni tokei ga aru no .

%mor: n|eki ptl:case|ni n|tokei ptl:case|ga v|ar-PRES ptl:fina|no .

*MOT: a sou [/] sou .

%mor: co|a co|sou

*MOT: Taatyan mo mottekuru no .

%mor: n:prop|Taatyan ptl:tori|mo v|mot-tekur-PRES ptl:fina|no .

*MOT: Taatyan mo motten no ne .

%mor: n:prop|Taatyan ptl:tori|mo v|mot-teir:cont-PRES:cont

ptl:fina|no ptl:fina|ne .

*MOT: ii no yo mottekonakute mo .

%mor: adj|adj|i-PRES ptl:fina|no ptl:fina|yo

v|mot-tekur-NEG-INF ptl:tori|mo .

*MOT: sou onazi nano .

%mor: co|sou adj:va|onazi-PRES v:cop|da&PRES ptl:fina|no .

*MOT: souyuu no ne .

%mor: demo:adj|souyuu ptl:case|no ptl:fina|ne .

*TAR: kore kuryuma [: kuruma] nai ne .

%mor: demo:n|kore n|kuruma v|ar-NEG-PRES ptl:fina|ne .

*MOT: a kore kuruma nai no .

%mor: co|a demo:n|kore n|kuruma v|ar-NEG-PRES ptl:fina|no .

*TAR: un .

%mor: co|un .

*MOT: zya Taatyan 0ga totta n zyanai .

%mor: conj|zya n:prop|Taatyan v|tor-PAST ptl:case|n v:cop|de&wa-NEG-PRES .

*MOT: dokka 0ni mottekitegoran .

%mor: demo:n:indef|dokka v|mot-tekur-tegoran-INF .

*MOT: kuruma 0o tuketageru .

以上、いろいろなタイプの JCHATファイルをみてきた。研究者が、それぞれ自分の研究の目的や好みにあ

わせて、どの程度複雑なフォーマットにするか、どういうタイプのファイルにするか決めてほしい。

参考文献

1. Brown, R. (1973) A �rst language: The early stages. Cambridge, MA: Harvard University.

2. 大久保愛 (1982) 2歳のことばの記録: 幼児のことば資料 (4). 秀英出版.

後書き

本原稿について、宮田 Susanneさん (愛知淑徳短期大学)、大野清幸さん (愛知淑徳短期大学)、南

雅彦さん (ハーバード大学)、中則夫さん (大阪学院大学)、森川尋美さん (カンザス大学)から、貴

重なコメントをいただきました。記して感謝いたします。

125

Page 150: JChatman
Page 151: JChatman

第15章 JCHAT記号一覧表

宮田Susanne・中則夫この章では、CHAT および、JCHATで使用される記号の一覧をまとめてある。データの入力に際して、ど

のような記号を用いるかについて不明な点が出てきたときには、以下の一覧の中から対応する記号を発見する

とよい。また、特定の記号がどんな意味をもつのかを手軽に調べることができるので便利である。なお、本章

の説明だけでは特定の記号の概要全体を知ることはできないので、記号の使用に際しては必ず本文を参照して

記号の説明を熟読すること。もし、以上の手続きを怠ると、記号を誤って使用する可能性があるので注意が必

要である。

1.ファイルに不可欠なファイルヘッダー (obligatory headers) | 第 4.1節

@Begin ファイルの初まり

@Participants: ファイルに登場する人物

@End ファイルの終わり

2.ファイル内で変更されないファイルヘッダー (constant headers) | 第 4.2節

@Age of XXX: 登場する人物の年齢

@Birth of XXX: 登場する人物の生年月日

@Coding: 使用した JCHAT のバージョン、ローマ字表記法

@Coder: データを入力した人の名前

@Educ of XXX: 登場する人物の教育水準 (年数)

@Filename: ファイルの名前

@ID: STATFREQによる分析で用いられるコード

@Language: ファイル内で使用されている第一言語

@Language of XXX: 登場する特定の人物の第一言語

@SES of XXX: 登場する人物の社会的地位、経済的な状態

@Sex of XXX: 登場する人物の性別

@Warning: ファイルの持つ欠点、特徴、注意点など

3.ファイル内で変更可能なファイルヘッダー (changeable headers) | 第 4.3節

@Activities: 特定の場面に関する状況や行動の説明

@Bg と @Bg: gemの始まり (GEM 用記号)

@Bck: 背景的な情報

@Comment: 注釈

@Date: 収録した日付

@Eg と @Eg: gem の終わり (GEM 用記号)

@G: gem(GEM 用記号)

@Location: 発話が行われた場所の地理的情報

@New Episode: 場面の切り替わりの明示

127

Page 152: JChatman

第 15章 JCHAT記号一覧表

@Room Layout: 部屋の構造、家具の配置など

@Situation: 会話のまとまった部分に関する状況や行動の説明

@Tape Location: テープ番号、面、カウンター数など

@Time Duration: 収録の開始時刻と終了時刻

@Time Start: 収録開始時刻の再設定 (リセット)、%tim行と併用

4.語に用いる記号 | 第 6.1節{第 6.5節

@ 汎用の特別形記号

@b なん語

@c 子どもが作った語

@d 方言

@f 家族内だけで用いられる語

@i 間投詞、インタラクション用語

@l 文字

@lh ひらがな (JCHAT)

@lk カタカナ (JCHAT)

@lc 漢字 (JCHAT)

@lr ローマ字 (JCHAT)

@n 新造語

@o 擬音語、擬声語

@p 音声的に安定している意味不明語

@pr 固定的な繰り返し

@s 第二言語

@sl 手話

@sas 手話と発話の併用

@t 実験用の仮想語

@u UNIBET

@x 排除する単語

xxx 聞き取れない語、CLAN の計算から除外

xx 聞き取れない語、CLAN の計算に含まれる

yyy 聞き取りにくい語、%pho行と併用、

CLAN の計算に含まれる

yy 聞き取りにくい語、%pho 行と併用、

CLAN の計算から除外

www 表記したくない、あるいはできない発話で、

重要性が低いもの

0 発話を伴わない行動、非言語的発話

& どもったり、言い間違って語になっていない

断片的な音声

[?] 完全に聞き取れなくて疑問が残る場合に使用する

推定記号

( ) 語の省略部分の補ったもの

= 同音異義語の区別(JCHAT)

0word [ゼロ] 脱落または、省略された語

0*word [ゼロ] 脱落または、省略された語、

128

Page 153: JChatman

非文法的な誤用に限る

00word [ゼロ] エリプシス: 脱落または、省略された語、

文法的なものに限る

5. 形態素分析に用いる記号 | 第 7.2節

- 接尾語

# 接頭語

+ 複合語、または機械的に記憶された表現など

& 語幹と接尾語の融合形

-0 省略された形態素

-0* 省略された形態素、非文法的なものに限る

6. 発話の終わりを示す終端記号、イントネーション記号 | 第 8.1節{8.4節

. 終止符、ピリオド

? 疑問符

! 感嘆符

-? 上昇型イントネーション

-. 下降型イントネーション

-'. 上昇下降型イントネーション

-,. 下降上昇型イントネーション

-, 平板型イントネーション

-_ 低い平板型イントネーション

, 呼びかけ (JCHAT)、または特殊な統語的区切れ

,, ディスロケーション (JCHAT)、付加疑問文

# 休止、ポーズ

-: 先行する語を伸ばして発話

7. 特殊な発話の終わりを示す記号、および連結記号など | 第 8.5節{8.6節

+... 自然に中断した発話

+/. 他者の割り込みによって中断した発話

+//. 自分自身で中断した発話

+/? 他者の割り込みによる中断した発話 (疑問文の場合)

+//? 自分自身で中断した発話 (疑問文の場合)

+"/. 次行に引用文があることを明示

+". 前行に引用文があることを明示

" 引用文が次に来ることを明示

+^ 他者の文に続いてすぐ発話

+, 自分の中断した発話を完成

++ 他者の中断した発話を完成

8. 語内の韻律 | 第 9章

/ 強勢

// 核強勢

129

Page 154: JChatman

第 15章 JCHAT記号一覧表

/// 対照強勢

: 音節の長音化

:: 音節間の休止、ポーズ

^ ブロッキング(吃り)

9. スコープ記号 | 第 10章

[=! text] 非言語的データ

[!] 強調

[!!] 対照強調

["] 引用

[= text] 説明

[: text] 置き換え

[0 text] 省略

[:=x text] 翻訳

[=? text] 他の転写可能性

[%xxx: text] メイン・ラインでのディペンデントティア表示

[% text] メイン・ラインでのコメント表示

[$text] メイン・ラインでのコード表示

[?] 推定

[>] 次行に同時発話

[<] 前行に同時発話

[<>] 前後の行に同時発話

[>number] 次行に同時発話(番号付)

[<number] 前行に同時発話(番号付)

[/] 繰り返し

[//] 部分的な言い直し

[/-] 完全な言い直し

[*] 誤用 (エラー・コーディング用)

[+ text] 一般ポストコード

10.ディペンデントティア | 第 11.2節

%act: 話し手の行動

%add: 話しかける相手

%alt: 他の転写可能性

%cod: 多目的コード

%com: コメント

%eng: 英語訳

%err: スピーチエラー

%exp: 説明

%fac: 表情

%flo: 記号を取り去った発話

%gls: グロス

%gpx: 身振りなどの情報

%int: イントネーション

130

Page 155: JChatman

%jpn: 仮名漢字表記

%lan: 使用言語

%mod: 音韻形式のモデル

%mor: 形態素分析

%par: 非言語的発声現象

%pho: 音韻的現象

%sit: 場面情報

%spa: スピーチアクトコード

%syn: 統語構造

%tim: タイムコード

11.ディペンデントティア用記号 | 第 11.4節

/.../ 音声表記用デリミター

<bef> メイン・ラインの発話の直前に起こったこと

<aft> メイン・ラインの発話の直後に起こったこと

<$=N> ディペンデントティアが、次の n 数の発話にも

当てはまる場合

12.エラーコーディング | 第 13章

$= 誤用の元となった原型 (%err行)

= 誤用形と、その正用形の間に置く

; 複数のエラーの仕切り (%err 行)

13. %mor行での形態素コーディング

| 品詞の次に置く

& 融合形 (%mor行)

+(Plus) 複合形 (%mor行)

-(Dash) 接尾語 (%mor行)

: 素性融合 (%mor行)

~(Tilde) 接辞 (%mor行)

0 省略

0* 省略、非文法的なものに限る

131

Page 156: JChatman
Page 157: JChatman

第16章 CLANエディターによる入力

大嶋百合子

16.1 はじめに

CHILDESのエディターである CLANエディターには、発話データの入力、編集のためのエディター・モー

ド、トランスクリプトをコーディングするためのコーダー・モード、MORプログラムで作り出された%morラ

インの解析結果のあいまい性を除く候補選択モード、発話の音声ファイルを扱うソニック・モード等がある (詳

しくは、マニュアルの第 19章を参照)。また、日本語の仮名や漢字のように ASCII以外の文字を使って入力

する場合でも、Macintoshの他、Windowsを OSとするコンピュータ上でも可能になってきた。この章では、

CLANのエディターモードを使用した入力方法を解説する。初心者には、Macintoshのほうが使いやすいので、

Macintoshを使用した場合を解説する。CLANのエディターは、CHATのデータファイルの入力用に開発され

たため、CHATのフォーマットが既にセットされているので、初心者でも、簡単に入力できる。また、ASCII

エディターなので、入力した後 ASCII変換する必要がない。

16.2 データの入力

CLANエディターへの入り方は簡単である。CHILDESのディレクトリー (フォルダーともいう)の中に、

CLANプログラムと CLANが収められているとしよう。まず、マウスで CHILDESのディレクトリーに矢印

を持っていって、ダブルクリックして、CHILDESのディレクトリーを開く。次に、その中の CLANにマウス

(矢印で示される)を持っていってダブルクリックすると、CLANに入ることができる。起動後、new�le.chaと

いう名称のウィンドウ画面が開き、スクリーンの下に CLAN[E] [CHAT] 1が表示されたら、入力を始めること

ができる。この画面が起動時に出ないときには、Fileメニューから Newを選び新規ファイルをオープンする。

Macintosh の場合には、Commandキーを押しながら nキーを押しても、またWindowsの場合には、Control

キーを押しながら nキーを押しても同様である。CLAN[E]は、CLANのエディターモードにいるということ、

[CHAT]は、CHATファイル様式を使用していることを示している。最後の数字は現在カーソルの位置してい

る行番号を示している。入力を始めると行番号が順に増えて行くのがわかる。ウィンドウ上部にあるタイトル

バーに表示される newfile.chaは、新しい CHATファイルを入力していることを示している。新しく入力し

たファイルを保存すると、保存の時に指定したファイル名に変わる (16.4節「保存と終了」で説明する)。

@Begin

@Participants: CHI Taroo Target_Child, MOT Hanako Mother

@Filename: tars211.cha

*MOT: ja, Taroochan, kore wa ano omocha no hako ni irete

ne,, barabara ni natchau kara

%tim: 00:00:00

*CHI: ima ?

*MOT: soo yo .

*MOT: issho ni yaroo .

133

Page 158: JChatman

第 16章 CLANエディターによる入力

%act: omocha o hako ni irehajimeru

*CHI: un ii yo .

%gaz: MOT

*CHI: aQ atta !

%gpx: yuka ni ochiteiru omocha o yubisasu

*CHI: 0.

%act: sore o hirou

*MOT: aa yokatta .

%gaz: CHI

*CHI: kore de asonde mo ii ?

%gpx: torampu no hako o yubisasu

*MOT: ii wa yo .

*MOT: demo nakusanai yooni ne .

%act: torampu o hako kara dashite CHI ni watasu

%tim: 00:01:45

@End

それでは、この発話データを CLANエディターを使って入力してみよう。CLAN エディターの使い方をマ

スターするには、実際に使ってみて体で覚えるのが一番よい。以下の手順にしたがって、実際に CLANを操作

してみよう。ローマ字表記は、ここでは、ヘボンを使用しているが、訓令でも構わない。ただし、どちらか一

つの表記を一貫して使わなければいけない (ローマ字表記については第 3章を参照)。

カーソルは今、スクリーンの一番左上に位置しているとしよう。

1. @Begin を打ち、リターン・キーを押す。リターン・キーを押すと、カーソルは自動的にインデントされ

た位置に来る。このまま次のヘッダーを打ち込んでみよう。

2. @Participants:

このヘッダーは自動的にスクリーンの左端に来ているはずである。

3.タブキーを一度押し、登場者を入力してみよう。

4. CHI Taroo Target_Child, MOT Hanako Mother

5.入力が終わったら、リターン・キーを押そう。次にファイル名を打ち込む。

6. @Filename:

7.タブキーを一度押し、ファイル名を入力する。

8. tars212.cha

 このファイル名は、以下のような情報を組いれて命名されている。

(a)最初の 3文字は子どもの名前の頭から 3文字 (Tar-oo)

(b)続いて子どもの苗字の頭文字 (S-uzuki)

(c)子どもの年齢 (21ヵ月)

(d)セッションナンバー (第 2セッション)

(e)エクステンション (CHATファイル)

もちろん、ファイル名は自由であり、このような形で命名する必要はない。

9.入力が終わったら、リターン・キーを押す。

次にメイン・ラインを打ち込む。

10. *MOT:を打ち、タブ・キーを一度押す。そして次の発話を続けて打つ。

ja, Taroochan, kore wa ano omocha no hako ni irete

ne,, barabara ni natchau kara .

このように長い発話でも、CLANエディターが、自動的にインデントしてくれるので、一気に最後まで入

134

Page 159: JChatman

16.3. スピーカーコードの登録と短文登録:マクロ作成

力することができる。

11. 入力が終わったら、リターン・キーを押す。

一つのティアが終了したときには必ずリターン・キーを押すこと、メイン・ライン記号* 、ディペンデン

ト・ティアー記号 % 、ヘッダーライン記号@の後に、それぞれのコードとコロン : を打ち、その後は必ず

タブを押し、それからテキストを打つことに注意。

それでは入力を続けよう。

12. %tim: 00:00:00

*CHI: ima ?

*MOT: soo yo .

*MOT: issho ni yaroo .

%act: omocha o hako ni irehajimeru

*CHI: un ii yo .

%gaz: MOT

補足 エディター・モードでは、リターン・キーを押すと自動的に発話を入力する最初のポジションにカーソル

が動き、スクリーンの左端には戻らない。これによってインデント (段を付けること)の操作をいちいち気にせ

ずに 2 行以上に渡るような長い発話をそのまま一気に最後までタイプすることができる。しかも、ファイル・

ヘッダー記号@、スピーカー・ティア記号* 、ディペンデント・ティア記号 % を打つと、カーソルは自動的に

左端まで戻るので、そのまま打ち続けられる。

16.3 スピーカーコードの登録と短文登録:マクロ作成

データ入力の際、頻繁に使われるスピーカー・コードやディペンデントティア・コードをあらかじめ登録し

コード・ナンバーを使って簡単に呼び出すことができる。方法 1は、スピーカー・コードだけ登録する場合、

方法 2は、スピーカー・コードでもディペンデントティア・コードでも短文なら何でも登録できる。

16.3.1 方法 1:スピーカーコードの登録

スピーカー・コードを登録するには、以下のような登場者のヘッダーラインが、入力されていることが必要

である。

1. @Participants: CHI Taroo Target_Child, MOT Hanako Mother

これは先程すでに入力したので、このヘッダーラインのスピーカー・コードを登録するには、以下の操作

を行えばよい。

2. マウスを使って矢印をスクリーン上の Tiersに持って行き、マウスのボタンを押したまま下の Updateま

で下がる。

3. Updateまで来たらマウスのボタンから指を離す。

これでスピーカー・コードが登録された。確認したいときはマウスを使って登録した時と同ようにして Tiers

の下のボックスの中を見る。*CHI: @ 1

MOT: @ 2

が見えるはずである (注: ここで @は Commandキー、つまり Appleのマークが刻印されたキーを表すものと

する)。

*CHI:を呼び出すときには Commandキーを押したまま 1を、*MOT:は Commandキーを押したまま 2を

押す。マクロは自動的に現在カーソルの位置している行の 1つ下の行の左端に現われるはずである。

135

Page 160: JChatman

第 16章 CLANエディターによる入力

この方法で、スピーカー・コードを一度登録するとアップデート操作を再度行うまで登録されたスピーカー・

コードとその呼び出しコードは変わらない。同じデータを何日にも渡って入力したり編集したりする時はとて

も便利なので、ぜひ利用しよう。

16.3.2 方法 2:マクロ短文登録

この方法では、スピーカー・コードだけでなく、何でも登録することができるが、残念ながら一度そのファ

イルを保存して CLANを出てしまうと登録したマクロも消去されてしまう。したがって、一度ファイルを出た

後同じデータを続けて入力したり、編集する時には新たに登録をしなければならない。

それでは %act: のマクロを作ってみよう。

1.まず、半角文字入力ができる状態になっていることをし、ESCキーを押してから、n(文字)キーを押す。

2.すると、ダイアログボックスが現われる。まずMacro Numberに数字 0をタイプする。

3.次に、%act: をタイプする。

4.タブ・キーを一度押して、リターン・キーを押す。

5.以上の設定が終わったら、OKボタンを押す。

残念ながらこの方法では実際に呼び出すまでコードを確認することができない。したがって、何番に何を登録

したか覚えていなければならない。それでは下の項目を登録してみよう。全部で 10項目登録できるが、ここ

では、0から 6まで 7項目登録してみよう。コロンの後の TAB は、コロンの後、タブ・キーを押すという意

味である。こうしておけば、タブまでマクロに登録されることになるので、入力する時にいちいちタブをおさ

なくてよいので、手間が省ける。

Number Macro

0 %act: TAB

1 %add: TAB

2 %gaz: TAB

3 %gpx: TAB

4 %tim: TAB

5 CHI

6 MOT

マクロの呼び出し方

1. CTRLキーを押してから w(文字)のキーを押す。

2. スクリーン下に string number:が、現われたら、数字 0をタイプする。すると、%act:がテキストに現

われるはずである。

マクロは現在カーソルの位置している場所に現われるので、新しいティアを作る場合は、呼び出す前にリ

ターン・キーを押しておく必要がある。

それでは、方法 1と方法 2で登録したマクロを使って続きをタイプしてみよう。

*CHI: aQ atta !

%gpx: yuka ni ochiteiru omocha o yubisasu

*CHI: 0.

%act: sore o hirou

*MOT: aa yokatta .

%gaz: CHI

*CHI: kore de asonde mo ii ?

136

Page 161: JChatman

16.4. 保存と終了

%gpx: torampu no hako o yubisasu

*MOT: ii wa yo .

*MOT: demo nakusanai yooni ne .

%act: torampu o hako kara dashite CHI ni watasu

%tim: 00:05:45

@End

16.4 保存と終了

作ったファイルを保存するためには、次の操作をすればよい。

1. マウスで矢印をスクリーンの上の File にもって行く。

2. クリック・ボタンを押したまま下に下がり、save as の位置でクリック・ボタンから指を離す。

3. new�le.cha というファイル名を tars212.cha に直して打ち込む。

4. スクリーンに現われたボックスの中の save/保存の位置でクリックする。

5. スクリーンの下に CLAN[E][CHAT] tars212.cha 24 : File tars212.cha written という文字が出る

はずである。これで保存される。

6. CLANでの作業を終了するためには、Fileに矢印をもって行き、マウスのボタンを押したまま、下に下が

り、Quit の位置でマウスのボタンから指を離す。

16.5 編集

すでに保存したファイルを編集したい時は、次の操作をすればよい。練習のために tars212.cha のファイル

を編集することにしよう。tars212.chaを 2度クリックするとスクリーンに先程入力したデータが現われるはず

だ。方法 1を使ったマクロはまだ登録されているから、*CHI:と*MOT:は、コード @ + 1 と @ + 2 を使って呼

び出すことができるが、方法 2を使ったマクロは消えている。もう一度使いたい時には登録をここでし直さな

ければならないことに注意。

下記のように先程入力したデータを変えてみよう。

1. 8行目の soo yo . を soo yo ima yo . に直す。

2. 12行目の %gaz: MOT を消す。

3. 23行目の %act: torampu o hako kara dashite CHI ni watasu 以降に下記を足す。

*CHI: 0.

%act: torampu o uketoru

4. 保存

このとき save asではなく、saveを選択する。これで編集したものが以前のものと入れ替わるはずである。

16.6 作業ディレクトリー (フォルダー)の作り方

上記のようにして入力した様々なデータを dataという作業ディレクトリー (フォルダー)の中に収め、整理

しておくと、CLANで分析する時に、分析結果を、自動的に「データ」ディレクトリーに保存することができ

るので非常に便利である。

作業ディレクトリーの作り方は、簡単だ。CHILDESを開くと、スクリーンに CLAN、tars212.chaが見え

る。このままの状態で、

137

Page 162: JChatman

第 16章 CLANエディターによる入力

1.マウスで矢印をスクリーン上の Fileに持って行き、マウスのボタンを押したまま下に下がり、「New/新規

フォルダー」の所で指を離す。新規フォルダーがスクリーンに現われる。

2.そのフォルダー名の所に、 data を入力し、マウスのボタンを押す。これで新しいデータという作業ディ

レクトリー (フォルダー)ができた。

3.マウスを使って矢印を tars212.cha の上に置き、マウスのボタンを押したまま、今作ったフォルダーの上

に持って行き、指を離す。これで tars212.chaは dataディレクトリーの中に入るはずである。

16.7 CHECKプログラム

データを入力したファイルが正しい CHATの形式、記号を使用しているか検査してくれるのが、CHECKプ

ログラムである。CLANの中で、CHECKプログラムを使用する場合は、ESCキーを押してから l(文字)キー

を押せばよい。すると、CHECKプログラムは、入力ファイルに depファイルに登録済みの CHATのフォー

マットや記号にあてはまらないものがないか検査し始める。あてはまらないものが見つかるとそこで止まって

スクリーンの下にメッセージが出る。その都度、間違いを訂正し CHECKプログラムが文句をいわなくなった

ら、CHECKプログラムの検査をパスしたことになる。

それでは、tar212.chaを CHECKプログラムで検査してみよう。

1. tar212.cha を、二度クリックする。

2. ESCキーを押してから、l(文字)キーを押す。

%gaz: のところで、CHECKプログラムが止まり、間違いのメッセージが出るはずだ。これは、%gaz:とい

うディペンデントティアーが、dep�le.cutファイルに登録されていないからである。dep�le.cutファイルに登

録されていないディペンデントティアーや記号を使用したい場合は、00depadd.cut という追加 depファイル

を作ってそこに登録し、元の depファイルが収められている libディレクトリーに入れればよい (depファイル

や追加 depファイルの詳細は、マニュアルの「CHECKプログラム」の章を参照して欲しい1)。

それでは、追加 depファイルを作って%gaz: を登録してみよう。追加 depファイルは、他の入力ファイルと

同様に CLANを使って作ればよい。

1. CLANをダブルクリックする。

2. %gaz: * と一行目にタイプする。

3.このファイルを 00depadd.cutというファイル名で保存する。

4. CLANの作業を終了し、今、保存した 00depadd.cutを libディレクトリーに入れる。

この後、もう一度、tar212.chaに CHECKプログラムをかけてみて、何も文句をいわれなければ、00depadd.cut

は、正しく libディレクトリーに加えられ、その目的を果たしていることになる。

入力が終わらないうちに、CLANの中で、CHECKプログラムを頻繁に使うと、誤りを最小限におさえるこ

とができる。CHECKプログラムの検査をパスしたら、CLANプログラムを使ってデータの分析をする準備が

できたことになる。CLAN分析プログラムの使い方については、コマンドレファレンスマニュアルを参照して

欲しい。

16.8 仮名ファイルの入力

以上、ローマ字ファイルの入力について解説してきたが、仮名で入力し、ファイルが完成したら、JCHANGE

を利用してローマ字ファイルを ASCIIファイルに変換することができる (JCHANGEについては第 17章を参

照2)。仮名入力の場合も、メイン・ラインの発話内容やディペンデントティアのテキストを、仮名で入力する

1本書では割愛した。2本書では割愛した。

138

Page 163: JChatman

16.8. 仮名ファイルの入力

以外は、ローマ字入力と同じ手順で行えばよい。ただし、CHATの記号や語と語のスペースは、かならず、半

角で入力する必要があるので注意してほしい。また、句読点は使わずに、ピリオドとコンマを使用する (仮名

ファイルの具体例については、第 14章を参照)。

後書き

本原稿について中  則夫さん (大阪学院大学)から、貴重なコメントをいただきました。記して感謝いたし

ます。

139

Page 164: JChatman
Page 165: JChatman

第17章 日本語のスクリプト : 文字体系

寺尾 康

17.1 はじめに

JCHATでは日本語を表記する際の文字として現段階ではローマ字が採用されている。ところが、実際の表記

の場面では、我々は 4種類の文字を組み合わせて使用している。このことは「他にちょっと例をみないほど」(金

田一,1988)とされており、表記に関する日本語の特殊性と呼んでもよいほどの事実であるにもかかわらず、ロー

マ字表記をしている限り JCHATでは現れてこない。国際的なデータ・ベース共有システムである CHILDES

というプロジェクトの目的からすれば、ローマ字表記が優先されるべきであろう。しかし、近い将来漢字仮名

まじり文の JCHAT表記法が加わる予定であるという。そこで、日本語を母語としないメンバーには日常場面

での日本語表記のいわば真の姿を知ってもらうために、本章では現代日本語で使用されている文字の種類と用

法について、歴史的観点も含めながら日本語の文字体系を理解する際の助けとなるような概観をおこなってみ

たい。

ある日の新聞から拾った例から始めよう。

「TOYOTAからセプター、2200ccエンジンを搭載して新登場. . .」

この1行の中だけで、ローマ字、漢字、ひらがな、カタカナという4種類の文字とアラビア数字とが使い分け

られている。4種類も存在すること自体注目してよいことなのだが、さらに興味深いのは、それぞれに使用さ

れる文字の種類は規則的とまではいかなくてもかなり限定されることである。意味と音が同じだからという理

由でこれ以外の文字に置き換えてしまうと何らかの心理的な効果を狙ったのではと勘ぐってしまうほど語、あ

るいは品詞と文字との結びつきが強固であるといえる。例えば、「えんじん」とあれば、はて、子供向きの絵

本だろうか、「シン登場」とあれば、新しいことをよほど強調したいのか、あるいは何かの語呂合わせなのだ

ろうか、と考えてしまう。ただ、置き換えが可能であること自体も単一の文字しか持たない人々からみれば驚

きであろうが。

どうして日本語はこのような使い分けをするようになったのか、というテーマは壮大すぎて本章で深く立ち

入ることはできない。ただ、これまでの研究成果をみると、ひらがな、カタカナの出現からはじまって、一見

したところ関係がないように見えるローマ字の整備まで、日本語がこれほど多様な文字体系を持つようになっ

た起源は漢字の特殊性にあるとしておくのは妥当であるように思われる。次節からはそれぞれの文字の起源と

使用法について簡単にまとめながら、この見方を確認していきたい。

17.2 文字の起源

17.2.1 漢字

漢字は、一つの文字が発音と意味とを合わせ持つ表意文字である。日本との関わりを歴史的にみると 3世紀

あるいは 4世紀に中国から伝えられ、5世紀頃から日本人 (といってもごく限られた人々)に用いられ始め、7

世紀頃定着したとされる。この時代にもたらされた漢字という文字がその後日本に定着したということについ

て、次のことは注意すべきであろう。まず、漢字は日本人が獲得した初めての文字であること。そして、その

141

Page 166: JChatman

第 17章 日本語のスクリプト: 文字体系

文字は圧倒的な文明と文化の優位性を持つ中国からもたらされたこと。さらに、その文字は類型的 (使用人口

ではなく)にみてめずらしい部類にはいる表意文字であったこと。第一の点と第三の点は日本人が中国語の文

字である漢字を日本語の中に取り込んでゆく努力をせざるを得なかったことと関連している。林 (1977)によれ

ば、伝来当初、漢字は中国語の文法とともに用いられる完全な外国語の文字であると同時に唯一の文字であっ

たために、日本人の文字獲得のきっかけは漢字の中に日本語を表記するためのより適した形を見いだすことに

あった。それには二つの方向があり、その時にたどったルートは現在の日本語の表記にも通じている。一つは

漢字を表意文字ではなく、表音文字として扱うもので、その漢字の持つ音だけを借りてきて日本語の表記にあ

てるという方法をとる。もう一つは漢字の持つ意味にそれと対応する日本語をあてるというもので、結果とし

て日本語は漢字に、中国音を日本語化した音読みと日本語の意味を読む訓読みの二つの読み方を持つことにな

る。金田一 (1988)は、ケンとかカンという中国音を持つ「間」をアイダやマと読むのは日本語という外国語で

中国語を読んでいることになり、このような読み方を持つのは世界でも日本だけである、と述べている。第二

の点は日本人が漢字という文字に対して持つ規範性、権威性と言うべきものと関わっている。日本の歴史の中

で、漢字に関する知識をも含めてこの文字を使用できた人の割合はかなり長い間、ひとにぎりといってよい程

であった。ひら仮名を用いることがどんなに普及しても、正式な書面では漢字を用いる方が好ましいという意

識や習慣が残った背景には、この文字が初めてもたらされた時代の両国の文化・文明の隔たりがあるように思

われる。第三の点は表音文字と表意文字を生活の中で同時に使うという日本語表記の複雑さを生み出した源で

あるともとれる。表記の複雑さを避けるために明治期に興ったかな文字化運動やローマ字化運動もここから始

まったという見方ができる点で興味深い。

その後も、日本語と中国語との間の隙間を埋めるような漢字自体の発明や変化 (例えば、国字と呼ばれる日

本独自の漢字の発明や「勝事」→「笑止」(林, 1977)のような意味変化にからくる漢字の変化)を伴いながら

も、また、字体的には簡略化される方向に変化をしながらも、漢字は後発の文字にとって代わられることなく

現在も日本語に定着している。

17.2.2 ひらがな・カタカナ

外国語である漢字を日本語に取り込む方策の一つとして、漢字の持つ音的な部分だけを借りてくる日本語表

記が行われたことは前節でも述べた。その最初の試みは真仮名と呼ばれる文字の中にみることができる。真仮

名は真字 (まな:本当の文字)を借りて用いる仮名 (かりな)という意味で、現存最古の和歌集である万葉集で

多用されたために万葉仮名とも呼ばれる。例えば、「春」は「波流」、「秋」は「阿伎」と書かれる。この文字

はあくまで借りてきた文字で、表意文字である漢字を、意味的な表示にさかれている部分の画数までも含めて

表音的に用いているので、大坪 (1977)も指摘している通り、この文字を用いて長文を記すにはかなりの労力

と時間が必要とされたことが予想される。そこで、真仮名が普及するにしたがって、字体をより簡略なものに

する工夫がなされた。それには草化と省文という二つの方法があり、その結果生じた仮名は略体仮名と呼ばれ

る。まず、草化は真仮名の草書体を簡単な字形に崩すもので、例えば、「安」は「あ」と崩される。また、省

文は真仮名の一部をとって全体に替えるという方法で、例えば、「伊」はへんの部分をとって「イ」と書かれ

る。例をみれば明らかなように、現在使用されている平仮名のほとんどは草化から、片仮名のほとんどは省文

から生まれた略体仮名である。複雑な漢字の字体をより簡略なものに、という同じ動機から始まった二つの仮

名は、誕生当初 (平安初期)は混用されることもあったが (大坪,1977)、平安中期頃から用いられる領域がはっ

きりするようになる。やや大胆に分類すれば、草化仮名は和歌や日記の表記を中心に用いられるようになり、

書き手は女性、字体的には書道の影響から変化に富むという方向に、省文仮名は、漢文訓読の世界を中心に用

いられ、書き手は男性、字体的には一音一字の原則が確立し、早くから現在とほぼ同じ字体が使われていた、

ということになる。

平安期以降は平仮名と片仮名は相対的優位性の地位をかえながら発展してゆくことになるが、現在の日本語

表記において漢字で書かれない部分の多くに用いられる仮名が平仮名になったことの背景として、まず、漢文

の記号にみられるように、片仮名は漢字あるいは漢文を補助するという地位にとどまったのに対し、平仮名は

142

Page 167: JChatman

17.2. 文字の起源

女性という書き手の層を背景に、漢字とは独立した和文表記の文字としての地位を固めたことが考えられる (大

坪,1977; 峰岸,1989)。また、平仮名は日記、散文といった日常に密着した作品の表記に用いられたということ

も優位を得た理由の一つに数えられる。やがて、平仮名で表記された和文の中で表意的文字を用いて意味の差

を示した方がよい部分では漢字が用いられるような状況も出てくるようになり、現代の表記に近いものが生じ

てきたのである。

17.2.3 ローマ字

日本語とローマ字の関わりの起源はキリスト教の布教に訪れた、ポルトガル、イタリアをはじめとするヨー

ロッパからの外国人が日本語の転写を行った 16世紀後半に求めることができる。当初は宣教師たちの便宜のた

めだけに書かれたものであったが、やがて 19世紀にかけて歴史的には日本研究の報告として、言語学的にはそ

の時代の音韻を伝えてくれる資料として重要度を増していった。ただし、つづり方は統一されていたわけでは

なく、転写にあたった人物の母語によって多少の異なりがみられる。日下部 (1977)にはキリシタンのつづり、

オランダ式と蘭学式のつづり、ドイツ式つづり、フランス式つづり、英語式つづりの 5つが取りあげられてい

るが、この中で日本人がローマ字を用いるという点から現在まで残っているのは蘭学式のものと英語式のもの

であり、これらはそのまま、JCHAT の表記でもしばしば話題となる訓令式とヘボン式のつづり方の対立の源

流となっている。この二つのつづり方の流れが一つになりきれなかった背景にある要素を二つあげるならば、

それはいわゆる 50音図への執着と英語という外国語の強い影響力ということになろう。まず、江戸時代後期

から明治初期にかけて日本の知的リーダーたちが頭に描いていたローマ字表記は蘭学者たちが用いた、 50 音

図に沿って各段、各行に同一文字をあてるという方式 (日本式)であった。50音図自体の歴史はたいへん古く、

日本人の精神に根ざしているといってもよいほどなので、これは自然な流れであったと思われる。そこに、明

治時代以降英学が盛んになるにつれて支持を拡大したつづり方が登場する。英学の辞書に広く用いられていた

音声転写に基づいたつづり方で、代表的な辞書の編者 J.C.Hepburnの名をとってヘボン式と呼ばれるものであ

る。この方式は国民にローマ字使用を広めようというローマ字運動を推進しようとした結社が採用したことも

あり、一時的には統一のきざしもみられたが、やがて結社分裂の形で 50音図式回帰の方式が一派を作る勢い

を得ていく。ヘボン式と日本式の違いは音声レベルを重視するヘボン式と 50音図との対応を重視する日本式

という観点からまとめることができる。例えば、前者は音声的に異なる音でなければ文字の上では同じ音とし

て扱うのに対し、後者は音声的に同じ音であっても 50音図の対応を重視する立場からあえてことなる表記を

する方式をとる。(「じ」と「ぢ」の扱いに注目されたい)

このような流れを一本化すべく、1937年、1954年の二度にわたり、内閣訓令の形で修正版のつづり方が提案

されることになる。これは、50音図に基づきながら、音素的な観点から表記体系をまとめようとしたもので、

訓令式の名で呼ばれる。この方式については第 3章で詳しく論じられているのでそちらを参照されたい。

注意すべきはいまだに統一は成し遂げられていないということで、終戦直後の進駐軍への配慮、固有名詞の

表記、外来語の表記等がこれに関わっている。

17.2.4 JCHATのローマ字表記

JCHATでは上記のような日本のローマ字表記の現状を認めた上で、全体的な表記としてはヘボン式を採用

している。このことにより音声レベルでの記述の現実性はよりあがることが期待される。しかし、訓令式表記

の利点にも注目しなければならない。例えば、50音図でいう同じ行の子音部分には同じ文字が用いられるの

で、全体としてよりまとまりがある体系だという見方もあるし、実際問題として JCHATの利用者の多くが関

係しているであろう言語学の論文の日本語表記には訓令式が用いられることが多いという事実がある。そこで、

JCHATでは互換ファイルを作成し、どちらの入力も問題なし、という機械レベルでの柔軟性を備えることで

ローマ字表記問題の解決策を用意した。

ここで、日本語の発話資料のデータベース化に関して、より根本的と思われる問題についてふれておきたい。

143

Page 168: JChatman

第 17章 日本語のスクリプト: 文字体系

表 17.1: 新聞における文字使用率 (林 大,1982より引用)

異なり字数 (%) 延べ字数 (%)

漢字 2,258 (86.8) 462,209 (46.1)

ひらがな 74 ( 2.8) 353,704 (35.3)

カタカナ 79 ( 3.0) 60,791 ( 6.1)

ローマ字 26 ( 1.0) 4,084 ( 0.4)

数字 59 ( 2.3) 13,581 ( 1.4)

その他 105 ( 4.0) 107,185 (10.7)

それは、日本語の発話資料ならば、漢字かな交じり文で表記できないか、という問題である。コンピュータへの

入力にローマ字を用いる必然性があるわけではなく、既にデータベース化されている日本語の発話資料の中に

は綿巻 (1992)の JUPITAのように漢字かな表記を用いているものもある。また、近い将来、漢字仮名まじり文

の JCHAT方式も開発されるという。そこで、ローマ字表記と漢字かな表記の比較を簡単に行ってみると、ま

ず利用者にとって一見したところの読みやすさという点で漢字かな表記は優れている。おそらく、読みとる速

度も漢字が入った方が速いだろう。ただし、これは日本語を母語とする利用者に限られることには注意しなけ

ればならない。普遍性という点ではローマ字表記に軍配が上がる。入力のしやすさではどうだろうか、CHAT

で決められている様々な記号を加えながら入力してゆくことを考えると、ローマ字表記の方が有利であろう。

また、省スペースということを考慮に入れると漢字かな表記はローマ字表記の3分の2の字数ですむという報

告があり (日下部,1977)、ライン内へのおさまりはいいかもしれない。

ただし、漢字かな表記はいわゆる 2バイトコードであり、コンピュータの中でデータとして処理されるとい

う場面ではまだまだ不都合な点がでてくることも予想される。記号としての一貫性、中立性という点を考えて

みると、ローマ字表記ならば、誰が入力しても同じ結果が得られることが予想される。ところが、漢字かな表

記ではどの部分を漢字化するかという組み合わせだけをとっても同じ結果が得られるとは考えにくい。さらに、

子供の発話の中でどの部分を漢字で書けばよりよく内容を伝えられるのか、という問いに関して結論を出すの

は難しいように思われる。ローマ字表記を用いれば、それがよいことかどうかは別として、これらの問題を回

避することができる点でも現段階のローマ字表記使用は妥当だと思われる。

17.3 現代日本語の文字使用

現代日本語では、漢字、ひらがな、カタカナ、ローマ字、数字という 5つの文字の体系が存在している。明

治以来、漢字とかなを交えて文章を書き表すことが一般的になったとされているが、本節では、それらがどれ

くらい、どのように使用されているのかを述べてみたい。まず、量的な側面からみると、表 18.1は共同通信社

が 1971年 7月 15日から 21日までの間に扱った 4252文に使用された文字の延べ字数を示したものである。

新聞に現れた文字に限っているので、この数字が正確に現代日本語の文字使用の姿を伝えているとは必ずし

もいえないが、おおよその傾向は知ることができる。

次にどのような場合にどの種類の文字が使われるのかという原則をみてみよう。原則とことわるのは、現代

日本語では同じ言葉を異なる文字で表記されることが許されているからで、例えば金田一 (1988)では「春が来

た」が最も標準的としながらも、「ハルガキタ」、「はるがきた」「春がきた」、「ハルが来た」も間違いとはいえ

ないとして、日本語表記の多様性の一端を紹介している。標準からはずれた時、あるいは故意に標準からはず

された表記に接した時に読み手が持つ心的態度も興味深い観点ではあるが (吉村,1985を参照)、本節では「春

が来た」とする原則について述べてみたい。

まず、そもそも文字を持たないところに表意文字の漢字が入ってきたことが、我国の文字の起源であること

は前述の通りである。それ以来漢字を日本語に取り込もうとする努力が始まったわけであるが、一貫して漢字

144

Page 169: JChatman

17.4. おわりに

は「正字」であって漢字で表せるものならば漢字を使うという方針が基底に存在する。それらは訓読み、熟字

訓 (熟字の訓読み。例えば、大人 (おとな)、昨日 (きのう))、借訓 (固定した訓読みを同音の別語にあてること。

例えば、助動詞「つる」を「鶴」)、国字 (日本で作られた漢字。例えば、峠、榊)等の工夫にみてとれる。こ

こからいえることは、実質的意味を表す部分には漢字を用いるという原則である。具体的には動詞、形容詞、

形容動詞の語幹部分と名詞は漢字で書かれる。また、日本語にあって中国語にはないために漢字をあてること

が難しい用言の活用部分をはじめとして助詞、助動詞といった形式的、文法的な役割を担う部分はひらがな書

きが標準となる。したがって、「ヨム」は「読む」、「オソロシイ」は「恐ろしい」と漢字に送りがなをつける

形になる。さらに、品詞別にいうと接続詞、副詞、感動詞の類はひらがな書きされるのが普通である。次にカ

タカナ書きされる言葉は圧倒的に外来語が多く、斎賀 (1955)の調査によると和語でカタカナ書きされるのは

「サラサラ」、「ワンワン」といった擬態語・擬声語の類と「イヌ、ヘビ、イネ、イモ」のような動植物名、さら

に「クビ」(解雇の意)のような特殊な意味を持つ言葉、「デタラメ」等の俗語であるという。ローマ字の表記

が普通である場合は NTT、 J リーグといった略語の固有名詞、SONYや SEIKOといったブランド名とも言

うべき固有名詞がその代表である。さらに、頭文字をとった ON砲、字形からくる S 字カーブや Uターンと

いった造語の材料としても用いられる。

以上がごく概略的な原則であるが、ここで注意すべきは文字、あるいは文字政策については各研究者の主張

が色濃くあらわれる点と、原則と社会慣習的な文字使用とが必ずしも一致しないまま複数の表記の候補が定着

している場合がある、という 2 点である。前者に関しては実質-形式の対立にとらわれるよりも、和語、漢語

の区別に敏感になった方が日本語表記の問題が少なくなるという主張がある。例えば、日本語の「あたたかい」

は「温」と「暖」の意味を合わせたものであるから無理に漢字で表すことはないし、「行く」と「行う」は異

なる意味であるのに同じ漢字を用いなければならなくなっている、という根拠があげられている。後者につい

ては、送りがなに関するゆれの問題が一例としてあげられる。動詞の「オコナウ」を「行なう」と送りがなを

つけて書く人でも名詞は「行い」と書くことが起こり得る。送りがなに関する調査では動詞の方が名詞よりも

多くの送りがながつけられる傾向にあるようであるが、とかくゆれの多い送りがなの問題を避けるために用言

は平仮名で書いたらどうか、という主張もある (小泉, 1981,1993)。

17.4 おわりに

本節では、その気になれば、その文字だけを用いてことばのほとんどを表記することができる文字が 4種類

も混在する日本語の表記体系について簡単にまとめてみた。ただ、混在といっても、文字の起源に目を向けて

みると漢字の歴史とも言うべき主流が見えてくる。これを無謀といってよいほどの比喩を用いて単純にまとめ

てしまうと、(固有の文字を持たなかったという意味で)肥沃ではないが素直でくせの無い土壌にまかれた種が

漢字という、ある意味では特殊な表意文字だったために、これが根付き、土になれるまでにたいへんな努力と

工夫が必要になった、そして、そこから訓読み、平仮名、カタカナが生まれ、漢字かな交じりの表記が発達し

ていった、ということになろうか。さらに、ローマ字運動もこうした表記の煩雑さを整理しようとして起こっ

たことを考えると、一見複雑な日本語の表記法をささえる上記の 4種類の文字はすべて漢字が起点になってい

るという単純な見方でとらえることができるように思われる。

文献

1. 大坪併治 (1977) 片仮名・平仮名. 大野・柴田 (編),文字: 岩波講座 日本語 8 (pp.249-287).

2. 大野晋・柴田武 (編) (1977) 文字: 岩波講座 日本語 8. 大修館書店.

3. 金田一春彦 (1988) 日本語: 新版 上・下. 岩波書店.

4. 日下部文夫 (1977) 日本のローマ字. 大野・柴田 (編), 文字: 岩波講座 日本語 8(pp.341-371).

5. 小泉保 (1978) 日本語の正書法. 大修館書店.

6. 小泉保 (1981) 日本の文字政策. 月刊言語,10 (11), 20-27.

145

Page 170: JChatman

第 17章 日本語のスクリプト: 文字体系

7.小泉保 (1993) 日本語教師のための言語学入門. 大修館書店.

8.佐藤喜代治 (1988) 漢字と仮名: 漢字講座 4. 明治書院.

9.中田祝夫他 (編) (1972) 音韻史・文字史: 講座国語史 2. 大修館書店.

10.林 大 (監修) (1982) 図説 日本語. 角川書店.

11.林 史典 (1977) 日本における漢字. 大野・柴田 (編), 文字: 岩波講座 日本語 8(pp.159-194).

12.吉村弓子 (1985) 語表記意識の変異. 言語学論叢, 4, 82-93. 筑波大学.

13.綿巻 徹 (1992) 日本語MLU計算のための発話分割ガイド : (未公刊). 発達障害研究所.

146

Page 171: JChatman

第18章 CHILDESのデータベース

小椋たみ子CHILDESは種々の言語の巨大なデータベースを保有している。研究者が詳細な理論的予測を検証するのに、

沢山の自然なサンプルを必要とする。本来は新しいデータを収集して検証するのが望ましいが、そのために数

年を必要とすることもある。また少数の代表的でないサンプルでは誤った結論を導くこともある。このような

場合 CHILDESのデータベースを用いると、研究者はいろいろな仮説を検証するために用いることができる

沢山の研究プロジェクトからのデータにアクセスできる。CHILDESデータベースは広い範囲の年齢、場面の

種々の言語のサンプルを含んでいる。半分以上は英語圏からのデータであるが、英語圏でないデータもある。

多くは CHATの標準形式で入力されている。現在、入力データの統語的正確さのチェックの作業を行っている。

データベースの全サイズは約 4万文字 (90 メガバイト) である。コーパスは 6つの主なディレクトリーに分か

れている。CHAT形式での英語データ、nonCHAT形式での英語データ、英語以外のデータ、物語データ、本

からのデータ、言語障害のデータ、二言語獲得からのデータである。

ここでは MacWhinney(1995)に紹介されているデータベースを英語データベース、英語以外のデータベー

ス、物語データベース、nonCHAT形式での英語データベース、言語障害データベース、二言語データベース

の順にデータの内容について紹介する。内容については A.データの収集時期、B.被験児の人数、年齢、C.被

験児の特徴、階層等、D.データの収集方法、E.収集場面の内容、収集時間、転写時間等 、F.その他 (入力形式

など)を表形式で記載した。MacWhinney(1995)に紹介のない項は記載していない。またこれらのデータベー

スを利用する際には、データを公開した各研究者の文献を引用する義務がある。これらの文献を各表の引用す

べき文献の欄に記載し、その詳細を文献リストに示した。

147

Page 172: JChatman

第 18章 CHILDESのデータベース

表 19.1 英語データベース

提供者/データベー

ス名

A:収集時期, B:被験児の人数,年齢, C: 被験児の階層等

D:収集方法, E:場面の内容, 収集・転写時間等, F:その

他。 年齢で X;Y.Zは X歳 Yカ月 Z日を示す

引用すべき文献

Bates A: 1978{1980, B:完全データ 27児 (男児 13名、女児 14

名) 0;10,1;1,1;8,2;4, C:コーカサス系の中流、中流上 D:

縦断観察・家庭と実験室, E:母子の自由遊び,絵本,おや

Bates, Bretherton,& Sny-

der (1988)

Bernstein{

Ratner

A:1979{1980, B:9組の母子・開始時 1;1{1;9, C:母親は

短大卒、父親はホワイトカラー, D:実験室・4{5ヶ月間

隔の 3回の縦断観察 E: 45分間の一定の玩具での母子遊

び, F:詳細な UNIBET でのトランスクリプション

Bernstein (1982);

Bernstein{Ratner (1984a;

1984b; 1985; 1986; 1987),

Bernstein{Ratner & Pye

(1984)

Bloom B:1児 (Allison)・1;4.21{2;10で 6時期, C:母親はBloom,

D:縦断観察・実験室, E:40分間の玩具での母子遊びとオ

ヤツ

Bloom (1973)

Bloom A:1960後半 1973 (Peterは 19971{1973), B:4児 (Peter

のデータが主)・1;9.7{3;1.21で 20 時期 C:Peter (中流

上), D:縦断観察

Bloom (1970)

Bohannon A:1976{1977, B:2児 (Nat,Baxter)と母親、10{17名の

学生 Nat (2;8,3;0)、Baxter不明, C:Natは父親が大学

教官、Baxterは不明 , D:家庭, E: 約 15 分間の学生と

の遊び

Bohannon & Marquis

(1977); Stine & Bohannon

(1983)

Braine B:8児の 12ファイル, G:子供の発話のみ入力 Braine (1976)

Brown A:1962{1966, B:3児 (Adam,Eve,Sarah)。Adamは 55

ファイル、Eve は 20 ファイル、Sarah は 139 ファイ

ル・Adam (2;3{4;10), Eve (1; 6{2;3), Sarah (2;3{5;1),

C:Adamの両親は牧師と教師で中流、Eveは大学院生、

Sarahは労働者層 D:縦断観察・家庭, E:主に母親との自

発的会話、少なくとも月 1回、2時間, F:minCHATに

対応, Adamと Eve は 5つの発話行為をコード

Brown (1973)

Carterette &

Jones

B:1年 54名、3年 48名 5年 48名、大人 24名, C:中流

D:横断研究・実験室, E:3児が実験者と円く座り、実験

者がウオーミングアップ後、自由に話す, F:Unibetでの

転写

Carterette & Jones (1974)

Clark A:1976{1977, B:1 児 (Shem)の 40ファイル・2;2.16{

3;2.2, C:中上流階級, D:縦断観察・家庭, E:1週間間隔で

1時間, F:トランスクリプションは反復、躊躇、後戻り

に注意。発音は修正されて入力

Clark (1978a); Clark

(1978b); Clark (1982a);

Clark (1982b)

148

Page 173: JChatman

提供者/データベー

ス名

A:収集時期, B:被験児の人数,年齢, C: 被験児の階層等

D:収集方法, E:場面の内容, 収集・転写時間等, F:その

他。 年齢で X;Y.Zは X歳 Yカ月 Z日を示す

引用すべき文献

Demetras{

Trevor

B:1 児 (Trevor)の 27ファイル・2;0.27{3;11.27, D:縦

断観察・家庭, E:父親との一定の玩具での自由遊びでの

20分間の父親との会話, F.オーディオ,ビデオテープ記

録の利用が可

Demetras (1989a); Deme-

tras (1989b)

Demetras{

WorkPar

B:3児と両親・2;2,1児は 2;4, 2;6, 2;9の資料もあり, C:

保育所児, D:横断観察、縦断観察 E:20分間の玩具での

遊び, F.オーディオ,ビデオテープ記録の利用が可

Demetras (1989a); Deme-

tras (1989b)

Evans B:小学校 1年生 16組, E:室内遊びのほぼ真ん中の 10分

Fawcett A:1978{1984, B:92 児の 184ファイル・6;0, 8;0, 10;0,

12;0 D:横断観察, E:他 2児との遊びと、好きな遊びか、

TV番組についての大人との面接のはじめの 10分間

Fawcett & Perkins (1980)

Fletcher B:英国児 72名・3;0, 5;0, 7;0, D:横断観察・保育所、学

校, E:ゲーム、自由会話、物語場面での女性の大人との

45分間の面接

Fletcher & Garman

(1988); Johnson (1986)

Garvey B:16 の 3 人組の 48 ファイル・2;10{5;7, D:横断観察,

E:3人組の 2児づつの会話

Garvey & Hogan (1973)

Gathercole B:各月齢 4児の 17ファイル・2;9{6;6, D:横断観察, E:3

人組の 2児づつの会話

Gathercole (1980)

Gathercole{

Bnurns

B:3, 4, 5歳児各 4名, D:横断研究

Gleason A:1976{1979, B:24 名 (男児、女児各 12 名)・2;1{5;2,

C:中流, D:横断観察・実験室・家庭, E:母親との 30分間

の車、絵本、お店遊び。父親との 30分間の車、絵本、お

店遊び。母親、父親との夕食

Bellinger & Gleason

(1982); Gleason (1980);

Gleason & Grief (1983);

Gleason, Perlmann &

Grief (1984); Grief &

Gleason (1980); Masur &

Gleason (1980); Menn &

Gleason (1986)

Haggerty small A:1905, B:1903年生まれの 1児・2歳半, D:

家庭, E:朝 7時の起床時から夜 7時 30分までの 9

時間 30分間の発話記録 (就寝時、昼寝除く)

Haggerty (1929)

Hall B:39名・4;6{5;0, C:黒人{白人×中流-労働者, D:横断観

察・家庭、学校、通学途中, E:2日にわたり各 2時間半の

自然な会話 (朝登校前、学校からの帰宅時, 夕食前、夕

食時に各日 15 分間の録音), F:純粋な CHAT 形式では

入力されていない

Hall,Nagy & Linn (1984);

Hall,Nagy & Nottenburg

(1981); Hall & Tirre

(1979)

149

Page 174: JChatman

第 18章 CHILDESのデータベース

提供者/データベー

ス名

A:収集時期, B:被験児の人数,年齢, C: 被験児の階層等

D:収集方法, E:場面の内容, 収集・転写時間等, F:その

他。 年齢で X;Y.Zは X歳 Yカ月 Z日を示す

引用すべき文献

Higginson A:1983{1984, B:3児 (APR, MAY, JUN 女児)・APR

(1;10{2;11), MAY (0;11), JUN (1;3{1;9), C:両親は学

生、院生, D:縦断観察・家庭, E:45分間の自然な、構造

化されていない遊び場面, F:すべての子どもの発話が音

声学的に記号化されている

Higginson (1985)

Howe A:1973, B:スコットランドの 16組の母子 (男児9名、女

児 7名)・第 1回目 1;6{1;8, 第 2回目 1;11{2;1, C:中流、

労働者階級, D:家庭, E:40分間の玩具での遊び (20分間

は子どもの玩具で、次の 20分間は一定の玩具で)

Howe (1981)

Korman B:6 組の英国母子・6 週-16 週, C:中流、母親は 20 代、

第 1子, D:縦断観察・家庭, E:2週間間隔で 24時間録音,

母子の自由遊び場面を録画, F.CHAT形式で入力されて

いない

Korman (1984)

Kuczaj A:1973{1975, B:1児の 210ファイル・2;4{4;1,4;1{5;0,

C:Kuczajが親, D:縦断観察、家庭 (日誌研究)2;4{4;1は

毎週 2時間半、4;1{5;0は 1時間半の自発のことば

Kuczaj (1976)

MacWhinney B:2 児 (Mark, Ross)・Rossは 2;6{8;0 , Markは 0;7{

5;6, C:MacWhinneyが父親, D:縦断観察・家庭 (日誌研

究), E:家族のインタラクションの自然な記録, F:ファイ

ルは予備的状態

使用の際引用不要

New England B:52組の母子・1;2,1;8,2;3{2;8の 3回, D:縦断観察・実

験室, E:5分間の種々の玩具での遊び (母親は他の作業)、

子どもに触れるのを禁止した玩具場面、4つの箱の中の

玩具での母との 10分間の遊び。転写は 20{25分間 F.発

話の切れ目はイントネーションによる。語は形態素に分

割。不明瞭な語の音韻形態が%pho列と UNIBET で記

述。14ヶ月児は視線、指さし、頷き等の身振りを%gpx

列に記述。語の省略の表記なし。新造語、家族特有語、

音声一貫形態は区別せず@で記述。

Dale et al. (1989); Snow

(1989)

Peter{Wilson B:1 児 (Seth, 重度の視覚障害児),C:Wilson が父親,

F:1992年に MacWhinneyにより CHAT形式へ。

Wilson & Peters (1988);

Peters (1987)

Post B:3 女児とその家族, 2 児は 1;7,1 児は 1;10から約 9ヶ

月間 (10回), C:フロリダの労働者階級の白人, D:縦断観

察・家庭, E:4週間毎に 60分間の玩具での遊び, F:CHAT

で転写。母親の発話の切れ目は息継ぎによる。

Post (1992); Post (1993)

Sachs A:1969{1974, B:1児 (Naomi)の 93ファイル・1;1{5;1,

C:Sachsが母親, D:縦断観察

Sachs (1983)

Snow A:1979{1980, B:1児 (Nathaniel)の 30ファイル・2;3{

3;9, C:Snowが母親, D:縦断観察

使用の際引用不要

Suppes A:1972{1973, B:1児 (Nina)の 56ファイル・1;11{3;3,

D:縦断観察

Suppes (1973)

150

Page 175: JChatman

提供者/データベー

ス名

A:収集時期, B:被験児の人数,年齢, C: 被験児の階層等

D:収集方法, E:場面の内容, 収集・転写時間等, F:その

他。 年齢で X;Y.Zは X歳 Yカ月 Z日を示す

引用すべき文献

Van Houten B: 31名・2;0, 3;0 (3;2{3;7) 。13名が青年期の母親。26

名は 2歳、3歳の転写あり。4名は 3歳時点の転写がな

いが、2歳時点の転写あり。0;4, 0;8は入力されていな

い。D:家庭, E:2歳;昼食 30分間 (最初の 3分間転写)、

母親の課題教授 3場面各 3分間 (3分間転写)、30分の

自由遊び (3分間転写)3歳;自由遊び場面、子どもが母

親に単純な課題を教授する場面, F:青年期の母親と年長

の母親の母子の相互交渉の相違の研究。母子の発話を構

造的複雑さ (MLU,主要な動詞数)、発話役割、実用機能

でコード化

Van Houten (1986)

Van Kleeck B.37 児・3 歳, C. 人種、社会的階層は統制されていな

い, D:横断観察・実験室, E:2時間半, F:被験児、資料収

集方法についての情報がさらに必要。

Warren{

Leubecker

B:年少群 10名 (1;6{3;1),年長群 10名 (4;6{6;2), C:中

流の白人, D:横断観察・家庭, E:子どもの玩具、本を用

いた母親・父親 (別々)との会話場面最低各 15分間, F:

母親と父親の子どもへの話かけの声の基本周波数の相違

の検討が研究目的

Warren{Leubecker & Bo-

hannon (1984); Warren{

Leubecker (1982)

Wells A:1973{1977, B:1;6 (開始時)-5;0 (3ヶ月間隔で 10回) ,

D:縦断観察・家庭,検査は大学, E:自発会話 (9.am{6p.m.

に約 20分間隔で 90秒持続の 24例)を記録

Wells (1981)

Wisconsin

(Miller & Chap-

man)

B:48児・1;6

151

Page 176: JChatman

第 18章 CHILDESのデータベース

表 19.2 英語以外のデータベース

言語 提供者/デー

タベース名

A:収集時期, B:被験児の人数,年齢, C: 被験児の階層等

D:収集方法, E:場面の内容, 収集・転写時間等, F:その

他。 年齢で X;Y.Zは X歳 Yカ月 Z日を示す

引用すべき文献

ブラジル系

ポルトガル

Scliar{

Cabral

A:1974, B:1児 (1;8.21,1;10.20,2;2.8), C:上中流、父親

は言語学者、母親は心理学者。 一部保育所に参加, D:

縦断観察, E:5{6時間の録音

デンマーク

Plunkett A.1982{1987, B.Anne (0;8.12{6;0、転写は 2;5.15まで

の 39ファイル), Jens (0;11.15{6;0,転写は 2;8.0までの

42ファイル)C.2 児とも両親は大学卒、Jensは一人子、

父親は専門職。保育所に参加, D. 家庭・縦断観察, E.2

週毎に 1時間半録画 (面接、ウズギリス-ハント尺度、

自由遊び), F. 発話は大人の文法構造でなく、ポーズと

イントネーションによる。発話の形態素分割は構音と流

暢性の基準による。

Plunkett (1986);

Plunkett (1985)

オランダ語 Gillis B. Maarten (0;11.15{1;11.28 の 79 ファイル、最初の

65ファイルは CHILDESにはなし), D.家庭・縦断観察,

E.1週間に 2回、1週平均 3時間録音。大人 (主に母親)

との遊び、一人遊び, F.CHATに従い転写、オランダ語

の UNIBETの転写での発音を含む。

Schaerlaekens &

Gillis (1987)

オランダ語 Schaerlaekens A.1969{1970 B.2組の 3つ子 (1;10.18{3;1.7の 13回と

1;8.29{2;10.23 の 12回), C.知能は平均以上、3つ子間

の運動発達差は両組ともなし。D.縦断観察 E.各月に録

画, F. 子どもの両親の言語の転写はない。CHATで記

号化。%mor列に品詞と形態統語特性の記号化がされて

いる。

Gillis & Verhoeven

(1992); Schaer-

laekens (1972);

Schaerlaekens

(1973); Schaer-

laekens & Gillis

(1987)

オランダ語 Utrecht

(Elbers &

Wijnen)

B.1 児 (2;3.22{2;11.22), D. 家庭・縦断観察 E. 毎週母

親が録画。The little giantess の絵本が発話を喚起する

のに使用された。F.CHATの弁別記号使用。

Elbers (1985);

Elbers & Wijnen

(1990); Wijnen

(1988); Wijnen

(1990a); Wijnen

(1992)

オランダ語 Van Kam-

pen

B.2児 (Laura1;9.18{5;10.9; Sarah1;6.16{6;0)。使用可

能なのは Lauraの 1;9.4{2;1.27の 12回, D.家庭・縦断

観察, E.月 1{2回 45分間母親が母親と子どもの日常の

家庭場面を録音。F.%mor,%syn 列は使用していない。

非成人語や理解できない発話は%pho列が用いられた。

Van Kampen

(1994)

152

Page 177: JChatman

言語 提供者/デー

タベース名

A:収集時期, B:被験児の人数,年齢, C: 被験児の階層等

D:収集方法, E:場面の内容, 収集・転写時間等, F:その

他。 年齢で X;Y.Zは X歳 Yカ月 Z日を示す

引用すべき文献

オランダ語 Wijnen B.1児 (Niek2;7{3;10), C.ことばの発達遅い。2;7時点

のMLUは 1.72、構音の代置あり。4;6時点では流暢で

問題なし。D.家庭・縦断観察 E.父親 (Wijnen)が日常

の遊びや絵本場面を 31時間録音, F.信頼性チェックの数

と性質の記載。CHATの弁別記号使用。標準記号以外も

使用。プロソディーを示すのに [=! ]使用。UNIBET

が%pho列に与えられている。

Wijnen (1988); Wi-

jnen (1990b); Wij-

nen (1992)

フランス語 Champaud B.1 児 (Gregoire1;9.18{2;5.27 の 10 ファイル) 現在観

察継続中, C.第 3子。中上流階級。父親大学教授、母親

元フランス語教師。F. c',d',j',l',m',n',qu',s', t',y'の後

にはスペースをいれる。読めない転写を作らないように

%pho列に単語の明確な形態を記す。

フランス語 Leveille A.1971{1972, B.1児 (Philippe)2;1.19{3;3.12の 33ファ

イル, C.30代の学者の両親の一人っ子 D.家庭・縦断観

察 , E.1週間に 1回 Leveilleが訪問し録音。居間にテー

プレコーダー設置

Suppes, Smith, &

Leveille (1973)

フランス語 Rondal B.1児 (Stephane) 2;3{4;9の 120ファイル, C.Rondal

の第一子。1;2{4;3 は米国在住。4;4{4;9はフランス語

圏のベルギーに帰国。3;2{4;3は保育所。家族での言語

は主に仏語, E.母子のインタラクション。場面の記述な

し。 F. 転写と発話分割は Rondal, Bachelet, & Peree

(1985)に従う。MacWhinneyが 1992年に CHAT形式

に変換

Rondal (1985)

ドイツ語 Clahsen B.3児 (Daniel 2;9.28{3;6.28の 10ファイル、Julia 1;11{

21{2;5.28の 7ファイル、Mathias 2;9.7{3;6.28の 10ファ

イル) 上記ファイルはデータの一部 C: Dan., Mat.は二

卵性双生児で出産時に短期の酸素投与を行った。脳性

麻痺があり、ボバース運動療法をうける。53ヶ月時点の

IQは Dan.が 123,Mat.が 128。Jul.は妹で問題なし。

IQ121。父親弁護士で中上流, D:家庭・縦断観察 E. 日

常生活場面。子ども部屋での 45{60 分間の観察。母親

同席。F.Max{Planck{Instituteの Feldweg,H.が 1990

年に CHATに変換。分析は 100発話に基づく

Clahsen (1982)

ドイツ語 Wagner B.13 児 (1;5, 1;8, 2;1, 3;6, 5;4, 8;7, 9;2, 9;6,9;7, 10;7,

11;4, 12;2, 14;10) C:各児の両親の社会的階層の記述あ

り。D:.横断観察 E:各児の収集場面の記述あり。主に日

常生活場面, F:Wagner (1974)に従い転写。被験児の言

語、原言語の転写。被験児に関する対話者の発話の転写

Wagner (1985)

153

Page 178: JChatman

第 18章 CHILDESのデータベース

言語 提供者/デー

タベース名

A:収集時期, B:被験児の人数,年齢, C: 被験児の階層等

D:収集方法, E:場面の内容, 収集・転写時間等, F:その

他。 年齢で X;Y.Zは X歳 Yカ月 Z日を示す

引用すべき文献

ドイツ語 Weissenborn B. 7, 8, 9, 10, 11, 14歳児と大人。各群 6{10の被験児

のペアー, D. 実験, E. 対の各児が同じ街のモデルをも

ち、方向を与える人が、もう一人に車が通る道を示す。

家は中心軸の周りに対称にある。4つの等困難度の道と

3条件 (展示の対称を壊す補助指標・身振り、指標なし・

身振り、指標なし・身振りなし)でのルートの記述。

Weissenborn (1985;

1986)

ドイツ語 Wode B. Wodeの息子 Larsと娘 Inga, D.縦断観察・家庭, E.

毎日の生活場面 (食事、ゲーム、散歩、スポーツを含む)

の記録と録音 F.CHATでの [//]に変更されていない。

Wode (1974; 1977;

1978; 1979; 1980;

1981; 1987); Wode

& Allendor� (1981)

ギリシャ語 B.Spiros (1;9),Maria (2;3, 2;9), Mairi (1;9, 2;3,2;9),

Janna (1;11, 2;5, 2;9)の 4児, C.アテネ在住, F.音韻、

音声について転写。%pho列に音声についての詳細あり。

%mor列に文法コードあり。

ヘブライ語 Ravid B. Ravidの娘 Sivan (1;8{6;10)の 1;11.2{6;11.4の 37

ファイル, C.第一子、母親は言語学者、教育をうけた典

型的な中流階級, D.縦断観察・家庭, E.家での遊びを母

親が録音

ヘブライ語 Na'ama

(提 供 者

Kaplan)

B.Na'ama (1;7.8{2;6.4)の 10ファイル, C.中流階級の

教育をうけた両親の第一子, D.縦断観察・家庭

ヘブライ語 BSF (提供

者 Berman)

B.1;6{1;11群 14児、2;0{2;6群 20児、2;0{2;11群 6児、

3;0{3;11群 27児、4;1{4;11群 25児、5;0{5;11群 17児,

C.中流階級, D. 横断, E. 自然な発話。研究チームのメ

ンバーが録音

Berman & Doromi

(1984); Berman

(1985)

ハンガリー

MacWhinney A.1970{1971, B. 保育所児 5名 Zoli (1;5.2{2;2), Moni

(1;11{2;5), Andi, Gyuri, Eva C.中流階級,両親勤務 C.

保育所D.研究者と子どものインタラクション。子どもは

マイクのついたエプロン着用 F.Zoli, Moni, Andiの統

語パターンの詳細な分析を行った (MacWhinney,1975)

MacWhinney

(1974)

イタリア語 Calambrone B.健常児群 6名 (1;7{3;0で 9{21ファイル)、言語障害

縦断群 3 名 (6;2{9;4, 4;11{6;5, 5;8{6;11), 言語障害横

断群 8 名 (7{11;10), C. 健常群は上-中下階級、言語障

害群は発達性失語、遺伝性染色体異常。言語障害縦断群

は発達性失語で、一語発話段階で、語連鎖は殆ど無し,

D.健常群は家庭。縦断観察, E.健常群は月2回で、1回

30{45分間大人とのインタラクションを録画。言語障害

児群は毎月 30 分間ビデオ録画, F.CHAT 形式で転写。

最初の分析の焦点は健常児と言語障害児の語彙と形態素

の獲得の段階を調べること。

Cipriani et al

(1989)

154

Page 179: JChatman

言語 提供者/デー

タベース名

A:収集時期, B:被験児の人数,年齢, C: 被験児の階層等

D:収集方法, E:場面の内容, 収集・転写時間等, F:その

他。 年齢で X;Y.Zは X歳 Yカ月 Z日を示す

引用すべき文献

イタリア語 Roma (Piz-

zuto)

B.1児 (Francesco,1;4{4;0), C.中流階級、母親はパート

で生科学科学者として勤務。昼間は労働者階級のメード

が世話。2;6{4;0まで午前中は就学前学校。第一子。D.

縦断観察 E.2週毎の訪問で各回 2時間半録音。自発的で

計画なしでの観察。子どもの発話とそれらに関係する大

人の発話と非言語文脈に関する情報の転写。CHAT 形

式でのコーディング%cri列に文脈関連情報を記す。

Antinucci & Parisi

(1973); Antinucci

& Volterra (1978);

Volterra (1972;

1976;1984)

マンビラ語 Mambila A.1990 B.Sondue 家, C.ナイジェリアとカメルーンの

境界に位置。E.Sondue, M.の家での会話の録音 (研究

者は同席しない)。夫、妻とその家族、2人の訪問者, F.

発話分割は Stiles (1992)による。親戚関係と言語の研

Wilson & Zeitlyn

(1995)

ポーランド

Weist B.3児 (Marta 1;7, 1;8, 1;8, 1;9, 1;9, 1;10; Bartosz 1;7,

1;7, 1;8, 1;8, 1;11, 1;11; Kubus (2;1, 2;2, 2;2, 2;4, 2;4,

2;6), C.Poznanの都市の中流階級。親は高学歴, D. 縦

断観察・家庭, E.2人の実験者が訪問, F. 文脈のノート

あり。形態素に記号化されている。

Weist et al

(1984); Weist

& Witkowska{

Stadnik (1986)

ロシア語 Protassova B.1 児 (Varvara), C.父親は本の装丁家、母親は心理言

語学者。一人子。祖父母が週に数日養育。 D.家庭, E.

家庭の通常場面で 90分間録音。

スペイン語 Linaza B.1 児 (Juan) 2;0{4;0 C.Juan は Linazaの息子 D. 家

庭, E.対話者の多くは父親。F.音韻省略を捉える様式で

転写されている。発話や節の切れ目が一貫していない。

MLU等の計算は不適切

スペイン語 Marrero B.6児 (1.8{8;0)。1990年にスタートし、現在 12ファイ

ル。D.縦断観察, F. 研究目的は言語学的分析。可能な

時は正字法で転写。

スペイン語 Montes B.1 児 (1;7.20{2;11.14) の 13 の録音と転写 , C. 第一

子、中流、両親は言語学者、研究対象中はメキシコ在住。

父親の母国語は英語。母親の母国語はスペイン語。D.縦

断観察・家庭 E.日常の遊び場面、生活場面。30{40分間

転写。 F.CHAT形式で転写。2秒以上の発話間のポー

ズがマークされている。

Montes (1987;

1992)

スペイン語 Romero{

Contreras

B.0;6{7;0の各年齢 12 名, C. 両親は 5 年以上メキシコ

に居住し、母国語がスペイン語。D.横断観察・家庭, E.

日常の家族とのインタラクション, F.英語への翻訳はな

い。minCHAT の慣用に従い、必要な所で CHATコー

ドを使用。文脈情報は限られている。必要ならビデオの

コピーが使用可。

Romero,Santos, &

Pellicer (1992)

155

Page 180: JChatman

第 18章 CHILDESのデータベース

言語 提供者/デー

タベース名

A:収集時期, B:被験児の人数,年齢, C: 被験児の階層等

D:収集方法, E:場面の内容, 収集・転写時間等, F:その

他。 年齢で X;Y.Zは X歳 Yカ月 Z日を示す

引用すべき文献

スエーデン

Str�omqvist B.5 児 (Mar. 1;6{6;0.9でファイルは 1;3.19{2;9.29の

28、Eva. 0;1.21{3;9.23、Ant. 1;11.8{2;10.4の 20ファ

イル、Har. 1;6.20{2;11.7の 26ファイル、Thea.は 1;0.2

より観察中) , C. Mar.と Eva.は兄妹、Har.と Thea.は

兄妹。中流階級で家族は標準的なスエーデン語を話す。

D.縦断観察・家庭, E.日常の家庭での活動、自由遊び、

本の読み聞かせ。大人ー子ども、子どもー子どものイン

タラクション, F.形態素で分割。発話はイントネーショ

ンで同定。不明瞭な語形のガイドとして Ant.と Har.に

ついて語彙ファイルを作成。Mar. 1;6.10{2;2.10につい

て聴覚記録を作成。

Plunkett &

Str�omqvist (1992);

Str�omqvist,Richto�,

&Anderson (1993)

タミール語 Narashimhan

Vaidyanathan

B.1児 (Vanitha) 0;9{2;9の 25セッション, C.両親大学

出身、中流、父親技師、母親研究事務官。昼間は他の家

の主婦が養育。父母養育者ともタミール語を話す。20ヶ

月時母子転居、25ヶ時保育所 (英語), D. 縦断観察・家

庭 , E.日常の家庭の養育場面での子どもと両親のインタ

ラクション場面を 2週間毎に録音。2時間研究者が訪問

し、45分間録音。F.音韻学的に転写。発話と文脈の英

訳付きだが、注意して使用の必要。いくつかの補助ファ

イルがこのコーパスについての情報を与えている。

Narasimhan (1981)

トルコ語 Berkeley

(Akus &

Slobin)

B. 2;0{4;8で 4ヶ月間隔で選択。C.両親のどちらかは少な

くとも大学出身で知的職業者。都市在住。D.横断観察・家

庭あるいは就学前学校 , E.認知と言語課題 (Slobin,1982)

を与えられた。大人ー子どもの自発や導かれた会話を転

写。F.子どもの発話はハイフォンで形態素に分割されて

いる。不確かな転写は ( )内に示されている。標準的

な言い方は [ ] 内に示されている。

トルコ語 Frogs

(Akus{

Koc)

E. Frog Story絵本

表 19.3 物語データベース

提供者 B:被験児の年齢、人数等 E:データ収集内容 F:その他 引用すべき文献

Gopnik B: 2;0{5;0の健常児 61名 Gopnik (1989)

Hicks B:小学校 1,2,5年生 (中流の家族)と下層階級 (小 1データ

がコントロール), E: 無声映画の「赤い風船」を 3分間みた

後で実際の出来事の報告、進行中の出来事、装飾された話

を語る。F: CHATで転写し、CLANで分析。物語データ

は節単位 (述部を含む言語発話) で分割し、統語上の制約、

時間的表現/事象の関係、指標となる節の 3つの下位システ

ムの子どもの使用を検討

Hicks (1990)

156

Page 181: JChatman

表 19.4 Non{CHATデータベース

提供者/データベース

B:データの内容 E:収集方法、手続き F:その他 引用すべき文献

CHILDES/BIB B:種々のコンピューター化されていない文献目録。16,000を

こえる論文の要約や図書目録の情報を含んでいる。F:CLAN

の BIBFINDで CHILDES/BIBデータファイルの著者、被

験者、キーワードなど検索ができる。

Higginson &

MacWhinney

(1990) CornellCor-

pus

B:種々の印刷、話し源からのテキストファイル, F:会話の研

究でなく語彙の研究のためにデザインされている。

Hayes (1988)

Issacs B:2;11{7;5 の英国児、上中流と上流 , F:Issacs (1930) の

Intellectual Growth in Young Children と Issacs (1933)

の Social Development in Young Childrenの完全なテキス

トを含む

Issacs (1930)

MacBates B:英語、イタリア語、ハンガリー語圏の 3,4,5 歳児各 10名

と大人各 10名、計各言語 40名、総計 120名。中流階級で

大都市に居住, E:個別実験。9系列の 3枚の絵刺激に対して

簡単な文で記述する。系列で主語は既知を増大させ、動詞

は新奇さが増大する。

MacWhinney &

Bates (1978)

Sterns (Clara and

Wilhelm Stern)

B. ドイツ語のコーパス。3 児 (Hilde:0;00,00{13;00,27,

G�unther:0;00,01{17;07,11, Eva:0;00,18{9;10,28), F:1988

年に手書きのノートからコンピューターファイルに Max

Plank InstitutのWerner Deutchにより入力された。

Stern & Stern

(1907)

Sulzby B:2;4{5;3 の 51 名の保育園児 65 ファイル (面接は 1 回の

子どもと 3ヶ月再面接の子どもあり), E:好きな本について

の子どもとの討論と好きな本についての子どもからの物語,

F:Sulzbyの許可によってのみ使用可

157

Page 182: JChatman

第 18章 CHILDESのデータベース

表 19.5 言語障害のデータベース

提供者/データベー

ス名

B:被験児の人数,年齢, C: 被験児の特徴、階層等D:収集

方法, E:課題、場面の内容等, F:その他

引用すべき文献

Bates (CAP 研

究)

B: 英国、ドイツ、ハンガリーの 60名の 20歳-82歳の失

語症者と健常者 C: 右利き手、左半球損傷のブローカ、

ウエルニッケ失語症、健忘失語 。職業種々、教育年数

(5{18 年), D: 個別実験, E: 9 系列の3枚の絵刺激に対

して簡単な文で答える。系列で主語は既知を増大させ、

動詞は新規さが増大する, F: CHAT形式で入力。形態

素コーディングと誤りコーディング。

Bates, Friederich, &

Wulfeck (1987a;1987b);

Bates, Friederich, Wulfeck

& Juarez (1988); Bates,

Hamby & Zurif (1983);

Bates & Wulfeck (1989a;

1989b); MacWhinney &

Bates (1978)等

Bliss B: 2;3.0{11;8.0の健常児 8 名と 3;0.0{11;8.0の言語障

害児 7名, C: 種々の言語障害 , D: CHAT形式で入力

Bliss (1988)

Conti{Ramsden B. 英国の 4;9{6;9 の言語障害児と MLUでマッチした

1;11{3;2のその弟、妹, C.言語障害児のMLUは Brown

(1973) の段階 I, II で言語理解は測定される側面で子ど

もにより異なる。治療中。母親は中等学校卒で主婦、社

会階層は II{IV, D: 横断観察・家庭 E. 家庭で弟 (妹)、

母との自由遊び 15分間, F:10分間の言語、非言語行動

を CHAT形式で入力

Conti{Ramsden & Dykins

(1989)

Feldman B:1;2{3;0の 4組の双生児 , C: 出産時脳損傷、言語障害

のリスクあり。1組は脳障害を有す, D: 横断観察・家庭

, F:発話行為をコーディング

Keefe, Feldman & Holland

(1989); Feldman,Keefe &

Holland (1989)

Fulsberg B:ダウン症児と自閉症児 , F: Rollins,P.により CHAT

形式へ

Tager{Fulsberg et al.

(1990)

Hargrove B: 3;0{6;0の 6 名の言語障害児, D: 言語治療士と子ど

もの面接場面

Hargrove, Holmberg &

Zeigler (1986)

Holland B:19;0{93;0の 42名の脳溢血後の患者, D:言語治療士と

の会話場面, E:週 6日、1日 15分間の病院訪問。転写は

最初、中間、最終の 3時期の訪問に対して各 5分間。

Holland, Miller,

Reinmuth, Bartlett,

Fromm,Pashek, Stein, &

Swindell (1985)

Hooshyar B:40名の健常児 (平均CA26.75ヶ月)、31名のダウン症

児 (平均 CA64.48ヶ月、3;1{11;6)、21名の言語障害児

(44.84ヶ月)。CHILDESデータはダウン症児のみ , C:

ダウン症児は 30名はトリソミー、1名は転座型。ダウ

ン症児の社会適応年齢は 44.35ヶ月。ダウン症児の母親

の平均年齢は 36歳で、短大-大学卒, D:横断観察・家庭,

E:遊び、お話、食事場面 20分間。遊びとお話のみ転写。

F: 発話行為をコーディング

Hooshyar (1985), Hoosh-

yar (1987)

158

Page 183: JChatman

提供者/データベー

ス名

B:被験児の人数,年齢, C: 被験児の特徴、階層等D:収集

方法, E:課題、場面の内容等, F:その他

引用すべき文献

Leonard B: 3;8{5;7の特殊言語障害児 (SLI)11名。IQは 86{127、

言語発達検査では-1.0から-2.53標準偏差, D: 女性の研

究補助者との会話, E: 玩具、絵本での遊び場面, F: 子ど

もの発話のみ転写。Brownの 14の形態素カテゴリーで

記号化

Rondal B:21 名のダウン症児 (CA3;0{12;2で MLU1.04{3.06)

とMLUでマッチした健常児 (CA1;8{2;8), C:ダウン症

児は全員トリソミー (心臓、感覚障害等を有しない)。両

群とも中流階級、母親の年齢は健常児 28歳、ダウン症

児 42歳 , D:横断観察・家庭, E:母子遊びの言語でのイ

ンタラクション場面 30分間を約 1週間間隔で 2回

Rondal (1978)

Ulm (Johannsen

らが提供)

B:吃音の就学前と小学校生徒, C:Swabian方言, D:音声

クリニックの実験室, E:30分間の母親との農場組立遊び

Johannsen, Schulze, Rom-

mel, Haege, & Sieron

(1992)

表 19.6 二言語獲得のデータベース

提供者/デー

タベース名

言語 B:被験児の人数,年齢, C: 被験児の特徴、階層等D:収集

方法, E:場面の内容、収集時間等, F:その他

引用すべき文献

De Houwer 英語、オラ

ンダ語

B:1 児 (Kate)2;7{3;4 の 19 回, C:母親は米国人で英語

で、父親はフランダース人でオランダ語で、Kateに話

す。両親の会話は英語。居住地はアントワープ。D:縦断

観察・家庭, E.台所で母親が料理中に研究者とKateが遊

んでいる場面。1時間の録音。研究者と Kate との会話

はオランダ語。母親と研究者の会話は英語。, F: CHAT

形式に変換されている。形態素統語発達の始まりの研究

には有用でない (収集開始時にこの段階にいた)。

De Houwer (1990)

Deuchar 英語、スペ

イン語

B:1 児 (Manuela) 1;3{3;3。話相手 (主に祖母)が英語

が 95 回、スペイン語 (主に父親)が 125 回, C:母親は

Deuchar (言語学者)で英国人で英語を話す。父親はキ

ューバ人でスペイン語を話す土木技師。両親はスペイン

語で会話。Manuelaは両親からスペイン語で、保育所

や母方祖母から英語で話しかけられた。D:縦断観察・家

庭, E:スペイン語を話す父親と、英語を話すす祖母との

インタラクションを毎週録音、録画。主に半分居間、半

分食堂の長方形の部屋で録画。F:多くの録音は転写され

ていない。PHONASCIIの音声学的な転写がなされて

いるのは英語 9ファイル、スペイン語 8ファイル。プロ

ソデイーは転写されていない。母親の日誌記録と保育所

の観察記録があるが、CHAT形式では利用できない。

Deuchar & Clark

(1992)

159

Page 184: JChatman

第 18章 CHILDESのデータベース

提供者/デー

タベース名

言語 B:被験児の人数,年齢, C: 被験児の特徴、階層等D:収集

方法, E:場面の内容、収集時間等, F:その他

引用すべき文献

Guthries 中国語、英

B:中国系米国人の小学校 1 年生 11 人と 2 人の教師 C:

一人は広東語と英語を話す女性教師、もう一人はスペイ

ン語と英語の二カ国語プログラムの英国人男性教師。半

日は中国語を話す教師、半日は中国語を話さない教師と

過ごす。D:横断研究・学校, E: 段階 1:収集に先立ち、英

語、中国語の口語の熟達を 4段階で評価。二カ国語教師

の読みと英国人教師の口語の 2つのタイプの授業。段階

2:英国人教師のクラスで口語と着席しての仕事、二カ国

語教師のクラスで読みと中国語が録音された。F:コーデ

ングシステムは 0codes.docと 0orig.doc に輪郭が描か

れている。

Guthrie (1983);

Guthrie (1984);

Guthrie & Guthrie

(1988)

Hayashi 日本語、デ

ンマーク語

B:1児 (1;0.15{2;5.28)の 19ファイル。C:母親は日本語、

父親はデンマーク語ではじめから子どもに話かけた。両

親は主に英語で互いに話した。母親はデンマーク語があ

まり理解できない。21{23ヶ月時に、日本に滞在。母親

が昼間養育。日本語の語彙が 20ヶ月に優位。D:縦断観

察・家庭 E:家庭で約 1時間両親がいるところで録画。食

事、自由遊び、本読みの 30分間転写。母親、父親が等量

になるように転写。毎回 Uzgiris{Hunt Scale 実施。F:

発話、スピーチのユニットの同定に Plunkett (1990)の

方法を適用。正確な音韻分析はされていない。両親は子

どもの語彙を記録。

Hayashi (1993);

Klausen,Subritzky,

& Hayashi (1992)

Serra ス ペ イン

語、カタロ

ニア語

B.10 児 (1;0{3;0), C.1 児はスペイン語、5 児はカタロ

ニア語、4児は両言語。D:.家庭, E:母親や養育者との自

然な場面の録画。

Snow{

Velasco

ス ペ イン

語、英語

B:公立 1年生 40人、3年生 40人のプエルトリコ人 C:

教師によりスペイン語の読みが半数は劣る、半数は優秀

と判断された。すべて家庭でスペイン語を主に話す。二

カ国語教育の対モデルプログラムに参加 (半日スペイン

語、半日英語を話す教師により指導), D: 実験・学校, E:

英語とスペイン語での定義課題 (WISC{Rの 10の名詞

の定義課題)。絵記述課題 (距離が離れている聞き手の必

要に応じる能力)。子どもの反応を録音。

Velasco (1989);

Velasco & Snow

(1990)

160

Page 185: JChatman

文献

1. Antinucci,F., & Parisi, D. (1973). Early language acquisition: A model and some data. In C.Ferguson,

& D. Slobin (Eds.)., Studies in child language development. New York: Holt.

2. Antinucci,F., & Volterra,V. (1978). Lo sviluppo della negazione nel linguaggio infantile: uno studio

pragmatico. In L. Camaioni (Ed.)., Sviluppo del linguaggio e interazione sociale. Bologna: Il Mulino.

3. Bates,E., Bretherton, I., & Snyder, L. (1988). From �rst words to grammar: Individual di�erences and

dissociable mechanisms. Cambridge, MA: Cambridge University Press.

4. Bates,E., Friederici,A., & Wulfeck,B. (1987a). Grammatical morphology in aphasia: Evidence from

three languages. Cortex, 23, 545{574.

5. Bates,E., Friederici,A., & Wulfeck,B. (1987b). Sentence comprehension in aphasia: A cross{linguistic

study. Brain and Language, 32, 19{67.

6. Bates,E., Friederici,A., & Wulfeck,B. & Juarez,L. (1988). On the preservation of word order in aphasia:

Cross{linguistic evidence. Brain and Language, 33, 323{364.

7. Bates,E., Hamby,S., & Zurif, E. (1983). The e�ects of focal brain damage on pragmatic expression.

Canadian Journal of Psychology, 37, 59{84.

8. Bates,E., & Wulfreck,B. (1989a). Comparative aphasiology: A crosslinguistic approach to language

breakdown. Aphasiology, 3,11{142.

9. Bates,E., & Wulfreck,B. (1989b). Crosslinguistic studies of aphasia. In B. MacWhinney, & E. Bates

(Eds.)., The crosslinguistic study of sentence processing. New York: Cambridge University Press.

10. Bellinger,D., & Gleason,J. (1982). Sex di�erences in parental directives to young children. Journal of

Sex Roles,8,1123{1139.

11. Berman, R. (1985). The acquisition of Hebrew. In D. Slobin (Ed.) The crosslinguistic study of language

acquisition. Hillsdale, NJ: Lawrence Erlbaum Associates.

12. Berman, R., & Dromi,E. (1984). On making time without aspect in child language. Papers and Reports

on Child Language Development, 23, 23{32.

13. Bernstein, N. (1982). Acoustic study of mothers' speech to language{learning children: An analysis of

vowel articulatory characteristics. Unpublished doctoral dissertation, Boston university.

14. Bernstein{Ratner,N. (1984a). Patterns of vowel modi�cativon in mother{child speech. Journal of Child

Language, 11, 557{578.

15. Bernstein{Ratner,N. (1984b). Phonological rule usage in mother{child speech. Journal of Phonetics.12,245{

254.

16. Bernstein{Ratner,N. (1985). Dissociation between vowel durations and format frequency characteristics.

Journal of Speech and Hearing Research, 28, 255{264.

17. Bernstein{Ratner,N. (1986). Durational cues which mark clause boundaries in mother child speech.

Journal of Phonetics, 14, 303{309.

18. Bernstein{Ratner,N. (1987). The phonology of parent child speech. In K. Nelson, & A. vanKleeck

(Eds.)., Children's Language: Vol.6. Hillsdale, NJ: Erlbaum.

19. Bernstein{Ratner,N., & Pye,C. (1984). Higher pitch in baby talk is not universal: Acoustic evidence

from Quiche Mayan. Journal of Child Language, 11, 515{522.

20. Bliss, L. (1988) The development of modals. The Journal of Applied Developmental Psychology, 9,

253{261.

21. Bloom,L. (1970). Language development: Form and function in emerging grammars. Cambridge, MA:

MIT Press.

22. Bloom,L. (1973). One word at a time: The use of single word utterances. The Hague: Mouton.

23. Bohannon, J. N., & Marquis, A.L. (1977). Children's control of adult speech. Child Development, 48,

161

Page 186: JChatman

第 18章 CHILDESのデータベース

1002{1008.

24. Braine,M.D.S. (1976) Children's �rst word combinations. Monographs of the Society for Research in

Child Development, 41, (Whole No.1).

25. Brown, R. (1973). A �rst language: The early stages. Cambridge, MA: Harvard.

26. Carterette, E.C., & Jones, M.H. (1974). Informal Speech: Alphabetic and Phonemic texts with statis-

tical analyses and tables. Berkeley, Ca: University of California Press.

27. Cipriani, P., Pfanner, P., Chilosi, A., Cittadoni, L., Ciuti, A.,Maccari, A., Pantano, N.,Pfanner, L., Poli,

P., Sarno, S., Bottari, P., Cappelli, G.,Colombo, C., & Veneziano, E. (1989). Protocolli diagnostici e

terapeutici nello sviluppo e nella patologia del linguaggio. 1/84 Italian Ministry of Health. Unpublished

manuscript, Stella Maris Foundation.

28. Clahsen,H. (1982). Spracherwerb in der Kindheit: Eine Untersuchung zur Entwicklung der Syntax bei

Kleinkindern. Tubingen: Gunter Narr.

29. Clark,E.V. (1978a). Awareness of language: Some evidence from what children say and do. In

R.J.A.Sinclair, & W.Levelt (Eds.)., The child's conception of language. Berlin: Springer Verlag.

30. Clark,E.V. (1978b). Discovering what words can do. In W.J.D.Farkas, & K. Todrys (Eds.)., Papers

from the parasession on the lexicon. Chicago: Chicago Linguistic Society.

31. Clark,E.V. (1982a). Language change during language acquisition. In M.E.Lamb, & A. L. Brown

(Eds.)., Advances in child development: Vol.2. Hillsdale: N.J.:Lawrence Erlbaum.

32. Clark,E.V. (1982b). The young word maker: A case study of innovation in the child's lexicon. In E.

Wanner, & L.R. Gleitman (Eds.)., Language acquisition: The state of the art. Cambridge University

Press.

33. Conti{Ramsden,G., & Dykins,J. (1989). Mother{child interaction with language{impaired children and

their siblings. Unpublished manuscript, University of Manchester.

34. Dale,P., Bates, E., Reznick,S., & Morisset, C. (1989). The validity of a parent report instrument.

Journal of Child Language, 16, 239{249.

35. De Houwer, A. (1990). The acquisition of two languages: A case study. New York: Cambridge University

Press.

36. Demetras, M. (1989a). Changes in parents's conversational responses: A function of grammatical de-

velopment. Unpublished manuscript. ASHA, St.Louis, MO.

37. Demetras, M. (1989b). Working parents conversational responses to their two{year{old sons. Unpub-

lished doctoral dissertation, University of Arizona.

38. Deuchar, M., & Clark, A. (1992). Bilingual acquisition of the voicing contrast in word{initial stop con-

sonants in English and Spanish. Cognitive Science Research Report No.213. Unpublished manuscript,

University of Sussex.

39. Elbers, L. (1985). A tip{of{the{tongue experience at age two? Journal of Child Language, 12,353{365.

40. Elbers, L., & Wijnen, F. (1990). E�ort, production skill, and langauge learning. In C. Ferguson, L.

Menn, & C. Stoel{Gammon (Eds.)., Phonological development: Models, research, implications. Parkton,

MD: York.

41. Fawcett, R.P., & Perkins,M.R. (1980). Child language transcript 6{12 with a preface. Polytechnic of

Wales, Department of Behavioral and Communication Studies.

42. Feldman,H., & Keefe,K., & Holland,A. (1989). Language abilities after left hemisphere brain injury: A

case study of twins. Topics in Special Education, 9, 32{47.

43. Fletcher, P., & Garman, M. (1988). Normal language development and language impairment: Syntax

and beyond. Clinical Linguistics and Phonetics, 2,97{114.

44. Garvey,C., & Hogan, R. (1973). Social speech and social interaction: Egocentrism revisited. Child

Development, 44,562{568.

162

Page 187: JChatman

45. Gathercole,V. (1980). Birdies like birdseed the bester than burns: A study of relational comparatives

and their acquisition. Unpublished doctoral dissertation, University of Kansas.

46. Gillis,S., & Verhoeven,J. (1992). Developmental aspects of syntactic complexity in two triplets. Antwerp

Papers in Linguistics, 69,

47. Gleason, J.B. (1980). The acquisition of social speech and politeness formulate. In H.Giles, W. P.

Robinson, & S.M.P. (Eds.)., Language: Social psychological perspectives. Oxford: Pergamon.

48. Gleason, J.B., & Grief,E. (1983). Men's speech to young children. In B.Thorne, C. Kramerae, &

N.Henley (Eds.)., Language,Gender and Society. Rowley, MA: Newbury.

49. Gleason, J.B.,Perlmann,R.Y., & Grief,E.B. (1984). What's the magic word ? Learning language through

routines. Discourse processes, 6,493{502.

50. Gopnik,M. (1989). Re ections on challenges raised and questions asked. In P.R. Zelazo, & R.G. Barr

(Eds.)., Challenges to developmental paradigms. Hillsdale, NJ: Erlbaum.

51. Grief, E.B., & Gleason,J.B. (1980). Hi, thanks and goodbye: More routine information. Language in

Society, 9, 159{166.

52. Guthrie,L.F. (1983). Learning to use a new language: Language functions and use by �rst grade

Chinese{Americans. Oakland: ARC Associates.

53. Guthrie,L.F. (1984). Contrasts in teachers' language use in a Chinese{English bilingual classroom. In

J. Hanscombe, R.Orem, & B.Taylor (Eds.)., On TESOL '83: The question of control. Washington, DC:

TESOL.

54. Guthrie,L.F., & Guthrie,G.P. (1988). Teacher language use in a Chinese bilingual classroom. In

S.Goldman, & H.Trueba (Eds.)., Becoming literature in English as a second language. Norwood, NJ:

Ablex.

55. Haggerty, L. (1929). What a two{and{one{half{year{old child said in one day. Journal of Genetic

Psychology, 38, 75{100.

56. Hall, W.S., Nagy, W.E., & Linn, R. (1984). Spoken words: E�ects of situation and social group on oral

word usage and frequency. Hillsdale, NJ: Erlbaum.

57. Hall, W.S., Nagy, W.E., & Nottenburg,G. (1981). Situational variation in the use of internal state

words. University of Illinois, Center for the Study of Reading.

58. Hall, W.S., & Tirre, W.C. (1979). The communicative environment of young children: Social class,

ethnic and situational di�erences. University of Illinois, Center for the Study of Reading.

59. Hargrove,P.M., Holmberg,C., & Zeigler,M. (1986). Changes in spontaneous speech associated with

therapy hiatus: A retrospective study. Children Language Teaching and Therapy, 2, 266{280.

60. Hayashi,M. (1993). A longitudinal study of the language development in bilingual children. Unpublished

doctoral dissertation, University of Arhus.

61. Hayes,D.P. (1988). Speaking and writing: Distinct patterns of word choice. Journal of Memory and

Language, 27, 572{585.

62. Hicks, D. (1990). Kinds of texts: Narrative genre skills among children from two communities. In

A.McCabe (Ed.)., Developing narrative structure. Hillsdale, NJ: Lawrence Erlbaum.

63. Higginson,R., & MacWhinney,B. (1990). CHILDES/BIB: An annotated bibliography of child language

and language disorders. Hillsdale, N.J.: Erlbaum.

64. Higginson,R.P. (1985). Fixing{assimilation in language acquisition. Unpublished doctoral dissertation,

Washington State University. Holland,A.,Miller,J., Reinmuth,O., Bartlett,C.,Fromm,D.,Pashek,G.,

65. Stein,D., & Swindell, C. (1985). Rapid recovery from aphasia: A detailed language analysis. Brain and

Language, 24, 156{173.

66. Hooshyar,N. (1985). Language interaction between mothers and their nonhandicapped children, mothers

and their Down children, and mothers and their language{impaired children. International Journal of

163

Page 188: JChatman

第 18章 CHILDESのデータベース

Rehabilitation Research, 4, 475{477.

67. Hooshyar,N. (1987). The relationship between maternal language parameters and the child's language

constancy and developmental condition. International Journal of Rehabilitation Research, 10, 321{324.

68. Howe,C. (1981). Acquiring language in a conversational context. New York: Academic.

69. Isaacs,S. (1930). Intellectual growth in young children. London: Routledge and Kegan Paul.

70. Johannsen, H.S., Schulze,H., Rommel, D., Haege, A., & Sieron, J. (1992). Aetiologie und Verlaufsbe-

dingungen des kindlichen Stotterns: Darstellung einer laufenden f�unfj�ahrigen Langsschnittstudie. Un-

published manuscript, Forschungsbericht Nr. 43 der Universit�at Ulm.

71. Johnson,M. (1986). A computer{based approach to the analysis of child language data. Unpublished

doctoral dissertation, University of Reading.

72. Keefe,K., Feldman,H., & Holland, A. (1989). Lexical learning and language abilities in preschoolers

with perinatal brain damage. Journal of Speech and Hearing Disorders, 54, 395{402.

73. Klausen,T., Subritzky,M.S., & Hayashi,M. (1992). Initial production of in ections in bilingual children.

In G. Turner, & D.Messer (Eds.)., Critical in uences on language acquisition and development. London:

Macmillan.

74. Korman,M. (1984). Adaptive aspects of maternal vocalizations in di�ering contexts at ten weeks. First

language, 5,44{45.

75. MacWhinney,B. (1974). How Hungarian children learn to speak. Unpublished doctoral dissertation,

University of California, Berkeley.

76. MacWhinney,B., & Bates,E. (1978) Sentential devices for conveying giveness and newness: A cross{

cultural developmental study. Journal of Verbal Learning and Verbal Behavior, 17, 539{558.

77. Masur,E., & Gleason,J.B. (1980). Parent{child interaction and the acquisition of lexical information

during play. Developmental Psychology, 16,404{409.

78. Menn,L., & Gleason,J.B. (1986). Babytalk as a stereotype and register: Adult reports of children's

speech patterns. In J.A.Fishman (Ed.) The Fergusonian Impact, Volume I. Berlin: Mouton de Gruyter.

79. Narasimhan,R. (1981). Modeling language behavior. Berlin: Springer.

80. Peters,A. (1987). The role of imitation in the developing syntax of a blind child. Text, 7,289{311.

81. Plunkett,K. (1985). Preliminary approaches to language development. Arhus, Denmark: Arhus Univer-

sity Press.

82. Plunkett,K. (1986). Learning strategies in two Danish children's language development. Scandinavian

Journal of Psychology, 27, 64{73.

83. Plunkett,K., & Stromqvist,S. (1992). The acquisition of Scandinavian languages. In D.I. Slobin (Ed.).,

The crosslinguistic study of language acquisition: Volume 3. Hillsdale, NJ: Lawrence Erlbaum Asso-

ciates.

84. Romero,S.,Santos,A., & Pellicer,D. (1992). The construction of communicative competence in Mexican

Spanish speaking children (6 months to 7 years). Mexico City: University of the Americas.

85. Rondal,J. (1978). Maternal Speech to Normal and Down's Syndrome Children Matched for Mean Length

of Utterance. In C.E.Meyers (Ed.)., Quality of Life in Severely and Profoundly Mentally Retarded

People: Research Foundations for Improvement. Washington, DC: American Association on Mental

De�ciency.

86. Rondal,J. (1985). Adult{child interaction and the process of language understanding. New York:

Praeger.

87. Sachs,J. (1983). Talking about the there and then: The emergence of displaced reference in parent-

child discourse. In K.E.Nelson (Ed.)., Children's language, Vol.4. Hillsdale,N.J.: Lawrence Erlbaum.

88. Schaerlaekens,A., & Gillis, S. (1987). De taalverwerving van het kind: een hernieuwde orientatie in het

Nederlandstalig onderzoeks. Groningen: Wolters{Noordho�.

164

Page 189: JChatman

89. Schaerlaekens,A.M. (1972). A generative transformational model of language acquisition. Cognition,

2,371{376.

90. Schaerlaekens,A.M. (1973). The two{word sentence in child language. The Hague: Mouton.

91. Snow,K. (1989). Imitativeness: a trait or a skill? In G.Speidel, & K.Nelson (Eds.)., The many faces of

imitation. Reidel.

92. Stern,C., & Stern,W. (1907). Die Kindersprache. Leipzig: Barth.

93. Stine.E.L., & Bohannon III, J.N. (1983). Imitations, interactions, and language acquisition. Journal of

Child Language, 10, 589{603.

94. Str�omqvist, S., Richto�, U., &amp; Anderson, A.-B. (1993). Stro�omqvist's and Richto�'s corpora: A

guide to longitudinal data from four Swedish children. Gothenburg Papers in Theoretical Linguisitcs,66,

95. Suppes,P. (1973) The semantics of children's language. American Psychologist,88,103{114.

96. Suppes,P., Smith,R., & LeveillM. (1973). The French syntax of a child's noun phrases. Archives de

Psychologie, 42, 207{269. Tager{Flusberg,H., & Calkins,S.,Nolin,T.,Bamberger,T., Anderson,M., &

97. Chandwick{Dias,A. (1990). A longitudinal study of language acquisition in autistic and Down Syndrome

children. Journal of Autisim and Developmental Disorders,20,1{21.

98. Van Houten,L. (1986). Role of maternal input in the acquisition process: The communicative strategies

of adolescent and older mothers with their language learning children. Unpublihsed manuscript, Paper

given at the Eleventh Annual Boston University Conference on Language Development.

99. Van Kampen,N.J. (1994). The learnability of the left branch condition. In Linguistics in the Netherlands.

100. Velasco, P. (1989). The relatioship between decontexualized oral language skills and reading comprehen-

sion in bilingual children. Unpublished doctoral dissertation, Harvard Graduate School of Education.

101. Velasco, P., & Snow ,C. (1990). Bilingual children's performance in Spanish and English on decontexu-

alized language tasks. Unpublished manuscript, Harvard Graduate School of Education.

102. Volterra,V. (1972). Prime fasi di sviluppo della negazione nel linguaggio infantile. Archivio di Psicologia,

Neurologia e Psichiatria, 33, 16{53.

103. Volterra,V. (1976). A few remarks on the use of the past participle in child language. Journal of Italian

Linguistics, 2, 149{157.

104. Volterra,V. (1984). Waiting for the birth of a sibling: The verbal fantasies of a two year old boy. In I.

Bretherton (Ed.) Symbolic play. New York: Academic Press.

105. Wagner,K.R. (1985). How much do children say in a day? Journal of Child Language, 12, 475{487.

106. Warren{Leubecker,A. (1982). Sex di�erences in speech to children. Unpublished doctoral dissertation,

Georgia Institute of Technology.

107. Warren{Leubecker,A., & Bohannon,J.N. (1984). Intonation patterns in child{directed speech: Mother{

father speech. Child Development, 55, 1379{1385.

108. Weissenborn,J. (1985). Ich weiss ja nicht von hier aus, wie weit es von da hinten ist: Makroraume in

der kognitiven und sprachlichen Entwicklung des Kindes. In H. Schweizer (Ed.)., Sprache und Raum.

Stuttgart: Metzlersche.

109. Weissenborn,J. (1986). Learning how to become an interlocutor: The verbal negotiation of common

frames of reference and actions in dyads of 7- to 14-year{old children. In J. Cook{Gumperz (Ed.).,

Children's worlds and children's language. The Hague: Mouton.

110. Weist,R., & Witkowska{Stadnik,K. (1986). Basic relations in child language and the word order myth.

International Journal of Psychology, 21, 363{381.

111. Weist,R.,Wysocka, H., Witkowska{Stadnik,K.,Buczowska, E., & Konieczna, E. (1984). The defective

tense hypothesis: On the emergence of tense and aspect in child Polish. Journal of Child Language,

11,347{374.

112. Wells,C.G. (1981). Learning through interaction: The study of language development. Cambridge:

165

Page 190: JChatman

第 18章 CHILDESのデータベース

Cambridge University Press.

113. Wijnen,F. (1988). Spontaneous word fragmentations in children: Evidence for the syllable as a unit in

speech production. Journal of Phonetics, 16, 187{202.

114. Wijnen,F. (1990a). The development of sentence planning. Journal of Child Language, 17, 550{562.

115. Wijnen,F. (1990b). On the development language production mechanisms. Unpublished doctoral dis-

sertation, University of Nijmegen.

116. Wijnen,F. (1992). Incidental word and sound errors in young speakers. Jounal of Memory and Language,

31. 734{755.

117. Wilson, A.J., & Zeitlyn,D. (1995). The distribution of person{referring terms in natural conversation.

Research on Language and Social Interaction,28,61{92.

118. Wilson, B., & Peters, A.M. (1988). What are you cookin' on a hot?: Movement Constraints in the

Speech of a Three{Year{Old Blind Child. Language, 64, No.2, 249{273.

119. Wode,H. (1974). Naturliche Zweitsprachigkeit: Probleme, Aufgaben, Perspectiven. Linguistische Berichte,

32, 15{36.

120. Wode,H. (1977). Four early stages in the development of L1 negation. Journal of Child Language,

4,87{102.

121. Wode,H. (1978). The L1 vs L2 acquisition of English interrogation. Indian Journal of Applied Linguis-

tics, 4, 31{46.

122. Wode,H. (1979). Operating principles and &quot; universals&quot; in L1, L2, and FLT. International

Review of Applied Linguisitcs, 17, 217{231.

123. Wode,H. (1980). Grammatical intonation in child language. In L.R. Waugh, &, C.Schooneveld (Eds.).,

The melody of language. Baltimore, MD: University Park Press.

124. Wode,H. (1981). Language{acquisitional universals: A uni�ed view of language acquisition. In H.

Winitz (Ed.)., Native language and foreign language acquisition. New York: New York Academy of

Sciences.

125. Wode,H. (1987). The rise of phonological coding abilities for the mental representation of lexical items.

In H. Bluhme, & G.Hammarstrom (Eds.)., Descriptio lingusitica. Tubingen: Narr.

126. Wode,H., & Allendor�, S. (1981). Some overgeneralizations in the L1 acquisition of interrogative pro-

nouns. International Review of Applied Linguistics, 19,31{44.

166

Page 191: JChatman

第19章 CLAN チュートリアル

中則夫

19.1 はじめに

以下の章では、CLAN と呼ばれる CHILDES のコンピュータプログラムについて解説を行います。CLAN

は Computerized Language ANalysisの略したものです。CLANは、Carnegie Mellon 大学の Leonid Spector

によって作成されました。CLANの最新バージョンはグラフィカルユーザーインターフェースを使用していて、

Macintoshと Windows のどちらでも動作します。CLAN の古いバージョンでは MSDOS と UNIX で動作し

ますが、グラフィカルユーザインターフェースは利用できません。この古いバージョンは現在でも入手可能で

すが、現在は改良が中止されています。

CLAN は トランスクリプトデータに対して非常に多くの自動分析を行えるように作られています。それら

の分析には、頻度計算、文字列検索、共起分析、MLU 計算、インタラクション分析、テキスト変換などが含

まれます。このプログラムは、CHILDES の CHAT システムにしたがってフォーマットされたトランスクリ

プトデータを分析するように特に設計されています。分析のほとんどは、あらゆるタイプの ASCII ファイル

に対して行えますが、CHAT ファイルに対して使用するときに最もよく機能し、精確な出力を得られます。マ

ニュアルの 21章以下では、この分析コマンドの詳しい説明がアルファベット順になされています1。

19.2 CLAN に慣れる

CLANに慣れるためには、次節のチュートリアルをざっと見てみるとよいでしょう。そこでは、このプログ

ラムの基本的な理解ができるようになっています。次に、エディターの章を一通り見てエディター画面の特徴

を理解してください。

19.2.1 MacintoshにCLAN をインストールする

CLANは、http://childes.psy.cmu.edu/から Netscapeや InternetExplorerのようなウェブブラウザを

使って入手する2ことも、また CHILDESが発行している CDROMから入手することもできます。

Macintosh 版の CLAN は ウェブ上では Stu�It ファイルの形式で配布されていて、.sit の拡張子がついて

います3。これを展開するには、Stu�It Expanderが必要です。入手したプログラムを Stu�It Expander のア

イコン上にドラッグすると自動的に展開が始まります。CDROMに収録されているものは自己展開形式になっ

ているので、そのままアイコンをダブルクリックすれば自動的に展開が行えます。元の状態に復元できたら、

ハードディスク内の適当な場所に CLAN フォルダを配置してください。

Macintosh 版の CLAN は、現在のところまでかなりの程度、日本語 (ひらがな、カタカナ、漢字)に対応し

ています。しかし、一部まだ対応していない部分がありますので、安定した動作が必要な場合には、以下のサ

1本書では割愛した。2CHILDESのホームページは http://jchat.sccs.chukyo-u.ac.jp/ でミラーしていますので、ここからも入手可能です。3Stu�It とはファイルやフォルダーの内容を、サイズの小さなファイルに変換 (圧縮と言います)したり、もとに戻したりする (展開や

解凍と言います)ためのMacintosh用のプログラムです。同様のプログラムはWindowsではWinZipと呼ばれていますが、両者には互換性はありません。

167

Page 192: JChatman

第 19章 CLAN チュートリアル

イトから日本語版の CLAN-J をダウンロードしてください。なお、CLAN-Jではエディター (CED)と CLAN

が分かれていますので、エディターも必要な方は CED-J もダウンロードします。

ftp://jchat.sccs.chukyo-u.ac.jp/JCHAT/JCLAN

日本語版 CLAN-J に関するお問い合わせは、[email protected]まで email でお願いします。

19.2.2 WindowsにCLAN をインストールする

Windows 用の CLAN も Macintosh 用のものと同様、http://childes.psy.cmu.edu/ から Netscape や

InternetExplorerのようなウェブブラウザを使って入手する4ことも、また CHILDESが発行しているCDROM

から入手することもできます。

Windows 版の CLANは、Zipファイル5の自己展開形式になっています。ハードディスクにコピーしたあと

ダブルクリックしてください。自動的にインストールプログラムが起動します。

Windows 版の CLAN は、まだ開発から日が浅いため日本語対応になっていません。日本語表示を CLAN

で行う場合には、Twinbridge 社の Twinbridge Japanese Partnerが必要です。Japanese Partner に関する情

報は、http://www.twinbridge.comをごらんいただくか、[email protected] まで emailでお問い

合わせください。Japanese Partner は製品ですが、期間限定のデモバージョン (jp40demo)が Twinbridge社

のホームページよりダウンロードできます。まずはこれを入手してください。なお、試用期間が過ぎたら、製

品版を購入することをお勧めします。

以下に Japanese Partner のデモバージョン jp40demo をインストールする手順を示します。

1.まず、Japanese Partner のデモバージョン jp40demo を入手します。

2.「マイコンピュータ」をダブルクリックして開き、「マイコンピュータ」の中の「Cドライブ」をダブルク

リックして開きます。

3.ここで、「ファイルメニュー」の「新規作成」をマウスでクリックし、「フォルダ」を選びます。すると、C

ドライブ内に「新しいフォルダ」ができます。このフォルダの中に、jp40demo を置きます。

4.次に、jp40demo をダブルクリックします。すると、ウィンドゥが現れ、インストールに必要なファイル

が取り出されます。終了したら、ウィンドゥ右上の X 印をクリックしてウィンドゥを閉じます。

5.「新しいフォルダ」を開け、setupというファイル (パソコンのアイコンの形をしたもの)をダブルクリッ

クします。すると、インストールプログラムが起動します。この時警告メッセージが出ることがあります

が、「実行」ボタンをクリックしてそのまま次に進みます。

6. インストーラが起動するとウィンドゥダイアログが出てきます。そのまま Nextボタンをクリックしてく

ださい。都合 3回クリックすると、自動的にインストールが始まります。

7. インストールが完了すると、各種環境設定のウィンドゥダイアログが表示されます。特に希望がなければ、

Nextボタンを押して次へ進みます。合計 3回クリックすると最終確認のダイアログが出ますので、Finish

ボタンをクリックしてください。インストールが終了します。最後に、インストーラが終了してもいいか

聞いてきますので、Finishボタンをクリックして Windows の画面に戻ります。

8. Windowsに戻ると Japanese Partnerに関する注意事項が表示されますので、読み終わったらウィンドゥ

右上の X 印をクリックしてウィンドゥを閉じます。

9.この時点で、デスクトップ上に Twinj40d というフォルダができていますので、そのフォルダ内にある

Twinj40 (赤い『橋』というアイコン)をシングルクリックし、「ファイル」メニューから「ショートカット

の作成」を選びショートカットを作ります。できたショートカットは、見やすいようにデスクトップにマ

ウスでドラッグして移動してください。4CHILDESのホームページは http://jchat.sccs.chukyo-u.ac.jp/でミラーしていますので、ここからも入手可能です。5Zipファイル とはファイルやフォルダーの内容を、サイズの小さなファイルに変換 (圧縮と言います)したものを言います。このよう

なファイルを作成すしたり、もとに戻したりする (展開や解凍と言います)ために、WindowsではWinZipと呼ばれるソフトウェアが一般的です (日本では LHAというプログラムも使われています)。これに相当するMacintosh用のプログラムには Stu�Itや CompactProがあります。Windowsのものと Macintoshのものの間には互換性はありません。

168

Page 193: JChatman

19.2. CLAN に慣れる

10. 以上でインストールは完了です。CLANを使うときには、この Japanese Partnerの (ショートカット)ア

イコンをダブルクリックすることにより Japanese Partnerを起動し、その後 CLAN を起動します。

(注意) Japanese Partnerは一旦起動すると、システムに常駐します。ですから CLANを何回も使うような場

合でも、Japanese Partnerの起動は一回ですみます。

19.2.3 CLAN を起動する

CLAN を起動するためには、CLAN のアイコンをダブルクリックするか、CLANが起動するように設定さ

れたファイルをダブルクリックします。Macintoshでは、CLANで作成したファイル、Windows では、.cha,

.cdc, .cut の拡張子を持ったファイルは、ダブルクリックすると CLANが起動してそのファイルをオープンす

るように設定されています。CLAN の使い方を最初に覚える際には、プログラム本体のアイコンを直接ダブル

クリックして起動させるほうがよいでしょう。すると、Commandというタイトルがついたウィンドゥが開き、

CLAN のコマンドが入力できるようになります。

19.2.4 ディレクトリを設定する

CLANを起動したら、個別のCLANコマンドを実行する前にあなたの使い方に合わせたワーキングディレク

トリとライブラリディレクトリを設定しておく必要があります。このためには、コマンドウィンドゥの working

と Lib と書いてあるボタンをクリックします。ワーキングディレクトリとは、CLAN で分析作業を行うため

のディレクトリで、分析対象となる CHATファイルなどが置いてあるディレクトリに設定します。ライブラリ

ディレクトリは、CLANが参照する各種の設定ファイルが収められたディレクトリで、必ず CLAN と一緒に

配布される Libディレクトリを指定します6。

19.2.5 CLAN コマンド

コマンドウィンドゥは、いわゆるシェルあるいはインターフェースと呼ばれる環境を提供し、これにより分

析を行うコマンドを入力できるようになります。各コマンドは、CHATファイルを入力とし新しい CHATファ

イルを出力するか、データサマリーを出力します。CLAN がファイルに対して動作するためには、コマンド

ウィンドゥにコマンド名を最後までタイプしなければなりません。各コマンドは、以下の 3つの要素を含んで

います。

1.コマンド名

2.オプションスイッチ

3. 分析対象のファイル名

freq +f +i adam35.cha

ProgramOptions

Filename

これらの要素は、コマンドラインにタイプされますが、半角スペースで分けなければなりません。各要素の

順序に関する唯一の制約は、コマンド名が一番最初にこなければならないことだけで、その他の順序は自由で

す。オプションスイッチは、+ 記号か - 記号が最初につく要素で、ファイル名とオプションスイッチの順番

は、上述の通りまったく自由な順番で入力することができます。どちらが先にきても、またどのような順番で

タイプしてもかまいません。ファイル名は、複数のファイル名を好きなだけ列挙して指定することもできます。6ワーキングディレクトリやライブラリディレクトリは必ずハードディスクにコピーしたディレクトリを指定してください。CDROM

をお使いの方は特にご注意ください。

169

Page 194: JChatman

第 19章 CLAN チュートリアル

もちろん、通常はひとつ、あるいは一連のファイルを *.cha のような形で指定することのほうが多いことで

しょう。

コマンドがタイプし終わったら、リターンキーを押してください。プログラムが動作を開始します。もし直

前に入力したコマンドをもう一度実行したい場合には、次のようにします。まず、Windowsの場合、直前のコ

マンドがコマンドボックスに表示されていますので、その行までマウスを動かしてカーソルをクリックし、リ

ターンキーを押してください。ここで、直前のコマンドを一部修正して再実行することもできます。Windows

では、コマンドウィンドゥをスクロールバックして少し前に実行したコマンドの一覧を表示することができま

す。それぞれのコマンドのところへマウスを動かしてリターンキーをを押せば、そのコマンドを再度実行する

ことができるわけです。

Macintosh の場合には、コマンドウィンドゥ下部にある Recall ボタンを押してください。以前のコマンド

が独立したウィンドゥに一覧となって現れ、そのいずれかをダブルクリックできるようになります。すると、

そのコマンドがコマンドウィンドゥにコピーされ、リターンキーで実行されます。なお、この recall 機能は、

上向きカーソルキー ↑ を使っても呼び出すことができます。この場合、最新のコマンドから古いコマンドへ

遡ってコマンドウィンドゥに表示されます。行き過ぎてしまった場合は、下向きカーソルキー ↓ を押せば新

しいほうへ表示が変わっていきます。

出力ファイルには、実行したコマンドにしたがって 3文字の拡張子がつくようになっています。たとえば、

もし MLUコマンドを adam15.chaというファイルに実行したとすると、出力ファイルとして adam15.mluが

できます。ここで MLU コマンドを sample.cha ファイルに使ってみましょう。次のコマンドをタイプしてく

ださい。

mlu +f sample.cha

このコマンドは、結果を sample.mlu という別のファイルに出力します。このようにして、オリジナルのデー

タファイルは上書きや変更をされずに残すことができるわけです。

もし複数のファイルに対して一度にプログラムを実行したい時には、ファイル名の指定に アスタリスク (*)

記号を使用します。この記号をファイル名として使用すると、対応するファイル名を次々とすべて呼び出しま

す。ここで、あなたが Roger Brown の Sarah コーパスをすべて一ファイルずつ呼び出したいと仮定してみま

しょう。まず Sarah001.chaにプログラムをかけて、終わったら今度は sarah002.chaにかけて、という方法は、

プログラムを絶えず見ていてやらなければならず、またコマンドをいちいちタイプする必要があります。代わ

りに sarah*.cha あるいはもっと簡単に *.cha とタイプすれば、プログラムはワーキングディレクトリにあ

る Sarah コーパスのすべてのファイルを次々と処理してくれます。これは大量のデータを処理する際には大変

強力な手段となります。

19.2.6 リダイレクション (ファイルの書き出し指定)

リダイレクションには、>, >>, >& の三つのリダイレクト記号が使用でき、分析の出力をひとつのファイルに

まとめて書き出すことが可能です。この機能の例として次のようなコマンドが挙げられます。

freq sample.cha > filename-you-like

freq sample.cha >> filename-you-like

freq sample.cha >& filename-you-like

この三つのコマンドは、それぞれ少し違った結果になります。

1. > は、既にある同じ名前のファイルを上書き (オーバーライト)

2. >> は、既にあるファイルの末尾に結果を付け足し (アペンド )

3. >& は、プログラムの出力の他、さまざまなシステムメッセージも同時に出力

170

Page 195: JChatman

19.2. CLAN に慣れる

もし逆に、各ファイルの出力を各ファイルごとに分けて出したい場合には、+f スイッチを代わりに使用し

ます。

19.2.7 シェルコマンド

さまざまな分析用のコマンドに加えて、CLANで使用されているシェルでは UNIX や MSDOS のコマンド

ラインで使用されている基本的な操作用コマンドのいくつかを使用することができます。以下のコマンドでは、

ディレクトリを移動したり、情報を得たり、新しいプログラムを起動したりすることができます。

1. accept

Macintosh のみに有効。CLANがテキストタイプのファイルのみに適用するようにするには、accpt text

とタイプします。もし、元の状態 (テキストタイプ以外のファイル、つまりプログラムやワープロファイ

ルなどのバイナリファイルも分析する状態)に戻したいときには、accept all をタイプします。

2. batch

複数のコマンドをテキストファイルに列挙して、それをバッチ (自動実行)コマンドとして実行すること

ができます。バッチファイルは、エディターを使って新たに作成し、一挙に動かしたいコマンドを一行に

コマンドをひとつ指定します。バッチファイルの作成が終わったら、コマンドボックスに batchとタイプ

した後に、半角スペースを開けてバッチファイルの名前をタイプします。すると、バッチファイル内に記

述してある CLAN コマンドを順番にひとつずつ実行します。バッチファイルはワーキングディレクトリ

かライブラリディレクトリ内になければなりません。また、# をバッチファイル名の前につけてコマンド

ボックスにタイプし、リターンキーを押してもバッチファイルを実行できます。

3. cd

MS-DOS と同じように、ディレクトリを変更するために使用します。cd .. はひとつ上のディレクト

リに移動します。カレントディレクトリにあるフォルダ名を指定すると、そのフォルダに行くことがで

きます。フォルダのフルパスを指定すると、直接そのフォルダに移動することができます。たとえば、

HardDisk:Applications:CLAN を指定すると、CLANディレクトリに移動するなどします。

4. copy

ファインダーに戻らずにコピーを行うことができます。-q オプションを指定すると、本当にコピーをして

もいいのか聞いてきます。

5. del

ファイルを削除します。ワイルドカードを使用するとすべてのファイルが一度に消えてしまうので注意し

てください。できれば、常に -q オプションを併用するようにすることを勧めます。+re オプションを使

うと、カレントディレクトリ以下のすべてのファイルが削除されますので、十分注意してください。なお、

この場合だけは、デフォールトで CLANが本当に実行していいか聞いてきます。

6. dir

カレントディレクトリのファイルリストを表示します。

7. info

利用可能なコマンドをすべて表示します。

8. list

コマンドメニューで登録してあるすべての入力ファイルリストを表示します。

9. ren

このコマンドは、ファイル名をさまざまな形で変更できます。CLAN コマンドの出力で変更された各種

ファイル名を、自分の使いやすいファイル名に変更するときに使用します。ファイル名にピリオドが含ま

れる場合には、ワイルドカード* と併用することによって、特定の拡張子を一度に取り去ったり、適当な

拡張子に変更したりすることができ重宝します。ただし、ファイル名にピリオドが二つ以上ある場合には

動作しません。

171

Page 196: JChatman

第 19章 CLAN チュートリアル

-uは大文字に、-lは小文字に変更されます。-cと -tは、それぞれ Macintoshのファイルクリエータと

ファイルタイプを変更することができます。ファイルクリエータとは、ファイルがどのプログラムによっ

て作られたかを示すパラメータで、この値によってそのファイルにどのようなアイコンマークがつくかが

決まります。自分の使うエディターにクリエータを設定すると、ファイルからのプログラムの起動が楽に

なります。たとえば、CLAN のファイルクリエータは MCED なので、次のように入力すると、

ren -cMCED *.cha *.cha

変更後のファイルはすべて CLAN のアイコンになります。ファイル名にスペースが含まれている場合に

は、ファイル名をシングルクォートで囲むようにしてください。

10. rmdir

このコマンドは、ディレクトリやフォルダーを消去します。

19.2.8 オンラインヘルプ

非常に限られた量ではありますが、CLANにはオンラインヘルプが用意されています。使い方は、コマンド

ボックスから特定のプログラム名だけをコマンドとしてタイプすれば、そのプログラムの使い方に関する簡単

な説明が表示されます。たとえば、FREQとだけタイプしリターンキーを押すと、FREQのオプションスイッ

チに関する説明を見ることができます。19.2.7節で触れたシェルコマンドに関するヘルプは、helpとタイプす

れば表示されます。または、コマンドウィンドゥの Helpボタンをクリックしてください。

19.2.9 CLAN のテスト

CLAN が正確に分析を行っているか確かめるのは重要なことです。ときどき、CLAN は本来のねらいとは

違った動作をしていることがあるのに気づくことがあるかもしれません。間違いを防ぐため、CLANに分析さ

せたい項目をすべて含んだ小さなファイルを作ってみましょう。たとえば、FREQを使うときは、単語やコー

ドがいくつか入ったファイルを作成します。検索にヒットする項目だけでなく、失敗する項目を入れるのを忘

れないでください。たとえば、CLANに特定のティアを項目をカウントさせたくない場合には、そのティアに

他にはない単語を入れるようにしてください。もし出力にその単語が含まれていたら、何かがおかしいことが

分かるはずです。一般的に、正しく行える処理のためにテストするのではなく、おかしい部分の処理をテスト

する必要があります。

+t スイッチと +s スイッチを正しく使用していることを確かめるために、小さなファイルを作り、それに対

して KWAL を +s スイッチなしで適用してみます。すると、含めたいあるいは除外したいファイルの部分が

出力されるはずです。

19.2.10 バグリポート

ときどき、CLANが間違った結果を出すことに気づくことがあるかもしれません。このような場合には、ま

ずマニュアルの該当部分をもう一度読み直し、あなたが正しくコマンドを実行しているかどうか確かめてくだ

さい。もしマニュアルを読み直しても問題が解決しない場合には、[email protected]に英語で email を出し、指

示を受けてください。バグやプログラムミスにより正しい結果が得られないのかもしれません。日本語の email

を出す場合には、

[email protected] を使ってください。

sample.chaと sample2.chaは、マニュアルを通して使用されています。これらは、CHILDES CDROMに含

まれ、例に示されている通り CALNを実際に動かしてみることができます。もしプログラムの問題に突き当たっ

たら、問題が入力ファイルではなくプログラムそのものであることを確認するために、sample.chaファイルでも

172

Page 197: JChatman

19.2. CLAN に慣れる

問題点をテストしてみてください。このようにすることによって、問題の本質がどこにあるのかを確認すること

もできます。それでもプログラムが正常の作動しなかったら、次の情報と一緒に、[email protected]あてに email

を通して英語で報告してください。日本語の email を出す場合には、[email protected]

を使ってください。

1. CLAN を使用しているパソコンの機種、メーカー、OS などに関する情報

2.プログラムを動かしたデータファイルのコピー

3. 誤動作が起こったときに使用したコマンドの内容

4.コマンドを実行して得られたすべての出力およびエラーメッセージ

5. CLANプログラムのバージョンナンバー。これは、Macintosh の場合は画面左上のアップルメニューにあ

る About CLAN、Windows の場合にはメニューバー右端にある Help CLAN をみると分かります。

19.2.11 プログラム改良へのリクエスト

CLANプログラムは、ユーザーが研究を進めていくために必要な機能についてわたし達が受けた情報に基づ

いて設計されています。あなたの情報が重要です、というのも、わたしたちは常に新しいプログラムを設計し

ており、既存のプログラムを改良しているからです。もしそれらのプログラムが、あなたの実現したい特定の

研究を生み出すのに力不足であると分かったら、こちらに連絡してください。手助けとして最善の努力をしま

す。ある場合には、あなたの目標を達成するために既存の CLANプログラムについての使い方を説明すると

きもあります。また他の場合には、プログラムを修正するか、まったく新しいプログラムを設計する必要があ

るかもしれません。問い合わせは、[email protected] あてに email を通して英語で報告してください。日本語の

email を出す場合には、[email protected] を使ってください。要求の一部として、以下

のような情報が必要になります。

1. 入力ファイルの例

2. 望まれる出力例

3.なぜ修正が重要で役に立つのか

19.2.12 日本語対応および国内サポート

上記のサポートに加えて、日本国内でのサポートを JCHATプロジェクトが行っています。まず、プログラ

ムの使いかたやプログラムの入手、JCHATに関する問い合わせは、以下のようなメーリングリストが運営さ

れていますのでそちらへ email で連絡を行ってください。NiftyServeなどの大手商用ネットからもメールは届

きます。emailが利用できない人は、巻末の連絡先へ郵便または電話でご連絡ください。

[email protected]

日本語処理に関するプログラムの開発については、米国カーネギーメロン大学の他、JCHATプロジェクトでの独

自のサポートも行っています。特に2バイトコードを中心とする日本語の固有の処理については米国では情報が

少ないので、これからも JCHATが中心に開発をサポートし、最終的なプログラミングはカーネギーメロンで行

う予定です。その他、自動化したい定形作業がある場合は、気軽に相談を寄せてください。上記の形式で報告して

頂けると助かりますが、とりあえず連絡して頂けるだけでも結構です。[email protected]

まで email でご連絡ください。

173

Page 198: JChatman

第 19章 CLAN チュートリアル

19.3 CLAN チュートリアル

19.2.1節で述べたように CLAN をインストールしたら、CLAN のアイコンをダブルクリックしてプログラ

ムを起動します。すると、図 19.1のようなウィンドゥが現れます。これを、コマンドウィンドゥと呼びます。

起動後、コマンドウィンドゥが現われない場合には、Macintoshの場合にはWindowsメニューから Commands

を選ぶか、もしくは Commandキーを押しながら Dキーを押します。Windowsの場合には Window メニュー

から Commandsを選ぶか、Controlキーを押しながら Dキーを押します。

図 19.1: CLAN コマンドウィンドゥ

このウィンドゥを使用して CLAN の機能の多くをコントロールすることができます。また、このウィンドゥ

は、プログラムがその動作を終了するまでバックグラウンドでアクティブな状態になっています。コマンドウィ

ンドゥで重要な部分は中央少し下にあるコマンドボックスと、いくつかのボタンです。この起動した状態で、

まず最初にワーキングディレクトリとライブラリディレクトリを指定します。

ワーキングディレクトリを設定する

ワーキングディレクトリは、分析したいファイルを収めておく場所です。このチュートリアルでは、CLAN

のライブラリディレクトリをワーキングディレクトリとして使用します (が、もちろんみなさんの都合に合わ

せて自由に変更できます)。ワーキングディレクトリの設定は、次のように行います。

1. workingボタンを押す (図 19.1参照)。

2.ディレクトリを指定を求めるダイアログが出るので、分析したいファイルが収められているディレクトリ

まで移動する。

3.最後に Select Current Directoryボタンを押して設定を確定させる (図 19.2参照)。

ワーキングディレクトリを設定すると、元のコマンドウィンドゥに戻ります。ここで、先ほど選択したディ

レクトリが workingボタンの右側に表示されていることを確認してください。ここを見ることによって現在の

ワーキングディレクトリが一目で確認できるので非常に便利です。

ワーキングディレクトリの設定が終わったら、同様にしてライブラリディレクトリを設定します。Libボタン

を押して設定を始めてください。なお、outputボタンについては、特に設定は必要ではありません。デフォー

ルト (特に何もしない状態)ではワーキングディレクトリと同じディレクトリが出力ディレクトリになります。

174

Page 199: JChatman

19.3. CLAN チュートリアル

図 19.2: ディレクトリ選択時のダイアログボックス

ワーキングディレクトリ以外に出力ファイルを送りたい場合に使用します。

さあ、ここで CLAN を試しに動かしてみましょう。freq sample.cha というコマンドをコマンドボックス

にタイプしてください。以下のようになるはずです。

図 19.3: コマンドボックスでのタイプ例

コマンドがタイプし終わったら、リターンキーを押すか、コマンドウィンドゥの Run ボタンをクリックく

ださい。すると、次のような出力が出てきます。

この出力はコマンドウィンドゥとは別の Clan Output ウィンドゥに出力されます。出力はどんどん下へスク

ロールしながら最後まで表示されます。なお、ウィンドゥのサイズは、あなたが調整するサイズによっていろ

175

Page 200: JChatman

第 19章 CLAN チュートリアル

図 19.4: コマンド出力の例

いろな大きさになります。

リコールボタン

もし過去にタイプしたコマンドを表示させたい時には、リコール機能を利用します。このためには Recallボ

タンをクリックしてください。すると、過去のコマンドが新しいウィンドゥに一覧として出てきます。ここに

は、過去 20の古いコマンドが履歴としてリストされています。使いたいコマンドが見つかったら、その行を

ダブルクリックすることでそのコマンドがコマンドウィンドゥにコピーされます。このように、同じ作業を繰

り返したり、今までに行った作業の過程を確認することが楽になり便利です。

Macintosh では、同様のことを上向きカーソルキー ↑ を使っても行うことができます。この場合、最新の

コマンドから古いコマンドへ遡って順々にコマンドウィンドゥに表示されていきます。行き過ぎてしまった場

合は、下向きカーソルキー↓ を押せば新しいほうへ表示が進んでいきます。

Windows 版の CLAN では、矢印キーの代わりに、コマンドボックスのスクロール機能を使用します。タイ

プしたコマンドはコマンドボックス内に次々とリストされていきますので、それぞれのコマンドの行をクリッ

クして移動しリターンキーを押せば、その行のコマンドが実行されます。

ヘルプボタン

Helpボタンは、ファイルやディレクトリの情報を得たり、その操作を行うコマンドの使い方を表示します。

このとき表示されるコマンドは、コマンドボックスにタイプして使用します。

一例として、dirとタイプしてみましょう。すると、図 19.3のような出力が得られます。これは、現在のワー

キングディレクトリであるライブラリディレクトリのファイルの一覧です。

176

Page 201: JChatman

19.3. CLAN チュートリアル

図 19.5: helpボタンの出力

もしウィンドゥが小さ過ぎる場合には、適当な大きさに調整することができます。

CLANボタン

CLAN ボタンは、CLAN で使用できる分析コマンドの一覧が表示されます。もちろん、もしあなたがコマ

ンドの使い方に慣れているのであれば、直接コマンドボックスにタイプする方が速いことでしょう。一覧の中

から特定のコマンド、たとえば FREQ をダブルクリックすると、そのコマンドがコマンドボックスにコピー

されます。

File In ボタン

CLANボタンを使って、あるいは直接タイプしてコマンドをコマンドボックスに表示し、そのコマンドに続

けて半角スペースをひとつタイプすると、コマンドボックス上に File Inボタンが現れることに気がつきます。

このボタンをクリックすると、次のようなダイアログが現れ、ワーキングディレクトリ内のどのファイルを分

析対象に加えるか選択できるようになります。

ここで、sample.cha まで右側のボックス内をスクロールして下がり、ファイル名をダブルクリック (あるい

は Addボタンをクリック)します。すると、sample.chaが右側のボックス内に移動し登録されます。Add all

ボタンは、左側ボックス内のすべてのファイルを選択し右側ボックスに移動します。右側のボックス内に移動

したファイルは、CLAN のコマンドのファイル指定を @ でまとめて呼び出すことができるようになります。

Removeボタンは、右側のボックス内にある特定のファイルを登録から削除する時に使用します。Clearボタ

ンは右側ボックス内のファイルをすべて登録から削除します。ファイルを選択し終わったら、Doneボタンを

押します。すると、コマンドウィンドゥに戻り、コマンドボックスの中に @ が現れていることが分かりすが、

この記号は先ほど選択したファイルのすべてを入力ファイルとして指定していること意味しています。

177

Page 202: JChatman

第 19章 CLAN チュートリアル

図 19.6: dir コマンドの出力

19.3.1 コマンドを直接入力する

コマンドの入力のしかたには二種類あり、ひとつは上で述べたようにボタンとメニューを使用する方法で

す。もうひとつの方法として、コマンドを直接タイプすることもできます。試しにやってみましょう。ここで、

MLU(平均発話長)コマンドを使うとしてみましょう。そして、MLU 計算がこどもの発話だけにかかるよう

に制限してみます。さらに、その結果をファイルに出力するように指定してみます。以上のことをさせるため

に、以下のようなコマンドをコマンドウィンドゥにタイプします。

mlu +t*NIC +f sample.cha

このコマンドは四つの部分からなりたっています。最初にはプログラムの名前、二番目には *NIC:で始まる

行だけを計算する指定、三番目はファイルへの出力を指定、四番目は分析対象となるファイル名の指定です。

以上の結果、以下のような表示になります。

一見難しいそうに見えますが、メニューとボタンを使う方法を使い込んだり、よくマニュアルと向き合って

いるうちに自然と慣れていきます。慣れてくるにしたがって、直接コマンドをタイプするほうがかえって容易

になってしまうくらいです。もちろんよく慣れていないコマンドについては、ボタンやメニューのほうが便利

なときもあるでしょう。どちらを使うかは、みなさんの好みや都合によって選択してください。

19.3.2 ワイルドカード

ワイルドカードは * 記号によって表されますが、これによりいろいろな複数のファイル名の代わりとして使

うことができます。たとえば、もし .chaという拡張子で終わる 10 個のファイルに上で考えたコマンドをかけ

たいとしましょう。この場合、次のようなコマンドが使えます。

mlu +t*CHI +f *.cha

このように、ワイルドカードは特定の文字列、たとえば複数のファイル名*.cha、複数のスピーカー IDである

CH*、同じ形で終わる複数の単語*ing などを指定するときに使うことができます。一緒に使った場合に、これ

178

Page 203: JChatman

19.3. CLAN チュートリアル

図 19.7: FILE IN 選択ダイアログ

らがどのように機能するかをみるために、以下のコマンドを試してみましょう。

mlu +s*ing *.cha

このコマンドは、現在ワーキングディレクトリになっているライブラリディレクトリにあるファイルのうち .cha

で終わるすべてのファイルを調べ、-ingで終わるすべて単語の頻度を計算します。計算結果は CLAN の Clan

Ourput に送られます。そこでは、スクロールしながらその出力結果をくまなく見ることができることでしょ

う。もちろん、このウィンドゥを印刷したり、ファイルに保存することもできます。

19.3.3 出力ファイル

CLANは、2種類のデータファイルを操作します。ひとつは入力ファイルで、CHATフォーマットで記述さ

れたトランスクリプションデータが含まれます。もうひとつは出力ファイルで、入力ファイルに対して CLAN

が行った分析の結果が収められます。デフォールトの出力ファイルはスクリーン画面で、出力に応じてどんど

んスクロールしていきます。しかし、テキストファイルとして出力したほうが便利な場合も多いですから、次

の3つの方法が用意されています。

1. +f オプション

このオプションをコマンドと一緒に使うと、入力ファイルごとにそれぞれ出力ファイルが作られるように

なります。操作ミスを避けるため、ファイルの書き出しは上書き出力を行いません。その代わり、すでに出

力ファイルと同じ名前のファイルがある場合には拡張子をファイルの末尾につけて、ファイル名が重ならな

いようにして出力ファイルを作成します。たとえば、kid.frqというファイルが既に存在する場合、CLAN

は kid.fr0, kid.fr1と末尾の数字を増やしていくことになります。ただし、数字の最高は 9 までなので、そ

れ以上ファイルが作れない場合には、コマンドそのものが動作しなくなります。このようなときは、古い

ファイルを移動するか削除します。

2. +f オプションと3文字の拡張子指定

CLANコマンドの出力ファイルには、そのコマンド名に応じた拡張子がつきますが、拡張子名を明示的に

指定するとその拡張子名が優先されて出力ファイルにつくようになります。たとえば、*MOT 行だけを分析

179

Page 204: JChatman

第 19章 CLAN チュートリアル

した場合、+fmot と指定すると出力ファイルには .motが付加されるようになります。その他の基本的な

動作は、(1) と同じです。

3. リダイレクション記号 (>)

リダイレクションを用いても、+fと同じようにファイルに出力できます。+fと違う点は、複数の入力ファ

イルを単一の出力ファイルに書き出せること、出力ファイル名を自由に指定できることです。たとえば次

のように使用することができます。

freq *.cha > all.frq

なお、+fでも出力ファイルをまとめるオプションを使用すれば同様の結果が得られます。

19.3.4 代表的な5つのコマンドの練習

それでは、CLANの準備ができたところで、最も基本的なプログラムであるFREQ, MLU, COMBO, KWAL,

GEM の5つのコマンドを試しに動かしてみましょう。動作の実感を大まかにつかんでください。まず、準備

として CLANのアイコンをダブルクリック起動し、ワーキングディレクトリをハードディスクにコピーしたラ

イブラリディレクトリに指定しておきます。入力ファイルとして、ライブラリディレクトリ内ある sample.cha

を使用します。以下の例と同じように、みなさんも実際に同じ操作を行うことができるはずです。

19.3.4.1 FREQ

FREQは、単語の出現頻度計算を行うプログラムです。同時に、語彙の使われ方の指標となるタイプ・トー

クン比率も計算します。標準の状態では、FREQ は入力ファイルに含まれるすべてのスピーカーのすべての

単語のリストをアルファベット順に出力します。以下のコマンド例では、sample.chaというファイルの母親の

ティアだけを参照し、出力をアルファベット順で CLAN ウィンドゥに表示します。

freq +t*MOT sample.cha

FREQ プログラム名(コマンド)

+t*MOT 母親の発話行だけを分析

sample.cha 入力ファイル名

180

Page 205: JChatman

19.3. CLAN チュートリアル

> freq +t*MOT sample.cha

FREQ +t*MOT sample.cha

Tue Jul 14 14:23:38 1998

FREQ (29-JAN-98) is conducting analyses on:

ONLY speaker main tiers matching: *MOT;

****************************************

>From file <sample.cha>

1 a

1 any

1 are

3 chalk

...中略...

2 you

- ------------------------------

31 Total number of different word types used

43 Total number of words (tokens)

0.721 Type/Token ratio

統計情報が、最後に必ず表示されます。上の例では、合計 43単語がトークンとして使用され、タイプは 31

種類であることが分かります。また、タイプ・トークン比率は 31を 43で割ったものが表示され、0.721 にな

ります。

+f オプションを使用すると、結果をファイルに保存できます。CLANは、ファイル名の末尾に .frq という

拡張子をつけます。もし入力ファイルに拡張子が既についているときには、それを新しい拡張子で置き換えま

す。+fMOT を指定すると、拡張子を .mot にすることもできます。

FREQは、デフォールト状態では xxx, yyy, wwwといった不明瞭発話を示す特殊な語、および 0, &, +, -, #

の文字で始まる文字列を無視しますが、繰り返しについては特に指示を出さない限りそのままカウントされ

ます。

*CHI: the dog [/] dog barked

この例では、dogが 2語、そして the と barkedが一語づつとしてカウントされます。繰り返しを無視させ

たい場合には、+r6 オプションを使用します。

19.3.4.2 MLU

MLU は、第一言語習得研究で主に用いられている文平均発話長 (MLU) を算出します。また、ファイル内

の総発話数や総形態素数も計算できます。形態素数を発話数の比率 (MLU)はこれらの数値から算出されます。

たとえば、以下のコマンドは、sample.cha ファイルの母親の MLU 値を算出します。

MLU -t*MOT sample.cha

MLU プログラム名

+t*MOT 母親の発話行だけを分析

sample.cha 入力ファイル名

以上のコマンドの出力は、次のようになります。

> MLU -t*MOT sample.cha

181

Page 206: JChatman

第 19章 CLAN チュートリアル

MLU -t*MOT sample.cha

Tue Jul 14 14:26:19 1998

MLU (29-JAN-98) is conducting analyses on:

ALL speaker main tiers EXCEPT the ones matching: *MOT;

****************************************

>From file <sample.cha>

MLU for Speaker: *NIC:

MLU (xxx and yyy are EXCLUDED from the utterance and morpheme counts):

Number of: utterances = 5, morphemes = 7

Ratio of morphemes over utterances = 1.400

Standard deviation = 0.490

総形態素数を総発話数で割った MLU 値は 0.490 で、総発話数は 5 になっています。

19.3.4.3 COMBO

COMBOは、特定の単語や文字列の組み合わせをデータから検索する非常に強力なプログラムです。たとえ

ば、COMBO を使えば to と want を同一発話内で同時に使っている例を探し出すことができます。こうした

検索例を行うのが次のようなコマンド例です。

combo +t*MOT +s"to^want" sample.cha

COMBO プログラム名

+t*MOT 母親の発話行だけを分析

+s"to^want" to の直後に want"が生起している文字列を指定

sample.cha 入力ファイル名

このように、特定の文字列を検索する場合には、+sオプションの後にその文字列を指定するようになってい

ます。

> combo +t*MOT +s"to^want" sample.cha

((to^want))

COMBO +t*MOT +sto^want sample.cha

Tue Jul 14 14:31:05 1998

COMBO (29-JAN-98) is conducting analyses on:

ONLY speaker main tiers matching: *MOT;

****************************************

>From file <sample.cha>

- ----------------------------------------

*** File "sample.cha": line 42.

*MOT: it's not good to want chalk .

1 1

Strings matched 1 times

この例では、指定した文字列が 1回だけヒットしたことが、該当の発話を抜き出すことで示されています。

182

Page 207: JChatman

19.3. CLAN チュートリアル

19.3.4.4 KWAL

KWALプログラムは、指定した文字列を検索しそのキーワードを文脈付きで表示することができます。文

字列の指定には +s オプションを使用します。文脈は、キーワードが含まれる発話自体に加えて、前後の発話

(メインラインおよびディペンデントティアの総体 、つまりクラスタ)もその数を指定して表示することがで

きます。なお、デフォールトでの出力はメインラインだけになっているので、ディペンデントティアも出力す

るためには、+t% オプションを加えます。以下のコマンドは、キーワードの anyを検索し、その前後 2発話づ

つを合わせて表示します。

kwal +sany -w2 +w2 sample.cha

KWAL プログラム名

+sany キーワードの any を指定

-w2 ヒットしたキーワードの前の 2発話を表示

+w2 ヒットしたキーワードの後ろの 2発話を表示

sample.cha 入力ファイル名

数値の設定を変えることで、より広い文脈を表示することも可能です。出力は以下のようになります。

> KWAL +sany -w2 +w2 sample.cha

KWAL +sany -w2 +w2 sample.cha

Tue Jul 14 14:32:44 1998

KWAL (10-MAR-98) is conducting analyses on:

ALL speaker tiers

****************************************

>From file <sample.cha>

- ----------------------------------------

*** File "sample.cha": line 30. Keyword: any

*MOT: what's that ?

*NIC: what's that ? [+ I]

*MOT: is there any delicious cha:lk ?

@eg

*NIC: neat chalk+chalk .

この場合はヒットが1件でしたが、複数件ヒットした場合には、そのすべてが列挙されて出力されます。

19.3.4.5 GEM

GEM は、予めタグ付けされてマーキングされたテキスト部分を抽出するプログラムです。主に、GEM で

ファイルの特定の部分を取り出して他の分析プログラムに渡して分析を行うといった使い方をします。この機

能は、ファイルの特定の部分に分析を絞り込みたい場合や、ファイルが複数の異質な部分に分かれているとき

に特に有効です。たとえば、トランスクリプトをこどもの発話タイプによって分割整理してあるとしましょう。

ここで GEM を使えば、各発話タイプ別に分析をそれぞれ行い、別のプログラム(たとえば FREQ)で分析

することができます。このように、あるプログラムの出力結果を別のプログラムの入力として送り込む方法を

パイプ処理といいます。

GEMで処理するためには、特定部分のタグ付けとして、@bgと@egとファイルに入れ込む必要があります。

sample.cha ファイルには、以下のようにタグ付けが行われています。

183

Page 208: JChatman

第 19章 CLAN チュートリアル

@bg

*MOT: what's that?

%act: pulls out chalk board

%spa: $CON:sel:ve $RFI:xxx:ve

*NIC: what's that? [+ I]

%spa: $IMI:sel:ve $CON:sel:in

*MOT: is there any delicious cha:lk?

%spa: $INI:sel:non $RFI:tes:in

@eg

このように、ふたつのマークで挟まれた部分が GEMによって自動的に抜き出されることになります。それ

では、以下の例を見てみましょう。

gem +t*NIC +d sample.cha | freq

GEM プログラム名

+t*NIC NIC の発話行だけを分析

+d 出力が次のコマンドの入力になれるように再フォーマット

sample.cha 入力ファイル名

| パイプ処理

FREQ プログラム名

この出力結果は次のようになります。

> gem +t*NIC +d sample.cha | freq

GEM +t*NIC +d sample.cha

Tue Jul 14 14:36:48 1998

GEM (29-JAN-98) is conducting analyses on:

ONLY speaker main tiers matching: *NIC;

and ONLY header tiers matching: @BG:; @EG:;

****************************************

>From file <sample.cha>

FREQ

Tue Jul 14 14:36:48 1998

FREQ (29-JAN-98) is conducting analyses on:

ALL speaker tiers

****************************************

>From pipe input

1 that

1 what's

1 yeah

- ------------------------------

3 Total number of different word types used

3 Total number of words (tokens)

1.000 Type/Token ratio

ここで、上でみたタグ付け部分のうち、NICの発話の単語だけがカウントされていることに注意してくださ

い。なお、GEMによるタグ付け部分の抜き出しは、複数のタグ付け部分を一度に取り出したり、特定の部分

だけを参照して抜き出したりすることも可能です。

184

Page 209: JChatman

第20章 CLANエディター

中  則夫CLANには、ASCIIテキストを対象にした本格的なエディターが組み込まれています。このエディターは、

特に CHATファイルに対してよく機能するように設計されています。現在のところ、少なくとも以下の7つの

機能があります。

1. non-CHATエディターモード ([E][non-CHAT])では、ASCIIエディターとして non-CHATファイルを操

作することができます。

2. CHATエディターモード ([E][CHAT]) では、CHATファイルを新規に作成したり編集したりすることが

できます。Macintosh上では、特定の Language Kitを使用することで、標準ASCII文字から成る日本語、

中国語、韓国語、IPA、キリル文字なども使用することができます。

3.エディターモードでは、CHECKコマンドを呼び出してファイルに含まれる間違いを探すことができます。

4.コーダーモード ([C])では、あらかじめ用意、編集したコーディングメニューにしたがって、新しいコー

ディング行を作りながら分析コードを体系的に入力することができます。

5. 候補選択モード (Disambiguator mode)では、MORプログラムが作成した%mor行に含まれるあいまいな

出力結果から正しいものを選択、確定させることができます。

6. Sonic作成モードでは、入力した発話文をデジタル音声ファイルに直接リンクすることができます。また

音声波形が画面下に表示され、発話音声の始まりと終わりがミリ秒単位でトランスクリプトファイルに表

示されます。こうしてリンクを作ることによって、トランスクリプト上から直接発話音声を再生すること

ができます。

7. Sonic再生モードでは、音声波形を出さない代わりに、ファイル全体の音声データを再生することができ

ます。ひとつひとつの発話を次々と再生し、それにしたがって発話されているトランスクリプトがハイラ

イト(白黒反転)していきます。

これらの各モード間の切り替えには、それぞれオン、オフのコマンドが用意されています。

20.1 エディターモード

最初にエディターの使い方に慣れる際には、エディターモードが一番よいでしょう。CLANを起動すると、自

動的に新しい編集ウィンドウが開きます。このウィンドウを使って作業を始めるか、すでにでき上がった CHAT

ファイルを File メニューの Open から開くことができます。基本的な編集コマンドに慣れるまで、しばらく

はエディターモードだけに集中しましょう。使い方は、通常の場合とまったく同じです。ワープロ操作に慣れ

ていれば困ることはないでしょう。CLANエディターによる CHATファイルの具体的な作成手順については、

第 16章「CLAN エディターによる入力」を参照してください。

20.1.1 File, Edit, Font メニュー

ファイルを開いたり、印刷、カット、やり直し、フォント変更といった作業はエディターの基本的な機能で

す。これらのコマンドは File, Edit, Fontの各メニューにあります。また、各機能にはキーボードショートカッ

185

Page 210: JChatman

第 20章 CLANエディター

トが用意されていて、各メニューの横に記されています。

20.1.2 検索

Edit メニューには、いろいろな検索コマンドがあります。Findコマンドを選ぶとダイアログが現れ、検索

文字列を指定と検索方向の選択ができるようになります。Find Sameコマンドは検索を複数回行うことができ

ます。Go-Toコマンドは、特定の行番号に飛ぶことができます。Replaceコマンドは、特定の文字列を検索し

て、それを置換することができます。Windowsでは、置換はダイアログを使用します。Macintoshでは、次の

ようなコマンドをキーボードからタイプしなければなりません。

! すべてを置換

n 現在の対象を置換しない

リターンキー 現在の対象を置換しない

スペースキー 現在の対象を置換

Control + G 検索作業を中止

20.1.3 キーボードコマンド

キーボードとマウスによる加えて、CLANでは Emacsエディターに準拠したキーボードによる操作が多数

用意されています。しかし、この操作方法に慣れている人はそれほど多くないと思います。詳しい操作方法は

ESC-hをタイプしてヘルプをごらんください。

20.1.4 ティアメニュー

CLANのエディターは、CHATファイル(@Participantsヘッダが含まれているもの)を開く時に各スピー

カー IDをチェックし、その IDを Tiersに自動的に挿入します。登録された各 IDはキーボードショートカット

とリンクされているので、ショートカットを指定することで特定のスピーカー IDを簡単にタイプすることが

できます。たとえば、@Participantsヘッダーの一番最初に定義してあるスピーカー IDは、Macintoshの場

合にはコマンドキーを押しながら 1キー、Windowsの場合には Controlキー押しながら 1キーをタイプするこ

とで、現在カーソルがある位置にスピーカー IDが自動的にタイプされます。同様にして、@Dependentヘッダ

に 4つまでのディペンデントティアの IDを列挙できます。これも Tiersメニューに登録されます。なお、ファ

イル読み込み後にこれらのヘッダの内容を変更した場合には、メニュー下部のUpdateを選択すれば、Tiers

メニューを最新の内容に更新できます。

20.1.5 ティア除外のしかた

コーディングをしているときなど、特定のティアを表示しないようにしたくなるときがあるかもしれません。

そのような時には、特定のティアを一時的に表示しないようにすることができます。また、すべてのティア(メ

インラインは例外)を表示しないようにすることもできます。方法は、次の通りです。エディターモードかコー

ディングモードの状態で、Escapeキーを押して放し、続いて 4キーを押します(あるいは、Modeメニュー

からHide tiersを選びます)。すると、スクリーン下部にメニューが出ますので、希望の処理を選択します。

hはティアを消す、sはティアを表示する、rは設定を元に戻すようになっています。ここでは例として、hを

使ってみましょう。リターンキーを押し各処理を選択すると、次にどのティアについてその処理を適用するか

聞いてきますので、特定のティア名、たとえば %mor、をタイプしリターンキーを押します。いかがですか、指

定したティア(ここでは %mor)が表示されなくなっているはずです。なお、すべてのディペンデントティアを

選択するには、%と指定してください。

186

Page 211: JChatman

20.2. 特殊文字とキーボード

20.1.6 エディター内で CHECK を使用する

エディター内で、直接 CHECKプログラムを起動することが可能なので、作成中のファイルのフォーマット

を即座に検証することができます。CHECKは、ライブラリディレクトリの dep�le.cutファイルをまず読み込

み、その中に定義されている情報についてファイルに含まれる間違いを検証します。CHECKを呼び出すとき

には、エディターモードの状態で、Escapeキーを押して放し、続いて lキーを押します(あるいは、Mode

メニューから Check opened �leを選びます)。起動の後の具体的な操作については、表示される指示にし

たがってください。なお、CHECKに関する詳しい説明は、第 21章の「コマンドレファレンス」1および第 16

章「CLAN エディター」参照してください。

20.2 特殊文字とキーボード

MacintoshとWindowsは、どちらも各種の言語に適した文字セットとキーボードを提供しています。キー

ボードの配置とその出力文字については、Macintoshの場合にはアップルメニューから「キーボード」を選び、

Windowsの場合には、デスクアクセサリフォルダにある「キャラクター配置」をダブルクリックしてくださ

い。各キーの組み合わせによる文字の表示が確認できます。CLAN のエディターは、スペイン語などダイアク

リティクスを使用する文字などの ASCII 以外の文字や、日本語、キリル文字、中国語などの非 ASCIIローマ

ン文字をサポートしています。

20.2.1 ローマン文字セット

多くの言語では、基本的なローマンアルファベットの他、拡張文字やダイクリティクスを使用しています。

CLAN のエディターは、各パソコンシステムに組み込まれた文字フォントを読み込みそれらを表示することが

できます。たとえば、スペイン語の例では、次のような表示が得られます。

@Begin

@Perticipants: CHI Target Child, MOT Mother

*CHI: hasta ma~nana.

*MOT: �qu�e? creo que s��.

@End

20.2.2 非ローマンスクリプト

ローマン文字に依存しないスクリプトでは、パソコンのシステムに搭載される文字フォントに依存すること

になります。例としてキリル文字アルファベットをみてみましょう。キリル文字を使用では、CLANエディター

を使用して次のようなファイルを作成することができます。

@Begin

@Perticipants: CHI Target Child, MOT Mother

*CHI: молоко ?

*CHI: нет .

@End

Appleコンピュータ社の Cyrillic Language Kitの Latinskiフォントを使用すればこのように見ることがで

きます。もしこのフォントがインストールされていない場合には、次のような表示になります。

1本書では割愛した。

187

Page 212: JChatman

第 20章 CLANエディター

@Font: CyrillicII:9

@Begin

@Perticipants: CHI Target Child, MOT Mother

*CHI: �I�OI�O�I�O

*MOT: �IA�U.

@End

Macintosh では、Apple 社がさまざまな言語の向けの Language Kitを出荷しています。日本語システム

には、日本語表示に必要なものはすべて用意されていますので、次項の「フォントの設定」を行うだけです。

Windows向けには、さまざまなメーカーが同様の製品を出荷しています。Windowsでは、アジア諸言語向け

として TwinBridgeが提供されています。http://www.twinbridge.comに詳しい説明を参照してください。現

在のところ、Windowsでは Twinbridgeを利用した文字表示に限定されており、Twinbridge を使用しな

い場合には日本語の表示はできません。日本語表示には、Twinbridge社の Japanese Partner(製品) を使

う必要があります。

20.2.3 フォントの設定

Macintosh では日本語システムを使用し、Windowsでは Japanese Partnerをインストール後起動してある

ことを確認したら、CLANの表示フォントの設定を行います。Macintoshの場合、CLANのデフォールトフォ

ントは Monacoに設定されています。新しくファイルを作成するときには、Fontメニューから大阪等幅フォ

ント(あるいは、ASLFont+などの等幅フォント)を選びます。既に作成してあるファイルを表示する場合に

は、テキストをすべて選択してから Font メニューで日本語フォントに設定します。

Windows の場合には、日本語表示が問題なく行われていても、以下の手順で正しく日本語フォントを設定

してください。設定が正しく行われていない場合、CLANが正常に動作しません。なお、Windows 版 CLAN

の操作方法は、開発中のため変更が加えられることがあります。最新の操作方法については、適宜発行される

別刷りの操作説明を参照するか、JCHAT ホームページ http://jchat.sccs.chukyo-u.ac.jp/clanwin をごらんく

ださい。

1. Twinbridge 社の Japanese Partnerが動作していることを確認する。

2.少なくとも日本語フォントがひとつインストールされていることを確認する。日本語フォントは "Jpn" の

文字で始まっていなければならない。Japanese Partnerがインストールされている場合には、適切な日本

語フォントがインストールされます。

3.初めて CLANを使用するときには、Viewメニューから Set Fontを選び MS 明朝を選びます。既に作成し

てあるファイルを表示する場合には、Edit メニューから Select All を選択するか Controlキーを押しなが

ら a キーを押してテキストをすべて選択してから Font メニューで日本語フォントに設定します。

20.3 エディター設定とオプション

CLANエディターは、オプション設定を変更することができます。Editメニューから CLAN Optionsを選

ぶと次のようなダイアログボックスが現れます。

各オプションの意味は、以下の通りです。なお、設定は再起動後に有効になります。

1. Checkpoint every: ファイルの自動保存を行うまでの入力単語数。

2. Codes �le: コーダーモードで使用するコードリストファイルを指定します。

3. key-bind �le: キー操作を定義したファイルを指定します。通常は必要ありません。

4. Limit of lines in Clan window: Clan Window の最大表示行数を設定します。

188

Page 213: JChatman

20.4. モード切り替え

図 20.1: CLAN エディターのオプション設定ダイアログボックス

5. Disambiguate tier name: 解析結果選択モードで参照するティア名を指定します。

6. No backup �le: バックアップファイルの自動作成を抑制します。

7. Start in non-editor mode: 新規編集ウィンドウを起動時に表示したくないときに指定します。

8. Use CA mode instead of default CHAT mode: CAIN モードでビデオ編集を行う際に指定します。

9. show cursor position in percentages: 行番号の代わりにパーセンテージでカーソルの位置を表示します。

10. auto-wrap in Editor mode: エディター使用時に行の自動折り返しを行います。

11. auto-rap Clan output: Clan Output ウィンドウで行の自動折り返しを行います。

12. recognize prosodic delimiters: 単語内の音調記号を無視しないようにします。

13. check words for illegal character: ASCII 文字以外の文字に対して警告するようにします。

14. non-Edit mode: CHAT モードで動作する場合を指定します。

always: 常に CHATモードで動作

never: 常に non-CHATモードで動作

auto: 両モードをファイル形式から自動判別して動作

20.4 モード切り替え

CLANには、6つの動作モードがあります。(1)コーダーモード、(2)CHATエディターモード、(3)Non-CHAT

エディターモード、(4)Sonic作成モード、(5)Sonic再生モード (6)候補選択モードです。各モードの切り替え

は、Mode メニューで適切なモードを選ぶか、次のようなキーボードショートカットを使用します。

189

Page 214: JChatman

第 20章 CLANエディター

CHAT $ Non-CHAT Escape キーを押して放し、m キーを押す

コーダー $ エディター Escape キーを押して放し、e キーを押す

選択モード $ エディター Escape キーを押して放し、2 キーを押す

Sonic 作成 $ エディター Escape キーを押して放し、0 キーを押す

Sonic 再生 $ エディター Escape キーを押して放し、8 キーを押す

シングルクリックで再生を一時停止します。ダブルクリックで再生を終了し、元のモードに戻り

ます。

20.5 Sonic CHAT

トランスクリプトを直接音声ファイルにリンクしたい場合には、CLANエディターに含まれる Sonic CHAT

モードを使用します。このモードでは、通常の CHATファイルを音声ファイルにリンクし%snd 行を自動的に

生成します。実際にどのように動作するかは、CHILDES CDROM に含まれるサンプルファイル boys85.cha

を試してください。このファイルは boys85 という音声ファイルにリンクされており、音声を聞くことができ

ます。まず、boys85.cha を CLAN で開き、次にカーソルを適当な行に移動します。そして、Macintosh の場

合には Command キーを押しながらクリック、Windows の場合には Control キーを押しながら左ボタンでク

リックします。すると、音声が聞こえるはずです。なお、boys85 音声ファイルは boys85.cha と同じフォルダ

にない場合音声ファイルの場所を聞いてくるので、ファイルを選択するようにします。

なお、Sonic CHAT で扱えるデジタル音声ファイルは、22.050KHz、モノラル、8bit、圧縮なしの条件でサ

ンプリングされたもののみです。この条件を満たせばどのようなソフトウェアで作成したものでも使用可能で

す。なお、音声ファイルの形式は、Macintoshの場合は AIFF、Windows の場合はWAVフォーマットを使用

してください。

20.6 Sonic作成モード

音声ファイルさえを準備すれば、すぐに Sonic CHAT を使ってファイルにリンクすることができます。こ

こでは、音声ファイルの内容は既に文字化されファイルが作成されていると仮定します。また、リンクを作成

するためには、音声ファイルは予め作成されていなければなりません。まず、通常のように、リンクさせたい

ファイルを開き、エディターモードに入ります。ここで、Mode メニューから Sonic modeを選ぶか、Escape

キーを押して放し、0 キーを押して Sonic作成モードに入ります。音声ファイルの位置を聞いてくる場合があ

りますので、ファイルを指定します。すると、スクリーン下部に音声波形が現れ、Sonic 作成モードに入った

ことが分かります。この時点で、以下のようないくつかの機能が使用できるようになります。

1.音声波形から音声を再生する

波形の適当な区間をマウスで選択してハイライトさせると、任意の部分を再生することができます。もう

一度再生する場合には、ハイライトさせた部分を、Macintoshは Command キーを Windowsは Control

キーを押しながらクリックします。

2.波形選択範囲の調整

選んだ波形の選択範囲を変更する場合には、Shift キーを押しながらより広い部分をクリックすれば変更

が容易に行えます。また、Shift キーを押した状態では、境界部分をドラッグして移動させることもでき

ます。

3.トランスクリプション

波形の操作をしている間も、通常の CHAT モードと同じように文字をタイプしてファイルを編集するこ

とができます。音声を聞きながらトランスクリプトがタイプできるので便利です。

4. リンキング

190

Page 215: JChatman

20.7. Sonic 再生モード

選んだ波形部分の音声が、トランスクリプトの該当部分とずれがないこと、そしてカーソルがその発話行

にあることを確認したら、波形の左端にある s マークをクリックします。すると、カーソルのある行の下

に %snd行が生成され、選んだ波形部分の始点と終点がミリ秒単位で表示されます。同じ操作を Macintosh

の場合は Command キーを押しながら、Windows の場合は Controlキーを押しながら i キーを押すこと

で実現できます。また、Mode メニューの Link sound to text を選択しても同じです。なお、既に %snd

がある行に対してこの操作を行うと、%sndが更新されます。

5. 該当する波形部分の呼び出し

特定の発話行にリンクしている波形部分を呼び出すには、その発話行をトリプルクリックします。

図 20.2: Sonic 作成モード

20.7 Sonic 再生モード

Sonic再生モードを使用すると、Sonic CHAT で作成されたファイルの全発話を連続して再生することがで

きます。このとき、再生されている発話文はハイライトされ、順次色が反転していきます。まず、Sonic 作成

モードがオフになっていることを確認し、Mode メニューから Continuous playbackメニューを選んでくださ

い。あるいは、Escape キーを押して放し、8キーを押します。再生が始まったら、一旦再生を止めるにはシン

グルクリック、再生を中止するにはダブルクリックします。同様の操作を繰り返せば何度でも再生することがで

191

Page 216: JChatman

第 20章 CLANエディター

きます。連続再生ではなく、一部のトランスクリプトだけを聞きたい場合には、その行の%snd行を Macintosh

の場合は Commandキーを押しながら、Windowsの場合は Controlキーを押しながらクリックしてください。

20.8 ビデオモード

動画ファイルを用意すれば、Sonic CHATと同様にしてトランスクリプトと画像ファイルをリンクすること

ができます。しかし、まだ十分に自動化されていないので、使い勝手は多少落ちます。次の手順を踏んでくだ

さい。なお、ビデオモードを利用するためには、QuickTimeがインストールされている必要があります。

1. CLAN エディターを起動する。

2. movie1.mov という動画ファイルに対応するファイルとして、movie1.cha を作成する。

3.該当する発話行の下に %mov: "clip1" 1 20000とタイプする。

4.カーソルをこの行に移動し、Macintoshの場合は Commandキーを押しながら、Windowsの場合は Control

キーを押しながらクリックします。これにより、動画ファイルの最初の数秒が再生されるようになります。

10分の動画ファイルの場合、終点は 300,000ぐらいになるでしょう。

5.同様にして、必要な発話行に対して、%mov 行を作成していきます。

動画ファイルの適当な位置を CLAN エディター内から特定することは現時点ではできないので、他の方法

を援用してください。

20.9 候補選択モード

Mode メニューの Disambiguate tierを選ぶと、候補選択モードに入ります。Escape キーを押して放し、2

キーを押すことでも起動します。このモードでは、%mor行に含まれるあいまいな解析出力が探され、それぞ

れスクリーン下部にリストされます。適切な候補をダブルクリックするか、カーソルキーで選択したあとでリ

ターンキーを押すとその選択候補が確定されて代わりに挿入されます。あいまいな解析出力は、^記号を挟ん

で同時に表記されています。たとえば、N|back^Prep|backは、それぞれ名詞と前置詞の "back"があいまい

な候補として出力されているわけです。

デフォールト設定では、解析選択モードは %mor 行に対して動作しますが、その他のディペンデントティ

アに対して使用することができます。20.3 のオプション設定を参照してください。試しにライブラリディ

レクトリに含まれている sample.cha ファイルを試してください。すると、2 番目の %spa 行まで移動し、

%spa:$RS:sel:ve^$DES:tes:veがハイライトされるはずです。スクリーン下部には 2 つの候補が示され、

希望するほうを選んでリターンキーを押せば、その候補が挿入されます。

20.10 コーダーモード

コーダーモードでは、あらかじめコードのパターンをファイルに記述しておくことで、さまざまなコード入

力が極めて体系的に行うことができます。コーダーモードに慣れるためには、使用方法について少し練習が必

要です。まず、ライブラリディレクトリにある sid.cha ファイルをダブルクリックして CLAN を起動させてく

ださい。このファイルは最初の*MOTの発話が I-'ll tell you what.になっているはずです。そして、適当

なメインラインにカーソルを移動したあとコーダーモードを起動します。Mode メニューから Coder modeを

選ぶか、Escape キーを押して放し、e キーを押します。すると、コードファイルはどこか聞いてきますので、

適当なファイルを指定します。ここでは、ライブラリディレクトリにある codes1.cut を指定します。

192

Page 217: JChatman

20.10. コーダーモード

20.10.1 コードの入力

この段階で、code1.cut ファイルの最初の行に指定されたコーディングティアのレベルがスクリーンの下部

に表示されます。ここでの例では、%spaしかありませんので、それをクリックするかリターンキーを押して確

定します。すると %spa というディペンデントティアが挿入され、スクリーン下部にはひとつ下のレベルの候

補が表示されます。同様にして、そのレベルのコードが確定するとそのコードが %spa に挿入され、さらに下

のレベルのコードの候補がスクリーン下部に挿入されます。ハイライト表示されているコードを移動するには、

カーソルキーを使用します。また、各レベルのコードの一覧を見るには、Escape キーを押して放し、sキーを

押すと候補が次々に現れます。試しに、$POS:COM:VE というコードを完成してみてください。

図 20.3: コーダーモード

入力中のコードのうちすべてのレベルを入力せずにコーディングを終了したい時、すべてのコーディングが

終了した場合には、Escape キーを押して放し、c キーを押して中断します。次のコーディングポイントへ移

動するには、カーソルキーを使用します。マウスで移動するとコーダーモードから抜けてしまうので注意して

ください。その場合は、もう一度コーダーモードに入り直します。また、次の行に移動して引き続きコーディ

193

Page 218: JChatman

第 20章 CLANエディター

ングを行う場合には、Control キーを押しながら t キーを押すこと移動できます。その行で処理を行わず、さ

らに次の行へ移るためには、もう一度 Control キーを押しながら t キーを押してください。

もしコーディングを特定のスピーカーだけに行いたいときには、Control + t キーによって移動するメイン

ラインを制限することができます。これには、コーダーモードを一旦抜け (Escape + c)、Escape キーを押し

た後に放し tキーを押してください。どのメインラインを対象とするか聞いてきますので、たとえば CHIのよ

うにタイプします。リターンキーを押して確定させれば、その時点からコーダーモードでの Control + tは次

の *CHI 行に飛びその他のメインラインをスキップするようになります。

もし何か他の操作をしようとした時に Finish coding current tierというエラーメッセージが出たら、Escape

キーを押してから放し、c キーを押してください。コーダーモードから抜けて操作ができるようになります。

これまでのコーディングモードでのコマンドをまとめると次のようになります。

コマンド 機能

Escape + c 現在のコーディングレベルを抜ける、あるいはコーディング

そのものを終了

Escape + t コーディング対象を特定のティアに制限

Escape + s 現在利用可能なコードリストをトグル表示

Escape + Escape 次のメインラインに移動

Control + c 現在スクリーン下部でハイライトしているコードをカーソル

位置に挿入

Control + t 現在のティアのコーディングを終了し、次のティアへ

Control + g 誤った入力コマンドをキャンセル

20.10.2 コードファイルの作り方

本格的にコーディング作業を行うときには、自分自身のコードファイル (codes.cut) を作成して使用します。

コードファイルの作成時は、CLANエディターが CHATモードになっているか確認してください。コードファ

イルの名前は自由に設定することができます。codes.cut の第一行目では、エディター動作の初期設定を行いま

すが、以下のような形式になっています。

\ +b50 +d +l1 +s1

+bは、オートセーブまでに処理される単語の数ですが、多すぎたり少なすぎたりする場合は好みに応じて

変更することができます。+dを指定すると、バックアップファイルが作成されなくなります。+lはよく選択

する候補を頻度順に並べ換える操作を指定しますが、次の三種類の選択ができます。

0 変更を加えない

1 最も頻度が高いコードを先頭に移動

2 頻度順にひとつ上に移動

+sオプションが指定されていると、簡略表記された codes.cut ファイルを自動的に補完し、すべて同じコード

が階層化されていると解釈します。たとえば、次のようなファイルでは2、

\ +l1 +s1 +b50

%spa: <--- ここにはタブをひとつ入れます

$MOT

:POS <--- 階層が一段深くなるごとに半角スペースで字下げします

:Que

2ここで n は日本語キーボードでは¥と表示されているキーを表します。

194

Page 219: JChatman

20.10. コーダーモード

:Res

:NEG

$CHI

以下のようなファイルを作成したのと同じ結果が得られます。

$MOT:POS:Que

$MOT:POS:Res

$MOT:NEG:Que

$MOT:NEG:Res

$CHI:POS:Que

$CHI:POS:Res

$CHI:NEG:Que

$CHI:NEG:Res

したがって、8種類のコードの組み合わせをすべて網羅的に列挙する必要はないわけです。+s1 オプション

を設定することで、コードが省略されている部分は記述されている部分と同じ候補があるとみなされます。

もし、あるコードの前にスペースを入れたい場合には、スペースの前にダブルクォートを入れれば実際の文

字として認識されます。たとえば、$MOTと$CHIの前にスペースを入れたい場合には、次のようになります3。

\ +l1 +s1 +b50

" $MOT

:POS

:Que

:Res

:NEG

" $CHI

もし、論理的可能性な組み合わせのうちにひとつでも存在しない組み合わせがあれば、(不要なコードの組

み合わせができてしまうので)その部分は個別にすべて記述される必要がありますし、+sオプションは使うこ

とができません。

この codes.cut ファイルの作成は、CLAN エディター の操作の中で最も難しい部分です。しかし、一旦作

成してしまえばその後はほとんど変更する必要がないので、うまく設定して大いに活用するようにしましょう。

もしうまく動かないときには、配布プログラムのライブラリディレクトリにある codes.cut を参考にしてくだ

さい。

3ここで n は日本語キーボードでは¥と表示されているキーを表します。

195

Page 220: JChatman
Page 221: JChatman

第21章 CHECK | データの表記法のチェック

中則夫・白井英俊CHAT ファイルのデータの表記をチェックするためにはふたつの方法があります。ひとつは、CLANエディ

ターから CHECKを起動する方法で、ESC-Lと入力するとチェックを開始します。もうひとつは、CLANエディ

ターからではなく、CHECK を単体のプログラムとして起動する方法です。指定したファイルの内容をチェック

して、その結果を画面上やファイルに出力します。エラーがあった場合には、その行と、どこが間違っている

のかの説明が表示されます。

21.1 CHECKの動作

CHECKは 2パスで動きます、つまり二回ファイルをチェックします。一回目はファイルの全体的な構造をチェッ

クします。具体的には、

1.ファイルが @Begin で始まり、@Endで終わっているか。

2. 各行が、*か @か %か タブで終わっているか。

3.コロンがメインラインやデペンデントティア、記入項目があるヘッダーで正しく使われているか。

をチェックします。もし、この段階でなにか問題がある場合には、CHECK はチェックを中止して問題のある箇

所を出力し、その次の段階には進みません。これは基本的なエラーがあると、その後の細かいチェックが正し

く行えないことがあるからです。したがって、この段階でエラーが報告されたならそれらをすべて訂正する必

要があります。すべてのエラーが除去されるまでは、どんなファイルでも CHECKにパスしたとは考えないでく

ださい。

一回目のチェックが問題なく完了すると、CHECKは二回目のチェックを行います。このチェックはファイルの

細かな構造をチェックしますが、これには dep�le.cut ファイルに依存して行われます。dep�le.cutファイルは

CLANと共に配布されていますが、これには許されるディペンデントティアやヘッダの名前、メインラインや

いろいろなディペンデントティアの内容として許容できる文字列や単語を定義してあります。このファイルは

\childes\clan\libディレクトリかワーキングディレクトリになければなりません。Macintoshの場合は、ラ

イブラリディレクトリ (LIBフォルダー)に置いてください。このファイルが見つからない場合には、Macintosh

の場合、どこにあるかの問い合わせが行われます。

CHECKがどのように動くか見るには、ライブラリディレクトリにあるその kid10.chaファイルを開いて見て

ください。このファイルにはいろいろなエラーが含まれています。そこで ESC-Lをタイプして試してみてくだ

さい。そしてエラーを訂正してください。そして CHECKがエラーを返さなくなったならば、CHECKがどのよう

に CHAT形式のファイルを検査するかについて学んだことでしょう。

21.2 dep�le.cutの作成

dep�le.cutは、ファイルの形式を統一するのに重要な働きをしますから、dep�le.cut の内容をみだりに変更

することはしないでください。CHAT 形式が変更されたときに、それを反映するため、dep�le.cutの内容を開

発者側が 変更することがありますが、それでもよほどのことがない限り変更は行いません。もしも CHAT 形

197

Page 222: JChatman

第 21章 CHECK |データの表記法のチェック

式を拡張したり修正したりすることが必要になったならば、その場合は、その変更内容を \00depadd.cut" と

いうファイルに記入してください。00depadd.cut は、チェックするファイルと同じ場所 (つまり通常はワーキ

ングディレクトリ)に置きますが、CHECK は 00depadd.cut の内容を dep�le.cut に自動的に付け加えてチェッ

ク処理を行います。00depadd.cutを使っている時は、標準的な CHAT 形式とどう違うのかを説明する文書の

一形式として、データファイルにいつも 00depadd.cutファイルを添付する必要があります。

CHECK を効率的に使用したり、00depadd.cut ファイルを作成するには、dep�le.cut のファイル形式を理解

することが必要です。\dep�le"は、要するに CHAT 形式のエッセンスをまとめたもので、ヘッダー、メイン

ライン、ディペンデントティアの構造に関する定義が記述されています。定義内容の基本方針として、許容し

たい構造をすべて dep�le.cut と 00depadd.cut に記述することになります。

1. @Begin のように内容を伴わないヘッダーは、一行にひとつずつ、この形で記入します。

2. @Commentsのように内容記述を伴うヘッダーは、そのヘッダーに続けて、コロン (:)、タブ、そしてどの

語の記入も許すことを表すアスタリスク (*)をファイルに記入します。

3. @Ageのように、日付が記入されるヘッダーに対しては、年号を表す \y"、月を表す \m"、日を表す \d"を

用いて形式を記述します。そして小文字は数を、大文字は文字の記入を表します。日付の標準的な記法は

@d<dd-MMM-yyyy>のように表され、14-NOV-1956がその例です。年齢の標準的な形式は@d<yy;mm.dd>で

あり、2;5.17がその例です。資料収集の時間は@d<hh:mm-hh:mm>が標準的な形式であり、12:15-14:30

がその例です。

MOTや CHIのような特定の登場者の名前は \Age of #"のようにヘッダーでは# 記号で表されます。

4.ヘッダーの定義に続いて、*:が左にある行が現われます。これはメインラインのマーカーです。このアス

タリスクに続いて許される文字列が現われます。最初の記号がアスタリスクです。これにより CHECKはア

ルファベット文字から始まるどんな単語も許容することになります。

5. メインラインの定義の後には、いろいろな接頭辞や接尾辞の定義が来ます。標準的な dep�le.cutは英語用

に作成してあり、英語のさまざまな接頭辞や接尾辞を登録してあります。これらは他の言語用に変更可能

です。文字で始まる単語はすべて可能な形として許容されます。しかし、ダッシュ(-)やブラケット ([)か

ら始まる文字列はすべて記述しておかなければなりません。接尾辞は *-接尾辞、接頭辞は*接頭辞# とい

う表記法を使用して定義します。

6. メインライン定義には CHATのすべての特殊形を含んでいます。

7. メインラインの定義の次には、ディペンデントティアの定義があります。基本的にはメインラインの場合

と同じですが、内容は若干異なっています。

8. メインティアに現われる語と異なり、ディペンデントティアの語は接頭辞や接尾辞に分けられません。こ

のため、ディペンデントティアに接頭辞や接尾辞を明示的に記入したいならば、自分の \00depadd"ファ

イルのそのティアの部分に [AFX]コードを付け加える必要があります。もしもメインの \dep�le"にも自

分の \00depadd"ファイルにもコーディングするティアにアスタリスクがないならば、 \00depadd"ファ

イルにそのティアで使いたいすべての単語接辞の組合せや型を記入する必要があります。

9.標準的な \dep�le"の %morの行にある [UTD] は、すべての発話区切り記号 (例えばピリオドや感嘆符記

号など)が含まれていることを許容するための特別な記号です。%morの行に発話区切り記号が現われるの

がいやならば、00depadd.cut ファイルを作って、その%mor行に [-UTD]と記入する必要があります。ま

た、%mod の行にある [IGN]記号は、特定のディペンデントティアにある記号のチェックを抑制する特別

な記号です。

21.3 CHECKを走らせる

CHECKを走らせるにはふたつの方法があります。CLANエディターを使って新しくデータを作っている場合

は、エディターから CHECKの起動が簡単でしょう。ESC-L を入力すれば、CHECKが起動しファイル全てを検

査して、エラーがあればその部分をハイライトし、どのような誤りかを表示します。そのエラーを直してから

198

Page 223: JChatman

21.4. CHECKを使うためのヒント

また CHECKを続ければよいのです。

CHECKを走らせるもうひとつの方法は、コマンドウィンドゥからコマンドを実行する方法です。いくつかの

ファイルをいっぺんにチェックするにはこの方法が適しています+reオプションをつければ再帰的に下位のディ

レクトリの中のファイルまで検査します。この場合、 00depadd.cutファイルが検査するファイルのディレクト

リに あれば、それを用います。CHECKの出力を CLANの出力ウィンドゥに送れば、そのウィンドゥで示され

たエラー表示において、ファイル名をトリプルクリック (クリック三回)すると CLANエディターはそのファ

イルを開いて、エラーの箇所に連れて行ってくれるでしょう。これはファイルが多いけれどもエラーが少ない

ような場合に特に有効な方法でしょう。

21.4 CHECKを使うためのヒント

1. 特に CHAT の書き方を覚えようとしている場合は、なるべく早く、そして頻繁に CHECK を使ってみてく

ださい。書き起こしを始めたならば、たとえデータの入力が終わっていなくても、ESC-L を押して、エ

ディターの中からファイルを検査してください。もし CHECKに何かひっかかったら、それはあなたが学ば

なければならないところであり、これを修正することによって、将来同じような間違いを繰り返すことを

未然に防ぐことができるのです。

2. 00depadd.cut ファイルにどのようにコードを追加するか、その方法を学んでください。*や *$ のような

自由度の高い記述はなるべく避けてください。なぜなら、それらを使ってしまうと、コードの中に含まれ

る不正なエラーを見過ごすことになりかねません。

3.もしあまりにも多くのエラーがでて、圧倒されてしまった場合には、+d1 スイッチを使って、エラーのタ

イプごとに一つの報告をするようにさせるか、もしくは-t% スイッチを指定して、まずメインラインのエ

ラーだけにしぼってエラーを表示させるようにしてください。

4.エディターの機能の一つである対話型の検索置換機能の使い方を覚えてください。また CHSTRING を使用

して、複数のファイルにおいて検索置換する方法も覚えてください。

21.5 CHECKのオプション

CHECK において独特な意味を持つオプションには、以下のようなものがあります。

1 +c: デフォルトでは、CHECKは 00depadd.cut ファイルを探して使います。しかし、もし 00depadd

ファイルとして別の名前のファイルを使用したい場合には、このスイッチに続けてそのファイル名を指

定します。

2. +d: 同じタイプのエラーが何度も出てくるのを抑制します。最初に CHECK を使用したファイルに

何度も同じエラーが繰り返し出てくる場合に効果的です。しかし、訂正すべき多くの種類のエラーを見

過ごすことがあるので、このスイッチを使いすぎないように注意してください。さらに +d1 スイッチを

指定すると、エラーをタイプごとにただ一個だけしか表示しないようにすることができます。

3. +e: 特定のタイプのエラーを検索するときに使用します。エラーのタイプ番号は、次のコマンドを

実行すれば表示されます。

check +e

たとえば、16番のエラータイプを追跡する場合には、次のコマンドを実行してください。

check +e16 *.cha

199

Page 224: JChatman

第 21章 CHECK |データの表記法のチェック

4. +g1/-g1: | 音調曲線記号を発話の区切り記号として扱う +g1 スイッチが使用されると、-. や

-? などの音調曲線記号を、8章で述べたように発話の終わりを示す終端記号として扱います。-g1 は、

その設定をさらに元の設定に戻し、これらの音調曲線を発話の区切り記号とはしません。

+g2/-g2: | タブのチェックを抑制 デフォルトでは、メインラインでは、コロンの後のタブは必要

です。しかし、一部のワープロソフトではタブを含んだファイルを出力できません。この問題を一時的

に回避するために、タブのチェックを一時的に抑制するのが+g2 スイッチです。-g2を使用すると、設定

を元の状態に戻すことができます。

+g3/-g3: | 単語内のチェックを省略 CHECKは単語の内部構造についても簡単なチェックを行いま

すが、+g3 スイッチを使うと、CHECK は単語内に数字、大文字、不適切なアポストロフィなどがないか

までチェックします。-g3はこの設定を元に戻します。

上記以外のオプションについては、コマンドウィンドゥで CHECKと入力すればそのリストが得られます。まず

プログラムに固有のオプションが表示され、続けて一般的なオプションが表示されます。

一般的なオプションについては 26章を参照してください。

200

Page 225: JChatman

第22章 COMBO |ブール関数を用いた検索

中則夫・白井英俊COMBO は通常の文字列検索に加え、強力なブール関数を用いた検索を行い、検索文字列をデータ中の文字、

単語、単語の連鎖などに自由にマッチさせることができます。この機能は、統語的に分析に興味がある研究者

にとっては特に重要です。検索文字列は、+s/-sを用いてコマンドラインからも直接指定できますが、ファイ

ル内に検索文字列を収めて一度に検索することもできます。COMBOに慣れる際には、検索文字列の指定のしか

たが最も分かりにくい作業です。

22.1 検索文字列の指定方法

COMBO は基本的に単語単位の文字列にマッチする単語一致検索です。単語は単語境界記号によって分けられ

ている文字列で、特定の検索文字列を指定した場合に単語とマッチするかどうかを計算します。したがって、

単語の一部とマッチするような部分一致検索を行う場合には、メタキャラクタを使用するか、+g オプション

を指定して文字ベースでの検索に切り替える必要があります。

ブール関数を用いた検索は、データ中に含まれる単語や単語の組み合わせを定義する効率を高めるために代

数記号を使用します。ブール関数には、followed by, or, notがあります。これら 3種類の論理関数に加え、*,

, \ の 3種類のメタキャラクタが使用できます。メタキャラクタは、ワイルドカードまたは正規表現とも呼ば

れています。合計で、6つの特殊記号を使用して検索文字列を定義することができます。

意 味 記 号

直後に続く ^

(排他的でない) OR +

論理的 NOT !

繰り返し文字 *

一文字 _

引用 \

^ (続く) をふたつの文字列の間に入れることによって、最初の文字列の次に二番目の文字列が続いている連鎖

を探し出すことができます。+ (or) をふたつの文字列の間に使うと、ふたつのうちどちらか一方とマッチする

ことができます。両方にマッチする必要はなく、どちらか一方にマッチします。! (not) 記号を検索文字列の前

に含めると、その検索文字列を含まない文字列にマッチします。

^を使用した場合には、その前にある文字列はその後ろにある文字列がある時のみマッチします。たとえば、

検索文字列を big^cat とすると、big のうちすぐ後に catが続くときだけマッチし、big catが検索されま

す。さらに、big cat の他、すぐに続かないけれども共起する例を検索したい場合には、メタキャラクタを併

用して big^*^cat のような検索文字列にします。*は 0個以上のどんな文字でもマッチしますから、たとえば

big black catなどを検索できます。この場合、*は文字列だけではなく単語にもマッチする点に注意してく

ださい。なお、* 記号だけを +g や +x オプションと使うことはできません。

以上の論理関数に加えて、メタキャラクタも使用することができます。*はどんな数の文字にもマッチしま

す。また^*^ として用いると、どんな数の単語にもマッチします。 はどんな一文字にもマッチします。ピリ

201

Page 226: JChatman

第 22章 COMBO |ブール関数を用いた検索

オドで終わる一つの単語にマッチさせたいときは、+s"_*." を指定します。_* の部分は、_が * によって任

意の数だけ繰り返されますので、どんな単語でもマッチします。さらにその後にはピリオドがついているので、

すぐ後ろにピリオドがあるどんな単語にもマッチします。たとえば、\cat." などが検索できますが、この場合

は c に、*は at にマッチしています。

nは、直後の特殊記号の意味を打ち消し、文字どおりの意味にします。つまり、もし * や をメタキャラク

タではなく、その文字そのものとして検索したい場合には、それらの文字の前に n をつける必要があります。

そのため、\*, \_はそれぞれ *, にそれぞれマッチします。メタキャラクタは、幅広い文字列の定義に特に便

利です。たとえば、\weight", \weighs", \weighing", \weighed", \weigh"などの語を検索したいときには、こ

れらの単語をすべて検索文字列に指定する必要はなく、weigh*と指定するだけで大丈夫です。メタキャラクタ

は、文字列のどの位置でも使用することができます。

COMBOは、検索文字列にマッチする文字列を発見すると、その文字列が含まれる文全体を表示します。もし、

+w, -w スイッチを使用している場合には、マッチした文字列が含まれる文の前後の文脈も合わせて出力されま

す。これら、文字列を含む文と、その前後の文脈を併せて以下では「ウィンドゥ」と呼びます。

22.2 検索文字列の例

次のコマンド例は、sample.cha ファイルを検索し、\want" の直後に \to" が続いている文字列にマッチし

てそのウィンドゥを表示します。

combo +swant^to sample.cha

直後に続いているという条件に加えて、単に後ろに続いている文字列を検索したい場合は、次のようなコマン

ドを実行します。

combo +s"want^*^to" sample.cha

次のコマンド例は、want と to が連続していればどのような語順であってもマッチします。+x は、語順を無

視するオプションです。

combo +s"want^to" +x sample.cha

次の例では、たとえば sample.cha と sample2.cha ファイルを検索し、\wonderful" か \chalk" を含むウィン

ドウを表示します。

combo +s"wonderful+chalk"; sample*.cha

次の例では、sample.cha の中で、\neat" のうち直後に \toy" か \toys" が続かない例をすべて表示します。

\toy"の前に ! (not)が使用され、\toy"が続いてはいけないという指定を行っていることに注意してください。

combo +s"neat^!toy*"; sample.cha

次の例では、\see" の直後に \what" か \toy*"が続いている例にマッチします。

combo +s"see^(what+toy*)" sample.cha

このように、検索文字列の解釈をはっきりさせるためにかっこを使用することができます。次の例も参照して

ください。

combo +s"what*^(other+that*)" sample.cha

この場合、\what" の直後に \other" か \that" が続いている例がすべて検索されます。検索出力例として、

\what that", \what's that", \what other"などがあります。直後という条件が効いているので、\what is that"

とか \what do you want"などはマッチしません。COMBOがコマンドを左から右に解釈する性質上、かっこは

コマンドラインでは必要な処置です。次のような例でもやはりかっこは必要です。

202

Page 227: JChatman

22.3. ファイルに収めた検索文字列を参照する場合

combo +s"the^*^!grey^*^(dog+cat)" sample2.cha

このコマンド例では、まず \the" のうち直後あるいは単に後ろに \grey" 以外の文字列が続いていなければな

りません。それに加えて、直後あるいは単に後に \dog" か \cat" が続いている条件が加わります。この結果

マッチする文字列として、\the big cat" や \the boy with a cat" などがあり、マッチしない文字列として、

\the big grey cat"があります。もし、かっこが使われないと、プラスの前の文字列か、\cat"にマッチするこ

とになってしまいます。検索文字列に含まれる^*^ は、直後か直後ではない後に続くという指定で、間にどん

な単語がいくつあってもよくなります。もし代わりに ^ だけを用いると、\the" の直後に \grey" が続かない

例にだけマッチします。

22.3 ファイルに収めた検索文字列を参照する場合

+s スイッチの次には、検索文字列をひとつでもふたつでも指定できます。加えて、ファイルに収めた任意の

数の検索文字列も使用することができ、また複数の文字列ファイルを指定することもできます。たとえば、前

置詞と冠詞の組み合わせを次のようなコマンドで検索することができます。

+s@preps^@arts

このコマンドを使用する場合には、あらかじめ前置詞の一覧をファイルにした \preps"と、冠詞の一覧をファ

イルにした \arts" をそれぞれ用意しておかなければなりません。このように、いろいろな品詞や意味の単語

をリストしたファイルを分類、作成しておけば、COMBO 上でそれらを呼び出し、広範囲な統語的あるいは意味

的な検索、分析を行うことができます。英語マニュアルの 22章の語彙リストには、単語のグループ化につい

ていくつかのヒントが提案されています。一番簡単なリストとしては、法助動詞や前置詞、冠詞などをすべて

集めたものなどが考えられます。この場合には、方言による変異形や、datや thatなどの異形態を含めるのを

忘れないようにしてください。

22.4 COMBO におけるクラスターペア

ほとんどのコンピュータープログラムは、一行ごとに処理を実行します。もしマッチする文字列を発見した

らその文字列を表示し、その次の行に進むようになっています。しかし、CHATの場合には、メインラインと

それに付属しているディペンデントティアという独特の構造のため、行ごとというよりはクラスター (行のま

とまり)単位で CLAN の検索が適用するほうが便利です。クラスターという単位は、COMBOや KWAL などの検

索プログラムでは特に重要になります。クラスターは、単一のスピーカーによる単一の発話、およびそれに付

属するすべてのディペンデントティアとして定義できます。CLANでは、デフォールトでは一度にひとつのク

ラスターを分析しています。さらに COMBO では、+b スイッチを用いることでこの基本的な検索範囲を隣接す

るクラスターに拡大することができます。しかし、このスイッチの使用はクラスター間の検索が必要なときだ

けにしたほうがよいでしょう。クラスター間の検索はプログラムの実行速度を落とすことが多いからです。

22.5 クローズメイトの検索方法

%syn ティアで分析を行う際には、マッチする対象をクローズメイトとして同じ節内あるものに制限できる

と便利です。次のふたつの %syn ティアを考えてみましょう。

%syn: ( S V L ( O V ) )

%syn: ( S V ( S V O ) )

203

Page 228: JChatman

第 22章 COMBO |ブール関数を用いた検索

もし目的語が後に続く主語をすべて検索するとしたら、二番目の例にあるような埋め込み文にあるタイプにマッ

チさせたいものです。しかし、もし+S^*^O のような単純な検索文字列を指定するとすると、最初の例に加えて

二番目の例もマッチしてしまいます。そこで、二番目の例を抑制するために、かっこを検索文字列に加えます。

+s"S^*^(!\(+!\))^*^O

これによって、間にかっこが含まれない S と Oだけがマッチし、最初の例はうまく除外することができます。

かっこにうまくマッチさせるために、%syn 行内ではかっこを半角スペースで囲むようにします。

22.6 文末にある単語の検索方法

発話文末の単語を検索するためには、検索文字列内に文境界の記号をすべて指定する必要があります。具体

的には、(\!+?+.)という文字列を使用します。3つの境界記号を有効にするために、全体をかっこで囲むよう

にします。これらの境界記号の前に生起する単一の単語を指定するには、_*を使用することができます。この

場合に、*は任意の数の文字にマッチするだけであって、任意の数の単語にマッチするわけではないことに注

意してください。COMBOでは、*は任意の数の単語にマッチしますが、_*は任意の数の文字にマッチするだけ

です。文末の単語には以下のコマンドを用いてください。

combo +s"_*^(\!+?+.)" sample.cha

+d2 スイッチを使用した場合には、パイプを通して FREQ に出力を送ることができます。

combo +s"_*^(\!+?+.)" +d2 sample.cha | freq

22.7 ファイルの最初にある語の検索方法

ファイルの最初をマークするような特殊な記号がないので、ファイルの最初にある発話の語を検索すること

は難しい。この問題を解く鍵は、以下のようにして、CHSTRINGを使って最初の文にマークをつけることです。

このためのよいマークは ++ 記号でしょう。というのはこれはほとんど他の用途に使われないからです。

chstring +c -ta" -t% +t* *.cha

これには、以下の行を持つ chagnes.cut ファイルを必要とするでしょう。

": " ": ++"

この一行だけを持つファイルには、二つの引用された文字列があります。最初のものはコロンの後にタブがあ

り、二番目のものはコロン、タブ、そして++があります。

22.8 除外する文字列の追加

COMBOは特定の単語を除外するための機能を持っていません。しかしながら、これは (1)パターンマッチン

グ、(2)CHAT形式でのマッチ情報の出力、(3)望んでいないマッチを変更して二度とマッチしないようにする、

(4) 元の検索文字列とマッチさせる、という手順を踏めば可能です。以下がその例です。

combo +s"*ing*" +d input.cha | chstring +c +d -f | combo +s"*ing*"

この分析の目的は、\ing"という特定の語尾をもつ単語だけとマッチさせることにあります。まず COMBOは

\-ing"で終る全ての語とマッチします。次に CHSTRINGは望まない語のリストを取り、\-ing"を例えば \-jng"

に換えます。そして COMBOをもう一度走らせて、望むものだけをマッチさせるのです。

204

Page 229: JChatman

22.9. COMBO を使った分析範囲の制限のしかた

22.9 COMBO を使った分析範囲の制限のしかた

発話の一部にだけ分析を制限したいときがよくありますが、CLANでは、その適用を制限するごく簡単なス

イッチがいくつかあります。たとえば、+t/-t スイッチを使うと特定のティアを分析に含んだり除外したりする

ことできます。しかし、このような簡単な制限方法だけでは不十分なため、COMBOや KWALを併用したもっと強

力な制限方法が必要になるときもあります。COMBOは、最も強力な制限能力をもったプログラムであり、+s ス

イッチを使用することによって文字列検索を利用したきめ細かい制御ができます。たとえば、sample.cha ファ

イルにおいて、*MOT に関係するすべてのスピーチアクトコードのうち、文内で \want to" が使われている

場面での出現頻度を計算したい場合には、次のコマンドを使用します。

combo +t*MOT +t%spa sample.cha +s"want^to" +d | freq +t%spa -t*

+t*MOT スイッチは、スピーカーを *MOT だけに対象を限定します。+t%spa によって、*MOT に付属する

%spa ティアを対象に含めることができます。デフォルトでは、ディペンデントティアは分析から除外されるこ

とに注意してください。+s"want^to"によって、現在対象に絞られている *MOTとその%spaのクラスターの

うち、さらに \want to"を含むクラスターだけに対象が絞られます。+d スイッチは、その他の情報を省略する

指定です。その後、検索結果はパイプを通じて FREQに渡されますが、FREQは渡された内容のうちメインライ

ンに対してのみ分析を行います。そのため、もし +t%spa, -t* の指定を行わないときは、メインラインの単

語の頻度が計算されます。FREQ の他にも、MLU や KEYMAP などに検索結果をパイプ出力することもできます。

COMBO を使用して、特定のコーディングティアを除外したファイルを作ることもできます。およそ次のよう

な種類のコマンドを使えば、KWAL や COMBO で実現できます。

combo +o@ -t% +f +s";*" +d *.cha

+o スイッチは、本来除外されるヘッダ部分を出力するのに必要です。-t スイッチによって除外したいディペン

デントティアを指定します。さらに、+t/-t スイッチを用いて、特定のスピーカーのメインラインやディペン

デントティアを削除することもできます。これらデータ出力の制御になれるためには、小さいファイルを使っ

ていろいろなオプションを実行してみることです。

22.10 COMBOのオプション

COMBO には、次のようなオプションがあります。

1. +b: COMBOはデフォルトでは一度にひとつのクラスターを分析対象とします。そのため、隣接クラ

スターも同時に分析する場合にはこのスイッチを使用します。

2. +d: COMBO はデフォルトではマッチした文字列の行番号も出力します。しかし、+d スイッチを使

用するとその出力を省略し、マッチした文だけを CHAT 形式で出力します。+d1 は、+d に加えて、行

番号とファイル名を出力します。これらには @Comment ヘッダーがついているため、CLANには無視さ

れるように配慮されています。以下のコマンドを試してみてください。

combo +s"want^to" sample.cha

combo +s"want^to" +d sample.cha

combo +s"want^to" +d1 sample.cha | freq

combo +d1 +s"_*^." sample.cha | freq

3. +g: COMBOは、単語単位と文字単位のどちらでも検索を行うことができ、検索モードを切り替える

ことができます。デフォールトでは単語単位で検索を行います。単語モードでは、指定した検索文字列は、

単語としてスペースで区切られているか、単語境界記号で区切られていると仮定され、その条件を満たさ

ない文字列にはマッチしません。したがって、単語内の部分文字列を検索する場合には、メタキャラクタ

205

Page 230: JChatman

第 22章 COMBO |ブール関数を用いた検索

を使用しなければなりません。しかし、文字モードに切り替えると、検索文字列を単純に文字列だと仮定

するので、単語内の部分文字列を直接検索文字列として指定できるようになります。文字モードへの切り

替えには +g スイッチを使用してください。通常の使用では、文字単位での検索モードはあまり使用しな

いでしょう。

メタキャラクタの解釈は検索モードによって変わってくるので注意してください。たとえば、単語検索

モードでの air*^planeという検索文字列でのアスタリスクの解釈は、\air plane", \airline plane", \airy

plane"などにマッチしますが、\airplane"にはマッチしません。これは、単語検索モードでは各文字列が

独立した単語として解釈されるため、上の例ではふたつの単語を探すからです。また、\air in the plane"

にもマッチしません。上の検索文字列では、^ 記号で結ばれている隣接するふたつの単語を探すので、な

にか別の単語が間に入っているとマッチしないのです。基本的には、単語検索モードで文字列を検索した

場合、たとえば \air" を指定した場合には_air_,_air., _air?, _air! などの文字列が検索されると考え

ます。この場合の下線はスペースか文頭にあるということを示しています。一方、文字検索モードの場合

には、同じ検索文字列 air*^plane であっても、解釈が異なります。\air plane", \airline plane", \airy

plane"などはもちろん、単語検索モードの場合にはマッチしなかった \airplane", \air in the plane"にも

マッチします。この場合にアスタリスクは、スペースも含めたいかなる数の文字ともマッチするからです。

しかし、air^plane という検索文字列の場合には、\airplane"にはマッチしますが \air plane" にはマッ

チしません。検索文字列にスペースの指定がないからです。一般的に、文字検索モードは単語検索モード

ほど役立つ場面は少ないでしょう。ひとつ考えられるとしたら、部分文字列だけを探すときに使用するこ

とができます。たとえば、\ing"がつかない \kick"の例を探したいとしたら、kick*^!^!ingという検索

文字列を使用すれば検索できます。

4. +o: +t スイッチを使用すれば、入力ファイルから特定のティアを含めたり除外したりすることが

できますし、COMBO の場合はそれが出力に含まれることになります。しかし、場合によっては、入力に含

まれないティアを出力に含めたいこともあります。このようなティアは、+o スイッチで指定することが

できます。たとえば、%mor など特定のティアにある要素だけを検索したいけれども、出力にはすべての

ティアを含めたいときなどがこれにあたります。このような場合には、次のコマンドを実行します。

combo +t%mor +s"*ALL" +o% sample2.cha

5. +s: 検索文字列を指定します。文字列は、すぐ後に指定しなければなりません。メタキャラクタに

ついては、本文および 26.2節を参照。複数の単語を検索する場合には、ファイルに書き込み、+s@ファイ

ル名、を指定します。

6. +t/-t: COMBOでは、デフォールトで検索対象に含まれるのはメインラインだけで、ヘッダーやディ

ペンデントティアは検索されません。もし特定のティアについてだけ検索したい場合には +t スイッチが

使えます。特定のティアを分析から除外するときには -t スイッチを用います。オプションの後にはティア

コードを直接指定することができます。特定のディペンデントティアを検索に含めると、そのメインライ

ンと共にクラスターとしてまとめられて処理されます。たとえば、the^*^kitten という検索文字列を指

定したときには、メインラインにある \the" と、そのディペンデントティアにある \kitten" がマッチす

ることにもなります。この機能は、メインラインにある特定の単語を、またディペンデントティアにある

特定のコードを含むスピーカーのティアだけを検索対象に含めたいときなどには非常に有効になります。

たとえば、\want"と \to" のどちらかが、%spa 行で模倣としてコード化されている場合や、\neat"が同

ティア継続としてコード化されている場合の出現頻度計算を行いたい場合には、次のふたつのコマンドを

実行します。

combo +s(want^to^*^%spa:^*^$INI*)+(neat^*^%spa:^*^$CON*) +t%spa +f +d sample.cha

freq +swant +sto +sneat sample.cmb

この例では、+s オプションによって \want", \to", $INI を検索文字列として指定し、それらが指定した

ティアでどのような順番でもでてきてもマッチするようにします。+t%spaオプションは、%spa ティアを

206

Page 231: JChatman

22.10. COMBOのオプション

検索対象にするために必要です。+d は、行番号などの付加情報の出力を抑制し、後の FREQ の処理に備

えるはたらきをします。なお、この例のふたつのコマンドは、パイプを使ってひとつのコマンドに折り畳

むことも可能です。

7. +x: COMBO の検索は、検索文字列を指定した順番で行われます。たとえば、dog^catという検索文

字列を指定すると、\dog cat" という順序で並んだ文字列だけがマッチします。しかし、検索を文字列順

不同にしたい場合には、+x オプションを使用します。すると、指定順と逆順の両方で検索が行われ、ど

ちらかにマッチするようになります。

combo +swant^to +x sample.cha

一般的なオプションについては 26章を参照してください。

207

Page 232: JChatman
Page 233: JChatman

第23章 FREQ | 出現頻度計算

中則夫・白井英俊CLAN の中で最も強力なのが、出現頻度計算を行う FREQ です。このプログラムは使い方が最も簡単であ

り、CLAN の使い方を覚えるのには最適のプログラムです。FREQ は特定のファイルの単語の一覧を出現頻度

つきで作成することができます。単語の出現頻度とは、単一あるいは複数のファイルに含まれる単語が何回出

てきているかを計算したものです。また、タイプ・トークン比率も算出することができます。タイプ・トーク

ン比率は、使われた単語の種類を単語の総出現数で割ったもので、どの程度語彙に多様性があるかに関する大

まかな目安になります。タイプ・トークン比率は同じ大きさの標本規模で比較するようにします。一般に標本

規模が大きくなるにつれて、タイプの数は横ばいになっていきます。

23.1 FREQ が無視するもの

CHATでは、データ入力が困難な内容を表記するためにふたつの特別な記号を用意しています。xxx記号は、

発話内容が聞き取り不能なことを示し、www 記号は技術的な理由で表記ができない場合に使用します。FREQ

は、このふたつの記号をデフォルトで無視します。また、0, &, +, -, # で始まる単語も計算から除外します。

したがって、これらの単語を計算に含めたい場合には、+s スイッチを用いて指定しなければなりません。また

FREQ はヘッダやディペンデントティアをデフォールトで除外するので、計算に含める場合には、+t スイッチ

を使用してそれらを指定する必要があります。

23.2 特定の語彙を計算する場合

FREQの最も単純な使い方は、ファイルに含まれるすべての単語の頻度を出すことです。それに加えて、FREQ

は特定の語彙だけの頻度を出すこともできます。たとえば、もし二才児の人称代名詞の発達に興味がある場合

などはこの機能が役に立ちます。また、接続詞や、前置詞、食物関係の単語などをそれぞれすべて表示させる

のもよいかもしれません。このように特定の単語の頻度を計算するためには、検索したい単語の一覧をファイ

ルに入力し、+s スイッチを使用してファイル名の前に @ 記号をつけます。たとえば次の例のようになります。

freq +s@articles +f sample.cha

この場合は、すべての冠詞を収めた \articles" ファイルを指定して、それらの頻度を計算します。

23.3 FREQ とワイルドカードの併用のしかた

FREQ の中で最も強力な使用方法のひとつに、ワイルドカードを組み合わせて使う方法があります。この方

法は、ディペンデントティアなどに入力したさまざまなコードの頻度を計算するときに特に威力を発揮しま

す。たとえば、\sample2.cha"ファイルにあるハンガリア語のデータを考えてみましょう。このファイルの先頭

行は、%mor 行を使って品詞と統語役割をコード化してあります。たとえば、N:A|duck-ACC, N:I|plane-ACC,

N:I|grape-ALL, N:A|baby-ALL のようなコードを含んでいますが、接尾辞は accusative(対格)と allative 格

209

Page 234: JChatman

第 23章 FREQ | 出現頻度計算

を、先頭の大文字は有性名詞と非有性名詞を表しています。ここで、有性名詞 (N|A)だけの頻度を知りたいと

きは次のようなコマンドを使用します。

freq +t%mor +s"N:A|*" sample2.cha

すると、次のような出力が得られます。

1 n:a|baby-all

1 n:a|ball-acc

1 n:a|duck-acc

この場合、+sスイッチの後の文字列は二重引用符 (")で囲むようにします。これは、ワイルドカードが正しく

解釈されるようにするためです。しかしながら、UNIX では、$ 記号が検索文字列に含まれている場合には、

一重引用符 (') で囲む必要があります。

次の例は、同じファイルに対してアスタリスクを利用して検索した例です。下線は、あらゆる一文字に対応

するワイルドカードで、下の例ではこれをふたつ連続して使用しています。

検索文字列 出力

*-acc 1 n:a|ball-acc

1 N:A|duck-acc

1 N:I|plane-acc

*-a__ 1 N:A|baby-all

1 n:a|ball-acc

1 N:A|duck-acc

1 N:I|plane-acc

1 N:I|grape-all

N:*|*-al 1 N:A|baby-all

1 N:I|grape-all

もし、マッチした文字列を表示させたくない場合には、%を使います。%はアスタリスクの機能に表示させな

い機能を付け加えたものです。

検索文字列 出力

N:A|% 3 N:A|

%-ACC 3 -ACC

%-A__ 3 -ACC

2 -ALL

N:%|%-ACC 3 N:|-ACC

N:%|% 5 N:|

また、次の例のように二種類の異なるワイルドカードを同時に使用することもできます。

検索文字列 出力

N:%|*-ACC 1 N:|ball-acc

1 N:|duck-acc

210

Page 235: JChatman

23.4. FREQ の出力先の指定方法

1 N:|plane-acc

N:*|% 3 N:A|

2 N:I|

FREQ の応用例として、スピーチアクトコードやインタラクションコードの一覧を作成することもできます。こ

れらのコードは、階層構造になっていること多く、たとえば、$NIA:RP:NV というコードは、3段階の階層に

なっています。英語版マニュアル第 13 章で説明されているシステムでは、最初の階層がやりとりのタイプ、二

番目はスピーチアクトや発話語内の力のタイプ、三番目は、コミュニケーションのチャネルの性質をそれぞれ

コード化しています。%mor 行に対して行ったのと同じような階層別の分析をここでも行うことができます。次

のコマンド例では、%spa 行を分析する際に、さまざまなワイルドカードによってどのような出力が得られる

かを示しています。まず、基本的なコマンド形式は、次のようになります。

freq +s"$*" +t%spa sample.cha

検索文字列 出力

$* %spa 行の3階層すべての頻度

$*:% やりとりのタイプの頻度 (第一階層)

$%:*:% スピーチアクトコードの頻度 (第二階層)

$RES:*:% RES カテゴリー内のスピーチアクトの頻度

$*:sel:% SEL というスピーチアクトを含むやりとりのタイプの頻度

もしコードの中に二階層しかないものが含まれる場合には、次のように % 記号をもうひとつ付け加える必要

があります。%がふたつ連続して用いられると、%ひとつのときの機能に加えて直前の一文字も検索に含めな

い機能が付け加えられます。

+s"$%:*:%%"

このコマンドでは、三階層のものはもちろん、二階層のコードも同時に検索されます。

23.4 FREQ の出力先の指定方法

FREQ は、デフォールトでは画面に出力を表示しますが、+f オプションを使うとファイルに直接出力するこ

とができます。

freq +f sample.cha

この場合は、\sample.frq" というファイルに出力されます。もし、\.frq" 以外の拡張子をつけたい場合には、

+f オプションの後に自由に拡張子を指定することができます。たとえば、\.mot" という拡張子をつけたい場

合には、次のように入力します。

freq +fmot sample.cha

ところが、もし複数のファイルに対して FREQを使用した場合には、仮に+f を指定したとしても、出力は入力

ファイルごとに別々に作られてしまいます。次の例では、それぞれの .cha ファイルごとに出力ファイルが別々

にできます。

freq +f *.cha

そのため、たくさんのファイルについていちいち出力ファイルを見るのはたいへんです。そこで、もし別々の

計算結果をひとつのファイルに一括して出力したい場合には、リダイレクト記号 (>)を使用して、ファイル名

を指定しなければなりません。

211

Page 236: JChatman

第 23章 FREQ | 出現頻度計算

freq *.cha > freq.all

こうすることによって、結果を単一のファイルに集めて出力できるので、結果の閲覧が楽にできます。また、出

力を既にあるファイルの末尾に付け加えたい場合には (追加書き)、次のようなリダイレクト記号を使うとファ

イルの最後に追加書きすることができます。

freq *.cha >> freq.all

検索結果を個別に出力するのではなく、複数のファイルの検索内容を合計して、ひとつの出力結果にまとめた

い場合も意外とあります。次のコマンドでは、+uオプションを使って合計した結果をひとつのファイルにまと

めて出力します。

freq +u *.cha

ファイル名を指定したい場合には、リダイレクトが使えます。

freq +u *.cha > freq.all

23.5 FREQ の適用を制限する方法

CLANを使用した分析の中で比較的重要なもののひとつとしてコマンドの適用範囲を制限する機能がありま

す。適用を制限することによって、データのうち必要な部分だけを調べ、他の関係ない部分を分析から除外す

ることができます。制限する機能は、+s, +t, +z の各オプションを用いて行います。これらの適用制限機能は

ほとんどの CLAN のコマンドで利用することができます。

1.ディペンデントティアを含むか含まないかによる制限

特定のディペンデントティアを選択することによって制限を行います。+tは特定のディペンデントティア

だけを分析に含め、-tは分析から除外することができます。たとえば、特定のスピーカーのメインライン

を選ぶと、そのメインラインのディペンデントティアだけが分析されるようになります。さらに、ディペ

ンデントティアのうち特定の種類のティアだけを分析するように指定することもできます。特に指定しな

い場合は、デフォールト設定のティアが分析されます。

2. メインラインを含むか含まないかによる制限

もし、-t* オプションを +t*MOT オプションと同時に使用すると、まず分析を母親の発話に限定し、さら

に母親のメインラインを分析から除外することができます。-t* スイッチはすべてのスピーカーのメイン

ラインを分析から除外します (ディペンデントティアは含まれる)が、-t*CHI スイッチは、CHI のメイン

ラインとそのディペンデントティアをすべて分析から除外します。

3.ある連続した領域を含むか含まないかによる制限

+zオプションを使用することによって、データファイルのうちある限られた連続する部分だけを分析する

ことができます。

4.文字列を含むか含まないかによる制限

+s/-s オプションを使用すれば、データに含まれる特定の文字列だけをプログラムに処理させることがで

きます。

ここで、以上の 4つの制限手法を併用したコマンド例を考えてみましょう。まず仮定として、sample.cha ファ

イルには *NIC と *MOT のふたつのスピーカーがあるとします。ここで調べたい条件として、次のようなも

のを考えます。

(1)スピーカーは、*NICだけを調べたい

(2) %spa ティアだけを調べたい

(3) $ini コードだけを調べたい

212

Page 237: JChatman

23.6. 共用されている語彙を調べる

(4) 最初の 20 発話文だけ調べたい

この目的を同時に達成するためには、次のコマンドを実行します。

freq + t*NIC +t%spa +s"$INI*" -t* +z20u sample.cha

最初の +t*NIC は (1) を実現し、そのメインラインとディペンデントティアだけを対象に絞ります。+t%spa

は (2)に対応し、対象を %spa ティアとメインラインだけに絞り、他のディペンデントティアは除外されます。

-t* オプションは、現在対象となっている *NIC メインラインそのものも分析対象から除外します。+s オプ

ションは、$INI にマッチしないすべての文字列を分析対象から除外します。ダブルクォートは、アスタリス

クを正しく解釈させるためには必要なので注意します。最後の +z オプションによって分析の範囲が最初の 20

行に制限されます。このようにして、当初の目的を達成します。結果はデフォールトの画面に出力されるので、

ファイルに出力したい場合には +f オプションを指定する必要があります。ヘッダーは、デフォールトで分析

から除外されます。

23.6 共用されている語彙を調べる

FREQでは、ある単語が親とこどもの間で共用されているかどうかを調べることができます。たとえば、こど

もには使われるが、母親には使われない語彙の性質を調べ、こどもの社会や概念世界が家庭内の要因ではなく、

外部の要因によって構成されていることを検証することができます。作業は、次のようないくつかのステップ

を践んでください。

1. 以下のようなコマンドを実行し、こどもと母親の発話に FREQ を適用します。ただしここでは分析対象の

ファイルを \sample.cha"としています。

freq +d1 +t*MOT +f sample.cha

freq +d1 +t*CHI +f sample.cha

この結果、最初のコマンドでは sample.frqが、二番目では sample.fr0が生成されます。

2. 次に、これらの出力ファイルに対して FREQ を適用します。

freq +y +o +u sample.f*

このコマンドの出力は、頻度 1と 2のリストになっています。頻度 2の語は、母親とこどもの両方によっ

て共有された語で、頻度 1の語は母親かこどものどちらかしか使用していない語です。

3. 一方に使われている語が、母親なのかこどもなのかを調べることもできます。それには、このプログラム

の結果を COMBOプログラムを使ったフィルターを通せばできます。頻度 2の語が母親だけが使っている語

で、頻度 1がこどもだけが使っている語になります。これを行う手続きは以下の通りです。

freq +y +o +u sample.f* | combo +y +s"2" +d | freq +y +d1 > shared.freq

最初のコマンドは三つの部分から構成されています。最初の FREQは共有されている単語全てを頻度 2、そ

うでない単語全てを頻度 1という印をつけて分類するものです。COMBOはそれを受けて、共有された語だ

けを抜きだします。その結果を、二番目の FREQにより数の部分を削除してファイルに書き出します。

同様にして、こどもだけが使っている語を調べることもできます。

4. 同じ手続きを同じ登場者が現われている複数のファイルに対して適用することもできます。もちろんこの場

合は同じスピーカー IDが使われているものと仮定しています。ここで、01.cha、02.cha、03.cha、04.cha、

05.cha、06.chaの六つのファイルがあったとしましょう。1 で述べたコマンドをワイルドカードつきで実

行したならば、 *.frq と *.fr0 という一群のファイルができます。それに対して 2 で述べたコマンドを実

行できます。

213

Page 238: JChatman

第 23章 FREQ | 出現頻度計算

freq +d1 +t*MOT +f *.cha

freq +d1 +t*CHI +f *.cha

ここで FREQを使って以下のコマンドを実行します。

freq +y +o +u 01.f*

freq +y +o +u 02.f*

...

もしくは、3で述べたように、COMBOを使ったコマンドをパイプしても同様の結果が得られます。

23.7 FREQのオプション

FREQには、次のようなオプションがあります。

1. +c: 大文字の語だけを検索します。

2. +d: 特定のレベルの分析を実行します。デフォルトでは、ファイル中に含まれるすべての単語の頻

度が出力ファイルに含まれます。+d オプションは、これらの出力ファイルを変更するために使用します。

次のコマンドを実行し、出力結果を比較してみてください。

freq sample.cha +d0

freq sample.cha +d1

freq sample.cha +d2 +t@ID=1.25*

それぞれのコマンドでは異なる結果が得られます。

+d0:通常の出力に加えて、単語の出現した行番号も表示します。

+d1:出現した単語のタイプだけを、一行に一単語表示し、その他の情報は一切表示しません。この出力

は単語リストとして、KWALや COMBOなどのコマンドの入力とすることができ、その単語やコー

ドが生起する環境を調べることができます。

+d2:検索結果を STATFREQ の入力に最適化した特別な形式で出力します。同時に、複数の .frq ファイル

を追跡するために \stat.out" ファイルを生成します。+f オプションはデフォールトで指定されるの

で、使用しないでください。また、 STATFREQ にどのスピーカーを追尾させるのかを指定するため

に、+t オプション を必ず使用してください。指定方法は、@IDか +t*CHI の形式で行います。詳し

くは、STATFREQ の項を参照してください。

+d3:基本的に +d2 と同じですが、タイプ、トークン、タイプとトークンの比率などの統計情報しか出力

しません。このオプションによってもいろいろな .frq 出力ファイルを追跡するための \stat.out"ファ

イルが作られます。単語の頻度情報はファイルには書かれません。このオプションの時、+fは仮定

されているので、+fを指定する必要はありません。

+d4:タイプとトークンに関する情報だけを表示します。

3. +o: FREQ の出力は通常はアルファベット順ですが、このオプションを使用すると頻度の高いもの

から降べき順で出力します。

23.8 FREQMERG | FREQ の出力ファイルを結合する

もし、FREQ の出力ファイルが大量にあり、それらの出力内容をひとつにしたいときには、FREQMERG

を使用することができます。たとえば、次のようなコマンドを実行してみましょう。

214

Page 239: JChatman

23.8. FREQMERG | FREQ の出力ファイルを結合する

freq sample*.cha +f

すると、sample.frq と sample2.frq ファイルができます。次に、このふたつのファイルを次のようなコマンド

を用いて結合してみましょう。画面上に、結合されたデータが表示されるはずです。

freqmerg *.frq

FREQMERGEに特有のオプションは次のものだけです。

1. +o: メインライン上にある特定の語を検索するように指定できます。複数の語を調べる時は、ファ

イルに書き込んで +o@ファイル名 の形で指定するようにします。

215

Page 240: JChatman
Page 241: JChatman

第24章 KWAL | キーワードと行

中則夫・白井英俊KWALは、ユーザーの定義した検索語を含む発話を検索し、出力します。それに加え、検索文字列として使用

したキーワードが使われている前後の文脈を見ることができます。検索語を指定するためには +s オプション

を使用しますが、単一の単語でも、ファイルにリストした複数の単語でも検索することができます。+s オプ

ションは好きなだけたくさん指定することができます。

COMBOと同じように KWALプログラムは行ではなく「クラスター」に対して作用します。クラスターはメイ

ンティアとそれに関連した選ばれたディペンデントティアの組合せのことです。それぞれのクラスターは与え

られたキーワードに対して独立に検索されます。KWALは与えられたクラスターのティアで見つかったすべての

キーワードをリストします。KWAL の簡単なコマンド例として、次のコマンドをみてみましょう。

kwal +schalk sample.cha

このコマンドの出力には、ファイル名と検索語を含む文の行番号が表示され、その後検索語を含む行を表示し

ます。

24.1 KWAL の適用を制限する方法

時々、元ファイルにあるいくつかの情報を体系的に取り去った新しいファイルを作りたいと思う時があると

思います。たとえば、データファイルを読みにくくしているある特定のコーディングティアを消してしまいた

いと思うことがあるはずです。%mor ティアを削除するためには、次のコマンドを使用してください。

kwal +o@ -t%mor +d +f sample.cha

+o スイッチは、ヘッダーを出力し落とさないようにするために指定します。ここで、KWAL では、制限する

ために使われる +t スイッチと、出力の形式を整えるために特に用いられる +o スイッチを区別していること

に注意してください。この場合、メインラインとそのディペンデントティアはデフォールトで維持されるよう

になっています。-t%mor スイッチによって、%mor ティアが出力から削除されます。+d スイッチは、出力が

CHAT 形式になるようにする指定で、+fはファイルへの出力の指定です。

どのスピーカーやディペンデントティアをクラスターに含めるかを指定することができます。このためには

+t オプションを使います。クラスターには、デフォルトではメインラインしか含まれません。メインライン

を除外したい場合には、-t*を指定します。しかしながら、これは検索の対象となる入力だけにしか適用せず、

出力には影響を与えません。したがって、ひとつもマッチするものがなくても、出力にはメインラインだけは

必ず含まれることになります。出力からメインラインを取り除きたいだけであれば、次のような FLO コマンド

を使います。

flo +t*NIC -t* +t%spa sample.cha

もう少し複雑な制限を行いたい場合には、FLO と KWAL を組み合わせて使用します。

kwal +t*NIC +t%spa +s"$SEL*" -t* sample.cha +d | flo -t* +t%

217

Page 242: JChatman

第 24章 KWAL | キーワードと行

*MOTのメインライン と %spa ティアのキーワードだけを検索するには、+t*MOT +t%spa をそれぞれ次の

ように指定します。

kwal +s"$INI:*" +t%spa +t*MOT sample.cha

24.2 KWALのオプション

KWALには、次のようなオプションがあります。

1. +a: 出力を、アルファベット順にソートします。このオプションを使用すると、実行速度がかなり

低下します。MS-DOSでは、メモリが 1MB 以下の場合にメモリ不足によりシステムクラッシュが起こる

ことがあるので注意してください。

2. +d: KWALは、通常検索語にマッチしたティアの場所を行番号で出力します。+d オプションを使用

すると、この行番号の出力を抑制し、簡潔な CHAT 形式 で出力します。+d1 スイッチは、CHAT 形式

であることに加えて、ファイル名、行番号も出力します。次のコマンドを試してみましょう。

kwal +s"chalk" sample.cha

kwal +s"chalk" +d sample.cha

kwal +s"chalk" +d1 sample.cha

KWAL を +d を用いながら制限のために使用する: +d と+d1 スイッチは、テキストの特定の部

分を分析する際に非常に重要なツールとして役立つことがあります。たとえば、あるプロジェクトにおい

ては、中心的な研究目的が聞き手の性質を関数とした MLUの変化だとします。これを分析するためには、

それぞれの発話文に %add 行と聞き手を特定するコードを与えます。sample.chaを例にとると、次のよう

な KWAL コマンドが実行できます。

kwal +t%add +t*NIC +s"*MOT" +d sample.cha | mlu

このコマンドは、聞き手としての母親に向けて行われたこどもの発話の MLUだけを計算することができ

ます。

3. +o: +t スイッチが、KWAL の入力と出力から特定のティアを加えたり削除する制御を行います。

しかし、場合によっては、入力には含まれていないティアを出力に含めたいことがあるはずです。これは、

ひとつのディペンデントティア、たとえば%mor ティア、の検索語にマッチさせたいが、出力にはすべての

ティアを含めたい場合によく起こります。このためには、次のようなコマンドを使用してください。

kwal +t%mor +s"*ACC" +o% sample2.cha

また別な状況では、KWALの出力において通常含まれないようなティアを含めたいといことがあるでしょ

う。例えば、こどもの年齢を出力ファイルに表示させたい場合は、次のようにします。

kwal +o@Age -t* *.cha

4. +w/-w: キーワードが見付かった時に表示する文脈 (ウィンドゥ)を広げることもできます。+w/-w

オプションによって対象となるクラスターがみつかった場合にどれだけの数のクラスターを出力に含める

かを指定します。このオプションの直後には数を書かなければなりません。この数が、対象となるクラス

ターの前と後に含められるクラスター数になります。KWALではウィンドゥ操作が特に役にたちます。以下

のコマンドは sample.cha ファイルの中の \chalk" を探し、それが含まれているクラスターの前 (-w3)後

(+w) 3クラスターを出力ファイルに表示します。

一般的なオプションについては 26章を参照してください。

218

Page 243: JChatman

第25章 MLU | 平均発話長

中則夫・白井英俊MLU は、発話に対する形態素の比率である MLU (mean length of utterances) を計算します。MLU は言語

発達の水準を調べる方法として広く知られています (Brown, 1973)。

25.1 MLUのデフォルト

MLU は次のように各記号を処理します。

1. [/] か [//] の前にあるかぎかっこ (< >)内の要素はすべて除外されます。この設定を無効にするには、

+r6を用いるか、次のスイッチを指定します。

+s"</>" +s"<//>"

2. [+ bch] のような特定のポストコードを含む発話を除外するためには、-s スイッチを使用します。

-s"[+ bch]"

3. 次のような記号もすべて除外されます。

xxx yyy www uh um 0* &* +* -* #* $*

ここでのアスタリスクは、直前にある除外する記号に続くあらゆる要素に対応します。デフォルトでは、

xx と yyは除外されません。上の記号以外の要素はすべて計算に含まれますが、特定の除外記号は計算に

含まれません。もし仮に発話内容がすべて除外される要素だとすれば、発話全体が無視されることになり

ます。

さらに、接尾辞や接頭辞、0(ゼロ)から始まる複合語も自動的に除外されます。そしてこの扱いを変更す

る方法はありません。

4.このプログラムでは、次の記号が単語境界になります。

. ? ! , ; [ ] < >

(半角)スペースも単語境界になります。

5. 次の四つの記号が形態素境界になります。

& - # ^

6. 次の三つの記号が発話境界になります。

. ! ?

また、+... のように最後が上の記号で終わっている各種の複合記号も発話境界に含まれます。

219

Page 244: JChatman

第 25章 MLU | 平均発話長

25.2 MLUを走らせてみよう

デフォルトでは、MLU 計算はそれぞれのスピーカーについてメインラインに基づいて行われます。一般的

な使用例としては以下のようになります。

mlu sample.cha

データの特定の部分にだけ分析を行いたいときもよくあります。この場合は KWALの節で詳しく説明したよう

に、次のようなコマンドを実行します。

kwal +t*CHI +t%add +s"*MOT" sample.cha +d | mlu

このコマンドは、こどもが母親に話しかけた発話だけを分析します。KWAL は出力をパイプ記号を通して MLU

に渡します。このように、パイプ記号 (\j") はあるプログラムの出力を別のプログラムに渡すときに使用しま

す。もし出力を単一のファイルに出力したい場合には、さらにリダイレクト記号を使用することもできます。

kwal +t*CHI +t%add +s"*MOT" sample.cha +d | mlu > file.mlu

25.3 MLUとMLTでの発話の取り込みと除去

特定の文型が MLU 計算を増やしたり減らしたりすることがよく知られています。しかし、どの文型を MLU

計算に含め、どれを除外するかに関するはっきりした合意はまだありません。CLANの MLUプログラムは、も

しメインラインに発話のタイプを示すポストコードが含まれているのなら、さまざまな MLU 計算に対する考

え方に適応することができます。-s スイッチを使い、分析から除外したい単語やポストコードを登録したファ

イルを指定することができ、分析から特定のデータを除外することができるからです。たとえば、sample.cha

ファイルには、yes/no 疑問文には [+ Q]、模倣には [+ i]、呼格については [+ V] など、特定の項目に対応

する反応を示すポストコードが含まれています。

まず手始めとして、ファイル内の Nicolette の MLU を調べるために、次のようにタイプしてみましょう。

mlu +t*NIC sample.cha

その次に、Scarborough (1990)の基準にしたがって、こどもの MLUを計算してみましょう。この基準では、次

のような項目を除外する必要があります。いつも決まってやること [+ R]、読書 [+ "]、つなぎことば [+ F]、

模倣 [+ I]、自分での繰り返し [+ SR]、独立したオノマトペ [+ O]、呼びかけ [+ V]特に不明瞭な発話 [+ PI]

などです。これを実行するために、これらのポストコードをリストしたファイルを作って、それらの要素を除

外する必要があります。もちろん小さなサンプルファイルには、ほんの少しのコードしか入っていません。し

かし、試しに、\scmlu" というファイルを作ってコードをかぎかっこで囲み、Scarborough の基準で分析をテ

ストしてみることはできます。ポストコードは CHAT では角括弧 ([\ ])で囲みますが、CLAN で使われる

ファイル内では、かぎ括弧 (< >)で囲みます。\scmlu" ファイルには、次のようになっています。

<+ R>

<+ ">

<+ V>

<+ I>

このファイルを作ると、次のコマンドを実行できます。

mlu +t*nic -s@scmlu sample.cha

三回目として、さらに制限的な基準でこどもの MLU を計算してみましょう yes/no 疑問文に対する一語の答

えを [$Q] として除外するファイルをさらに加えた作り、次のようなコマンドを実行します。

220

Page 245: JChatman

25.4. MLUのオプション

mlu +t*nic -s@resmlu sample.cha

一般に、このような限定されたタイプの発話を次々に除外していくと、こどもの MLU は上昇する傾向にあり

ます。

25.4 MLUのオプション

MLUに固有のオプションには以下のものがある。

1. +b/-b: 特定の形態素境界を含めるかどう除外するかを指定することができます。デフォールトで

は、&, #, { の三つが形態素境界になっています。もし仮に、-b#-& スイッチを指定するとすべての形態

素境界を無視させることができます。+bは、新しい境界を付け加えます。

2. +cS: ユニットマーカー S を検索します。文の代わりに、フレーズや話法ユニットとカウントした

いときは、[c]のようなマーカーを加えて、データファイルをさらにユニットに分割します。次の二つの

コマンドを比較してみてください。

mlu sample.cha

mlu +c[c] sample.cha

3. +d: このオプションを使い、STATFREQ 用の ID の指定すると、統計的数値を出力することができ

ます。付属のサンプルファイルへの適用例は次の通りです。

mlu +d +t@ID=1.25.8.2 sample.cha

このコマンドの出力は次のようになります。

1.25.8.2 5 7 1.400 0.548

これらの数値は、次のような内容を示しています。

� スピーカーの ID

� 発話文の数

� 形態素の数

� 形態素と発話文の比率

� 標準偏差

このタイプの分析を行うためには、各スピーカーに対応する @ID ヘッダーがなければなりません。ある

いは、+t*CHI のような形式でも指定できます。しかし、いろいろなファイルのいろいろな名前のこども

について分析する場合には@ID ヘッダーが必要になります。

+d1: 基本的には +d スイッチと同じ機能があり、各スピーカーごとの統計情報を表示します。しかし、+d

スイッチほど統計プログラムに対応した出力フォーマットをもちません。また、+d1 スイッチは +u

スイッチと併用できますが、+d スイッチは併用できません。出力例は次のようになります。

*NIC: 5 7 1.400 0.490

*MOT: 8 47 5.875 2.891

4. +g: 特定の単語だけで構成される発話を分析から除外します。たとえば、\hi"や \bye"だけから成る発話

を除外したい場合には、これらの単語をリストにしたファイルを作成します。そして、+gオプションの後に

ファイル名を指定します。ファイル名を省略した場合には \No �le name for the +g option speci�ed!"(+g

オプションに対するファイル名が指定されてない!) というエラーメッセージが表示されます。

221

Page 246: JChatman

第 25章 MLU | 平均発話長

5. +s/-s: 特定の単語に分析を限定することができます。このオプションの次には直接文字列を指定します。

複数の単語を検索する場合には、ファイルに書き込み、+s@ファイル名、を指定します。-s スイッチは特

定の単語を分析から除外します。逆に、+sスイッチは特定の単語だけを分析に含めますが、このような使

い方をする場合はほとんどないでしょう。しかしながら、+sスイッチには別な使い方があります。それは、

+sを使って自動的に MLU計算から除去されている語を含めることです。MLUは自動的に xxxや 0や uh

や&から始まる語を計算から除外します。これは以下のコマンドによって変更可能です。

mlu +s+uh +s+xxx +s0* +s&* file.cha

一般的なオプションについては 26章を参照してください。

222

Page 247: JChatman

第26章 CLANプログラムの共通オプション

中則夫・白井英俊この章では、CLANで利用可能なさまざまなオプションあるいはスイッチを詳しくみます。それぞれのコマ

ンド、例えば KWALで可能なオプションの一覧を見るには、コマンドウィンドゥで単に \kwal" と入力します。

オプションは +か -で始まっており、実際に使用する際には、この記号の前にスペースを置きます。複数のオ

プションを指定することはどのコマンドでも可能で、順番は任意です。コマンドラインでは、オプションをス

ペースで区切ります。例えば以下は

kwal +f +t*MOT sample.cha

Key Word And Line分析を \sample.cha"ファイルに対して実行します。+fオプションの指定により、出力

が \sample.kwa" というファイルに書き込まれます。+t*MOTオプションにより、解析は母親 (*MOT)の発話だ

けに適用されます。ファイル名は最後に書かなければなりませんが、オプションの順番は自由です。

26.1 オプション機能の説明 (アルファベット順)

本節では、使用可能なオプションをそれぞれ取り上げ、各コマンドでの使い方を説明します。

+a このオプションについてはそれぞれのプログラムの説明をご覧ください。

+b このオプションについてはそれぞれのプログラムの説明をご覧ください。

+c このオプションについてはそれぞれのプログラムの説明をご覧ください。

+d 各プログラムのこのスイッチの使用法の説明をご覧ください。

+e 各プログラムのこのスイッチの使用法の説明をご覧ください。

+f/-f ファイルか画面に出力を送る デフォルトでは、ほとんどの CLANプログラムは出力を画面に送る

ようになっています。しかし、+f スイッチを指定することで、出力をファイルに書き出すこともできま

す。ファイルに出力する利点は、後で詳しく結果を確認できる点にあります。

-f スイッチは、出力を画面に送るように指定するためのものです。画面に出力することの利点は、結果

がすぐ確認できることと、作業するディレクトリが不要なファイルでいっぱいにならない点です。これ

は、早く結果を見たい場合には便利です。画面に出力するために-fスイッチが必要なのは、CHSTRING,

FLO, SALTINコマンドだけです。他のすべてのプログラムはデフォルトで画面に出力されます。

+f の後に文字列を指定すると、それが、出力ファイルにつけるデフォルトの拡張子名として使用されま

す。たとえば、次のコマンドでは、

freq +f file.ext

\�le.frq"という出力ファイルが作成されます。しかし、+fスイッチの直後に最大 3文字までの拡張子を

指定することで拡張子を変更することができます。次の例をみてください。

223

Page 248: JChatman

第 26章 CLANプログラムの共通オプション

freq +fmot file.ext

これにより、出力のためのファイル \�le.mot" が作られます。もしも文字列を 3文字以上指定した場合

には、4文字目以降は無視されます。ですから、次のようなコマンドを実行したとしても、

freq +fmother file.ext

出力ファイル名はやはり \�le.mot"になります。

Macintosh では、ファイルメニューから出力ディレクトリを指定する 3 番目のオプションがあります。

MS-DOS では、次のような+f スイッチを使用することで同じ効果が得られます。

+fc: 出力ファイルを Cドライブのワーキングディレクトリに作ります。

+f".res" 出力ファイルの拡張子を指定します。

+f"c:.res" Cドライブに出力ファイルを作り、拡張子を .res にします。

注意: 複数のファイルに対して+fスイッチを用いてコマンドを実行した場合には、それぞれのファ

イルに対してそれぞれ異なった出力ファイルが作られます。もしもすべての入力ファイルに対する結果

をまとめてひとつの出力ファイルにしたいならば、+uスイッチを使ってください。さらに、出力ファイ

ルに特定の名前をつけたい場合は、リダイレクト記号 (>) を使用します。リダイレクト機能は +uと一緒

でも単独でも使用することができますが、+fとは一緒に使えません。

+g このオプションについてはそれぞれのプログラムの説明をご覧ください。

+h このオプションについてはそれぞれのプログラムの説明をご覧ください。

+i このオプションについてはそれぞれのプログラムの説明をご覧ください。

+j このオプションについてはそれぞれのプログラムの説明をご覧ください。

+k 大文字と小文字の区別 CLAN のプログラムは、デフォルトとして大文字小文字の区別を行い

ません。唯一の例外は CHSTRINGで、区別をするのがデフォルトになっています。+kはデフォルトの状

態を変化させ、CHSTRING以外のプログラムも大文字と小文字の区別をするようになります。たとえば、

単語表を作るとしましょう。大文字と小文字の区別を行わないプログラムでは例えば \may" も \MAY"

も \May"も同一視されますが、+kを指定すればこれらは別々の単語と認識されるようになります。

+l このオプションについてはそれぞれのプログラムの説明をご覧ください。

+m ファイルの出力先を制御 デフォルトでは、CLAN は出力ファイルをワーキングディレクト

リに作ります。+mを使用すると、出力ファイルを入力ファイルがあるディレクトリに作るようになりま

す。このスイッチはMacintosh の場合には特に強力です。なぜなら、すべてのプログラムが再帰的に動

作するからです。たとえば、次のようにして、CHILDESデータベースのすべてのファイルに対し FREQ

を実行することができます。

freq +f +m *.cha

この場合、+mスイッチにより、\.frq" ファイルがそれぞれのディレクトリにできることになります。

+n このオプションについてはそれぞれのプログラムの説明をご覧ください。

+o このオプションについてはそれぞれのプログラムの説明をご覧ください。

+pF 単語境界記号の定義 CLANプログラムのほとんどは、単語モードで動作しますので、単語

の境界を定義しなければなりません。CLAN のデフォールトの単語境界記号は、半角スペースと次にあ

げる記号です。

224

Page 249: JChatman

26.1. オプション機能の説明 (アルファベット順)

, . ; ? ! [ ] < >

これらの記号は、すべてのメインラインとコーディング行に適用されますが、UNIBETと PHONASCII

を使用する %phoと %mod 行は例外となります。これらの場合は、音素を記述するために境界記号を使用

しているので、半角スペースだけが境界記号になります。

単語単位で動作するプログラムは、すべて+pオプションをもっています。このオプションを使用すると、

デフォルトの単語境界記号を変更することができます。CHAT では、あるときには境界記号として使わ

れ、またあるときには単語の一部として使用される特別な文字があるので、これが役にたつ場合がありま

す。たとえば、\-" 記号は形態素境界記号として使われているので、単語の一部として扱われるべきでは

ありません。また、ダイアクリティクスを使用する言語を分析する場合にも便利です。単語分割記号を変

更するときには、ファイル内で使用されているすべての分割記号をリストしたファイルを作らなければな

りません。入力のしかたは、ひとつの行にすべての記号をスペースを入れずに連続してタイプするだけで

す。変更はすべてのメインラインとコードティアに有効です。ファイルを指定するときには、+p の直後

に新しい分割記号のファイルを続けます。例として、デフォルトから 次のような内容の \newpunct.txt"

に含まれた分割記号に変更すると考えてみましょう。

$*&^!

この内容を有効にするには、次のようなコマンドを実行します。

freq +pnewpunct.cut sample.cha

注意: もし +p スイッチをファイル名なしで使用すると、プログラムは \punct.cut"というファイル

をワーキングディレクトリで探します。そもそも+pスイッチを使用しなくても、プログラムは \punct.cut"

というファイルを探します。もしそのようなファイルがない場合には、プログラムに組み込まれたデフォル

トの分割記号を使用します。分析する言語の分割記号がデフォルトのものから変更されたら、\punct.cut"

ファイルを作成し、ファイルで変更された記号を登録して、ワーキングディレクトリに置くべきです。

\punct.cut"は自動的に参照されるので、その内容はすべての CLANプログラムを使用するときに有効

になります。もしデフォルトの分割記号を使用したい場合は、\punct.cut"がワーキングディレクトリに

ないことと、+pスイッチを使用していないことを確認してください。

+q このオプションについてはそれぞれのプログラムの説明をご覧ください。

+r1 丸括弧を除去する 単語の一部が省略された場合、例えば (be)cause のように丸括弧を用いて

省略部分を示すことができます。+r1 スイッチを指定すると、丸括弧を取り去った状態で単語を解釈し

ます。

+r2 丸括弧を残す 丸括弧のある状態で単語を解釈します。

+r3 丸括弧内の要素を除去 省略された部分をすべて取り除きます。

次にあげるのは、入力語を \get(s)"とした時の、上の三つの +rオプションのコマンドとその出力例です。

オプション 出力

なし gets

\+r1" gets

\+r2" get(s)

\+r3" get

+r4 単語内の音韻記号を除去 単語から、#, /, : 記号を取り除きます。これらの記号については、

第 9章を参照。

225

Page 250: JChatman

第 26章 CLANプログラムの共通オプション

+r5 テキストの置き換え デフォルトでは、[: text]は直前の内容を角括弧 ([])内の内容で置き

換えます。この置き換えを望まないときにこのオプションを指定します。置き換えが抑制され、角括弧の

前の要素が維持されます。

+r6 繰り返しの要素 デフォルトでは、繰り返しの要素は検索や計算に含まれます。しかし、+r6

を指定すると、これらの要素を計算から除外することができます。

一方、MLUと MODREPでは、繰り返しの要素は計算からデフォルトで除外されますが、+r6スイッチを指

定すると逆に計算に含めるようになります。

+s/-s 指定された単語やファイルに登録されている単語の検索 +s オプションを使用すると、特

定のキーワードを指定して検索することができます。文字列は、+sdog のように、+sスイッチの直後に

指定するか、+s"dog"のように二重引用符で文字列を囲みます。ファイルに書かれている複数の単語を指

定することもできます。この場合、+s の後に @ 記号とファイル名を指定して+s@adverbs のように指定

すると、\adverbs" というファイルに登録されている単語を検索します。ここで@という文字を検索した

い場合には、+s\@ のようにバックスラッシュ(n)を前に置きます1。

デフォルトでは、このプログラムはメインラインの要素だけを検索します。また、デフォルトでは、こ

のスイッチの下で角括弧内の要素は見えないものとして扱われます。実際に、検索文字列の中に角括弧

を含まないと、角括弧内の要素をすべて無視します。COMBOプログラムを使用すると、文字列に正規表

現を使用することができます。検索文字列内に区切り記号を含めることが可能なのは、COMBO、 FREQ、

KWALだけです。

+sオプションは、コマンドラインで好きなだけたくさん使用することができます。+sオプションを使う

と、デフォルトに優先して検索が行われます。たとえば次の例では、

freq +s"word" data.cha

\data.cha" というファイルから \word"だけが検索されます。

+s/-s は次のような要素と共に使われます: (1) 単語、(2) コードまたはポストコード、(3) 角括弧内の

コードと関連したかぎ括弧内のテキスト、(4) 特定のポストコードと関連した要素、(5)特定のポストコー

ドそれ自体。これらの異なるタイプに対するスイッチの効果は、以下の表に示す通りです。

+s -s +s+

単語 この単語だけ: それ以外の単語全て すべての単語と xxx

例: +s"dog" -s"dog" +s+xxx

[code] このコードだけ デフォルト すべてのテクストとこ

のコード

例: +s"[//]" -s"[//]" +s+"[//]"

<code> このタイプのテクスト

だけ

このタイプ以外のテク

ストすべて

すべてのテクストとこ

のコード

例: +s"<//>" -s"<//>" +s+"<//>"

<+ code> このポストコードだけ デフォルト すべてのテクストとこ

のポストコード

例: +s"[+ imi]" +s+"[+ imi]"

<code> このポストコードをも

つ発話だけ

このポストコードを持

つもの以外のすべての

発話

すべてのテクストとこ

のコード

例: +s"<+ imi>" -s"<+ imi>" +s+"<+ imi>"

1ここで n は日本語キーボードでは¥と表示されているキーを表します。

226

Page 251: JChatman

26.1. オプション機能の説明 (アルファベット順)

+s を複数使用した場合には、排他的ORでマッチします。したがって、ひとつの +sにマッチした場合

には、他の +sにはマッチしません。最も特定的なものからマッチが行われます。たとえば、テキストに

次のようなコードが含まれている場合に、

$gf $gf:a $gf:b $gf:c

次のようなコマンドを実行すると、

freq +s$gf% +s$gf:a

出力は次のようになります。

$gf% 3

$gf 1

$gf:aは+s$gf:a にマッチするので、+s$gf% のマッチからは除外されるからです。

除外から取り除く +s スイッチは、自動的に除外される項目から文字列を除外するためにも使用するこ

とができます。たとえば、MLUプログラムは、xxx, 0, uh, & で始まる単語などを MLU 計算から除外し

ますが、次のコマンドを使用することでこれを変更することができます。

mlu +s+uh +s+xxx +s+0* +s+&* file.cha

+t/-t ティアコードの選択と除外 CHAT には 3種類のティアコードのタイプがあります。メイ

ンスピーカーティア (*)、ディペンデントティア (%)、ヘッダーティア (@) がそうです。ディペンデン

トティアは、常にメインスピーカーに付属して使われます。たとえば、*MOT と %codディペンデント

ティアを分析するようにしても、*MOT のメインティアと、その %codしか分析しません。

+tスイッチを使用すると、各スピーカーティア、ディペンデントティア、ヘッダーティアのうちどれを

分析に含めるかを指定することができます。その他のティアは、すべて無視されます。たとえば、次のよ

うなコマンドでは、

freq +t*CHI +t%spa +t%mor +t"@Group of Mot" sample.cha

FREQは、*CHI メインティア、%spa, %mor のディペンデントティア、@Situation ヘッダーティアしか検

索を行いません。ティアが含まれると、分析はそのティアだけに行われることになります。

-t オプションは、各スピーカーティア、ディペンデントティア、ヘッダーティアのうちどれを分析から

除外するかを指定することができます。その他のティアは、デフォルトで指定されているもの以外はす

べて分析から除外されます。次のコマンドでは、

freq -t*CHI -t%spa -t%mor -t@"Group of Mot" sample.cha

FREQは、*CHI メインティア、%spa, %mor のディペンデントティア、@Situationヘッダーティアを分析

から除外します。そのほかのティアは、すべて分析に含まれます。

+t スイッチにおいて# 記号をワイルドカードとして使用することもできます。たとえば、スピーカー

ID にコードの複合形を使用し、母親に話しかけるこどもを*CHI-MOT のような形で表すとすると、以

下はそれぞれ、母親に話しかける子供の発話、母親に話しかけるすべての発話、子供の発話すべてを分

析対象とします。

227

Page 252: JChatman

第 26章 CLANプログラムの共通オプション

freq +t*CHI-MOT sample.cha

freq +t*#-MOT sample.cha

freq +t*CHI-# sample.cha

ティアが含まれると、分析はそれら特定のティアだけで行われ、除外されると指定されたティア以外で

分析が行われます。不要なティアをすべて残らず除外し損なうと、正確な分析結果が出ないことになり

ます。したがって、ティアを除外するよりも、必要なものを含める方が安全であり、ファイル内にある

ファイルのすべてに気を配るのは難しいことが多いといえます。tオプションの後に、ティアタイプ記号

(*, %, @) だけしか指定しないと、分析からそのタイプ諸ティアをすべて分析に含めたり除外したりする

ようになります。KWALを使うときには、+t@を指定してヘッダー情報を出力に含めるようにすることが

重要です。

プログラムの検索は、ティアコードの左から、ユーザーが指定したとおりに左側に順次進められます。こ

れは、指定した検索文字列が見つかったらいつでもマッチが発生することになります。もし、コマンド

ラインでオプションの後に *M と指定すると、*MAR, *MIK, *MOT などの *Mではじまるティアでは

すべてマッチが成功します。検索を明確にするために、+t/-t オプションの後には、コロンも含めて完

全なティア名を指定するようにします。たとえば、*MOT ティアだけが含まれるようにするためには、

+t*MOT: というオプションを指定します。

文字コードでスピーカーティアを指定する他に、次のような指定方法もあります。

+t@id=idcode

この形式では、ID コードは @ID ヘッダーを使ってファイルの先頭で宣言している文字列に一致するど

んな文字も使えます。これらの ID コードの作り方に関する標準的な使用法は、まだでき上がっていませ

ん。しかし、やがて作られるシステムでは、言語、年齢、性別、などの情報を取り込むことができるよ

うになるでしょう。

すべてのプログラムは、デフォールトでメインスピーカーティアを含み、すべてのディペンデントティ

アを +t% スイッチが指定されていない限り除外します。

+u 複数のデータファイルをまとめて出力 デフォールトでは、複数のファイルを入力として指

定すると、分析は個々のファイルに対して別々に実行され、別々のファイルに出力が送られます。もし +u

オプションを指定すると、入力ファイルをひとつにまとめて処理を行い、出力を一括してひとつのファ

イルにまとめます。選択されるファイルが多すぎた場合には、ファイルをまとめることができないこと

もあります。

+v バージョンナンバー 使用されている CLAN のバージョンを、プログラムが修正された日

付で表示します。

+w/-w ウィンドウサイズ このオプションは、ふたつの CLAN コマンド KWAL と COMBO で使

用されます。これらのプログラムは、指定されたキーワードや正規表現による検索文字列を表示するた

めに使われます。デフォールトでは、KWAL と COMBO は選択されたメインティアとそのディペンデント

ティアをクラスターとしてひとまとまりにします。

-w オプションは、直後に整数を指定することによって、マッチしたクラスターの前のクラスターをその

数だけ表示させることができます。+w オプションは、同様にして後のクラスターを表示することができ

ます。もし KWAL に 1クラスター分より大きい文脈を出させたい場合には、たとえば、-w3 と +w2 オプ

ションを指定することができます。するとマッチしたクラスターの前 3クラスター分、および後 2クラ

スター分の文脈情報を表示します。

+x このオプションについてはそれぞれのプログラムの説明をご覧ください。

228

Page 253: JChatman

26.2. 検索用のメタキャラクタ

+y nonCHAT ファイルへの対応 CLANプログラムのほとんどは、CHAT 形式のファイルに

対して適用するように設計されておりいます。しかし、+y オプションを指定することによって、プログ

ラムを nonCHAT ファイルにも適用させることが可能です。プログラムは、nonCHAT ファイルの各行

をひとつのティアとして分析を行います。+y スイッチにはふたつの値があり、+y は行に対して適用し、

+y1は、ピリオド、疑問符、感嘆符 (. ? !) を区切り記号とする発話に対して適用します。+y スイッチ

が使えないプログラムもあるので注意してください。

+z 範囲を指定 CLANプログラムは、ファイル全体に対して分析を行うのがデフォルトです。

+zオプションを指定すると、どんな範囲の単語、発話、ターンも指定して分析できるようになります。

範囲の指定はオプションの直後で行います。

+z10w 最初の 10単語だけ分析

+z10u 最初の 10発話だけ分析

+z10t 最初の 10ターンだけ分析

+z10w-20w 10番目の単語から 11単語だけ分析

+z10u-20u 10番目の発話から 11発話分だけ分析

+z10t-20t 10番目のターンから 11ターンだけ分析

+z10w- 10番目の単語からファイルの終わりまで分析

+z10u- 10番目の発話からファイルの終わりまで分析

+z10t- 10番目のターンからファイルの終わりまで分析

ファイルに存在する単語数や発話数以上の値を指定すると、プログラムは実際に存在する値分だけ分析

を行います。また、ターンや発話が除外指定されている特殊な記号や単語を含むために分析対象となら

ない場合には、それらの発話やターンはカウントされません。

26.2 検索用のメタキャラクタ

メタキャラクタとは一群の文字を指定するために使われる特殊な文字です。特定のメタキャラクタは、s ス

イッチを使用して指定できる検索文字列を指定するために使われることがあります。しかし、CHSTRINGで

メタキャラクタを使うためには、特別なスイッチを使用しなければなりません。CLANで使用できるメタキャ

ラクタは、次のものです。

* 0個以上の文字にマッチする

% 0個以上の文字にマッチし削除する

%% 上記に加えてその前の一字も削除する

あらゆる一文字にマッチする

n エスケープ記号

ファイル内の \cat"という単語の生起例をすべて検索したいと仮定してみましょう。その中には、複数形 \cats"、

所有形 \cat's"、縮約形 \cat-'is" や \cat-'has" などがあります。メタキャラクタ (この場合は *)を使うと、こ

れらの形すべてをいちいち指定することなしに、すべて検索することができます。cat*を指定ファイルや、+s

オプションで指定することによって、すべての形を見つけられます。メタキャラクタは、単語のどの位置にで

も置くことができます。

* メタキャラクタはワイルドカード記号で、単語内に置かれた位置で連続するあらゆる数のあらゆる文字

にマッチします。たとえば、もし \b*" と指定すると、\breads", \bats", \bat-'s", \balls", \beds", \bed-s",

\breaks" などにマッチします。

% メタキャラクタは、* 記号と同じようにマッチを行うことができます。しかし、異なるのは、% 記号に

マッチした文字列の間で区別が行われないため、出力が生成される時に各文字列は同じものとして扱われます。

言い換えると、もし検索文字列が b%t だとすると、\beat" と \bat"は出力では同じ文字列が 2回出てきたも

229

Page 254: JChatman

第 26章 CLANプログラムの共通オプション

のとして分析されます。もし、キーワードのマッチによって単語のリストを作るプログラムで使用しなければ、

% 記号は * 記号と同じ効果をもちます。

% 記号がもうひとつの % と連続して使われると、メタキャラクタの効果が少し変わります。この場合 %に

よってマッチした部分だけでなく、その前の一文字も内容を無視されます。% 記号を付加しない場合には、ワ

イルドカードの前の単語分割記号にはマッチしませんし、無視しません。%を加えた検索は、単語の語幹だけ

を検索したい場合に特に役に立ちます。たとえば、\cat" の単語頻度計算を行う際には、次のコマンドを使用

します。

freq +s"cat-%%" file.cha.

最初の % 記号は接尾語にマッチし、2番目はハイフンにマッチします。このように、+s オプションで指定さ

れた検索文字列は、\cat", \cats", \cat-'s", \cat-s" などにマッチし、FREQ はこれらの単語を \cat" 一語とし

てカウントします。�le.chaがこれら 4つの単語だけをもっていれば、出力は 4 catとなるはずです。この検索

法の限界は、2番目の %が単語分割記号にしかマッチしないため、\cats"や \cat's"などの単語にマッチしな

いことです。2番目の % は、$NIA:RP:IN などの階層コードにマッチさせるときにも便利です。

下線 ( ) 記号は * 記号に似ていますが、単語内の一字にしかマッチしない点が異なります。たとえば、b d

は、\bad", \bed", \bud", \bid" などにマッチします。%, _, *記号の詳細な例としては、FREQプログラムの節

(23節)を参照してください。

引用 (\) 記号は、本来特別な意味を持ったメタキャラクタの記号をエスケープして、文字どおりの解釈に用

いる場合に使用します。テキスト内で、文字どおりの * 記号を検索したいと仮定してみましょう。* 記号は、

いかなる文字列にもマッチする特別な意味があるので、検索文字列で指定する場合には、\* のように直前に\

を置いて文字どおりの意味で解釈させるようにします。例えば \string\*string" のように指定します。文字ど

おりの \ 記号を検索する場合には、やはりエスケープして\\とします。

230

Page 255: JChatman

第27章 CLANのいろいろなプログラム

中則夫・白井英俊

27.1 CHAINS { インタラクションコードの追跡

CHAINS は、インタラクションコードの連続を追跡するために使用する。追跡されるコードは、特定の単一

のコード用ティアに手で入力しておく必要があります。CHAINS を試しに動かしてみたいときには、配布ディ

スクに含まれる chains.cha ファイルを使用するとよいでしょう。次のようなデータが含まれています。

@Begin

@Participants: CHI Sarah Target_child, MOT Carol Mother, FAT Bob Father

*MOT: sure go ahead [c].

%wld: $A

%spa: $nia:gi

*CHI: can I? [c] can I really [c].

%wld: $A $D. $B.

%spa: $nia:fp $nia:yq.

%sec: $ext $why. $mor.

*FAT: you do [c] or you don't [c].

*MOT: you do [c].

%wld: $B $C.

%spa: $nia:pa

*MOT: that's it [c].

%wld: $C

%spa: $nia:pa

@End

このファイルに含まれる [c]という記号は、節をマークするために使用されています。現在のところ、CHAINS

プログラムのためだけに使用されています。%wldティアは、このプロジェクトに固有なティアで、話法理論で

定義されているような可能世界をコード化するのに用いられています。%spa, %sec, %wld ティアにはピリオド

がありますが、これはメインラインの [c] 記号とディペンデントティアのコードの対応関係を明確にするため

です。

出力に表示されるコードの順番を変えるためには、codes.ord というファイルを作成し、作業用のワーキン

グディレクトリかライブラリディレクトリに置きます。CHAINSは、自動的にこのファイルを探しますので、オ

プションの指定は不要です。もしこの名前のファイルがない場合は、アルファベット順に出力が行われます。

codes.ord ファイルでは、すべてのコードをどんな順番でも記述することができますが、一行にひとつのコー

ドを書きます。リストには、データ内に含まれるコード以外のものが入っていてもかまいません。しかし、も

しデータ内にあるコードの中でリストに挙げられていないコードがある場合には、自動的にアルファベット順

で挿入されます。

231

Page 256: JChatman

第 27章 CLANのいろいろなプログラム

27.1.1 例題の実行

それでは、手始めとして %spa ティアを調べてみましょう。次のようなコマンドを実行してみてください。

chains +t%spa chains.cha

すると、すべてのスピーカーのスピーチアクトコードのチェーンが個別に出力されます。

Speaker markers: 1=*MOT, 2=*CHI, 3=*FAT

$nia:fp $nia:gi $nia:pa $nia:yq line #

0 1 0 0 3

2 0 0 2 6

0 0 1 0 11

0 0 1 0 14

ALL speakers:

$nia:fp $nia:gi $nia:pa $nia:yq

# chains 1 1 1 1

Avg leng 1.00 1.00 2.00 1.00

Std dev 0.00 0.00 0.00 0.00

Min leng 1 1 2 1

Max leng 1 1 2 1

Speakers *MOT:

$nia:fp $nia:gi $nia:pa $nia:yq

# chains 0 1 1 0

Avg leng 0.00 1.00 2.00 0.00

Std dev 0.00 0.00 0.00 0.00

Min leng 0 1 2 0

Max leng 0 1 2 0

SP Part. 0 1 1 0

SP/Total 0.00 1.00 1.00 0.00

Speakers *CHI:

$nia:fp $nia:gi $nia:pa $nia:yq

# chains 1 0 0 1

Avg leng 1.00 0.00 0.00 1.00

Std dev 0.00 0.00 0.00 0.00

Min leng 1 0 0 1

Max leng 1 0 0 1

SP Part. 1 0 0 1

SP/Total 1.00 0.00 0.00 1.00

Speakers *FAT:

$nia:fp $nia:gi $nia:pa $nia:yq

# chains 0 0 0 0

Avg leng 0.00 0.00 0.00 0.00

232

Page 257: JChatman

27.1. CHAINS { インタラクションコードの追跡

Std dev 0.00 0.00 0.00 0.00

Min leng 0 0 0 0

Max leng 0 0 0 0

SP Part. 0 0 0 0

SP/Total 0.00 0.00 0.00 0.00

また +sスイッチを用いて、いろいろなスピーチアクトコード間で分析を統合することもできます。この場合

には、もうひとつの事例がある場合にはコンマで区切られさらに出力されます。次のようなコマンド例を見て

ください。

chains +d +t%spa chains.cha -t*FAT +s$nia:%

このコマンドを実行すると、次のような出力が得られます。なお、父親は-t*FAT スイッチを用いて分析から

除外されていることに注意してください。

Speaker markers: 1=*MOT, 2=*CHI

$nia: line #

1 gi 3

2 fp, yq 6

1 pa 11

1 pa 14

ALL speakers:

$nia:

# chains 1

Avg leng 5.00

Std dev 0.00

Min leng 5

Max leng 5

Speakers *MOT:

$nia:

# chains 2

Avg leng 1.50

Std dev 0.50

Min leng 1

Max leng 2

SP Part. 1

SP/Total 0.60

Speakers *CHI:

$nia:

# chains 1

Avg leng 2.00

233

Page 258: JChatman

第 27章 CLANのいろいろなプログラム

Std dev 0.00

Min leng 2

Max leng 2

SP Part. 1

SP/Total 0.40

一度にふたつのティアを追跡することもできます。たとえば、%codと %secティアの両方にまたがるチェー

ンを次のようなコマンドで追跡できます。

chains +c"[c]" +d +t%cod chains.cha +t%sit -t*fat

また、このコマンドでは、+c スイッチを使用して発話文より小さい分析単位を定義する方法の例ともなってい

ます。出力は次のようなります。

Speaker markers: 1=*MOT, 2=*CHI

$a $b $c $d line #

1 3

2 $ext $why 2 $ext $why 6

2 $mor 6

1 1 11

1 14

ALL speakers:

$a $b $c $d

# chains 1 1 1 1

Avg leng 2.00 2.00 2.00 1.00

Std dev 0.00 0.00 0.00 0.00

Min leng 2 2 2 1

Max leng 2 2 2 1

Speakers *MOT:

$a $b $c $d

# chains 1 1 1 0

Avg leng 1.00 1.00 2.00 0.00

Std dev 0.00 0.00 0.00 0.00

Min leng 1 1 2 0

Max leng 1 1 2 0

SP Part. 1 1 1 0

SP/Total 0.50 0.50 1.00 0.00

Speakers *CHI:

$a $b $c $d

# chains 1 1 0 1

Avg leng 1.00 1.00 0.00 1.00

Std dev 0.00 0.00 0.00 0.00

Min leng 1 1 0 1

Max leng 1 1 0 1

234

Page 259: JChatman

27.1. CHAINS { インタラクションコードの追跡

SP Part. 1 1 0 1

SP/Total 0.50 0.50 0.00 1.00

27.1.2 CHAINSのオプション

CHAINS において独特の意味をもつオプションには以下のものがあります。

1. +c: CHAINSが分析するデフォルトの単位は発話であるが、+cオプションにより、発話以外の単位でも

追跡できる。発話以外の単位の場合、[c]を節の区切りとして使うには、+c"[c]" のように+cの後に区

切り記号を指定する。このような区切り記号を多数使用する場合には、ファイルにそれらを書き込んでお

き、+c@filenameのように指定できる。このオプションがどのように働くか確かめるには、以下を実行し

てみればよい。

chains +c"[c]" +d +t%wld chains.cha +t%sec -t*FAT

2. +d: 出力において、不要なゼロをスペースに変換する。このオプションがどのように働くか確かめるに

は、以下を実行してみればよい。

chains +d +t%spa chains.cha -t*FAT +s$nia:%

3. +s/-s: 特定のコードだけを追跡するために用いる。例えば、+s$bを指定すれば、$bコードだけを追跡

する。追跡するコードが多数ある場合はファイルに書き込んでおき、+s@filenameと指定することができ

る。このオプションがどのように働くか確かめるには、以下を実行してみればよい。

chains +d +t%spa chains.cha -t*FAT +s$nia:%

4. +wN: 出力のコラム幅を N字幅に設定する。

上記以外のオプションについては、コマンドウィンドゥで CHAINSと入力すればそのリストが得られます。ま

ずプログラムに固有のオプションが表示され、続けて一般的なオプションが表示されます。一般的なオプショ

ンについては 26章を参照してください。\breads", \bats", \bat-'s", \balls", \beds", \bed-s", \breaks" など

にマッチします。

% メタキャラクタは、* 記号と同じようにマッチを行うことができます。しかし、異なるのは、% 記号に

マッチした文字列の間で区別が行われないため、出力が生成される時に各文字列は同じものとして扱われます。

言い換えると、もし検索文字列が b%tだとすると、\beat" と \bat" は出力では同じ文字列が 2回出てきたも

のとして分析されます。もし、キーワードのマッチによって単語のリストを作るプログラムで使用しなければ、

% 記号は * 記号と同じ効果をもちます。

% 記号がもうひとつの % と連続して使われると、メタキャラクタの効果が少し変わります。この場合 %に

よってマッチした部分だけでなく、その前の一文字も内容を無視されます。% 記号を付加しない場合には、ワ

イルドカードの前の単語分割記号にはマッチしませんし、無視しません。%を加えた検索は、単語の語幹だけ

を検索したい場合に特に役に立ちます。たとえば、\cat" の単語頻度計算を行う際には、次のコマンドを使用

します。

freq +s"cat-%%" file.cha

最初の % 記号は接尾語にマッチし、2番目はハイフンにマッチします。このように、+s オプションで指定

された検索文字列は、\cat", \cats", \cat-'s", \cat-s" などにマッチし、FREQはこれらの単語を \cat" 一語と

してカウントします。�le.chaがこれら 4つの単語だけをもっていれば、出力は 4 cat となるはずです。この検

索法の限界は、2番目の %が単語分割記号にしかマッチしないため、\cats"や \cat's" などの単語にマッチし

ないことです。2番目の % は、$NIA:RP:IN などの階層コードにマッチさせるときにも便利です。

235

Page 260: JChatman

第 27章 CLANのいろいろなプログラム

記号は * 記号に似ていますが、単語内の一字にしかマッチしない点が異なります。たとえば、\b d" は、

\bad", \bed", \bud", \bid" などにマッチします。%, , * 記号の詳細な例としては、FREQプログラムの節を

参照してください。

n 記号は、本来特別な意味を持ったメタキャラクタの記号をエスケープして、文字どおりの解釈に用いる場

合に使用します。テキスト内で、文字どおりの * 記号を検索したいと仮定してみましょう。* 記号は、いかな

る文字列にもマッチする特別な意味があるので、検索文字列で指定する場合には、n* のように直前に n を置

いて文字どおりの意味で解釈させるようにします。文字どおりの n 記号を検索する場合には、やはりエスケー

プして nn とします。

27.2 CHIP | インタラクションの分析 | Je� Sokolov

CHIPは、Je� Sokolovによって書かれたプログラムで、発話の特定のペアを分析します。このプログラムは、

親からこどもへの発話入力、スピーチアクトと模倣の相関関係、健常児および障害児による模倣の個人的相違

などを分析するのに使われてきました。このプログラムを使用した研究成果を公表する際には、Sokolov and

MacWhinney (1990) を引用してください。CHIP の主な機能的側面としては、次のようなものがあります。

1.ティア作成システム

2.コード化システム

3.置き換えクラスを定義するテクニック

4.総合統計の性質

27.2.1 ティア作成システム

CHIPは、特定のふたつの文を比較してそれらを分析し、その結果を新しいコード化ティアにとしてデータ

中に挿入します。ペアになるふたつの文のうち、最初の文をソース発話と呼び、二つ目をレスポンス発話と呼

びます。レスポンスは、ソースと比較されます。スピーカーは、+bと +c コードによって特定されます。最も

簡単な CHIP のコマンドは次のようになります。

chip +bMOT +cCHI chip.cha

このコマンドが、次のような 7つの文からなるファイルに適用されたと仮定しましょう。

@Begin

@Participants: MOT Mother, CHI Child

*MOT: what-'is that ?

*CHI: hat .

*MOT: a hat !

*CHI: a hat .

*MOT: and what-'is this ?

*CHI: a hat !

*MOT: yes that-'is the hat .

@End

すると、その出力は次のようになります。

*MOT: what-'is that ?

*CHI: hat .

%chi: $NO_REP $REP = 0.00

236

Page 261: JChatman

27.2. CHIP | インタラクションの分析 | Je� Sokolov

*MOT: a hat !

%asr: $NO_REP $REP = 0.00

%adu: $EXA:hat $ADD:a $EXPAN $DIST = 1 $REP = 0.50

*CHI: a hat .

%csr: $EXA:hat $ADD:a $EXPAN $DIST = 2 $REP = 0.50

%chi: $EXA:a-hat $EXACT $DIST = 1 $REP = 1.00

*MOT: and what-'is this ?

%asr: $NO_REP $REP = 0.00

%adu: $NO_REP $REP = 0.00

*CHI: a hat !

%csr: $EXA:a-hat $EXACT $DIST = 2 $REP = 1.00

%chi: $NO_REP $REP = 0.00

*MOT: yes that-'is the hat .

%asr: $NO_REP $REP = 0.00

%adu: $EXA:hat $ADD:yes-that-'is-the $DEL:a $DIST = 1 $REP = 0.25

出力には、後で述べるような詳しい総合統計も含まれます。出力の最初の部分では、4つの異なるティアが導

入されています。

1. %chi:このティアは、親の発話に対するこどもの反応に関する分析です。したがって、おとなの発話がソー

スで、こどもの発話がレスポンスです。

2. %adu: こどもの発話に対するおとなの反応です。こどもの発話がソースで、おとなの発話がレスポンスに

なります。

3. %csr: こどもによる自分自身の発話の繰り返しを分析します。こどもの発話が、ソースであると同時にレ

スポンスになります。

4. %asr: おとなによる自分自身の発話の繰り返しを分析します。おとなの発話が、ソースであると同時にレ

スポンスになります。

CHIPは、デフォールトでこれらの 4つのティアを生成します。しかし、+nオプションを使用すれば、どのティ

アを作るか制御することができます。3種類の組み合わせが可能です。

1. -ns と -nb を両方使用する。-ns スイッチは %csr ティアと %asr ティアの両方を抑制します。-nb は

%adu ティアを抑制します。その結果、%chi ティアだけが出力されます。

2. -ns と -nc を両方使用する。-ns スイッチは %csr ティアと %asr ティアの両方を抑制します。-nc は

%chi ティアを抑制します。その結果、%adu ティアだけが出力されます。

3. -nb と -nc を両方使用する。%csr ティアと %asr ティアが出力されます。

3つのスイッチを一度に使用することはできません。

27.2.2 コード化システム

CHIP コード化システムは、先行して考案されたいくつかのシステムの側面を含んでいます。 (Bohannon &

Stanowicz, 1988; Demetras, Post & Snow, 1986; Hirsh-Pasek, Trieman & Schneiderman, 1984; Ho�-Ginsberg,

1985; Moerk, 1983; Nelson, Denninger, Bonvilian, Kaplan & Baker, 1984) 。以前のシステムと異なるのは、

コードを自動的に計算できる点です。これにより、分析のスピードと信頼性を高めることができますが、その

柔軟性と適用範囲は逆に犠牲になります。

CHIP が作るコードには、語彙的、形態的な追加、削除、完全に一致、置き換えの特定が含まれています。

コードには、次のようなものがあります。

237

Page 262: JChatman

第 27章 CLANのいろいろなプログラム

$ADD N 個の連続する単語を追加

$DEL N 個の連続する単語を削除

$EXA N 個の連続する単語が完全に一致

$SUB N 個の連続する単語を特定の語彙リスト内で置き換え

$MADD 一致した語幹に基づいて形態素を追加

$MDEL 一致した語幹に基づいて形態素を削除

$MEXA 一致した語幹に基づいて形態素を完全に一致

$MSUB 一致した語幹に基づいて形態素を置き換え

$DIST ソース発話とレスポンス発話の距離

$NO REP ソースとレスポンスの重複なし

$LO REP ソースとレスポンスの重複がユーザー定義の最小値未満

$EXACT 追加、削除、置き換えなしのソースとレスポンスのペア

$EXPAN 完全に一致、追加のペアはあるが、削除、置き換えなしのソースとレスポンスのペア

$REDUC 完全に一致、削除のペアはあるが、追加、置き換えなしのソースとレスポンスのペア

$SUBST 完全に一致と追加だけのソースとレスポンスのペア

$FRO 語彙リストからのひとつの要素が前置

$REP ソースとレスポンス間の繰り返し率。重複した語幹の数を、すべての語幹の数で割ったもの

chip.cha の最後の行を見てみましょう。

*MOT: yes that-'is the hat .

%asr: $NO_REP $REP = 0.00

%adu: $EXA:hat $ADD:yes-that-'is-the $DEL:a $DIST = 1 $REP = 0.25

%adu ティアは、おとなのレスポンスが \hat" という完全に一致した単語と、\yes-that-'is-the" という追加し

た単語と、\a" の削除を含んでいることを示しています。DIST=1 は、おとなのレスポンスがこどものソース

よりも 2発話の距離になることを示しています。また、この比較の繰り返し率は 0.25です (一致した語幹ひと

つを、おとなのレスポンスの総語幹数で割っている)。

CHIP は、CHAT タイプの形態素コード化も利用しています。単語に遭遇すると、 CHIP は語幹と一緒に接

頭語と接尾語をすべて格納します。コード化の過程で、語幹が完全に一致した場合には、付属する形態素の追

加、削除、繰り返し、置き換えなどを調べます。

27.2.3 語彙クラス分析

chip.cha を CHIP で普通に分析した場合には、おとなとこどもの両方が \hat" という単語の前で定冠詞を

使っているという事実は報告されません。しかし、定冠詞や法助動詞などの小さな語彙グループに関する置き

換えクラスを作り、クラス内削除、追加、完全一致と同じように、クラス内置き換えを追跡することができま

す。そのためには、まず置き換えられる語彙のリストをファイルにしなければなりません。たとえば、冠詞の

置き換えをコード化するためには、配布ディスクに含まれる \a" と \the" をリストした article というファイ

ルが使用できます。次のように、+g と +h オプションを使用してください。

chip +cCHI +bMOT +g +harticles chip.cha

chip.cha の最後の二行を分析した出力には、%aduに $SUB のフィールドが追加されます。

*CHI: a hat!

*MOT: yes that-'is the hat.

%adu: $EXA:hat $ADD:yes-that-'is $SUB:the $DIST = 1 $REP = 0.25

238

Page 263: JChatman

27.2. CHIP | インタラクションの分析 | Je� Sokolov

+g オプションは置き換えを可能にし、+harticle オプションはあらかじめユーザーの作ったファイルを調べ

ます。注目して欲しいのは、\hat" という完全一致、\yes-that-'is-the"という追加、\the"と \a" のクラス内

置き換えがある点です。置き換えオプションを使用するとディペンデントティアを変更するほか、総合統計に

も影響を与えます。置き換えオプションを使った場合には、統計は語彙リスト相対でのみ計算されます。多く

の場合、CHIP を置き換えオプションありとなしの両方で使用し、分析結果を対比することになるでしょう。

また、CLANの制限機能を繰り返し利用し、CHIPを用いた分析をさらに強力にすることもできます。もし、

親のレスポンスが限られたクラスの動詞を含む拡張した発話である例を抽出したりコード化したい場合には、

まず CHIPで分析を行い、その後 KWALを使用して必要な部分に絞った小さなデータを手に入れます。このデー

タができたら、手でコードを打ち込むことができると思いますので、その後もう一度 KWAL や FREQ にかけま

す。このようないくつかのステップを踏んで分析を行うことによって、自動のコード化と手動のコード化の利

点をフルに活かすことができます。

27.2.4 総合統計

CHIPは、一連の総合統計を作成することもできます。総合統計には、以下に述べるように、各スピーカーの

各コードカテゴリーの絶対的、および相対的な数値を含みます。

chip.cha Measure ADU CHI ASR CSR

chip.cha Total number of utterances: 7

chip.cha Total Responses 3 3 3 2

chip.cha Overlap 2 1 0 2

chip.cha No Overlap 1 2 3 0

chip.cha %_Overlap 0.67 0.33 0.00 1.00

chip.cha Avg_Dist 1.00 1.00 0.00 2.00

chip.cha Rep_Index 0.38 1.00 0.00 0.75

chip.cha ADD_OPS 2 0 0 1

chip.cha DEL_OPS 1 0 0 0

chip.cha EXA_OPS 2 1 0 2

chip.cha %_ADD_OPS 0.40 0.00 0.00 0.33

chip.cha %_DEL_OPS 0.20 0.00 0.00 0.00

chip.cha %_EXA_OPS 0.40 1.00 0.00 0.67

chip.cha ADD_WORD 4 0 0 1

chip.cha DEL_WORD 1 0 0 0

chip.cha EXA_WORD 2 2 0 3

chip.cha %_ADD_WORDS 0.57 0.00 0.00 0.25

chip.cha %_DEL_WORDS 0.14 0.00 0.00 0.00

chip.cha %_EXA_WORDS 0.29 1.00 0.00 0.75

chip.cha MORPH_ADD 0 0 0 0

chip.cha MORPH_DEL 0 0 0 0

chip.cha MORPH_EXA 0 0 0 0

chip.cha MORPH_SUB 0 0 0 0

chip.cha %_MORPH_ADD 0.00 0.00 0.00 0.00

chip.cha %_MORPH_DEL 0.00 0.00 0.00 0.00

chip.cha %_MORPH_EXA 0.00 0.00 0.00 0.00

chip.cha %_MORPH_SUB 0.00 0.00 0.00 0.00

239

Page 264: JChatman

第 27章 CLANのいろいろなプログラム

chip.cha AV_WORD_ADD 2.00 0.00 0.00 1.00

chip.cha AV_WORD_DEL 1.00 0.00 0.00 0.00

chip.cha AV_WORD_EXA 1.00 2.00 0.00 1.50

chip.cha EXACT 0 1 0 1

chip.cha EXPAN 1 0 0 1

chip.cha REDUC 0 0 0 0

chip.cha %_EXACT 0.00 1.00 0.00 0.50

chip.cha %_EXPAN 0.50 0.00 0.00 0.50

chip.cha %_REDUC 0.00 0.00 0.00 0.00

� コラム (Columns): 左からファイル名、統計の略号、こども対おとなのデータ、おとな自身の繰り返し、

こども自身の繰り返し

� 総発話数 (Total Number of Utterances): 分析に含まれる発話の総数、スピーカーのく別なし

� 総レスポンス数 (Total Responses): 各スピーカーのレスポンス数、重複も含む

� 重複数 (Overlap): ソースとレスポンスに少なくともひとつの語幹の重複があるレスポンスの数

� 重複なし数 (No Overlap): ソースとレスポンスに重複がないレスポンスの数

� 平均距離 (Avg_Dist): DIST 値を重複している発話の総数で割った値

� 重複率 (%_Overlap): 総発話数に占める重複レスポンスの割合

� 繰り返し率 (Rep_Index): 重複を含むレスポンス数に占めるソースレスポンス間の繰り返しの平均比率

� 追加総数、削除総数、完全一致総数、置き換え総数 (ADD-OPS, DEL_OPS,EXA_OPS, SUB_OPS) 重複を含

むすべてのペアにおける追加、削除、完全一致、置き換えのぞれぞれの絶対総数

� 追加比率、削除比率、完全一致比率、置き換え比率 (%_ADD_OPS, %_DEL_OPS, %_EXA_OPS, %_SUB_OPS):

各操作の数を 4種類全部の操作の総数で割った値

� 追加単語数、削除単語数、完全一致単語数、置き換え単語数 (ADD_WORD, DEL_WORD, EXA_WORD, SUB_WORD):

重複を含む発話に含まれる各操作の絶対単語数

� 追加単語比率、削除単語比率、完全一致単語比率、置き換え単語比率 (%_ADD_WORDS,%_DEL_WORDS, %_EXA_WORDS,

%_SUB_WORDS): 各操作の単語数を 4種類全部の操作の単語数で割った値

� 追加形態素数、削除形態素数、完全一致形態素数、置き換え形態素数 (MORPH_ADD, MORPH_DEL, MORPH_EXA,

MORPH_SUB): 語幹が一致した場合の各形態素の総数

� 追加形態素比 、削除形態素比 、完全一致形態素比 、置き換え形態素比 (%_MORPH_ADD, %_MORPH_DEL,

%_MORPH_EXA, %_MORPH_SUB): 語幹が一致した場合の各形態素の総数を、完全に一致した語幹の総数で

割った値

� 追加単語平均値、削除単語平均値、完全一致単語平均値、置き換え単語平均値 (AV_WORD_ADD, AV_WORD_DEL,

AV_WORD_EXA): 重複が含まれる発話中における各操作ごとの単語の平均数

AV_WORD_ADD = #_added_words/#_ADD_OPS

AV_WORD_DEL = #_deleted_words/#_DEL_OPS

AV_WORD_EXA = #_exact_words/#_EXA_OPS

AV_WORD_SUB = #_substituted_words/#_SUB_OPS

240

Page 265: JChatman

27.2. CHIP | インタラクションの分析 | Je� Sokolov

� 前置数、前置率 (FRONTED, %_FRONTED): 語彙リストに登録されている単語のうち、前置されたものの総

数と比率

� 完全一致数、完全一致率 (EXACT, %_EXACT): 完全一致したレスポンスの総数と比率

� 追加と完全一致数、追加と完全一致率 (EXPAN, %_EXPAN): 追加と完全一致のみを含むレスポンスの総数

と比率

� 完全一致と削除数、完全一致と削除率 (REDUC, %_REDUC): 完全一致と削除のみを含むレスポンスの総数

と比率

� 完全一致と置き換え数、完全一致と置き換え率 (SUBST, %_SUBST): 完全一致と置き換えのみを含むレス

ポンスの総数と比率

27.2.5 CHIPのオプション

CHIP には、次のような固有のオプションがあります。

1. +b: おとなのスピーカー ID を指定します。指定するスピーカーは、実際におとなの発話でなく

てもかまいません。したがって、実質的にある特定のスピーカーを追跡するために指定するといえます。

2. +c: こどものスピーカー ID を指定します。指定するスピーカーは、実際にこどもの発話でなく

てもかまいません。したがって、実質的にある特定のスピーカーを追跡するために指定するといえます。

3. +d: コードティアのみを出力、数値類は抑制し、次の継起的な分析に備えます。+d1を指定する

と、総合統計だけを出力し、この結果は統計解析のためのプログラムに受け渡すのに使えます。

4. +g: 置き換えオプションを実行可能にします。この場合、+h/-h によって指定された単語リスト

があることが前提条件です。置き換えは、単語リストにしたがって実行されます。

5. +h/-h: 単語リストのファイルを用います。ファイル名を \h"の後に続けて指定します。分析に含

む特定の単語を含めたり (+h)、除外したり (-h) することができます。+h スイッチを使用することによっ

て、発話ペアに含まれる ADD と DEL カテゴリーを比較し、指定した語彙クラス内で置き換えが起こっ

ているかどうか調べることができます。たとえば、人称代名詞のファイルを作るとします。すると、 \I"

の ADDと \you"の DEL の事例が、ソースとレスポンス間で特定の語彙クラス内での置き換えであるこ

とが分かります。

CLAN の標準的なワイルドカードは、リストのどの部分でも使用することができます。もし CHAT タイ

プの形態素解析 (例えば I-'ve )を行っているファイルであれば、単語リストに登録してある語幹だけがデー

タファイル内でマッチします。いいかえると、単語リストを用いた分析では、指定した単語以外は分析が

行われません。したがって、すべての操作と総合統計は、リストで指定された単語にのみ計算されること

に注意してください。語彙リストを用いた分析は、文法的な語彙クラス、数量表現、色彩表現、精神性動

詞などのあらゆる研究目的に活用することができるはずです。また、-h オプションは、\okay"や \year"

などの特定の単語を分析から除外するのに便利です。これにより、適合する発話を取り出す精度を挙げる

ことができます。

6. +n: これには+nb, +nc, +ns の 3種類の値があります。詳しくは本文を参照。

7. +qN: ウィンドウのサイズを N 発話に設定します。デフォルトのウィンドウサイズは、7発話で

す。CHIP はソースとレスポンスの発話ペアを確定した後、コード化を行います。レスポンスを発見する

と、プログラムは最も近いソースの候補を発見するまで指定されたウィンドウ数をさかのぼって検索しま

す。ひとつのレスポンスにつき、ひとつのソースしかコード化はされません。ソースとレスポンスのペア

が確定すると、単純な一致検索が実行されていきます。

8. +x: コード化する、最小限の繰り返し回数を指定します。

241

Page 266: JChatman

第 27章 CLANのいろいろなプログラム

上記以外のオプションについては、コマンドウィンドゥで CHIPと入力すればそのリストが得られます。まず

プログラムに固有のオプションが表示され、続けて一般的なオプションが表示されます。一般的なオプション

については 26章を参照してください。

27.3 CHSTRING | ファイル内の文字列変換

ASCIIテキストの文字列を別の文字列に変換します。CHSTRINGは、特にスペルミスの訂正、スピーカーの名

前を匿名性の高いものに変更、コードを新しいものに更新、その他複数のファイル間でさまざまな一括変換を行

う際に便利です。テキストエディターを使用し、検索置換を行っても同様の結果を得られますが、CHSTRING

のほうが速く、しかも複数のファイルに対して複数の文字列変換を一度に実行できる点で優れています。

単語単位で検索を行う COMBO とは異なり、CHSTRINGは、文字単位検索を行います。つまり \the" という文

字列を検索した場合は、\the"という単語ではなく \t"、\h"、\e"という文字の並びとして扱われます。した

がって、単語内の部分文字列にもマッチしますので、 \other", \bathe", \there" などがマッチしてしまいま

す。そのため、もし単語一致検索をしたい場合には、文字列を半角スペースで囲むようにします。CHSTRING

は、デフォルトでは、メインラインにのみ適用し、ヘッダーとディペンデントティアには適用しません。また、

常に大文字と小文字の区別を行います。なお、日本語の文字も変換することができますが、誤変換を防止する

ため、必ず検索文字列を 3文字以上にしてください。2文字以下では誤変換が発生することがあります。

CHSTRINGには、次のような固有のオプションがあります。

1. +c: データに対して複数の変換を行う必要がある場合があります。その場合は、+c スイッチを使

用して変換ファイルを指定します。まず、エディターなどで変換ファイルを作り、変換対象の文字列と変

換後の文字列のペアをリストします。変換ファイルの形式は、次のようになります。

" old string " " new string "

" old word " " new word "

スペースで文字列を囲むと単語検索モード、スペースを使用しないと文字列検索モードになります。この

ファイルのデフォルト名は、\change.txt"で、もし特定のファイル名を指定しないときには、デフォルト

名のファイルが検索されます。特定のファイル名を使用したいときには、+cの直後にファイル名を指定し

ます。たとえば、もし \myword.txt" という変換ファイルを使用したいときには、+cmyword.txt としま

す。CHSTRING の動作を体験するため、まず次のような変換ファイルを作成してください。

" the " " wonderful "

" eat " " quark "

そして、次のようなコマンドを実行します。

chstring +c sample.cha

変換が正しく行われたどうか、出力ファイルを確かめてみてください。

もし文字列に二重引用符 (")を含めなければならない場合には、文字列を一重引用符 (')で囲むようにし

ます。また検索文字列には、拡張 ASCII 文字を使用することができ、日本語も検索できます。たとえば、

次の例では、ドイツ語の拡張 ASCII テキストを通常の ASCII に変更しています。"�a" '^a"'

"�o" '^o"'

"�u" '^u"'

"�" '^ss'

(a) +d: CHSTRING 独自の各種整形機能を無効にします。整形機能には、空行の削除、余分なスペー

スの削除、要素を含まないディペンデントティアの削除、ヘッダの後のスペースをタブに変換、長い文

242

Page 267: JChatman

27.3. CHSTRING | ファイル内の文字列変換

の自動改行などが含まれます。

(b) +l: ティア ID の次にあるコロンの左側の要素にのみ変換を適用します。

(c) +n: ティア ID の次にあるコロンの右側の要素にのみ変換を適用します。

(d) +q: CHAT では、3文字のスピーカーコードの後はタブを使うことになっています。しかし、

いくつかの場合では、やむを得ずスペースが代わりに使われてしまうことがあります。しかも、これら

の違いは視覚的に区別できないので不便です。+q オプションは、スペースをタブに置き換えて解釈し、

CHAT 形式に適合するようにします。

(e) +r: ティア ID の次にあるコロンの右側の要素にのみ変換を適用します。

(f) +s: 場合によっては、ひとつの検索だけすればよい場合もあります。その場合には、+s の直後

に検索文字列を指定することができます。たとえば、\gumma" という単語をすべてこども独自の形式

としてマークしたい場合には、次のように指定します。

+s" gumma " " gumma@c "

検索文字列と置換文字列が共にスペースで囲まれ、ふたつ文字列はスペースで区切られていることに注

意してください。また、文字列の指定は大文字と小文字の使い分けを行います。どちらかの文字列に二

重引用符が含まれる場合には、両方の文字列を一重引用符で囲んでください。

(g) +t: 特定のディペンデントティアだけを含めたい場合には +t スイッチの後にティアコードを

指定します。たとえば、%spa ティアだけを変換したいとすると、次のようなコマンドを使用します。

chstring -t* +t%spa +s"$INI" "$INIT" sample.cha

ここで、メインラインを除外するために -t* オプションを使用しなければならないことに注意してくだ

さい。CLANでは、メインラインをデフォールトで分析します。もし、すべてのメインラインとディペ

ンデントティアを分析したい場合には、+t* の指定はいりません。しかし、もしコーディングティアに

変換を行いたい場合には、+t% オプションが必要です。たとえば、母親の %spa ティアだけを変換した

いとすると、+t*MOT オプションを指定して次のようなコマンドを実行します。

chstring -t* +t*MOT +t%spa +s"$INI" "$INIT" sample.cha

-t*MOT でまず変換が母親の発話に限定され、-t* でさらにメインラインが除外されることに注意して

ください。このように、-t* は、単にこどものメインラインとそのディペンデントティアを除外する

-t*CHI とははたらきが異なることになります。

(h) +x: CHSTRINGは、デフォルトでは * _ \ をメタキャラクタとして扱いません。というのも、

そのような扱いをすると、場合によっては悪い結果を引き起こすからです。そこで、もしこれらの記号

をメタキャラクタとして解釈させたい場合には、+x オプションを使用します。

(i) +y: nonCHAT ファイルに適用する際には、このオプションを指定しなければなりません。

注意: CHSTRING は、CLAN の中でも潜在的に最も危険なプログラムです。誤って使用した場合、重要な

データを失う深刻な事態になる可能性があります。そのため、変換のしかたについては特に慎重に行って

ください。検索文字列を正確に指定しないと、取り返しのつかないことにもなります。例として、 \yes"

を \yeah"に変更する場合に何が起こるのかを考えてみましょう。次のようなコマンドを実行してみます。

chstring +s"yes" "yeah" myfile.cha

この場合、検索文字列をスペースで囲んでいないので文字検索モードで変換が行われています。したがっ

て、すべての \yes"という文字連鎖はすべて変換されることになります。たとえば、\yesterday", \eyes",

\polyester" などはすべて変換され、\yeahsterday", \eyeah", \polyearter" になります。そこで変換精度

を高めるために、検索文字列をスペースで囲んで単語検索モードで変換を行います。より好ましいコマン

ドは次のようなものです。

chstring +s" yes " " yeah " myfile.cha

この変更によって、 \yes" という単語だけが \yeah"に変更されます。また、文境界記号が後に続く例も

変換されます。CLANは文境界記号を、スペースと同じように扱うことができます。

243

Page 268: JChatman

第 27章 CLANのいろいろなプログラム

27.4 COOCCUR | 共起分析

COOCCURは、同一発話文内の単語の共起を分析します。これは、統語的な要素のまとまり (クラスター)の分

析に特に役に立ちます。デフォールトでは、クラスターの長さはふたつの単語ですが、+n オプションを使用す

ることによって単語の数を 20 まで増やすことができます。この場合に、最初のクラスターの二番目の単語は、

二番目のクラスターの最初の単語になります。

cooccur +t*MOT +n3 sample.cha +f

このコマンド例では、+t*MOT スイッチによって*MOT ティアだけが分析されます。COOCCURでは、ヘッダーと

ディペンデントティアはデフォールトで除外されます。+n3 は、3つの単語をクラスターとして分析するオプ

ションです。COOCCURは、一度に 3つづつ単語を検索していき、同一単語の共起を調べます。文末に達すると

その文の検索は終了するので、検索が別の文にまたがることはありません。

%mor 行でのコードの共起は、次のようなコマンドで調べることができます。

cooccur +t%mor -t* +s*def sample2.cha

COOCCURに固有なオプションには以下のものがあります。

1. +d: 共起頻度数の表示を抑制します。

2. +n: クラスターの長さを設定します。たとえば、+n3 とすると、クラスターの長さは 3となり、3

つの単語を同時に検索します。

3. +s: 特定の単語の共起だけを分析します。このオプションの次には直接文字列を指定することがで

きます。複数の単語を検索する場合には、ファイルに書き込み、+s@ファイル名 を指定します。

一般的なオプションについては 26章を参照してください。

27.5 DIST | コードや単語間の距離

DISTはファイルの含まれるコードや単語間の平均距離を算出します。指定したキーワードや単語間に、途中

に介在する発話数がどれくらいあるかを計算します。次の例を見てください。

dist +t%spa -t* +b: sample.cha

これによってプログラムは、sample.cha ファイルの%spaティアを見て \:"という記号が含まれているコード

を探します。それぞれのコードの頻度を計算し、それらの出現の間のターンの回数を計算します。またここで

は-t*オプションによってプログラムはメインティアのデータを無視しています。

DISTに固有のオプションには以下のものがあります。

1. +b: +b の後には、ある特別の文字を指定することができます。これはコロンのようなもので、複

雑なコードを、その構成要素に分割する働きをします。たとえば、ディペンデントティアにある、ある単

語を名詞と特定し、その後に別のディペンデントティアで $NOU:pro のようなコードを用いて、同一の単

語を代名詞と特定したいとします。すると、プログラムはおの複合コードを各構成要素ごと、およびそれ

全体、の二通りで分析をすることができるようになります。したがって、$NOUでマークされた上位のクラ

スとしての要素の距離と、 $NOU:pro マークされた下位のクラスとしての要素の距離をそれぞれ出せるよ

うになるわけです。具体的なコマンドとしては、次のように用いることになります。

dist +b: sample.cha

2. +d: 統計分析に適した形で出力を行います。

3. +g: このスイッチを使用すると、発話ごとに同じ単語の出現を一回に制限します。つまり、同じ語

やコードが同一発話内で何回出てきても、一回として計算します。

244

Page 269: JChatman

27.6. DSS | 文発達指標 (Developmental Sentence Score)

4. +o: このスイッチを使用すると、bオプションで指定された文字を含むコードではなく、その文字

を含む単語だけを計算の対象にします。

27.6 DSS | 文発達指標 (Developmental Sentence Score)

このプログラムは、Lee (1974)の文発達指標を自動的に計算します。この指標は、8つの文法領域にわたる統

語的、形態的、語彙的構造に関して与えられたさまざまな指標を基に算出されます。現在のバージョンの DSS

は、予備的なものであり不完全です。完全に自動的な DSS の計算は、PARS〔統語解析)プログラムが完成す

るのを待たなければなりません。それまでは、自動的に計算されたプロファイルを手作業で修正し、自動計算

を補完しなければなりません。

27.6.1 CHAT ファイル形式に関する条件

DSSが正常に動作するためには、次のような CHAT 変換が行われていなければなりません。

1. すべての発話は、文境界記号で終わり、命令文は ! で終わっていなければなりません。

2. 不完全あるいは中断された発話分は+... か +/. のどちらかで終わっていなければなりません

3. 代名詞の I か、固有名詞の第一文字目だけが大文字になっていなければなりません

4. 主語述語関係に名詞と動詞を含むが変則的な語順を持つ発話では、文境界の後に [DSS] 記号がなければな

りません

5. DSS は、こどもがすぐ前の親の発話をまねた場合には、その文を自動的に除外するようになっています。

しかし、他にも模倣として分析から除外した方がよいと思われる発話があると分析をする人が判断した場

合には、それらの発話の後には [+ imit] というポストコードを入れておかなければなりません。

27.6.2 50発話分のコーパスの選択

DSS 指標は、50の文からなるコーパスを基にして計算されます。DSSは、Leeの 6つの指標を基にしてサン

プル発話から 50 の文を抽出するように設計されています。

1.コーパスは、50 の完全な文を含んでいなければなりません。もし文が主語述語関係の中に名詞と動詞を

含んでいると、その文は完全であるとみなされます。 \Look!" のような命令文も含まれますが、必ず文末

に !記号がなければなりません。\Car a garage come out, Hit a �nger hammer" などのように、語順が

逆転している未発達の発話も含めることができます。しかし、このような文は、文境界記号の後に [DSS]

コードを入力し、分析に含まれるようにしなければなりません。

2. 発話サンプルは、連続した発話がまとまったものでなければなりません。発話データ全体をうまく代表す

るためには、このように発話が連続した部分から抜き出されている必要があります。分析を行う人は、そ

の部分が最も代表的な部分であるかを自分の自由な判断に応じて決定することができます。DSSは、最初

の 50 の文を自動的に選択するのがデフォルトになっています。したがって、そのほかの部分から分析を

始めたい場合には、@dss ヘッダをファイルのヘッダ部分に入れ、DSS 分析を行いたい部分が始まる箇所

に@dss: start 行を挿入します。

3.サンプルに含まれる文はすべて異なったものでなければなりません。同じ文が含まれないように注意して

ください。DSSはそれぞれの文を解析し、繰り返された文を自動的に分析から除外します。

4. 判読不能な文はサンプルから除外します。DSSは、 xxx, xx, yyy, yyが含まれた文を分析から自動的に除

外します。

5.エコー文 (おうむ返し文)は、サンプルから除外します。DSSは、こどもが自分自身で作り出した文に焦点

を当てて分析を行いますので、先行するおとなの発話をまねしたこどもの発話はすべて除外されます。-s

245

Page 270: JChatman

第 27章 CLANのいろいろなプログラム

オプションを使用することによって、[+imit]ポストコードを含むすべての文も除外することができます。

6.不完全な文は除外しなければなりません。+... や+/. などの不完全な発話や割り込まれた文は分析から

除外しましょう。

7. (これはまだ実現されていません) DSSは、Lee の定義する完全な文を少なくとも 50% もっている場合に

だけ実行されます。もし完全な文が 50%に満たない場合には、Developmental Sentensce Type Analysys

(DST)のほうが適切です。この条件が満たされない場合には、出力ファイルに警告メッセージが出力され

ます。

27.6.3 DSS の自動計算

DSS を計算するためには、まず MOR を使用して完全な形態素解析をする必要があります。この際に、 MOR

の +c オプションを使用しなければなりません。MORは、文中に含まれる単語の形態素解析を自動的に行い、

解析結果を対応する%morティアに出力します。出力ファイルには .mor の拡張子がつきますが、このファイル

を DSS の分析に使用します。

MOR による解析が終了したら、次に DSS を使用して Developmental Sentence Analysys を行わなければ

なりません。 DSS には、自動モードと対話モードのふたつのモードがあります。自動モードでは、最終的な

Developmental Sentensce Score なしで DSS 表を生成します。+e オプションを指定することによって、自動

モードで動作させることができます。基本的な自動モードの DSS コマンド例は、次のような形になります。

dss +b*CHI +e sample.mor

27.6.4 対話モードによる計算

対話モードでは、 DSS はコーパス中の各文を解析し、さらに Sentence Point を加算したり、適切な場所に

マークをつけるなどの操作が可能です。Sentence Pointは、もしおとなの文の標準的な規則を満たしていれば

(Lee, p137)、それぞれの文に加算することが可能です。Sentence Point は、 DSS によって解析される 8つの

カテゴリー以外のエラーに対しては与えることを抑制することができます。このようなエラーには、冠詞、前

置詞、複数形または所有形標識、語順に関するエラーなどが含まれます。それに加えて、\chair" の代わりの

\sitting-thing" や \mailman" に対する \letterman" などの新しい単語の使用などを含む意味的なエラーに対

しても抑制することができます。

grammatical category point は、Lee の要件を満たした構造にのみ与えられます。もし、文法構造が使用し

ようとしたけれども、正しく産出されなかった場合には、得点値の代わりに \attempt" マークが挿入されま

す。対話モードでは、DSS はそれぞれの文を表示し、sentense pointを加算するかしないかの決定をユーザー

に聞いてきたり、attempt マークを挿入したり得点を編集する機会を提供してくれます。

Sentence |IP |PP |PV |SV |NG |CNJ|IR |WHQ|

what this say. | 1 | | | | | | | 2 |

To edit type: category +/- point value (e.g. np+4)

or: p = sentence pt/continue; n = no sentence pt/continue

この時点で、ユーザーには3つのオプションがあります。

1. \p" をタイプして得点を与え、操作を継続

2. \n" とタイプして得点を与えずに操作を継続

3. \e"とタイプして attempt マークを与える、あるいは各カテゴリー得点値を編集してから、 \p" か \n"

をタイプする

246

Page 271: JChatman

27.6. DSS | 文発達指標 (Developmental Sentence Score)

カテゴリーを修正するコマンドは、カテゴリー、付加には + 削除には -、そしてレベル値の3つから構成され

ています。たとえば、attempt マークを加える、あるいは得点値を修正する操作は、次のようになります。primary verbに attempt マーク \-" を挿入: pv+0

primary verbから attempt マーク \-" を削除: pv-0

たとえば、\what this say"という文を考えてみましょう。ユーザーは、文法的エラーの性質を示す primary

verb(PV)と interrogative reversal (IR) の両方に attempt マークを挿入したい場合があります。primary verb

カテゴリーに attempt マークを挿入するために pv+0 とタイプすると、次のような変更画面が得られます。

Sentence |IP |PP |PV |SV |NG |CNJ|IR |WHQ|

what this say. | 1 | | - | | | | | 2 |

To edit type: category +/- point value (e.g. np+4)

or: p = sentence pt/continue; n = no sentence pt/continue

interrogative reversal カテゴリーに attempt マークを挿入するために ir+0とタイプします。すると、次のよ

うな画面が得られます。

Sentence |IP |PP |PV |SV |NG |CNJ|IR |WHQ|

what this say. | 1 | | - | | | | - | 2 |

To edit type: category +/- point value (e.g. np+4)

or: p = sentence pt/continue; n = no sentence pt/continue

DSS では、複数の変更を同時に行うことが可能です。したがって、コマンドの \ir", \+", \0" などの文字の間

にスペースを使用しないように注意してください。この対話モードを使用することによって、文法範疇から得

点値を引くことも同様にして行うことができます。

注意: DSSによる自動モードは、以下にあげるような 3つの項目に対しては得点を正しく与えることができ

ません。もし、これらの項目が存在するときには、自動モードで分析した後に対話モードで得点を付与する必

要があります。

1. \One should not worry about one's life" のような代名詞用法の \one"。これらは、代名詞として 7点を

与えられなければなりません。

2. 補文ではない不定詞構造 (例: \I stopped to play") と補文不定詞構造 (例: \I had to go") これらは

secondary verb としてそれぞれ 3点と 5点を与えられます。

3. 接続詞を含まない埋め込み節を伴う Wh 疑問文 (例: \Why did the man we saw yesterday call you?")。

接続詞でマークされた場合とは異なる (例: \What did the man that we saw yesterday say to you?")。

27.6.5 DSS 出力

50 の文についてすべて sentence pointが与えられると、 DSS は自動的に表を作成します。自動モード、対

話モードとも、それぞれの文は、表の一番左側の欄に表示され、得点値がそれに続きます。対話モードでは、

さらに各文法範疇に対応する attempt マーク、sentence point、 DSS スコアがそれぞれ表示されます。文発達

指標は、各文の合計点の総和を文の数で割ることによって算出されます。

出力される表は、それぞれのこどもについて 8つの文法範疇のどこが強くてどこが弱いかが一目で分かるよ

うに特に設計されています。下の表で、不定代名詞と人称代名詞 (IP, PP) の数値が低いことは、このこども

が発達初期の形式しか使っていないことを示しています。

Sentence |IP |PP |PV |SV |NG |CNJ|IR |WHQ|S|TOT|

I like this. |1 | 1 |1 | | | | | |1| 4|

247

Page 272: JChatman

第 27章 CLANのいろいろなプログラム

I like that. |1 | 1 |1 | | | | | |1| 4|

I want hot dog. | | 1 |1 | | | | | |0| 2|

I like it . | 1 | 1 |1 | | | | | |1| 4|

what this say. | 1 | |- | | | | - | 2 |0| 3|

Developmental Sentence Score: 4.2

27.6.6 DSS サマリー

DSSは、Lee (1974)で概略が示されている文選択と得点付与の両方の基準を可能な限り厳密に守るように設

計されています。 DSS の最終的な目標は、Lee(1974) の基準に基づいて DSS スコアを計算することにありま

す。DSS カテゴリーは以下のように定義されています。

� 不定代名詞 (Inde�nite Pronouns, IP)

得点 構造

1 it, this, that

3 no, some, more, all, lot(s), one(s), two (etc.)

other(s), another, something, somebody, someone

4 nothing, nobody, none, no one

7 any, anything, anybody, anyone

every, everything, everybody, everyone

both, few, many, each, several, most, least, last, second, third (etc.)

� 人称代名詞 (Personal Pronouns, PP)

得点 構造

1 1st and 2nd person: I, me, my, mine, your(s)

2 3rd person: he, him, his, she, her(s)

3 plurals: we, us, our(s) they, them, their, these, those

5 re exives: myself, yourself, himself, herself, itself, themselves, ourselves

6 Wh-pronouns: who, which, whose, whom, what, that, how much

Wh-word + in�nitive: I know what to do, I know who(m) to take

7 (his) own, one, oneself, whichever, whoever, whatever

� 主動詞 (Main Verb, MV)

得点 構造

1 unin ected verb

copula, is or 's

is + verb + ing

2 -s and -ed

irregular past

copula am, are, was, were

auxiliary am, are, was, were

4 can, will may + verb

obligatory do + verb

emphatic do + verb

248

Page 273: JChatman

27.6. DSS | 文発達指標 (Developmental Sentence Score)

6 could, would, should, might + verb

obligatory does, did + verb

emphatic does, did +verb

7 passive including with get, and be

must,shall + verb

have + verb + en

have got

8 have been + verb + ing, had been + verb + ing

modal + have + verb + en

modal + be + verb + ing

other auxiliary combinations (e.g., should have been sleeping)

� 補助動詞 (Secondary Verbs, SV)

得点 構造

2 �ve early developing in�nitives

I wanna see, I'm gonna see, I gotta see, Lemme see, Let's play

3 noncomplementing in�nitives: I stopped to play

4 participle, present or past: I see a boy running

5 early in�nitives with di�ering subjects in basic sentences:

I want you to come

later in�nitival complements: I had to go

obligatory deletions: Make it [to] go

in�nitive with wh-word: I know what to get

7 passive in�nitive with get : I have to get dressed

with be: I want to be pulled.

8 gerund: Swinging is fun.

� 否定 (Negative, NG)

得点 構造

1 it, this, that + copula or auxiliary is, 's + not: It's not mine.

This is not a dog.

4 can't don't

5 isn't won't

7 uncontracted negatives

pronoun-auxiliary or pronoun-copula contraction

auxiliary-negative or copula negative contraction

� 接続詞 (Conjunction, CNJ)

得点 構造

3 and

5 but

so, and so, so that

or, if

249

Page 274: JChatman

第 27章 CLANのいろいろなプログラム

8 where, when , how, while, whether, (or not), till, until,

unless, since, before, after, for, as, as + adjective + as,

as if, like, that, than

obligatory deletions: I run faster that you [run].

elliptical deletions (score 0)

wh-words + in�nitive

I know how to do it.

� 疑問倒置 (Interrogative Reversal, IR)

得点 構造

1 reversal of copula: isn't it red?

4 reversal of auxiliary be: Is he coming?

6 obligatory -do, -does, -did Do they run?

reversal of modal: Can you play?

tag questions: It's fun isn't it?

8 reversal of auxiliary have: Has he seen you?

reversal with two or three auxiliaries: Has he been eating?

� Wh-疑問文 (Wh-question, WHQ)

得点 構造

2 who, what, what + noun

where, how many, how much, what . . . do, what . . . for

5 when,. how, how + adjective

7 why, what it, how come, how about + gerund

8 whose, which, which + noun

27.6.7 DSSのオプション

DSSには、次のような固有のオプションがあります。

1. +b: 分析するスピーカーを特定します。

2. +c: 分析に含まれる文の総数を指定します。デフォールト値は、50の文です。これらの文には、、

主語と動詞が含まれていること、明瞭であること、同一の文ではなく、模倣でないことなどの条件を満た

していなければなりません。コーパスの作成に際しては、厳密な基準を使用します。xxx, yyy, www,など

のコードを含む文はすべて、分析対象から除外したほうがよいでしょう。

3. +e: DSS 表を自動的に生成します。

4. +s/-s: このスイッチは、DSS では特別な使い方をします。[dss] コードでマークされた文を分析

に含めるためには、+s"[dss]"をコマンドラインに含めます。[+ imit] というポストコードにマークさ

れた文を分析から除外するためには、-s"<+ iimit>" を使用します。

27.7 GEM | 必要な部分にタグをつける

GEMは、コーパス中の特定の部分にマークをつけ、分析をより詳細に行えるように設計してあります。出力

させたい部分の最初と最後の部分をマークするふたつのヘッダーを使用するようになっています。これらのヘッ

ダーにはタグをもたせることができ、当該の部分を分析に含めるか除外するかなどの制御を行うことができま

す。もし特定のタグ情報を指定しないときには、@bg をコロンなしで使います。もしタグを使用する場合は、

コロンを使用し、さらにタブを打ち込んでください。これらの形式を守らないと、 CHECKにパスすることがで

250

Page 275: JChatman

27.7. GEM | 必要な部分にタグをつける

きません。次のコマンド例のようなデフォールトでは、 GEMはタグなしの始点記号である @bg と終点記号の

@eg を探します。

gem sample.cha

もし、 gem の検索をもっと細かく行いたい場合には、コードやタグを@bg と @eg に付け加える必要がありま

す。たとえば、読書をしている間のことばのやりとりをすべてマークしたいときは、@bg: の後に \reading"

というタグをつけ、読書が始まる会話部分の前に挿入し、終わる部分の前には、@eg: の次に \reading" を同

様にタグ付けします。そして、+sreading スイッチを指定して、次のようなコマンドを実行します。

gem +sreading sample2.cha

タグ付けにあいまい性が出る場合があり、タグなしの gemが別の gem に入れ子状に埋め込まれた場合や、そ

の領域が重なったときなどがそれにあたります。このような場合には、 gemが固有のタグをもつようにし、タ

グが重複しないように注意してください。

GEM は、発話誘導法などで用いられる特定の刺激文に対する反応だけを検索することもできます。このため

には、@Bg: ヘッダーを用いますが、その後に番号そして必要ならば刺激に関する記述を加えます。次に挙げ

るのが、その例です。

{\tt @Bg:} Picture 53, truck

53番の絵に対する反応をすべて検索するためには、+s"53" スイッチを使用します。

@Bg 行でスラッシュ記号 (/) を使うと、実験で順番に提示した刺激が、順番に関係なく記述されていること

を示すことができます。また、アンパサンド記号 (&) を使うと、刺激を記述しようとする2回目の試みである

ことを示すことができます。たとえば、次の例のように、2番目の刺激の記述 1a に対する 1a&がそれにあた

ります。

@Bg: 1b /

*CHI: a &b ball.

@Bg: 1a /

*CHI: a dog.

@Bg: 1a &

*CHI: and a big ball.

似たようなコードは、特定の研究プロジェクトの刺激の構造と順番を記述する必要があれば作り出すこともで

きます。

gemの領域が重複しない、またその埋め込みがないことがはっきりしていて、ある gemの終わりが別の gem

の始まりになっているときは、lazy GEM と呼ばれる、より簡単な使い方もあります。この方法では、 gemは

@G: にひとつ、あるいは複数のタグをつけたものを使用し、+n スイッチを指定します。次のような例をみて

みましょう。

@G: reading

*CHI: nice kitty.

@G: offstage

*CHI: who that?

@G: reading

*CHI: a big ball.

@G: dinner

この場合、すべての読書の会話は、次のようなコマンドで検索することができます。

gem +n +sreading

251

Page 276: JChatman

第 27章 CLANのいろいろなプログラム

27.7.1 GEMを使った分析範囲の制限のしかた

また、GEMは分析範囲を限定するツールとして用いることもできます。GEMの限定の方法は、KWALや COMBO

のそれとはまったく異なり、特定の部分を抜き出す +t スイッチと似ています。このような使い方をする場合

には、+d スイッチを指定して、出力を CHAT 形式にすると便利です。出力はファイルとしても保存できます

が、次の例のように、パイプを使って別のプログラムの入力として分析を続けることもできます。

gem +sreading +d sample2.cha | freq

@bg 行にはあらゆるタイプのコードを使用することができます。たとえば、文法的な複数の文にわたるターン、

ティーチングエピソード、コミュニケーションの失敗、偶発的な質問の連続などを記述することができます。

27.7.2 GEMのオプション

GEMには、次のようなオプションがあります。

1. +d: +d0を指定すると CHAT形式でファイルを出力します。+d1を指定すると CHAT 形式である

ことに加えて、ファイル名、行番号、@ID コードも出力します。

2. +g: このスイッチを使用すると、+s で指定したタグのすべてが @bg: ヘッダーに含まれている場

合しか検索されなくなります。+g スイッチを指定しない場合には、+sで指定したタグのうちどれかが含

まれているだけで検索にマッチします。

gem +sreading +sbook +g sample2.cha

この例では、ほんの読書を含むすべての行動の部分を検索することができます。

3. +n: @g: 行を検索します。これを指定した場合、gem の 領域に重複がないこと、 gemが入れ子状

に埋め込まれていないこと、それぞれの@gがタグをもっていることが条件になります。この場合、@egは

必要なく、CHECK や GEM は、@gから始まり次の@gでその部分が終了していると判断します。

4. +s: @bg: ティアにある単語によって同定される発話部分を選択します。-s スイッチは使用しない

でください。例は、上の +g オプションの項を見てください。複数の単語を検索する場合には、ファイル

に書き込み、+s@ファイル名、を指定します。

一般的なオプションについては 26章を参照してください。

27.8 GEMFREQ | 行動の種類による出現頻度計算

このプログラムは、 FREQと GEM の基本的な機能を統合したものです。gemは@bg と @egでマークされた発

話データの部分です。たとえば、読書の部分を \@bg bookreading" と \@eg bookreading" でマークすること

ができます。このようなマークを入力すると、GEMFREQ を使うことで基本的な FREQ の出力をさまざまな gem

に応じて作成することができます。たとえば、次のようなコマンドを実行してみましょう。

gemfreq +sarriving sample2.cha

すると、次のような出力が得られます。

gemfreq sample2.cha +sarriving

Tue May 24 15:40:19 1994

gemfreq (14-APR-94) is conducting analyses on:

ALL speaker tiers

and ONLY header tiers matching: @BG:; @EG:;

252

Page 277: JChatman

27.9. GEMLIST | ファイル内の GEM 分布の一覧

****************************************

From file <sample2.cha>

2 arriving:

1 are

1 fine

1 how

1 you

GEMFREQ には、次のようなオプションがあります。

1. +d: このスィッチの+d0レベルは CHAT形式でファイルを出力します。+d1レベルは CHAT 形式

であることに加えて、ファイル名、行番号、@ID コードも出力します。

2. +f/-f: コマンドの実行結果の出力先を指定します。デフォールト設定は -f で、直接画面上に出力

されます。したがって、ファイルに出力したい場合には+f スイッチを使用しなければなりません。

3. +g: このスイッチを使用すると、+s で指定したタグのすべてが @bg: ヘッダーに含まれている場

合しか検索されなくなります。+g スイッチを指定しない場合には、+sで指定したタグのうちどれかが含

まれているだけで検索にマッチします。

gemfreq +sreading +sbook +g sample2.cha

この例では、ほんの読書を含むすべての行動の部分を検索することができます。

4. +n: @g: 行を検索します。これを指定した場合、gem の 領域に重複がないこと、 gemが入れ子状

に埋め込まれていないこと、それぞれの@gがタグをもっていることが条件になります。この場合、@egは

必要なく、CHECK や GEM は、@gから始まり次の@gでその部分が終了していると判断します。

5. +o: メインライン上の特定の単語を検索します。複数の単語を検索する場合には、ファイルに書き

込み、+o@ファイル名、を指定します。

27.9 GEMLIST | ファイル内の GEM 分布の一覧

GEMLISTは、複数のファイルの gemの分布を見ることができる便利なプログラムです。たとえば、sample.cha

と sample2.cha に GEMLIST を適用すると、次のような出力が得られます。

From file <sample.cha>

12 @BG

3 main speaker tiers.

21 @EG

1 main speaker tiers.

24 @BG

3 main speaker tiers.

32 @EG

From file <sample2.cha>

18 @BG: just arriving

2 main speaker tiers.

21 @EG: just arriving

22 @BG: reading magazines

2 main speaker tiers.

25 @EG: reading magazines

26 @BG: reading a comic book

253

Page 278: JChatman

第 27章 CLANのいろいろなプログラム

2 main speaker tiers.

29 @EG: reading a comic book

gemlist も@g という lazy GEMマークとともに用いられます。この場合、@g以外のものを用いてはいけませ

ん。gemlist は@g から始まり次の@gでその部分が終了していると判断します。そうでなければ、出力は @bg

と @eg マーカーとともに用いられた場合と同じになります。

GEMLISTの独特のオプションは以下のものだけです。

1. +d : @bg と @eg 間のデータだけをまとめる。

一般的なオプションについては 26章を参照してください。

27.10 KEYMAP | 偶然性の分析

KEYMAPは、簡単なインタラクション分析や偶然性分析を行うのに便利なプログラムです。 KEYMAPは、特定

のティアにある始発コードである \key" を検索します。もし始発コードである keyを発見すると、KEYMAPは

次の発話の特定のコーディングティアにあるすべてのコードを検索します。これが map です。出力は、さま

ざまなスピーカーに関して、特定のコードが特定のキーに写像する回数を報告します。

27.10.1 KEYMAPの実行例

次にあげるのは、 KEYMAP に追跡されるコードの例です。

*MOT: here you go.

%spa: $INI

*MOT: what do you say?

%spa: $INI

*CHI: thanks.

%spa: $RES

*MOT: you are very welcome.

%spa: $CON

このデータに対して、+b スイッチで $INI をキー記号として KEYMAP を適用すると、出力として $INI の後に

$INIに一回、$RESに一回出現していることが報告されます。キー (上の例の $INI)とディペンデントティア

のコードは、 KEYMAP が特定できるように定義しなければなりません。コーディングティアでは、KEYMAP は

$ 記号をもった記号だけを検索し、他のすべての記号は無視されます。キーは、+b オプションを使用して定

義し、探したい記号はその後にすぐ続けて指定します。KEYMAP の動作をみるために、次のコマンドを試して

みましょう。

keymap +b$INI* +t%spa sample.cha

UNIXでは、クォートメタキャラクタを次のように変更する必要があります。

keymap +b\$INI\* +t%spa sample.cha

KEYMAP は、ひとつ以上のキーを使用しているすべてのスピーカーと、各記号が使用された回数を示した表を

出力します。これらのスピーカーの次には、ぞれぞれ特定の始発スピーカーに応答したすべてのスピーカーの

リストが、始発スピーカーが続けて話す場合も含めて出力されます。また、応答文に含まれるすべてのコード

のリスト、その頻度計算も出力されます。

254

Page 279: JChatman

27.11. MAXWD | 文字列の長さを計算

27.10.2 KEYMAPオプション

KEYMAP独特のオプションには以下のものがあります。

1. +b: 始発コードであるキーを指定します。コードは、+b の後に続いて指定します

2. +s/-s: マップとして検索する $ 記号で始まるコードを指定します。たとえば、sample.cha ファイ

ルで、$CON:*に該当するコードだけ検索したい場合は、次のように指定します。

keymap +b$* +s``$CON:*'' +t%spa sample.cha

一般的なオプションについては 26章を参照してください。

27.11 MAXWD | 文字列の長さを計算

このプログラムは、最も長い単語や発話含まれる場所を探し、それを計算して出力することができます。複

数のファイル間での計算も行うことができます。最も長い単語を検索するときには、出力には、単語、文字数、

行番号、ファイル名などが含まれます。+g オプションを指定した場合には、該当の発話文、発話の長さ、行

番号、ファイル名が出力されます。デフォルトではメインラインにある要素しか対象にしませんが、+t オプ

ションを使うことによって、ディペンデントティアやヘッダーに含まれる要素も対象にすることができます。

次のようなコマンドを実行して、最長の単語がどのように報告されるか試してください。

maxwd sample.cha

MAXWD には、次のようなオプションがあります。

1. +b/-b: 特定の形態素境界を含めるかどう除外するかを指定することができます。デフォルトでは、

&, #, - の 3つが形態素境界になっています。もし仮に、-b#-& スイッチを指定するとすべての形態素境界

を無視させることができます。+bは、新しい境界を付け加えます。

2. +c: 長さが最大のものからいくつの候補を表示するかを指定します。次の例では、sample.chaに現

われる語で最大のものから 7つまでの候補を表示します。

maxwd +c7 sample.cha

3. +d: 最初に文字列の長さを出力し、次の行に単語を表示します。行番号とファイル名は出力されま

せん。+d1を指定すると、最長の単語のみを出力します。

4. +g: 単語ではなく発話の長さを計算し、最も長い単語あるいは形態素をもつ文を選び出して表示し

ます。発話の長さの計算方法は、+g オプションの後の番号によって指定することができます。+g1 は発

話ごとの形態素数で計算します。+g2は発話ごとの単語数で計算します。+g3は発話ごとの文字数で行い

ます。

たとえば、*MOT 行にある最大のものから5つの発話文のMLUと MLTを計算したいときには、次のよ

うなコマンドを実行します。

maxwd +g2 +c5 +d1 +t*mot sample.cha | mlu

+g2 は発話の長さが単語単位で計算されることを指定しています。+c5 は該当候補を最大 5までしか表

示させない設定です。+d1は最大の文字列以外の情報を表示しないようにしています。 j 記号は、 MAXWD

の計算結果を MLU に渡しています。

5. +o: もし +c スイッチを使用しているときには、同じ長さの候補をひとつに絞り、複数の同じ長さ

の候補を表示しないようにすることができます。次のようなコマンド例を試してください。

maxwd +c8 +o sample.cha

255

Page 280: JChatman

第 27章 CLANのいろいろなプログラム

6. +x: 最大の長さの設定を行います。これにより、指定以上の長さをもつ対象を除外し、その指定以

下の長さの中から計算を行うことができます。 長さの数値は+xの直後に記入します。次のコマンドを試

してみてください。

maxwd +x6 sample.cha

一般的なオプションについては 26章を参照してください。

27.12 MLT | 平均ターン長

MLTプログラムは、ターンにおける平均発話数、発話における平均単語数、ターンにおける平均単語数を

計算します。ターンはそれぞれの話し手による発話の列として定義されます。発話の重複はこの計算に含まれ

ません。単純にメインラインの先頭にあるスピーカー IDの列に基づいて計算されます。これらの計算は、各

話し手ごとに別々に行われます。これらの比率には、形態素がどれにも含まれていないことに注意してくださ

い。発話における形態素数を分析する場合には、 MLUプログラムを使用してください。

27.12.1 MLTのデフォルト

MLT 計算の本質は、計算に何を含み何を除外するかに依存しています。デフォルトとしては、次のような原

理にしたがっています。

1. [/] か [//]が次に続くかぎかっこ内にある要素はすべて除外されます。+r6 を用いるか、次のスイッチ

を指定することで、この設定を無効にすることができます。

+s"</>" +s"<//>"

2. [+ bch] のような特定のポストコードを含む発話を除外するためには、-s スイッチを使用します。

-s"[+ bch]"

3.次のような記号もすべて除外されます。

www 0* &* +* -* #* $*

ここでのアスタリスクは、直前にある記号から文末までのすべての要素に対応します。

4.このプログラムでは、次の記号が単語境界記号になります。

. ? ! , ; [ ] < >

半角スペースも単語境界記号になります。

5.次の 3つの記号が発話境界記号になります。

. ! ?

これらのうちの一つで終る+...のような複合記号も同様に発話境界記号になります。

6.特別な記号 xxx と yyy は分析から除外されません。もしこれらの記号が発話内に含まれているとカウン

トされることになります。

7. メインラインにおける発声を伴わない発話は、もし [+ trn] コードをもっていると、ターンとしてカウ

ントされます。たとえば、次のような例です。

CHI: 0 . [+ trn]

%spa: gestures to mother

256

Page 281: JChatman

27.12. MLT | 平均ターン長

この発話をターンとしてカウントするためには、次のスイッチを使用します。

+s+"[+ trn]"

\s" の後の + は、通常は除外される要素を含むことを示しています。

27.12.2 実行例

次に挙げるのが、普通の MLTプログラムの使い方です。

mlt sample.cha

27.12.3 MLTのオプション

MLT に独特のオプションには以下のものがあります。

(a) +cS: ユニットマーカー S を検索します。文の代わりに、フレーズや話法ユニットとカウントし

たいときは、[c] のようなマーカーを加えて、データファイルをさらにユニットに分割します。

mlt sample.cha

mlt +c[c] sample.cha

(b) +d: このオプションを使い、 STATFREQ 用の ID の指定すると、一行にひとつ統計的数値を出力

することができます。付属のサンプルファイルへの適用例は次の通りです。

mlt +d +t@ID=1.25.8.2 sample.cha

このコマンドの出力は次のようになります。

1.25.8.2 6 6 8 1.333 1.000 1.333

これらの数値は、次のような内容を示しています。

� スピーカーの ID

�ターンの数

�単語の数

�単語とターンの比率

�発話とターンの比率

�単語と発話の比率

このタイプの分析を行うためには、各スピーカーに対応する @ID ヘッダーがなければなりません。ある

いは、+t*CHI のような形式でも指定できます。しかし、いろいろなファイルのいろいろな名前のこど

もについて分析する場合には@ID ヘッダーが必要になります。

+d1: 基本的には +d スイッチと同じ機能があり、各スピーカーごとの統計情報を表示します。

しかし、+d スイッチほど統計プログラムに対応した出力フォーマットをもちません。また、+d1 スイッ

チは +u スイッチと併用できますが、+d スイッチは併用できません。出力例は次のようになります。

*NIC: 6 6 8 1.333 1.000 1.333

*MOT: 8 7 43 6.143 1.143 5.375

(c) +g: 特定の単語だけで構成される発話を分析から除外します。たとえば、\hi" や \bye" だけか

ら成る発話を除外したい場合には、これらの単語をリストにしたファイルを作成します。そして、+gオ

プションの直後にファイル名を指定します。つまり、+gとファイル名との間にスペースが入ってはいけ

ません。ファイル名を省略した場合には \No �le name for the +g option speci�ed." というエラーメッ

セージが表示されます。

(d) +s/-s 特定の単語に分析を限定することができます。このオプションの次には直接文字列を指定

することができます。複数の単語を検索する場合には、ファイルに書き込み、+s@ファイル名、を指定

257

Page 282: JChatman

第 27章 CLANのいろいろなプログラム

します。-s スイッチは特定の単語を分析から除外します。逆に、+s スイッチは特定の単語だけを分析

に含めますが、このような使い方をする場合はほとんどないでしょう。

一般的なオプションについては 26章を参照してください。

27.13 MODREP | ティア間の単語一致検索

MODREP は、あるティアにある単語を別のティアにある別の単語にマッチさせることができます。この操

作は、ティア Aにある単語がティア Bにもただひとつだけあるときに実行することができます。このよう

な一対一の対応関係があるときに、MODREPはすべてのマッチした語の頻度を出力します。CLANととも

に配布している次のようなサンプルファイル \modrep.cha" をみてみましょう。

@Begin

@Participants: CHI Child Child

*CHI: I want more.

%pho: aI wan mo

%mod: aI want mor

*CHI: want more bananas.

%pho: wa mo nAnA

%mod: want mor bAn&nAz

*CHI: want more bananas.

%pho: wa mo nAnA

%mod: want mor bAn&nAz

*MOT: you excluded [//] excluded [/] xxx yyy www

&d do?

%pho: yu du

%mod: yu du

@End

このファイルに対して次のようなコマンドを実行することによって、モデル{レプリカ分析 (model-and-

replica analysys) を作成することができます。

modrep +b*chi +c%pho +k modrep.cha

出力は、次のようになります。

From file &lt;modrep.cha&gt;

1 aI

1 aI

2 bAn&nAz

2 nAnA

3 mor

3 mo

3 want

1 wan

2 wa

この出力を見ると、 \want"がふたつのやり方で模倣され、 \more" はひとつのやり方で二回模倣されて

います。この例では、子どもの発話だけが分析され、%mod 行は無視されています。ここで、%pho 行での

258

Page 283: JChatman

27.13. MODREP | ティア間の単語一致検索

分析は大文字と小文字を区別するので、+k スイッチを使用して区別が有効になるように注意してくださ

い。デフォールトでは、すべての CLAN コマンドは大文字と小文字の区別を行いません。しかし、%pho

行における UNIBET の記述は、異なる音素を指示するために大文字と小文字を区別するからです。

27.13.1 分析への取り込みと除外

デフォルトでは、MODREP はモデルティア (%mod) とメインライン上の特定の文字列を無視します。こ

れらの文字列には、xxx, yyy, www, アンパサンド (&)が先頭につく文字列、繰り返し記号 ([/], [//])な

どがあります。これらが除外される例として、次のコマンドを実行してみましょう。

modrep +b* +c%pho +k modrep.cha

出力は、次のようになります。

From file &lt;modrep.cha&gt;

1 I

1 aI

2 bananas

2 nAnA

1 do

1 du

3 more

3 mo

3 want

1 wan

2 wa

1 you

1 yu

もしこれらのデフォールトで除外される文字列を分析に含めたいときには、+q オプションを使用します。

modrep +b* +c%pho +k modrep.cha +qwww

しかし、www を加えると、モデル行とレプリカ行の一対一関係が壊れてしまうことがあります。このよ

うな場合には、CLANはエラーメッセージを出して、そのまま途中で終了してしましまいます。どのよう

になるか実際に確かめてください。また +q スイッチを用いてもっと別の文字列を除外することができま

す。たとえば、zで始まる単語をすべて除外したい場合には、次のコマンドを使用します。

modrep +b* +c%pho +k modrep.cha -qz*

しかし、ここでのファイル内には z 出始まる単語はないので、モデルとレプリカの間の一致関係は変わり

ません。

27.13.2 %mod 行の使い方

より正確に MODREP を使用するためには、母親とこども用に %mod 行を作成して%pho 行とマッチさせ

ることです。modrep.cha ファイルでは、既に%mod 行が含まれています。%mod を作ると、次のようなコ

マンドを使用することが可能になります。

modrep +b%mod +c%pho +k modrep.cha

259

Page 284: JChatman

第 27章 CLANのいろいろなプログラム

このコマンドは、sample.cha ファイル内の母親とこども両方の %mod と %pho 行を比較することができ

ます。

modrep +b%mod +c%pho +k +sm* modrep.cha

また、+o オプションを使用すると、それぞれの検索語の発音を追跡することも可能です。次のコマンド

では、/m/で始まる単語を追跡しています。

modrep +b%mod +c%pho +k +sm* modrep.cha

また、+s スイッチは +o スイッチと組み合わせて次のように使用することができます。

modrep +b%mod +c%pho +k +sm* +omo* modrep.cha

27.13.3 MODREP と COMBO | ティア間での COMBO 応用

MODREPは、%morティアのコードをメインラインの単語とマッチさせて使うことがことができます。た

とえば、もし%mor 行で対格接尾語がついた単語に対応するメインラインのすべての単語を sample2.cha

から探し出したいときは、次のようなコマンドを使用することができます。

modrep +b%mor +c*mot +o&quot;*ACC&quot; sample2.cha

出力は、次のようになります。

From file &lt;sample2.cha&gt;

1 n:a|ball-acc

1 labda't

1 n:a|duck-acc

1 kacsa't

1 n:i|plane-acc

1 repu&quot;lo&quot;ge'pet

もし、さらに厳密に %mor 行のコードを選択したいときには、MODREP を COMBO と組み合わせて使用しま

す。たとえば、動詞の後に出てくる対格をもった動詞のすべてを探したいときには、これらの発話をまず

COMBO を +d スイッチと+s スイッチを用いて取り出します。その後出力をパイプを通して MODREP に渡

します。このように、ふたつのプログラムを一緒に使うことをクロスティア COMBO といいます。

combo +s"v:*^*^n:*-acc" +t%mor sample2.cha +d | modrep +b%mor +c*mot +o"*acc"

この出力は、前の例と同じになります。しかし、入力ファイルが大規模になったときには、COMBOによる

フィルター効果によって検索が、より制限のきついものになり、強力になります。

27.13.4 MODREPのオプション

MODREPには、次のような固有のオプションがあります。

(a) +b: モデルティア名を指定します。デフォールトの設定はありません。メインラインにモデル

ティアを設定することも可能で、+b* か +b*chi のように指定します。

(b) +c: レプリカティア名を変更します。デフォールト名の設定はありません。

(c) +o: MODREP の出力に含まれる文字列を特定のものに限定します。たとえば、出力を -ing 形ある

いは、対格接尾語といったもので終わるものだけに限定します。もし複数の文字列や単語を指定したい

場合には、ファイルにリストし、スイッチの直後に @ファイル名の形で指定します。

260

Page 285: JChatman

27.14. MOR | 形態素解析

(d) +q/-q: xxx や & で始まる記号などデフォールトでは分析から除外される記号を分析に含めま

す。-q スイッチは、特定の記号を分析から除外します。もし複数の記号や単語を取り込んだり除外した

いときには、ファイルにリストし、 @フィル名としてスイッチの直後に指定します。

一般的なオプションについては 26章を参照してください。

27.14 MOR | 形態素解析

MOR は、CHAT ファイルのすべてのメインティアに%mor ティアを生成するために使用します。MOR をう

まく使用するためには、このプログラム、辞書の作成方法、形態素解析の効率をあげるツールを十分に理

解する必要があります。MOR は初心者ユーザーや、ちょっとしたユーザーのためのプログラムではありま

せん。むしろ、分析力を著しく高めるために、プログラムと辞書に多くの努力を払うのをいとわない真摯

なユーザーのためのプログラムです。MOR の初心者ユーザーは間違った分析を行ってしまい、誤った結果

を得ることも起こりやすいといえます。CLANプログラム一般、特に MOR については、CHILDES セン

ターはユーザーが正しくプログラムを使用するのを助けるますが、ユーザがこれらのツールをよく学習し

ていないために起こるご分析に対してはいかなる責任も負いません。

MOR の設計は、Roland Hausser の MORPH システム (Hausser, 1990) をもとにしています。その特長と

しては、言語間での移植可能性、辞書と文法の拡張性、CLANとの互換性を最大にするように設計されて

います。基本的な解析エンジンは特定の言語に依存していません。言語に固有な情報は、独立したデータ

ファイルに収められます。言語の規則は、各ユーザーが修正できるデータファイルになっています。辞書

ファイルもアスキーファイルであり、辞書を特定のコーパスに最適化するいくつかの方法もあります。辞

書ファイルが巨大なるのを防ぐため、辞書には語幹だけを登録し、それぞれの語幹に適切な活用形を起動

時にメモリ上に作成します。

MOR は、英語版マニュアル 14 章にあるような%mor ティアを自動的に生成します。単語は、その統語範

疇あるいは \scat" でラベルづけをされており、そのあとに \j" 記号で区切られ、形態素構成素に分割さ

れた単語そのものが続きます。

*CHI: the people are making cakes .

%mor: det|the n|people v:aux|be&PRES v|make-ING

n|cake-PL .

MOR は、文脈を参照せずにメインティアの各単語を調べ、可能なすべての文法範疇を付与し形態素解析を

行います。次の例では、^ 記号はメインティアの単語が複数の解析候補をもつことを示しています。

*CHI: I want to go back.

%mor: pro|I v|want inf|to^prep|to

v|go adv|back^n|back^v|back .

それぞれのあいまいな解析結果を選択するために、CLANエディターの候補選択モードを使って編集する

ことができます。

MOR をうまく動かすためには、ライブラリディレクトリか作業ディレクトリになけらばならないいくつか

のファイルがあります。ファイルのデフォールト名は、engar.cut, engcr.cut, englex.cut, engclo.cutです。

ファイル名を変更したい場合には、+g, +l スイッチを使用します。これらのファイルの内容は以下のよう

なものです。

(a) 異形態規則ファイル: このファイルは、形態素の形の変え方がリストされています。これらのバリエー

ションを記述する規則を \arule" といいます。このファイルの名前は \*ar.cut" のようなもので、英語

の異形態規則を収めたファイルは engar.cut です。

(b) 結合規則ファイル: このファイルには、形態素が結びつく規則がリストしてあります。可能な結合を

261

Page 286: JChatman

第 27章 CLANのいろいろなプログラム

記述した規則を crule といいます。このファイルの名前は \*cr.cut" のようなものです。英語の結合規

則を収めたファイルのデフォールト名は、\engcr.cut" です。

(c)クローズドクラスファイル: ある言語の接頭語や接尾語、接辞などは、数が少ない閉じたクラスの語

彙で、事実上すべての分析に使用されますが、これらを \*clo.cut" という名前のファイルに収めます。

英語のクローズドクラスの語彙を収めたファイルのデフォルト名は、\engclo.cut" です。

(d)ディスク辞書ファイル: このファイルには、当該の言語の単語をリストします。このファイルの名前は

\*lex.cut"です。英語辞書のデフォールト名は、\englex.cut"です。このファイルのことを、ディスク辞

書といいます。配布されている基本的な \englex.cut" ファイルには 24,000 語が登録されています。こ

の辞書を使うには CLANに割り当てられるメモリのサイズを最低でも 7MB にしなければなりません。

(e)候補選択規則ファイル: MOR は、各単語を単体で分析します。もし +b スイッチが使用されると、プ

ログラムは単語の左右一語の単語を分析して、可能な解析候補から正しい候補を絞ろうとします。これ

らの規則を \drule" といい、\*dr.cut" という名前のファイルにリストされます。英語の候補選択規則

ファイルのデフォールト名は、\engdr.cut" です。

MORは、engar.cut, englex.cut, engclo.cut ファイルを使い、englex.cut よりも完全なランタイム辞書を作

成します。MORは、ランタイム辞書と結合規則を使いながら入力となる単語を解析していきます。

解析プログラムは最初に engar.cut ファイルを読み込みます。次に、プログラムは englex.cut ファイルを

読み込み、engar.cutの規則を使ってランタイム辞書を作成します。englex.cutが大きすぎると、MS-DOS

では動かないことがあります。しかし辞書を小さくして、少ないメモリで動かすと、MOR の力は半減して

しまいます。いったんランタイム辞書ができ上がると、次に engcr.cut ファイルを読み込み、もし +b オ

プションが指定されていれば、engdr.cutファイルも読み込みます。以上で、結合規則が使用可能になり、

単語の分析が可能になります。普通のユーザーは、ランタイム辞書の中身について心配する必要はありま

せん。むしろ、辞書ファイルの中身が、関心の対象になるはずです。*ar.cut ファイル、*cr.cut ファイル

の中身のことを考えるのは、英語版マニュアル 14 章の分析とは異なる方法を実行するか、新しい言語の

文法規則を開発するときだけです.

27.14.1 MORオプション

MOR固有のオプションには以下のものがあります。

(a) +b: 候補選択規則として *dr.cut ファイルを用います。

(b) +c: \'d"や \n't" \I'll"のようなクリティクスを独立の単語として扱います。DSS分析のための

%morティアを作るときにはこのオプションを指定しなければなりません。

(c) +eN: デバッグの診断レベルを N にセットします。このオプションの情報は、新しい言語のために

arule や crule を構築している開発者に有用です。診断レベルは以下の 8レベルがあります。

1 |すべての規則の適用を表示します。

2 |aruleの規則の適用を表示します。

3 |cruleの規則の適用を表示します。

4 |druleの規則の適用を表示します。

5 |メモリの使用量を表示します。

6 |drule規則を表示します。

7 |crule規則を表示します。

8 |arule規則を表示します。

(d) +f/-f: コマンドの実行結果の出力先を指定します。デフォルト設定は +f で、\.mor"拡張子をもつ

ファイルに書き出されます。したがって、画面に出力したい場合には -f スイッチを使用しなければなり

ません。

(e) +g: さまざまな言語の文法ファイルを指定します。デフォールトの値は、英語用の \eng"で、engar.cut,

262

Page 287: JChatman

27.15. PHONFREQ | 音韻頻度分析

engcr.cut, engdr.cutが呼び出されます。(注意: +b オプションが指定された時にだけ \*dr.cut"ファイ

ルが使われます) 特定の言語にセットするためには、ファイル名から拡張子を取った部分を、オプショ

ンの後に指定します。たとえば、日本語用の +gjpn は、jpnar.cut, jpncr.cut, jpndr.cut ファイルを呼

び出します。これらのファイルは、ライブラリディレクトリか、作業ディレクトリに置いていなければ

なりません。

(f) +k: MORは、大文字で始まる単語をデフォルトでは固有名詞 (n:prop) と判断しますが、+kオプショ

ンを指定すると、これを抑制できます。

(g) +l: MORが使う辞書ファイルを指定します。デフォールトは、英語用の engで、englex.cut, engclo.cut

が呼び出されます。+ljpnと指定すると、日本語用の jpnlex.cut, jpnclo.cutが呼び出されます。これら

のファイルはライブラリディレクトリになければなりません。

(h) +m: デフォルトでは CLANは出力ファイルを作業ディレクトリに書き出します。+mを指定すれば、

出力ファイルを入力ファイルがあるディレクトリに書き出します。

(i) +xi: MOR を対話型テストモードで使用します。テストプロンプトから単語を入力すると、解析テス

トを行って、すべての結果を表示します。:q (コロンに続けて q)で終了、:h (コロンに続けて h)でヘル

プが表示されます。

(j) +xl: 辞書作成モードです。複数のファイルに対して形態素解析を行い、解析できない項目を発見し

て .ulx 拡張子がついたファイルにリストとして書き出します。辞書ファイルを整備するのに便利です。

27.14.2 MOR辞書

これ以降の内容については、JMOR と一緒に配布される説明書をお読みください。

27.15 PHONFREQ | 音韻頻度分析

PHONFREQ は、%pho 行の音素をすべて表にまとめて出力します。たとえば、PHONFREQ の説明のところで

用いたファイルに PHONFREQ をオプションなしで使用すると、出力は次のようになります。

2 A initial = 0, final = 1, other = 1

1 I initial = 0, final = 1, other = 0

3 a initial = 1, final = 1, other = 1

2 m initial = 2, final = 0, other = 0

3 n initial = 1, final = 1, other = 1

2 o initial = 0, final = 2, other = 0

2 w initial = 2, final = 0, other = 0

この出力から、/A/という音素が 2回出現していて、ひとつは語末に、もうひとつはその他の中間位置に

生起していることが分かります。

アルファベットファイル: もし alphabetというファイルを作り、作業ディレクトリにおくと、特定の2文

字表記がひとつの音素として扱われるようになります。この機能は、二重母音や UNIBET の二文字表記

を検索するときに重要になります。アルファベットファイルでは、アスタリスクをあらゆる一文字にマッ

チするメタキャラクタとして使用することができます。たとえば、*: という文字列はコロンが後に続くあ

らゆる音素にマッチします。もし、a:, e:, o: がそれぞれ 3回ずつあるとすると、出力はこれらの 3つづつ

の生起例をばらばらに表示し、コロンが後に続く要素として 9つをひとまとまりにしません。UNIBETと

PHONASCIIでは、いずれもアスタリスクを使用していませんから、アスタリスクを検索文字として指定

することはありません。アルファベットファイルのサンプルは、配布ディスクに含まれています。PHONFREQ

は、アルファベットファイルがないとエラーメッセージを出しますが、アルファベットファイルを特別に

263

Page 288: JChatman

第 27章 CLANのいろいろなプログラム

使用しないときは、気にせずそのまま作業を続行してください。

もし音韻分析に完全な置き換え対応表を作りたい場合には、%mod 行をデータファイル内に用意し、そこに

模範的な音韻を記述します。そして、PHONFREQを 2回適用します。一回目は %pho 行に、二回目は %mod

行です。%mod 行を分析する場合には、+t%mod スイッチを使用する必要があります。

アルファベットファイルは、作業ディレクトリかライブラリディレクトリに置きます。登録したい音素表

記は、それだけを一行にひとつづつ書きます。アルファベットファイル内では、3文字による音素表記も

登録ことができますが、この場合には 2文字の前に 3文字表記を登録します。3文字音素は、2文字音素

に優先して分析されます。

PHONFREQには、次のような固有のオプションがあります。

(a) +b: PHONFREQ は、デフォールトでは %pho ティアを分析します。したがって、もし他のティアを分

析したいときには、+b スイッチを使用して指定しなければなりません。+b スイッチを指定したとして

も、次のような例ではさらに +t スイッチを使用しなければならないことがあるので注意してください。

phonfreq +b* +t*CHI modrep.cha

(b) +d: このスイッチを指定すると、マッチした音素に対応する実際の単語を出力します。それぞれの生

起例が出力されます。

(c) +t/-t: PHONFREQでは、分析対象となるティアは +b スイッチで指定します。また、+t スイッチは、

分析する特定のスピーカーを指定するのに用いるので、それぞれの使い分けに注意してください。たと

えば、CHIというスピーカーのメインラインを分析したい場合には、次のコマンドを使用してください。

phonfreq +b* +t*CHI modrep.cha

一般的なオプションについては 26章を参照してください。

27.16 RELY | コードの信頼性を測定

いろいろなコードを CED のコーダーモードを使って入力していると、ファイルを複数の人でコード化し

比較することによって、その信頼性を計算したいと思うことがよくあります。そのためには、各入力者に

ファイルを渡し %cod 行に入力させて、その後 RELY を使って一致する点と一致しない点をあぶり出しま

す。たとえば、sample.cha ファイルを samplea.cha としてコピーし、その中のコードをひとつ変更しま

す。この例では、15 行目の in を gone に変更します。そして 次のコマンドを実行してください。

rely sample.cha samplea.cha +t%spa

出力ファイル sample.rlyには、通常の sample.chaファイルの内容の他に、15 行目には次のような新しい

部分が加わっています。

%spa: $RDE:sel:non $RFI:xxx:gone:?"sample.cha" $RFI:xxx:in:?"sample.cha"

もし、2番目の入力者によって生み出されたメインライン、ヘッダーラインディペンデントティアの違い

を無視させたければ、+cオプションを使用します。すると、それらの違いは無視され、常に最初のファイ

ルから内容がコピーされます。次のようなコマンドでは、

rely +c sample.cha samplea.cha +t%spa

%spaティアを除いてすべての情報は、マスターファイルである sample.chaファイルからもってこられる

ことになります。

RELYには、次のような固有のオプションがあります。

(a) +c: 選択されたティア以外の情報のチェックをしない。

一般的なオプションについては 26章を参照してください。

264

Page 289: JChatman

27.17. SALTIN | SALT 形式のファイルを変換

27.17 SALTIN | SALT 形式のファイルを変換

SALTIN は、SALT 形式のファイルを CHAT 形式に変更します。SALT は、米国ウィスコンシン大学の

Jon Miller と Robin Chapman によって開発されたデータファイル形式です。SALTINはデフォールトで

はファイルに出力しません。普通は次のように使用します。

saltin file.txt

SALTIN の行う変換について、いくつか特徴を述べておきます。

(a) 丸かっこが見つかると、未確認の繰り返しのタイプとして [/?] 記号を使用します。

(b) 複数行にわたるコメントは、ひとつのコメントティアにある複数行に変更します。

(c) 分秒の時間表記は、時分秒へと変換されます。

(d) %def ティアが、コードの定義のために作られます。

SALTINには、次のような固有のオプションがあります。

(a) +h: SALTでは、コメントを入力するためにかぎかっこを使う人がいます。< と > の間にテキスト

を含む場合には、このオプションを使用することで [% と ] の間にコメントが入る用に変更させること

ができます。そうしない場合には、かっこ内の要素は、テキストの傘なりとしてコード化されます。

(b) +l: コードを独立した %cod ティアに移動します。このオプションを選択しないと、コードはメイン

ライン内で [$text] の形式で変換されます。

一般的なオプションについては 26章を参照してください。

27.18 STATFREQ | 統計分析を出力

STATFREQプログラムは、単語やコードの頻度を複数のファイルにわたって計算しサマリーを出力します。

しかし、ファイル内では一度にひとりのスピーカーしか分析することができません。このサマリーは、SAS

や BMDP のような統計分析入力として渡すことができます。sample.chaを分析した出力は次のようにな

ります。

a cat chalk+chalk fine here just minute mommy neat no not

that the uhhuh what's white yeah

1.25.8.2 0 0 1 0 0 0 0 1 1 0 0 1 0 0 1 0 2

1.26.8.2 1 1 0 1 1 1 1 0 0 1 1 0 1 1 0 1 0

このような出力を得るためには、次のような3段階のステップを踏まなければなりません。

(a)まず、分析するファイルに対して適切な @ID ヘッダーを用意します。すべての CHAT ファイルにス

ピーカーひとりにつきそれぞれ @ID ヘッダーを一行だけ入れます。ひとつのスピーカーに使える IDは

ひとつだけです。次のような形になります。

@ID: 1.25.8.2=NIC

コロンの後にはタブを置き、等号の前後にはスペースを置かないようにしてください。等号の前にはス

ピーカー ID を、後ろには @Participants 行で指定した 3文字のスピーカー ID を置きます。

(b) 次に、FREQで各ファイルを分析します。+tとメタキャラクタを使うか、+t* の後にスピーカーコード

を指定してください。また +d2 オプションを指定して、STATFREQ の入力形式にします。これにより、

stat.outという一時的なファイルができます。STATFREQの入力となる出力を行う freqコマンドの例は

次のものがあります。

freq +d2 +t@ID=1.*.8.2 sample*.cha

+t スイッチはここでは、ID 番号に一致するスピーカーだけを選ぶ出す特別な意味を持っています。こ

の例では、アスタリスクを使うことによってふたつのサンプルファイルに含まれる 1.25.8.2 と 1.26.8.2

265

Page 290: JChatman

第 27章 CLANのいろいろなプログラム

というふたつのスピーカーを探します。もし、1.*.8.2 のような形の @ID 行をひとつのファイルのふた

つのスピーカーに与えると、STATFREQ はふたつのスピーカーのデータをひとつの出力にまとめてデー

タを壊すことになります。したがって、ID 番号が重複しないように、首尾一貫した番号づけを行うよう

にします。

ID 番号はヘッダーが年齢、性別、などの役に立つ情報を含めように構成することができます (第 3章を

参照)。このようにして、+t スイッチとメタキャラクタを活用することによって、特定の年齢や性別の

こどものスピーカーすべての頻度の表を生成することができます。たとえば、それぞれのこどもに

@ID: 1.25.2

のような形の ID ヘッダーを与えたとしましょう。ここでの 1 は分析の対象となるこどもを意味し、次

の 25はファイル番号、最後は年齢を表しています ( 1 = 14 カ月、 2 = 20 カ月)。ここで、+t@id=1.*.*

と指定することによって、すべてのこどもの頻度表を生成できます。同様にして、+t@id=1.*.20 と指

定すると、20カ月のこどもの頻度表がすべて生成されます。このようにすると、ひとつのスピーカーの

頻度データは、スピーカーの ID 番号が同じなのでひとつの STATFREQ 出力として取り扱うことができ

るようになります。

もし、@IDヘッダーをファイルに付け加えたくないときで、ファイル間であるスピーカに対して同じス

ピーカーコードしか使っていないときには、+t スイッチを使用することができます。 +t*CHI という

スイッチを指定すると、STATFREQは CHIと言う3文字コードをもったすべてのスピーカーをひとつに

するので、コーパス内のすべての *CHI 行が分析できます。しかし、いろいろなファイルにわたってこ

どもにいろいろな名前を付けている場合には、やはり @ID ヘッダを使用しなければなりません。

このような +t スイッチの特別な使い方は、その普通の使い方と組み合わせても使用することができま

す。たとえば、もし *CHI の%mor 行だけに STATFREQ 分析を行いたい場合には、次のコマンドを使用

します。

freq +d2 +t*MOT -t* +t%mor sample*.cha

(c)すると、FREQがメッセージを出し、次のように入力して STATFREQ を実行するように求めます。

statfreq stat.out

このとおり実行してください。ファイルに出力したいときは、+f スイッチを指定します。

statfreq +f stat.out

もし、@ID:ヘッダーが見つからない場合には、 \NO ID GIVEN" というエラーメッセージが表示され

ます。

STATFREQ の最終出力に対してさらに何か処理をしたいことがあるかもしれません。一番よい方法は、縦

欄と横欄をデータベース処理ソフトか、Mintabや SAS のような統計パッケージプログラムのデータ構造

に変換することです。

STATFREQには、次のような固有のオプションがあります。

(a) +d: 統計分析プログラムに直接出力できるように、ファイルヘッダを除去します。また、欠けている

データは統計分析に用いられるデータが欠けていることを表すピリオド記号で置き換えられます。

一般的なオプションについては 26章を参照してください。

27.19 TEXTIN | 構造化されていないテクストをCHATに変換する

TEXTINプログラムは極めて単純です。文の集まりを取り、CHATファイルに変換します。空行は段落の

区切りとしてみなされ、@Blankヘッダーとして表されます。TEXTINの例として、以下の文に対して走ら

せてみましょう。

The TEXTIN program is quite simple. It takes a set of sentences in paragraph form and

converts them to a CHAT �le. Blank lines are considered to be possible paragraph breaks

and are noted with @Blank headers.

266

Page 291: JChatman

27.20. TIMEDUR | ポーズと重複の計量

As an example of the operation of TEXTIN, one could look at the results of running the

program on the sentences in this subsection.

その結果は以下のようになります。

@Begin

@Participants: T Text

*T: the textin program is quite simple.

*T: it takes a set of sentences in paragpraph form and converted

them to a chat file .

*T: blank lines are considered to be possible paragraph breaks and

are noted with @blank headers.

@Blank

*T: as an example of the operation of TEXTIN, one could look at

the results of running the program on the sentences in this subsection.

TEXTINに固有のオプションはありません。一般的なオプションについては 26章を参照してください。

27.20 TIMEDUR | ポーズと重複の計量

TIMEDURは話し手間のポーズと重複の長さを計算します。これには sonic CHATで作られる %sndティア

が必要です。出力データはスプレッドシートのデータベースプログラムが使える形になります。一つのス

ピーカー IDがついたコラムには発話の長さが表示されます。例えば FAT-ROSのように二つのスピーカー

IDがついたコラムには一番目のスピーカーの発話の終りと二番目のスピーカーの発話の始まりの間のポー

ズの長さが表示されます。負の数は重複を表します。

TIMEDURに固有のオプションはありません。一般的なオプションについては 26章を参照してください。

27.21 WDLEN | 単語長のグラフ

WDLENは単語の長さを表にし、ヒストグラムを作成します。単語も発話も計算することができます。出力に

は単語の長さ (文字数)、発話の長さ (単語数)、その頻度数、ヒストグラムが含まれます。出力に現われる

Wdlen は word length (単語の長さ) を表しています。また出力に現われる Utt len は utterance length

(発話の長さ)を表しています。

基本的な使い方は次のようになります。

wdlen sample.cha

WDLENに固有のオプションには以下のものがあります。

(a) +h 頻度数が 70 を越えると、グラフのダッシュ一つは頻度一に対応しなくなります。そこで+h

オプションを指定すると、ヒストグラムの最大の長さを伸ばし、1対1の関係を保つようにできます。

一般的なオプションについては 26章を参照してください。

267

Page 292: JChatman
Page 293: JChatman

第28章 ユーティリティ|便利なツール

28.1 COLUMNS { CHAT ファイルのコラム表示化

CHATファイルを印刷したものを閲覧するときには、こどもの発話部分をその他のスピーカーの発話部分

とは視覚的に区別してあると便利な場合が多くあります。伝統的な手法としては、こどもの発話を左側のコ

ラムに書いて、その他のスピーカーをまん中のコラムに書き、コメントを右側のコラムに書くというもの

です。COLUMNSを使うと、CHATファイルをこのように変更することができます。たとえば、sample.cha

ファイルの最初の 5つの発話をコラムに分けるためには、次のようなコマンドを実行します。

columns +h +nNIC +z5u sample.cha

すると次のような出力が得られます。

hey Nicky wanna [: want to] see what

other neat toy-s there are?

%spa: $INI:sel:in $RFI:tes:ve

yeah. [+ Q]

%spa: $RES:sel:ve $DES:tes:ve

you wanna [: want to] see a [*] more toy-s?

%err: a = some $LEX

%spa: $RDE:sel:non $RFI:xxx:in

yeah. [+ Q]

%spa: $RES:sel:in $DES:tes:non

%add: mot

oh # I see.

%spa: $INI:xxx:non $CR:sel:in

この出力では、こどもの発話が左側のコラムに、母親の発話が右側のコラムに書かれています。ディペン

デントティアはメインラインの下に書かれています。もしディペンデントティアを独立したコラムにした

い場合には、+d スイッチを使用し、次のようなコマンドを実行します。

columns +h +d +nNIC +z5u sample.cha

すると、次のような出力が得られます。

269

Page 294: JChatman

第 28章 ユーティリティ|便利なツール

hey Nicky wanna [: want to] see what other neat toy-s there are?

%spa: $INI:sel:in $RFI:tes:ve

yeah. [+ Q]

%spa: $RES:sel:ve $DES:tes:ve

you wanna [: want to] see a [*] more toy-s?

%err: a = some $LEX

%spa: $RDE:sel:non $RFI:xxx:in

yeah. [+ Q]

%spa: $RES:sel:in $DES:tes:non

%add: mot

oh # I see.

%spa: $INI:xxx:non $CR:sel:in

もし、+h スイッチを省略すれば、スピーカー ID も一緒に出力されます。また、-t スイッチを使用すれ

ば、コメントのコラムの表示を抑制することができます。省略されたコメントのコラム分のスペースを活

用するために、+b40, +c76のオプションを用いて 2番目のスピーカーのコラムを 2番目の 36のコラムに

変更します。

columns +nMOT -t% +z5u +b40 +c76 sample.cha

出力は、次のようになります。

*MOT: hey Nicky wanna [: want to] see

what other neat toy-s there are?

*NIC: yeah. [+ Q]

*MOT: you wanna [: want to] see a [*] more toy-s?

*NIC: yeah. [+ Q]

最後に、CHATコードとヘッダーをできるだけ見たくない人には、FLO の出力をパイプで受け取ることも

できます。

flo +d sample.cha | columns +nNIC +z5u +h +b40 +c76

すると、次のような非常に簡単な出力が得られます。

hey Nicky wanna see what other

neat toys there are ?

yeah .

you wanna see a more toys ?

yeah .

oh I see .

COLUMNSには、次のような固有のオプションがあります。

8. +b 二番目のスピーカーの発話を記述するコラムの開始位置を指定します。たとえば、40文字目

から始めるときは、+b40 となります。

9. +c: ディペンデントティアが始めるコラムの開始位置を指定します。たとえば、60 文字目から始

めるときには、+c60 となります。

10.+d: ディペンデントティアを独立して表示します。

11.+h: ティア名を出力しません。

270

Page 295: JChatman

28.2. DATES | 年齢と日付の計算

12. +n: どのスピーカを第一コラムにするか指定します。このオプションは、常に使用する必要があ

ります。たとえば、+nNICは、sample.cha ファイルでは、第一スピーカーに Nicolette を選択します。

28.2 DATES | 年齢と日付の計算

DATES は、ふたつの年月日から経過年月日を計算します。つまり、こどもの生年月日、こどもの年齢、現在

の日付のうちのふたつが分かっていれば、残りのひとつの値を割り出すことができます。具体的には、こども

の年齢と現在の日付からこどもの生年月日を算出します。また、生年月日と現在の日付からこどもの年齢を算

出します。あるいは、こどもの年齢と生年月日から現在の日付を割り出します。たとえば、次のようなコマン

ドを実行してみましょう。

dates +a 2;3.1 +b 12-jan-1962

すると、次のような出力を得ることができます。

@Age of Child: 2;3.1

@Birth of Child: 12-JAN-1962

@Date: 13-APR-1964

DATES には、次のようなオプションがあります。

1. +a: こどもの年齢の指定

2. +b: こどもの生年月日の指定

3. +d: 現在、あるいはファイルが作成された時点の日付の指定

28.3 FLO | メインラインを簡素にする

FLO は、%floラインとよばれるメインラインの簡単な複製、つまり、CHAT コードを取り去って、より読

みやすいメインラインを作ります。取り除かれない記号は、# と +... だけです。

28.4 LINES | 行番号を挿入

印刷された発話データファイルを見ていると、発話データの一部分を行番号で参照したいことがよくありま

す。LINESプログラムは、データファイルに行番号を付け加えたり取り除いたりしたりすることができます。

行番号が先頭に挿入されたファイルは CHAT 形式ではないので、CLAN を使って分析する前には必ず行番号

を取り除いてください。

LINES に固有なオプションは以下のものだけです。

1. +n: 一度 LINESプログラムで挿入した行番号を、すべて取り除きます。

28.5 MAKEDATA |他のプラットフォームのためのファイルの作成

これは Macintosh, DOS, UNIX という異なるプラットフォームでファイルをやりとりするためのものです。

一度にディレクトリ全体を変換することを可能にする+reスイッチとともに用いられることを想定しています。

変換の結果は変換されるディレクトリと同じレベルの新たなディレクトリに作られますので、元のファイルに

は変化ありません。

MAKEDATA の動きはコマンドラインで与えられる拡張子によって一部変わってきます。たとえば、

271

Page 296: JChatman

第 28章 ユーティリティ|便利なツール

makedata +re +w *.cha

というコマンドでは、\.cha"という拡張子をもつすべての CHATファイルがWindows 形式のファイルに変換

されます。しかしながら、 MAKEDATAはまた改行コードも検査します1。コマンドラインの拡張子とファイルの

改行コードなどから判断して、MAKEDATAは以下の三種類のうちのどれかを行います。

1.ファイルの拡張子が \.cha"というテクストファイルであれば、MAKEDATAはそのファイルを Windows形

式にして、ある主のフォントを拡張 ASCII文字に変換します。

2.ファイルの拡張子が \.cha"以外のテクストファイルであれば、MAKEDATAは改行コードだけを Windows

形式に変換します。

3.テクストファイルでなければ、 MAKEDATAは単にそれをコピーする。

MAKEDATAによって作られるフォルダーはしばしば、それぞれの方法のいずれかによって、三とおりすべての

形式のファイルからなる場合があります。MAKEDATAがちゃんと正しく変換しているかを確かめるために、変

換されたファイルに対して CHECKを再帰的に適用した方がよいでしょう。

MAKEDATAに固有のオプションには以下のものがあります。

1. +a: Macintosh のためのデータだけを作る。

2. +d: DOS のためのデータだけを作る。

3. +u: UNIX のためのデータだけを作る。

4. +w: Windows のためのデータだけを作る。

一般的なオプションについては 26章を参照してください。

1改行コードはプラットフォームごとに異なっています。Macintoshでは 16進で書けば 0x0dの一バイト、Windowsでは 0x0d 0x0aの二バイト、UNIXでは 0x0a の一バイトです。

272

Page 297: JChatman

第29章 WAKACHI98

| 分かち書きガイドライン

宮田 Susanne・中 則夫

29.1 まえがき

この分かち書きガイドラインは日本語のための単語の分け方の提案である。例はすべてヘボン式で書かれて

いるが、訓令式にも、カナ漢字まじりにも適応できるように作られている。

WAKACHI98は文法編とレファレンス編という二つの部分から構成されている。文法編 (本章)は品詞とそ

の活用表、そして一覧表を含む。総合索引 (付録C)は書き起こしする際によく迷うような単語を、五十音順に

並べたものである。

CHILDES では「単語」が基本的な単位として扱われている。日本語のデータファイルを作るときに、普段

わかち書きされていない形で表記されている日本語をどのように単語に分けるかという問題が生じる。この問

題を解決するのは、JCHAT の初期からの目的でもあったが、総合的なガイドラインを作る必要性を感じ始め

たのは、JMOR(自動形態素解析プログラム、中 (1998))の開発に入った時だった。

自動形態素解析の精度はそれが有する辞書の大きさにかなり左右される。基本的には辞書に登録されていな

い単語は解析されない (具体的には、未知語として扱われる)。同様に、ある単語に読みのバリエーションがあっ

たとしても、一つの可能性しか辞書に登録されていなければ、他の可能性は未知語として扱われてしまう (例:

「やはり」と「やっぱり」)。したがって、精度の高い自動形態素解析の辞書には、単語のバリエーションをでき

る限り含むことが大切である。この問題は、特に分かち書きのルールが固定していない時に深刻である。可能

な表記をすべて登録することは不可能とはいえないまでも極めて困難であるし、辞書の大きさは膨大になり、

解析器の効率 (速度や正解率)も極減する。

このような問題が 1995年に JMOR開発に着手して以来徐々に明らかになった。このことが、JMOR開発と

分かち書きガイドラインの開発を平行に進めてきた理由である。現在のところは、JMORはWAKACHI98に

したがって作られたファイルで一番有効に動く。言いかえれば、WAKACHI98とは異なる分かち書きをする

と、JMORでは登録されていない語として扱われる可能性が高くなるのである。

なお、分かち書きのルールのガイドラインは、現代日本語の文法に沿った、体系的なものになることを重視

して作られている。WAKACHI98は基本的に益岡・田窪 (1992, 1995 改訂版)に従っている。しかし、JCHAT

で扱われるデータは日常的な話し言葉、しかも言語学習者 (幼児、そして第二言語学習者)が多い。そのデー

タの特徴を考慮して修正も行わざるをえない部分が出て来たので、いくらか益岡・田窪と異なる部分がある。

さらに、現時点において JCHATフォーマットで書き起こされているデータのほとんどが東京以外の地方の子

どものデータであるから、それらの子ども (およびその母親)に用いられた方言もある程度は JMOR および

WAKACHIに含むことにしている。

273

Page 298: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

29.2 品詞一覧表 | Word Class List

品詞 活用表 一覧表

名詞

固有名詞

複合名詞

形式名詞

動作名詞

ナ形容詞 (形容動詞) ナ形容詞活用

イ形容詞 (形容詞) イ形容詞活用

連体詞

母音動詞 母音動詞活用

子音動詞 子音動詞活用

変異動詞 変異動詞活用

複合動詞

テ型複合動詞

判定詞 判定詞活用

助動詞

副詞

擬声擬態語 擬声擬態語一覧表

幼児語 幼児語一覧表

疑問詞

カ不定詞 (不定語)

モ不定詞 (不定語)

指示名詞 (こそあ)

指示形容詞 (こそあ)

数詞

格助詞

提題助詞

取立助詞

接続助詞

接続詞

終助詞

接頭辞

接尾辞 接尾辞一覧表 (準備中)

助数辞 助数辞一覧表 (準備中)

挨拶用語一覧表

肯否定語・間投詞・感動詞一覧表

274

Page 299: JChatman

29.2. 品詞一覧表 | Word Class List

29.2.1 名詞 | Nouns

関連: 接尾辞・接頭辞 (29.2.23節)

名詞 (n)

机 tsukue njtsukue tsukue ni oitearu .

りんご ringo njringo ringo o zembu tabechatta.

幼児語 (n:mot) (参照:幼児語 (29.2.11節)

くっく kukku n:motjkukku kukku haita.

固有名詞 (n:prop)

加藤 健 Katoo Ken n:propjKatoo n:propjKen Katoo Ken desu .

ポロリ Porori n:propjPorori Porori ga deta.

由香里 Yukari n:propjYukari Yukari ga totchatta.

複合名詞 (n)

貯金箱 chokinbako njchokinbako chokinbako ni ireru

バスセンター basusentaa njbasusentaa basusenta de matsu

文字名 (n:let)

エー ee n:letjee ee@lr kakeru ?

ビー bii n:letjbii bii@lr o kaite !

形式名詞 - Sentence Nominalizing Nouns

あいだ aida n:snjaida kaiteiru aida ni kizuita .

あと ato n:snjato kaita ato ni kizuita .

あまり amari n:snjamari okotta amari ni namida ga deta .

うち uchi n:snjuchi kaiteiru uchi ni wakattekita .

おかげ okage n:snjokage tasuketekureta okage de maniatta .

おり ori n:snjori kaeru ori ni soo iimashita .

かわり kawari n:snjkawari iimeeru utsu kawari ni denwa o kaketa .

くせ kuse n:snjkuse soo itteiru kuse ne jibun de yaranai .

こと koto n:snjkoto hansee suru koto wa nai .

せい see n:snjsee okureta see de maniawanakatta .

たび tabi n:snjtabi furusato ni kaeru tabi ni soo omou.

ため tame n:snjtame ryokoo dekiru tame ni chokin suru .

ついで tsuide n:snjtsuide kaeru tsuide ni kaimono suru .

つもり tsumori n:snjtsumori monku o iu tsumori wa nai kedo.

とおり toori n:snjtoori kaitearu toori ni jisshi shitekudasai !

とき toki n:snjtoki kaeru toki made gaman shite !

ところ tokoro n:snjtokoro kaeroo to shiteiru tokoro datta .

275

Page 300: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

の no n:snjno miru no ga tanoshii .

ookii no ga ii hoshii.

はず hazu n:snjhazu wakatta hazu wa nai .

ほう hoo n:snjhoo deta hoo ga omoshiroi .

ほか hoka n:snjhoka shigoto suru hoka ni nan no tanoshimi mo nai

.

まえ mae n:snjmae deru mae jumbi suru .

まま mama n:snjmama ikanai mama de owatteshimatta .

もの mono n:snjmono ningen to iu mono wa . . .

よう yoo n:snjyoo mae mo itta yoo ni kore wa muridesu .

わけ wake n:snjwake kookai suru wake mo nai .

一方 ippoo n:snjippoo ookii ippoo de kanri ga taihenda.

限り kagiri n:snjkagiri membaa dearu kagiru riyoo suru tsumori da .

最中 saichuu n:snjsaichuu kaigi shiteiru saichuu ni renraku ga haitta .

際 sai n:snjsai kaigi suru sai ni yakudatsu .

場合 baai n:snjbaai mondai ga okita baai ni tsukau .

反面 hammen n:snjhammen akarui hammen ni ochikomigachi dearu .

29.2.2 動作名詞|Verbal Nouns

関連: 変異動詞活用 (スル、29.2.6.6節)

漢語借用語 (n:vn)

挨拶 aisatsu n:vnjaisatsu chanto aisatsu shinasai!

確認 kakunin n:vnjkakunin kakunin shimashita.

喧嘩 kenka n:vnjkenka kare to kenka shita .

拒否 kyohi n:vnjkyohi sore o kyohi suru.

電話 denwa n:vnjdenwa denwa shiteokoo ka?

要求 yookyuu n:vnjyookyuu yookyuu shitekita .

借用語 (n:vn)

カット する katto suru n:vnjkatto katto shita shuppi

サービス する saabisu suru n:vnjsaabisu saabisu itashimasu

ドライブ する doraibu suru n:vnjdoraibu doraibu shiyoo ka?

擬声擬態語 (n:vn:onoma) (参照:擬声擬態語 29.2.10節)

ごろごろ する gorogoro suru n:vn:onomajgorogoro gorogoro shiteiru.

幼児語 (n:vn:mot) (参照:幼児語 (29.2.11節)

ねんね nenne n:vn:motjnenne hayaku nenne shinasai!

276

Page 301: JChatman

29.2. 品詞一覧表 | Word Class List

29.2.3 ナ形容詞 (形容動詞)| Nominal Adjectives

関連: ナ形容詞活用 (29.2.3節)、イ形容詞 (29.2.4節)

ナ形容詞 (adj:na)

和語

静か shizuka adj:najshizuka&PRES:0 kesa wa shizuka ne.

静かだ shizukada adj:najshizuka-PRES amari shizukajanakatta

.

静かな shizukana adj:najshizuka-REL shizukana kodomo

静かに shizukani adj:najshizuka-CONJ shizukani shinasai !

静かで shizukade adj:najshizuka-INF shizukade ii kankyoo

のよう N no yoo adj:najyoo&PRES:0 yume no yoo

のようだ N no yooda adj:najyoo-PRES owari no yooda .

のように N no yooni adj:najyoo-CONJ kodomo no yooni naita .

このような konoyoona demo:adj:najkonoyoo-REL konoyoona yarikata

こういうふうな kooiufuuna demo:adj:najkooiufuu-CONJ kooiufuuni tsunaida

こんなふうな konnafuuna demo:adj:najkonnafuu-REL konnafuuna katachi

借用語

スリム surimu adj:najsurimu-CONJ surimuni natta .

リーズナブル riizunaburu adj:najriizunaburu-REL riizunaburuna nedan

漢語借用語

危険 kiken adj:najkiken-REL kikenna basho

正確 seekaku adj:najseekaku-NEG-PRES seekakujanai yooda.

29.2.3.1 ナ形容詞活用 | Nominal Adjective In ection

関連: ナ形容詞 (29.2.3)、イ形容詞活用 (29.2.4.1)、判定詞活用 (29.2.8.3)

[ゼロ] NA adj:najshizuka&PRES:0 shizuka

だ NA-da adj:najshizuka-PRES shizukada

だった NA-datta adj:najshizuka-PAST shizukadatta

だったら NA-dattara adj:najshizuka-COND:tara shizukadattara

だったり NA-dattari adj:najshizuka-INF:tari shizukadattari

だろう NA-daroo adj:najshizuka-INT shizukadaroo

で NA-de adj:najshizuka-INF:te shizukade

です NA-desu adj:najshizuka-POL-PRES shizukadesu

でした NA-deshita adj:najshizuka-POL-PAST shizukadeshita

でしたら NA-deshitara adj:najshizuka-POL-COND:tara shizukadeshitara

でして NA-deshite adj:najshizuka-POL-INF:te shizukadeshite

でしょう NA-deshoo adj:najshizuka-POL-INT shizukadeshoo

じゃない NA-janai adj:najshizuka-NEG-PRES shizukajanai

じゃなくちゃ NA-janakucha adj:najshizuka-PRH&INF&wa shizukajanakucha

じゃなきゃ NA-janakya shizukajanakya

すぎる NA-sugiru v:v:derjshizuka-sugi-PRES shizukasugiru

277

Page 302: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

な NA-na adj:najshizuka-REL shizukana

なら NA-nara adj:najshizuka-COND:nara shizukanara

に NA-ni adj:najshizuka-CONJ shizukani

である NA-dearu adj:najshizuka&FML-PRES shizukadearu

でありたい NA-dearitai adj:najshizuka&FML-DES-PRES shizukadearitai

NA-dearitakatta adj:najshizuka&FML-DES-PAST shizukadearitakatta

NA-dearitakunai adj:najshizuka&FML-DES-NEG-

PRES

shizukadearitakunai

NA-dearitaku adj:najshizuka&FML-DES-INF shizukadearitaku

NA-dearitakute adj:najshizuka&FML-DES-INF:te shizukadearitakute

NA-

dearitakattari

adj:najshizuka&FML-DES-INF:tari shizukadearitakattari

NA-

dearitakereba

adj:najshizuka&FML-DES-COND shizukadearitakereba

NA-

dearitakattara

adj:najshizuka&FML-DES-

COND:tara

shizukadearitakattara

であった NA-deatta adj:najshizuka&FML-PAST shizukadeatta

であったら NA-deattara adj:najshizuka&FML-COND:tara shizukadeattara

であったり NA-deattari adj:najshizuka&FML-INF:tari shizukadeattari

であって NA-deatte adj:najshizuka&FML-INF:te shizukadeatte

であり NA-deari adj:najshizuka&FML-INF shizukadeari

でありなさい NA-dearinasai adj:najshizuka&FML-IMP:POL shizukadearinasai

であります NA-dearimasu adj:najshizuka&FML-POL-PRES shizukadearimasu

であれば NA-deareba adj:najshizuka&FML-COND shizukadeareba

であろう NA-dearoo adj:najshizuka&FML-INT shizukadearoo

でない NA-denai adj:najshizuka&FML-NEG-PRES shizukadenai

でなきゃ NA-denakya adj:najshizuka&FML-PRH&INF&wa shizukadenakya

ではない NA-dewanai adj:najshizuka&FML-NEG-PRES shizukadewanai

29.2.4 イ形容詞 | Adjectives

関連: イ形容詞活用 (29.2.4.1節)、ナ形容詞 (29.2.3節)、接尾辞・接頭辞 (29.2.23節)

イ形容詞 (adj)

長い nagai adjjnaga-PRES nagai himo

adjjnaga-CONJ nagaku natta supiichi

adjjnaga-PAST ashi ga nagakatta .

adjjnaga-NEG-PRES bunshoo ga nagakunai .

赤い akai adjjaka-CONJ kao ga akaku natta.

黄色い kiiroi adjjkiiro-CONJ kureyon de kiiroku nutta .

四角い shikakui adjjshikaku-PRES shikakui hako

278

Page 303: JChatman

29.2. 品詞一覧表 | Word Class List

マザリーズ (adj:mot)

あっちい (熱い) atchii adj:motjatchi-PRES atchii kara !

あちちい (熱い) achichii adj:motjachichii kore achichii .

ばっちい (汚い) batchii adj:motjbatchi-PRES batchikunai .

29.2.4.1 イ形容詞活用 | Adjective In ection

関連: イ形容詞 (29.2.4)、ナ形容詞活用 (29.2.3.1)、動詞 (29.2.6)

い A-i adjjnaga-PRES nagai

かった A-katta adjjnaga-PAST nagakatta

かったら A-kattara adjjnaga-COND:tara nagakattara

かったり A-kattari adjjnaga-INF:tari nagakattari

がる A-garu v:c:derjhoshi-gar-PRES hoshigaru

v:c:derjhoshi-gar-NEG-PRES hoshigaranai

く A-ku adjjnaga-CONJ nagaku nobita.

nagaku natta.

くない A-kunai adjjnaga-NEG-PRES nagakunai

くて A-kute adjjnaga-INF:te nagakute hosoi

ければ A-kereba adjjnaga-COND nagakereba

すぎる A-sugiru v:v:derjnaga-sugi-PRES nagasugiru

v:v:derjnaga-sugi-PAST nagasugita

そう A-soo adj:na:derjoishi-soo&PRES:0 oishisoo

adj:na:derjoishi-soo-PRES oishisooda

adj:na:derjoishi-soo-REL oishisoona

adj:na:derjoishi-soo-CONJ oishisooni

29.2.5 形容詞・連体詞 | Adnominals

関連: 指示形容詞 (こそあ)(29.2.15)節)

いろんな ironna adj:adnjiroiro-REL ironna okashi ga atta .

大きな ookina adj:adnjooki-REL ookina kuri no ki

おかしな okashina adj:adnjokashi-REL okashina hanashi da .

細かな komakana adj:adnjkomaka-REL tottemo komakana saiku

小さな chiisana adj:adnjchiisa-REL chiisana issunbooshi

29.2.6 動詞|Verbs

関連: 母音動詞活用 (29.2.6.2節)、変異動詞活用 (29.2.6.6節)、子音動詞活用 (29.2.6.4節)、複合動詞 (29.2.7

節)、判定詞・助動詞 (29.2.8.2節)

29.2.6.1 母音動詞 (v:v) | Vowel Verbs

食べる taberu v:vjtabe-PRES ringo o taberu .

279

Page 304: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

29.2.6.2 母音動詞活用 | Vowel Verb In ection

関連: 動詞 (29.2.6)、子音動詞活用 (29.2.6.4)、形容詞活用 (29.2.4.1,29.2.3.1)、テ型複合動詞 (29.2.7)、変異

動詞活用 (29.2.6.6)、接尾詞・接頭詞 (29.2.23)、複合動詞 (29.2.7)、判定詞活用 (29.2.8.3)

[ゼロ] V-0 v:vjtabe&INF tabe

tabe ni iku

がたい V-gatai adj:derjtabe-gata-PRES tabegatai

させる V-saseru v:vjtabe-CAUS-PRES tabesaseru

すぎる V-sugiru v:v:derjtabe-sugi-PRES tabesugiru

そう V-soo adj:na:derjtabe-soo&PRES:0 tabesoo

adj:na:derjtabe-soo-REL tabesoona

た V-ta v:vjtabe-PAST tabeta

たい V-tai v:vjtabe-DES-PRES tabetai

V-takatta v:vjtabe-DES-PAST tabetakatta

V-takunai v:vjtabe-DES-NEG-PRES tabetakunai

V-takute v:vjtabe-DES-INF:te tabetakute

V-takattari v:vjtabe-DES-INF:tari tabetakattari

V-takereba v:vjtabe-DES-COND tabetakereba

V-takattara v:vjtabe-DES-COND:tara tabetakattara

V-tagaru v:vjtabe-DES-gar-PRES tabetagaru

たら V-tara v:vjtabe-COND:tara tabetara

たり V-tari v:vjtabe-INF:tari tabetari

ちゃ V-cha v:vjtabe-INF:te&wa tabecha ikan

て V-te v:vjtabe-INF:te tabete

(テ型複合動詞参照) tabetehoshii

な V-na v:vjtabe-IMP:POL:conc taberuna

ない V-nai v:vjtabe-NEG-PRES tabenai

V-nakatta v:vjtabe-NEG-PAST tabenakatta

V-nakute v:vjtabe-NEG-INF:te tabenakute

ないで V-naide v:vjtabe-NEG-INF:te tabenaide

(テ型複合動詞参照) tabenaidekudasai

tabenaidehoshii

なきゃ V-nakya tabenakya

tabenakya ikenai

なくちゃ V-nakucha v:vjtabe-PRH&INF&wa tabenakucha

なさい V-nasai v:vjtabe-IMP:POL tabenasai

にくい V-nikui adj:derjtabe-niku-PRES tabenikui

ました V-mashita v:vjtabe-POL-PAST tabemashita

ましたら V-mashitara v:vjtabe-POL-COND:tara tabemashitara

まして V-mashite v:vjtabe-POL-INF:te tabemashite

ましょう V-mashoo v:vjtabe-POL-INT tabemashoo

ます V-masu v:vjtabe-POL-PRES tabemasu

やすい V-yasui adj:derjtabe-yasu-PRES tabeyasui

よう V-yoo v:vjtabe-INT tabeyoo

280

Page 305: JChatman

29.2. 品詞一覧表 | Word Class List

られる V-rareru v:vjtabe-POT-PRES taberareru

られる V-rareru v:vjtabe-PASS-PRES taberareru

る V-ru v:vjtabe-PRES taberu

れば V-reba v:vjtabe-COND tabereba

れる V-reru tabereru

ろ V-ro v:vjtabe-IMP tabero

ん V-n v:vjtabe-NEG:conc&PRES taben

taben de ii (方言)

taben de mo ii (方言)

29.2.6.3 子音動詞 (v:c) | Consonant Verbs

飲む nomu v:cjnom-PAST juusu o nonda .

呼ぶ yobu v:cjyob-INF kare o yonde ne !

29.2.6.4 子音動詞活用 | Consonant Verb In ection

関連: 動詞 (29.2.6)、母音動詞活用 (29.2.6.2)、形容詞活用 (29.2.4.1,29.2.3.1)、テ型複合動詞 (29.2.7)、変異

動詞活用 (29.2.6.6)、接尾詞・接頭詞 (29.2.23)、複合動詞 (29.2.7)、判定詞活用 (29.2.8.3)

あせる V-aseru v:cjnom-CAUS-PRES nomaseru

あれる V-areru v:cjnom-PASS-PRES nomareru

い V-i v:cjyob-INF yobi

nomi ni iku

う V-u v:cjnom-PRES nomu

え V-e v:cjnom-IMP nome

えば V-eba v:cjnom-COND nomeba

える V-eru v:cjnom-POT-PRES nomeru

おう V-oo v:cjnom-INT nomoo

がたい V-gatai adj:derjyom-gata-PRES yomigatai

じゃ V-ja v:cjyom-INF:te&wa yonja ikan

すぎる V-sugiru v:v:derjnom-sugi-PRES nomisugiru

そう V-soo adj:na:derjtabe-soo&PRES:0 nomisoo

adj:na:derjshin-soo-REL shinisoona

た V-ta v:cjkak-PAST kaita

だ V-da nonda

たい V-tai v:cjnom-DES-PRES nomitai

V-takatta v:cjyob-DES-PAST yobitakatta

V-takunai v:cjkak-DES-NEG-PRES kakitakunai

V-takute v:cjdas-DES-INF:te dashitakute

V-takattari v:cjshir-DES-INF:tari tabetakattari

V-takereba v:cjshin-DES-COND shinitakereba

V-takattara v:cjkats-DES-COND:tara kachitakattara

V-tagaru v:cjaw-DES-gar-PRES aitagaru

281

Page 306: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

たら V-tara v:cjnom-COND:tara kaitara

だら V-dara nondara

たり V-tari v:cjnom-INF:tari kaitari

だり V-dari nondari

ちゃ V-cha v:cjshir-INF:te&wa shitcha dame

て V-te v:cjkak-INF:te kaite

で V-de (テ型複合動詞参照) nondeshimau

な V-na v:cjnom-IMP:POL:conc nomuna !

ない V-nai v:cjnom-NEG-PRES nomanai

ないで V-naide v:cjnom-NEG-INF:te nomanaide

(テ型複合動詞参照) yobanaidekudasai

kattanaidehoshii

なきゃ V-nakya shiranakya

iwanakya ikenai

なくちゃ V-nakucha v:cjnom-PRH&INF&wa nomanakucha

なさい V-nasai v:cjnom-IMP:POL nominasai

にくい V-nikui adj:derjnom-niku-PRES nominikui

ました V-mashita v:cjnom-POL-PAST nomimashita

ましたら V-mashitara v:cjnom-POL-COND:tara nomimashitara

まして V-mashite v:cjnom-POL-INF:te nomimashite

ましょう V-mashoo v:cjnom-POL-INT nomimashoo

ます V-masu v:cjnom-POL-PRES nomimasu

やすい V-yasui adj:derjtabe-yasu-PRES nomiyasui

ん V-n v:cjnom-NEG:conc&PRES noman

dasan de ii (方言)

kakan de mo ii (方言)

29.2.6.5 変異動詞 (v:ir) | Irregular Verbs

する suru v:irjsu-PRES toppu ni suru

yame ni suru

kitanaku suru

denwa suru

nenne suru

ある aru v:irjar-PRES soko ni aru .

くる kuru v:irjkur-PRES ashita kuru .

29.2.6.6 変異動詞活用 | Irregular Verb In ection

関連: 動詞 (29.2.6)、母音動詞活用 (29.2.6.2)、判定詞活用 (29.2.8.3)、子音動詞活用 (29.2.6.4)、形容詞活用

(29.2.4.1,29.2.3.1)

する (v:ir)

させる V-aseru v:irjsur&CAUS-PRES saseru

される V-areru v:irjsur&PASS-PRES sareru

282

Page 307: JChatman

29.2. 品詞一覧表 | Word Class List

し V-i v:irjsur&INF shi

benkyoo shi ni iku

しがたい V-gatai adj:derjsur-gata-PRES shigatai

しすぎる V-sugiru v:v:derjsur-sugi-PRES shisugiru

しそう V-soo adj:na:derjsur-soo&PRES:0 shisoo

adj:na:derjsur-soo-PRES shisooda

adj:na:derjsur-soo-REL shisoona

adj:na:derjsur-soo-CONJ shisooni

した V-ta v:irjsur-PAST shita

したい V-tai v:irjsur-DES-PRES shitai

v:irjsur-DES-PAST shitakatta

v:irjsur-DES-NEG-PRES shitakunai

v:irjsur-DES-INF shitaku

v:irjsur-DES-INF:te shitakute

v:irjsur-DES-INF:tari shitakattari

v:irjsur-DES-COND shitakereba

v:irjsur-DES-COND:tara shitakattara

v:c:derjsur-DES-gar-PRES shitagaru

したら V-tara v:irjsur-COND:tara shitara

したり V-tari v:irjsur-INF:tari shitari

しちゃ V-cha v:irjsur-INF:te&wa shicha

して V-te v:irjsur-INF:te shite

しない V-nai v:irjsur-NEG-PRES shinai

しないで V-naide v:irjsur-NEG-INF:te shinaide

(テ型複合動詞参照) shinaidekudasai

shinaidehoshii

しなきゃ V-nakya shinakya

shinakya ikenai

しなくちゃ V-nakucha v:irjsur-PRH&INF&wa shinakucha

しなさい V-nasai v:irjsur-IMP:POL shinasai

しにくい V-nikui adj:derjsur-niku-PRES shinikui

します V-masu v:irjsur-POL-PRES shimasu

v:irjsur-POL-PAST shimashita

v:irjsur-POL-COND:tara shimashitara

v:irjsur-POL-INF:te shimashite

v:irjsur-POL-INT shimashoo

しやすい V-yasui adj:derjsur-yasu-PRES shiyasui

しよう V-yoo v:irjsur-INT shiyoo

しろ V-ro v:irjsur-IMP shiro

する V-ru v:irjsur-PRES suru

するな V-na v:irjsur-IMP:POL:conc suruna

すれば V-reba v:irjsur-COND sureba

せん V-n v:irjsur-NEG:conc&PRES sen

sen de mo ii (方言)

283

Page 308: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

ある

あった V-ta v:irjar-PAST atta

あったら V-tara v:irjar-COND:tara attara

あったり V-tari v:irjar-INF:tari attari

あって V-te v:irjar-INF:te atte

あらへん (方言) V-n v:irjar-NEG:conc&PRES arahen

あり V-i v:irjar-INF ari

ありすぎる V-sugiru v:v:derjar-sugi-PRES arisugiru

ありそう V-soo adj:na:derjar-soo&PRES:0 arisoo

ありにくい V-nikui adj:derjar-niku-PRES arinikui

あります V-masu v:irjar-POL-PRES arimasu

ある V-ru v:irjar-PRES aru

あれば V-reba v:irjar-COND areba

あろう V-oo v:irjar-INT aroo

ない V-nai v:irjar&NEG-PRES nai

なきゃ V-nakya nakya

なくちゃ V-nakucha v:irjar&PRH&INF&wa nakucha

くる

き V-i v:irjkur&INF ki

きすぎる V-sugiru v:v:derjkur-sugi-PRES kisugiru

きそう V-soo adj:na:derjkur-soo&PRES:0 kisoo

adj:na:derjkur-soo-PRES kisooda

きた V-ta v:irjkur-PAST kita

きたい V-tai v:irjkur-DES-PRES kitai

v:irjkur-DES-PAST kitakatta

v:c:derjkur-DES-gar-PRES kitagaru

きたら V-tara v:irjkur-COND:tara kitara

きたり V-tari v:irjkur-INF:tari kitari

きちゃ V-cha v:irjkur-INF:te&wa kicha

きて V-te v:irjkur-INF:te kite

きなさい V-nasai virjkur-IMP:POL kinasai

きにくい V-nikui adj:derjkur-niku-PRES kinikui

きます V-masu v:irjkur-POL-PRES kimasu

きやすい V-yasui adj:derjtabe-yasu-PRES kiyasui

くる V-ru v:irjkur-PRES kuru

くるな V-na v:irjkur-IMP:POL:conc kuruna

くれば V-reba v:irjkur-COND kureba

こい V-i v:irjkur&IMP koi

こさせる V-saseru v:irjkur-CAUS-PRES kosaseru

こない V-nai v:irjkur-NEG-PRES konai

こないで V-naide v:irjkur-NEG-INF:te konaide

こなかった V-nakatta v:irjkur-NEG-PAST konakatta

284

Page 309: JChatman

29.2. 品詞一覧表 | Word Class List

こなきゃ V-nakya konakya

konakya ikenai

こなくちゃ V-nakucha v:irjkur-PRH&INF&wa konakucha

こよう V-yoo v:irjkur-INT koyoo

こられる V-rareru v:irjkur-PASS-PRES korareru

これる V-reru v:irjkur-POT-PRES koreru

こん V-n v:irjkur-NEG:conc&PRES kon

kon de mo ii (方言)

29.2.7 複合動詞・テ型複合動詞 | Compound Verbs

関連: 動詞 (29.2.6節)、母音動詞活用 (29.2.6.2節)、子音動詞活用 (29.2.6.4節)、変異動詞活用 (29.2.6.6節)

複合動詞

上げる V+ageru v:cjmot-age-PRES baketsu o mochiageru.

得る V+eru v:cjar-e-PRES kore wa arieru.

終わる V+owaru v:vjtabe-owar-PRES tabeowatta.

かける V+kakeru v:cjiw-kake-PRES iikaketa .

出す V+dasu v:cjtor-das-PRES tsumiki o toridashita.

始める V+hajimeru v:cjyom-hajime-PRES yomihajimeta.

テ型複合動詞

ちゃ V-cha v:vjtabe-INF:te&wa tabecha

tabecha ikan (方言)

tabecha ikemasen

tabecha ikenai

tabecha dame

てあげる V-teageru v:cjkak-teage-PRES kaiteageru

てある V-tearu v:cjkak-tear-PRES kaitearu

ている V-teiru v:vjtabe-teir-PRES tabeteiru

てる V-teru v:vjtabe-teiru:cont-PRES tabeteru

てん (方言) V-ten tabeten no

て行く V-teiku v:cjkak-teik-PRES kaiteiku

ていらっしゃる V-teirassharu v:cjkak-teirasshar-PRES kaiteirassharu

てらっしゃる V-terassharu v:cjkak-teirasshar:cont-PRES kaiterassharu

ていらっしゃい V-teirasshai v:cjkak-teirasshai&IMP kaiteirasshai

てらっしゃい V-terasshai v:cjkak-teirasshai:cont&IMP kaiterasshai

ておいで V-teoide v:vjtabe-teoide-INF tabeteoide

ておく V-teoku v:vjtabe-teok-PRES tabeteoku

285

Page 310: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

ておる (方言) V-teoru v:vjtabe-teor-PRES tabeteoru

とる (方言) V-toru v:vjtabe-teor:cont-PRES tabetoru

て下さい V-tekudasai v:cjkak-tekudasai&IMP kaitekudasai

てくる V-tekuru v:vjtabe-tekur-PRES tabetekuru

てくれる V-tekureru v:cjkak-tekure-PRES kaitekureru

てごらん V-tegoran v:cjkak-tegoran&IMP kaitegoran

てしまう V-teshimau v:vjtabe-teshimaw-PRES tabeteshimau

ちゃう V-chau v:vjtabe-chaw-PRES tabechau

ちまう V-chimau v:vjtabe-chimaw-PRES tabechimau

てちょうだい V-techoodai v:vjtabe-techoodai&IMP tabetechoodai

てほしい V-tehoshii adj:derjtabe-tehoshi-PRES tabetehoshii

てみる V-temiru v:vjtabe-temi-PRES tabetemiru

てもらう V-temorau v:vjtabe-temoraw-PRES tabetemorau

てやる V-teyaru v:cjkak-teyar-PRES kaiteyaru

29.2.8 判定詞・助動詞 | Copula and Auxiliaries

関連: 判定詞活用 (29.2.8.3節)、終助詞 (29.2.20節)

29.2.8.1 助動詞 (v:aux) | Auxiliaries

そうだ V sooda v:auxjsoo-PRES iku sooda .

べきだ V bekida v:auxjbeki-PRES kaku bekida .

v:auxjbeki-PRES:0 yaru beki shigoto

みたいだ V mitaida v:auxjmitai-PRES kuru mitaida .

ようだ V yooda v:auxjyoo-PRES taberareru yooda .

わけだ V wakeda v:auxjwake-PRES komaru wakeda

のだ V noda v:auxjno-PRES kaku noda .

ookii noda .

hon na noda .

iyana noda .

んだ V nda v:auxjno:cont-PRES kaku nda .

29.2.8.2 判定詞 (v:cop) | Copula

だ N da v:copjda&PRES hon da .

じゃない N janai v:copjde&wa-NEG-PRES puro janai.

で N de v:copjde&INF:te gakusha de sakka de mo aru .

である N dearu v:copjde-ar-PRES kodomo dearu .

ではない N dewanai v:copjde-wa-NEG-PRES kodomo dewanai .

でない N denai v:copjde-NEG-PRES puro denai hito wa . . .

です N desu v:copjde&POL-PRES kodomo desu.

chiisai desu .

でございます N degozaimasu v:copjde-gozaimas-PRES hon degozaimasu .

でいらっしゃる N deirassharu v:copjde-irasshar-PRES sakka deirassharu .

286

Page 311: JChatman

29.2. 品詞一覧表 | Word Class List

29.2.8.3 判定詞活用 | Copula In ection

関連: 判定詞・助動詞 (29.2.8.2)、子音動詞活用 (29.2.6.4)、ナ形容詞活用 (29.2.3.1)、動詞 (29.2.6)、母音動

詞活用 (29.2.6.2)、変異動詞活用 (29.2.6.6)

だ da v:copjda&PRES

だった datta v:copjda-PAST

だったら dattara v:copjda-COND:tara

だったり dattari v:copjda-INF:tari

だろう daroo v:copjda-INT

です desu v:copjde&POL-PRES

でした deshita v:copjde&POL-PAST

でしたら deshitara v:copjde&POL-COND:tara

でして deshite v:copjde&POL-IN:te

でしょう deshoo v:copjde&POL-INT

で de v:copjde&INF:te

じゃない janai v:copjde&wa-NEG-PRES

じゃなくちゃ janakucha v:copjde&wa-PRH&INF&wa

じゃなきゃ janakya

な na v:copjda&REL

なら nara v:copjda&COND:tara

である dearu v:copjde-ar-PRES

であった deatta v:copjde-ar-PAST

であったら deattara v:copjde-ar-COND:tara

であったり deattari v:copjde-ar-INF:tari

であって deatte v:copjde-ar-INF:te

であり deari v:copjde-ar-INF

でありたい dearitai v:copjde-ar-DES-PRES

dearitakatta v:copjde-ar-DES-PAST

dearitakunai v:copjde-ar-DES-NEG-PRES

dearitaku v:copjde-ar-DES-INF

dearitakute v:copjde-ar-DES-INF:te

dearitakattari v:copjde-ar-DES-INF:tari

dearitakereba v:copjde-ar-DES-COND

dearitakattara v:copjde-ar-DES-COND:tara

dearitagaru v:c:derjde-ar-DES-gar-PRES

であります dearimasu v:copjde-ar-POL-PRES

dearimashita v:copjde-ar-POL-PAST

dearimashitara v:copjde-ar-POL-COND:tara

dearimashite v:copjde-ar-POL-INF:te

dearimashoo v:copjde-ar-POL-INT

であれば deareba v:copjde-ar-COND

であろう dearoo v:copjde-ar-INT

でない denai v:copjde-NEG-PRES

ではない dewanai v:copjde-wa-NEG-PRES

でなきゃ denakya v:copjde-PRH&INF&wa

287

Page 312: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

29.2.9 副詞 | Adverbs

関連: イ形容詞 (29.2.4節)、ナ形容詞 (29.2.3節)、接続詞 (29.2.22節)、擬声擬態語 (29.2.10節)

副詞 (adv)

いちばん ichiban advjichiban ichiban muzukashii .

さっぱり sappari advjsappari sappari shita aji

たまたま tamatama advjtamatama tamatama nakatta .

ちっとも chittomo advjchittomo chittomo omoshirokunai .

ちょっと chotto advjchotto chotto matte !

とても totemo advjtotemo totemo suki .

ゆっくり yukkuri advjyukkuri yukkuri netai .

わざわざ wazawaza advjwazawaza wazawaza katta noni .

さらに sarani advjsarani sarani kuwaeta .

たまに tamani advjtamani tamani tootta kara . . .

はじめに hajimeni advjhajimeni hajimeni jumbi shita .

ぐるっと gurutto adv:onomajgurutto gurutto mawaru .

わざと wazato advjwazato wazoto mushi shita .

A-く A-ku adjjoishi-CONJ oishiku tabeta .

NA-に NA-ni adj:najshizuka-CONJ shizukani kaetta .

29.2.10 擬声擬態語 | Onomatopoeia

関連: 擬声擬態語一覧表 (29.3.4節)

onoma

ジョンジョンジー

(音まね)

jonjonjii onomajjonjonjii jonjonjii@o

ワンワン wanwan onomajwanwan wanwan@o to hoeta .

ミーミー miimii onomajmiimii miimii@o, semi da .

adv:onoma

ぐるぐる guruguru adv:onomajguruguru guruguru mawaru

げらげら geragera adv:onomajgeragera geragera@o

geragera waratta.

じろじろ jirojiro adv:onomajjirojiro jirojiro mita

ぐるっと gurutto adv:onomajgurutto gurutto mawaru.

ちょろっと chorotto adv:onomajchorotto chorotto

ぴりっと piritto adv:onomajpiritto piritto shita aji

288

Page 313: JChatman

29.2. 品詞一覧表 | Word Class List

29.2.11 幼児語|Motherese

関連: 幼児語一覧表 (29.3.1節)

名詞 (n:mot)

あんよ anyo (足) n:motjanyo

くっく kukku (靴) n:motjkukku

動作名詞 (n:vn:mot)

おっき okki (起きる) n:vn:motjokki

おんぶ ombu (抱かれる) n:vn:motjombu

ぬりぬり nurinuri (塗る) n:vn:motjnurinuri

ねんね nenne (寝る) n:vn:motjnenne

はんぶんこ hambunko (分ける) n:vn:motjhambunko

イ形容詞 (adj:mot)

あっちい atchii (熱い) adj:motjatchi-PRES

ばっちい batchii (汚い) adj:motjbatchi-PRES

29.2.12 疑問詞|Question Words

関連: 不定詞 (~か、~も)(29.2.13節)、指示形容詞 (こそあ) (29.2.15節)、指示詞 (こそあ)(29.2.14節)

疑問詞 (demo:wh)

いかに (如何に) ikani demo:whjikani ikani dekita ka . . .

いくら (幾ら) ikura demo:whjikura ikura haratta ?

いくど (幾度) ikudo demo:whjikudo ikudo tameshita ?

いくつ (幾つ) ikutsu demo:whjikutsu ikutsu na no ?

いつ itsu demo:whjitsu itsu kaeru ?

だれ dare demo:whjdare dare na no ?

どう doo demo:whjdoo doo yatte yaru no ?

どういう dooiu demo:whjdooiu dooiu mono ga ii no ?

どういった dooitta demo:whjdooitta dooitta kanji ?

どういう風 dooiufuu demo:whjdooiufuu dooiufuu kashira ?

どういう風に dooiufuuni demo:whj dooiufuuni dooiufuuni yaru ?

どうして [ 理由 ] dooshite demo:whjdooshite dooshite dame ?

どこ doko demo:whjdoko doko ni aru ?

どちら dochira demo:whjdochira dochira kara iku ?

どっち dotchi demo:whjdotchi dotchi ga ii ?

どなた donata demo:whjdonata donata desu ka ?

どの dono demo:whjdono dono shurui ?

どのような donoyoona demo:whjdonoyoona donoyoona hito ?

どのように donoyooni demo:whj donoyooni donoyooni suru ?

どれ dore demo:whjdore dore de iku ?

どれぐらい doregurai demo:whjdoregurai doregurai desu ka?

どれくらい dorekurai demo:whjdorekurai

289

Page 314: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

どれだけ doredake demo:whjdoredake doredake gambatta ka . . .

どんだけ dondake demo:whjdondake

どんな donna demo:whjdonna donna moyoo ?

どんなに donnani demo:whjdonnani donnani gambatta ka . . .

どんなふうに donnafuuni demo:whjdonnafuuni donnafuuni yaru ?

なぜ naze demo:whjnaze naze ugokanai ?

なんで [ 理由 ] nande demo:whjnande nande okotteiru ?

なに nani demo:whjnani nani tabeta ?

なん nan demo:whjnan nan da tte ?

なん-助数辞 nani- demo:whjnan-

何人 nannin demo:whjnan-nin nannin kuru ?

何本 nambon demo:whjnan-hon nambon katta ?

何時 nanji demo:whjnan-ji ima nanji ?

29.2.13 不定詞|Inde�nite Demonstratives

関連: 疑問詞 (ど)(29.2.12節)、指示名詞 (こそあ)(29.2.14節)、指示形容詞 (こそあ)(29.2.15節)

カ不定詞 (demo:indef)

いくらか ikuraka demo:indefjikuraka okashi ga ikuraka nokotteita .

いくつか ikutsuka demo:indefjikutsuka sembee o ikutsuka choodai .

いつか itsuka demo:indefjitsuka itsuka tsuki ni ikitai .

だれか dareka demo:indefjdareka dareka kita yo .

どこか dokoka demo:indefjdokoka okashi ga dokoka ni aru yo .

どちらか dochiraka demo:indefjdochiraka dochiraka erande !

どっちか dotchika demo:indefjdotchika dotchika wakaranai .

どなたか donataka demo:indefjdonataka donataka shirimasen ka?

どれか doreka demo:indefjdoreka doreka wa sugu wakaru.

なぜか nazeka demo:indefjnazeka nazeka wakaru nda yo .

なにか nanika demo:indefjnanika nanika soko o tootta .

なんか nanka demo:indefjnanka nanka mieta ?

モ不定詞 (demo:indef)

いかにも ikanimo demo:indefjikanimo ikanimo itasoona hyoojoo

いくつも ikutsumo demo:indefjikutsumo kaki ga ikutsumo atta .

いくども ikudomo demo:indefjikudomo ikudomo tameshita .

いくらも ikuramo demo:indefjikuramo ikuramo nokoktteinai .

いつも itsumo demo:indefjitsumo itsumo wasureru .

だれも daremo demo:indefjdaremo daremo shinai .

どうしても dooshitemo demo:indefjdooshitemo dooshitemo dame .

290

Page 315: JChatman

29.2. 品詞一覧表 | Word Class List

どうも doomo demo:indefjdoomo doomo dekinai .

どこも dokomo demo:indefjdokomo dokomo aiteinai .

どちらも dochiramo demo:indefjdochiramo dochiramo nai .

どっちも dotchimo demo:indefjdotchimo dotchimo hirakanai .

どなたも donatamo demo:indefjdonatamo donatamo irassharanai .

どれも doremo demo:indefjdoremo doremo ataranai .

なにも nanimo demo:indefjnanimo nanimo oitenai .

29.2.14 指示名詞 (こそあ)|Demonstratives

関連: 指示形容詞 (こそあ)(29.2.15節)、不定詞 (~か、~も) (29.2.13節)、疑問詞 (ど)(29.2.12節)

ここ koko demo:njkoko koko ga ii .

そこ soko demo:njsoko soko ni mo nai .

あそこ asoko demo:njasoko asoko ni oitearu .

これ kore demo:njkore kore totte !

それ sore demo:njsore sore nai kara . . .

あれ are demo:njare are nondemite !

こっち kotchi demo:njkotchi kotchi ni mo nai .

そっち sotchi demo:njsotchi sotchi oiteoite !

あっち atchi demo:njatchi atchi ni aru kara .

こちら kochira demo:njkochira kochira e doozo .

そちら sochira demo:njsochira sochira wa doo desu ka ?

あちら achira demo:njachira achira o goran !

ここらへん kokorahen demo:njkokorahen kokorahen made kita .

そこらへん sokorahen demo:njsokorahen sokorahen ni aru .

あそこらへん asokorahen demo:njasokorahen asokorahen janai ?

ここらじゅう kokorajuu demo:njkokorajuu kokorajuu ni aru .

そこらじゅう sokorajuu demo:njsokorajuu sokorajuu yogoshita .

29.2.15 指示形容詞 (こそあ) | Demonstrative Adjectives

関連: 指示名詞 (こそあ)(29.2.14節)、不定詞 (不定語)(29.2.13節)、疑問詞 (29.2.12節)

指示形容詞 ( demo:adj )

こういう kooiu demo:adjjkooiu kooiu koto desu .

こういった kooitta demo:adjjkooitta kooitta mondai wa . . .

そういう sooiu demo:adjjsooiu sooiu kanji .

そういった sooitta demo:adjjsooitta sooitta mondai

ああいう aaiu demo:adjjaaiu aaiu mondai ni naru .

この kono demo:adjjkono kono hito nara daijoobu .

その sono demo:adjjsono sono ko ga kaetta toki . . .

あの ano demo:adjjano ano hito ni kiite !

こんな konna demo:adjjkonna konna hito wa dame .

そんな sonna demo:adjjsonna sonna koto yaruna !

あんな anna demo:adjjanna anna hito to kenka shite mo . . .

291

Page 316: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

指示形容詞 (demo:adj:na)

こういうふうだ kooiufuuda demo:adj:najkooiufuu-PRES kore wa kooiufuuda .

こういうふうな kooiufuuna demo:adj:najkooiufuu-REL kooiufuuna yarikata

こういうふうに kooiufuuni demo:adj:najkooiufuu-CONJ kooiufuuni tsunaida

こういうふう kooiufuu demo:adj:najkooiufuu-PREF:0 kooiufuu ga ii

このようだ konoyooda demo:adj:najkonoyoo-PRES mondai wa konoyooda .

このような konoyoona demo:adj:najkonoyoo-REL konoyoona mondai ga . . .

このように konoyooni demo:adj:najkonoyoo-CONJ konoyooni tsunagu to, . . .

こんなふうだ konnafuuda demo:adj:najkonnafuu-PRES katachi wa konnafuuda .

こんなふうな konnafuuna demo:adj:najkonnafuu-REL konnafuuna katachi

こんなふうに konnafuuni demo:adj:najkonnafuu-CONJ konnafuuni naretara . . .

指示副詞 (demo:adv)

こう koo demo:advjkoo koo yatte mo dame .

そう soo demo:advjsoo soo ieba nai ne .

ああ aa demo:advjaa aa iu koto ja komaru .

こんなに konnani demo:advjkonnani konnani atsui noni . . .

そんなに sonnani demo:advjsonnani sonnani ii no ?

あんなに annani demo:advjannani annani sagashita noni . . .

29.2.16 数詞|Numerals

関連: 助数辞 (29.2.24節)

一 ichi countjichi

二 ni countjni

三 san countjsan

四 shi numjshi

yon countjyon

五 go countjgo

六 roku countjroku

七 nana numjnana

shichi countjshichi

八 hachi countjhachi

九 ku countjku

kyuu countjkyuu

十 juu countjjuu

百 hyaku countjhyaku

千 sen countjsen

万 man countjman

億 oku countjoku

292

Page 317: JChatman

29.2. 品詞一覧表 | Word Class List

一つ hitotsu countjhitotsu

二つ futatsu countjfutatsu

三つ mittsu countjmittsu

mitsu countjmitsu

四つ yotsu countjyotsu

五つ itsutsu countjitsutsu

六つ muttsu countjmuttsu

七つ nanatsu countjnanatsu

八つ yatsu countjyatsu

九つ kokonotsu countjkokonotsu

十 too countjtoo

一人 hitori countjhitori

二人 futari countjfutari

一日 tsuitachi countjtsuitachi

二日 futsuka countjfutsuka

三日 mikka countjmikka

四日 yokka countjyokka

五日 itsuka countjitsuka

六日 muika countjmuika

七日 nanoka countjnanoka

八日 yooka countjyooka

九日 kokonoka countjkokonoka

十日 tooka countjtooka

二十日 hatsuka countjhatsuka

二十才 hatachi countjhatachi

29.2.17 格助詞 | Case Particles

関連: 提題助詞 (29.2.18節)、取立助詞 (29.2.19節)、接続助詞 (29.2.21節)

が ga ptl:casejga zoo ga ookii

から kara ptl:casejkara soko kara kita

で de ptl:casejde koko de taberu

と to ptl:casejto Hanako to tooron shita

dameda to itta

に ni ptl:casejni kare ni moratta

の no ptl:casejno kare no sodatta basho

へ e ptl:caseje uchi e kaeru

まで made ptl:casejmade gakkoo made iku

より yori ptl:casejyori kare yori ookii

を o ptl:casejo gohan o tabeta

293

Page 318: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

29.2.18 提題助詞 | Topic Particles

関連: 格助詞 (29.2.17節)、取立助詞 (29.2.19節)、接続助詞 (29.2.21節)

なら nara ptl:topjnara hon nara aru ga . . .

hon yomu nara ii kedo . . .

ったら ttara ptl:topjttara Ryookun ttara komatta mon da

って tte ptl:topjtte biiru tte nigai ne

は wa ptl:topjwa zoo wa hana ga nagai

29.2.19 取立助詞 | Focus Particles

関連: 格助詞 (29.2.17節)、提題助詞 (29.2.18節)、接続助詞 (29.2.21節)

くらい kurai ptl:torijkurai ichijikan kurai aru

ぐらい gurai ptl:torijgurai kore gurai ni shitara?

こそ koso ptl:torijkoso sore koso taihen

さえ sae ptl:torijsae gohan sae areba

しか shika ptl:torijshika hon shika nai

ずつ zutsu ptl:torijzutsu ikko zutsu taberu

すら sura ptl:torijsura gohan sura tabenai

だけ dake ptl:torijdake kare dake ga dekiru

だって datte ptl:torijdatte kare datte dekiru

とか toka ptl:torijtoka fuku toka katta

など nado ptl:torijnado hon nado katta

なんか nanka ptl:torijnanka kore nanka sutetara

なんて nante ptl:torijnante kare nante hen da wa

のみ nomi ptl:torijnomi oya nomi no atsumari

は wa ptl:torijwa kaze ga tsuyoi ga ame wa fut-

teinai

ばかり bakari ptl:torijbakari hon bakari da

ばっかり bakkari ptl:torijbakkari uso bakkari

ばかし bakashi ptl:torijbakashi joodan bakashi

ほど hodo ptl:torijhodo kore wa are hodo yokunai

まで made ptl:torijmade kare made dekiru

も mo ptl:torijmo kore o mite Hanako mo naita

294

Page 319: JChatman

29.2. 品詞一覧表 | Word Class List

29.2.20 終助詞 | Final Particles

か ka ptl:�najka iku ka ?

かい kai ptl:�najkai hoshii kai ?

かも kamo ptl:�najkamo iku kamo ne .

かもしれない kamoshirenai ptl:�najkamoshirenai

かもしれません kamoshiremasen ptl:�najkamoshiremasen

かもしれん kamoshiren ptl:�najkamoshiren

かな kana ptl:�najkana iku kana ?

かなあ kanaa ptl:�najkanaa

かしら kashira ptl:�najkashira kore kashira?

こと koto ptl:�najkoto hayaku iku koto!

さ sa ptl:�najsa abunai sa .

さあ saa ptl:�najsaa kore sa henda yo .

じゃない janai ptl:�najjanai ii janai !

じゃん jan ptl:�najjan ii jan !

ぞ zo ptl:�najzo ii zo .

っけ kke ptl:�najkke yutta kke ?

ってば tteba ptl:�najtteba ii tteba .

kore da tteba .

henda tteba .

とも tomo ptl:�najtomo ii tomo

な na ptl:�najna ii na !

なあ naa ptl:�najnaa

ね ne ptl:�najne abunai ne .

kore ga ne aru yo .

の no ptl:�najno yaru no?

もん mon ptl:�najmon ii mon !

もの mono ptl:�najmono kireedesu mono

よ yo ptl:�najyo totemo ii yo .

わ wa ptl:�najwa moo ii wa .

295

Page 320: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

29.2.21 接続助詞 | Conjunctive Particles

関連: 格助詞 (29.2.17節)、提題助詞 (29.2.18節)、取立助詞 (29.2.19節)

か ka ptl:conjjka hon ka rombun

soko ni itta ka wakaranai

が ga ptl:conjjga matta ga konai

から kara ptl:conjjkara kita kara daijoobuda

itte kara hajimeru

きり kiri ptl:conjjkiri itta kiri ni natta

けど kedo ptl:conjjkedo

けれど keredo ptl:conjjkeredo

けれども keredomo ptl:conjjkeredomo daibu matta keredomo

し shi ptl:conjjshi ken mo ookii shi mari mo ookii .

つつ tsutsu ptl:conjjtsutsu kangae tsutsu aru

と to ptl:conjjto hon to zasshi

aru to benri

ikanai to dame

ii to kagiranai

tabeyoo to suru

とか toka ptl:conjjtoka hon toka zasshi toka atta .

ながら nagara ptl:conjjnagara yomi nagara taberu

chiisai nagara genki

shizuka nagara chanto ugoku.

なり nari ptl:conjjnari iku nari

に ni ptl:conjjni koohi ni koocha

の no ptl:conjjno bunshoo no naka

のに noni ptl:conjjnoni itta koto nai noni

つつ tsutsu ptl:conjjtsutsu kangae tsutsu aruku .

と to ptl:conjjto hon to zasshi

とか toka ptl:conjjtoka hon toka zasshi toka

ほど hodo ptl:conjjhodo ikeba iku hodo . . .

まで made ptl:conjjmade basu ga kuru made matsu

も mo ptl:conjjmo hon mo zasshi mo

itte mo ii ?

や ya ptl:conjjya koohi ya koocha o nonda

296

Page 321: JChatman

29.2. 品詞一覧表 | Word Class List

29.2.22 接続詞|Conjunctions

関連: 接続助詞 (29.2.21節)

あるいは aruiwa conjjaruiwa aruiwa koo sureba ii

しかし shikashi conjjshikashi shikashi nakatta .

じゃ ja conjjja ja yameru .

じゃあ jaa conjjjaa

すなわち sunawachi conjjsunawachi sunawachi kooiu koto da .

そうすると soosuruto conjjsoosuruto soosuruto kare ga hannin da.

そしたら soshitara conjjsoshitara soshitara yameta hoo ga ii.

そして soshite conjjsoshite soshite kaetchatta.

それで sorede conjjsorede sorede tsugi wa koko da.

そいで (方言) soide

それでは soredewa conjjsoredewa soredewa hajimemasu.

それなら sorenara conjjsorenara sorenara ii yo.

だから dakara conjjdakara dakara yameta

だけど dakedo conjjdakedo

だけども dakedomo conjjdakedomo

だけれども dakeredomo conjjdakeredomo dakedo ii yo.

だったら dattara conjjdattara dattara yameta hoo ga ii.

だって datte conjjdatte datte takai mon .

では dewa conjjdewa dewa hajimemashoo .

でも demo conjjdemo demo amari yokunai.

ところが tokoroga conjjtokoroga tokoroga kowareta.

ところで tokorode conjjtokorode tokorode amari yokunai.

なぜなら nazenara conjjnazenara nazenara moo nai nda.

ひょっとしたら hyottoshitara conjjhyottoshitara hyottoshitara machigaeta kana ?

ひょっとして hyottoshite conjjhyottoshite

ひょっとすると hyottosuruto conjjhyottosuruto

ほんで (方言) honde conjjhonde honde uchi ni kaetta.

ほんなら (方言) honnara conjjhonnara honnara yametara?

もし moshi conjjmoshi moshi hontoo dattara . . .

もしかしたら moshikashitara conjjmoshikashitara moshikashitara hontoo kamo

もしかして moshikashite conjjmoshikashite

もしかすると moshikasuruto conjjmoshikasuruto

ようするに yoosuruni conjjyoosuruni yoosuruni shippai datta.

297

Page 322: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

29.2.23 接尾辞・接頭辞 | Su�xes and Pre�xes

関連: 助数辞 (29.2.24節)

接尾辞

方 V-kata njyar-kata yarikata

手 V-te njyar-te yarite

場 V-ba njasob-ba asobiba

気 A-ke njnemu-ke nemuke

さ A-sa njama-sa amasa

味 A-mi njama-mi amami

君 N-kun njkaba-kun kabakun

ごっこ N-gokko njokaasan-gokko okaasangokko

ちゃん N-chan njusagi-chan usagichan

中 VN-chuu n:vnjressun-chuu ressunchuu

N-juu njnatsu-juu natsujuu

様 N-sama njo#kyaku-sama okyakusama

さん N-san njari-san arisan

過ぎ N-sugi njhiru-sugi hirusugi made

達 N-tachi njkodomo-tachi kodomotachi

屋 N-ya njdenki-ya denkiya

屋さん N-yasan njomocha-ya-san omochayasan

接頭辞

大 dai#A adjjdai#kira-PRES daikirai

お o#N njo#soto osoto

ご go#N njgo#hon gohon

真 ma#N njma#shiro masshiro

298

Page 323: JChatman

29.2. 品詞一覧表 | Word Class List

29.2.24 助数辞 | Classi�ers

関連: 数詞 (29.2.16節)、接尾辞・接頭辞 (29.2.23節)

第 dai#NUM countjdai#ni-ban dainiban

回 COUNT-kai countjni-kai=times nikai

sankai

階 COUNT-kai countjsan-kai= oor nikai

sangai

階建て COUNT-

kaidate

countjni-kaidate nikaidate

ヶ月 COUNT-

kagetsu

countjsan-kagetsu sankagetsu

月 COUNT-gatsu countjichi-gatsu ichigatsu

個 COUNT-ko countjsan-ko sanko

才 COUNT-sai countjsan-sai sansai

時 COUNT-ji countjyo-ji yoji

年 COUNT-nen countjsan-nen sannen

年生 COUNT-

nensee

countjichi-nensee ichinensee

番 COUNT-ban countjsan-ban samban

匹 COUNT-hiki countjichi-hiki ippiki

本 COUNT-hon countjichi-hon ippon

枚 COUNT-mai countjichi-mai ichimai

299

Page 324: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

29.3 一覧表

29.3.1 幼児語 | Motherese

関連: 幼児語 (29.2.11), 動作名詞 (29.2.2)

あちちい achichii 熱いこと/もの n:motjachichii

あっちい atchii 熱い adj:motjatchi-PRES

あめこんこん amekonkon 雨 n:motjamekonkon

あんよ anyo 足 n:motjanyo

いないないばあ inainaibaa 隠れる n:vn:motjinainaibaa

うんこ unko 排便 n:vn:motjunko

うんこ unko 大便 n:motjunko

うんち unchi 排便 n:vn:motjunchi

うんち unchi 大便 n:motjunchi

おしっこ oshikko 排尿 n:vn:motjoshikko

おしっこ oshikko 小便 n:motjoshikko

おっき okki 起きる n:vn:motjokki

おてて otete 手 n:motjotete

おぶう obuu お茶 n:motjobuu

おべべ obebe 洋服 n:motjobebe

おめめ omeme 目 n:motjomeme

おんぶ ombu 背負われる n:vn:motjombu

おんも ommo 外 n:motjommo

おんり onri 降りる n:vn:motjonri

きしゃぽっぽ kishapoppo 汽車 n:motjkishapoppo

きれきれ kirekire 拭く n:vn:motjkirekire

くっく kukku 靴 n:motjkukku

げえ gee 吐く n:vn:motjgee

こっけこちゃん kokkekochan 鶏 n:motjkokkekochan

こっこ kokko 大便 n:motjkokko

しい shii 小便 n:vn:motjshii

しいしい shiishii 小便 n:vn:motjshiishii

しっこ shikko 排尿 n:vn:motjshikko

しっこ shikko 小便 n:motjshikko

だいじ daiji 大事なもの n:motjdaiji

だいじだいじ daijidaiji 大事なもの n:motjdaijidaiji

たち tachi 立つ n:vn:motjtachi

たんたん tantan お風呂 n:motjtantan

ちっち chitchi おっぱい n:motjchitchi

てて tete 手 n:motjtete

とんとん tonton 叩く n:vn:motjtonton

とんとん tonton トンカチ n:motjtonton

とっと totto 鳥 n:motjtotto=bird

とっと totto 魚 n:motjtotto=�sh

300

Page 325: JChatman

29.3. 一覧表

なんな nanna 散歩 n:vn:motjnanna

なんななあ nannanaa 散歩 n:vn:motjnannanaa

にゃあにゃ nyaanya ネコ n:motjnyaanya

ぬりぬり nurinuri 塗る n:vn:motjnurinuri

ねんね nenne 寝る n:vn:motjnenne

はあは haaha 歯 n:motjhaaha

ばっちい batchii 汚い adj:motjbatchi-PRES

はんぶんこ hambunko 分ける n:vn:motjhambunko

ぷう puu おなら n:vn:motjpuu

ぶうぶ buubu 車 n:motjbuubu

ぶうちゃん buuchan 豚 n:motjbuuchan

ぶんぶ bumbu 風呂;水 n:motjbumbu

ぽい poi 捨てる n:vn:motjpoi

ぽっぽ poppo 鳩 n:motjpoppo=pigeon

ぽっぽ poppo 汽車 n:motjpoppo=train

ぽん pon 投げる n:vn:motjpon

ぽんぽん pompon お腹 n:motjpompon

まんま mamma ごはん n:motjmamma

めめ meme 目 n:motjmeme

よしよし yoshiyoshi 撫でる n:vn:motjyoshiyoshi

わんわん wanwan 犬 n:motjwanwan

29.3.2 挨拶用語一覧表 | Greetings

ありがとう arigatoo co:gjarigatoo

ありがとうございました arigatoo+gozaimashita co:gjarigatoo+gozaimashita

どうもありがとうございました doomo+arigatoo+gozaimashita co:gjdoomo+arigatoo+gozaimashita

いただきます itadakimasu co:gjitadakimasu

いってきます ittekimasu co:gjittekimasu

いってらっしゃい itterasshai co:gjitterasshai

いらっしゃいませ irasshaimase co:gjirasshaimase

おかえり okaeri co:gjokaeri

おかえりなさい okaerinasai co:gjokaerinasai

おかまいなく okamai+naku co:gjokamai+naku

おねがい onegai co:gjonegai

おねがいします onegai+shimasu co:gjonegai+shimasu

おはよう ohayoo co:gjohayoo

おはようございます ohayoo+gozaimasu co:gjohayoo+gozaimasu

お久しぶり ohisashiburi co:gjohisashiburi

お久しぶりです ohisashiburi+desu co:gjohisashiburi+desu

お久しぶりですね ohisashiburi+desu+ne co:gjohisashiburi+desu+ne

おめでとう omedetoo co:gjomedetoo

おめでとうございます omedetoo+gozaimasu co:gjomedetoo+gozaimasu

301

Page 326: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

おやすみ oyasumi co:gjoyasumi

おやすみなさい oyasuminasai co:gjoyasuminasai

乾杯 kampai co:gjkampai

ごちそうさま gochisoosama co:gjgochisoosama

ごちそうさま gochisoosama co:gjgochisoosama

ごちそうさまでした gochisoosama+deshita co:gjgochisoosama+deshita

ごめん gomen co:gjgomen

ごめんなさい gomennasai co:gjgomennasai

こんばんわ kombanwa co:gjkombanwa

こんにちわ konnichiwa co:gjkonnichiwa

さようなら sayoonara co:gjsayoonara

失礼 shitsuree co:gjshitsuree

失礼します shitsuree+shimasu co:gjshitsuree+shimasu

失礼しました shitsuree+shimashita co:gjshitsuree+shimashita

すみません sumimasen co:gjsumimasen

それじゃ soreja co:gjsoreja

それでは soredewa co:gjsoredewa

ただいま tadaima co:gjtadaima

バイバイ baibai co:gjbaibai

またね matane co:gjmatane

もういいかい moo+ii+kai co:gjmoo+ii+kai

もしもし moshimoshi co:gjmoshimoshi

よろしく yoroshiku co:gjyoroshiku

よろしくお願いします yoroshiku+onegai+shimasu co:gjyoroshiku+onegai+shimasu

よろしくお願いいたします yoroshiku+onegai+itashimasu co:gjyoroshiku+onegai+itashimasu

29.3.3 肯否定語・間投詞・感動詞一覧表 | Communicators

関連: 挨拶用語 (29.3.2節)

ああ aa co:ijaa

あっ aQ co:ijaQ

あの ano co:ijano

あのう anoo co:ijanoo

あのさ anosa co:ijano+sa

あのね anone co:ijano+ne

いいえ iie co:ijiie

いや [=いいえ] iya co:ijiya

うん un co:ijun

ううん [=いいえ] uun co:ijuun

ええ ee co:ijee

ええと eeto co:ijeeto

ええとさ eetosa co:ijeeto+sa

ええとね eetone co:ijeeto+ne

302

Page 327: JChatman

29.3. 一覧表

おお! oo ! co:ijoo

きゃあ! kyaa ! co:ijkyaa

さあ saa . . . co:ijsaa

そう soo co:ijsoo

は [=はい] ha co:ijha

はあ [=はい] haa co:ijhaa

はい hai co:ijhai

はいはい haihai co:ijhai+hai

ふうん! fuun ! co:ijfuun

へえ! hee ! co:ijhee

へえん! heen ! co:ijheen

ほお! hoo ! co:ijhoo

ほら hora co:ijhora

ほれ hore co:ijhore

まあ . . . maa . . . co:ijmaa

やっ [=いいえ] yaQ co:ijyaQ

わあ! waa ! co:ijwaa

ん? n ? co:ijn

[息を吸う] ss co:ijss

29.3.4 擬音語・擬態語 | Onomatopoeic Words

あっさり assari character onomajassari

あたふた atafuta mental state onomajatafuta

あはは ahaha laugh onomajahaha

いじいじ ijiiji mental state onomajijiiji

いそいそ isoiso feeling onomajisoiso

いひひ ihihi laugh onomajihihi

いらいら iraira mental state onomajiraira

うかうか ukauka inattention onomajukauka

うきうき ukiuki feeling onomajukiuki

うじうじ ujiuji mental state onomajujiuji

うっかり ukkari inattention onomajukkari

うっとり uttori feeling onomajuttori

うつらうつら utsurautsura sleep onomajutsurautsura

うとうと utouto sleep onomajutouto

うねうね uneune bend onomajuneune

うふふ ufufu laugh onomajufufu

うらうら uraura weather onomajuraura

うろちょろ urochoro movement onomajurochoro

うんざり unzari feeling onomajunzari

えへへ ehehe laugh onomajehehe

えへん ehen cough onomajehen

303

Page 328: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

おいおい oioi cry onomajoioi

おずおず ozuozu mental state onomajozuozu

おたおた otaota mental state onomajotaota

おちおち ochiochi mental state onomajochiochi

おっとり ottori character onomajottori

おどおど odoodo mental state onomajodoodo

おほほ ohoho laugh onomajohoho

おろおろ orooro mental state onomajorooro

おんおん on'on cry onomajon'on

かあかあ kaakaa crow onomajkaakaa

があがあ gaagaa duck onomajgaagaa

かあん kaan sound onomajkaan

かさかさ kasakasa rub onomajkasakasa

がさがさ gasagasa rub onomajgasagasa

かしゃかしゃ kashakasha rub onomajkashakasha

がしゃがしゃ gashagasha rub onomajgashagasha

かたかた katakata knock onomajkatakata

がたがた gatagata knock onomajgatagata

がたがた gatagata rock onomajgatagata

がたがた gatagata disorder onomajgatagata

がたっと gatatto rock onomajgatatto

がたぴし gatapishi rub onomajgatapishi

がたり gatari rock onomajgatari

かたん katan knock onomajkatan

かたん katan rub onomajkatan

がたん gatan knock onomajgatan

がたん gatan rub onomajgatan

かちかち kachikachi hardness onomajkachikachi

がちがち gachigachi hardness onomajgachigachi

がちゃがちゃ gachagacha mecopoda elongata onomajgachagacha

がちゃがちゃ gachagacha sound onomajgachagacha

がちゃがちゃ gachagacha disorder onomajgachagacha

がつがつ gatsugatsu eat onomajgatsugatsu

がっくり gakkuri feeling onomajgakkuri

がっくり gakkuri unpleasant onomajgakkuri

かっこお kakkoo cuckoo onomajkakkoo

がっしり gasshiri weight onomajgasshiri

がっしり gasshiri body onomajgasshiri

がぶり gaburi eat onomajgaburi

がやがや gayagaya speak onomajgayagaya

がやがや gayagaya people onomajgayagaya

からから karakara hunger onomajkarakara

からから karakara laugh onomajkarakara

がらがら garagara thunder onomajgaragara

304

Page 329: JChatman

29.3. 一覧表

からっと karatto weather onomajkaratto

からっと karatto character onomajkaratto

からり karari weather onomajkarari

かりかり karikari mental state onomajkarikari

がりがり garigari eat onomajgarigari

かん kan sound onomajkan

かんかん kankan sun onomajkankan

かんかん kankan sound onomajkankan

がんがん gangan speak onomajgangan

がんがん gangan head ache onomajgangan

きいきい kiikii rub onomajkiikii

ぎいぎい giigii rub onomajgiigii

きちんと kichinto orderly onomajkichinto

きっぱり kippari mental state onomajkippari

きしきし kishikishi rub onomajkishikishi

ぎしぎし gishigishi rub onomajgishigishi

きっちり kitchiri orderly onomajkitchiri

ぎゅうぎゅう gyuugyuu wring onomajgyuugyuu

ぎゅっと gyutto wring onomajgyutto

きゃんきゃん kyankyan dog onomajkyankyan

きらきら kirakira star onomajkirakira

きらきら kirakira lustre onomajkirakira

ぎらぎら giragira sun onomajgiragira

ぎらぎら giragira lustre onomajgiragira

きらっと kiratto star onomajkiratto

きらり kirari star onomajkirari

きりきり kirikiri stomach onomajkirikiri

くうくう kuukuu sleep onomajkuukuu

ぐうぐう guuguu hunger onomajguuguu

ぐうぐう guuguu sleep onomajguuguu

ぐざぐざ guzaguza cut onomajguzaguza

ぐざり guzari cut onomajguzari

ぐざっと guzatto cut onomajguzatto

ぐしょぐしょ gushogusho humidity onomajgushogusho

くすくす kusukusu laugh onomajkusukusu

くすっと kusutto laugh onomajkusutto

くだくだ kudakuda speak onomajkudakuda

くちゃくちゃ kuchakucha disorderly onomajkuchakucha

ぐちゃぐちゃ guchagucha disorder onomajguchagucha

くっくっと kukkutto laugh onomajkukkutto

ぐっしょり gusshori humidity onomajgusshori

ぐっすり gussuri sleep onomajgussuri

ぐったり guttari unpleasant onomajguttari

くどくど kudokudo speak onomajkudokudo

305

Page 330: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

くにゃくにゃ kunyakunya bend onomajkunyakunya

ぐにゃぐにゃ gunyagunya bend onomajgunyagunya

くにゃり kunyari bend onomajkunyari

ぐにゃり gunyari bend onomajgunyari

くねくね kunekune bend onomajkunekune

くよくよ kuyokuyo mental state onomajkuyokuyo

くらくら kurakura head ache onomajkurakura

ぐらぐら guragura rock onomajguragura

ぐらっと guratto rock onomajguratto

ぐらり gurari rock onomajgurari

くるくる kurukuru turn onomajkurukuru

ぐるぐる guruguru turn onomajguruguru

くるっと kurutto turn onomajkurutto

ぐるっと gurutto turn onomajgurutto

くるり kururi turn onomajkururi

ぐるり gururi turn onomajgururi

けらけら kerakera laugh onomajkerakera

げらげら geragera laugh onomajgeragera

けろけろ kerokero frog onomajkerokero

げろげろ gerogero frog onomajgerogero

げんなり gennari unpleasant onomajgennari

ごおん goon sound onomajgoon

ごくごく gokugoku eat onomajgokugoku

ごくり gokuri eat onomajgokuri

ごくん gokun eat onomajgokun

こけこっこお kokekokkoo cock onomajkokekokkoo

ごしごし goshigoshi rub onomajgoshigoshi

こそこそ kosokoso movement onomajkosokoso

ごたごた gotagota disorder onomajgotagota

こちこち kochikochi hardness onomajkochikochi

ごちゃごちゃ gochagocha disorder onomajgochagocha

こっくり kokkuri sleep onomajkokkuri

こつこつ kotsukotsu work onomajkotsukotsu

ごつごつ gotsugotsu hardness onomajgotsugotsu

ごつごつ gotsugotsu body onomajgotsugotsu

こっそり kossori movement onomajkossori

こつん kotsun knock onomajkotsun

ごつん gotsun knock onomajgotsun

ことこと kotokoto knock onomajkotokoto

ごとごと gotogoto knock onomajgotogoto

ことん koton knock onomajkoton

ごとん goton knock onomajgoton

こほん kohon cough onomajkohon

ごほん gohon cough onomajgohon

306

Page 331: JChatman

29.3. 一覧表

こりこり korikori hardness onomajkorikori

こりこり korikori eat onomajkorikori

ごりごり gorigori eat onomajgorigori

ごろり gorori stone onomajgorori

ころころ korokoro cricket onomajkorokoro

ころころ korokoro stone onomajkorokoro

ごろごろ gorogoro thunder onomajgorogoro

ごろごろ gorogoro stone onomajgorogoro

ころり korori stone onomajkorori

ころん koron stone onomajkoron

ごろん goron stone onomajgoron

ごわごわ gowagowa hardness onomajgowagowa

ごわごわ gowagowa quality onomajgowagowa

ごん gon sound onomajgon

こんこん konkon fox onomajkonkon

こんこん konkon knock onomajkonkon

ごんごん gongon knock onomajgongon

ごんごん gongon sound onomajgongon

ざあっと zaatto ow onomajzaatto

ざあざあ zaazaa rain onomajzaazaa

ざあざあ zaazaa ow onomajzaazaa

ざくっと zakutto cut onomajzakutto

さくさく sakusaku cut onomajsakusaku

ざくざく zakuzaku cut onomajzakuzaku

さくっと sakutto cut onomajsakutto

ざくり zakuri cut onomajzakuri

さっくと sakkuto stand up onomajsakkuto

さっと satto stand up onomajsatto

さっと satto movement onomajsatto

さっぱり sappari character onomajsappari

さっぱり sappari movement onomajsappari

さらさら sarasara quality onomajsarasara

ざらざら zarazara quality onomajzarazara

さらっと saratto humidity onomajsaratto

さらりと sararito character onomajsararito

ざんざん zanzan rain onomajzanzan

じいじい jiijii cicade onomajjiijii

しいんと shiinto still onomajshiinto

しくしく shikushiku cry onomajshikushiku

しくしく shikushiku stomach onomajshikushiku

じくじく jikujiku humidity onomajjikujiku

じっと jitto movement onomajjitto

しっとり shittori humidity onomajshittori

307

Page 332: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

しっぽり shippori humidity onomajshippori

しとしと shitoshito rain onomajshitoshito

じめじめ jimejime humidity onomajjimejime

しゃなりしゃなり shanarishanari walk onomajshanarishanari

しょんぼり shonbori feeling onomajshonbori

しんみり shinmiri feeling onomajshinmiri

しんしん shinshin snow onomajshinshin

じんじん jinjin head ache onomajjinjin

すいっちょ suitcho hexacentrus japon onomajsuitcho

ずかずか zukazuka walk onomajzukazuka

すかっと sukatto feeling onomajsukatto

ずきずき zukizuki head ache onomajzukizuki

ずきずき zukizuki wound onomajzukizuki

すたこら sutakora walk onomajsutakora

すたすた sutasuta walk onomajsutasuta

ずっしり zusshiri weight onomajzusshiri

すぱすぱ supasupa cut onomajsupasupa

すぱすぱ supasupa tabaco onomajsupasupa

すぱっと supatto cut onomajsupatto

ずぶっと zubutto cut onomajzubutto

すべすべ subesube quality onomajsubesube

すやすや suyasuya sleep onomajsuyasuya

ずんずん zunzun walk onomajzunzun

すんなり sunnari body onomajsunnari

ぜいぜい zeezee breath onomajzeezee

せっせと sesseto work onomajsesseto

そっと sotto movement onomajsotto

そよそよ soyosoyo wind onomajsoyosoyo

ちゃんと chanto movement onomajchanto

ちゃらちゃら charachara sound onomajcharachara

ちゃりん charin sound onomajcharin

ちかちか chikachika lustre onomajchikachika

ちんろりん chinrorin xenogryllus marmoratus onomajchinrorin

ちらちら chirachira snow onomajchirachira

ちょきちょき chokichoki cut onomajchokichoki

ちょきり chokiri cut onomajchokiri

ちょきっと chokitto cut onomajchokitto

ちょろちょろ chorochoro ow onomajchorochoro

ちょろり chorori ow onomajchorori

ちょろっと chorotto ow onomajchorotto

ちゅんちゅん chunchun sparrow onomajchunchun

ちゅっと chutto eat onomajchutto

ちゅうちゅう chuuchuu mouse onomajchuuchuu

ちゅうちゅう chuuchuu eat onomajchuuchuu

308

Page 333: JChatman

29.3. 一覧表

つるつる tsurutsuru quality onomajtsurutsuru

てかてか tekateka lustre onomajtekateka

てきぱき tekipaki movement onomajtekipaki

てくてく tekuteku walk onomajtekuteku

てらてら teratera lustre onomajteratera

でんでん denden sound onomajdenden

どきどき dokidoki breast onomajdokidoki

どんどん dondon knock onomajdondon

どんどん dondon sound onomajdondon

どにょり donyori weather onomajdonyori

どしどし doshidoshi humidity onomajdoshidoshi

どたばた dotabata walk onomajdotabata

どたばた dotabata people onomajdotabata

どっしり dosshiri weight onomajdosshiri

どっしり dosshiri body onomajdosshiri

とっとと tottoto walk onomajtottoto

とぼとぼ tobotobo walk onomajtobotobo

どやどや doyadoya people onomajdoyadoya

とんとん tonton knock onomajtonton

なよなよ nayonayo body onomajnayonayo

にこにこ nikoniko laugh onomajnikoniko

にこっと nikotto laugh onomajnikotto

にこり nikori laugh onomajnikori

にたにた nitanita laugh onomajnitanita

にたっと nitatto laugh onomajnitatto

にたり nitari laugh onomajnitari

にゃあにゃあ nyaanyaa cat onomajnyaanyaa

にやにや niyaniya laugh onomajniyaniya

にやっと niyatto laugh onomajniyatto

にやり niyari laugh onomajniyari

にゅるっと nyurutto stickiness onomajnyurutto

にゅるり nyururi stickiness onomajnyururi

ぬめぬめ numenume stickiness onomajnumenume

ぬらぬら nuranura stickiness onomajnuranura

ぬるり nururi stickiness onomajnururi

ねちねち nechinechi stickiness onomajnechinechi

ねちねち nechinechi mental state onomajnechinechi

ねっとり nettori stickiness onomajnettori

ねとねと netoneto stickiness onomajnetoneto

ねばねば nebaneba stickiness onomajnebaneba

のこのこ nokonoko walk onomajnokonoko

のそのそ nosonoso walk onomajnosonoso

のろのろ noronoro movement onomajnoronoro

のんびり nonbiri character onomajnonbiri

309

Page 334: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

はあはあ haahaa breath onomajhaahaa

ぱくぱく pakupaku eat onomajpakupaku

ぱくり pakuri eat onomajpakuri

ばしり bashiri knock onomajbashiri

ぱしり pashiri knock onomajpashiri

ばたっと batatto stop onomajbatatto

ばたり batari stop onomajbatari

ばたん batan stop onomajbatan

ぱっくり pakkuri eat onomajpakkuri

はっと hatto keen onomajhatto

ははは hahaha laugh onomajhahaha

はらはら harahara snow onomajharahara

はらはら harahara petal onomajharahara

はらはら harahara mental state onomajharahara

ばらばら barabara petal onomajbarabara

ぱらぱら parapara rain onomajparapara

ぱらぱら parapara petal onomajparapara

はらり harari petal onomajharari

ばりっと baritto tear onomajbaritto

ぱりっと paritto tear onomajparitto

ばりばり baribari tear onomajbaribari

ばりばり baribari work onomajbaribari

ぱりぱり paripari tear onomajparipari

ばりん barin tear onomajbarin

ぱりん parin tear onomajparin

ぴいひょろろ piihyororo milan onomajpiihyororo

ぴかっと pikatto star onomajpikatto

ぴかっと pikatto ash onomajpikatto

ぴかぴか pikapika star onomajpikapika

ぴかぴか pikapika lustre onomajpikapika

ぴかり pikari star onomajpikari

びくびく bikubiku mental state onomajbikubiku

ひしひし hishihishi feeling onomajhishihishi

びしょびしょ bishobisho humidity onomajbishobisho

ひそひそ hisohiso speak onomajhisohiso

ぴたっと pitatto stop onomajpitatto

ぴたり pitari stop onomajpitari

ぴたん pitan stop onomajpitan

びっしょり bisshori humidity onomajbisshori

ひっそり hissori still onomajhissori

ぴったり pittari orderly onomajpittari

ひひいん hihiin horse onomajhihiin

ひひひ hihihi laugh onomajhihihi

310

Page 335: JChatman

29.3. 一覧表

ひゅうひゅう hyuuhyuu wind onomajhyuuhyuu

びゅうびゅう byuubyuu wind onomajbyuubyuu

ぴゅうぴゅう pyuupyuu wind onomajpyuupyuu

ぴよぴよ piyopiyo chick onomajpiyopiyo

ぴょんと pyonto jump onomajpyonto

ぴょんぴょん pyonpyon jump onomajpyonpyon

ひらひら hirahira paper onomajhirahira

びらびら birabira paper onomajbirabira

ぴらぴら pirapira paper onomajpirapira

ひらり hirari paper onomajhirari

ひらり hirari walk onomajhirari

びりっと biritto tear onomajbiritto

ぴりっと piritto tear onomajpiritto

ひりひり hirihiri wound onomajhirihiri

びりびり biribiri tear onomajbiribiri

ぴりぴり piripiri tear onomajpiripiri

ぴりぴり piripiri mental state onomajpiripiri

ぴんぴん pinpin body onomajpinpin

ぴんぽん pinpon sound onomajpinpon

ふうふう fuufuu breath onomajfuufuu

ぶうぶう buubuu speak onomajbuubuu

ぶうぶう buubuu pig onomajbuubuu

ぷうぷう puupuu sound onomajpuupuu

ぷうんと puunto smell onomajpuunto

ぷかっと pukatto tabaco onomajpukatto

ぷかぷか pukapuka tabaco onomajpukapuka

ぷかり pukari tabaco onomajpukari

ぶくぶく bukubuku body onomajbukubuku

ぶすっと busutto cut onomajbusutto

ぶすっと busutto mental state onomajbusutto

ぶつぶつ butsubutsu speak onomajbutsubutsu

ぶつぶつ butsubutsu mental state onomajbutsubutsu

ふっくら fukkura softness onomajfukkura

ふっと futto stop onomajfutto

ふっと futto keen onomajfutto

ふと futo keen onomajfuto

ふふっと fufutto laugh onomajfufutto

ぶよぶよ buyobuyo softness onomajbuyobuyo

ぷよぷよ puyopuyo softness onomajpuyopuyo

ふらふら furafura body onomajfurafura

ふわふわ fuwafuwa cloud onomajfuwafuwa

ふんわり funwari cloud onomajfunwari

ふんわり funwari softness onomajfunwari

ぺこぺこ pekopeko hunger onomajpekopeko

311

Page 336: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

ぺちゃくちゃ pechakucha speak onomajpechakucha

へっへっと hehhetto laugh onomajhehhetto

べとっと betotto stickiness onomajbetotto

べとべと betobeto stickiness onomajbetobeto

べとり betori stickiness onomajbetori

へなへな henahena body onomajhenahena

べらべら berabera speak onomajberabera

ぺらぺら perapera speak onomajperapera

ほうほけきょ hoohokekyo nightingale onomajhoohokekyo

ほうほう hoohoo owl onomajhoohoo

ぽかぽか pokapoka weather onomajpokapoka

ぼきぼき bokiboki break onomajbokiboki

ぽきぽき pokipoki break onomajpokipoki

ぼきっと bokitto break onomajbokitto

ぽきっと pokitto break onomajpokitto

ぼきり bokiri break onomajbokiri

ぽきり pokiri break onomajpokiri

ほくほく hokuhoku feeling onomajhokuhoku

ぼたぼた botabota paint onomajbotabota

ぽたぽた potapota drop onomajpotapota

ぼたり botari paint onomajbotari

ぽたり potari drop onomajpotari

ぽたん potan drop onomajpotan

ぽっかり pokkari cloud onomajpokkari

ほっそり hossori body onomajhossori

ぽっちゃり potchari softness onomajpotchari

ほっと hotto feeling onomajhotto

ぽっぽ poppo pigeon onomajpoppo

ぽつぽつ potsupotsu rain onomajpotsupotsu

ぼにゃり bonyari inattention onomajbonyari

ぼにゃり bonyari absent onomajbonyari

ぼやぼや boyaboya absent onomajboyaboya

ほろほろ horohoro pheasant onomajhorohoro

ぽろぽろ poroporo cry onomajporoporo

ほんのり honnori smell onomajhonnori

まごまご magomago movement onomajmagomago

まるまる marumaru body onomajmarumaru

みいんみいん miinmiin cicade onomajmiinmiin

みしみし mishimishi rub onomajmishimishi

むかむか mukamuka breast onomajmukamuka

むかむか mukamuka mental state onomajmukamuka

むしむし mushimushi weather onomajmushimushi

むすっと musutto mental state onomajmusutto

むっと mutto mental state onomajmutto

312

Page 337: JChatman

29.3. 一覧表

むずむず muzumuzu mental state onomajmuzumuzu

めちゃくちゃ mechakucha disorder onomajmechakucha

めちゃめちゃ mechamecha disorder onomajmechamecha

めいめい meemee goat onomajmeemee

めそめそ mesomeso cry onomajmesomeso

もうもう moomoo cow onomajmoomoo

もりもり morimori eat onomajmorimori

やんわり yanwari softness onomajyanwari

ゆさっと yusatto rock onomajyusatto

ゆさゆさ yusayusa rock onomajyusayusa

ゆさり yusari rock onomajyusari

ゆらっと yuratto rock onomajyuratto

ゆらゆら yurayura rock onomajyurayura

ゆらり yurari rock onomajyurari

よちよち yochiyochi walk onomajyochiyochi

よろよろ yoroyoro body onomajyoroyoro

りいん riin sound onomajriin

りいんりいん riinriin homoegryllus japon onomajriinriin

りん rin sound onomajrin

りんりん rinrin sound onomajrinrin

わあん waan cry onomajwaan

わあっと waatto cry onomajwaatto

わあわあ waawaa cry onomajwaawaa

わいわい waiwai speak onomajwaiwai

わくわく wakuwaku feeling onomajwakuwaku

わんわん wanwan dog onomajwanwan

わんわん wanwan cry onomajwanwan

313

Page 338: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

29.4 品詞コード|JMOR Word Class Codes

29.4.1 形態素コード

品詞コード word class 品詞 例 コード化された例

adj Adjective イ形容詞 (形容詞) 長い adjjnaga-PRES

adj:adn Adnominal 連体詞 小さな adj:adnjchiisa-REL

adj:der Derived

Adjective

派生イ形容詞 飲みやすい adj:derjnom-yasu-

PRES

adj:mot Motherese

(Adjective)

幼児語 ばっちい adj:motjbatchi-PRES

adj:na Nominal

Adjective

ナ形容詞 (形容動詞) 静かだ adj:najshizuka-PRES

adj:na:der Derived Nomi-

nal Adjective

派生ナ形容詞 食べそうだ adj:na:derjtabe-soo-

PRES

adv Adverb 副詞 もっと advjmotto

co:g Communicator:

Greeting

挨拶用語 ありがとう co:gjarigatoo

co:i Communicator:

Interjection

肯否定語・間投詞など いいえ co:ijiie

conj Conjunction 接続詞 そして conjjsoshite

count Counter 序数詞 一枚 countjichi-mai

demo:adj Adjectival

Demonstrative

指示詞 (形容詞機能) その demo:adjjsono

demo:adj:va Adjectival

Demonstrative

指示詞 (形容詞機能) このような demo:adj:najkonoyoona

demo:adv Adverbial

Demonstrative

指示詞 (副詞機能) こう demo:advjkoo

demo:indef Inde�nite

Demonstrative

不定語 なにも demo:indefjnanimo

demo:n Nominal

Demonstrative

指示詞 (名詞機能) ここ demo:njindef

demo:wh WH

Demonstrative

疑問語 どこ demo:whjdoko

n Noun 名詞 リンゴ njringo

n:der Derived Noun 派生名詞 甘さ n:derjama-sa

n:mot Motherese 幼児語 アンヨ n:motjanyo

n:prop Proper Noun 固有名詞 ターちゃん n:propjTaachan

n:vn Verbal Noun 動作名詞 勉強 v:njbenkyoo

n:vn:mot Motherese (Ver-

bal Noun)

幼児語 ねんね v:n:motjnenne

314

Page 339: JChatman

29.4. 品詞コード|JMOR Word Class Codes

品詞コード word class 品詞 例 コード化された例

n:sn Sentence Nomi-

nalizing Noun

形式名詞 あいだ n:snjaida

num Number 数詞 三 numjsan

onoma Onomatopoeia 擬声擬態語 ジャブーン onomajjabuun

ptl:case Case Particle 格助詞 を ptl:casejo

ptl:conj Conjunctive

Particle

接続助詞 けど ptl:conjjkedo

ptl:�na Final Particle 終助詞 よ ptl:�najyo

ptl:top Topic Particle 提題助詞 は ptl:topjwa

ptl:tori Focus Particle 取り立て助詞 も ptl:torijmo

v Verb 動詞 食べる   v:vjtabe-PRES

v:c Consonant Verb 子音動詞 読む v:cjnom-PRES

v:c:der Derived Conso-

nant Verb

派生子音動詞   食べたがる v:c:derjtabe-DES-gar-

PRES

v:cop Copula 判定詞 だ v:copjda&PRES

v:ir Irregular Verb 変異動詞 する v:irjsur-PRES

v:v Vowel Verb 母音動詞 食べる v:vjtabe-PRES

v:v:der Derived Vowel

Verb

派生母音動詞 長すぎる v:v:derjnaga-sugi-

PRES

315

Page 340: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

29.4.2 JMOR形態素コード | JMOR Morpheme Codes

形態素コード 英訳 例 コード化された例

CAUS Causative 飲ませる v:cjnom-CAUS-PRES

食べさせる v:vjtabe-CAUS-PRES

COND Conditional 飲めば v:cjnom-COND

食べれば v:vjtabe-COND

かわいければ adjjkawai-COND

きれいであれば adj:najkiree&FML-COND

COND:tara \tara" Conditional 飲んだら v:cjnom-COND:tara

食べたら v:vjtabe-COND:tara

かわいかったら adjjkawai-COND:tara

きれいだったら adj:najkiree-COND:tara

きれいなら adj:najkiree-COND:nara

CONJ Conjunctional きれいに adj:najkiree-CONJ

かわいく adjjkawai-CONJ

DES Desiderative 飲みたい v:cjnom-DES-PRES

きれいでありたい adj:najkiree&FML-DES-PRES

FML Formal Form きれいである adj:najkiree&FML-PRES

IMP Imperative 飲め v:cjnom-IMP

食べろ v:vjtabe-IMP

IMP:POL Polite Imperative 飲みなさい v:cjnom-IMP:POL

食べなさい v:vjtabe-IMP:POL

きれいでありなさい adj:najkiree&FML-IMP:POL

INF In�nitive 飲み v:cjnom-INF

食べ   v:vjtabe&INF

INF:tari \tari" In�nitive 飲んだり v:cnom-INF:tari

食べたり v:vjtabe-INF:tari

かわいかったり adjjkawai-INF:tari

きれいだったり adj:najkiree-INF:tari

INF:te \te" In�nitive 飲んで v:cjnom-INF:te  

食べて v:vjtabe-INF:te

かわいくて adjjkawai-INF:te

きれいで adj: najkiree-INF:te

INT Intentitive 飲もう v:cjnom-INT

食べよう v:vjtabe-INT

316

Page 341: JChatman

29.4. 品詞コード|JMOR Word Class Codes

NEG Negation 飲まない v:cjnom-NEG-PRES

食べない v:vjtabe-NEG-PRES

かわいくない adjjkawai-NEG-PRES

きれいじゃない adj:najkiree-NEG-PRES

NEG Negation 飲まない v:cjnom-NEG-PRES

食べない v:vjtabe-NEG-PRES

かわいくない adjjkawai-NEG-PRES

きれいじゃない adj:najkiree-NEG-PRES

NEG:cont Contracted Negation 飲まん v:cjnom-NEG:cont&PRES

食べん v:vjtabe-NEG:cont&PRES

PASS Passive 飲まれる v:cjnom-PASS-PRES

食べられる v:vjtabe-PASS-PRES

PAST Past 飲んだ v:cjnom-PAST

食べた v:vjtabe-PAST

かわいかった adjjkawai-PAST

きれいだった adj:najkiree-PAST

POL Polite Form 飲みます v:cjnom-POL-PRES

食べます v:vjtabe-POL-PRES

きれいです adj:najkiree-POL-PRES

POT Potential 飲める v:cjnom-POT-PRES  

食べられる v:vjtabe-POT-PRES

食べれる v:vjtabe-POT:cont-PRES

PRES Present 飲む v:cjnom-PRES

食べる v:vjtabe-PRES

かわいい adjjkawai-PRES

きれいだ adj:najkiree-PRES

PRES:0 きれい adj:najkiree&PRES:0

PRH Prohibitive 飲まなくちゃ v:cjnom-PRH&INF&wa

食べなくちゃ v:vjtabe-PRH&INF&wa

かわいくなくちゃ adjjkawai-PRH&INF&wa

きれいでなくちゃ adj:najkiree-PRH&INF&wa

飲まなきゃ

食べなきゃ

かわいくなきゃ

きれいでなきゃ

REL Relative きれいな adj:najkiree-REL

317

Page 342: JChatman

第 29章 WAKACHI98 | 分かち書きガイドライン

gar がる 悲しがる v:c:derjkanashi-gar-PRES

食べたがる v:c:derjtabe-DES-gar-PRES

gata がたい 飲みがたい adj:derjnom-gata-PRES

kusa くさい 照れくさい adj:derjtere-kusa-PRES

古くさい adj:derjfuru-kusa-PRES

niku にくい 飲みにくい adj:derjnom-niku-PRES

ppo っぽい 飽きっぽい adj:derjaki-ppo-PRES

安っぽい adj:derjyasu-ppo-PRES

soo そうだ 降りそうだ adj:na:derjfur-soo-PRES

古そうだ adj:na:derjfuru-soo-PRES

sugi すぎる 飲みすぎる v:v:derjnom-sugi-PRES

古すぎる v:v:derjfuru-sugi-PRES

yasu やすい 飲みやすい adj:derjnom-yasu-PRES

yo よい 飲みよい adj:derjnom-yo-PRES

文献

� 小川芳男 (編) (1987) 日本語教育事典、東京: 大修館書店.

� Rickmeyer, Jens (1983) Morphosyntax der japanischen Gegenwartssprache, Heidelberg: J. Groos V.

� Trask, R. L. (1993) A Dictionnary of Grammatical Terms in Linguistics, London and New York:

Routledge

� Tsujimura, Natsuko (1996) An Introduction to Japanese Linguistics, Cambridge Mass: Blackwell.

� 綿巻 徹 (1993) 日本語MLU計算のための発話分割ガイド第2版.

� 横西正人 (編) (1993) 逆引き同類語辞典、東京: 東京堂出版.

318

Page 343: JChatman

第30章 第一版のあとがき|JCHATプロジェクト:組織、活動、今後の課題

大嶋百合子JCHATグループは、CHILDESに正確で質の高い 日本語のデータベースをつくり上げることを、主要目標

として 1993年 5月に結成された。この目標を達成するために、主として、次の三つの活動を行う。

(1) 日本語の入力方式及び基準を解説したマニュアルを作成する。

(2) 正確で信頼性の高いデータファイルが作成できるように種々の指導活動をする。

(3) 日本語にあった分析プログラムを開発する。

アンケート調査から、CHILDESに日本語のデータベースをつくりあげるためには、日本語にあった CHILDES

の入力方式 CHAT(JCHAT)を早急に確立する必要があることが分かった。そこで、JCHATグループの発足以

来、ローマ字による日本語の入力方式の開発が JCHATプロジェクトの活動の中心となっている。このマニュ

アルの出版によって、(1)の目標は、ある程度達成されることになる。

今後は、漢字、仮名を用いたデータファイルの入力方式の開発を計画している。(2)の指導活動については、

有志メンバーによる個人的指導や、電子メールネットワークを利用した指導を行っている。1995年 6月 30日

から 7月 2日までの 3日間、日本アップルコンピュータ社の協力で、東京の千駄ヶ谷のアップルトレーニング

センターで、CHILDES のデイレクターMacWhinney 氏を迎えて、実技演習を含めたワークショップを行う。

これにより、多くのメンバーにデータの正しい入力方法を、習得してもらうと同時に、有能な指導員を育てて、

今後の指導活動に貢献してもらう。

また、将来、指導センターを作り、CHILDES に提供されたデータファイルの検査も含む組織的な指導活

動を行うことが計画されている。(3) の日本語のための分析プログラムの開発 については、既に、中氏が、

MacWhinney氏と協力して仮名データファイルから、ローマ字表記へ変換、及び、ローマ字ファイルから、仮

名ファイルへの変換ファイル JCHANGEを開発した。現在、日本語の発話文を形態素に自動的に分割するプ

ログラム JMORを開発中である。2年以内に、

1. JCHANGE, JMORプログラムの実用化。

2. 漢字仮名混じり文のデータファイルをローマ字ファイルへ変換するプログラムの開発と実用化。

3. 異なる方式で入力された漢字仮名混じり文のデータファイルを、CHILDESのデータファイル方式にあうよ

うに自動的に分かち書きするプログラムの開発と実用化 (たとえば、JUPITAと JCHATのトランスレー

ターの開発)。

4. 既にある CHILDESの分析プログラムを、ローマ字ファイルに変換しなくても、仮名ファイル や漢字仮名

混じり文のファイルに直接使える様にする。

というのが、今後の主な達成目標である。また、日本語形態素自動分割プログラム JMORの開発に必要な日

本語の発達測度に関する基礎的研究も計画されている。以上三つの活動に加え、日本語の獲得及びそれに関

連した文献をコンピュータ化し、文献のデータベースを作成するグループを組織することも計画されている。

JCHATプロジェクトの指導のもとに作成された日本語のデータベース、分析プログラム、文献のデータ ベー

スは、他の CHILDES のデータベースやプログラムと同様に、Carnegie Mellon大学の CHILDESにおさめら

れ、CD-ROMやインターネットなどを利用して世界中の CHILDESメンバーに配布される。

319

Page 344: JChatman

第 30章 第一版のあとがき|JCHATプロジェクト:組織、活動、今後の課題

JCHATの入会に関しては特に制限はなく、CHILDESを利用した日本語の発達研究に関心があれば、そして、

CHILDESのメンバーとしての基本的なルールを守るのであれば、誰でも入会できる。JCHATプロジェクトの

活動のアナウスメントやメンバー間の情報交換は、JCHATプロジェクトの電子メールネットワーク (JCHAT-

LIST)を通じて行う。CHILDESの CD-ROMは、原則として、CHILDES、JCHATのメンバーには、無料で

配布される。ただし、無断で、CD-ROMおよびその一部のコピーを配布してはいけない。CHAT/JCHAT、

CLANプログラム、CHILDESのデータベースを用いて論文を発表する場合は、必ずその使用を明記する。た

とえば、CHILDES一般については、MacWhinney & Snow(1985)、MacWhinney (1995)を、このマニュアル

を使用した場合は、日本語では、大嶋、MacWhinney (1995)、 英語では、Oshima-Takane & MacWhinney

(1995)を引用するとよいだろう。CHILDESのデータベースの引用については、このマニュアルの第 19章、英

語のマニュアルの第 25章を参照してほしい。CD-ROMには CLANプログラム、データベース、マニュアルが

入っている。CHILDESか MacWhinney氏に連絡すると、無料で送られてくる。 CLANプログラム、CED、

データベース、マニュアルは、FTPで、カネギーメロン大学から直接取り寄せることもできる。FTPの利用

の仕方については、英語のマニュアルの 25章に詳しく説明されている。CLANプログラムのバグレポートや

問い合わせは、Brian MacWhinney氏、あるいは、中氏にしてほしい。

以下に、CHILDESプロジェクトと JCHATプロジェクトの連絡先を示す。

� CHILDESプロジェクト

連絡先 Child Language Data Exchange System

Department of Psychology

Carnegie Mellon University

Pittsburgh, PA 15213 USA

email: [email protected] [email protected]

Brian MacWhinney: [email protected]

URL: http://childes.psy.cmu.edu/

� JCHATプロジェクト

{ 日本国外連絡先

Yuriko Oshima-Takane

Department of Psychology

McGill University

1205 Dr. Penfield Avenue

Montreal, PQ H3A 1B1 Canada

Phone: 514-398-4672

email: [email protected]

{ 日本国内連絡先

Susanne Miyata 宮田 Susanne

Department of Communication 〒 464-8671 愛知県

Aichi Shukutoku Junior College 名古屋市千種区桜ガ丘 23

23 Sakuragaoka, Chikusa-ku 愛知淑徳短期大学

Nagoya 464-8671 Japan コミュニケーション学科

Fax: 052-783-0073

email: [email protected]

320

Page 345: JChatman

Norio Naka 中則夫

Department of International 〒 564 大阪府

Kokusai Gakubu 吹田市岸部南 2-36-1

Osaka Gakuin University 大阪学院大学 国際学部

Phone: 06-381-8434

email: [email protected]

� JCHAT-LIST連絡先:

Hiromi Morikawa-Paul

Center for Life Span Studies

University of Kansas

Lawrence, Kansas 66045 USA

Phone: 913-846-0528

email: [email protected]

� JCHAT-LIST:

[email protected]

文献

1. MacWhinney, B. & Snow, C. (1985). The Child Data Exchange System. Journal of Child Language,

12, 271-276 .

2. MacWhinney, B. & Snow, C. (1990). The Child Data Exchange System: Update. Journal of Child

Language, 17, 457-472 .

3. MacWhinney, B. (1995). The CHILDES Project: Tools for Analyzing Talk.,Second Edition. Hillsdale,

N.J.: Lawrence Erlbaum Associates.

4. 大嶋百合子・Brian MacWhinney (1995). 「日本語のための CHILDESマニュアル」マッギル大学 (英語

の場合は、Oshima-Takane, Y. & MacWhinney, B. (1995). CHILDES Manual for Japanese. Montreal:

McGill University).

5. Sokolov, J. & Snow, C. (1994). Handbook of research in language development using CHILDES. Hillsdale,

N.J.: Lawrence Erlbaum Associates.

321

Page 346: JChatman
Page 347: JChatman

第31章 改訂版のあとがき

白井 英俊第一版の JCHATマニュアルが出てから 3年もたたないうちに、CHILDES/JCHATをとりまく環境はめざ

ましい変化を遂げた。まず、CHILDESのディレクターのMacWhinneyらの努力により、CLANの機能があが

り、例えば Macintoshでしかできなかったようないろいろな機能がWindows 95/NTを OSとするコンピュー

ターでもできるようになった。また、コンピューター自体もより速く、安く、機能も強力になり、ハードディ

スクもメモリも大きなものが使えるようになった。ちょっと前では音声ですらコンピューターに取り込むには

特殊な機器が必要であったが、今やコンピューターはどんどんマルチメディア化して、音声だけではなく画像

やビデオも取り込めるようになって来ている。さらにインターネットの普及により、いながらにして世界中の

いろいろな資源 (ソフトウェア、データ、論文などのアイデア)を駆使できるようになってきた。

このように研究環境はどんどん変化している。JCHAT自体もこの変化に対応すべく、宮田さんと中さんの

尽力により独自に CD-ROMを製作したり、また独自のホームページ http://jchat.sccs.chukyo-u.ac.jp/

を持って会員の情報交換やデータの普及などに供するようになった。また、手前味噌であるが、かな漢字混じ

りでかかれた CHATファイルをメールで送れば (アドレスは [email protected])、ロー

マ字変換して返してくれるサービスも行われている1。

今からほぼ一年前に、第一版のマニュアルの在庫がほとんどなくなった。それを機に、マニュアルを HTML

化し、あわせてHTML化してあった英語版のマニュアルとリンクをはり、オンラインで (もしくは CDROMを

使って) マニュアルを見ることができるようにした。しかし、印刷物としてのマニュアルの要求は根強くあった。

改訂版を作る直接のきっかけとなったのは、1998年の JCHAT/CHILDESの年次総会でチュートリアルを

開くのを機に 6月ころ宮田さんが「作ろう」と言い出したことであった。それに不用意に「手伝うよ」と言っ

たのが運のつきで、作業の意外な多さと増分となるべき原稿のできあがりの遅れに悩まされながら、ほぼ 2週

間あまりその作業にかかりきりとなった。作業に協力いただいた純子さん、菊地君、渡辺君、木畑さん、古田

君に感謝する。

改訂版と第一版の違いを思いつくまま以下に列挙する。

� LATEXを用いて原稿を作成した。LATEXを使うと索引が容易にできる上、PDF2にするのも簡単である。

ページを通し番号にし、また索引をつけた。

� マニュアルのサイズを B5にした。第一版は A4であったため、コンピューターの横に置いて参照するに

は大きすぎた。

� 第一版の誤りのいくつかを修正した。また同時に現在の CLANには合わないような記述を削除、訂正を

行った。

1かな漢字混じりで書かれたメールを [email protected] に送れば一般のファイルでもローマ字にしてくれる。2PDF とは Adobe 社が提案するドキュメントファイルの形式であり Portable Document Format の略である。コンピュー

ターの機種によらず PDF ファイルを読むためのソフト (Acrobat Reader) がインターネットを通して無料配布されている(http://www.adobe.com/acrobat/)。ウェブブラウザと同様にファイルの内部や別な PDF ファイルへリンクをはったり、画像などもとりこめるようになっている。高品質でありながらファイルの大きさが小さくできるという特徴を持つ。PostScript形式で書かれた文書との変換も容易である (Adobe 社が提供する Acrobat Distillerソフト以外に、フリーソフトとして pdf2ps, ghostscriptがある)。今では CHILDESのマニュアルだけではなく、さまざまな文書 (説明書、学部の紀要のようなものまで)が PDFファイルとして作成されている。PDFファイルを作成するには、Adobe社の Acrobatを購入することが必要であるが、作成自体はワープロソフトに依存せず容易である。

323

Page 348: JChatman

第 31章 改訂版のあとがき

特にこれは 1997年あたりで CHILDESにおいていくつかの記号の変更があったり、CLANが新しい版

になったりしたので、必要なことであった。

� CLANが新しくなったことにより、19章、20章を新たに付け加えた。

漢字仮名混じりの CHATファイルを使えるようになったことも大きい。

ただ時間の制約から、CLANのコマンドやオプションについてはマニュアルに加えることができなかっ

た。第三版ではぜひ取り込んでほしいものである。また、JCHANGEについて書かれた章も中さんの申

し出により削除した。

� 宮田さんと中さんにより、わかち書きの規則の整備が行われた。これはお二人が開発して来た JMOR を

有効に使うためでもあり、その成果は、6章の大幅なカットや、29章、付録 Cに現われている。

最後に、現在の JCHATの活動を紹介しよう。大きくわけると、JCHATの活動は次の七つにわけられる。

1.会としての一般的な運営|会員名簿やメーリングリスト (jchat)の管理など。

2.技術講習の開催や、メーリングリスト (J2-list)によるチュートリアルサービスなどの技術指導活動

3.年次総会などの研究発表やワークショップーの開催

4.出版活動

5.文献データベースおよびコーパスデータベースの作成

6.特に日本語のデータを効率よく処理するためのツール開発

7.国際科研など、研究プロジェクトの発展

JCHATの活動に関して重要な決定は、activeと呼ばれるメンバーによって行われる。この activeメンバー

は、以下のように実行委員会メンバーとサポートスタッフからなり、任期は最短一年で、次の条件を満たすも

のに限られている。

� 実行委員会メンバー (Executive committee member)

以下の3条件を満たし、JCHATの様々な活動や方針について、打診、打ち合わせ、決定に参加する。

(1) activeに投稿されたメッセージには、かならず目を通す。

(2) 日本語のメールが多いので日本語のメールも読めるようにする。投稿は、日本語でも、英語でもど

ちらでもよい。

(3) 打ち合わせ、コメントが目的のメッセージに対しては、敏速に何らかの意思表示をする。

(4)いつでも実行委員として参加できるが、すくなくとも一年は続ける。

年次総会の時に、その後一年間の実行委員会メンバーを確認する (年次大会準備委員会メンバーも含む)。

� サポートスタッフ (Supporter)

(1)-(2)実行委員会メンバーと同じ条件である。

(3) activeメンバー当てのメールに対してコメントは出す義務はないが、プロジェクトの動向を随時知っ

ておいて、たとえば以下のような点で貢献する。

{ ワークショップの時に、スタッフとして手伝う

{ 共同で研究助成の申請をする

{ マニュアル著者

{ マニュアルの改訂原稿のコメンター

{ JCHAT.BIBの文献サーチを手伝う

{ プログラムのバグのテスト

{ その他

324

Page 349: JChatman

現在のところは JCHATは会費を集めていない。これまでの活動は、メンバーのボランティア、寄付、グラン

トにより、進められている。ボランティアはいつでも名乗りでていただきたい。一人でも多く activeメンバー

が増えることが、JCHATの活動、ひいては日本における第一言語習得研究、第二言語習得研究、談話研究に

貢献することにつながると考える。

325

Page 350: JChatman
Page 351: JChatman

付 録A 記録、電子化、書き起こしの技法

白井 英俊データの記録と書き起こしのための機材や技法について述べる。四つほど重要なことを指摘する。それは、

第一に、やりとりがなるべく自然になるよう記録の取り方を工夫すること、第二に背景雑音をなるべく避ける

こと、第三に書き起こしに品質の高さを求めるならば高品質の記録機材や再生機材を使うことが要求されると

いうこと、第四に書き起こしやコード化のためにエディターに習熟することの重要さである。本章では記録や

書き起こしのための特定の機材などを推薦することも行う。

A.1 記録のための技法

小さな外部マイクがついた小さいポータブルの録音器を使えば自然なやりとりに干渉する度合を最小にする

ことができる。その時内部バッテリーを使っているならば、記録を取り始める前に録音レベルを確かめておい

た方がよい。そして、記録を取り始めた後では録音器の調整をしないようにすべきである。使っている機器に

習熟していれば、それが機能しているかどうか心配することはないはずなので、一旦セットしたら、後はなる

べくそのことを忘れることである。また道路の近くや外部雑音の多いところでの録音は避けた方がよい。

録音中は、マイクをどこかにぶつけたり、コードをひっぱったりすることにより、自然なやりとり以外の要

因による余計な雑音をたてないよう注意すべきである。マイクをなるべく見えない場所に置いて、子供がマイ

クに直接話しかけたりしないようにしよう。音量レベルは音が歪まないようなレベルに調整しておこう。音量

メーターの針が決してレッドゾーンに入らないように調整しておこう。

録音器をノートとして使うこともできる。つまり、子供が話しておらず、自分と別な部屋に居る時に、注釈

を直接吹き込んで録音することができる。録音を取り始める時にまず、その日の年号と日時、子供の名前、状

況などを録音しておこう。こういう習慣は間違ったラベルを付けてしまった時にテープの内容を確認するのに

役にたつ。

あちこち動き回るひとかたまりの子供たちの記録を取ろうとする場合は、それぞれの子供に対して別々のマ

イクと別々のチャネルを割り当てる必要があるだろう。二人の子供だけを見る場合なら、ステレオ録音できる

録音器が一個で足りる。子供の数がそれよりも多い場合は、別々の録音器が必要となる。そして書き起こしの

時にすべてのテープの時間合わせをするという問題に直面することになるだろう。

子供たちが動き回っている時は、録音器を持って子供たちを追いかけるのは不可能に近い。このような場合

には、無線マイクを使うことが解決策として考えられる。

A.2 録音機材

一昔前では高品質のポータブルな録音機材は値段も高く入手困難であったが、今では幸いなことに、値段も

安くなり、しかも手に入りやすくなった。使いやすく品質の高い物としては録音再生可能なポータブルMD(ミ

ニディスク) がお勧めであるが、カセットテープレコーダーならば録音再生可能なポータブルのWalkmanタ

イプのものがよい。もしも DAT(Digital Audio Tape)を好むならば、Sonyの TCDがいいだろう。録音器に

求められる機能としてはテープカウンター (ディジタル録音の場合は不要)、高い S/N(信号対雑音)比、周波数

領域の広さがある。録音レベルをモニターするため録音メータがついていることを望むかもしれないが、そう

327

Page 352: JChatman

付 録 A 記録、電子化、書き起こしの技法

いう行為はやりとりの自然さを損なう可能性に注意すべきである。

録音器の内蔵マイクは使うべきではない。こういうマイクは必然的に録音器のモーターの音を拾ってしまう

からである。小さな外部マイクを使えば、会話の自然さを損なうことなく、記録を停止したり再開したりでき

る。どのような時に会話を録音するか、子供の目から録音機材を隠すべきかどうか、という決定はプロジェク

トの目的にも大きく依存する。この問題に対する考察は Clark(1976)を見て欲しい。

たとえ有名な会社のものであっても、低品質の録音材料を使わないように注意すべきである。カセットテー

プならば、高品質のメタル以外のテープを使うようにしよう。メタルテープはかなり値段が高く、それにして

は高品質のテープとほとんど性能に差は無い。ほとんどの用途に最適な長さは 90分のものであり、これはほ

とんどの店においてある。マイクロカセットは使ってはいけない。

A.3 書き起こしのための機材

記録された音を再生するのはヘッドフォンでもスピーカーでもよいが、高品質を保ちつつ安上がりな方法は

ヘッドフォンを使うことだろう。スピーカーを使うと、自然な子供のやりとりでは泣き声、叫び声はざらであ

るから、まわりの人達への迷惑になりかねない。どのようなヘッドフォンを使うかは個人により好みがある。

軽いウォークマンタイプのヘッドフォンが好みの人もいる。これは手軽であるが、周囲に音を撒き散らしたり、

周囲の音が侵入したりしやすいため、聞き取りに問題を起こす場合がある。長い時間にわたって書き起こしを

するほとんどの人は密閉式のヘッドフォンを好むようだ。軽く楽な、かつ密閉される式のヘッドフォンも手に

入れられる。どんなタイプのヘッドフォンを使うかは、書き起こしをする環境による。部屋が静かであれば、

軽い方がいいだろう。そうでなければ、重いけれども耳を密閉する方式のヘッドフォンが必要となるだろう。

高品質の書き起こしの機材を使うことが重要である。よい機械を使えば、同じ部分を繰り返し聞くのもやり

やすい。このために足踏み式でテープを巻き戻しする機械がある。ペダルを足で操作できるので、手をキーボー

ドから離す必要がない。ペダルを足から離せば、自動的にテープがリプレーされるという機能を使うと、聞き

取りにくい語でも何回でも繰り返して聞き取りしやすい。Sony BM-77などの現在の機器は、巻き戻すテープ

の量をコントロールできるようになっていて、信頼性が高い。またこのような機器は、聞き取りのためスピー

ドを遅めにすることも可能である。同様のことが可能なビデオ機材があるかどうかは不幸にして知らない。し

かしながら、ビデオからの書き起こしの場合、4ヘッドのビデオカセットレコーダーならばかなり高品質な静

止画を得られる。これにより非言語行為に注目した書き起こしが可能になる。

書き起こしをさらにやりやすくするには、コンピューターに音声処理させることが考えられる。そのため開

発した物が CLANエディターの Sonic CHATモードである。ただし、これにはちょっとした投資が必要であ

る。しかし、現在のコンピューターはますますマルチメディア化しているので、Sonic CHATを使って書き起

こしするために必要な費用はわずかなものになっている。

A.4 音声のデジタル化

テープなどで録音された音声をデジタル化する (コンピューターで扱える形に変換する)にはMacintoshでは

SoundEdit 16というプログラムをお勧めする。このプログラムはMacroMedia社 (http://www.macromedia.com/)

の製品で、ほとんどのコンピューターショップで手に入る。不幸なことに値段は段々高くなっており、SoundApp1のようなフリーウェア2が好きだ、という人もいるだろう。また、MDやテープレコーダーとMacintoshとを

つなぐための標準的なミニステレオジャックがついたケーブルも必要である。少なくともMacintoshは 16ビッ

トデジタル化可能なものでなければならない。CPUが 680X0で \AV"という名前がついたものか、CPUが

1http://www.naotaka.com/SoundApp/からダウンロード可能である。2フリーウェアは、値段は無料だが、技術サポートがないことが多く、自己責任で使うことが要求される (保証がないということ)。そ

れに対し、シェアウェアは無料のお試し期間があり、それを越えて使い続ける場合にライセンス料金を払う方式のソフトのこと。パッケージも印刷されたマニュアルもついていないが、値段は安い。フリーウェアもシェアウェアも、一般にインターネットなどで入手できる。http://www.goo.ne.jp/のようなインターネットを検索するページを使って調べてみるといいだろう。

328

Page 353: JChatman

A.5. ビデオのデジタル化

PowerPCのMacintoshならばこの機能がついている (つまり、最近のものはすべてそうなっている)。これら

が準備でき、Macintoshなどの機器の電源を入れ、MDやテープレコーダーなどの再生器3と Macintoshとを

ケーブルでつないだならば4、音声ファイルをデジタル化するには以下のステップを実行すればよい。

1. SoundEdit 16 のアイコンをクリックして、SoundEdit 16を起動する。

2. すると、SoundEdit 16は \Untitled-1"という名前のウィンドゥを開く。これが記録のためのウィンドゥ

である。

3. \Sound"メニューから \Sound Format"を選び、録音設定を 16ビット、22050 KHzにセットする。デフォ

ルトではステレオではなくモノラルになっている。チェックボックスをクリックして、その設定をデフォ

ルトとして保存する。

4. \Sound" メニューから入力ソースを選び、 \Recording Options"をマイクロフォンにする。

5. \Windows"メニューからコントロールパレットを開け、そこの \Record"を押すと同時に、録音器の再生

を始める。

6. Macintoshで録音中は、音量が緑の範囲にあって、ほとんどレッドゾーンにはいらないようになっている

かをチェックする。

7. 録音が終れば、コントロールパレットの \stop"を押して停止する。

8.テスト録音が終わったら、@-A5を使ってテスト録音の部分全てをハイライト化し、\delete"キーを押して

消去する。

9. 同様にして、さらに数分間データをMacintoshに取り込んでみる。そして、どの部分をどのくらいの長さ

録音するかを決める。

10. 録音が終了すれば、ファイルをセーブする。Macintoshの CLANエディターで sonicモードで使うには

SoundEdit 16形式 (これがデフォルトである)でセーブする。Windowsの CLANエディターで Sonicモー

ドで使うには、WAVE形式を選ぶ。

11. SoundEdit 16を終了する。

以上、Macintoshでの操作について述べたが、OSをWindows 95/NTとするいわゆる DOS/Vマシン (ノート

ブックも含む)で同様のことをすることは可能である。Windows 95/NTの場合は、Sound Edit 16の代わりに

シェアウェアの Cool Editや Goldwave6が使える。Windows 95/NT用の CLANエディターはWAVE形式の

音声ファイルを使う。Macintoshの音声ファイルは使えないので注意すること7。

A.5 ビデオのデジタル化

本節ではビデオテープに録画録音された会話データをデジタル化するための基本的な情報を提供する。それ

には以下のような機器が必要となる。

1. 録画されているビデオテープ。どのような機器を使っていても構わない。ただしビデオカメラを使って記

録された音を使うのだから、音質に注意を払うこと。カメラとは別にマイクを使って録音することをお勧

めする8。

2.ビデオの再生装置。モニターもあれば、必要ではないがあると便利だろう。VCRがついた TVや、液晶

ディスプレーがついたビデオカメラでもよい。

3ただしこの場合、再生器は高品質のものであればあるほとよい。宮田さんによれば、MDでさえも DATの方がよいデジタル化された音声データが得られる。

4テープレコーダーなどの場合はケーブルをスピーカーもしくはヘッドフォンのジャックに差し込む。Macintoshには外部音声 (マイクロフォンの形が書いてある)のジャックに差し込む。

5@は Macintoshの Commandキー (Appleのマークが入っているキー) を表すものとする。6Windows 95/NTのシェアウェアについての情報は窓の杜 http://www.forest.impress.co.jp/にアクセスしてみて欲しい。7SoundEdit 16 形式の音声ファイルを WAVE形式にする、またはその逆をすることは、ここであげたソフトウェアを使えば可能で

ある。8デジタルカメラの音質は DATと同じように高品質であるが、カメラにマイクがついているため、音声がきれいに捉えられるか疑問

がある。

329

Page 354: JChatman

付 録 A 記録、電子化、書き起こしの技法

3. AV入力のある PowerPCの Macintoshで、速い CPUとアクセスの速いハードディスクを持ったもの。

MacWhinneyのところでは 1996年代製造のMacintosh 8500/180を使っている。それよりも古いMacintosh

や AVでないはパフォーマンスをあげるため、ビデオカードやビデオボードが別途必要になるだろう。

4. 2本以上がセットになった RCA同軸ケーブル9。これはビデオの音声と画像の出力をMacの音声と画像の

入力につなぐためのものである。

5. Fusion Recorder 1.1というソフトウェア。このソフトは 1995年に Appleがフリーウェアとして配布してい

た。もはやこのソフトはサポートされておらず、それを作った会社も存在していない。Appleもまた Avid

と Strataによる同じ機能を持ったプログラムを配布している。

6. CD-ROMを作るための CDRか、650MBの容量を持つMOか、PD、もしくは DVD-RAM。これらは大

抵 SCSIによって接続される。画像データは膨大なものになるので、それらを保存するための機器が必要

である。

7.最後に、上記の機器、すなわち、CDRやMO、PD、DVD-RAMに対応した保存用のメディアが必要であ

る。書き込み可能な CD-ROMは最近かなり安くなって来た。たくさん買えば、一枚 200円以下で手に入

るだろう。それに対し、MOや PD、DVDはまだかなり高価である (一枚 1000円くらいはするだろう)。

もちろん記録用に保存しないのであれば、これらの機器やメディアは必要ない。また大きなハードディス

クを持っているのならなおさらである。しかしながら大規模なプロジェクトになればなるほど、このよう

な機器の必要性は高くなる。

以上あげた機器を設定したならば、Fusion Recorderを起動し、ビデオの再生を始めよう。そうすれば、Record

Windowにビデオ画像が写るだろう。Fusion Recorderで必要なオプションは \Record"メニューだけだろう。

MacWhinneyによれば最適の値は以下のようになっている。

1. Record Windowのサイズを 3/8にする。

2. Videoを Onにする。

3. \Video Settings"において以下の設定を行う。

� Compression(圧縮率): Video, 75% quality, 15 frames/sec, key every 15 frames

� Image and Source: 入力が PAL方式でなければ、デフォルトでよい10。

� Sound Setting: 22K, 16 bit モノラル、ゲイン 100

� Record preferences: ディスクに記録、post-compression(後で圧縮) on, 残り時間表示

4.ビデオの再生を開始し、すぐに記録 (record)ボタンを押す。

5. Record Windowに表示される残り時間をモニターし、ディスクを使い切らないように注意する。MacWhin-

neyのところでは、2GBのハードディスクを使っていて、そのうちの 1.3GBをこの作業にあけてある。

ハードディスクの残り容量が足りないのなら、作業の前にディスクの最適化などを行った方がよいかもし

れない。

6. 5分から 10分録画したならば、録画を停止する。

7. Fusionソフトに後圧縮 (post compression)を行わせる。これには録画した時間と同じくらいの時間がか

かる。

8.ファイルをディスクにセーブし、Fusionを quitする。

以上の設定を用いて、MacWhinneyはそれぞれ 10分程度の長さの、Mike Forresterによる数学の講義を写し

た二つの小さな画面の QuickTimeムービーのサンプルを作成した。画質はオリジナルのテープよりも悪かっ

たが、動きはまずまずで、会話や人の動作についていきやすいものであった。10分間の録画ファイルの大きさ

9このようなケーブルはビデオカメラなどに標準的についていることがある。ビデオ信号が黄色、音声が赤と白の三本セットのケーブルが一般的である。しかし、Macの音声入力はモノラルなので、左か右の音声だけを入力とするか、もしくは左と右の音声をミックスしたものを入力とするかを選ばなければならない。後者の場合は、少し特殊なケーブルが必要となる。

10日本とアメリカのビデオ信号は NTSC、それに対してヨーロッパなどは PAL方式をとっている。両者の方式では走査線の数などが違う (PAL方式の方が線が多くきれいである)ため、ヨーロッパのビデオを日本のテレビで見たりすることは一般にできない。

330

Page 355: JChatman

A.5. ビデオのデジタル化

は 120MB程度であった。このことから、CD-ROMには 50分程度のビデオが録画できる計算になる。将来的

には MPEG2や DVD-ROMを用いてもっと状況を改善することができるだろう。それにもかかわらず、現状

でも基本的にはよい結果が得られている。

331

Page 356: JChatman
Page 357: JChatman

付 録B 日本語マニュアルと英語マニュアルの対照表

英語のマニュアルは、新しい機能が CLANや CLANエディターに取り込まれるたびに常に更新されている。

これは 1998年の 3月 8日に作成されたマニュアルに基づいている。英語のマニュアルは CHILDESのホーム

ページ ( http://childes.psy.cmu.edu/childes/) においてあるが、日本国内のミラー

http://jchat.sccs.chukyo-u.ac.jp/childes/

からも取り寄せることができる。

英語マニュアル 日本語マニュアル

第 1章 Principles of Transcription 第 1章トランスクリプト作成の方法

第 2章 The CHAT Transcription System 第 2章 表記システム CHAT

なし 第 3章 ローマ字表記:ヘボンと訓令

第 3章 File Headers 第 4章 ファイル・ヘッダー

なし 第 5章 分かち書き

第 4章 Transcribing Words 第 6章 語をどのように転記するか

第 5章 Transcribing Morphemes 第 7章 メイン・ラインに形態素をどのように

表記するか

第 6章 Utterances and Tone Units 第 8章 発話の区切り方と調子単位

第 9章 語内の韻律

第 7章 Scoped Symbols 第 10章 スコープ記号

第 8章 Dependent Tiers 第 11章ディペンデントティア

第 9章 Adapting CHAT for special topics なし

第 10章 UNIBETs 第 12章 日本語のための UNIBET

第 11章 PHONASCII なし

第 12章 Error Coding 第 13章 日本語のためのエラー・コーディン

第 13章 Speech Act Codes なし

第 14章 Morphosyntactic Coding 第 29章 WAKACHI98 | わかち書きガイド

ライン

第 15章 Examples of Transcribed Data 第 14章 JCHATファイルの具体例

第 16章 Recording, Digitization, and Tran-

scription Techniques

付録 A

第 17章 Chat Symbol Summary 第 15章 JCHAT記号一覧表

第 18章 Introduction to CLAN 第 19章 CLANチュートリアル

第 19章 CLAN tutorial 第 19章 CLANチュートリアル

なし 第 17章 日本語のスクリプト: 文字体系

第 20章 The Editor 第 16章 CLANエディターによる入力

第 20章 CLANエディター

333

Page 358: JChatman

付 録 B 日本語マニュアルと英語マニュアルの対照表

英語マニュアル 日本語マニュアル

第21章 CHAINS| Sequences of Interactional

Codes

27.1節

第 22章 CHECK | Verifying Data Accuracy 第 21章

第 23 章 CHIP | Analysis of Interaction |

Je� Sokolov

27.2節

第 24 章 CHSTRING | Altering Strings in

Files

27.3節

第 25章 COMBO | Boolean Searching 第 22章

第 26章 COOCCUR | Cooccurence Analysis 27.4節

第 27章 DIST | Distances Between Codes 27.5節

第 28 章 DSS | Developmental Sentence

Score

27.6節

第 29章 FREQ | Frequency Counts 第 23章

第 30章 GEM | Tagging Interesting Passages 27.7節

第 31章 KEYMAP | Contingency Analysis 27.10節

第 32章 KWAL | Key Word and Line 第 24章

第 33章 MAXWD | Tracking String Length 27.11節

第 34章 MLT | Mean Length of Turn 27.12節

第 35章 MLU | Mean Length of Utterance 第 25章

第 36章 MODREP | Matching Words Across

Tiers

27.13節

第 37章 MOR | Morphological Analysis 27.14節 (改変あり)

第 38 章 PHONFREQ | Phonological Fre-

quency Analysis

27.15節

第 39章 RELY | Measuring Code Reliability 27.16節

第 40章 SALTIN | Converting SALT Files 27.17節

第 41章 STATFREQ | Outputting to Statis-

tical Analysis

27.18節

第 42章 TEXTIN | Converting Unstructured

Text to CHAT

27.19節

第 43章 TIMEDUR | Quantifying pauses and

overlaps

27.20節

第 44章 WDLEN | Graphs of Word Length 27.21節

第 45章 CLAN Options 第 26章

第 46章 Utilities 28章

第 47章 Word Lists なし

第 48章 CHILDES/BIB and LEX なし

第 49章 The Database 第 18章

第 50章 Research Based on CHILDES なし

第 51章 Future Directions なし

(注) 第一版の JCHATマニュアルには英語版の第 21章から第 45章にあたる部分はあるが、現在の CLANに

はあてはまらない部分が多くある。

334

Page 359: JChatman

著者一覧

� Iwatate, Shizuo 岩立志津夫

Department Kindergarten Education 〒 422 静岡市大谷 836

Shizuoka University 静岡大学教育学部

836 Ohya Shizuoka-shi, 422 Japan

E-MAIL: [email protected]

� MacWhinney, Brian

Department of Psychology

Carnegie Mellon University

Pittsburgh, PA 15213 USA

E-MAIL: [email protected]

� Minami, Masahiko(南雅彦)

Foreign Languages and Literatures,

College of Humanities

San Francisco State University

1600 Holloway Avenue, San Francisco, CA 94132

E-MAIL: [email protected]

� Miyata, Susanne 宮田 Susanne

Department of Communication 〒 464-8671 名古屋市千種区桜が丘 23

Aichi Shukutoku Junior College 愛知淑徳短期大学

23 Sakuragaoka Chikusa-ku コミュニケーション学科

Nagoya, 464 Japan

EMAIL: [email protected]

� Morikawa-Paul, Hiromi (森川尋美)

Department of Human Development and Family Life

University of Kansas

Lawrence, KS 66045 USA

EMAIL: [email protected]

� Naka, Norio 中則夫

Department of International 〒 564 大阪府吹田市岸部南 2{36{1

Kokusai Gakubu 大阪学院大学国際学部

Osaka Gakuin University

EMAIL: [email protected]

� Ogura, Tamiko 小椋たみ子

Department of Human Development 〒 657 神戸市灘区鶴甲 3{11

Kobe University 神戸大学発達科学部

3{11, Tsurukabuto, Nada-ku

Kobe-shi, 657 Japan

EMAIL: [email protected]

335

Page 360: JChatman

付 録 B 日本語マニュアルと英語マニュアルの対照表

� Oshima-Takane, Yuriko(大嶋百合子)

Department of Psychology

McGill University

1205 Dr. Pen�eld Ave

Montreal, PQ H3A 1B1 Canada

EMAIL: [email protected]

� Sirai, Hidetosi 白井 英俊

School of Computer and Cognitive Sciences 〒 470-0393 豊田市貝津町床立 101

Chukyo University 中京大学情報科学部

Tokodate 101, Kaizu-cho,

Toyota 470-0393 Japan

EMAIL: [email protected]

� Terao, Yasushi 寺尾 康

Department of General Education 〒 420 静岡市瀬名 2{2{1

Tokoha Gakuen College 常葉学園短期大学

2{2{1 Sena Shizuoka-shi, 420 Japan 教養教育科

EMAIL: [email protected]

336

Page 361: JChatman

付 録C Wakachi98用レファレンス

形態素 ローマ字  例 参照項目

(息を吸う) ss ss , kore wa chotto . . . 感動詞ああ aa aa taihenda . 間投詞ああ aa aa yatte furimawasu kara . 指示副詞ああいう aayuu aayuu yarikata tte dameda yo . 指示形容詞ああいうふう aayuufuu kore wa aayuufuuni yaru nda yo . 指示形容詞アール aaru aaru@lr o kaite ! 名詞アイ ai ai@lr o kaite ! 名詞あいだ aida kaiteiru aida ni kizuita . 形式名詞あいだ aida aida ga aku to yokunai . 名詞あげる ageru kore ageru . 母音動詞あげる {ageru kaiteageru wa . テ型複合動詞あげる V+ageru mochiagerarenai . 複合動詞あそこ asoko asoko made aruku . 指示名詞あちちい achichii achichii da kara ki o tsukenasai! 幼児語  ナ形容

詞あちら achira achira no kata desu . 指示名詞あった atta ippai atta . 変異動詞活用あったら attara gohan ga attara juubunda . 変異動詞活用あったり attari jiko ga attari . . . 変異動詞活用あっち atchi atchi made aruitekuru . 指示名詞あっちい atchii atchii kara. 幼児語  イ形容

詞あって atte mondai ga atte . . . 変異動詞活用あと (後) ato kaita ato ni kizuita . 形式名詞あと (跡) ato koboshita ato ga tsuita . 名詞あの ano ano hako totte ! 指示形容詞あの ano chotto ano chigau . 間投詞あのう anoo anoo 間投詞あのさ anosa anosa 間投詞あのさあ anosaa anosaa kore saa . . . 間投詞あのね anone anone kore ne yameta wa . 間投詞あまり amari amari yokunai . 副詞あまり amari okotta amari ni namida ga deta . 形式名詞あまり amari okane no amari ga areba . . . 名詞あめこんこん amekonkon osoto wa amekonkon da yo . 幼児語  名詞ありがとう arigatoo arigatoo to iwanai to . . . 挨拶用語ありがとうございました

arigatoo+gozaimashita arigatoo+gozaimashita 挨拶用語

ありそう arisoo semmonsho ga arisoona hon'ya 変異動詞活用ある aru soko ni aru . 変異動詞活用ある aru aru hito ga soo itteimashita . 連体詞ある {aru kaitearu . テ型複合動詞あるいは aruiwa aruiwa koo sureba ii . 接続詞あれ are are totte ! 指示名詞

337

Page 362: JChatman

付 録 C Wakachi98用レファレンス

形態素 ローマ字  例 参照項目

あんな anna anna hito wa yamereba ii . 指示形容詞あんなの anna no anna no ga omoshirokunai . 指示形容詞, 形

式名詞あんなに annani annani gambatte mo. . . 指示形容詞あんよ an'yo Ryookun no an'yo da . 幼児語  名詞い {i densha ga nagai . イ形容詞活用いい ii tabete mo ii. イ形容詞いい [方言] ii tabende ii . 母音動詞活用,

イ形容詞イー ii dii@lr o kaite ! 名詞いいえ iie iie chigaimasu . 肯否定語いいや [=いいえ] iiya iiya chotto chigau . 肯否定語いかに (如何に) ikani ikani hoshigatteiru no ka . . . 疑問詞いかにも ikanimo ikanimo kanjootekini . . . モ不定詞いかん [方言] ikan tabecha ikan . テ型複合動詞いく iku nomi ni ikoo ? 子音動詞活用いく {iku kaiteiku テ型複合動詞いく iku nomi ni ikoo ? 子音動詞活用いくつ (幾つ) ikutsu ikutsu arimasu ka ? 疑問詞いくつか ikutsuka ikutsuka atsumeta . カ不定詞 (不定

語)いくつも ikutsumo ikutsumo tabete mo akinai . モ不定詞 (不定

語)いくど (幾度) ikudo ikudo yonda ka wakaranai . 疑問詞いくども (幾度も) ikudomo ikudomo yonde mo wakaranai . モ不定詞いくら (幾ら) ikura ikura haratta ? 疑問詞いくらか ikuraka okome ga ikuraka atta . カ不定詞いくらでも ikurademo ikurademo haraesoo .

いくらも ikuramo ikuramo haraeru . モ不定詞いけない ikenai tabete wa ikenai . テ型複合動詞いけない ikenai hitori de wa totemo ikenai . 子音動詞活用いけません ikemasen tabete wa ikemasen テ型複合動詞いたします itashimasu ojama itashimasu . 動作名詞, 母音

動詞活用いただきます itadakimasu itadakimasu . 挨拶用語いち ichi ichi kara yarinaosu . 数詞いつ itsu itsu kimashita ? 疑問詞いつか itsuka itsuka hanashi shita hoo ga ii deshoo? カ不定詞いつか itsuka mikka kara itsuka made taizai suru . 数詞いつつ itsutsu itsutsu hoshii naa . 数詞いってきます ittekimasu chotto omise ni ittekimasu . テ型複合動詞いってきます ittekimasu ittekimasu ! 挨拶用語いってらっしゃい itterasshai hayaku itterasshai ! テ型複合動詞いってらっしゃい itterasshai itterasshai ! 挨拶用語いっぽう (一方) ippoo ookii ippoo de kanri ga taihenda. 形式名詞いっぽう (一方) ippoo ippoo ni katayoru . 名詞いつも itsumo itsumo no mondai da . モ不定詞いて ite shibaraku koko ni ite ! 母音動詞活用いて {ite e o kaiteite omocha to asondeite テ型複合動詞いないないばあ inainaibaa inainaibaa ! 幼児語  挨拶いないないばあ inainaibaa inainaibaa shita ? 幼児語  動作名

338

Page 363: JChatman

形態素 ローマ字  例 参照項目

いながら i nagara nondei nagara ohanashi suru . 接続助詞いながら i nagara soko ni i nagara kansatsu suru . 接続助詞いや [=いいえ] iya iya chotto chigau . 肯否定語いらっしゃい irasshai koko ni irasshai ! 子音動詞活用いらっしゃい {irasshai hayaku kaiteirasshai ! テ型複合動詞いらっしゃいませ irasshaimase irasshaimase ! 挨拶用語いらっしゃる {irassharu hon kaiteirassharu . テ型複合動詞いられる irareru soko ni wa irarenai . 母音動詞活用いる iru hito ga iru . 母音動詞活用いる {iru tabeteiru テ型複合動詞いるな iruna soko ni iruna ! 母音動詞活用いれば ireba heya ni ireba . . . 母音動詞活用いろ iro soko ni iro ! 母音動詞活用いろんな ironna ironna hito ga iru . 連体詞いわゆる iwayuru iwayuru kokusaikai 連体詞う {u iku 子音動詞活用ううん [=いいえ] uun uun chigau . 肯否定語うち uchi kaiteiru uchi ni wakattekita . 形式名詞うち uchi uchi kara wa derarenai . 名詞うん un un sono toori da . 肯否定語うんこ unko unko ga ippai deta . 幼児語  名詞うんこ unko unko shiyoo ? 幼児語  動作名

詞うんち unchi unchi ga tsuita . 幼児語  名詞うんち unchi unchi shita no ? 幼児語  動作名

詞エイチ eichi eichi@lr o kaite ! 名詞エー ee ee@lr o kaite ! 名詞ええ ee ee sono toori desu . 肯否定語ええと eeto eeto soo desu ne . . . 間投詞ええとさ eetosa eetosa kore o sa . . . 間投詞ええとね eetone eetone kore o ne . . . 間投詞えき (駅) eki Nagoyaeki 複合名詞エス esu esu@lr o kaite ! 名詞エックス ekkusu ekkusu@lr o kaite ! 名詞エッチ etchi etchi@lr o kaite ! 名詞エヌ enu enu@lr o kaite ! 名詞エフ efu efu@lr o kaite ! 名詞エム emu emu@lr o kaite ! 名詞エル eru eru@lr o kaite ! 名詞える {eru kakeru 子音動詞活用える {eru arieru koto . 複合動詞えん (円) en juu en 名詞お o# osoto ni iku? 接頭辞おいで oide kotchi ni oide ! 変異動詞活用おいで {oide tabeteoide ! テ型複合動詞おう {oo hayaku ikoo ? 子音動詞活用おお oo oo sore wa ii kangae da ! 感動詞オー oo oo@lr o kaite ! 名詞おおきい ookii mondai ga ookii . イ形容詞おおきな ookina ookina mondai ni natta . 連体詞

339

Page 364: JChatman

付 録 C Wakachi98用レファレンス

形態素 ローマ字  例 参照項目

おかえり okaeri okaeri ! 挨拶用語おかえりになる okaeri ni naru sudeni okaeri ni natta kata wa . . . 動詞おかえりなさい okaeri+nasai okaerinasai ! 挨拶用語おかげ okage tasuketekureta okage de maniatta . 形式名詞おかしい okashii kono hanashi wa okashii. イ形容詞おかしな okashina okashina koto ni 連体詞おかまいなく okamainaku doozo okamainaku . 挨拶用語おく (億) oku ichioku en 数詞おく {oku tabeteoku テ型複合動詞おしっこ oshikko oshikko ippai deta . 幼児語  名詞おしっこ oshikko oshikko shita . 幼児語  動作名

詞おっき (起) okki okki shite ! 幼児語  動作名

詞おてて (手) otete otete misete ! 幼児語  名詞おねがい onegai kare ni onegai shitemireba? 動作名詞おねがいします onegai+shimasu soredewa onegaishimasu. 挨拶用語おねがいいたします

onegai+itashimasu soredewa onegaiitashimasu. 挨拶用語

おばさん obasan Yukariobasan 複合名詞おはよう ohayoo ohayoo ! 挨拶用語おはようございます

ohayoo+gozaimasu ohayoogozaimasu ! 挨拶用語

おひさしぶり ohisashiburi ohisashiburi ! 挨拶用語おひさしぶりですね

ohisashiburi+desu+ne ohisashiburidesune ! 挨拶用語

おぶう (お湯) obuu obuu nomu ? 幼児語  名詞おべべ (洋服) obebe kireena obebe ni shiyoo? 幼児語  名詞おめでとう omedetoo otanjoobi omedetoo ! 挨拶用語おめでとうございます

omedetoo+gozaimasu omedetoogozaimasu ! 挨拶用語

おめめ omeme omeme kayui? 幼児語  名詞おやすみ oyasumi kyoo wa oyasumi desu . 動作名詞おやすみ oyasumi oyasumi ! 挨拶用語おやすみなさい oyasumi+nasai oyasuminasai ! 挨拶用語おり ori kaeru ori ni soo iimashita . 形式名詞おる oru uchi ni orimasu . 動詞おる {oru miteorimashita . テ型複合動詞おわる V+owaru tabeowaru to atokatazuke o shihajimeru . 複合動詞おんぶ ombu pandachan o ombu shite . . . 幼児語  動作名

詞おんも ommo ommo iku ? 幼児語  名詞おんり onri onri shinasai ! 幼児語  動作名

詞か ka iku ka ? 終助詞か ka koohi ka koocha wa aru kedo . . . 接続助詞が ga ichi+jikan mo matta ga konai . 接続助詞が ga zoo ga ookii . 格助詞

340

Page 365: JChatman

形態素 ローマ字  例 参照項目

かい kai hoshii kai ? 終助詞かい kai mooiikai ? 挨拶用語 (の一

部)かい (回) {kai nikai jampu shita . 助数辞かい (会) {kai otanjookai wa itsu ? 接尾辞かい (階) {kai sangai ni sundeiru . 助数辞かぎり (限り) kagiri kagiri ga aru . 名詞かぎり (限り) kagiri membaa dearu kagiru riyoo suru tsumori

da .

形式名詞

かげつ (ヶ月) {kagetsu sankagetsu mo kakatta . 助数辞かける V+kakeru aisatsu o iikaketa ga . . . 複合動詞かしら kashira hontoo kashira ? 終助詞かた (方) {kata kooiu yarikata mo aru . 派生語尾がたい {gatai iigatai koto desu ga . . . 動詞活用がつ (月) {gatsu ichigatsu kara hajimaru . 助数辞かった {katta nagakatta ressun no ato ni . . . イ形容詞活用かどうか ka doo ka iku ka doo ka wakaranai . 終助詞かな kana hontoo ni iku kana ? 終助詞かなあ kanaa tabeta kanaa ? 終助詞かまわない kamawanai tabete mo kamawanai テ型複合動詞かも kamo iku kamo ne . 終助詞かもしれない kamoshirenai iku kamoshirenai . 終助詞かもしれません kamoshiremasen yameru kamoshiremasen . 終助詞かもしれん kamoshiren soo kamoshiren . 終助詞から kara ie kara detekita . 格助詞から kara maniatta kara daijoobuda 接続助詞から kara kaette kara taberu . 接続助詞がる {garu imooto mo hoshigaru . イ形容詞活用かわり kawari iimeeru utsu kawari ni denwa o kaketa . 形式名詞かん (間) {kan tookakan taizai shita . 接尾辞かんする kansuru kare ni kansuru shitsumon 変異動詞かんぱい kampai kampai ! 挨拶用語かんぱい kampai kampai shimashoo ! 動作名詞きしゃぽっぽ kishapoppo kishapoppo de asobu . 幼児語  名詞きゃあ kyaa kyaa hebi da ! 感動詞キュー kyuu kyuu@lr o kaite ! 名詞きゅう (九) kyuu kyuu shika nai . 数詞きり kiri itta kiri desu . 接続助詞きれきれ kirekire kirekire shita ? 幼児語  動作名

詞く {ku nagaku natta kaminoke . イ形容詞活用く (九) ku shichi hachi ku made aru . 数詞くせ kuse soo itteiru kuse ni jibun de yaranai . 形式名詞くせ kuse henna kuse ga tsuita . 名詞ください {kudasai onamae o kaitekudasai . テ型複合動詞くっく kukku kukku haite ! 幼児語  名詞くて {kute yubi ga nagakute te mo ookii . イ形容詞活用くない {kunai kono kyoku wa nagakunai . イ形容詞活用くなる {ku naru ookiku natta kodomo

くらい kurai ichijikan kurai kakaru . 取立助詞ぐらい gurai sore gurai jumbi shita hoo ga ii . 取立助詞くる {kuru tabetekuru kara ii wa . テ型複合動詞くる kuru renshuu shi ni kuru . 変異動詞活用

341

Page 366: JChatman

付 録 C Wakachi98用レファレンス

形態素 ローマ字  例 参照項目

くれる {kureru kaitekureru nda tte . テ型複合動詞くん (君) {kun oi oi kabakun ! 接尾辞け [方言] ke tabeta ke ? 終助詞け (気) {ke nemuke 接尾辞ケイ kee kee@lr o kaite ! 名詞けど kedo mita kedo omoshirokunai . 接続詞けれど keredo soo da keredo . . . . 接続詞けれども keredomo matta keredomo . . . 接続詞ご go# goaisatsu shita ? 接頭辞こ (個) {ko amesan sanko atta . 助数辞ご (五) go go made kazoeru . 数詞こう koo koo yatte tsunagu . 指示副詞こういう kooiu kooiu mondai ni naru kara . . . 指示形容詞こういう の kooiu no kooiu no ga ii deshoo . 指示形容詞, 形

式名詞こういうふう kooiufuu kooiu fuu no reeru mada aru ? 指示形容詞こういうふうだ kooiufuuda jumban wa kooiufuuda . 指示形容詞こういうふうな kooiufuuna kooiufuuna reeru wa doo na no? 指示形容詞こういうふうに kooiufuuni kooiufuuni tsunageba ii . 指示形容詞こういった kooitta kooitta mondai wa ooi. 指示形容詞ここ koko koko no gakusee wa . . . . 指示名詞ここのか kokonoka kokonoka made yasumu . 数詞ここのつ kokonotsu kokonotsu mo atta . 数詞こそ koso sore koso taihenda . 取立助詞ごちそうさま gochisoosama gochisoosama ! 挨拶用語ごちそうさまでした

gochisoosama+deshita gochisoosama+deshita ! 挨拶用語

こちら kochira kochira no hoo ni doozo ! 指示名詞こっけこちゃん kokkekochan kokkekochan ga ita . 幼児語  名詞こっこ kokko kokko ippai deta ? 幼児語  名詞こっち kotchi kotchi ni mo atta . 指示名詞こと koto hayaku iku koto ! 終助詞こと koto aruku koto ga daiji . 形式名詞こと koto kangaeru koto ga ippai . 名詞この kono kono hito wa purin ga daisukida . 指示形容詞このような konoyoona konoyoona mondai wa tamani okiru . 指示形容詞このように konoyooni konoyooni 指示形容詞こまかい komakai komakai koto wa yosemashoo . イ形容詞こまかな komakana komakana kokorozukai 連体詞こまった komatta komatta hito da . 連体詞こまる komaru kore de komatta. 母音動詞ごめん gomen otoshite gomen ! 挨拶用語ごめんなさい gomennasai gomennasai ! 挨拶用語これ kore kore ga soko ni hairu . 指示名詞こんな konna konna hito komaru . 指示形容詞こんな の konna no konna no arieru ? 指示形容詞, 形

式名詞こんなん [方言] konnan konnan iranai . 指示名詞こんなに konnani konnani nakanakute ii jan . 指示形容詞こんにちわ konnichiwa konnichiwa ! 挨拶用語こんばんわ kombanwa kombanwa ! 挨拶用語

342

Page 367: JChatman

形態素 ローマ字  例 参照項目

さ {sa amasa o osaeta . 派生語尾さ sa abunai sa . 終助詞

kore sa henda yo . 終助詞さあ saa saa yarimashoo 間投詞さあ saa itta kara saa . 終助詞さい (才) {sai sansai no kodomo . 助数辞さい (際) sai kaigi suru sai ni yakudatsu . 形式名詞さいちゅう (最中) saichuu shokuji no saichuu ni renraku ga haitta . 形式名詞さえ sae gohan sae areba . . . 取立助詞させる {saseru muriyarini tabesaseta . 動詞活用さま (様) {sama okyakusama 接尾辞さらに sarani sarani kore mo kuwaeru . 接続詞さようなら sayoonara sayoonara ! 挨拶用語さん san san made kazoeru . 数詞さん {san Itoosan ga kita . 固有名詞さん {san arisan ga ippai . 接尾辞し shi ookii shi omoi shi 接続詞し (四) shi ichi ni san shi made kazoeru . 数詞じ (時) {ji hachiji kara no ensookai 助数辞シー shii shii@lr o kaite ! 名詞ジー jii jii@lr o kaite ! 名詞しい shii hayaku shii shitekinasasai ! 幼児語  動作名

詞しいしい shiishii shiishii shichatta . 幼児語  動作名

詞ジェイ jei jei@lr o kaite ! 名詞しか shika omocha shika nai . 取立助詞しち shichi roku shichi gurai aru . 数詞した shita ichinichi gorogoro shita . 変異動詞しっこ shikko shikko deta ? 幼児語  名詞しっこ shikko shikko shitekita ? 幼児語  動作名

詞しつれい shitsuree shitsuree ! 挨拶用語しつれいしました shitsuree+shimashita shitsuree+shimashita . 挨拶用語しつれいします shitsuree+shimasu chotto shitsuree+shimasu . 挨拶用語しまう shimau shorui shimatteokoo . 子音動詞しまう {shimau zembu tabeteshimatta . テ型複合動詞じゃ ja kore ja ikan . 判定詞活用じゃ ja ja kaeru . 接続詞じゃあ jaa jaa soo suru wa . 接続詞じゃない janai kore wa mondai janai . 判定詞じゃない janai sekkaku da kara ii janai ! 終助詞じゃない {janai amari shizukajanai . ナ形容詞活用じゃなきゃ janakya soo janakya henda mon . 判定詞じゃなくちゃ janakucha soo janakucha henda mon . 判定詞じゃん jan yasui kara ii jan ! 終助詞じゅう (十) juu juu made kazoeru 数詞しよう shiyoo doraibu shiyoo ? 変異動詞すぎ {sugi hiru sugi made kuru . 接尾辞すぎる {sugiru himo ga nagasugiru . イ形容詞活用すぎる {sugiru kodomo ga shizukasugiru . ナ形容詞活用すぎる {sugiru tabesugita wa . 母音動詞活用すぎる sugiru ohiru ga sugita . 母音動詞

343

Page 368: JChatman

付 録 C Wakachi98用レファレンス

形態素 ローマ字  例 参照項目

すなわち sunawachi sunawachi kooiu koto da . 接続詞すまん suman suman . 挨拶用語すまん suman yomanai to ki ga suman . 子音動詞すみません sumimasen sumimasen . 挨拶用語すら sura gohan sura tabenai 取立助詞する suru denwa suru wa . 変異動詞する suru nenne suru ? 変異動詞する suru aisuru hito e 変異動詞すると suruto suruto kare ga tachiagatte . . . 接続詞せい see okureta see de maniawanakatta . 形式名詞ゼット zetto zetto@lr o kaite ! 名詞せん (千) sen sen made kazoeru . 数詞せん sen sonna koto sen ! 変異動詞せんせい (先生) sensee Hattorisensee 複合名詞ぞ zo ii zo . 終助詞そいで [方言] soide soide saa asoko made ittara saa . . . 接続詞そう {soo oishisooda ne . イ形容詞活用そう {soo taberaresoona mono nai ? 動詞活用そう soo soo na no ! 肯否定語そう soo soo shiyoo ? 指示副詞そういう sooyuu sooiu hito wa saketa hoo ga ii . 指示形容詞そういうふうだ sooyuufuu da kare no kangaekata wa sooiufuu da . 指示形容詞そういうふうな sooyuufuuna sooiufuuna kangaekata wa . . . 指示形容詞そういうふうに sooyuufuuni sooiufuuni kangaeru to . . . 指示形容詞そうすると soosuruto soosuruto yameta hoo ga ii ne . 接続詞そうしたら sooshitara sooshitara umaku itta . 接続詞そうすると soosuruto soosuruto yameta hoo ga ii ne . 接続詞そうそう soosoo soosoo . 肯否定語そうだ sooda iku sooda . 助動詞そうだ soo da sore wa soo da . 指示副詞, 判定

詞そうだ {sooda okazu ga oishisooda . イ形容詞活用そうだ {sooda tabesooda . 動詞活用そうな {soona oishisoona gohan . イ形容詞活用そうな {soona tabesoona mono wa nai . 動詞活用そうに {sooni oishisooni tabeteiru . イ形容詞活用そうに {sooni tabesooni natta . 動詞活用そこ soko soko made aruku . 指示名詞そしたら soshitara soshitara yameta hoo ga ii . 接続詞そして soshite soshite heya o deta . 接続詞そちら sochira sochira no kata wa ? 指示名詞そっち sotchi sotchi no omocha mottekite ! 指示名詞その sono sono hako o totte! 指示形容詞そのようだ sonoyooda mondai wa sonoyooda . 指示形容詞そのように sonoyooni sonoyooni iwareta . 指示形容詞そのような sonoyoona sonoyoona koto da . 指示形容詞それ sore sore wa doo shita ? 指示名詞それで sorede sorede doo shita to omou ? 接続詞それでは soredewa soredewa ! 挨拶用語それでは soredewa soredewa hajimemashoo . 接続詞それでは sore de wa sore de wa umaku iku hazu nai . 指示名詞それなら sorenara sorenara yameta hoo ga ii . 接続詞そんな sonna sonna koto aru no ? 指示形容詞

344

Page 369: JChatman

形態素 ローマ字  例 参照項目

そんな の sonna no sonna no kiita koto nai . 指示形容詞, 形式名詞

そんな ん sonna n sonna n(o) kiita koto nai . 指示形容詞, 形式名詞

そんなに sonnani sonnani gambaranakute ii wa . 指示形容詞た {ta tabeta 母音動詞活用だ da kare ga mada gakusee da . 判定詞だ {da kono heya no hoo ga shizukada . ナ形容詞活用たい {tai gohan tabetai ? 母音動詞活用だい (第) dai# dainiban 接頭辞だい (大) dai# daikirai 接頭辞たいした taishita taishita sa wa nai . 連体詞たいして taishite kare ni taishite wa 副詞たいする taisuru kare ni taisuru komento 変異動詞だから dakara dakara dameda to itta . 接続詞だから da kara gakusee da kara dameda . 判定詞, 接続助

詞たがる   {tagaru tabetagaru 動詞活用だけ dake kare dake ga dekiru 取立助詞だけど dakedo dakedo kekkyoku kankee nai ne. 接続詞だけど da kedo kodomo da kedo shikkari shiteiru . 判定詞, 接続助

詞だけども dakedomo dakedomo kekkyoku kankee nai ne . 接続詞だけども da kedomo gakusee da kedomo 判定詞, 接続助

詞だけれども dakeredomo akeredomo kekkyoku kankee nai ne. 接続詞だけれども da keredomo kodomo da keredomo 判定詞, 接続助

詞だす V+dasu Toridasu 複合動詞ただいま tadaima tadaima ! 挨拶用語たち (達) {tachi kodomotachi 接尾辞だった datta kodomo datta . 判定詞活用だったら dattara kodomo dattara ii kedo. 判定詞だったら dattara dattara soo suru ? 接続詞だったり dattari hyooka ga shii dattari suru . 判定詞活用たっち tatchi tatchi shite ! 幼児語動作名詞だって da tte yuumeena hon da tte 判定詞, 終助詞だって datte datte omoshirokunai mon . 接続詞だって datte kare datte dekiru mon . 取立助詞だってば da tteba kore da tteba 判定詞, 終助詞たび tabi furusato ni kaeru tabi ni soo omou. 形式名詞ダブリュー daburyuu daburyuu@lr o kaite ! 名詞たまに tamani tamani furiizu suru kara 副詞ため tame ryokoo dekiru tame ni chokin suru . 形式名詞だめ dame tabecha dameda tte . ナ形容詞たら {tara tabetara onaka itaku naru yo . 動詞活用たり {tari tabetari nondari shite . . . 動詞活用だれ dare dare ga kita ? 疑問詞だれか dareka dareka shiranai ? カ不定詞だれかさん darekasan darekasan ga puu shita. カ不定詞だれも daremo daremo shitteiru koto . モ不定詞だろう daroo kodomo daroo . 判定詞たんたん tantan tantan hairu ? 幼児語 名詞

345

Page 370: JChatman

付 録 C Wakachi98用レファレンス

形態素 ローマ字  例 参照項目

ちいさい chiisai te ga chiisai . イ形容詞ちいさな chiisana chiisana sakanatachi 連体詞ちがう chigau chigau , kore wa aka da . 肯否定語ちっち chitchi chitchi shiyoo ka ? 幼児語動作名詞ちまう {chimau tabechimau テ型複合動詞ちゃ {cha tabecha テ型複合動詞ちゃう {chau tabechau テ型複合動詞ちゃん {chan Yurichan 固有名詞ちゃん {chan usagichan 接尾辞ちゅう (中) {chuu ressunchuu 接尾辞ちょうだい {choodai tabetechoodai テ型複合動詞ちょっと chotto chotto mattekureru ? 副詞ちょっとした chottoshita chottoshita okurimono 連体詞ついたち tsuitachi tsuitachi kara hajimaru . 数詞ついで tsuide kaeru tsuide ni kaimono suru . 形式名詞っけ kke yutta kke ? 終助詞ったら ttara Ryookun ttara komatta mon da 提題助詞つつ {tsutsu tabetsutsu 動詞活用って tte biiru tte nigai ne 提題助詞ってば tteba ii tteba 終助詞ってば tteba kore da tteba 終助詞つもり tsumori monku o iu tsumori wa nai kedo. 形式名詞て {te tabete 動詞活用て (手) {te yarite 派生語尾で de ichinensee de konna koto suru no? 判定詞で de koko de taberu 格助詞てあげる {teageru kaiteageru テ型複合動詞であった deatta gakusee deatta . 判定詞であったら deattara gakusee deattara . . . 判定詞であったり deattari gakusee deattari shita . 判定詞であって deatte kare wa yuumeena hito deatte . . . 判定詞であります dearimasu yuumeena hito dearimasu . 判定詞てある {tearu soko ni kaitearu yo . テ型複合動詞である dearu gakusee dearu . 判定詞であれば deareba otona deareba yoi . 判定詞活用であろう dearoo yuumeena hito dearoo ga . . . 判定詞活用ティー tii tii@lr o kaite ! 名詞ディー dii dii@lr o kaite ! 名詞ていく {teiku kaiteiku テ型複合動詞ていらっしゃい {teirasshai kaiteirasshai テ型複合動詞ていらっしゃる {teirassharu kaiteirassharu テ型複合動詞でいらっしゃる deirassharu sakka deirassharu . 判定詞, 動詞ている {teiru tabeteiru テ型複合動詞ておいで {teoide tabeteoide テ型複合動詞ておく {teoku memochoo ni kaiteoku ne . テ型複合動詞ておる [方言] {teoru gohan tabeteoru テ型複合動詞てください {tekudasai kaitekudasai テ型複合動詞てくる {tekuru chotto ittekuru テ型複合動詞てくれる {tekureru chizu kaitekureru ? テ型複合動詞でございます degozaimasu gakuseesan degozaimasu . 判定詞てごらん {tegoran zoosan no e o kaitegoran テ型複合動詞

346

Page 371: JChatman

形態素 ローマ字  例 参照項目

でさえ de sae kanojo desae dekinai 判定詞, 取立助詞

てしまう {teshimau tabeteshimau テ型複合動詞です desu gakusee desu . 判定詞活用です desu kore wa desu ne . . . 判定詞活用です {desu shizukadesu ナ形容詞活用てちょうだい {techoodai tabetechoodai テ型複合動詞てて tete tete o kirekire shite ! 幼児語でない denai puro denai hito ni totte wa . . . 判定詞でなきゃ denakya puro denakya yaru imi ga nai . 判定詞ては {te wa tabete wa 動詞, 取立助詞では dewa dewa hajimemashoo . 接続詞では de wa non de wa ikenai . 判定詞, 取立助

詞では de wa kore de wa ikenai 判定詞, 提題助

詞てみる {temiru tabetemiru テ型複合動詞ても {te mo tabete mo ii yo . 動詞, 取立助詞でも de mo kare de mo ii 判定詞, 取立助

詞でも {de mo nonde mo ii 動詞, 取立助詞てもらう {temorau tabetemorau テ型複合動詞てやる {teyaru e o kaiteyaru . テ型複合動詞てらっしゃい {terasshai kaiterasshai テ型複合動詞てらっしゃる {terassharu kaiterassharu テ型複合動詞てる {teru tabeteru テ型複合動詞ではない dewanai gakusee dewanai 判定詞てん {ten tabeten no テ型複合動詞と to Taroo ga Hanako to tooron shita . 格助詞と to taihenda to itta . 格助詞と [方言] to tabetoo to . 終助詞と to yomanai to dame ! 接続助詞と to tabeyoo to suru . 接続助詞と to aru to benrina doogu . 接続助詞と to daijoobuda to itta . 接続助詞と to hon to zasshi ga oitearu . 接続助詞とう too too made kazoeta . 数詞とう [方言] {too mina ga tabetoo . テ型複合動詞どう doo doo yatte dekiru ? 疑問詞どういう風 dooiufuu kore wa dooiufuu ? 疑問詞どういう風な dooiufuuna dooiufuuna tsunagikata na no ? 疑問詞どういう風に dooiufuuni dooiufuuni kaita no ? 疑問詞とうか tooka tooka kurai de soko made itta . 数詞どうして [理由 ] dooshite dooshite akanai no ? 疑問詞どうして doo shite doo shite aku no? 疑問詞どうしても dooshitemo dooshitemo yattehoshii tte . モ不定詞どうも doomo doomo dekinai モ不定詞|ありがとうございました

doomo+arigatoo+gozaimashita 挨拶用語

どう やって doo yatte doo yatte akeru ? 疑問詞,動詞とおり toori kaitearu toori ni jisshi shitekudasai ! 形式名詞とか toka hon toka zasshi wa yomu kedo . . . 接続助詞とか toka fuku toka katta 取立助詞

347

Page 372: JChatman

付 録 C Wakachi98用レファレンス

形態素 ローマ字  例 参照項目

とき toki toki ga tatsu . 名詞とき toki kaeru toki made gaman shite ! 形式名詞どこ doko doko ga ii deshoo ? 疑問詞どこか dokoka dokoka ni oiteatta kedo . . . カ不定詞どこも dokomo yasumi wa dokomo ikanakatta . モ不定詞ところ tokoro koronda tokoro misemashoo . 名詞ところ tokoro kaeroo to shiteiru tokoro datta . 形式名詞ところが tokoroga tokoroga kore dake dewanai . 接続詞ところで tokorode tokorode senjitsu no ken desu ga . . . 接続詞どちら dochira dochira no osumai desu ka ? 疑問詞どちらか dochiraka dochiraka ga machigai da . カ不定詞どちらも dochiramo dochiramo machigatteimasu . モ不定詞どちら様 dochirasama dochirasama desu ka ? カ不定詞どっち dotchi dotchi ga ii ? 疑問詞どっちか dotchika dotchika o erandekudasai ! カ不定詞どっちも dotchimo dotchimo dameda ne . モ不定詞とっと (魚;鳥) totto totto atta . 幼児語どなた donata donata desu ka ? 疑問詞どなたか donataka donataka zonjimasen ga . . . カ不定詞どなたも donatamo donatamo irassharanai node . . . モ不定詞どなた様 donatasama donatasama kara itadaita ka . . . カ不定詞どの dono dono hito mo shiranai . 疑問詞どのような donoyoona donoyoona susumikata ga deshita ka ? 疑問詞どのように donoyooni donoyooni susumeba ii deshoo ? 疑問詞とも tomo ii tomo 終助詞とる [方言] {toru tabetoru テ型複合動詞どれ dore dore ni shimasu ka ? 疑問詞どれか doreka doreka erande ! カ不定詞どれも doremo doremo iranai . モ不定詞どんな donna donna mono ga ii deshoo ? 疑問詞どんな の donna no donna no ga ii kana ? 疑問詞, 形式名

詞どんなに donnani donnani kangaetemo detekonai . 疑問詞どんな風に donnafuuni donnafuuni naru no ? 疑問詞な na gakusee na ndesu 判定詞な na ii na ! 終助詞な {na shizukana ナ形容詞活用な {na taberuna 動詞活用なあ naa ii naa ! 終助詞ない nai kore ga nai kara . 変異動詞活用ない {nai tabenai 動詞活用ないで {naide tabenaide 動詞活用ないと {nai to ikanai to dame 動詞活用, 接続

助詞ながら (同時) nagara tabe nagara shaberu . 接続助詞ながら (逆接) nagara mitei nagara shiranpuri o suru . 接続助詞なきゃ nakya hon ga nakya dame . 変異動詞活用なきゃ {nakya tabenakya 動詞活用なくす nakusu nakushita 動詞なくちゃ nakucha hon ga nakucha dame . 変異動詞活用なくちゃ {nakucha tabenakucha ! 動詞活用なくなる nakunaru hon ga nakunatta . 動詞

348

Page 373: JChatman

形態素 ローマ字  例 参照項目

なさい {nasai tabenasai 動詞活用なぜ naze naze damen no ka wakaranai . 疑問詞なぜか nazeka nazeka hantai shiteiru . カ不定詞なぜなら nazenara nazenara moo yameta nda . 接続詞など nado hon nado katta 取立助詞ななつ nanatsu nanatsu areba juubun . 数詞なに nani nani ga ii desu ka ? 疑問詞なにか nanika nanika atta? カ不定詞なにも nanimo nanimo tabetenai . モ不定詞なのか nanoka nanoka teedo yasumi o toru . 数詞なのだ na noda hon na noda 判定詞,助動詞なのだ na noda iya na noda 判定詞,助動詞なので na node chichi na node yoku wakaru . 判定詞, 接続助

詞なのに na noni chichi na noni wakaranai . 判定詞, 接続助

詞なら nara kare nara daijoobu . 判定詞活用なら nara hon nara aru ga . . . 提題助詞なり nari tsuku nari shigoto o tanomareta . 接続助詞なる naru oyomi ni naru 動詞なる naru ookiku naru 動詞なん{ nan- nannin kurai kiteita ? 助数辞なんか nanka nanka atta noka wakaranai kedo . . . カ不定詞なんか nanka kore nanka sutetara 取立助詞なんじ (何時) nanji nanji made ita no ? 疑問詞なんだ na nda hon na nda 判定詞,判定詞なんだ -na nda iyana nda ナ形容詞, 判定

詞なんて nante kare nante hen da wa 取立助詞なん で [手段] nan de taberu nan de taberu? 疑問詞,格助詞なんで [理由 ] nande nande dekinai no ? 疑問詞なんな nanna nanna shiyoo ka ? 幼児語動作名詞に ni koohi ni koocha ga aru . 接続助詞に ni kare ni moratta 格助詞に ni ichi ni san . . . 数詞に {ni shizukani shinasai ! ナ形容詞活用に いく ni iku nomi ni ikoo ? 格助詞, 子音動

詞活用にくい {nikui ika wa tabenikui . 動詞活用に くる ni kuru yomi ni kuru ? 格助詞, 変異動

詞に する ni suru yame ni suru 格助詞, 変異動

詞に なる ni naru oyomi ni naru 格助詞, 子音動

詞に も ni mo doko ni mo nai 格助詞にち (日) {nichi ichinichi yasunda . 助数辞にゃあにゃ nyaanya nyaanya kawaii ne . 幼児語にん (人) {nin sannin shika inai . 助数辞ぬりぬり nurinuri okusuri nurinuri suru kara ne . 幼児語動作名詞ね ne abunai ne 終助詞ね ne kore ga ne abunai yo 終助詞ねんせい (年生) {nensee ichinensee 助数辞

349

Page 374: JChatman

付 録 C Wakachi98用レファレンス

形態素 ローマ字  例 参照項目

ねんね nenne nenne suru ? 幼児語動作名詞の no miru no ga tanoshii . 形式名詞の no kare no sodatta basho 格助詞の no bunshoo no hajimari 接続助詞の no yaru no? 終助詞の か no ka iku no ka doo ka . . . 終助詞の か no ka iku no ka ? 終助詞の ね no ne itta no ne . 終助詞のだ noda kaeru noda . 助動詞ので node taihenna node yamemashoo . 接続助詞のに noni ikanai noni okane torareta . 接続助詞のみ nomi oya nomi no atsumari 取立助詞は wa hon wa yonda ga . . . 提題助詞は wa kaze ga tsuyoi ga ame wa futteinai 取立助詞は {wa tabetewa テ型複合動詞は [=はい] ha ha , wakarimashita . 肯否定語ば (場) {ba asobiba 接尾辞はあ [=はい] haa haa chotto wakarimasen . 肯否定語はあは haaha haaha itai no ? 幼児語ばあい (場合) baai mondai ga okita baai ni tsukau . 形式名詞はい hai hai, sono toori desu . 肯否定語はいはい haihai haihai, ima ikimasu yo . 肯否定語はいはい haihai haihai shiteiru akachan . 幼児語動作名詞バイバイ baibai mama, baibai ! 挨拶用語ばかし bakashi omocha bakashi da . 取立助詞ばかり bakari hon bakari yonderu . 取立助詞はじめる V+hajimeru yarihajimeru 複合動詞はず hazu wakatta hazu wa nai . 形式名詞はたち hatachi hatachi ni natta . 数詞はち hachi hachi made kazoeru . 数詞ぱちぱち pachipachi meme o pachipachi shite ! 幼児語動作名詞はつか hatsuka hatsuka made gambaru . 数詞ばっかり bakkari gomi bakkari nokoshita . 取立助詞ばっちい batchii kore batchii yo . 幼児語イ形容詞はんぶんこ hambunko hambunko shiyoo ka ? 幼児語 名詞はんめん(反面) hammen akarui hammen ni ochikomigachi dearu . 形式名詞ビー bii bii@lr o kaite ! 名詞ピー pii pii@lr o kaite ! 名詞ひと (一) hito- hitokuchi choodai ! 数詞ひとつ hitotsu hitotsu choodai ! 数詞ひとり hitori hitori de yaru kara . 数詞ひゃく hyaku hyaku made kazoeru . 数詞ひょっとしたら hyottoshitara hyottoshitara moo nai kamo ne . 接続詞ひょっとして hyottoshite hyottoshite kaettekonai . 接続詞ひょっとすると hyottosuruto hyottosuruto zembu nakunatta . 接続詞ブイ bui bui@lr o kaite ! 名詞ぷう puu puu shita no dare ? 幼児語ぶうちゃん buuchan buuchan ga ochita . 幼児語 名詞ぶうぶ buubu buubu ga hashitta . 幼児語 名詞ふうん fuun fuun , omoshiroi ne . 感動詞

350

Page 375: JChatman

形態素 ローマ字  例 参照項目

ふた (二) futa{ futaban tomatta . 数詞ふたたび futatabi futatabi yattemitara . . . 副詞ふたつ futatsu futatsu tabereru ? 数詞ふたり futari futari de kaetta . 数詞ふつか futsuka futsuka dake no taizai 数詞ぶんぶ bumbu bumbu ni hairu? 幼児語 名詞へ e uchi e kaeru 格助詞へえ hee hee, sugoi ne ! 感動詞へえん heen heen, hontoo ka ne ? 感動詞べきだ bekida kaeru bekida . 助動詞ぽい poi poi shinasai ! 幼児語動作名詞ほう hoo deta hoo ga omoshiroi . 形式名詞ほう hoo ushiro no hoo o mita . 名詞ほお hoo hoo, omoshiroi ! 感動詞ほか hoka shigoto suru hoka wa nai . 形式名詞ほか hoka hoka no hito ni kiite ! 名詞ぽっぽ (鳩, 汽車) poppo poppo ga kita . 幼児語 名詞ほど hodo heejitsu wa shuumatsu hodo isogashikunai 取立助詞ほど hodo renshuu suru hodo joozuni naru . 接続助詞ほら hora hora, yutta deshoo ! 感動詞ぽん pon booru o pon shite ! 幼児語  動作名

詞ほん (本) {hon aisu ippon nokoshita . 助数辞ほんで [方言] honde honde soko ittara . . . 接続詞ほんなら [方言] honnara honnara yameru . 接続詞ぽんぽん pompon pompon itai no? 幼児語 名詞ま (真) ma# masshiro ni natta . 接頭辞まあ maa maa ii kedo . 感動詞まい (枚) {mai ichimai shika nai . 助数辞まえ mae mae ni tatsu . 名詞まえ mae deru mae jumbi suru . 形式名詞ます {masu tabemasu 動詞活用また mata mata hajimatta . 副詞まで made papa ga kuru made matte ! 接続詞まで made gakkoo made aruku . 格助詞まで made kare made kichatta . 取立助詞まで も made mo eki made mo aruita 取立助詞まま mama mama no yuu koto kiite ! 名詞まま mama ikanai mama de owatteshimatta . 形式名詞まん (万) man niman de kaeru yo . 数詞まんま mamma mamma hoshii ? 幼児語み (味) {mi amami ga atte oishii . 派生語尾みたい mitai gakusee mitai . 助動詞みたい mitai hyoojoo o mitai . 母音動詞活用みたいだ mitaida kaettekuru mitaida . 助動詞みっか mikka mikka dake taizai suru . 数詞みっつ mittsu mittsu shika nai . 数詞みる {miru kore tabetemiru ? テ型複合動詞むいか muika muika made koko ni iru . 数詞むっつ muttsu muttsu mo atta . 数詞めったな mettana mettana genshoo de wa aru ga . . . 連体詞めめ meme meme o pachipachi shite ! 幼児語

351

Page 376: JChatman

付 録 C Wakachi98用レファレンス

形態素 ローマ字  例 参照項目

も mo kore o mite Hanako mo naita 取立助詞も mo hon mo zasshi mo oiteartta . 接続助詞も mo tabete mo ii. 接続助詞も mo takusan tabete mo futoranai . 接続助詞もしかしたら moshikashitara moshikashitara machigai datta . 接続詞もしかして moshikashite moshikashite soo kangaeteru no kanaa ? 接続詞もしかすると moshikasuruto moshikasuruto dameda ne . 接続詞もしもし moshimoshi moshimoshi ! 挨拶用語もの mono kireedesu mono 終助詞もの mono kono mono o dokashite ! 名詞もの mono ningen to iu mono wa . . . 形式名詞もん mon ii mon ! 終助詞や ya koohi ya koocha 接続助詞や (屋) {ya denkiya 接尾辞やさん {yasan omochayasan e ikoo ! 接尾辞やすい {yasui tabeyasui ookisa 動詞活用やっ [=いいえ] yaQ ya! chigau yo ! 肯否定語やっつ (八) yattsu yattsu mo atta . 数詞やる {yaru kaiteyaru yo . テ型複合動詞ユー yuu yuu@lr o kaite ! 名詞ゆう (言う) yuu dakara yutta janai ! 子音動詞よ yo ii yo 終助詞よう yoo mae mo itta yoo ni kore wa muridesu . 形式名詞よう {yoo tabeyoo 動詞活用ようか yooka yooka kara Tookyoo da . 数詞ようするに yoosuruni yoosuruni kotowarareta . 接続詞ようだ yooda taberareru yooda . 助動詞よう と {yoo to tabeyoo to suru 接続詞よしよし yoshiyoshi yoshiyoshi shiteagete ! 幼児語動作名詞よっか yokka yokka kurai nara daijoobu . 数詞よっつ yotsu yottsu shika nai . 数詞より yori kare yori ookii 格助詞より も yori mo kore yori mo are no hoo ga ii 格助詞, 取立助

詞よろしく yoroshiku yoroshiku ne . 挨拶用語よろしくお願いします

yoroshiku+onegai+shimasu 挨拶用語

よん yon yon made kazoeru . 数詞られる {rareru taberareru no ? 動詞活用り [方言] {ri Otoosan mo taberi ! 母音動詞活用る {ru taberu kara ii wa . 動詞活用れば {reba tabereba nakunaru . 動詞活用れる {reru kimochi yoku hashireru michi 動詞活用ろ {ro nigero ! 動詞活用ろく roku roku made kazoeru . 数詞ろくな rokuna rokuna hito wa inai . 連体詞ろくに rokuni rokuni neteinai . 副詞

352

Page 377: JChatman

わ wa ii wa 終助詞わあ! waa waa suteki ! 感動詞わけ wake iroiro wake ga atte . . . 名詞わけ wake kookai suru wake mo nai . 形式名詞わけだ wakeda komaru wakejanai kedo . 形式名詞, 助動

詞わ ね wa ne yutta wa ne 終助詞わ よ wa yo yameta wa yo 終助詞わんわん wanwan inu ga wanwan to hoeta . 擬声擬態語わんわん wanwan wanwan ga kita . 幼児語 名詞を o gohan o tabeta 格助詞ん n(o) konna n(o) de ii no? 形式名詞ん {n gohan nanka taben . 母音動詞活用ん? n ? n? nan to itta ? 間投詞んだ nda yappari ookii nda . 助動詞んで [方言] {nde tabende ii yo . 母音動詞活用んでも [方言] {nde mo tabende mo ii 母音動詞活用,

接続助詞

353

Page 378: JChatman

索 引

! . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

+ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

+" . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

+". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

+"/. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

+... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

+/. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75, 76

+//. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

+^. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

+r5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

; . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

� . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

�'. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .74

�, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

�,. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .74

�. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

�: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

�? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

� . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

�Oa�x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

�s"[+ bch]" . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78

<$=n> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

<aft> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .94

<bef> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211

( ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

* . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

+r5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

+r6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

+s+"[+ trn]" . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

,, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .75

-: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

-s"[+ bch]" . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .87

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

/ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

// . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .79

/// . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .75, 80, 81

:: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80, 81

? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .73

@ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

@Activities . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .36

@Age . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

@Bck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

@Begin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11, 33

@Bg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .36, 183

@Birth . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

@Coder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

@Coding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16, 34

@Comment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

@Date . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

@Education . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

@Eg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .36, 183

@End . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

@Filename . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

@G . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

@ID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

@l . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

@Language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

@lc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

@lh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

@lk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

@Location . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

@lr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50

@New Episode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

@o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

@Participants . . . . . . . . . . . . . . . . . . . . . . . . . 11, 12, 33

@Room Layout . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .36

@s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

@SES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

@Sex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

@Situation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

@Tape Location . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

@Time Duration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

@Time Start . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

@u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48, 97

354

Page 379: JChatman

索 引

@Warning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

[!!] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81, 84

[!] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81, 83

["] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .84, 118

[+ bch] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78

[<>] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

[<] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

[>] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

[*] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87, 104, 118

[+ bch] . . . . . . . . . . . . . . . . . . . . . . . . 87, 115, 118, 123

[+ text] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

[+ trn] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

[/-] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

[//] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

[/?] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

[/] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

[: text] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

[:=x text] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

[= text] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

[=! ] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

[=? text] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

[?] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .48, 85

[$text] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

[% text] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

[%xxx: text] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

[0 text] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

# . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53, 75

$= . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

$A/P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

$ACH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .106

$ADD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

$ANT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .106

$BLE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

$CGN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

$CON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

$EJS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

$EX1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

$EX2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

$FEA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

$INC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

$INT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .52

$JES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

$LEX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104, 105, 118

$LOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

$MAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

$MIX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

$MOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

$MRA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

$NSM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .107

$PCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

$PER . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

$PHO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105, 118

$PTA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

$PTL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

$SCR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

$SUB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104, 106

$SWI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

$SYL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

$SYN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

$UNC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .106

$VOW . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

% . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

%act: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

%add: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

%alt: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

%cod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

%cod: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .90

%com . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

%com: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

%eng: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91

%err . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

%err: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

%exp: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91

%fac: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

% o: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91

%gls: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

%gpx: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91

%int: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

%jpn: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

%lan: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

%mod: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

%mor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53, 89

%mor: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

%par . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

%par: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

%pho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .48, 97

%pho: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

%sit: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

%spa: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

%syn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .89

%syn: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

%tim . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .37

355

Page 380: JChatman

索 引

%tim: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

& . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48, 54

~ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48, 83

0*word . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

00depadd.cut . . . . . . . . . . . 53, 54, 66, 123, 138, 198

00readme.doc . . . . . . . . . . . . . 14, 41, 42, 51, 74, 123

00word . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

0lexicon.cut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

0word . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

accept . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

Addボタン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

asterisk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

batch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

Brian MacWhinney . . . . . . . . . . . . . . . . . . . . . . . . . . . ix

Catherine Snow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix

cd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

cdc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

CDI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .xx

CED-J . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

cha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

CHAINS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

CHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1, ix, xvii, 5

CHATエディターモード . . . . . . . . . . . . . . . 185, 189

CHATファイル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

行番号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .271

コラム表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269

CHECK . . . . . . . . . . . . . . . . . . . . .7, 15, 138, 187, 197

オプション . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

Check opened �le . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

CHILDES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix, xiii, 1

メーリングリスト . . . . . . . . . . . . . . . . . . . . . . xvii

メンバー . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvii

CHIP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

CHSTRING . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242

CLAN . . . . . . . . . . . . . . . . . . . . . . . . 1, 5, xvii, 40, 167

インストール . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

起動 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

コマンド . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

シェルコマンド . . . . . . . . . . . . . . . . . . . . . . . . . 171

スピーカーコードの登録 . . . . . . . . . . . . . . . . 135

データの入力 . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

日本語版 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

保存と終了 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

マクロ単文登録 . . . . . . . . . . . . . . . . . . . . . . . . . 136

Clan Output ウィンドゥ . . . . . . . . . . . . . . . . . . . . 176

CLANボタン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

CLAN-J . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

CLANエディター . . . . . . . . . . . . . . . . . 7, 15, 18, 133

Clearボタン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

Coder mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .192

codes.cut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .194

codes.ord . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

COLUMNS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269

COMBO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

オプション . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205

Command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

Continuous playback . . . . . . . . . . . . . . . . . . . . . . . . 191

COOCCUR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244

Cool Edit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329

coopy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

cut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .169

DATES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271

del . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

Dep�le . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

dep�le.cut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89, 197

dir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

Disambiguate tier . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

discourse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xviii

dislocation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

DIST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244

Doneボタン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

DSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

eru動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

exclude �le . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226

FEP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

File Inボタン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

Find . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

Find Same . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

FLO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271

Font . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

FREQ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180, 209

オプション . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

FREQMERG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

FTP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvii

Fusion Recorder . . . . . . . . . . . . . . . . . . . . . . . . . . . . .330

GEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183, 250

356

Page 381: JChatman

索 引

分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253

GEMFREQ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252

GEMLIST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253

Go-To . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

Goldwave . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329

help . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .172

Helpボタン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

Hide tiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

IDコード . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

include �le . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226

info . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

IPA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

iru動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

Japanese Partner . . . . . . . . . . . . . . . . . . . . . . . 168, 188

JCHANGE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16, 319

JCHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1, ix, 15

active . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324

LIST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321

活動 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324

プロジェクト . . . . . . . . . . . . . . . . . . . . . . . . . . . 319

ホームページ . . . . . . . . . . . . . . . . . . . . . . . . . . . 323

メンバー . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324

jchatizer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

JCHATファイル . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

JCHAT用訓令式ローマ字表 . . . . . . . . . . . . . . . . . . 32

JCHAT用ヘボン式ローマ字表 . . . . . . . . . . . . . . . . 31

JMOR . . . . . . . . . . . . . . . . . . . . . .xi, 18, 273, 314, 319

JUPITA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319

KEYMAP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254

KWAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183, 217

オプション . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218

Libボタン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

Libボタン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

LINES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271

list . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .171

logome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xx

Macintosh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328

main line . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .11

MAKEDATA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271

maxCHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

MAXWD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255

midCHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

minCHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8, 10

minJCHAT . . . . . . . . . . . . . . . . . . . . 8, x, 15, 109, 110

MITコーパス . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

MLT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86, 256

MLU . . . . . . xi, 77, 78, 86, 112, 115, 118, 181, 219

オプション . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

MODREP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86, 258

MOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7, 261

narrative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xviii

Non-CHATエディターモード . . . . . . . . . . .185, 189

nonCHATファイル . . . . . . . . . . . . . . . . . . . . . . . . . 229

onomatop.cut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

Outputボタン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

overlap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

percent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12

PHONASCII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

PHONFREQ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .263

recall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

Recallボタン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

RELY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .264

Removeボタン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .177

ren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .171

Replace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

rmdir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

RU-動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

Runボタン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

SALTIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265

SALT形式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

Select Current Directoryボタン . . . . . . . . . . . . . 174

Sonic CHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix, 328

Sonic CHATモード . . . . . . . . . . . . . . . . . . . . . . . . . 190

Sonic再生モード . . . . . . . . . . . . . . . . . . 185, 189, 191

Sonic作成モード . . . . . . . . . . . . . . . . . . 185, 189, 190

SoundApp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328

SoundEdit 16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328

STATFREQ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265

TEXTIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .266

Tiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .186

TIMEDUR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

Twinbridge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

U-動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

357

Page 382: JChatman

索 引

UCLAコーパス . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

UNIBET . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47, 97

Update . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

utterance terminator . . . . . . . . . . . . . . . . . . . . . . . . . 12

Wakachi98 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273

WAVE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329

WDLEN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

Windows . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .329

workingボタン . . . . . . . . . . . . . . . . . . . . . . . . . 169, 174

www . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48, 209

xx . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

xxx . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13, 47, 118

yy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

yyy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

アクセント . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74, 80

アスタリスク . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11, 170

ある . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284

アンパサンド . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

言い誤り . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101, 102

記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

言い直し . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

異音 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

異形態 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

イ形容詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278

活用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279

インタラクション

コードの追跡 . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236, 254

イントネーション . . . . . . . . . . . . . . . . . . . . . . . . . 74, 92

引用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvii, 84

引用内容 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

英語訳 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

エディター . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

エディターモード . . . . . . . . . . . . . . . . . . . . . . . . . . . 185

エラー・コーディング . . . . . . . . . . . . . . . . . . . . . . . 101

大文字 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

置き換え . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84, 226

置き換え記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

オプションスイッチ . . . . . . . . . . . . . . . . . . . . . . . . . 170

音韻的現象 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

音韻頻度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263

音声分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix

音声レベル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

音節間の間断 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

音節の長音化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

音素レベル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

オンラインヘルプ . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

外置 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18, 75

会話分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xviii

書き起こし . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327

かぎかっこ < > . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

書き言葉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

カ行変格活用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

角かっこ [ ] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .83

核強勢 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

格助詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17, 41, 293

下降上昇の音調曲線 . . . . . . . . . . . . . . . . . . . . . . . . . . 74

下降上昇ピリオド . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

下降する音調曲線 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

下降ピリオド . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

過小調整 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

家族専用語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

過大調整 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

学校文法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39, 56

活用形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

仮名漢字ファイル . . . . . . . . . . . . . . . . . . . . . . 120, 122

カ不定詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290

上一段活用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

漢語借用語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276, 277

感嘆符 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12, 73

間投詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .47, 75

擬音・擬声語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

聞き取りにくい語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

記号類 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

記号を取り去った発話 . . . . . . . . . . . . . . . . . . . . . . . . 91

擬声擬態語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276, 288

基本形語幹 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

疑問詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289

疑問符 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12, 73

休止 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

共起分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244

強勢 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79, 83

行番号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271

距離の計算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244

偶然性分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254

358

Page 383: JChatman

索 引

屈折形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

句読点 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

クラスタ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

繰り返し . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77, 86

くる . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284

グロス . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

訓令式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

訓令式第 1表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

訓令式第 2表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22, 29

訓令式ローマ字表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

繋辞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

形式名詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275

形態素 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .53, 70

形態素解析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . xviii, 261

形態素分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

形容動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277

活用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277

検索 . . . . . . . . . . . . . . . . . . . . . 186, 201, 217, 226, 229

語彙 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

語彙解析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xviii

口蓋化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

後述引用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

後舌母音 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

行動 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

合同 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

行動出現頻度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .252

候補選択モード . . . . . . . . . . . . . . . . . . . . 185, 189, 192

コーダーモード . . . . . . . . . . . . . . . . . . . . 185, 189, 192

コーディング . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

コード

信頼性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .264

コード表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

コードファイル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194

語幹 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

国内サポート . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .173

五段活用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

語内の韻律 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

コマンドウィンドゥ . . . . . . . . . . . . . . . . . . . . 169, 174

コメント . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

コメント行 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

コメント表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

固有名詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275

誤用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

コロン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

コンマ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13, 74

使用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

最初の発話 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

作業ディレクトリー .see ワーキングディレクトリ

サ行変格活用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

子音動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70, 281

活用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281

時間的関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

自己中断未完成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .76

指示副詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292

指示形容詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291

指示名詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291

持続 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

実験用語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

質問・中断未完成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

自動置き換え記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

下一段活用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

社会経済的階層 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

借用語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276, 277

終助詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42, 295

終端記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

出現頻度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

出力ファイル . . . . . . . . . . . . . . . . . . . . . . . . . . . 179, 223

手話 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

使用言語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

上昇-下降の音調曲線 . . . . . . . . . . . . . . . . . . . . . . . . . 74

上昇-下降ピリオド . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

上昇疑問符 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

上昇する音調曲線 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

省略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48, 84

省略された接辞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .54

助動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286

自立語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .39, 43

新造語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

推定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

数詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292

数字 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

スコープ記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

スピーカ IDコード . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

スピーチアクトコード . . . . . . . . . . . . . . . . . . . . . . . . 93

スピーチエラー . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91

する . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

接語記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

359

Page 384: JChatman

索 引

接辞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

接続詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297

接続助詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41, 296

接頭辞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54, 70, 298

接頭辞記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

接尾辞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54, 70, 298

接尾辞記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

説明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84, 91

前述引用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

前舌母音 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

促音 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25, 28, 29

即答 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

ソニック . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . see Sonic

ターン . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256

対照強勢 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

第 2言語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

タイプ・トークン比率 . . . . . . . . . . . . . . . . . . . . . . . 180

タイムコード . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

タ形語幹 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

脱落 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

他の転写可能性 . . . . . . . . . . . . . . . . . . . . . . . . . . . 85, 90

多目的コード . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

ダラーマーク . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

単語一致検索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .258

単語の長さ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255

グラフ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .267

単文登録 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19, 135

断片的な音声 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

置換 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

中断未完成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

調子群 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

調子単位 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

重複

長さ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

長母音 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25, 28, 30

ティアコード . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

ティア除外 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

提題助詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294

ディペンデントティア . . . . . . . . . . . . . . . . . . . . 12, 89

ディペンデントティア表示 . . . . . . . . . . . . . . . . . . . .85

データ共有 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

データ情報ファイル . . . . . . . . . . . . . . . . . . . . . . . . . . 14

データファイル

複数の . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .228

データファイル形式 . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

データベース

Non-CHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

英語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

英語以外 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152

言語障害 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

二言語獲得 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

物語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

テ型複合動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .285

テクスト

CHAT変換 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266

デジタル音声ファイル . . . . . . . . . . . . . . . . . . . . . . . 190

デジタル化

音声 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328

ビデオ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .329

転記 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3

転置 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .see 外置

同音異義語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

同化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

統計分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265

統語構造 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

動作名詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276

動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279

同時関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

同時発話 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

特殊音 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

トランスクリプト . . . . . . . . . . . . . . . . . . . . . . . . . . 1, 70

取立助詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294

ナ形容詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277

活用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277

喃語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

二重母音 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

日記データ (baby biography) . . . . . . . . . . . . . . . . . xv

日本語の UNIBET表 . . . . . . . . . . . . . . . . . . . . . . . . . 98

日本語のアクセント . . . . . . . . . . . . . . . . . . . . . . . . . . 80

日本語表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

日本式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21, 29

入力のしやすさ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

入力ファイル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .179

年齢計算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271

パーセント . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12, 89

360

Page 385: JChatman

索 引

バイリンガル・データ . . . . . . . . . . . . . . . . . . . . . . . . 51

バグリポート . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .172

撥音 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25{27, 30

バッチファイル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

発話終端記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

発話数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

話しかける相手 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .90

話し手の行動 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

場面情報 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

判定詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286

活用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287

鼻音 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

低い平板型音調曲線 . . . . . . . . . . . . . . . . . . . . . . . . . . 74

非言語的データ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .83

非言語的発声現象 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

ビデオモード . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .192

表記 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5

表情 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

ピリオド . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12, 73

品詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274

コード . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .314

ファイル

SALT形式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265

ファイル・ヘッダー . . . . . . . . . . . . . . . . . . . . . . . . . . 33

不可欠のヘッダー . . . . . . . . . . . . . . . . . . . . . . . . 33

変更可能なヘッダー . . . . . . . . . . . . . . . . . . . . . .35

変更のないヘッダー . . . . . . . . . . . . . . . . . . . . . .34

ファイル形式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

チェック . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

フォント . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

不完全な語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

不規則動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

複合語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .71, 78

複合語記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

複合動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285

複合名詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275

副詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288

副助詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

付属語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .39, 43

不定詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290

プロミネンス . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

文節 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39, 43

文発達指標 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

分類辞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .55, 71

分類マーカー . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

平均発話語数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

平均発話長 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .xi, 219

平板型音調曲線 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .74

ヘボン式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21, 22, 29

ヘボン式ローマ字表 . . . . . . . . . . . . . . . . . . . . . . . . . . 31

変異動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

活用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

変換 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . see 文字列変換

母音動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71, 279

活用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280

方言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47, 51

ポーズ

長さ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

ホームページ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .323

補助動詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

ポストコード . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83, 87

翻訳 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

マクロ作成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

マザリーズ . . . . . . . . . . . . . . . . . . . . . . . . . . . see 幼児語

窓の杜 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329

未完成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

南式分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

身振りなどの情報 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

無声音 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

明確さ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

名詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275

メイン・ライン . . . . . . . . . . . . . . . . . . . . . . . . . . . 11, 73

メタキャラクタ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

モード切り替え . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189

モーラ (拍) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

モーラ・音節間の間断 . . . . . . . . . . . . . . . . . . . . . . . . 81

文字 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47, 50

文字名 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275

文字列の長さ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .255

文字列変換 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242

モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

物語解析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xviii

モ不定詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290

森川方式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62, 115

役割 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

361

Page 386: JChatman

索 引

融合記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

有声音 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

用言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

用言の形態素分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

幼児語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .275, 276, 289

イ形容詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289

動作名詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289

名詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289

呼びかけ語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

読みやすさ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

ライブラリディレクトリ . . . . . . . . . . . . . . . . . . . . . 169

リコール機能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .176

リダイレクション . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

リダイレクト . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .211

利用制限 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

列挙 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

連体詞 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279

ローマ字 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

ローマ字表記 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

録音機材 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327

ワーキングディレクトリ . . . . . . . . . . . . . . . . . . . . . 169

設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

ワープロ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

ワイルドカード . . . . . . . . . . . . . . . . . . . . . . . . .178, 209

分かち書き . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39, 273

和語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277

362