1. CHILDES とは
○概要
CHILDES(チャイルズ、CHild Language Data Exchange System) は
口頭言語のデータベースです。
第1言語の獲得研究がメインですが、第2言語習得、バイリンガリズム、言語障害、手話研究など、
幅広い研究分野からデータを集めています。
2012年現在は34言語のデータ(約 44,000,000語)を含めています。
以下の三つの部分からなります。
★発話データのファイルとメディア
★CHAT(チャット)という表記フォーマット
★CLAN(クラン)という言語解析プログラム
CHILDESは非営利な研究プロジェクトです。データベースやプログラムのダウンロードが無料です。
ブライアン・マクウィニー (Brian MacWhinney)(カネギー・メロン大学)によって運営されています。
○規則
CHILDESを利用する際、以下のルールを守ってもらいます。
★引用義務
CHILDESシステム(CHATフォーマットやCLANプログラムによる解析を含む)を利用した場合は、MacWhinney(2000)を引用しなければなりません。
CHILDESシステムを利用した場合:
MacWhinney, B. (2000). The CHILDES Project: Tools for analyzing talk. Third Edition. Mahwah,
N.J.: Lawrence Erlbaum Associates.
日本語フォーマットを利用した場合は以下のOshima-Takane & MacWhinney(1995)、または宮田・森川・村木(2004)を引用します。
Oshima-Takane, Y. MacWhinney, B., Sirai, H., Miyata, S., & Naka, N. (eds.) 1998. CHILDES for Japanese. Second Edition.
The JCHAT Project Nagoya: Chukyo University.
宮田 Susanne・森川尋美・村木恭子(編)(2004)『今日から使える発話データベースCHILDES入門』ひつじ書房
公開データを利用した場合は、次のような形になります(国際データベースのため日本語データの引用でも英語の文献になります)。
提供者(年)Japanese ○○ Corpus. Pittsburgh, PA: TalkBank. ISBN
例: Noji, J., Naka, N. & Miyata, S. (2004). Japanese Noji Corpus. Pittsburgh, PA: TalkBank. 1-59642-058-8.
★メンバー登録および文献報告
CHILDESは非営利で、主に各種研究費とボランティア活動によって運営されていますので、研究助成を申請する際、
利用者数や研究論文数がCHILDESのインパクトの指数になります。
(
2章を参照)
○データ利用に関する倫理ルール
CHILDESは、自然言語全般を対象としているTalkBankの一部として、
TalkBankの倫理ルール に
従っています。
そのルールについて7つの方針があります。以下はその概要です。
**方針 1 提供者に対する称賛
データを提供した研究者は、データ収集と整備にかなりの時間と労力をかけて、そのデータを公開してくれています。さらに研究の元になったデータの公開はその研究者に重い責任がかかってきます。もちろんすべての研究者がデータを公開している訳ではありません。その理由の一つに公開によって競争的に不利益を受けることを恐れるということがあるでしょう。また一つにデータ整備にかかる手間暇の問題があるでしょう。それらにも関わらずデータを公開することにした研究者を尊敬すべきです。データを利用したときは指定文献を丁寧に引用しましょう。
**方針 2 参加者に対する敬意
TalkBankに蓄積されている会話に参加している方々は、発話の研究にそのデータの使用を許可することによって科学に貢献しています。データを収集している研究者(コーパス提供者)及びでき上がったコーパスの利用者は、そのことを認知することが大切です。参加者に対する非難はもちろんのこと、個人の知的能力、言語能力、社会性、外見に関するコメント、また参加者間のそれらの比較を避けるべきです。
**方針 3 プライバシーの尊重
録音/録画そのものに加えて、年齢、録音/録画の場所(都市名、施設の形態など)以外の参加者個人に関する情報は公開されません。もちろん、参加者を許可なく勝手に録音、録画することは許されません。
また、参加者は「未知の研究者」によって自分の会話データが分析されることを想定しています。万が一利用者が参加者を知っていた場合、a) そのデータを利用しないようにする、b) その参加者に連絡を取り、許可を得る、c)提供者に連絡し、利用の仕方について確認するのいずれかの方法を選ばなければなりません。(ただし無名データや多数の参加者を含む縦断的解析法を用いる場合は個人が対象にならないためこの限りではありません)
**方針 4 社会集団への畏敬
TalkBankのデータは個人の提供者や参加者によって収集されていますが、個人といってもどこかの社会的な集団に属しています。歴史的な理由等によって、集団の多くは他の集団からの非難に対して敏感です。原則としてTalkBankデータの解析において集団間の社会的アイデンティティに影響を及ぼすような比較は避けるべきです。
**方針 5 倫理審査の承諾
利用者だけでは方針3及び4の判断がしにくい場合、TalkBankの倫理審査委員会に連絡してください。倫理審査委員会は方針3及び4に反しない科学的利用を促進することを主眼としています。
**方針 6 データ公開の責任
TalkBankの利用者は研究(特に文部科学省・大学・研究機関などによっての補助金で行われている研究)によって収集された発話データのコーパスを公開する義務があります。
**方針 7 制裁措置
利用者がこれらの倫理方針に違反した場合、そのことを個人さらには公的な場において指摘することについて、TalkBankメンバー全員がその責を負っています。尚、TalkBankが無責任な、または失礼な研究を阻止することは不可能ですが、その不正利用に対する科学コミュニテーの注意を引くことはできます。
○CHILDESを使った研究の一覧
CHILDESに報告された
研究の一覧。
CHILDESに報告された日本語関連
研究の一覧。
○困った時
★
クイック・ヘルプ
マニュアルどおりでやったつもりだけど、うまく行かない時、マニュアルを超えたことをやりたい時、またはバグを報告したい時は
info-childes@googlegroups.com(メンバー登録の際登録できるメーリングリスト)に送ることができます
(英語のみ;1600人以上登録している国際メーリングリストなので、書き方に注意が必要)。
直接
Brian MacWhinney(英語のみ)、
また日本語の場合は
宮田 Susanne に相談することもできます。
(注意:上記MacWhinney氏のリンクでは、宛先アドレスの@の後ろに空白が入れてあるので削除してください)
●バグ報告をする前に、最新バージョンのCLANをダウンロードして、もう一度確認して下さい。
○CHILDESのメーリングリスト
info-childes@googlegroups.com :言語獲得に関する情報とディスカッション、学会情報など。
現在1600名が参加して、週に6、7通くらい入って来ます。使用言語は英語です。
過去のメッセージ
chibolts@googlegroups.com :CLANプログラムに関するディスカッションと情報提供。
過去のメッセージ
phon@googlegroups.com :PHONプログラムに関するディスカッションと情報提供。
過去のメッセージ
CABank@googlegroups.com :会話分析に関するディスカッションと情報提供。
BilingBank@googlegroups.com :
バイリンガリズム研究、第2言語習得、インタラクションに関するディスカッションと情報提供。
直接、興味のあるMLに登録ができます。上記のアドレスにクリックし、Google グループのページからgoogleアカウントを作成してから、それぞれのMLに登録できます。
宮田 Susanne @ 愛知淑徳大学 2012jul25