テキスト計量分析セミナーの案内

 

言語の計量分析、コーパスを用いた言語・文体分析、テキストマイニングなど電子化されたテキストを対象とした研究が多く見られるようになっており、今後さらに活発化することは間違いありません。このような研究を進めるためには、コンピュータ上で関連するソフト(あるいはプログラム)を状況に応じて適切に用いることが必要です。しかし、経験のない方にとっては、しばしばハードルが高く感じられるようです。そこで、電子化されたテキストを用いた研究を始めようとしている研究者や大学院生などを対象とし、既存のフリーツールを用いた研究・講習会を企画します。

本研究・講習会では、研究資料の整理、加工処理、集計、分析に必要となるツールとその利用法について解説し、関連の最新の研究を事例として発表します。テキストを計量するツールとしては、GUI操作による多言語(日、中、韓、英)テキストを計量するツールMLTPを用います。また、各自のマシン上での演習指導も予定しています。

 

日時:   823() 10:00~14:45

会場:   同志社大学文化情報学部 夢告館1(未定)

内容:   10:0011:00  道端 秀範、西本 薫

テキスト計量分析のための基礎知識と関連ツール

(エディター、正規表現、Perl、形態素解析、構文解析など)

         11:0012:00  金 明哲、田中 量子

テキストの計量分析ツールMLTPR

                     (KWIC、文字、単語、文節のn-gramや共起の集計,R)

           13:0014:45  テキストの計量分析

(1)西本 薫 :三島の自己改造の文体は計量できるか?

(2)道端 秀範:大学学長のメッセージの計量分析

(3)土山 玄 :源氏物語の計量分析

(4)田中 量子:携帯メールの書き手の同定

(5)遠藤 健太:アンケート調査の自由回答文分析

      演習指導:西村 昌晃、道端 秀範、田中 量子、西本 薫

参加費:  無料

主 催:  同志社大学東アジア総合研究センター

参考資料: 金明哲(2009). テキストデータの統計科学入門、岩波書店

申し込み: 金明哲(mjin@mail.doshisha.ac.jp)までに申し込みください。

1. 参加者氏名: 漢字(ふりがな)

2. 身分: @教員・研究者、A大学院生、B学部生、Cその他

3. 所属

4. E-mai

 

注:     (1) 希望人数が5人以下の場合は、セミナーを中止します。

(2) 演習の指導を希望する方は、各自のノートパソコンにPerlや形態素解析ソフト( JUMAN ChaSenMeCabいずれか1つ), 構文解析ソフトCaboChaを事前にインストールしてください。

 

15:00~18:00は、同会場で国立国語研究所共同研究プロジェクト(萌芽・発掘型)「テキストにおける語彙の分布と文章構造」研究発表会が行われます。(http://www.ninjal.ac.jp/)

 

会場へのアクセス情報:

http://www.doshisha.ac.jp/access/tanabe_access.html

京田辺キャンパス:アクセスマップ

 

近鉄「興戸」駅から徒歩15
近鉄「新田辺」駅からバス・タクシーで8
近鉄「三山木」駅からバスで5
○JR
「同志社前」駅から徒歩10

610-0394 京田辺市多々羅都谷1-3 TEL0774-65-7010

 

携帯サイトで見る

http://www.doshisha.ac.jp/access/image/qr_tanabe.jpg

携帯カメラで読み取る

携帯にURLを送る
http://www.doshisha.ac.jp/i/access/tanabe.html

 

京田辺校地へのアクセス