同志社大学  大学院文化情報学研究科   文化情報学専攻
 

データサイエンス研究室

研究室について

本研究室は、データサイエンスを方法論およびツールとした研究に焦点を当てている。データサイエンスは、データの収集、加工、処理、流通、分析などに関する科学であり、統計科学、情報科学、計算機科学を融合し、発展した研究分野である。

研究室における研究は、理論的研究と実証的研究に大別される。本研究室はデータに関する以下の研究に興味を持っている。


1.データ解析・マイニングに関する理論的研究

  • 確率論を含む数学をベースとした方法
  • アルゴリズムをベースとした機械学習方法
  • 計算(機)統計学

2.データサイエンスに基づいた人文社会科学を中心とした実証的研究

  • 文体学・文献学(stylometric, statistical style, computational style)
  • 言語学(corpus linguistics, mathematical linguistics, quantitative linguistic, computational linguistics)
  • メディア学(statistical media)
  • 法科学(mathematical/statistical/computational forensic science)
  • 文化学(culturometrics, statistical culture, cultural statistics)
  • 音楽(musicical mensurabilis, cantometrics, Arts Cantus Mensurabilis, stylometric of music,musical stylometrics)
  • 芸・絵画・美学(statistical aesthetics,stylometric of art-work)
  • 教育学(comparative education, statistics education)
  • 行動学(behaviormatrika, statistical behavior)
  • 経営学(management metrics)
  • 組織科学(organization science)
  • リスク分析(statistical risk)
  • サービス科学(service science)
  • 図書館情報学(statistical bibliography, bibliometrics)

3.一緒に考えてチャレンジして欲しいこと

  • 人間は何であるか?
  • 人間は何で文学・芸術作品を作るか?
  • 人間が文学作品を読む,芸術作品を見て感じるというのは何であるか?
  • 人間が感じているのと同等な自律型人工知能は可能であるか?
  • その基礎となるのは、データに基づいた文芸評論、比較分析ではないか?
Go To Top

論文リスト

論文発表

2019年度

  • 入江 さやか, 金 明哲 (2019). 方言録音文字化資料における拍bigramから見た方言分類―岐阜・愛知方言の所属は東か西か―, 計量国語学, 32(1), 印刷中, 査読あり.
  • 前田 侑亮, 金 明哲(2019).トピックモデルによる関西私鉄沿線の特徴分析,情報知識学会, 29(1), 3-22, DOI: https://doi.org/10.2964/jsik_2018_027,査読あり.
  • 李広微, 金明哲 (2019).統計解析からみた小説『続明暗』の文体模倣,計量国語学,32巻1号(2019年6月)または32巻2号(2019年9月)に掲載予定.査読あり.
  • W. Zheng and M. Jin (2019). Comparing Multiple Categories of Feature Selection Methods for Text Classification, Digital Scholarship in the Humanities, 印刷中, 査読あり.

2018年度

  • H. Sun and M. Jin (2018). Collaborative Writing of Yasunari Kawabata's Novel Otome no minato. Structure, Function and Process in Texts. 116-127, RAM-Verlag Publishing. 査読あり.
  • W. Zheng and M. Jin (2018). A comparative study of feature selection methods. International Journal on Natural Language Computing, 7(5), 1-9. 査読あり.
  • 財津 亘, 金 明哲(2018). 性別を偽装した文章における文体的特徴変化, 同志社大学ハリス理化学研究報告, 59(3), 47-54. 2018/10/31. 査読あり.
  • 財津 亘, 金 明哲(2018). パソコン遠隔操作事件で調著者識別による犯人性立証は可能だったか?,情報知識学会,28(3), 253-258. 2018/9/30,査読あり.
  • 財津 亘, 金 明哲(2018). 文末語の使用率に基づいた筆者識別―探索的多変量解析の実施と分析結果に対すスコアリングによる検討―、計量国語学,第31巻6号,417-425. 2018/9/20,査読有り.
  • 財津 亘, 金 明哲(2018). 機械学習を用いた著者の年齢層推定―犯罪者プロファイリング実現に向けて―, 同志社大学ハリス理化学研究報告, 59(2), 57-65. 2018/7/31, 査読あり.
  • 財津 亘, 金 明哲(2018). テキストマイニングによる筆者識別の正確性ならびに判定手続きの標準化. 行動計量学会誌. 45(1). 39-47.査読あり.
  • 孫 昊, 金 明哲 (2018). 川端康成小説『花日記』の代筆疑惑検証. 情報知識学会誌. 28(1). 3-14.査読あり.
  • 鄭 弯弯, 金 明哲 (2018). 変動係数を用いた語彙の豊富さ指標の比較評価. 同志社大学理化学研究報告書. 58(4).74-85.2018/1/31, 査読あり.

2017, 2016年度

  • H. Sun and M. Jin (2017). Verifying the Authorshipication of the Yasunari Kawabata’s Novel: The Sound of the Mountain. Journal of Mathematics and System Science. 7. 127-141.
  • 劉 雪琴, 金 明哲(2017). 入院する前に宇野浩二の文体は既に変わっていたのか, 情報知識学会誌,27(3):245-260.
  • 劉 雪琴, 金 明哲(2017). 宇野浩二の病気前後の文体変化に関する計量的分析, 計量国語学, 31(2):128-143.
  • 財津 亘, 金明哲 (2017). 階層的クラスター分析結果にスコアリングを導入したテキストマイニングによる筆者識別. 科学警察研究所報告. 66(2). 75-81.
  • 財津 亘, 金 明哲 (2017). ランダムフォレストによる著者の性別推定-犯罪者プロファイリング実現に向けた検討-. 情報知識学会誌. 27(3). 261-274.
  • 財津 亘, 金 明哲 (2017). テキストマイニングを用いた筆者識別へのスコアリング導入―文字数やテキスト数,文体的特徴が得点分布に及ぼす影響―. 日本法科学技術学会誌. 22(2). 91-108. 早期公開番号(ID: 715, http://doi.org/10.3408/jafst.715.
  • H. Sun and M. Jin (2016). The relation between stylometrics and neuroscience, Neuroscience and Biomedical Engineering. 4(3), 174-180.
  • W. Zaitsu and M. Jin (2016). Stylometric analysis for case linkage of Japanese communications from criminals: Distinguishing originals from copycats, International Journal of Police Science & Management, 18(1), 21-27.
  • 李 鍾賛, 崔 在雄, 金 明哲 (2016). 語節パターンを用いた韓国語文章の著者識別. INFORMATION. 20(1B). 417-428.

学会発表

2019年度

  • H. Sun and M. Jin (2019). Quantitative Analysis of Writing Style Problem in Yasunari Kawabata’s Novels. Global Digital Humanities Symposium.at 2019 Global Digital Humanities Symposium, Michigan State ・University,Mar 21-22. America.*refereed.
  • 孫 昊, 金 明哲 (2019). 日本語著者識別における文書の長さについて. 第8回知識・芸術・文化情報学研究会.1月26日. 立命館大学大阪いばらきキャンパス.
  • 鄭 弯弯, 金 明哲 (2019). 特徴訓練に基づいた分類器FTApproachの提案. 情報処理学会第81回全国大会.2-13:2-14. 3月14日-3月16日. 福岡.

~2018年度

  • H. Sun and M. Jin (2018). Quantitative Analysis of Writing Style Problem in Yasunari Kawabata’s Novels. 9th International Conference of Digital Archives and Digital Humanities.at Dramra Drum Institute of Liberal Arts (DILA),Dec 18-21. Taiwan. *refereed.
  • H. Sun and M. Jin (2018). Phonemes as Stylometric Features in Japanese Authorship Attribution. Digital Humanities Austria 2018.Nov 29-Dec 01,at the Paris Lodron University Salzburg, Austria. *refereed.
  • H. Sun and M. Jin (2018). Ghostwriting problem of Yasunari Kawabata's Novel Soranokatakana. Digital Humanities Australia 2018.Sep 25-28.at University of South Australia, Australia. *refereed.
  • R. Yukimura, H. SUN,M. JIN (2018),Feature analysis of paintings using color information of the image, 5th conference digital humanities austria. Nov 29-Dec 01, Salzburg, Austria. *refereed.
  • N. Oshiro, M. Jin, A. Kawase, H. Sun (2018),Classification of Osamu Dazai‘s works based on part-of-speech bigrams and usage of commas,5th conference digital humanities austria. Nov 29-Dec 01, Salzburg, Austria.*refereed.
  • G. Li and M. Jin (2018), Epoch changes of stylistic features in modern Japanese novels, 5th conference digital humanities austria. Nov 29-Dec 01, Salzburg, Austria.*refereed.
  • S. Huang and M. Jin (2018), Japanese Authorship Attribution Based on Sentence Pattern, 5th conference digital humanities austria. Nov 29-Dec 01, Salzburg, Austria.*refereed.
  •   
  • W. Zheng and M. Jin (2018), Evaluate Lexical Richness Measures Using Coefficient of Variation and Relative Value. 19th International Conference on Computational Linguistics and Intelligent Text Processing. Mar 18-24, Hanoi, Vietnam.*refereed.
  •  
  • W. Zheng and M. Jin (2018), Comparing feature selection methods by using rank aggregation, Proceedings 16th IEEE International Conference on ICT and Knowledge Engineering, 1-6. Nov 21-23, Bangkok, Thailand.*refereed.
  • W. Zheng and M. Jin (2018), Do we need more samples for text classification?, 2018 Artifical Intelligene and Cloud Computing Conference Abstract. 28. Dec 21-23, Tokyo, Japan.*refereed.
  •  
  • 孫 昊, 金 明哲 (2018). 音素を特徴量とした著者識別.第46回日本行動計量学会抄録集. 390-391. 9月3日-6日,東京.
  • 尾城 奈緒子, 金明哲 (2018). 太宰治の前期文体における芥川作品からの影響の有無について. 第46回日本行動計量学会抄録集. 36-37. 9月3日-6日, 東京.
  • 尾城 奈緒子, 金明哲 (2018). 文末表現に着目した文学作品の分類. 2018年度日本分類学会シンポジウム. 11月24日-25日, 沖縄.
  • 行村 隆平, 金 明哲 (2018). 絵画作品における色彩的特徴の計量的比較分析. 第46回日本行動計量学会抄録集. 40-43. 9月3日-6日, 東京.
  • 行村 隆平, 金 明哲 (2018). 絵画作品における色彩情報を用いた画家の識別. 2018年度日本分類学会シンポジウム. 11月24日-25日, 沖縄.
  • 劉 雪琴, 金 明哲 (2018). 判別分析による宇野浩二と同時代作家の比較分析. 第46回日本行動計量学会抄録集. 44-47. 9月3日-6日, 東京.
  • 劉 雪琴, 金 明哲 (2018). トピックモデルに基づく宇野浩二の創作時期についての検討. 2018年度日本分類学会シンポジウム. 11月24日-25日, 沖縄.
  • 劉 雪琴, 金 明哲 (2018). 宇野文学の計量分析ー同時代の作家との比較として. 第32回日本計算機統計学会. 5月26日-27日, 山口.
  • 鄭 弯弯, 金 明哲 (2018). 特徴選択方法の性能評価分析. 第46回日本行動計量学会抄録集. 48-51. 9月3日-6日, 東京.
  • 李 広微, 金明哲 (2018). 現代日本語小説の文体的特徴の変化について-大正・昭和の作品を中心として-. 第46回日本行動計量学会抄録集. 384-385.9月3日-6日, 東京.
  • 李 広微, 金明哲 (2018). 戦前・戦後の日本小説の分類とその特徴分析. 2018年度日本分類学会シンポジウム. 11月24日-25日, 沖縄.
  • 入江 さやか, 金 明哲 (2018). 方言録音文字化資料における拍bigramを用いたトピックモデルによる方言分類. 第46回日本行動計量学会抄録集. 386-387. 9月3日-6日, 東京.
  • 孫 昊, 金 明哲 (2018). 音素を文体特徴量とした日本語著者識別. 第46回日本行動計量学会抄録集. 390-391. 9月3日-6日, 東京.
  • 黄 善玉, 柳 燁佳, 金 明哲 (2018). 著者識別における文型特徴量の有効性に関する比較分析. 第46回日本行動計量学会抄録集. 392-393. 9月3日-6日, 東京.
  • 黄 善玉,金 明哲 (2018). 文型に基づいた著者識別.2018年度日本分類学会シンポジウム. 11月24日-25日, 沖縄.
  • 柳 燁佳, 金 明哲 (2018). 日本語文学作品の著者識別におけるfastTextの性能の比較分析. 第46回日本行動計量学会抄録集. 394-397. 9月3日-6日, 東京.
  • 柳 燁佳, 金 明哲 (2018). 複数特徴量を用いた菊池寛代作問題の分類分析.2018年度日本分類学会シンポジウム. 11月24日-25日, 沖縄.
  • 鄭 弯弯 (2018). 語彙の豊富さの新しい指標.言語処理学会第24回年次大会.3月12日-3月16日, 岡山.
  • H. Sun and M. Jin (2017). Collaborative Authorship Visualization of Yasunari Kawabata’s Novel. International Conference on Culture and Computing. Sep 10-12, Kyoto, Japan.
  • H. Sun (2017). Authorship Attribution of Yasunari Kawabata’s Novels. Joint Symposium of Doshisha University and Tamkung University.
  • X. Liu and M. Jin (2017). Stylistic Analysis of Kōji Uno’s Works Based on Data, The 2nd International Workshop on Language Technologies and Applications.Sep 3-6, Prague, Czech Republic.*refereed.
  • X. Liu and M. Jin (2017). The Changes Over Time in Koji Uno’s Writing Style, 2017 Conference of the International Federation of Classification Societies. Aug 8-10, Tokyo, Japan.
  • W. Zheng and M. Jin (2017). A comparative evaluation of feature selection methods. 2017 Conference of the International Federation of Classification Societies. Aug 8-10, Tokyo, Japan.
  • 入江 さやか, 金 明哲 (2017). 文末拍を用いた方言分類 方言録音文字化データを資料として. 第45回日本行動計量学会抄録集. 166-167. 8月29日-9月1日, 静岡.
  • 劉 雪琴, 金 明哲 (2017). 宇野文学における経時的な文体変化に関する計量分析.第45回日本行動計量学会抄録集. 162-165. 8月29日-9月1日, 静岡.
  • 李 広微, 金明哲 (2017). 水村美苗の『続明暗』に関する文体計量分析.第61回計量国語学学会.9月30日, 東京.
  • 尾城 奈緒子, 金明哲 (2017). 太宰治の前期作品における文体変化の定量的分析.第45回日本行動計量学会抄録集. 168-171. 8月29日-9月1日, 静岡.
  • 尾城 奈緒子, 金明哲 (2017). 太宰治の前期作品における1文中の読点の使用頻度の検討.第61回計量国語学会抄録集. 37-42. 9月30日, 東京.
  • 鄭 弯弯, 金明哲 (2017). 語彙の豊富さの指標の評価に関する研究の問題点と改善方法.第61回計量国語学会抄録集. 7-12. 9月30日, 東京.
  • 鄭 弯弯, 金明哲 (2017). 語彙の豊富さを表す指標の改良と評価.第45回日本行動計量学会抄録集. 72-75. 8月29日-9月1日, 静岡.
  • 行村 隆平, 金 明哲 (2017). カラーコードを用いた絵画作品の色彩的特徴分析.第45回日本行動計量学会抄録集. 64-67. 8月29日-9月1日, 静岡.
  • 柳 燁佳, 孫 昊, 金 明哲 (2017). 菊池寛「慈悲心鳥」代作問題に関する分類・判別研究.日本分類学会第36回大会予稿集. 17-20. 12月4日-5日, 札幌.
  • 柳 燁佳, 孫 昊, 金 明哲 (2017). 菊池寛作品に関する代作疑惑の計量文体学的な検証.第45回日本行動計量学会抄録集. 176-179. 8月29日-9月1日, 静岡.
  • 黄 善玉, 金 明哲 (2017). 文型を特徴量とした文章の著者識別.第45回日本行動計量学会抄録集. 172-175. 8月29日-9月1日, 静岡.
  • 袁 徐晟, 金 明哲 (2017). 中国ショッピングサイトにおける信憑性が低いレビューの特徴分析. 第45回日本行動計量学会抄録集. 68-71. 8月29日-9月1日, 静岡.
Go To Top

研究について

研究の仕方について


論文の書き仕方について


参考文献の書き方について

Go To Top

連絡先

Address
〒 610-0394 
京田辺市多々羅都谷 1-3
1-3,Tatara Miyakotani, Kyotanabe,
Kyoto, Japan

Phone:+81-(0)774-65-7682
Email: mjin@mail.doshisha.ac.jp
Go To Top