FACULTY MEMBERS
文章のスタイルや言葉の使い方を分析し、
著者の個性を見抜く!
「著者識別」の研究で文体の奥深さに迫ります。
著者の個性を見抜く!
「著者識別」の研究で文体の奥深さに迫ります。
FACULTY MEMBERS
柳 燁佳
外国人留学生助手
統計科学、計算科学、知覚情報処理
PROFILE
2023年、同志社大学大学院文化情報学研究科博士課程修了。同年4月より現職。中学時代にプログラミング言語C++の勉強がきっかけで、コンピューター・サイエンスに惹かれ、それを大学院時代に教わった統計学の知識と結び合わせて、テキストから、見過ごされがちなメタ情報を発見する面白さに開眼。現在は、文学作品を分析材料として、人間の文体が通時的に安定しているかについて研究を進めている。
「誰が書いたのか」を科学的に解き明かす
文章から「指紋」を見つける「著者識別」の魅力
私の研究分野は、文章の長さ、単語の使用頻度、文法構造などを数値化し、文体を客観的に記述することで文章の傾向を見つける計量文体学です。昔シェイクスピアのファンたちが、ある作品がシェイクスピアによって書かれたのかどうかを長らく争う中で、計量文体学の技法が練り上げられました。私は、計量文体学の中でも「著者識別」を専門としています。「著者識別」は、文章から著者独自の文体を分析し、「誰が書いたのか」を特定することを目的としています。いわば、文章から指紋を見つけ出し、著者を見分けるようなもの。実際、刑事裁判などで著者識別の結果が証拠として使われることもあります。
そもそも私が言語に興味を持ったきっかけは、小学校での英語の授業です。母語を自然に身につける過程では気づかなかった言語のルールや構造を知り、その奥深さに魅了された経験は、現在の研究へのモチベーションの源泉となっています。文章をただ読むのではなく、文章を構成するさまざまな要素を目的に応じて組み合わせて分析し、文章に隠された情報を見つけ出すのはとても面白く、計量文体学の醍醐味です。また、新しい分析手法の開発にあたって、ルールをゼロから作成するのは膨大な労力がかかりますが、試行錯誤の末に完成したときの達成感はひとしおです。
そもそも私が言語に興味を持ったきっかけは、小学校での英語の授業です。母語を自然に身につける過程では気づかなかった言語のルールや構造を知り、その奥深さに魅了された経験は、現在の研究へのモチベーションの源泉となっています。文章をただ読むのではなく、文章を構成するさまざまな要素を目的に応じて組み合わせて分析し、文章に隠された情報を見つけ出すのはとても面白く、計量文体学の醍醐味です。また、新しい分析手法の開発にあたって、ルールをゼロから作成するのは膨大な労力がかかりますが、試行錯誤の末に完成したときの達成感はひとしおです。
長い期間を置いて書かれた文章にも、文体の一貫性はあるのか
近年では、著者識別の前提となる文体の一貫性の発現が条件付きであることを示唆するケース・スタディーがいくつか発表されています。私が現在取り組んでいるのは、その条件の特定です。具体的には、「隔たる時期に書かれた文章でも共通した書き手の特徴が見られるか」が研究テーマです。通常、短い間隔で書かれた文章同士では、特徴が安定して発現すると考えられています。しかし、一定の期間を超えると特徴の発現がどのくらい不安定になるのかについては研究が進んでいません。書き手につながる特徴の安定的な発現が保証されなければ、「個人文体」は本当に存在するのかという計量文体学の根幹に関わる問題に発展しかねません。したがってこの研究は、従来の計量文体学に一石を投じるものとなるでしょう。
また、現在は限られた人たちの文章を用いて個々人の文体特徴を見つける段階ですが、「特定の属性を共有する人々が共通した文体特徴を持っているのか」についても興味があります。例えば、特定の疾患を抱える人が書いた文章を分析し、病状を客観的に観察する研究も行われています。将来的には、そうした人々が持つ共通した文体の特徴を形成した背景や理由を明らかにしたいと考えています。
また、現在は限られた人たちの文章を用いて個々人の文体特徴を見つける段階ですが、「特定の属性を共有する人々が共通した文体特徴を持っているのか」についても興味があります。例えば、特定の疾患を抱える人が書いた文章を分析し、病状を客観的に観察する研究も行われています。将来的には、そうした人々が持つ共通した文体の特徴を形成した背景や理由を明らかにしたいと考えています。
情報過多な時代だからこそ、計量文体学が必要とされる
計量文体学、著者識別などの分野は、簡単に言うと言葉を研究する学問です。言葉で溢れ返っている現代を生きていくには、正確な情報へ迅速にアクセスする力が重要です。研究が進むことで著者に関する情報を高い確度で推測することが可能になるため、商品レビューの信頼性の評価やなりすまし被害の防止、不正なプログラムで操作されているSNSアカウントの検知、知的財産保護などの社会的ニーズにも応えられると期待されています。