教育学生セミナー
2024年度 文理融合AI・データサイエンスセンター/ ジェンダード・イノベーション研究所 共同セミナー
データサイエンス × ジェンダード・イノベーション 小説の文体に潜むジェンダーの魅力を発見しよう!
小説家の文章の特徴をジェンダーの視点から見つけてみませんか?
本セミナーではデータサイエンスの知識とRの技術を用いて近現代の小説の文体を分析できる内容になっています。
Webアプリで分析を実施するので、データサイエンスのスキルを問わず皆様の参加を歓迎します。
セミナーを通してデータサイエンスとジェンダード・イノベーションとのつながりを考える機会になればと思います。
開催概要
対象 | 学部生・院生 |
---|---|
日時 | 1日目:2025年1月9日(木)17:00~18:30 |
場所 | 本館127室 |
担当教員 | 伊藤貴之(文理融合AI・データサイエンスセンター) 矢野緑里(文理融合AI・データサイエンスセンター) 高丸理香(ジェンダード・イノベーション研究所) 相川頌子(ジェンダード・イノベーション研究所) |
申込 | オンラインフォーム |
主催・問合先 | 文理融合AI・データサイエンスセンター(矢野) (問合先)E-mail:ocha-igi@cc.ocha.ac.jp |
プログラム
- 1日目
テキストマイニングの基礎
Webアプリの紹介
文体分析の実施 - 2日目
分析結果の発表
講評
開催報告
ジェンダード・イノベーション創出の基盤となる性差分析には、データサイエンスの知識や技術が重要である。なかでも、テキストデータを対象とするテキストマイニングは、膨大なテキストデータから客観的に知見を導き出すことができる技術であり、既存データの利活用の観点から高い注目を集めている。
本セミナーでは、文理融合AI・データサイエンスセンターの矢野緑里特任AFが独自に開発したテキストマイニングのウェブアプリ教材を用いて、小説のオープンデータ「青空文庫」にある小説の文体を作家の男女別に分析することを目的とした。
- 1日目
矢野AFよりテキストマイニングの基本的な流れについて説明があった。具体的には、テキストマイニングの手法、使用するテキストデータ、文章を意味のある最小単位(形態素)に分割する形態素解析、単語情報の集計方法、データの分析・可視化の手法についてである。また、ウェブアプリの機能と利用方法について、実演をまじえながら解説があった。そのほか、ウェブアプリの実践的な活用として、文末表現の単語の使用傾向を男女の作家別に分析する、夏目漱石の「坊っちゃん」の冒頭の一節を女性作家風にアレンジするという課題も出された。 - 2日目
セミナー参加者による分析結果の発表が行われた。単語の使用頻度分析の課題では、ウェブアプリを用いながらも、参加者の専門的な知見に基づき、独自の解析を取り入れたことが報告された。「坊っちゃん」の冒頭として知られる「吾輩は猫である」を、先に分析した文末表現の男女差を踏まえてアレンジする課題では、女性作家の方がよく使用する終助詞や助動詞に着目し、「わたし猫なの」「吾輩は猫であるのよ」といった表現を用いるなど、ユニークなアイデアが共有された。最後に、伊藤教授及び矢野AFから、文体の特徴を取り除いた文章の作成・分析の技術によって、エントリーシートやアンケートのジェンダー・バイアスの是正が可能となり、平等な選考や公平な意見の収集が行われるだろうとの展望が述べられ、閉会となった。 - 参加者のコメント
- 興味深い企画をありがとうございました。このようにすると、ジェンダーの特徴がみられるのか、ということを実際に、データを使って体験ができました。ありがとうございます。
- 動機としては誘われたから出てみたのですが、思ったよりずっと興味深く学び楽しめました。小説等のテキストデータはビッグデータサイエンスと親和性が高いですが、それを簡単に扱える分析ツールを開発したことは素晴らしいと思います。教材としても極めて有用ですし、研究面でも新たな発見ができそうな印象を受けました。
報告担当:相川 頌子(特任講師)
【参加者数】8名(オンライン参加の学生・院生、教職員を含む)