古典籍TEI/XMLマークアップ方針作成のための指針に向けて

はじめに #

本文書の目的と位置づけ #

 本文書は、国文学研究資料館内の古典籍TEI勉強会メンバーが、日本古典籍のテキストデータの作成と公開の進展を見据え、そのテキストデータのTEI/XMLデータ作成方針を定める際の参考資料となるものを目指して作成したものである。

 本文書の作成の前提に、文部科学省「AI等の活用を推進する研究データエコシステム構築事業」におけるユースケース創出課題として採択された「古典籍テキストデータを活用したデータ駆動型人文学のための研究資源構築プロジェクト」(研究代表者:菊池信彦)がある。これは、データ駆動型人文学の推進と確立に向け、古典籍資料を対象とした構造化データ(TEI/XMLデータ)の作成と公開を目的としたものであり、加えて、データ作成ノウハウを国文学研究者や古典籍所蔵機関と共有することで、広く古典籍TEI/XMLデータの普及を目指した研究プロジェクトである。この研究プロジェクトは、前述の国文学研究資料館の研究職員を中心とした古典籍TEI勉強会メンバーを中心に進め、そこでメンバーそれぞれが研究対象としている古典籍資料のマークアップを実践した。本文書はその実践経験をもとに、それぞれの対象資料のマークアップ方針をまとめたものである。なお、「古典籍テキストデータを活用したデータ駆動型人文学のための研究資源構築プロジェクト」に関与したメンバーは次の通りである。

「古典籍テキストデータを活用したデータ駆動型人文学のための研究資源構築プロジェクト」メンバー(2023-2024年度) (なお、所属機関や職名等は当時のもの)

氏名 所属機関・部局等・職名
菊池 信彦(研究代表) 国文学研究資料館・研究部・准教授
海野 圭介 国文学研究資料館・研究部・教授
木越 俊介 国文学研究資料館・研究部・教授
山本 嘉孝 国文学研究資料館・研究部・准教授
松田 訓典 国文学研究資料館・研究部・准教授
岡田 一祐 慶応義塾大学・准教授
松永 瑠成 国文学研究資料館・研究部・特任助教
幾浦 裕之 国文学研究資料館・古典籍共同研究事業センター・特任助教
李 澤珍 国文学研究資料館・古典籍データ駆動研究センター・機関研究員
José Manuel Escalona Echániz 総合研究大学院大学 研究生

 したがって、本文書は研究プロジェクトで取り上げた古典籍のマークアップ方針をベースとしたものであり、それゆえ古典籍一般に適用可能なTEI/XMLマークアップ方針ではない。それを目指してはいるが、あくまで暫定的なものであって、今後他の資料へと波及していく中で、記述の見直しと更新を前提としたものであることを、あらかじめご理解いただきたい。不完全なものではあるが、それでも古典籍の構造化データの進展に資するものであることを信じ、ここに公開するものである。

本文書の構成 #

 本文書の構成は以下のとおりである。