防災へ、みんなで古文書読み解く

■防災へ、みんなで古文書読み解く

 過去の災害について記された古文書の知見を防災に役立てる研究で、読み解くのが難しい「くずし字」で書かれた古文書をインターネットで公開し、市民が協力して解読する取り組みが成果を上げている。東京大地震研究所にあった約500点の解読がわずか2年余りで完了。予想を上回るペースに専門家は「未知の災害や被害が見つかるかも」と、日本各地に残る古文書の解読を進めたい考えだ。

■正解率98.5%、新発見に期待

 東大地震研で20日に開かれたシンポジウム。国立歴史民俗博物館(歴博)橋本雄太助教(人文情報学)が期待を込めて言った。

 「把握されていない、文字起こしされていない歴史史料は膨大にある。研究者や学芸員だけで読み解くのは現実的でなかったが、市民が参加する解読は大きな可能性を秘めている」

 この取り組みは歴博と東大、京都大が2017年に始めたプロジェクト「みんなで翻刻(ほんこく)」。地震研が所蔵する495点の古文書を対象に、「くずし字」で書かれた文字を一文字ずつ現代語に訳し、過去にどんな災害が起きたのか、どんな被害があったのかと言った知見を掘り起こすことを目指した。

 とはいえ、くずし字を読み解くのは国文学などの専門家でなければ容易ではない。地震学者が一つずつ解読していては到底終わらない。そこで古文書をインターネットの専用サイトで公開し、一般市民ができる範囲で少しずつ解読できるようにした。

 例えば、享保13(1728)年の「江戸洪水記」には、「前代未聞の事也水は段階的に起こる高い所へ逃げるものもあるかまたは親類の縁者の方へ……」という一節がある。

 サイト(https://honkoku.org/)をパソコンで開くと、画面の右に古文書の画像が表示され、左に翻刻した文字が入力できる。

 参加者は古文書のどこからでも、読める部分だけ入力すればよく、分からない文字は「?」や空欄にしておけばいい。すると、経験豊かな別の参加者がいつの間にか埋めてくれる。希望すれば添削もあり、読めなかった文字の正解を知ることができる。

 「あらかた翻刻すれば、達人が誤ったところを修正してくれる最高の環境なので勉強になる」「自分にも読めるところがあっておもしろい」(期間中にあったツイッターの投稿から)

 自らが翻刻した文字が防災に役立ったり、勉強になったりするのが受け、今春までの2年余りで4626人が参加。古文書495点の465万文字が翻刻を終えた。その後も古文書が追加され、これまでに5千人が600万字を翻刻。結果を専門家に検証してもらったところ、抽出した10万文字の正解率は98・5%で、「出版物の初稿ぐらいの高い精度」だった。

 橋本さんらが開発した学習アプリもあり、くずし字の基本的な読み方を勉強したり、問題を解いて練習したりもできる。

 東日本大震災では、869年の貞観地震が東北各地に大津波をもたらしていたことが注目された。古文書の重要性は高まっているものの、翻刻されていない古文書は全国に多数眠る。

 サイトを立ち上げた地震研の加納靖之准教授(地震学)は「これまでも大きな被害があった地震については調べられてきたが、ある地域だけで観測されたような小さな地震の情報から新しい知見が見えるかもしれない。翻刻結果をデータベース化して、研究や解析に役立つよう整備したい」と語る。

■対象拡大、世界遺産の文書も

 想像以上の成果を受け、東大などは22日、「みんなで翻刻」をリニューアルして、災害以外の古文書も対象にすると発表した。

 まずはユネスコ世界記憶遺産に指定された国宝「東寺百合文書(とうじひゃくごうもんじょ)」をサイトで公開した。京都の東寺に伝えられた膨大な量の古文書群で、100個の桐箱に収められていたことから命名された。8~18世紀の約1千年間にあった重要な議事などが2万5千通にわたって記されているとされる。こうした貴重な古文書を市民の参加を求めて翻刻していく方針だ。

 橋本さんによると、江戸時代以前に刊行された和本は約150万点あるが、翻刻されたものは1万点に満たないとされる。加納さんも「災害以外にも分野を広げることで、市民も含めて参加者を増やすことができる。まだ知られていない新しい事実が出てくることに期待したい」と話す。

 AIによるくずし字の自動認識機能も新たに導入する。AIが読み方の候補に確率を付けて表示してくれる仕組みで、初心者でも参加しやすくなると見込む。

 ただ、AIにとってもくずし字は難易度が高く、解読はまだまだ途上という。開発チームの一つで情報・システム研究機構人文学オープンデータ共同利用センターの北本朝展(あさのぶ)センター長は「このプロジェクトを通じて、AIのくずし字の認識向上につなげたい」と話す。(小林舞子)