Historiografía Digitalを構築中: #DayofDH2016 に寄せて

今日、2016年4月8日は、デジタル人文学の日”Day of DH 2016“とされている。このDayofDHは、世界のDH研究者らが「実のところDH研究者は何やってるのか?」を紹介・アピールする日とされているので、自分も現在作っているDHサイトのことを書いてみようと思う。

筆者の専門は、スペイン近代史、それも史学史であり、構築中のサイト”Historiografia Digital”もそのスペイン史学史に貢献しうるようなものを目指している。

Historiografia Digital (まだ「箱」だけ)
http://historiadigital.sakura.ne.jp/historiografiadigital/project/

このサイトでは、19世紀のスペインにおける歴史家の書籍や論文、講演記録等(もちろん著作権の切れたもの)のテキスト化をクラウドソーシングで行い、研究利用可能なテキストデータを作ること、そしてそれを分析することを目的としている。

スペインは、2012年から2014年まで、ヨーロッパ諸国の中でもEuropeanaへの提供は2番目に高いらしく、デジタル化資料もそこそこ多い。むろん史学史で扱うようなデジタル化史料も多い。しかしながら、その提供データを見ると、OCRによるテキストデータはかなりの誤認識があり、そのままでは分析やテキスト検索では信頼できないレベルのものばかりである。

誰か何とかしてくれないものかとぼんやり考えていたが、このままでは単なる待ちぼうけになりそうなので、停滞したこの状況を動かすべくあまりにも小さいがこのようなサイトを作ろうと思った次第である。また、デジタル化公開元の機関は、筆者の研究関心を満たすようなデータの整理と公開はしてくれないだろう、という予想もあった。もちろんデータは提供元のCCライセンスに準じて公開するつもりであるし、可能であればスペイン側の研究機関や図書館などにも渡せられればと思っている。

サイトは、Sakuraインターネットにサーバーを借りて、OmekaをベースにScripto等のプラグインを追加して作っている。本当は今日リリースを発表すべく準備を進めていたが、残念ながら他の仕事もあって間に合わなかった。

実際に作ってみる/作り始めてみると、いくつか思うことがある。

一つ目は、「歴史家」とはだれか、どこまで含めればよいのか、という史学史上の問題。

職業研究者の登場は19世紀後半を待たねばならないが、それまでにも多数の歴史学に関する著作は発行されている。では、”Historia”とタイトルにあればよいのかというと、そう単純にもいかない。そもそもサイト構築の趣旨が、信頼できるようなテキストデータを作ることだけでなく、さらにDistant Readingのように巨視的に史学史を眺めることにあるので、そうなるとその視野をどこまで拡大させればよいかわからなくなる。歴史家とは何か、というのは結構古い問題だと思うが、自分の研究関心では限定的な捉え方をするのではなく、なるべく広く揺らぎのある形で包含する必要だろうと思う。その意味で、デジタルヒューマニティーズは–よく言われることだが–新しい視角を提供するものといえる。

二つ目は、自分独自のコレクション作成の難しさである。

「歴史家」の定義の揺らぎはさておき、ひとまず有名人の歴史書を扱おうとした場合でも、その史料の捜索に結構手間取った。利用可能なデータを検索する難しさである。

例えば、ひとまずコレクションの1つとして作成したModesto Lafuenteは、『スペイン全史』(Historia General de España )を著した、スペイン近代史学史上の重要人物である。もちろん、著作はデジタル化されているのだが、調べてみると初版本のデジタル化が見つからない。いかにも初版本と思われるようなメタデータの書きっぷりであっても、中身を見てみると刊行年がLafuenteの死後のものもあったりした。さしあたりいろいろ「放り込む」ようにしようと思う。

また、いろいろなデジタルアーカイブからデータを引き抜いて、自分のコレクションを作成することの難しさもある。これには、さしあたりZoteroを経由してデータをOmekaに移すようにしてみるつもり。

現状は、作りながら考える、考えつつ作るしかないが、本当に正式公開できるか、運用していけるのかどうかは正直不安なところではある。が、一人でやっているので、あまり深刻に考える必要もないだろう。

そんなわけでDayofDH2016の日は暮れていく。

 

コメントする

カテゴリー: Uncategorized

“Humanities World Report 2015″におけるデジタルヒューマニティーズの現況

世界の人文学の現況をまとめたレポート”Humanities World Report 2015″が刊行されている。

Poul Holm, Arne Jarrick and Dominic Scott . (November 2014). Humanities World Report 2015 . [Online] Available at: http://www.palgraveconnect.com/pc/doifinder/10.1057/9781137500281.0001. (Accessed: 7 January 2016).

Poul Holm, Arne Jarrick, Dominic Scottの3人による同名プロジェクトの成果で、2014年11月の刊行の模様。紙は有料だが、電子書籍であればCC BYでオープンアクセスとなっている。発行元のPalgraveの紹介は以下の通り。

This book is open access under a CC BY license. The first of its kind, this ‘Report’ gives an overview of the humanities worldwide. Published as an Open Access title and based on an extensive literature review and enlightening interviews conducted with 90 humanities scholars across 40 countries, the book offers a first step in attempting to assess the state of the humanities globally. Its topics include the nature and value of the humanities, the challenge of globalisation, the opportunities offered by the digital humanities, variations in funding patterns around the world, and the interaction between humanities and society. Despite the stereotypical view of humanists as scholars locked away in their ivory towers, the picture that emerges from this report is that they are deeply committed to the social value of their work and appreciate the long-term importance it has for addressing global challenges. The report will be of interest not only to researchers and students in the humanities themselves, but also to administrators and funders.

それで、上にも書かれているが、この中でDigital Humanitiesに一章割かれていたので、内容をかいつまんでメモしておきたい。

章の全体的な流れは以下の4つになる。
①世界におけるDHの研究センター
②DHの研究動向
③DHに対する人文学の研究者からの批判・インタビュー記録
④まとめ

①世界におけるDHの研究センター
ここでは、centerNetをもとに、DHセンターの分布・研究者所在の情報を確認している。
相変わらずの欧米における層の厚さが指摘されている。

②DHの研究動向
DHCommonsのプロジェクトを利用しつつ、DHの研究領域を以下の5分野に分類し、それにかかわる研究プロジェクトを例示している。

(1)Digital collections, archiving and text encoding
(2)Reading and analysing electronic texts
(3)Geospatial and critical discursive mapping technologies
(4)Big Data,’ social computing, crowdsourcing, and networking
(5)3D immersive visualisation environments

(1)はデジタル化・テキスト化(OCR/クラウドソーシング)の話題と、TEIを利用したメタデータ共通化の話題。
⇒ちなみに、ここでは国文学研究資料館の歴史的典籍に関する大型プロジェクトも言及ある(pp.68-69.)。

A major Japanese project is the Integrated Database of Classical Japanese Texts in the pre-Meiji Period. This database of documents from Japan’s pre-1868 era involves the National Institute of Japanese Literature as the core institute. The project proposes compiling a new database with links to bibliographies, images of original manuscripts and transliterated texts.

(2)は電子テキストの読解環境の構築およびテキスト分析研究について
Debates in DHを挙げて、DHコミュニティによる共同読解を指摘。
その他に研究手法として”stylometry”、”content-based analysis”(頻度分析・トピックモデル)、”metadata analysis”をあげている。また、TAPoR・Voyant・Textal・WordSeerに言及あり。

(3)GISのプロジェクト
Hypercitiesを筆頭に多数のGISプロジェクトが紹介され、日本のものとして、「『地域の知』の資源のグローバルな構造化と共有化プラットフォーム」(Global Integration of Regional Knowledge Resources and Intercommunity Platform)も言及されている。

(4)ビッグデータ分析 Mapping the Republic of Letters. Harvesting Speech Datasets等を例示している。

(5)遺跡の3D化等。例示はなし。

③DHに対する人文学の研究者からの批判・DHに関するインタビュー記録
DHに対する批判を次の4つの観点で紹介。
・Reward structures in academia do not recognise digital publication
→これはいわゆるDHの評価問題
・Failure to see how DH applies to some disciplines
・‘Where are the results?’ ‘Show me a project that does something
useful with technology’
・The dark side of DH
→2013年のMLA大会で話題となったDHのダークサイドの問題。

その他、インタビューでは以下のような話題があった。

・伝統的な人文学研究者の情報技術に対する恐れ・無理解
・DHによって伝統的な研究成果とその知識が無価値化されることへの恐れ
これらに対しては、DHに対する懸念は時間が解決するのでは、との指摘も。
・デジタル化そのものに対する期待と恐れ(何を得て、何を失うのか?)
・研究の質に対する懸念
・一方で、DHは共同研究を創出すること、また、リソース・成果へのアクセスの民主化も指摘

④まとめ
章全体の振り返り、要点をまとめている。

———-

・人文学におけるDHの現在的な位置づけを知るには、良いレポートだといえる。ただ逆を言えば、全体的な議論はほぼ想定内であり、あまり自分にとって目新しい情報はなかった。

・DHのトレンドの5点は妥当。あえて言えば、ゲーム研究も一領域としていれてもよいかもしれないが、それは(5)3D immersive visualisation environmentsに加わるだろうか。

・DHが”H”たる人文学研究にもっと浸透するには、伝統的な人文学研究者とDH研究者との対話の必要性を強調している。伝統的な人文学研究者からのDHに対する懐疑的な見方もあるので、確かにそうだろうと思う。一方で、情報学の研究者らはDHをどのように見ているのだろうかという疑問もある。DHは人文学であって情報学の一領域ではないとか、そういう見解もあるのだろうか?

コメントする

カテゴリー: Uncategorized

『ドン・キホーテ』ポータルをスペイン国立図書館が公開 第2部刊行400周年にあわせて

2015年7月8日に、スペイン国立図書館がIberdolaと共同で、『ドン・キホーテ』のポータルサイト”Quijotes”を開設した。これは、『ドン・キホーテ』第2版の刊行400周年を記念して作成されたもの。

quijote

ポータルサイトは、同館に所蔵されている、世界40か国語以上に翻訳・編集された、3,300版を超す『ドン・キホーテ』への一元的なアクセスを提供するものとなっている。具体的には、カスティーリャ語版をはじめ、他言語版やセレクション版等の解説とその書誌情報、同館が2010年に公開した、かなり作り込まれたデジタル化初版本『ドン・キホーテ』(Quijote interactivo)や、同館のLinked Dataサイトdatos.bne.esへのリンク等が提示されている。

Quijote Interactivo

日本語版の刊行史のページを見てみると、19世紀末に子供向けの部分的な翻訳が登場し、どれも英語版をベースにしたものであることや、その後、永田 寛定、高橋正武、会田由らによるカスティーリャ語版をもとにした翻訳がなされたこと等が紹介されている。

ちなみに、国立国会図書館デジタルコレクションで検索してみると、一番刊行年が早いものとして、1893年刊の松居松葉抄訳『鈍機翁冒険譚』(!)の中身をみることができる。

コメントする

カテゴリー: Uncategorized

Libraries & Digital Humanities Special Interest GroupがADHOで承認される (#DH2015)

年1回のDHの世界大会として、今年のDH2015(http://dh2015.org/)がシドニーで開催されている。

その会期中に、世界のDH学会の連合組織であるADHOの新SIGとして、Libraries & Digital Humanities Special Interest Group が承認されたとのこと。

早速メンバーの申請をしてみた。

コメントする

カテゴリー: Uncategorized

DH関連と思しき科研新規採択課題(2015年度)

科研費のデータベースに新規採択課題が収録されたので、DH関係のものを探してみた。 検索は以下の通り行った。

  • 研究分野:図書館情報学・人文社会情報学
  • 研究期間:2015年~新規のみ

結果は59件。そこから、目視でDHと関係と思しきものをリストアップしたのが以下の16件。 もちろん、「図書館情報学・人文社会情報学」以外の分野でもDH関連と思われるものはあるはずであるし、また、タイトルのみの確認に留まるので、DHなのに下のリストから漏れたものや、あくまでDH関連と「思しき」ものでしかない。あくまでメモ的に。

課題名 代表者 研究種目
原史料メタ情報の生成・管理体系の確立および歴史知識情報との融合による研究高度化 山家 浩樹 東京大学・史料編纂所・教授 (60191467) 基盤研究(A)
セマンティック・クロノロジー:時間軸に沿った知識の可視化と利用に向けた基盤構築 関野 樹 総合地球環境学研究所・准教授 (70353448) 基盤研究(A)
「地域の知」のためのデータ寄付・時空間構造化・永続化支援プラットフォームの構築 有川 正俊 東京大学・教授 (30202758) 基盤研究(B)
アンティークステレオ写真をディジタルアーカイブし活用するための基盤技術 清水 郁子 東京農工大学・工学(系)研究科(研究院)・准教授 (70312915) 基盤研究(C)
サイエンスミュージアムにおけるオープンデータ利活用基盤に関する研究 遠藤 守 名古屋大学・情報科学研究科・准教授 (90367657) 基盤研究(C)
翻刻・本文校訂を前提としないクラウド型古文書画像検索システムに関する研究 中田 充 山口大学・教育学部・教授 (60304466) 基盤研究(C)
ロンゴロンゴのデジタルアーカイブと言語情報の抽出 山口 文彦 慶應義塾大学・理工学部・研究員 (60339124) 基盤研究(C)
訪日外国人旅行者による地域歴史資料を活用した情報発信に関する研究 沢田 史子 北陸学院大学短期大学部・准教授 (20456429) 基盤研究(C)
Framework for Studying Language Evolution using Large Scale Data ADAM Jatowt 京都大学・情報学研究科・准教授 (00415861) 挑戦的萌芽研究
論文著者に着目した大規模書誌分析に基づく科学論文生産構造の解明 川島 浩誉 文部科学省科学技術・学術政策研究所・研究員 (40649076) 挑戦的萌芽研究
「昭和天皇実録」からの人脈抽出による20世紀の日本寡頭政の政治経済史研究 増田 知子 名古屋大学・法学(政治学)研究科(研究院)・教授 (10183104) 挑戦的萌芽研究
日中比較文学の影響分析における定量的方法の研究 吉村 誠 山口大学・教育学部・教授 (70141116) 挑戦的萌芽研究
作家の計量分類による日本近現代文学史の構築 高橋 寿美子 大妻女子大学・助手 (40579182) 挑戦的萌芽研究
市民コミュニティのためのオープンデータ活用推進に関する研究 浦田 真由 名古屋大学・国際開発研究科・助教 (70634947) 若手研究(B)
「語り」の蓄積からコミュニティの物語を出力する地域デジタルアーカイブの構築と運用 松本 早野香 サイバー大学・総合情報学部・講師 (90575549) 若手研究(B)
旋律と歌詞の計量的分析による日本民謡の地域的特徴の解明 河瀬 彰宏 大学共同利用機関法人人間文化研究機構国立国語研究所・研究員 (80739186) 若手研究(B)

コメントする

カテゴリー: Uncategorized

ヨーロッパ各国におけるDH史の現状を論じたエッセイシリーズが公開中

ドイツの歴史学コミュニケーションプラットフォームH-Soz-Kultが、2014年10月22日から、”The Status Quo of Digital Humanities in Europe”と題したエッセイシリーズを公開している。

DHが国際的にブームとなり国境を越えた動きを見せている一方で、DHの基盤は各国ごとになっている現状もあるとして、本エッセイシリーズでは、ヨーロッパ各国ごとのDHの歴史を紹介している。取り上げられている国は、スウェーデン、ポルトガル、オランダ、ギリシア、ロシア、スイス、スペイン、スロヴェニア、ノルウェー、ドイツの10か国で、これを書いている11月26日現在では、前半の7か国、スペインまでが公開されている。

シリーズの編集者は、寄せられたエッセイから次の2点を結論として指摘している。

  1. ナショナルなDHプロジェクトは、古くからあるノンデジタルな研究プロジェクトとインフラにしばしば接続しているが、必ずといってよいほどEUの研究インフラとあっさり結びついている。
  2. 国による違いはあれど、パラレルな発展が確認できる。

—-

イベリア半島の2か国ぐらいは読んでおきたいが、その紹介は別稿に譲りたい。ここでの感想として、次の3点をメモしておく。

・ヨーロッパ各国の動きは見えにくいので、良企画だと思う。
・しかし、英仏伊、特にDHを牽引しているといってよいイギリスがないのが残念。
・また、各国ごとのDH史という視点のほかに、時代別でのDH史という視点が歴史学のポータルサイトとしてはあってもよいと思う。

コメントする

カテゴリー: Uncategorized

中世スペインにおける宗教的共存と対立を3D空間で学ぶVirtural Plasencia

キリスト教徒・ムスリム・ユダヤ教徒の共存と対立は、中世スペイン史における一つの重要なテーマだが、これをヴァーチャルに3D空間で再現したVirtural Plasenciaが、10月22日に公開された。

これは、アメリカ、スイス、スペインの3か国、計9大学の研究者による”Revealing Cooperation and Conflict: An Integrated Geovisual and Transcription Project for Plasencia, Spain (circa 1390-1450)”というプロジェクトの成果で、テキサス大学オースティン校の中世地図資料を扱ったDHプロジェクト “MappaMundi”の一プロジェクトに位置づけられている。

Virtural Plasenciaでは、プレーヤーはエストゥレマドゥーラにある一都市プラセンシア(Plasencia)の15世紀(1416~1455)の街並みを散策しながら、様々なトピック――例えば当時のワイン製造等――を通じて、宗教的共存と対立を学ぶことになる。プラセンシアは、その後のスペインそしてヨーロッパを形成する上で重要な諸々のイベントに関わることから、この都市が同プロジェクトで選ばれたようだ。

興味深いのは、3D空間で紹介されるトピックの”作成の仕方”である。紹介される史実は、(当たり前のことだが)史料に基づいて記述されており、表示される解説文でも史料の引用が多数行われている。これらの史料は、プラセンシアの大聖堂や市の公文書館の所蔵資料だが、特に大聖堂のアーカイブズの利用は指定の一週間に数時間程度のもので、ノンビリ読む間もない。そのためこのプロジェクトでは、2014年夏と秋に開講されたMOOCのコース”Deciphering Secrets: Unlocking the Manuscripts of Medieval Spain”の受講生をcitizen-scholarsとして、デジタル化史料の翻刻と分析に参加させるという手法を採ったという。

現在のプラセンシアの大聖堂前

 

既に同プロジェクトはver.2.0の開発に着手しており、今後は、散策できるエリアの拡大やインターネット教育リソースの提供機能、ソーシャルメディアとの連携、そしてプレーヤーをアバターで表示させる機能を追加する予定とされている。

—–

誰もいない空間を歩き回るのは、少し、いやかなり違和感がある。また、一トピックで読む解説文が長すぎて、3Dにした意味があまり感じられない。とても興味深いかつ意義のあるプロジェクトだと思うので、今後の改善に期待したい。

 

 

 

コメントする

カテゴリー: Uncategorized