「台灣佛教文獻數位
資料庫」的建構與緣起
中華佛學研究所圖書資訊館館長 杜正民
佛學研究中心學報
第七期(2002.07)
頁391-408
©2002 國立臺灣大學文學院佛學研究中心
臺北市
提要
「台灣佛教文獻數位資料庫」乃承續台大哲學系楊惠南教授多年來研究與執行
的各項台灣佛教相關計畫內容,及運用建構「中華典子佛典協會」、「佛學數位圖書館暨博物館」與其他佛教資料庫多年來累積的經驗及技術,將相關文獻數位化並
建構成資料庫。期能借網路提供各項方便的功能供讀者使用,將台灣佛教文獻資料廣傳於世。
本資料庫將從明鄭與清朝時期的台灣佛教資料的蒐集、編整,經日據時代資料
的整編、翻譯,至當代佛教文獻的彙編等工作,做一完整的整理與研究,並運用最新科技技術將這些文獻資料數位化。資料庫完成後將置於網際網路上,以提供國內
外學術界數位參考資料。深信此資料庫的完成,不但是國際間唯一的台灣佛教資料庫,加上先前完成的多項佛學資料庫計畫,當更能提供完整的佛學資料,成為國內
外佛教學者主要入口網站之一。
除計畫內容外,本文亦將介紹本資料庫所採用的技術與國際標準,以就教於先
進專家,亦可作為其他數位化計畫進行的參照與運用,以達資源共享的目的。
關鍵詞:台灣佛教、佛教文獻、全文資料庫、書目檢索、數位資料庫、佛教網路
資源
Summary:
This project intents to integrate
humanity and
science for the study and creation of Taiwanese Buddhist Digital
Database,
which will content the largest database in this area. Although
Taiwanese Buddhism
has its part of importance in this more than 300 years' history. But
there are
not many researches and reports on this field of studies, not to say
the digital
databases. Therefore, it is important to establish the only and unique
database
in the world.
The aim of this project would be to
collect relevant
historical material about the Taiwanese Buddhism through the
Ming-Cheng Period
and the Ching Dynasty to present, and analyze the situation and
development
of Taiwan Buddhist history and thoughts of this period. Then to
digitalize all
the available material and make it freely accessed on net by users
around the
world. Hence to lead modern people to understand Taiwanese Buddhism or
even
the Taiwanese history in all.
頁393 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
一、前言:緣起與內容
(一)、緣起
臺灣佛教延綿三百餘年,為臺灣歷史與文化的重要環節之一,以往少有學者專
注於這方面的研究,研究成果不多,致使時人對於臺灣的歷史與文化的瞭解必然有所欠缺與不足,因此,關於臺灣佛教的歷史與思想的研究計畫,為目前所迫切需要
的。
加以,於網路科技蓬勃發展的數位時代,綜觀國內外有限的漢文數位資料庫
中,可說並無台灣佛教數位資料庫的建置,因此本計畫擬建置一台灣佛教文獻數位資料庫,內含完整的圖書全文並配合佛學書目資料庫,以提供國內外學者從書目檢
索至閱覽全文的未來網路需求。同時,為推展台灣本土佛學於國際間,並將建置完整的「台灣佛教文獻數位資料庫」(以下簡稱「本資料庫」),期能增進國際間對
台灣佛教研究的暸解,進而藉此資料庫期能提昇國內學術發展。本計畫深知,為推展學術於國際間,本土文化的研究是很重要的,尤其台灣佛教研究在國際間尚未為
國際所重視,因而為使台灣佛教研究立足於國際間,及提昇台灣佛教研究的基礎建設,本計畫擬先建構「台灣佛教文獻」網站,從明鄭與清朝時期的台灣佛教資料的
蒐集、編整,經日據
頁394 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
時代資料的整編、翻譯,至當代佛教文獻的彙編等工作,做一完整的整理與研究,並運用最新科
技技術將這些文獻資料數位化,以提供國內外學術界數位參考資料。深信此資料庫的完成,不但是國際間唯一的台灣佛教資料庫,加上先前完成的多項資料庫計畫,
當更能提供完整的佛學資料,成為國內外佛教學者主要入口網站之一。
因此,本計畫擬整合當代科技與人文科學建構與研究「台灣佛教文獻數位資料
庫」 (The Study
and Creation of Taiwan Buddhist Digital
Database),以建置一涵蓋自明清以來的文獻數位資料庫,於網路上呈現完整的台灣佛教史料供國際學者查閱、檢索與使用。本計畫擬依台灣佛教史料之原
始文獻
(Primary Source)、國際間有關台灣佛教的研究文獻(Secondary Source)、將台灣佛教文獻資料電子化
(Digitalization
)、並於網路呈現與提供檢索功能(Net Retrieval
Function)等項目分別進行。同時,為提昇台灣佛教數位化技術與學術地位,本計畫擬積極參與國際電子學術會議、研發新技術、培訓新生代的參與等工作
項目,以提昇台灣學術發展之基礎建設,期能將學術資源做更有效率之整合,提昇台灣之國際學術地位。
(二)、計畫內容
「台灣佛教文獻數位資料庫」乃承續台大哲學系楊惠南教授多年來研究與執行
的各項台灣佛教相關計畫內容,及運用建構「中華典子佛典協會」、「佛學數位圖書館暨博物館」與其他佛教資料庫多年來累積的經驗及技術,將相關文獻數位化並
建構成資料庫。期能借網路提供各項方便的功能供讀者使用,將台灣佛教文獻資料廣傳於世。
本計畫乃立基於楊惠南及多位學者先前幾個計畫的成果,將之電子化:
(1)「臺灣佛教的歷史與思想-明鄭至日據時期」
(2)「日據時期臺灣佛教『四大法脈』的形成及其相關問題之研究」
(3)「臺灣新興佛教現象研究」
其中,(1)和(2)由行政院國家發展委員會所資助。而(3)則由中央研
究社會學研究所籌備處所資助。第(1)個計劃係整合型研究計劃,由四位來自不同學術機構的學者,各提出不同的子計劃,然後進行三年(1997年8月
-2000年7月)的研究。(詳下)第(2)個計劃,是個人型的單一計劃,為期兩年(2000年8月-2002年7月)。這兩個計劃的共同目標則是文獻的
彙集和整編;其中包括清代
頁395 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
各種方志的彙整、日據時期代表台灣佛教主流的《南瀛佛教》月刊日文漢譯。而第(3)個計劃
為期四年(1997年3月-2001年4月),以戰後台灣佛教新興教派為研究對象,包括慈濟功德會、佛光山、法鼓山、中台禪寺,以及現代禪、新雨社、維鬘
佛教協會、萬佛會、佛教青年(基金)會、關懷生命協會、同梵精舍等新興的台灣佛教教派和團體,並旁及宋七力顯相協會、法輪功等與當代台灣佛教相關的教派和
團體。進行方式除了平面資料的彙整之外,還包括主要人物的訪談。
二、贊助單位、計畫主持人與工作分配
本計畫蒙蔣經國學術基金會及中華佛學研究所贊助,於此特別致謝。[1]
如前文所述,「台灣佛教文獻數位資料庫」乃承續台大哲學系楊惠南教授多年
來研究與執行的各項台灣佛教相關計畫內容,將相關文獻數位化並建構成資料庫。期能借網路提供各項方便的功能供讀者使用,將台灣佛教文獻資料廣傳於世。因
此,需要有特殊的專業技術,是以擬借重中華典子佛典協會、佛教數位圖書館暨博物館與其他佛教相關計畫多年來累積的經驗及技術,於國際化方面,則邀請國際間
研究台灣佛教的著名學者
Dr. Charles Brewer Jones 參與。
是以,這個團隊是由數位學有專長的專家學者參與及分擔工作,無論是於文獻
資料內容的提供,資訊技術的研發與移轉及國際化的表達等可說是一完美的團隊整合,今簡述各主持人及其專長如下:
1.
主持人:釋惠敏,為國立藝術學院教授兼教務長與共同科主任。並擔任「中華電子佛典協會」主任委員,負責大正藏電子化的工作。具豐富的行政經驗,足以協調本
計畫的各項作業。
2.
共同主持人:楊惠南,任教於台大哲學系,近年來從事台灣佛教的研究不遺餘力。並累積相當多的資料,唯此資料尚未進行電子化的作業,因此
1.
由於該會應允贊助半數金額,另半應尋得其他單位贊助始能執行本
計畫,於此特別致謝中華佛學研究所所長李志夫教授欣然同意協助,使本計畫能順利執行。
頁396 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
於本計畫將致力於各項資料的研究與提供。
3.
共同主持人:杜正民,任教於中華佛學研究所,兼佛學網路資訊室主任暨圖資館館長,並擔任中華電子佛典總幹事及負責「佛學數位圖書館暨博物館」等網路工作,
具多年的佛教資料庫與網路工作經驗。
4. 國外合作主持人:Charles Brewer
Jones,目前任教於 The Department
of Religion and Religious Education, the Catholic University of
America. 其博士論文為
Buddhism in Taiwan: an historical survey (China, folk religion,
zhaijiao), 並出版有
Buddhism in Taiwan: Religion and the State, 1660-1990 (Honolulu:
University
of Hawaii Press, 1999)等書,為國際間研究台灣佛教的著名學者。
因此本作業計畫擬依上述主持人的專長分工如下:由楊惠南負責內容
(Contents) 的建構,Charles
Jones 則負責英文資料的建構與蒐集,杜正民負責網路(Net
Technique)與資料庫(Database)的建置,由釋惠敏就上述各內容負責統籌與分工等協調作業。
進一步說明之,計畫主持人釋惠敏現任「「中華電子佛典協
會」(CBETA)」主任委員,負責大正新脩大藏經一億多字的電子化工作,目前已有相當的成效展現於網際網路上
(http://www.cbeta.org)
,此項兼具普及化與學術化的作業,已獲得國內外許多單位與學者的讚賞,對本計畫數位化的工作將有相當的助益。另外,本計畫共同主持人杜正民從事「佛學網路
資料庫」(http://ccbs.ntu.edu.tw)
建構多年,這時期除了累積不少經驗外,還建構許多的網路資料庫,涵蓋有「佛學書目資料庫」、「佛學全文圖書資料庫」、「佛教電子大藏經」等大小網站總計二
十餘項,頗獲各界好評。杜正民於民國八十五年至八十七年間,曾協同釋恆清教授完成蔣經國國際學術交流基金會補助的《佛學國際網路資料庫》之網路建置工作,
此一雛型資料庫普一推出,即獲得國際間的好評與肯定,並多次受邀於國際會議中發表論文與展示成果。因而本計畫擬運用現有的發展基礎與經驗,開拓此學術領
域,使台灣的佛教研究成為國際學術重鎮。深信,立基於上述已有的資料庫建置經驗,當可迅速完成本計畫。
於此特別強調,本計畫擬完全著重於台灣佛教資料的建構,《佛學國際網路資
料庫》因為該計畫當初並未包含「台灣佛教資料」的蒐集與建構,因此只著重於「中國佛教資料」的建置,此為兩者間最大的不同。將來完成「台灣佛教文獻數位資
料庫」的建構後,此兩資料庫擬放在同一部主機
(http://ccbs.ntu.edu.tw)
繼續由杜正民統一管理,深信此兩個建置完成的資料
頁397 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
庫,將會是國際間最大型且最完整的漢文佛學資料庫。
加以,各共同主持人皆已有多年的學術研究或網路資料庫建構經驗,頗獲各界
好評。因而,於本計畫的資料來源、稿本寫作、技術專才、美工設計等都有相當的經驗。是以,基於目前各共同主持人的豐碩成果及實務經驗,可說本計畫已經有一
現成的架構與資料,只要假以時日即可使之臻至圓滿。因此可說,本計畫的一大特色,就是可以迅速將資料庫的資源轉為本計畫所需的數位資料,以利進行與完成。
最重要的,我們所完成的資料完全都是屬於公共領域
(Public Domain)
,可提供使用者作二次加值開發及研究學習之用。因此,本計畫擬於完成各項作業後,除保留一份於本資料庫主機外,將提供所有的全文資料置於其他文獻資料庫
中,或以鏡像
(Mirror Site) 的方式提供國內外學術界查閱、檢索、下載、編輯等功能,以達專業分工、資料共享的現代化需求。
總之,計畫主持人與共同主持人均系各個分工責任範圍內之專家,不論於學術
研究與計畫執行的能力上,均有豐富的經驗,誠為此一計畫之最佳人選。且各主持人學經歷涵蓋諸領域,在此一科際整合之契機下,必能對本計畫之課題提出多面向
之豐碩研究成果。[2]
三、本資料庫內容
本研究計畫的目的,即是建置一個具有高品質內容,且能夠充分展現結合資訊
科技、藝術與人文社會科學研究成果的大型「台灣佛教文獻數位資料庫」,以期能藉由這個計畫的成果,展示台灣學術研究在網際網路社會中所能發揮的重大影響。
今先就計畫內容做一簡介--臺灣佛教,就歷史觀點及思想差異的觀點來看,可以分一、明鄭時期與清朝的臺灣佛教;二、日據時代的臺灣佛教;三、戰後臺灣佛教
等三個階段。因此,本計畫擬依下述內容進行:
(一)、明鄭時期與清朝的臺灣佛教
這一時期的臺灣佛教,其特色是名士佛教。這可以由兩個方面來說明,
2.
本段有關申請人的資料大部分摘錄自計畫申請書,有關筆者部分或有溢美之詞,敬請諒查。
頁398 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
首先,就這一時期的佛教寺廟來看,主要是明末遺臣或是鄭氏遺臣所興建。其次,此一時期的名
士佛教,遺留下許許多多的詩詞歌賦,透露出當時佛教發展的概況,成為臺灣文化史上的瑰寶。而清朝佛教,其特色是禪淨雙修與神佛不分。這些特色具體而微的表
現於臺灣各種方志內。因此,本計畫擬就明清時期與佛教有關之台灣各地《地方志》、《臺灣歷史文獻叢刊(方志類)》、《臺灣歷史文獻叢刊(明鄭史料類)》、
《臺灣通志》、《臺灣方志集成:清代篇》及《臺灣歷史文獻叢刊(詩文集類)》、《臺灣詩錄》等資料建構全文數位資料庫。
(二)、日據時期的臺灣佛教
日本政府統治臺灣期間,於大正十年(1921)四月四日成立全臺灣性的
「南瀛佛教會」,這是管理臺灣佛教的最高當局,「南瀛佛教會」成立的主要目的是要培養佛教在家、出家的弘法人材,此外也出版機關刊物,以利佛教之傳播。該
雜誌發行年代長達十九年之久,可以說是日本統治後期臺灣佛教的最好見證。是以,本計畫擬就共同主持人楊惠南數年來執行各計畫所完成的《南瀛佛教》翻譯原
稿,承製為電子檔。並將此大量資料置於網路資料庫提供人文需求,以利使用者閱讀、檢索及下載等功能。
(三)、戰後時期的臺灣佛教
二次戰後的臺灣佛教可以分為兩個時期,第一個時期是戒嚴時期的臺灣佛教,
第二個時期是解嚴之後的臺灣佛教。
1﹒戒嚴時期的臺灣佛教
戒嚴時期的臺灣佛教主要是由大陸來臺僧侶所形成,因為這些僧侶大多來自大
陸蘇北,因此可說是蘇北佛教的延伸。蘇北佛教所表現的亦是淨土宗一宗獨盛的特色,這一特色由這些蘇北佛教的代表人物帶到臺灣來,成為戰後戒嚴時期臺灣佛教
的重要特色。舉凡在這一時期所發展出來的臺灣佛教主要團體,例如臺北的中國佛教會、高雄的佛光山、臺北的法鼓山等等,大概都和蘇北佛教所宣揚的西方極樂世
界淨土信仰有關。因此,本計畫擬就現有之各類佛教期刊蒐集完整的文獻資料,提供「書目與全文」等資料。此外,本計畫並將配合網路的發展提供珍貴的「影音圖
像」,以作為台灣近代佛教史的縮影。「書目文獻」與「影音資料」兩部分如完成,可謂是台灣當代佛教資料的大成。
頁399 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
2﹒解嚴之後的臺灣佛教
戰後第二個時期就是解嚴之後的臺灣佛教,過去在戒嚴時期由於政治的禁忌而
無法發展的一些教派,在解嚴之後迅速的開花結果。解嚴之後,人間佛教的理念迅速的開展,在這一時期所成立的一些小的教派,例如臺北的新雨社、臺北的現代
禪、臺南的維鬘,及臺北的萬佛會等新興的佛教團體,在解嚴後的特殊社會情況下,應運而起。因此,本計畫擬就現有之文獻建立完整的數位資料庫,提供國內外學
者最新、最完整的台灣佛教研究資料。[3]
(四)、本計畫之必要性
臺灣佛教是臺灣歷史與文化中不可或缺的一環,過去少有學者注目,本計畫希
望透過資料的搜集、彙編、整理和分析及數位化等作業,為明清、日據時期及近代的臺灣佛教歷史與思想留下完整的文字與影像紀錄,完成數位資料庫置於網路上,
並提供良好的電子工具,以方便相關學者參考之用。
四、使用之標準與技術
本計畫之完成,除了完整與大量台灣佛教文獻內容 (content)
外,並擬建立完善的交換標準,作為建構多媒體形式知識結構。本計畫擬依下列標準建構「知識基本表達」,如以計算機的資料結構、知識屬性整理、內容的外化
(形式化)、 知識結構等準則,以完成「台灣佛教文獻數位資料庫」。
本計畫擬參照「「中華電子佛典協會」」進行的佛典大量資料庫、佛典全文資
料庫與「佛學數位圖書館暨博物館」所進行的佛學書目及全文資料庫的建立外,並擬訂定佛典標記
(Markup) 功能表、規劃 XML (Extensive Markup Language)
作為標記工具、修編適合電子佛典製作的國際編碼交換協定(Text
Encoding Interchange, TEI)、連結佛典資訊超文件 (Hyper-text)、及漢文電腦缺字 (Rare
Characters)
處理及圖檔的處理,甚至跨國語文環境與漢文資料呈現於不同平台的考量等作業,皆是本計畫所需面臨與進行的。為解決上述問
3.
本計畫內容,乃依楊惠南教授多年來執行的計畫為主,因此本段文字參照楊教授提供的資料所改寫的。
頁400 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
題與困難,本計畫擬結合相關的學者專家共同解決困難與問題,配合上述需求開始各項技術性的
研發。
今試以本計畫正進行中的《南瀛佛教》全文及影像處理為例,介紹擬使用的標
準如下:
(一)、《南瀛佛教》全文資料庫以《電子文獻文獻編碼與交換導覽 TEI》為標準
本計畫的正進行中的電子化《南瀛佛教》文獻全文標記作業,完全依
Michael Sperberg-McQueen
(Univ. of Illinois, Chicago) and Lou Burnard (Oxford
University)所著的《電子文獻文獻編碼與交換導覽》
Guidelines for Electronic Text Encoding and Interchange (TEI P3/P4)
為標準。此書除
TEI 標準外,並含 TEI Document Type Definition (DTD)。(有關 TEI 資料可參考網頁資料 http://www.uic.edu/orgs/tei,
或 http://etext.virginia.edu/TEI.html)
。
本計畫主持人釋惠敏與共同主持人杜正民,於進行「中華電子佛典協會
(CBETA)」的《大正新脩大藏經》電子化作業時,即開始使用
TEI 的標準,CBETA 多年的經驗及改良東方文獻與漢文佛教文獻使用 TEI
標準的問題,增進國際間文獻編碼交換。上述經驗,目前已轉換為本計畫工作實務,並完成《南瀛佛教》的標記作業。
(二)、全文的建置內容,為能達國際交換的標準,擬以 XML 作為標誌語言
至於內容外化的部份,則擬採用符合國際標準的 XML 標誌語言 (
http://www.w3c.org),做為機器解讀與形式表達之用,不但可以作為國際交換標準,並且還可以作外化內容之間的聯繫關係,進而構成一知識
結構體。本項作業,在《大正新脩大藏經》電子化作業時已經有相當的經驗,該部份可謂是當代漢文資料中,採用
XML 作為原始檔的最大資料庫。
本計畫《南瀛佛教》文獻數位全文作業皆以 XML
為主。目前已完成所有文獻的 XML 轉檔作業,今後將以此
XML 檔作為主檔 (Source File),再依需求轉換為其他各種格式檔案。同時依既定步驟進行,《南瀛佛教》目前已完成 DTD
及標記等作業。
(三)、圖像資料庫 (Image Database)管理
為能提供讀者正確完整的一手資料,本計畫的進行除了《南瀛佛教》日
頁401 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
文資料的翻譯、數位化之外,並擬提供《南瀛佛教》全文圖像資料檔,以便對照與運用。並期望
能提供大量的佛教圖像,以利讀者使用。因此,圖像資料的建構與管理即成為重要的課題。
本計畫可藉共同主持人多年來的工作經驗,以確立本計畫目標與任務的方式進
行,譬如依國際標準、所需設備、應用軟體等需求,建立協定
(Establishing Protocols)、 攝影協定 (Photography Protocols)、數位化協定
(Digitization Protocols)
等方式,進行建立電腦之間通信與資料傳送所遵守的規則,以達成圖像影像檔的方便交換與管理之目的。
因此,本計畫將採取 Huntington Archive of
Buddhist and
Related Art 佛教圖像資料庫的實務經驗,如影像校正 (Image Correction)
的實際經驗,考慮採用具有自動功能的高速掃描器
以最高解析度掃描等實務工作,提高品質。加上,該資料庫所提供的「工作上常犯錯誤」與「改進方案」等實際經驗,當可作為本計畫的最佳務實參照。
(四)、資料將依 MetaData 標準,建立專業領域之共同後設資料
由於本資料庫需要製作大量的圖像檔,因此 MetatData
的詮釋資料就很重要。因此,有關文物圖像的表達,本計畫將以專業領域共同之後設資料
(Metadata) 作為標準,闢如參照「數位博物館資源組織與檢索相關規範工作小組」(Ross 小組) 所規範的 MICI 都柏林核心集
(Dublin
Core http://purl.org/DC) 之中文詮釋資料交換格式 (http://ross.lis.ntu.edu.tw/document/metadata/)
。同時,將參照國外 CIMI 機構
(the Consortium for the Computer Interchange of Museum Information, http://www.cimi.org/documents/meta_bestprac_v031.html)
的各項標準進行作業。
此外,擬採取國際通行的 Dublin Core標準,以其十五個元素
(DC.Title,
DC.Creator, DC.Subject, DC.Description, DC.Publisher, DC.Contributor,
DC.Date,
DC.Type, DC.Format, DC.Identifier, DC.Source, DC.Language,
DC.Relation, DC.Coverage
及 DC.Rights) 記錄所有電子化資料的屬性,以之作為先製資料。以利作業人員或使用者運用這些項目來管理電子文獻資料及文物項目,並將參照
Z39.50
作為檢索與交換的標準。
Metadata
於佛學文獻資料的電子化是一重要的概念,尤其在佛學書目的管理,以及佛教文物圖像的電子化,皆可採用
Dublin Core 的十五個元素作
頁402 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
為標準建立先製資料,以做檢索與交換之準則,因此本資料庫的全文資料亦將以 Dublin
Core
的格式建構。
(五)、缺字(Rare Characters) 的管理、呈現、檢索等問題
除了技術的突破及標記作業外,電腦缺字處理也是佛教文獻數位化的另一重要
課題。雖然國際間試圖解決缺字的方法有很多種,本計畫關於缺字處理的初步工作,則著重於「一般組字式」作為表達缺字的方法,以便使用者能在純文字環境下閱
讀,不需另外安裝造字檔或是圖檔而設計的,因而採用系統字
(Big-5) 的組字方式。這種方式除了提供了閱覽、散播上的便利性外,也不會佔用使用者對造字檔自行運用的空間。
當然,不同的缺字表達方法各有其利弊,因此本資料庫在以 XML
表達的主要檔案 (Source
File) 中,則建立缺字的轉換資料。使用者可依建立的缺字資料庫,自行轉換成其他的缺字表達方式,甚或轉為將來擬採用的 Unicode
碼。簡言之,本計畫乃採用
CBETA 的缺字處理方式,分為編撰 CB 碼、組字式、「今昔文字鏡」M 碼、通用字及 Unicode 幾部分,以便將來的資料整合與分享。
總之,本計畫採用上述標準的目的,主要是以能建構「知識基本表達」,達國
際交流,資源交換的標準為目的。確定編碼與格式等標準,建構一個格式統一的佛教資料交換標準
,不重複工作避免資源浪費與降低成本等,以達成資源共享的目的。
五、進行步驟與方法
為達預定的成果,本計畫擬分兩年四期完成所有的作業。
由於主持人與共同主持人多年來的工作經驗與文獻資料量的累積,因此本計畫
當可在最短期內完成最大量高品質,且足以代表台灣文化的「台灣佛教文獻數位資料庫」精緻作業。今將計畫進行步驟分述如下:
第一年度:
第一期:完成明鄭與清朝時期臺灣佛教資料,以及《南瀛佛教》刊物之
頁403 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
搜集、整編、分類及日文翻譯等作業。
第二期:完成上述各資料的英文資料與介紹,同時也完成電子檔及相關作業,
如 TEI/XML 檔的作業等項目,並將資料置於網路上測試。
第二年度:
第三期:完成戰後的臺灣佛教部份:戒嚴時期的臺灣佛教與解嚴之後的臺灣佛
教的全文資料與影音資料之蒐集分類與彙整等作業。並做成英文資料。
第四期:完成影音資料 Metadata 的建構、圖像資料庫
(Image Database)
建置、文獻全文資料庫大量 TEI 標誌(Markup)及 XML 原始檔(Source file)作業,研發人文需求的檢索軟體等項目。
至於此四期的作業方法,則將按照蒐集文獻、繕打資料、全文校對、建構資料
庫、測試上網等程序,於二年內依輸入、電腦校對、人工校對、標記工作、測試、上網等方式執行。並配合各項技術,研發人性化的檢索軟體,提供良好的學術工
具。
簡言之,本計畫將按部就班以確定主題範圍、收集、累積、整理、翻譯、繕打
資料,及研發檢索軟體、確定軟體需求、測試完成、上網流通等方式完成作業。最後,配合全文檢索功能及現代科技的應用,將所完成的「台灣佛教文獻數位資料
庫」置於網路上流通,以供國內外學術界自由使用與下載。
六、目前已完成的資料與成果
經前述所擬定的使用標準與技術及擬進行的步驟與方法後,當可確知本計畫將
完成的工作項目與具體成果,今再分述目前已完成的工作項目與具體成果如下:
(一)、依進度完成前述既定之各項作業進度
以文獻而言,以現代的科技與網路技術完成完整的明清與日據時代的台灣「文
獻資料」等資料庫。同時並完成網頁資料的英譯作業,以中英方式呈
頁404 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
現於使用者面前,期能使「台灣佛教文獻數位資料庫」成為國際間最完整最高品質的資料庫。玆
將第一年度已完成的資料簡列於下:
本計畫目前已完成明清時期與佛教有關的台灣《地方志》、《臺灣歷史文獻叢
刊(方志類)》、《臺灣歷史文獻叢刊(明鄭史料類)》、《臺灣通志》、《臺灣方志集成:清代篇》及《臺灣歷史文獻叢刊(詩文集類)》、《臺灣詩錄》等資料
建構全文數位資料庫。
同時,也完成《南瀛佛教》日文翻譯稿,並承製為電子檔。建構完整的
XML 檔及 TEI
標記作業。並將此大量資料置於網路資料庫以利使用者閱讀、檢索及下載等。進而,並完成《南瀛佛教》所有資料的圖檔掃描工作,並擬於短期內與上述建構的文字
檔連結做比對等作業。以提供使用者翻譯稿及完整的掃描資料作研究。
最後,於本計畫進行的同時,借助於各主持人的經驗與資源,就相關的網路呈
現方式與設計或資訊技術的運用等,完成網頁基本架構的建構與最後的改版作業,期能提供讀者完善的網路功能。如提供友善的界面,本資料庫的呈現方式,因為希
望能提供給大眾使用,因而參照目前市面上較受歡迎與較廣為流通的方式,譬如參考市面視聽資料,如各種百科全書光碟製作的界面與呈現等方式,完成本計畫的呈
現與展示。至於資料庫的檢索,將以「專題」及「分類」為主要檢索方法,及提供「多版本整句
(全文)檢索」功能,以利讀者比對各種版本與文獻資料。此外,將參照《大英百科全書》的檢索方式,完成「現成檢索詞彙」等工作。並且,設置「常被檢索的詞
彙與用語」,如「Top
10」的設置等,以適合非學者專家的使用。
簡言之,本計畫第一年度完成的進度與成果如下:
1.完成網頁架構作業
2.完成明清時期文獻電子化作業
3.完成日據時代 南瀛佛教 文獻電子化作業
4.完成日據時代 南瀛佛教 TEI/XML 作業
5.完成南瀛佛教 圖像檔作業
6.完成南瀛佛教文次與圖像比對作業
7.完成網頁修訂改版、檢索功能、界面呈現等作業。
(二)、完成上述文獻資料後,依規劃的架構設計測試網頁
茲將本資料庫進行的部份作業,作一簡單的網頁測試樣本與說明:
頁405 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
測試網頁 解說一
本資料庫依一、明鄭時期與清朝的臺灣佛教;二、日據時代的臺灣佛教;三、
戰後臺灣佛教三個階段設計網頁
(如下圖左欄「選項」)。並依各時期提供完整的台灣各地《地方志》、《南瀛佛教》以及當代文獻等資料建構全文數位資料庫 (如下圖右欄「主畫面」)。
同時,根據TEI/XML
國際標準進行內容外化的作業,除了資源可以與國際共享外,同時也可提供全文資料供使用者閱讀、下載使用等。
(如下圖「主畫面」)
頁406 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
測試網頁 解說二
本資料庫依上述三個時期建立完整的書目與全文資料庫,並提供良好的檢索軟
體,以發展人文需求的檢索軟體,以利讀者檢索查閱
(如下圖「主畫面」)。
查閱結果可提供完整的圖書書目資訊,並可連結至全文,或提供部份說明,使
用者不必到圖書館即可得知所需的資料是否為其所需
(如下圖「主畫面」)。
頁407 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
測試網頁 解說三
本資料庫不但提供查閱所需資訊外,並能連結全文。因為本資料庫內含完整的
圖書全文並配合佛學書目資料庫,以提供國內外學者從書目檢索至閱覽全文的未來網路需求。
除了全文的提供外,並將配合研究需求提供各種「參考工具」與「影音資料」
等多媒體功能 (如下圖左邊「選項」),並以
Metadata 建構完整的資料庫。
頁408 |
「台灣佛教文獻數位資料庫」的建構與緣起 |
佛學研究中心學報第七期(2002.07)
|
以
上為本資料庫目前已完成的測試網頁,然為能提供良好及友善的界面,本資料庫目前尚對此網頁進行改編與修訂中,待計畫執行週年後當會開放使用時
(http://ccbs.ntu.edu.tw/Taiwan),
將會有煥然一新的網頁呈現於讀者面前。
七、結語:發展方向
總之,本計畫於主持人釋惠敏的統籌與協調下完成所有的工作項目。亦即,由
共同主持人楊惠南負責內容
(content) 的建構,完成包含自明鄭以來完整且大量的「台灣佛教文獻數位資料庫」。在網路技術 (Net
technique),則由共同主持人杜正民提供最新的網路科技,及具人文需求的網路功能。此外,本計畫除重視國內使用率的提昇外,對於國際使用者的應用
也很重視。因此,由國外共同主持人
Dr. Charles Brewer Jones 負責英文資料的建構與撰寫。以期完成中英文解說,引導國外的讀者使用,以發揚台灣文化於國際間。
本資料庫將以國際性及學術性作為主要的訴求,亦即完成以 XML 標記
TEI 國際文獻編碼標準、以
Unicode
國際碼表達的「台灣佛教文獻數位資料庫」,亦即以「標準化」與「國際化」作為本資料庫的發展目標。其他,如提高數位化製作技術,如何讓讀者方便使用、解決
在不同的平台使用資料的問題、如何讓數位資料轉化為彼此相通的碼等國際間資源交流的問題,也是本資料庫目前正進行的方案。
簡言之,本資料庫最重要的是工作目標,就是依序完成前述各項計畫,建構完
整的台灣佛教文獻數位資料。建構一適合當代需求的佛學專業網站,提供專業的服務。