【中华佛教百科全书】

电脑佛典


  指电脑化之佛教文献。即将佛教文献输入于电脑中,俾供研究者应用。在近代科学史上,自第一部电子计算机问世以来,电子资讯的革命促使应用科学飞跃地成长,而人文科学的研究领域,也逐渐受到影响。因为利用电脑系统的结构性,人文学者亦可依自己的研究需要,请专家设计出所需的程式,以辅助其个人研究。此外,将资料输入于磁碟中,除了可随时补充资料外,更有易于储存、保存期限较长、复制容易、携带方便、不占空间等优点。而索引类工具书的电脑化,也将会是人文学术界的一大突破。
  佛教文献的电脑化,今已有若干成果。目前即将电脑化的佛教文献有︰泰文大藏经、缅文大藏经、巴利佛教文献、西藏佛典,及汉文系的《大正藏》《卍续藏》《碛砂藏》《高丽大藏经》等大部头丛书。而正在推行此种工作的机构则有下列诸处︰
  (1)日本花园大学国际禅学研究所、禅文化研究所、法宝义林研究所、立正大学、佛教大学、曹洞宗宗学研究所、净土真宗教学研究所、京都大学。
  (2)中国大陆中国社会科学院、北京广济寺中国佛教文化研究所。
  (3)台湾中央研究院、佛光山北海道场。
  (4)香港中文大学。
  (5)泰国摩希德大学、法身基金会。
  (6)韩国海印寺、Paeng Nyon佛教文化基金会。
  (7)澳洲坎培拉澳洲国立大学。
  (8)印度色拉大学。
  1993年四月,“国际电子佛典联合会”在美国加州大学柏克莱分校成立。美国柏克莱大学兰卡斯特(L. Lancaster)被推选为会长。该会成立的主旨在于提供佛典电脑化以及有关佛学研究的资讯。各会员团体可迅速获得当前国际间电子化佛学的研究动态,以避免重复同一主题之研究与作业,并且可以透过资讯的交流,分享佛学研究的成果。
  ◎附一︰川添良幸〈应用电脑处理佛教文献〉(摘录自《法光》杂志第四十五期)
  (一)前言
  佛教研究应用电脑,是最近几年的事。一般而言,文科系需要大量的资料,作为学术研究之用,而电脑资料库的管理技术可以支援文科系的这项需求,因此,自从此项技术正式应用以来,其普及的速度,可说相当快。目前,佛教研究者与电脑的关系,亦如同理科系的领域一样地密切了。(日本佛教学者)冢本启祥教授,就是促使电脑与佛典结合的中心人物,其成果广为学界所知。而透过在日本印度学佛教学会的发表,扫除了学会既有的电脑恐惧症。(中略)以下仅将我们数年来应用电脑及有关科技的始末与一部成果介绍于后。
  (二)梵文《法华经》的资料库化
  为了进行以佛教混淆梵语所写的多种《法华经》写本的比对之文献学研究,八年前即开始企划电脑资料库之建立。所发现的写本有三十余种之多,其来源大致可区分为尼泊尔、西藏、喀什米尔、中亚等三区域。冢本启祥教授费了多年的心力整理,自1977年以五年的时间出版了《梵文法华经写本集成》全十二卷。对所有资料进行客观性的比较检讨,则必须予以电脑资料库化。目前,完成了一、二卷的罗马字转写与电脑输入,并且出版;第三卷亦即将完成。
  罗马字的资料(data),经由微电脑的终端机输入,以国字标准规格的SQL(Structu-red Query Language)资料库,储存在东北大学冢本研究室的小型电脑IBM9370后,可经由电脑网路与世界各地连通。不过,梵文的字码尚无标准化,我们所用的是自己设定的。希望如UniCODE(新文字的字码系统,包含罗马字、汉字,甚至梵字天成体、藏文等世界主要文字),各种文字字码的世界标准化能早日实现。梵字罗马拚音的键入,一般字母以英文键盘处理即可,特殊的字则以二至三次的键入为方法(如ṃ键入m与‧),这种方法简单易记。至于输出,则利用电脑的显示器,及我们独自设计的特殊数位系统,由这个系统所出版的书籍,其印刷的品质最为优良,其鲜明度即使是最新的雷射列表机也难与匹敌。
  我们也完成第一、第二卷总数二万词的索引与逆反索引,其输出依照梵文字母的顺序,并列出此单字所出现的卷数、页数与写本。由此,对于各种写本之间单字的差异,可以一目了然。至于逆反索引,我们认为在文法研究上颇具重大功能。只要一按字键,就可在SQL资料库管理下的全文中,快速地检索出所需要的字词。而检索方法,也针对一般不晓得SQL指令的使用者,特为设计出全画面介面,只要操作功能键即可轻易使用了。
  举一个简单的例子,如想知道《梵文法华经写本集成》第一卷中,最常出现的单字之长度与最长的单字为何时,经由电脑的检索,结果发现最常出现的单字为七个字母,而长度最长的字有四十三个字母。
  在实用软体方面,我们开发了单字检索系统。只用从终端机键入查询的单字,在画面上即可显出该字出现的页数,以及列出包含该单字之《梵文法华经写本集成》中的那一行。对于出现多处的资讯,也会列出。经由这个系统,可以获得客观的诸写本间的基本检讨资料。目前也正进行着类似单字之比较,及文节长度分布之比较等研究,据此资料,可作为推测写本的系统来源。
  (三)佛教写本记述文字之自动辨识
  由于电脑资料库之建立,使得检索能够更为迅速正确。不过,梵文原典之解读,仅限于为数极少的专家而已,这是研究发展上的一大障碍。对于如何加速资料库之完成,就得利用电脑的长处,即资料之自动输入为研究重点。英文乃至于日文,均已开发出自动辨识的系统。不过,这只限于特定的印刷字体,对于手写的辨识,尚十分有限。更遑论梵文之电脑自动辨识,我们这个研究小组的梵字自动辨识成果,是世界仅见的。
  我们以Kern‧南条的印刷字《法华经》校订本,作为电脑自动辨识研究之开始。我们应用形状比对法与结构解析法两种作为辨识方法,对结果加以重复比较与检讨,再予以改进。形状比对法以资讯理论为基础,适合系统性研究,对印刷字得以发挥威力。至于结构解析法,接近人类阅读文字的方法,在原理上适用范围广泛,亦可应用到手写的写本上。目前的成果,由IBM大型电脑3081来辨识,Kern‧南条校订本的一行长度,所需时间约为十秒,辨识率达99%。因此,在此期间所积存的印刷天成字体达二百种,超过一万字以上,可说悉数搜集一般常用的所有字体种类了。
  同时,我们也进行天成体中众多类似文字的高精度辨识之研究。依此所开发的方法,适用于一般文字的辨识,是一项新创举,我们期待也能对汉字的自动辨识有所贡献。
  目前,我们正进行木刻版西藏佛教文献的自动辨识研究。藏文文献为比较清晰的资料,据此可作为手写文献研究的开端。不过,由于文字幅度之不一,行数之重叠,如何克服文字之断句,仍是当前的课题。
  (四)梵字演变之研究
  应用上述梵字自动辨识之研究所获致之成果,我们也进行了梵字演变的研究。
  不只梵字,文字在历史上的演变,超乎想像之外的激烈。特别是对年代久远的文献,作比较文献学之研究时,其记述文字之变化,是极为重要的考虑因素。误读一个文字,将会造成全然相反的解释,因此必须慎重检讨。
  我们于收集《梵文法华经写本集成》中所出现的全部文字种类时,开始了梵字演变之研究。起初,对于几个类似的文字,来进行比较性的辨识实验。我们从数种写本抽出几个主要的字,作成标准字体。以此字体来比较其他写本,然后确立辨识不同文字之方法。
  建立文字特征一般所用的方法,在结构解析的最初阶段,细线化最为适用。我们收集了许多梵字,来进行细线化的工作,其成果就是完成了一部梵文历史变迁辞典。目前,我们正在整理将收集到的各种梵字,予以细线处理,并计画将结果整理出版,以供想直接阅读原典的研究者参考。
  (五)以加速器质量分析法来测定佛教史料年代
  我们的研究小组,除了电脑之外,也利用各种最新的科技帮助佛教的研究进行。其中,先举以加速器来测定史料年代之例子。
  在测定史料的制成年代方面,利用该史料所含放射性同位元素的比率,可以测知。例如,碳十四的半衰期为5730年,与不含放射性的碳十二与其含量作比较,能够以数百年的精确度来推定数千年前史料的制成年代。传统测试史料年代的方法,是燃烧大量的所测史料,然后测定燃烧所得的碳,用以推测年代。不过,在测知年代之后,史料也随之丧失一部份。最近,开发出加速器质量分析法(AMS,Acce-lerator Mass spectrometry),只要用从前方法的千分之一或万分之一的材料,即可确定其制成年代。
  (六)诵经之音声辨识
  梵语是古印度的文言文,现在已成死语。不过,大多数的佛典是以佛教混淆梵语记述而成的,僧侣的诵经亦继续着这种语言。
  我们的研究小组,针对外国留学生的日语教育,进行了电脑日语会话的自动辨识研究。其成果也用来作为梵语颂经的试验。
  从冢本启祥先生处借得《namo tassa bha-gavato arhato sammāsambuddhassa》的录音带,用以进行音声解析。录音带的诵经,不仅抑扬顿挫,而且伴有法器的声音,甚难解析。
  进行音声自动辨识,必先完成抽出各种音素的辞典。对于母音,自动辨识的精确度极高。可是,一般而言,子音种类繁多,加上类似音、长短音等等因素,用单纯的方法难以自动辨识。以日语为例,除了母音、子音的因素之外,还要构筑附加一般语言知识的系统,始能辨识。对于梵语,在考虑同样的理由下,必先制成电子辞典,而且也要进行文法解析的自动化。这类课题,实际上,与文献之自动辨识类似,是不可或缺的,更须慎重检讨,再予以克服。
  (七)佛学电子公告栏
  应用电脑网路所设置的东北大学佛学电子公告栏,全世界有百余位佛学研究者参加。平均每天有十处左右的电子会议进行,而以东北大学为中心,每天则收到上千通的电子函件。三年之间,累积了相当数量的电子会议的记录,此处已确立了佛教研究者所利用之资料库地位。
  ◎附二︰冢本启祥着‧郭敏俊节译〈法华经电脑化之研究〉(摘录自《法光》杂志第四十五期)
  (一)梵文佛典研究的问题所在
  (1)传统的佛典研究
  佛教传入日本以来,长期间佛教之研究都以汉译佛典为依据,并且相信佛典所载的都是佛陀直接的教说,奉之为绝对的真理,而不需要去求证。因此,对于佛陀的教说,(在日本)一直就以汉译佛典与中国所著述的注释书为线索,从汉语的语感及语义来理解。及至江户时代,长达千余年所写成的日本佛教典籍,悉数具有这种性格。
  然而,自江户时代富永仲基(1715~1746)著《出定后语》提出“大乘非佛说”之后,批判性的佛典研究于是开始萌芽。明治以降,欧洲的研究方法被引进日本,梵语佛典、藏译佛典、巴利圣典始为日本人所认识。在此情况下,同一经典的梵语原典与不同译本之比较研究,就具备可能性了。
  (2)汉译佛典的原典
  印度传到汉地所译成的佛典,一般认为是自梵文翻译的。不过,当我们检讨汉译佛典的译语时,发现类似佛/佛陀,菩萨∕菩提萨埵等译语,同一个原文有数个不同的译语。起初,我们认为前者是后者的略称,进而,我们发现同一佛典数度被译的情形也不少,而这些经典的构成、内容、译语差异颇大。据此,可了解佛典的传译过程中,语言形态、经典改编以及各种条件变化的概况。
  汉译佛典的开展过程可区分为古译(一至四世纪)、旧译(五至六世纪)、新译(七至十三世纪)。在各个不同的翻译之间,其语音的音译与义译之译语均有差异,同时也发现各个译本各具其特色。这些特色可视为同一经典随着时代之变迁所留下的痕迹。
  (3)佛典的语言
  佛陀并不是用梵语说法的。梵语是纪元前五世纪文典家所确立的一种文献语言,被印度正统宗教的婆罗门教作为圣典语言。而站在批判立场的佛教与耆那教等沙门宗教,为了向一般民众传播其教义,则使用各地的俗语(中期印度的亚利安语,即Prakrit语)。佛教兴起于摩揭陀,也许佛陀是以摩揭陀语说法的吧!
  面积匹敌西欧,由多数人种组成的印度,各地使用不同的语言。随着佛教之传播全印度,摩揭陀语也随之被译成各地的俗语。
  今日,南方上座部的圣典,即以巴利语流传下来。这或许是摩揭陀语转换成西印度的俗语,或是受了西印度的影响之后传入斯里兰卡的。总之,巴利语的文法相当完备。另一方面,北传佛教在通过梵语文化圈(今日德里周围)的传播过程中,被译成梵文。当然,这种梵文化是经过数世纪的漫长时间逐渐形成的。因此,愈是初期的佛典,俗语的特征愈是浓厚,而后世的佛典,则近于古典梵语。这种梵语与俗语混合之佛典特有语言,称为“佛教混淆梵语”。
  玄奘三藏(七世纪)深感既有的佛典,其译语相当混乱,因而西行印度学习梵文,搜集佛典请回汉地。玄奘所确立的翻译称为“新译”。在此之前所译成各种译本,是原典梵语化过程中的经典,于不同时代,在不同的因素下,传到中国而被译的。例如“佛”的俗语为budh(a),“佛陀”的梵语为buddha;“菩萨”的俗语为bod(hi)-sat(ta),“菩提萨埵”的梵语为bodhi-sattva。由此可以推定不同的音译是由于俗语与梵语语音不同的缘故。
  (4)梵文写本
  所谓梵文写本,系以棕榈叶、白桦树皮、纸等写成,容易腐朽。古形的写本现在不复存在。中亚写本的上限年代为五世纪,喀什米尔写本为六世纪,尼泊尔、西藏写本为十一世纪。由此,保留古形的古译、旧译的汉译佛典(即现存梵文、藏译尚未确立之前的古代佛典),可以提供回溯现已不存的古代梵文原典的线索。
  (5)《法华经》的原典与翻译
  今天在日本广被诵读的《法华经》,其经典除了《妙法莲华经》(406年,鸠摩罗什译)外,尚有属于“古译”的《正法华经》(286年译)与“旧译”末期的《添品妙法莲华经》(601年译)。这三个译本,其经典的构成及其改编、文节插入或欠缺、语汇增删或置换等,均有极为明显的差异。
  《法华经》有其历史性,其信仰运动之实践道,以劝人受持、读、诵、解说、书写经典为“师行五种法”,并宣扬其功德,在亚洲地区广为流通。其原典写本,在现存佛典当中,数量为最多,其出土地域包含︰{1}中亚(五至八世纪),②喀什米尔(六至七世纪),③尼泊尔、西藏(十一至十九世纪)。到目前为止,经确认的现存原典写本(含端本)多达六十种,然而其内容与构成,却相差甚大。这是原典写本在传承过程中,受到流传的时代、地域、书写者的出身地等等因素的影响,也意味着原典在音韵学、文法学上的变貌,以及语汇之插入、修正与文献组成之改编等等现象。
  (6)《法华经》原典的校订本与问题点
  第一本梵文《法华经》原典的校订本,由H. Kern与南条文雄整理出版。此校订本比对了六本尼泊尔系写本(十一至十二世纪三本,十八至十九世纪三本)及两本中亚系写本(七至八世纪),虽然此校订本将两系统写本间之差异所在予以注记,然尚未臻完善。此外,又因校订者本身的理解与研判,难免有将混淆俗语的原典修正为古典梵文之倾向。此后,荻原云来、土田胜弥……等人所整理的校订本,亦是立于同样的编集方针。如同上述,把不同时代与西域的各个写本,视为同一,却忽略了写本流传的系统与形态、使用语言,及文字的特殊性等等问题。因此,在推论《法华经》原典的工作上尚残留着种种的问题。
  (二)梵文写本资料库化
  (1)《法华经》的搜集与比较研究
  为了解决上述的问题点,立正大学法华经文化研究所,自1966年起十年间,向世界上所有保存《法华经》的机构搜集梵文原典的照片,共计三十种写本。并且把这些写本与Kern校订本作各行之比对,拍成照片结集成书,于1977年出版《梵文法华经写本集成》。
  (2)《法华经》写本之资料库化
  上述的《梵文法华经写本集成》只能给专家使用,为了让一般研究者能够解读原典,必先转写成罗马拚音。可是写本集成的本文长达六四八二页,若是整理作成索引与出版的话,最少要耗费半世纪以上的时间。因此,我就想到利用电脑来建立资料库。在东北大学资讯教育中心的协助下,立正大学与东北大学的有关人员,于1986年完成了《梵文法华经写本集成罗马字本‧索引》。
  (3)开发经典编集用的程式
  将梵文转写成罗马字以编集经典,并且建构资料库,兼具印刷清晰、出版等功能,并且以个人用电脑与英文打字的连动为前提,在种种目的的需求之下,我们开发了输入的软体程式,并且制作了梵文表记的活字。
  (4)索引用程式
  电脑编集经典的一项优点,就是能够正确又迅速取得索引资讯。多达六四八二页的经典文句;加上全部词汇的分类,就要有上亿的语文容量。因此,东北大学资讯教育中心利用泛用大型的电脑,开发出依梵文字母顺序的索引软体程式,除了具有词汇索引的功能外,尚可作逆反索引(Reverse Index)。
  (三)资料库化后的研究课题
  《法华经》经典电脑资料库化之后,我们发现了新的研究课题,有待研究解决。主要的问题如下︰
  (1)语汇检索系统︰如同Index所能显示的功能,即除了所检索的语汇所出现的页数、写本记号之外,还能够显示出包含该语汇的文脉。
  (2)文法解析的基础作业︰逆反索引,就是自语汇末尾字母逆向语首排列的反索引。语汇的格变化与动词变化,会在语尾显示出来,是为文法解析的基础。例如mai-tre-ya∕mai-treyu*∕maitreye*虽然是同一文脉,这是“弥勒!”之意(男性、单数、呼格),前面所列者为梵文形,*号者为俗语形。
  (3)辞典编撰及其基础作业︰(计画中)
  (4)写本文字的系统别分类︰利用电脑的自动解读与共同作业,对于各写本的文字之展开过程与特征,加以探讨。这项工作亦待进行。
  (5)文化史的考察︰写本中语汇之修正与增删,显示出在流传过程中,文化与思想的交流情形,这点亦值得详加考察。
  [参考资料] 日本‧花园大学国际禅学研究所《电子达摩》(The Electronic Bodhidharma)。