.01 簡介
何謂數位化?
在數位資料俯拾皆是的今日,對漢文古籍知識的解讀我們卻依然仰賴學者專家。其困難點並不在於數位工具未臻完備,而是對漢文古籍的解讀能力不足。數位資料的使用在於「數位化」了哪些內容。例如掃描古籍,是將影像轉換為電子影像格式的檔案,打字是將文字轉換為電子字元格式的檔案。在文本數位化後,確實對傳輸、運算、儲存、查詢等功能大有幫助。若要再提升效益,目前有幾個方法:超連結、資料庫、標記語言等。這些工具可以再使用樞紐分析、地圖、網絡圖、時間線軟體輸出運算的結果。因此,數位化是為了能夠進行有意義的運算。例如,唐朝有兩位玄奘法師,一位即西行取經的唐三藏,一位是荊州玉泉寺玄奘。若要利用資料庫輸出唐三藏取經的行跡地圖,卻不能參雜到荊州玄奘的行跡,要如何做到呢?
所以就是要倚賴專業解讀服務,數位化才能辦到。茲舉一例:
《宋高僧傳.善無畏傳》卷2:「纔至中天竺境,即遇其王。王之夫人,乃畏之女兄也,因問捨位之由,稱歎不足。」
這裡的「畏」是指唐朝的善無畏和尚。該句看起來是說善無畏在中天竺遇見嫁給國王的姊姊,她詢問善無畏放棄王位的來由,並稱讚不已。但另一筆記載:
《全唐文.東都聖善寺無畏三藏碑》卷319:「至中天竺境上,乃遇其王。王之夫人,即和尚妹也。和尚服同凡品,而徒侶以君禮奉之。王問獲其由,嗟稱不足。」
比較之下《宋高僧傳》的標點應該改為:
纔至中天竺境,即遇其王──王之夫人,乃畏之女兄也──,因問捨位之由,稱歎不足。
這樣兩筆記載才能一致。
專業的漢文古籍解讀能力是數位化成功與否的核心。目前許多學者想要使用人工智慧(artificial intelligence,AI)、大數據(big data)來數位化漢文古籍,但在沒有背景知識的前提下,是難以成功的。