缺字系統
在數位化中國歷史文獻的過程中,由於電腦系統內,中文字編碼空間有限,時常會遇到不在既有編碼中的文字,這就是所謂的缺字問題。數位典藏技術發展組(DAAL)以漢字構形資料庫為基礎,構字式為主軸,發展了在網路上解決中文缺字問題的技術,此技術稱為未編碼中文字處理技術,俗稱缺字處理技術。
缺字處理技術發展至今,在網路應用上提供了一些服務,包括:
- 漢字檢索的網站:讓使用者可以在網頁上查詢漢字以及漢字的構字式。
- 提供字型圖片製作的功能,能將字型圖片下載回電腦使用。
- 線上呈現字形圖片API;是一個讓網頁上呈現缺字的Java Script程式,網頁載入處理的程式後,當使用者開啟網頁時,處理的程式會轉換頁面中的構字式成為適當大小的字形圖片,呈現在網頁的對應位置。如果漢字構形資料庫中尚未儲存對應的文字,我們的程式則會利用動態組字的方式來產生字形圖片。這項機制可以跨平台使用,以便利使用者存取及瀏覽含有缺字的頁面,而不需要額外在電腦中安裝字形檔。
(截取自原網站。)