「漢字古今音資料庫」(Chinese Character Readings,簡稱CCR)是一個為方便檢索漢字古今音而設計的線上聲韻資料庫,可提供使用者根據字頭查詢古今字音,或依需要設計各種檢索條件做資料的閱讀和分析。 本資料庫是行政院國家科學委員會「漢學研究資料庫」研發計畫下的成果之一,由臺灣大學中文系黃沛榮教授擔任總計畫主持人,楊秀芳教授擔任子計畫主持人,中央研究院語言學研究所何大安研究員為共同主持人。本資料庫自1997年開始進行基本架構的設計以及語料的判讀,並開發雛型系統。隨著聲韻資料的日益完備及資訊科技的日新月異,本資料庫歷經多次擴充及改版,以期增強功能,方便線上檢索。2009年,中央研究院資訊科學研究所文獻處理實驗室獲邀加入研發團隊,協助修改系統,重整資料庫架構,並參與資料維護等相關工作,使本資料庫終能改善體質,於2011年9月開放供各界使用。 本資料庫所提供的可查詢漢字總共兩萬多字,主要根據宋代韻書《廣韻》收字,此外並酌收其他字書、韻書及近代新增的少數字。根據《廣韻》收字的原因,在於它是中古時期集結古今南北字音的總匯,又有反切材料可資利用。以《廣韻》為基礎,可以上探中古以前的音韻系統,下求中古以後的音韻變化規律,對漢語音韻史及漢語方言的研究來說,《廣韻》具有無可取代的重要地位。 本資料庫的框架,由這兩萬多字的中古聲韻資料搭建而成,包括各字所屬的調類、韻目、字母、清濁、等第、開合等。在這框架之下,規劃輸入上古、中古、近代、現代四個階段的語音資料,並有日本、韓國和越南三地的域外譯音。上古階段包括先秦、兩漢音系;中古階段包括魏晉、南北朝、隋唐音系;近代音收錄元代《中原音韻》以及明代《洪武正韻》的音系;現代音部份則包括各大方言區的代表方言以及國語和幾種土話。 在本資料庫的構想框架下,許多重要資料還有待輸入,已輸入資料的校對也還需要持續進行,而且聲韻資料涉及的問題多,錯漏之處尚祈方家批評指正。未來本資料庫將在上述兩個合作單位的共同努力下,進一步結合漢語文獻的形音義資料,做更完備的擴充整合,敬祈各界不吝指教。
猜你喜欢