我國將打造1.2億詞級蒙古文文獻(xiàn)語料庫
2018-11-23 10:39:11 來源: 新華網(wǎng)
關(guān)注新華網(wǎng)
微博
Qzone
評論
圖集

  新華社呼和浩特11月23日電(記者勿日汗)我國正在建設(shè)一個(gè)總字?jǐn)?shù)將達(dá)到1.2億詞的大型蒙古文文獻(xiàn)語料庫,目前已完成800萬字語料的錄入校對工作。

  記者從承擔(dān)這項(xiàng)工作的內(nèi)蒙古自治區(qū)社會科學(xué)院了解到,蒙古文文獻(xiàn)語料庫,將窮盡式收集和納入自蒙古文第一部文獻(xiàn)《成吉思汗碑文》(1225年)以來的中世紀(jì)傳統(tǒng)蒙古文文獻(xiàn)和近代蒙古文木刻本文獻(xiàn)。對于現(xiàn)代文獻(xiàn),將按學(xué)科分類,即按法律法規(guī)、文學(xué)藝術(shù)、新聞媒體、醫(yī)藥醫(yī)學(xué)、應(yīng)用公文、教學(xué)教材、軍事、體育等擇優(yōu)選錄。

  蒙古文文獻(xiàn)語料庫建設(shè)將通過錄入、校對、數(shù)據(jù)標(biāo)注加工等環(huán)節(jié),按照國際領(lǐng)先水準(zhǔn),設(shè)計(jì)蒙古文語料資源管理平臺網(wǎng)絡(luò)版。其最終目標(biāo)是建成世界最大、最全、最精的網(wǎng)絡(luò)版蒙古文文獻(xiàn)語料庫,為保護(hù)、開發(fā)、利用蒙古文文獻(xiàn)資料提供基礎(chǔ)。

  2015年策劃開展的這項(xiàng)工作將于2024年結(jié)束。目前,正在進(jìn)行共109卷的佛教經(jīng)典蒙古文《甘珠爾經(jīng)》的錄入工作。

+1
【糾錯(cuò)】 責(zé)任編輯: 張樵蘇
新聞評論
加載更多
漠河迎來入冬最低溫
漠河迎來入冬最低溫
山火肆虐后的天堂鎮(zhèn)
山火肆虐后的天堂鎮(zhèn)
蜂鳥戲花
蜂鳥戲花
探訪陜西歷史博物館館藏文物
探訪陜西歷史博物館館藏文物

?
010020020110000000000000011105701123757666