藏文古籍文獻(xiàn)是珍貴的文化遺產(chǎn),是藏族文化的重要載體。促進(jìn)藏文古籍文獻(xiàn)數(shù)字化,用現(xiàn)代技術(shù)賦能文化發(fā)展,有利于創(chuàng)新我國(guó)藏文文獻(xiàn)資源保護(hù)、開(kāi)發(fā)和利用模式,實(shí)現(xiàn)把寶貴的藏族優(yōu)秀傳統(tǒng)文化保護(hù)好、傳承好、發(fā)展好的目標(biāo)。
近日,第七屆北京國(guó)際藏學(xué)研討會(huì)在北京舉行,西藏大學(xué)信息科學(xué)技術(shù)學(xué)院擁措教授在會(huì)上表示,運(yùn)用數(shù)字化技術(shù)保護(hù)藏文古籍文獻(xiàn),推動(dòng)文化繁榮,我們要做出力所能及的貢獻(xiàn)。
圖為擁措教授在第七屆北京國(guó)際藏學(xué)研討會(huì)上接受采訪 攝影:陳浩力
加大數(shù)字化保護(hù)力度構(gòu)建新時(shí)代新格局
“從利用現(xiàn)代化手段對(duì)古籍進(jìn)行保護(hù)的角度來(lái)說(shuō),藏文古籍文獻(xiàn)的保護(hù)工作過(guò)去主要面臨兩大困難:一是之前的藏文古籍文獻(xiàn)數(shù)字化程度低,由于古籍版式多樣、圖文混排、結(jié)構(gòu)緊密等現(xiàn)象,導(dǎo)致識(shí)別難度高,所以藏文古籍全文數(shù)據(jù)庫(kù)的建設(shè)也就更為復(fù)雜;二是對(duì)研究人員相對(duì)要求高,既要懂語(yǔ)言文字和數(shù)字化技術(shù),又要了解藏文古籍文獻(xiàn),所以早期從事藏文古籍?dāng)?shù)字化研究的人員相對(duì)較少,研究力量薄弱?!睋泶虢榻B道。
目前在多方努力下,這兩大難題逐漸得到緩解。國(guó)家出臺(tái)了很多針對(duì)古籍保護(hù)的文件,從2007年國(guó)務(wù)院辦公廳印發(fā)《關(guān)于進(jìn)一步加強(qiáng)古籍保護(hù)工作的意見(jiàn)》,到2022年中共中央辦公廳和國(guó)務(wù)院辦公廳印發(fā)《關(guān)于推進(jìn)新時(shí)代古籍工作的意見(jiàn)》,明確提出了要推進(jìn)古籍?dāng)?shù)字化,顯示了政策層面的重視。西藏自治區(qū)也積極響應(yīng),不斷加大西藏古籍普查、修復(fù)、數(shù)字化、隊(duì)伍建設(shè)等方面的工作力度?!霸谖覀儗W(xué)校、學(xué)院的各級(jí)領(lǐng)導(dǎo)精心指導(dǎo)下,越來(lái)越多的老師和學(xué)生不斷投身到藏文古籍?dāng)?shù)字化保護(hù)這一領(lǐng)域,研究隊(duì)伍也不斷壯大?!?/p>
相信隨著5G時(shí)代的到來(lái),人工智能、大數(shù)據(jù)等技術(shù)發(fā)展,通過(guò)加強(qiáng)數(shù)據(jù)庫(kù)建設(shè),在藏文古籍文獻(xiàn)數(shù)字化轉(zhuǎn)化和知識(shí)挖掘這兩個(gè)方面,將會(huì)形成性能更好的藏文古籍識(shí)別模型和更為全面的藏文古籍?dāng)?shù)據(jù)庫(kù)和知識(shí)庫(kù),推動(dòng)研發(fā)成果實(shí)現(xiàn)更廣泛的應(yīng)用。
黨的十八大以來(lái),黨中央站在實(shí)現(xiàn)中華民族偉大復(fù)興的戰(zhàn)略高度,對(duì)傳承和弘揚(yáng)中華優(yōu)秀傳統(tǒng)文化作出一系列重大決策部署。從藏文古籍文獻(xiàn)的資源庫(kù)建設(shè),到后續(xù)的文字識(shí)別、知識(shí)挖掘等智能信息處理,再到數(shù)據(jù)的開(kāi)發(fā)和共享,這一系列舉措創(chuàng)新了我國(guó)藏文文獻(xiàn)資源開(kāi)發(fā)和利用模式,推動(dòng)了藏文古籍文獻(xiàn)的創(chuàng)造化轉(zhuǎn)化和創(chuàng)新性傳承,擔(dān)負(fù)起把寶貴的文化遺產(chǎn)保護(hù)好、傳承好、發(fā)展好的使命,為新時(shí)代實(shí)現(xiàn)中華民族偉大復(fù)興提供精神力量。
圖為國(guó)家重點(diǎn)研發(fā)計(jì)劃重點(diǎn)專項(xiàng)《藏文文獻(xiàn)資源數(shù)字化技術(shù)集成與應(yīng)用示范》標(biāo)志性成果之一“藏文古籍版面分析和文字識(shí)別系統(tǒng)”受訪者供圖
信息技術(shù)水平提高研究成果日益增多
在談到目前藏文古籍文獻(xiàn)方面智能處理技術(shù)的研究進(jìn)展時(shí),擁措談到在2017年至2022年期間,西藏大學(xué)聯(lián)合國(guó)內(nèi)十幾家單位,牽頭承擔(dān)了科技部的一個(gè)國(guó)家重點(diǎn)研發(fā)計(jì)劃重點(diǎn)專項(xiàng)——藏文文獻(xiàn)資源數(shù)字化技術(shù)集成與應(yīng)用示范,該項(xiàng)目首席科學(xué)家和項(xiàng)目負(fù)責(zé)人是西藏大學(xué)尼瑪扎西教授。該項(xiàng)目成果獲得了2022年度西藏自治區(qū)科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)。目前研發(fā)成果已經(jīng)在西藏各大圖書(shū)館、布達(dá)拉宮古籍?dāng)?shù)字化保護(hù)中得到了廣泛推廣和積極應(yīng)用,為他們提供了很好的技術(shù)支撐。
“在此基礎(chǔ)上,西藏大學(xué)還承擔(dān)了西藏自治區(qū)科技廳的有關(guān)圖文識(shí)別項(xiàng)目,通過(guò)利用前沿的人工智能算法,對(duì)多場(chǎng)景多字體識(shí)別技術(shù)做了更進(jìn)一步的研究,包括古籍和其他場(chǎng)景下的多字體文字識(shí)別技術(shù)?!睋泶氡硎荆麄兊难芯坎⒉痪窒拊谖淖肿R(shí)別的智能處理上,更進(jìn)一步拓展至后續(xù)的知識(shí)挖掘和利用。
在擁措老師所帶領(lǐng)的研究生中,很多學(xué)生針對(duì)藏醫(yī)藥方面的古籍文獻(xiàn)智能信息處理展開(kāi)研究,在文字識(shí)別的基礎(chǔ)上,進(jìn)行知識(shí)圖譜構(gòu)建關(guān)鍵技術(shù)的研究,包括藏醫(yī)藥領(lǐng)域?qū)嶓w識(shí)別和關(guān)系抽取、智能問(wèn)答系統(tǒng)等。譬如說(shuō)針對(duì)《四部醫(yī)典》藏醫(yī)經(jīng)典著作,可以用自然語(yǔ)言處理技術(shù),抽取實(shí)體和關(guān)系信息,進(jìn)行知識(shí)圖譜的構(gòu)建和知識(shí)推理,這些研究對(duì)藏醫(yī)藥領(lǐng)域來(lái)說(shuō)有著重要的應(yīng)用價(jià)值和意義。
圖為擁措教授正在指導(dǎo)藏文古籍智能處理方向的研究生受訪者供圖
抓住研究關(guān)鍵節(jié)點(diǎn)學(xué)界業(yè)界深度融合
藏文古籍文獻(xiàn)研究的關(guān)鍵在于讓學(xué)術(shù)研究和應(yīng)用實(shí)踐相結(jié)合,一方面要推動(dòng)研究向縱深方向發(fā)展,同時(shí)要密切關(guān)注在實(shí)際應(yīng)用中的反饋,推動(dòng)二者形成一種正向循環(huán)。
從學(xué)術(shù)研究上看,實(shí)現(xiàn)藏文古籍文獻(xiàn)智能處理需要跨越多個(gè)領(lǐng)域,所以跨學(xué)科的合作尤為重要?!拔覀儓F(tuán)隊(duì)自身是計(jì)算機(jī)專業(yè),需要跨越語(yǔ)言文學(xué)這一學(xué)科,同時(shí)面向的研究領(lǐng)域又是藏醫(yī)藥學(xué),所以需要大家深入合作才能開(kāi)展研究。我們希望探索出一種更高效的合作模式,能夠讓來(lái)自不同領(lǐng)域的研究學(xué)者獲得他們所需要的知識(shí),又能夠讓他們形成合力,發(fā)揮出1+1+1>3的效果。”
從應(yīng)用實(shí)踐上來(lái)看,目前針對(duì)藏文古籍文獻(xiàn)的智能處理技術(shù)仍處于發(fā)展過(guò)程中?!耙恍┘夹g(shù)產(chǎn)品可能還不是那么的完善,所以我們希望將研發(fā)成果推廣出去,業(yè)界進(jìn)行實(shí)際操作時(shí),能夠給我們提出一些意見(jiàn)和建議,通過(guò)這些反饋,我們?cè)偃ジ倪M(jìn)模型和算法,使其更契合實(shí)際需求,從而為后續(xù)開(kāi)展更深層次的知識(shí)挖掘研究打下扎實(shí)的基礎(chǔ),讓藏文古籍文獻(xiàn)數(shù)字化服務(wù)的覆蓋面更寬、惠及面更廣?!?/p>
對(duì)于在數(shù)字化時(shí)代的發(fā)展展望,擁措認(rèn)為,隨著社交網(wǎng)絡(luò)的逐漸成熟,各類語(yǔ)種的文本出現(xiàn)在社交網(wǎng)絡(luò)上,如果藏文古籍文獻(xiàn)在數(shù)字化過(guò)程中建立起來(lái)的數(shù)據(jù)庫(kù)和知識(shí)庫(kù),能夠開(kāi)放共享給廣大學(xué)者或是公眾,那么將會(huì)有更多人通過(guò)微信、微博以及各種短視頻等社交媒體平臺(tái),接觸、了解、參與到古籍文化的傳播中來(lái),必將有助于研究成果的廣泛推廣和藏族優(yōu)秀文化的傳承,推動(dòng)西藏和國(guó)家文化事業(yè)的發(fā)展和繁榮。
(文章來(lái)源:中國(guó)西藏網(wǎng);記者:張萌萌 陳浩力 李絲雨)
版權(quán)所有 中國(guó)藏學(xué)研究中心。 保留所有權(quán)利。 京ICP備06045333號(hào)-1
京公網(wǎng)安備 11010502035580號(hào)