內(nèi)蒙古自治區(qū)蒙古文信息處理技術(shù)重點實驗室“探秘”——當(dāng)蒙古語“牽手”人工智能
“蒙古文AI云服務(wù)平臺”獲得2020年中國CCF科學(xué)技術(shù)獎。
飛龍教授(左二)與研究生一同探討科研問題。
高光來教授(前排左一)指導(dǎo)實驗室研究工作。
第三屆中蒙博覽會上,蒙古語智能交互機(jī)器人與參觀者進(jìn)行智能對話。□本報記者 白蓮
信息飛速發(fā)展的當(dāng)下,如何傳承保護(hù)好少數(shù)民族語言文字、圖書古籍以及音視頻文件,讓各族人民群眾盡享科技發(fā)展的紅利?在內(nèi)蒙古自治區(qū)蒙古文信息處理技術(shù)重點實驗室(以下簡稱實驗室),有這樣一支年輕的團(tuán)隊,他們視民族文化傳承與保護(hù)為己任,始終為蒙古文信息化發(fā)展付出不懈努力。
隨著全球首款綜合性蒙古文人工智能信息處理云服務(wù)平臺“蒙古文人工智能AI平臺”、國內(nèi)首款蒙古語“奧云AI合成主播”、國內(nèi)首款具備手寫語音識別功能的蒙古文輸入法等一系列科研成果走出實驗室,走入生產(chǎn)生活,不僅讓蒙古語與人工智能結(jié)合從理想照進(jìn)現(xiàn)實,也助力蒙古語在教育、氣象、交通等多個領(lǐng)域的運用,讓蒙古族文化在新時代重新煥發(fā)出新的活力。
讓計算機(jī)“能聽會說”蒙古語
如今,手機(jī)、電腦等終端成為人們獲取信息的重要手段。但對于蒙古族語言文字使用者來說,互聯(lián)互通的信息世界仍有限制,他們對蒙古文信息化有著迫切需求。
“由于蒙古文信息化工作在國內(nèi)外均沒有可借鑒或可運用的技術(shù)資源,導(dǎo)致蒙古語言文字信息處理技術(shù)發(fā)展較為滯后,過去一直沒有功能齊全的蒙古文輸入法?!睂嶒炇腋敝魅物w龍教授告訴記者。在國內(nèi),國家通用語言信息處理技術(shù)相對成熟,團(tuán)隊利用通用語言優(yōu)勢,廣泛學(xué)習(xí)借鑒相關(guān)信息化技術(shù)。
一切從零開始,一點點累積。
韻律建模問題是影響語音合成自然度和可懂度的重要因素。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,在海量文本和語音數(shù)據(jù)的支撐下,韻律建模可以取得令人滿意的效果。但是,在面對蒙古語這樣的低資源語言時,韻律建模往往充滿很多挑戰(zhàn)。
“第一,蒙古文韻律建模的數(shù)據(jù)規(guī)模有限,沒有海量的文本和語音數(shù)據(jù)用于模型的充分訓(xùn)練;第二,蒙古文獨特的黏著語特性導(dǎo)致蒙古文單詞具有復(fù)雜的構(gòu)詞特點,現(xiàn)有的韻律建模方法并沒有充分挖掘與韻律表達(dá)相關(guān)的構(gòu)詞特點以用于蒙古文韻律模型的訓(xùn)練?!憋w龍告訴記者,為了解決以上問題,研究團(tuán)隊提出了一種蒙古文單詞表示特征強(qiáng)化方法,并融合自注意力機(jī)制進(jìn)行韻律標(biāo)簽的預(yù)測。實驗結(jié)果證明,該方法可以有效提升蒙古文韻律建模的精度,并且最終提升蒙古語語音合成系統(tǒng)合成語音的整體表現(xiàn)。
飛龍教授現(xiàn)場為記者展示了這款具有自主知識產(chǎn)權(quán)的具備手寫語音功能的蒙古文輸入法,該輸入法能夠?qū)⒂脩粽f的蒙古語,在短短幾秒內(nèi)轉(zhuǎn)換成對應(yīng)的文本內(nèi)容。同時,還具有蒙古文手寫識別輸入、蒙古文詞組聯(lián)想輸入等6項功能。目前,奧云蒙古文智能手機(jī)輸入法安裝量已超過45萬,并且得到了用戶的廣泛好評。
“自2007年實驗室成立以來,研究開發(fā)了蒙古文信息檢索系統(tǒng)、蒙古文印刷體識別系統(tǒng)、蒙古文古籍檢索系統(tǒng)及以蒙古文為主的多語種電子辭典等軟件。實驗室的基礎(chǔ)研究不斷提升,為實現(xiàn)計算機(jī)‘能聽會說’蒙古語奠定了基礎(chǔ)。”實驗室主任高光來教授表示。
“讓計算機(jī)‘開口’說話是計算機(jī)語音合成研究的成果。利用人工智能深度學(xué)習(xí)技術(shù),讓計算機(jī)不僅能聽懂蒙古語,還能‘說’蒙古語,是我們一直以來努力的方向?!憋w龍教授告訴記者。
2019年,國內(nèi)首款蒙古語“奧云AI合成主播”首秀成功,實現(xiàn)了蒙古語與人工智能和新聞采編的深度融合。
該AI合成主播采用蒙古語語音合成、蒙漢機(jī)器翻譯、人臉關(guān)鍵點檢測、人臉特征提取、人臉重構(gòu)、唇語識別、手勢姿態(tài)合成等多項前沿技術(shù),生成與真人無異的蒙古語AI分身模型,進(jìn)而提高信息表達(dá)和傳遞的效率。
近年來,國家以及自治區(qū)大力推動少數(shù)民族語言文字信息化工作,極大地推動了實驗室蒙古語智能信息化研發(fā)工作。高光來介紹,實驗室成立的初衷,就是以蒙古文智能信息處理研究與蒙古文軟件開發(fā)為重點。研究團(tuán)隊依托內(nèi)蒙古大學(xué)計算機(jī)學(xué)院,先后承擔(dān)了國家相關(guān)計劃專項課題,主要研究方向包括蒙古文智能信息處理、人工智能與模式識別、圖像處理與虛擬現(xiàn)實。
2019年,實驗室推出了國內(nèi)首款蒙古文人工智能AI平臺,該平臺免費為用戶提供“蒙古文印刷體識別(OCR)”“蒙漢相互自動機(jī)器翻譯”“傳統(tǒng)蒙古文與新蒙古文相互轉(zhuǎn)換”等一系列功能,為蒙古語言文字信息處理任務(wù)提供了全面的智能化解決方案。
目前,該平臺已在中國和蒙古國得到廣泛應(yīng)用,滿足了宣傳、教育、文化、司法、辦公、政務(wù)等領(lǐng)域的蒙古語言文字智能信息處理需求,提升了我國少數(shù)民族語言文字智能化水平,對于保護(hù)和傳承少數(shù)民族語言文字與特色文化,發(fā)展少數(shù)民族地區(qū)經(jīng)濟(jì)具有重要意義。
用信息化成果傳承保護(hù)文化古籍
目前,自治區(qū)很多單位保存有大量早期出版發(fā)行的蒙古文圖書、報紙和文檔,是非常珍貴的文獻(xiàn)資源?;谶@些資源,利用蒙古文信息處理技術(shù),建立蒙古文大數(shù)據(jù)資源庫,對蒙古語言文字信息化發(fā)展具有重要意義。
這些寶貴文獻(xiàn)的數(shù)字化過程中,早期公開的蒙古文印刷體識別系統(tǒng)僅能處理蒙古文白體印刷的文檔,識別精度比較低,難以滿足實際應(yīng)用需要。
面向蒙古文共享工程、蒙古文應(yīng)用推廣和蒙古文信息化相關(guān)建設(shè)需要,實驗室做了大量工作,持續(xù)研發(fā)“蒙古文OCR系統(tǒng)”等應(yīng)用平臺和軟件產(chǎn)品,成為助力蒙古文數(shù)字化的有效途徑。
通過蒙古語言文字信息化建設(shè),推動了區(qū)內(nèi)外相關(guān)企事業(yè)單位、科研院校之間的技術(shù)交流和相互協(xié)作,促進(jìn)了蒙古語言文字信息化在基礎(chǔ)研究、人才培養(yǎng)、技術(shù)研發(fā)、資源建設(shè)、推廣應(yīng)用等領(lǐng)域的全面發(fā)展,使信息化建設(shè)成果不斷惠及各族群眾。
“人工智能、‘互聯(lián)網(wǎng) ’時代,社會對信息相關(guān)專業(yè)人才的需求日益增長,而我們所做的,正是以完備的軟硬件設(shè)施與雄厚的師資力量,為國家培養(yǎng)和輸送高質(zhì)量人才?!痹诟吖鈦斫淌诳磥?,蒙古語人工智能發(fā)展的關(guān)鍵在于聚集培養(yǎng)優(yōu)秀科技人才。
高光來介紹,實驗室的科研團(tuán)隊從最初的5-6人到現(xiàn)在的19人,其中17人具有博士學(xué)位,12人是從國內(nèi)外引進(jìn)的學(xué)術(shù)骨干和優(yōu)秀博士,并且,團(tuán)隊中4人為蒙漢英兼通的蒙古族博士。目前,實驗室正在培養(yǎng)16名博士研究生和113名碩士研究生,其中16名學(xué)術(shù)型碩士研究生和19名專業(yè)學(xué)位碩士研究生已畢業(yè)并獲得碩士學(xué)位,為少數(shù)民族語言信息化的發(fā)展提供了人才保障和技術(shù)支撐。
目前,實驗室共承擔(dān)科研項目34項,其中包括國家重點研發(fā)計劃(政府間國際科技創(chuàng)新合作重點專項)1項,國家自然科學(xué)基金10項。2019年和2020年,實驗室總投入605萬元,購置了GPU計算集群,進(jìn)一步提高了實驗室的計算能力,為產(chǎn)出高水平的科研成果提供保障。
“蒙古文信息化建設(shè),對蒙古族文化的發(fā)展具有重要的保護(hù)及傳承作用,所以,對于蒙古文信息化和人工智能化,我們從前在研究,現(xiàn)在在研究,今后也會繼續(xù)研究下去,助力蒙古族文化走向世界?!备吖鈦斫淌谡f。
(配圖由受訪者提供)