特稿:人工智能助力保護(hù)“多彩鄉(xiāng)音”
2019-08-29 18:25:41 來(lái)源: 新華網(wǎng)
關(guān)注新華網(wǎng)
微博
Qzone
評(píng)論
圖集

  新華社重慶8月29日電? 特稿:人工智能助力保護(hù)“多彩鄉(xiāng)音”

  新華社記者彭茜 黎華玲

  “干啥子喲?”“你瞅啥?瞅你咋地?”

  在2019中國(guó)國(guó)際智能產(chǎn)業(yè)博覽會(huì)(簡(jiǎn)稱“智博會(huì)”)上,一款內(nèi)嵌了最新人工智能方言識(shí)別技術(shù)的智能翻譯機(jī)逗樂(lè)了來(lái)自天南海北的觀眾。

  無(wú)論是四川話、東北方言,還是吳儂軟語(yǔ),都被科大訊飛翻譯機(jī)逐字逐句轉(zhuǎn)換成漢語(yǔ)文本,再實(shí)時(shí)翻譯成英文。

  此次參展的阿里巴巴人工智能實(shí)驗(yàn)室也開(kāi)發(fā)了可識(shí)別四川方言的智能音箱“天貓精靈”,預(yù)計(jì)今年9月后正式發(fā)布,未來(lái)還會(huì)以智能音箱終端為基礎(chǔ),通過(guò)語(yǔ)音交互采樣建立覆蓋全國(guó)的動(dòng)態(tài)方言數(shù)據(jù)信息庫(kù)。

  人工智能,正在幫助我們留下“多彩鄉(xiāng)音”。

  方言是中國(guó)語(yǔ)言文化的瑰寶,傳承豐富的歷史文化內(nèi)涵;方言也是人們鄉(xiāng)情的根系,具有豐富的人文價(jià)值。在我國(guó),部分“小方言”在經(jīng)濟(jì)社會(huì)飛速發(fā)展的背景下有消失風(fēng)險(xiǎn),方言的保護(hù)和留存極具緊迫性。

  長(zhǎng)期在中國(guó)進(jìn)行漢語(yǔ)方言調(diào)研的韓國(guó)首爾大學(xué)中文系主任樸正九教授接受新華社記者采訪時(shí)說(shuō),漢語(yǔ)方言使用人口多、地域廣,在全球語(yǔ)言學(xué)研究中占有非常重要的地位,漢語(yǔ)方言有助于研究人類語(yǔ)言的共性和個(gè)性。

  早在2012年,科大訊飛就以粵語(yǔ)為突破口,開(kāi)展方言識(shí)別技術(shù)攻關(guān)。2017年,科大訊飛輸入法聯(lián)合中國(guó)聲谷發(fā)起“方言保護(hù)計(jì)劃”,近3年來(lái)已收集超過(guò)86萬(wàn)條方言語(yǔ)音,支持23種方言語(yǔ)音輸入,實(shí)現(xiàn)包括粵語(yǔ)、四川話、湖南話等11種方言的語(yǔ)音合成;微信小程序“我AI說(shuō)方言”還方便公眾隨時(shí)隨地上傳方言,建設(shè)中國(guó)方言庫(kù)。

  阿里巴巴人工智能實(shí)驗(yàn)室今年也宣布,正式成立方言保護(hù)專項(xiàng)小組,投入1億元人民幣對(duì)漢語(yǔ)方言進(jìn)行保護(hù)和開(kāi)發(fā)。

  科大訊飛輸入法業(yè)務(wù)部副總經(jīng)理、“方言保護(hù)計(jì)劃”發(fā)起人李強(qiáng)軍介紹,方言語(yǔ)料的采集、記錄和歸納是方言識(shí)別的基礎(chǔ)。以前,這項(xiàng)工作很大程度依賴于調(diào)查者主觀感知,而歸納完整的語(yǔ)音變化、進(jìn)行句法和語(yǔ)義分析等工作難以單靠人力完成,所以有必要建立分屬不同方言的數(shù)據(jù)庫(kù),利用人工智能系統(tǒng)地對(duì)方言文字、發(fā)音等進(jìn)行整理。

  “各種漢語(yǔ)方言在語(yǔ)法語(yǔ)音上的特征都不相同,很難被系統(tǒng)整理。用上人工智能技術(shù),對(duì)方言保護(hù)和研究大有幫助。”樸正九說(shuō)。

  其實(shí),外語(yǔ)語(yǔ)音識(shí)別與方言識(shí)別的人工智能訓(xùn)練方法是相通的。隨著技術(shù)進(jìn)步,可用統(tǒng)一的語(yǔ)音識(shí)別模型,導(dǎo)入各地方言等不同語(yǔ)料進(jìn)行無(wú)監(jiān)督訓(xùn)練。我國(guó)語(yǔ)言學(xué)界將現(xiàn)代漢語(yǔ)方言分為十大方言區(qū),方言識(shí)別難度有所不同,落實(shí)到輸入法產(chǎn)品中,識(shí)別準(zhǔn)確率也略有差異。

  “適配不同的方言識(shí)別,對(duì)整體語(yǔ)音識(shí)別技術(shù)也會(huì)是一種促進(jìn)和優(yōu)化?!卑⒗锇桶腿斯ぶ悄軐?shí)驗(yàn)室高級(jí)產(chǎn)品專家張平介紹,做方言是為了讓更多地域人群能更好地交流,同時(shí)也更多保護(hù)地域文化?!拔覀兊谝豢钕茸鏊拇ǚ窖裕褪且?yàn)樗拇ǚ窖栽谥袊?guó)方言中用戶占比大”。

  開(kāi)發(fā)“方言版”語(yǔ)音識(shí)別,還有助于設(shè)計(jì)出更貼合消費(fèi)者需求的智能語(yǔ)音交互產(chǎn)品。美國(guó)“風(fēng)險(xiǎn)投資節(jié)奏(Venturebeat.com)”網(wǎng)站數(shù)據(jù)顯示,中國(guó)已超過(guò)美國(guó)成為全球最大的智能語(yǔ)音市場(chǎng),2019年第一季度智能音箱出貨量占全球總出貨量一半以上。

  國(guó)外智能語(yǔ)音產(chǎn)品廠商也在努力開(kāi)發(fā)能識(shí)別各種英語(yǔ)口音的版本。有趣的是,曾經(jīng)有一位美國(guó)消費(fèi)者投訴亞馬遜公司的智能語(yǔ)音助手“亞歷克薩(Alexa)”,因?yàn)樗荒茏R(shí)別自己母親的口音。

  目前,亞馬遜的“亞歷克薩”、蘋果的Siri和谷歌助手均可以識(shí)別標(biāo)準(zhǔn)美音、“印度味”英語(yǔ)和“中國(guó)味”英語(yǔ)。不過(guò),據(jù)Vocalize.ai實(shí)驗(yàn)室測(cè)評(píng),這三種產(chǎn)品識(shí)別中國(guó)口音英語(yǔ)的準(zhǔn)確率最低。另外,它們都沒(méi)有識(shí)別漢語(yǔ)方言的功能。

  由此可見(jiàn),獨(dú)具中國(guó)特色的“方言版”語(yǔ)音識(shí)別產(chǎn)品還有助于中國(guó)企業(yè)開(kāi)展差異化競(jìng)爭(zhēng)。

+1
【糾錯(cuò)】 責(zé)任編輯: 王萌萌
新聞評(píng)論
加載更多
“中國(guó)天眼”的晝與夜
“中國(guó)天眼”的晝與夜
第14屆莫斯科航展開(kāi)幕
第14屆莫斯科航展開(kāi)幕
秦俑!秦俑!
秦俑!秦俑!
探訪施華洛世奇水晶世界
探訪施華洛世奇水晶世界

?
010020020110000000000000011107271124938501