
德國(guó)人工智能研究中心(DFKI)正在支持人類語(yǔ)言項(xiàng)目,這是一項(xiàng)長(zhǎng)期和大規(guī)模的歐洲研究,開(kāi)發(fā)和創(chuàng)新項(xiàng)目,其雄心勃勃的科學(xué)目標(biāo)是到2030年深度自然語(yǔ)言理解。
預(yù)計(jì)自然語(yǔ)言處理(NLP)的進(jìn)展將能夠解決歐洲多語(yǔ)言設(shè)置的諸多挑戰(zhàn)。因此,該項(xiàng)目旨在成為歐盟旗艦項(xiàng)目,這是一項(xiàng)科學(xué)驅(qū)動(dòng)的研究計(jì)劃,運(yùn)行時(shí)間約為10年,總預(yù)算約為10億歐元。
根據(jù)歐盟網(wǎng)站,未來(lái)與新興(FET)旗艦項(xiàng)目匯集了大量研究機(jī)構(gòu),不能由一個(gè)委員會(huì)或單一成員國(guó)承擔(dān)。
DFKI高級(jí)研究員Georg Rehm博士鼓勵(lì)歐盟各組織為宣傳提供支持信。
“發(fā)起這種類型和范圍的人類語(yǔ)言項(xiàng)目 – 大規(guī)模和長(zhǎng)期 – 的想法是幾年前在歐洲議會(huì)歐洲多語(yǔ)種和語(yǔ)言平等研討會(huì)上誕生的,”Rehm告訴Slator。
“那時(shí)我們剛剛發(fā)布了META-NET白皮書系列的主要發(fā)現(xiàn),即21種歐洲語(yǔ)言面臨數(shù)字滅絕的危險(xiǎn)。這意味著超過(guò)20種歐洲語(yǔ)言,大多數(shù)揚(yáng)聲器數(shù)量較少的語(yǔ)言,無(wú)法在線完全使用。并非所有服務(wù)都以這些語(yǔ)言提供,并且并非所有服務(wù)都能夠在內(nèi)部處理這些語(yǔ)言的內(nèi)容,“他解釋說(shuō)。
不幸的結(jié)局將是我們所謂的“數(shù)字語(yǔ)言滅絕”
這意味著支持的語(yǔ)言遠(yuǎn)遠(yuǎn)少于使用更多發(fā)言者的語(yǔ)言,例如馬耳他語(yǔ),立陶宛語(yǔ)或冰島語(yǔ),它們將在線使用更大的語(yǔ)言,英語(yǔ)就是最好的例子。
“不幸的結(jié)局將是我們所謂的’數(shù)字語(yǔ)言滅絕’,”他進(jìn)一步解釋道。
未來(lái)證明我們所有的語(yǔ)言
Rehm澄清說(shuō),不僅DFKI正在推動(dòng)人類語(yǔ)??言項(xiàng)目,而且還有許多不同的利益相關(guān)者 – 從研究中心到大學(xué),再到受影響語(yǔ)言社區(qū)的成員,翻譯公司以及越來(lái)越大的公司。
“所有這些利益相關(guān)者不僅有興趣實(shí)現(xiàn)我們的關(guān)鍵科學(xué)目標(biāo),到2030年深度自然語(yǔ)言理解,尤其是提供平衡的技術(shù)基礎(chǔ),以便我們能夠在未來(lái)證明我們所有的語(yǔ)言,并確保我們可以在網(wǎng)上使用它們很多年,“他說(shuō)。
到目前為止,他表示最近發(fā)布的關(guān)于歐盟項(xiàng)目DFKI的支持信的呼吁得到了前所未有的熱情。
“真的很棒。這些信件一直在涌入!“他說(shuō)。
一個(gè)項(xiàng)目成為歐盟FET旗艦項(xiàng)目需要什么?雷姆說(shuō),需要政治意愿來(lái)推動(dòng)這樣一個(gè)大型項(xiàng)目。布魯塞爾的政治家和行政人員需要確信,這種規(guī)模的投資對(duì)歐洲社會(huì),歐洲工業(yè)和歐洲研究都有意義。
“根據(jù)我們于2018年2月20日提交的提案,我們正試圖進(jìn)行預(yù)備項(xiàng)目。該準(zhǔn)備項(xiàng)目的目標(biāo)是與整個(gè)社區(qū)共同開(kāi)發(fā)歐盟旗艦項(xiàng)目的關(guān)鍵組成部分:研究路線圖,治理結(jié)構(gòu),統(tǒng)一愿景,整體設(shè)置,“他說(shuō)。
真的很棒。這些信件一直在涌入!
毫無(wú)疑問(wèn),這是一個(gè)長(zhǎng)期的過(guò)程。 Rehm表示,DFKI的職責(zé)是協(xié)調(diào)這個(gè)準(zhǔn)備項(xiàng)目,并確保該聯(lián)盟提供一個(gè)成熟的,經(jīng)過(guò)深思熟慮的,可持續(xù)的歐盟旗艦概念,讓整個(gè)社區(qū)贊同并支持。
雄心勃勃的科學(xué)目標(biāo)
Rehm解釋說(shuō),通過(guò)NLP,研究人員可以識(shí)別命名實(shí)體,匯總文檔,并將用一種語(yǔ)言編寫的文本翻譯成另一種語(yǔ)言。但是,在一天結(jié)束時(shí),它仍然只是簡(jiǎn)單的處理。
“典型的NLP管道或系統(tǒng)缺乏的是對(duì)語(yǔ)言的真實(shí),深刻的理解。這不是一個(gè)新概念,自然語(yǔ)言理解的概念已經(jīng)存在了幾十年。我們相信,我們的領(lǐng)域現(xiàn)在能夠成功地解決下一步,從簡(jiǎn)單的處理到對(duì)人類語(yǔ)言的實(shí)際理解,“他說(shuō)。
“如果我們能夠?qū)崿F(xiàn)這一突破,那么由此產(chǎn)生的語(yǔ)言技術(shù)將在大幅提高準(zhǔn)確性,覆蓋范圍,穩(wěn)健性和質(zhì)量方面改變游戲規(guī)則。這就是我們想要帶來(lái)的,“他強(qiáng)調(diào)說(shuō)。