據(jù)國外媒體報道,谷歌昨日發(fā)布了谷歌網(wǎng)頁和手機版的翻譯。在漢英翻譯過程中,將采用全新的神經(jīng)機器翻譯,該應(yīng)用程序?qū)⒚刻爝M行1800萬次翻譯。谷歌出版了一篇關(guān)于翻譯系統(tǒng)操作原理的學(xué)術(shù)論文。
早些時候,Google表示在Google翻譯中使用了神經(jīng)網(wǎng)絡(luò)技術(shù),但只用于實時的視覺翻譯。不久前,Google高級雇員杰夫·迪恩(Jeff Dean)告訴VentureBeat,Google正試圖將越來越多的深入學(xué)習(xí)能力整合到Google翻譯中。谷歌發(fā)言人在一封電子郵件中告訴VentureBeat,最新的神經(jīng)機器翻譯是他們努力發(fā)展深入學(xué)習(xí)的結(jié)果。
事實上,Google一直在努力將深度神經(jīng)網(wǎng)絡(luò)集成到越來越多的應(yīng)用程序中,包括Google Allo和Gmail的收件箱。這個功能幫助Google更高效和高效地處理他們的數(shù)據(jù)。
Google的神經(jīng)機器翻譯(GNMT)高度依賴于8層短期記憶遞歸神經(jīng)網(wǎng)絡(luò)(LSTM-RNs)。層間殘差關(guān)系可以增強梯度流。谷歌足夠成熟,可以用未發(fā)布的張量處理單元處理數(shù)據(jù)。
雖然神經(jīng)機器翻譯并不總是最好的選擇,但谷歌的各種嘗試表明,在某些情況下,它仍然是例外。
系統(tǒng)評價表明,與以往的基于短語的翻譯系統(tǒng)相比,包括英法翻譯、英西翻譯和英漢翻譯,神經(jīng)學(xué)習(xí)翻譯系統(tǒng)的錯誤率降低了60%。在翻譯質(zhì)量上,翻譯系統(tǒng)將更接近譯者的平均水平。
Google Brain Team的研究與開發(fā)科學(xué)家Quoc Le和Mike Schuster在昨天發(fā)表的一篇博客文章中指出,在雙語評分員的幫助下,在維基百科上翻譯多語句子的錯誤率實際上已經(jīng)降低了55%到85%。
盡管如此,系統(tǒng)還不完善。神經(jīng)機器翻譯仍然會犯一些譯者永遠不會犯的錯誤,如遺漏單詞、把常用名詞或罕見的專有名詞弄錯了,以及缺乏對文本上下文的全面控制。但不可否認的是,神經(jīng)機器翻譯具有里程碑意義。



