日語翻譯Facebook翻譯謬誤導(dǎo)致一名建筑工人被抓,機(jī)器翻
六、對結(jié)果的剖析
BLEU為機(jī)器翻譯結(jié)果與人工翻譯結(jié)果對比值(縱坐標(biāo)應(yīng)為%,作者遺記標(biāo)注,下同)。可能看到隨著文本中退出噪聲的比例添加,機(jī)器翻譯的結(jié)果快速降落。
三、數(shù)據(jù)
2、黑箱對抗訓(xùn)練
4)只要用Nat數(shù)據(jù)集來訓(xùn)練,能力提高Nat數(shù)據(jù)集測試的魯棒性。這個結(jié)果表明了計(jì)算模型和人類的體現(xiàn)之間的一個重要區(qū)別——在學(xué)習(xí)言語時,人類并沒有明白地裸露在噪聲樣本中。
如作者所說:“咱們的目標(biāo)有二:
發(fā)現(xiàn):
作者首先測試了用潔凈(Vanilla)文本訓(xùn)練出的模型能否可以經(jīng)受住噪聲的考驗(yàn)。
作者抉擇了三種不同的神經(jīng)機(jī)器翻譯(NMT)模型以做對比,分別為:
七、總結(jié)
讓咱們用Rand+key+Nat的charCNN模型來翻譯一下前面那個凌亂的德語翻譯吧:
以色列警方此刻正監(jiān)管網(wǎng)絡(luò)來找一群稱為“l(fā)one-wolf”的恐懼分子,所以立馬就留意到了這條形狀。
五、兩種方法改進(jìn)模型2、meanChar模型
從上面的結(jié)果可能看出,多種噪聲同時訓(xùn)練charCNN的模型的魯棒性更好。But why?
輸入文本是亂七八糟的德語文本,但人類翻譯仍然可以根據(jù)文本猜測到意思,而目前幾個優(yōu)良的機(jī)器翻譯模型則體現(xiàn)很差。
四、潔凈文本訓(xùn)練翻譯模型
一、噪聲對機(jī)器翻譯影響有多大?