百合动漫

百合动漫动态

当前位置: 百合动漫 - 学术研究 - 百合动漫动态 - 正文


米成刚、谢韶亮:Bilingual and monolingual features enhanced morphological segmentation for spoken language neural machine translation

2025年04月17日 点击:[]

近日,研究院米成刚博士、谢韶亮博士,新闻与传播学院刘琪在国际学术期刊Multimedia Tools and Applications上合作发表题为Bilingual and monolingual features enhanced morphological segmentation for spoken language neural machine translation的论文。

本论文针对口语神经机器翻译 (neural machine translation, NMT) 中双语数据稀缺导致的性能瓶颈,提出了一种新颖的形态学切分方法。该方法通过结合单语特征(包括词法切分、BPE、语言模型特征)和双语特征(如双语词对齐),利用对数线性模型来预测最终的形态学切分结果。实验结果表明,该模型生成的词素能显著提高口语NMT的性能,在维吾尔语-汉语、土耳其语-英语和哈萨克语-英语等低资源语对上实现了最高1.9 BLEU的提升。

本文提出了一种整合单语与双语特征的形态学切分方法,有效缓解低资源口语神经机器翻译的数据稀疏瓶颈,为机器翻译和跨语言自然语言处理在资源受限场景下的性能提升提供了新的解决方案。

论文链接://link.springer.com/article/10.1007/s11042-025-20836-9



上一条:第八届中国翻译史研究专家研讨会在我校顺利召开

下一条:百合动漫 召开新学期全体教职工大会

关闭