基于短语汉维机器翻译解码的研究及实现

作者:杨世勤; 王磊; 杨雅婷; 米成刚

摘要:针对汉、维翻译中维语形态变化复杂、汉维语句法结构不同等造成的解码局限性问题,将解码中语言模型的评分调整为重点考虑短语衔接处的单词串的得分,引入词向量进行短语相似度计算,利用词向量将单词间隐含的语义关系加入到解码评分;调整解码的调序距离限制方法,设计一个限制解码中短语扩展的方法,使解码的调序更符合汉维翻译的实际;在此基础上,按优化的方案实现解码器。实验结果表明,优化能使译文BLEU值在基线方案基础上提升3.46,最终方案解码器的译文BLEU值为29.18。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 电子信息科学综合
收录:
  • 国家图书馆馆藏
  • 维普收录(中)
  • 上海图书馆馆藏
  • 北大期刊(中国人文社会科学期刊)
  • 知网收录(中)
  • 万方收录(中)
  • 统计源期刊(中国科技论文优秀期刊)
  • JST 日本科学技术振兴机构数据库(日)
  • 哥白尼索引(波兰)
  • SA 科学文摘(英)
  • Pж(AJ) 文摘杂志(俄)
关键词:
  • 汉维统计机器翻译
  • 解码
  • 特征模型
  • 语言模型
  • 调序限制
  • 柱搜索

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机工程与设计

期刊级别:北大期刊

期刊人气:3692

杂志介绍:
主管单位:中国航天科工集团
主办单位:中国航天科工集团第二研究院706所
出版地方:北京
快捷分类:计算机
国际刊号:1000-7024
国内刊号:11-1775/TP
邮发代号:82-425
创刊时间:1980
发行周期:月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:0.62
综合影响因子:1.32