霸榜WMT机器翻译大赛最难赛道阿里国际AI翻译模型Marco
WMT被誉为机器翻译领域的●▲▲…★◁“黄金标准◆▽•”◇●■◇…,其评测结果被全球学术界与工业界视为技术风向标▼▲▲●=霸榜WMT机器翻译大赛最难赛道。本届赛事采用COMET◁▲▽、LLM Judge等自动指标与大规模人工评测相结合的机制-□▼☆◁,最终排名以人工评分为准◁▪。Marco-MT在包括英译中在内的13个核心语向表现优异◁●▽=,跻身全球顶尖水平…△○●▪◇,标志着其通用翻译能力获得广泛认可★▽▲□◁…。其中▽▼,在英译中等多个语向上▪▲◆☆=,表现超过人工翻译▼◆…◇。
其中◆◆▽=•,在最受关注的英中语向上•▲▲▪=▽,Marco-MT超越了Gemini 2■=.5 Pro=-阿里国际AI翻译模型Marco、GPT-4▪▷▽•.1▪=▪▼、Claude 4和Mistral-Medium等所有顶尖闭源AI系统△■●,登顶榜首▪▪★=。WMT的人工评测被视为机器翻译领域的◇▲“黄金标准▷▼▲”○◁•,这也标志着Marco-MT从电商行业翻译迈向通用翻译的领先行列◆▪。
据「TMT星球」了解◆…•●☆,Marco-MT发布于2024年☆★△▷…□,最初专注于电商场景翻译◁◁☆•▽=,已接入阿里国际旗下的电商平台=○,支持搜索▽△=△、商品信息▲□…、对话●▽▪、图片等多种场景的翻译•=○▷•★。跨文化◆•、多语种的业务需求•▲▪=,使其具备高质量■◁△□…、低幻觉率等核心优势☆△☆-▷,为此次向通用翻译的拓展打下坚实基础◁▲•▽○•。此前……=▪★▷,Marco-MT已在语音翻译领域崭露头角•▼●,在2025年IWSLT国际赛事中斩获2项冠军和2项亚军•▽•□▼,表现出机器翻译领域多模态的竞争力▪▪▪□■▽。
且模型规模不超过20B的限制条件■△。还需严格遵守仅使用开源数据和开源模型…◁☆●,受限赛道不仅要求模型能够处理文学-◁、新闻■◇●▽▽●、社交媒体等多样化内容★★■☆•○,阿里国际的Marco-MT模型参加的是WMT竞赛中难度更高的受限赛道▽■◆。相比于非受限赛道●•○▲◁★?
Marco-MT此次脱颖而出☆▼○-,关键在于将丰富的电商翻译模型训练经验与一套原创训练方法M2PO(多阶段偏好优化)相结合•▼▼=▲,成功将强化学习范式应用于大模型翻译领域▪■==。该系统分三步提升翻译质量□▽:先通过两轮监督微调拓宽知识基础●▪■△;再引入强化学习▷•…,让模型学会判断译文优劣○□;最后在解码阶段融合词对齐与重排序技术◇•▷◆△•,在保证流畅的同时精准还原原文▷▪◆◁◁少化石能源消耗提高电,显著提升翻译的准确性和忠实度-☆◆7kW充电柱:1小时,。






