本文第一作者是徐婷,是香港中文大学博士生,主要研究兴趣是大模型的后训练;通讯作者分别是黄志超和程善伯,来自字节跳动Seed团队。 现在,这些问题迎来了新的解决方案。来自香港中文大学、字节跳动 Seed 和斯坦福大学的研究团队联手提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT) 该方法将同传任务巧妙地建模为序贯决策过程,通过优化完整的决策序列,显著提升了翻译质量,同时有效控制了延迟,其性能直逼、甚至在某些方面超越了同等大小的离线翻译模型。 同声传译的核心在于机器需要动态地决定 “继续听”(READ)还是 “开始说”(WRITE)。这个决策直接影响最终的翻译效果。例如,当模型接收到英文单词 “bark” 时,它面临一个困境:如果立即翻译,可能会译为 “狗叫”,但若后文出现 “of the tree”,则正确翻译应为 “树皮”。 传统的同传方法,它每一步决策(是继续听,还是开始翻译)都是孤立的。它可能会因为眼前的 “小利”(比如翻译出一个词)而牺牲掉全局的 “大利”(整个句子的流畅度和准确性)。 针对这一难点,该论文提出了 SeqPO-SiMT 框架。其核心思想是将同声传译任务建模为一个序贯决策问题,综合评估整个翻译流程的翻译质量和延迟,并对整个决策序贯进行端到端的优化。 该方法的主要特点是:它不再孤立地评估每一步决策的好坏,而是将一整句话的翻译过程(即一个完整的决策序贯)视为一个整体,更符合人类对同传的评估过程。 为了验证方法的有效性,研究者们在多个公开的英汉互译测试集上进行了实验,并与多种现有的同传模型进行了对比。实验结果显示:在低延迟水平下,SeqPO-SiMT 框架生成的译文质量相较于基线模型有明显提升。 本文将 SeqPO-SiMT 的实时同传结果与多个高性能模型的离线翻译结果进行对比。结果显示,SeqPO-SiMT 的翻译质量不仅优于监督微调(SFT)的离线模型及 LLaMA-3-8B,其表现甚至能媲美乃至超越 Qwen-2.5-7B 的离线翻译水平。这表明该方法在 70 亿参数(7B)规模上实现了业界顶尖(SoTA)的性能。 总的来说,SeqPO-SiMT 这项工作的主要贡献在于,为解决同声传译中的质量 - 延迟权衡问题提供了一个新的视角。它强调了对决策 “序贯” 进行整体优化的重要性。该研究提出的方法,对于需要进行实时、连续决策的自然语言处理任务具有一定的参考意义,并为未来开发更高效、更智能的同声传译系统提供了有价值的探索。
成色18k.8.35mb菠萝这不,近来学校里就发生了一件让老师和年级校长气到半死,政教主任都不敢轻易接手的事情,这背后的种种缘由,着实值得我们细细品味一番。北京时间6月14日凌晨,WTA500伦敦站1/4决赛,中国网球一姐、赛会头号种子郑钦文迎战前美网冠军、英国本土选手拉杜卡努。经过2盘比赛的争夺,郑钦文最终2-0获胜,昂首晋级4强。成色18k.8.35mb菠萝zjzjzjzjzjy.gov.cn2024年4月,相关信息得到证实后,李女士随即向当地纪检监察部门反映此事。李女士称,直到同年12月,她才接到纪委监委的反馈电话,对方告诉她,已经对韩某某作出政务记大过处分。不过,李女士认为,对比韩某某的行为给她带来的伤害,这一处罚较轻。这是6月24日到26日在天津举办的夏季达沃斯论坛会场上的一幕,也是全球智能科技蓬勃发展的缩影。在当下数字洪流奔涌的时代,人工智能正以超乎想象的速度发展。它早已从实验室中走出,赋能千行百业,成为驱动全球增长的重要动力源。
20251207 🔞 成色18k.8.35mb菠萝晓音:大模型的变化有点类似于人的智商水平。大模型更聪明并不代表它在具体技能上更懂行,这是因为掌握一项技能除了需要聪明才智,可能还需要一些行业的技术诀窍(know-how),或者是对具体应用场景的理解,这些往往依赖经验积累而非单纯的智商驱动。所以对我们来讲,这两者都非常重要。www.17cao.gov.cn6月11日,央视《法治在线》节目播出了大连警方破获一起31年前的积案,在逃嫌犯改头换面把自己包装成网络达人,民警经过不懈追踪最终揭开了他的真实身份。
📸 杨伟记者 韩广生 摄
20251207 😈 成色18k.8.35mb菠萝北京时间6月27日凌晨,开拓者官方晒出杨瀚森20岁生日的海报,开拓者官方祝贺杨瀚森20岁生日快乐,小杨这个生日过得可欢乐了,成为中国篮坛历史第三位首轮秀,还拿到了四年2139万美元的合同,人民币约1.53亿啊!www.17cao.gov.cn18日上午的成都市直属直管学校专场和下午的高新区专场,共有13所高中来到直播间介绍学校今年的招生情况和办学特色。
📸 张训良记者 卜保忠 摄
✅ 记者从江西省文物考古研究院获悉,一项最新考古研究成果显示,海昏侯墓出土的针状金属物被确认为最早的采用炒钢技术制作的医用毫针,是西汉时期医疗器具在材料和形制上嬗变的直接证据,对研究中国针灸发展史具有重要意义。51cao.gov.cn






