字幕翻译,如何合并和拆分过分断句

article/2025/8/20 7:33:14

我时常会接到字幕翻译项目,大多是英到中。如果字数比较多,我通常会问客户能不能增加一两个小时的预算,原因很简单:过分断句(over-segmentation)对译员很不友好,特别是在使用CAT  (computer-aided translation)的情况下,而合并句段、译后重新断句(post-segmentation),以及在原始视频中导入翻译好的字幕,进行在线/屏上检查(online/on-screen checking),这一切都需要更多时间,而这一切的成果,客户是喜闻乐见的,那就是客户可以直接拿来用的字幕文件。通常,如果客户不是特别“抠门儿”的话,是同意我的溢价请求的。

现在的CAT工具,大多都支持手工合并句段,比如在memoQ中,在当前句段中按ctrl+j,就可以将下一句段合并到当前句段中;选中多个句段,然后按ctrl+j,也可以一下子将这些选中句段合并;比如:

 粗略读一下,就可以看出,9个句段,其实是3个句子。手工合并后的结果:

显然,这种合并操作需要阅读原文,还要手工移动光标,选择句段,并且进行按键 操作。句段不多的话,还能忍受,但如果多的话,真的让人望而生畏。其实,仔细想想这个问题的根结所在,其实就是CAT软件在导入文件时,默认在段落结尾处分段了。所以,只需将那些分段重新接上就行了。因此,需要做的预处理工作就是将原文合并成一个大段落,原来分段的地方用一个特殊的标记表示,比如制表符(如果是英文,前面需要加个空格)。在Word中的操作步骤如下:

1.在Word打开源文件(这里显示的是memoQ导出的RTF格式):

2. 将只保留原文列,其他列(连同表头)删除:

 3.选中整个列(也就是整个表格),然后选择Layout >  Convert to text::

4. 将所有分段替换为带一个空格的制表符:

5.将文件改名保存为DOCX格式,重新导入memoQ:

 可以看出,原先过分断句地方已经转化为线内标记 (inline tags),而该断句的地方也断句了。

全篇翻译完毕后,确保那些表示断句的线内标记也已插入到译文的适当位置,不多也不少(可以通过CAT工具的标记验证功能进行检查)。之后,原路返回,也就是将这个文件导出为目标文件(那个单列的DOCX文件),在Word中打开,将所有带空格的制表符替换为段落,然后全部选中,转换为单列表格,然后将这个表格所有单元格选中、复制、粘贴到原来那个RTF文件中,保存这个文件,然后导入memoQ进行更新,这样就得到了和原来字幕对应的译文了。

这个流程有个问题,就是默认字幕原文是带标点符号的,即CAT软件会考察这些标点符号进行断句。如果原文不带标点符号,那么这个流程并不适用。

 

 

 

 

 


http://chatgpt.dhexx.cn/article/E8NGsqmR.shtml

相关文章

视频字幕翻译

字幕是指以文字形式显示电视、电影、舞台作品中的对话等非影像内容,也泛指影视作品后期加工的文字。在电影银幕或电视机荧光屏下方出现的解说文字以及种种文字,如影片的片名、演职员表、唱词、对白、说明词以有人物介绍、地名和年代等都称为字幕。 近年来…

英文视频实时字幕翻译

本视频是基于livecaption这个软件(免安装)来实现的。软件下载地址阅读后面可见。 使用阿里云进行语音识别,使用腾讯云进行实时翻译。 一、阿里云 阿里云官网:https://www.aliyun.com/ 没有注册和实名认证的,请注册…

翻译视频字幕的软件叫什么?安利这几个软件给你

如今有很多小伙伴都喜欢追一些韩剧、美剧、泰剧等等外国影片,但是同时也会出现一个问题,那就是有些片段听不懂的问题,很多的影片其实是没有中文字幕的,这时候,很多小伙伴就会直接放弃观看了,其实我们只需要…

怎么把英文字幕翻译成中文?快把这些方法收好

在日常的学习工作中,我们偶尔会接触到一些英文文件,这些文件里面通常都会夹杂着一些比较深奥的词汇。小伙伴们平时遇到这些看不懂的词汇会怎么办呢?是一个词一个词的翻译吗?这样子是可以理解词的意思,可是要带入句子中…

使用Trinity 软件进行拼接(无参转录组)

文章背景(此背景非彼背景) 本文主要是对Trinity软件的背景、安装以及参数做一个详细的介绍。别问为什么没有接着做 02——转录组分析——软件下载;因为发现师兄留下来的数据是需要用无参转录组进行分析的。。。。内心真的毫无波澜。。。。。…

[转]魔兽世界私服Trinity,从源码开始

转自:http://log4think.com/setup_wow_private_server/ 缘起因由 在一个无所事事的周末下午,突然想起魔兽世界,官方的账号很久没有上了,里面的大小号现在连满级都不是。以前曾经搭过传奇和星际争霸战网的私服自娱自乐,…

分析方法升级三代测序辅助,优化无参转录组测序策略

分析方法升级&三代测序辅助,优化无参转录组测序策略 无参转录组拼接升级 Corset 让“基因”概念更准确 在无参转录组项目中,利用主流软件 Trinity 进行 De novo 拼接转录本, 而后选取最长的转录本作为 unigene 进行后续分析。 但是研究表明,完全以…

使用Trinity进行转录组组装

Trinity Trinity是Broad Institute和Hebrew University of Jerusalem开发的RNA-Seq数据 转录组组装工具,包括三个模块, Inchworn(尺蠖): 将RNA-seq数据组装成单个转录本,通常是主要转录亚型的全长转录本Chrysalis(蛹): 这一步将上一步得到co…

TrinityCore魔兽世界服务器-环境搭建(Debian11)

TrinityCore是模拟魔兽世界(World of Warcraft)的开源项目。 我这里学习搭建环境,基于以下: 客户端World of Warcraft 3.3.5(12340或13930版本)服务端TrinityCore3.3.5分支 下面是我自己用的客户端(12340&#xff0…

魔兽世界私服Trinity,从源码开始

缘起因由 在一个无所事事的周末下午,突然想起魔兽世界,官方的账号很久没有上了,里面的大小号现在连满级都不是。以前曾经搭过传奇和星际争霸战网的私服自娱自乐,也听说过魔兽世界有开源的服务端模拟,既然兴致来了就小小…

魔兽世界开服教程wow服务器框架Trinirycore构建

首先明杰先给各位普及一下TrinityCore是什么 TrinityCore 是c实现MMORPG框架 来自MaNGOS,大型网络对象服务,随着时间的推移,该项目代码广泛的优化,改善和清理代码。 需要准备的架设工具: 端(版本&#xff0…

Trinity(3)

转自:http://blog.sina.com.cn/s/blog_83f77c940102v7xu.html 1:分析流程图如下 2: 首先就是将样本的reads合并在一起命令如下: cat 1M_READS_sample/*.left.fq > reads.ALL.left.fq cat 1M_READS_sample/*.right.fq > reads.ALL.right.fq 3:开始…

Trinity使用流程

原文地址:http://www.plob.org/2014/12/22/8826.html 1:分析流程图如下 2: 首先就是将样本的reads合并在一起命令如下: 1 cat 1M_READS_sample/*.left.fq > reads.ALL.left.fq 2 cat 1M_READS_sample/*.right.fq > reads.ALL.right.fq 3:开始拼接 …

安装trinity、解决报错

生信软件安装 Trinity安装 文章目录 生信软件安装一、安装trinity报错二、解决报错 一、安装trinity报错 解压代码: tar -zxvf trinityrnaseq-v2.14.0.FULL_with_extendedTestData.tar.gz进入软件文件夹 cd trinityrnaseq-v2.14.0/然后输入make进行安装&#xf…

【Free RTOS简介】

free rtos学习笔记之整体简介 简介 free rtos实际上是分为两个部分,即free和rtos,其中free是免费的意思,rtos(Real Time Operating System)则是实时操作系统的意思,连在一起是,这个实时操作系…

缺陷检测~Anomalib

这里说说如何应用Anomalib在数据集不平衡的情况下检测缺陷 Paula Ramos,英特尔 AI 软件布道师,美国 武卓,英特尔 AI 软件布道师,中国 Samet Akcay,英特尔人工智能研究工程师/科学家 在《如何应用Anomalib在数据集不平…

MS-RTOS正式发布啦!!!

仓库地址 GitHub:https://github.com/ms-rtos?fromtimeline GiTee:https://gitee.com/ms-rtos 一、MS-RTOS 简介 MS-RTOS(Micro Safe RTOS) 是翼辉信息全新设计的一款面向未来的安全实时操作系统,其最大的特点是开创…

15. RDMA之RoCE Soft-RoCE

转自:https://zhuanlan.zhihu.com/p/361740115 阅读本文前建议温习“RDMA概述”一文,了解下RDMA领域的基本概念。 我已经在基本概念篇里面跟大家对本领域的基本知识进行了科普,在对于基本的宏观概念有了认识之后,我们就可以开始更…

用firadisk+grub4dos实现的RAMOS的方法

论坛里有很多Ramos的教程,不过大多数大是MS自己的Ramdisk驱动用Ntldr引导方式实现的,最近新兴一个驱动叫firadisk,这个是Grub4DOSMap --mem虚拟出来的硬盘在WIN下的驱动,通过这种方式也能做出Ramos,而且限制很少&#…

基于 PyTorch 的目标检测和跟踪(无敌版)

一个不知名大学生,江湖人称菜狗 original author: jacky Li Email : 3435673055qq.com Time of completion:2023.2.1 Last edited: 2023.2.1 目录 图像中的目标检测 视频中的目标跟踪 作者有言 在文章《基于 PyTorch 的图像分类器》中,介绍…