如何从电影中导出字幕内容
idx+sub图形字幕转成srt文本字幕的几种方法
1、了解字幕格式
一般而言,DVDrip电影自带的字幕文件是*.sub格式,并配合*.idx索引文件一起使用的。由于*.sub是基于图片形式来存放字幕数据的,所以自身的容量比较大,并且无法编辑,这给我们的字幕翻译和修改工作带来了不便。相反,*.srt字幕文件是基于文本格式的,所占空间小、可直接用记事本打开编辑,普遍用于字幕的翻译和修改。因此,我们在翻译英文字幕或修改中文字幕之前,要将*.sub格式转换成*.srt格式,更重要的是后面要用到的Subtitle Workshop不支持*.sub格式(当然如果字幕已是*.srt格式的,那么就可跳过下一步)
2、转换字幕格式
转换字幕格式的方法有许多,这里只介绍比较常用的三种方法:1)用SubResync转换*.sub格式的英文字幕;2)用subRip转*.sub格式的英文字幕3)用“SubToSrt 3.11”转换*.sub格式的中文字幕;
1)、用SubResync转换*.sub格式的英文字幕
机器上安装好Vobsub软件,点选*.sub或*.idx文件,从鼠标右键菜单中选择“Edit With SubResync”,打开文件。先在下拉菜单中选择语言为English,然后选择Save As,保存类型选Subripper(*.srt),最后填好文件名保存。要注意的是,在OCR Settings中有一个调整识别敏感度的滑块,将敏感度调到最高可以提升软件的识别能力(如图1)
此时,软件会进行字幕识别的学习。其界面下方会依次一行一行地出现我们前面打开的字幕,请照着提示一一输入(字母要分大小写),软件会对它们进行识别学习并记录下来(如图2)。当你把26个大小写字母以及标点、数字输入一遍之后,字幕的学习也就结束了。而这时你会惊奇地发现,字幕文件的格式转换工作也结束了(以上所有工作只需5分钟左右,相比“SubToSrt 3.11”要方便,但中文就不太适用了)。完成之后,你就得到了一个可自由编辑的,大小仅有几十KB的*.srt字幕文件。这种*.srt字幕不仅可以像*.sub一样直接用于电影播放,而且还可以用记事本或翻译工具(Subtitle Workshop等)打开编辑。
2)用“subRip”转换*.sub格式的英文字幕
机器上安装并打开subRip软件,点击菜单“文件”→“打开Vob文件”弹出详细的选择对话框。在左侧选择字母流的语种(目前SubRip的OCR功能限于西文字母类语言使用,中文的OCR可用另一个叫做SubOCR的软件,支持简繁体),在”字符点阵文件”处加载字库(即”ChMatrix’目录下的*.sum文件)。设置完成后点击“开始”,SubRip就会开始搜索指定文件中的字幕流。
每种字母第一次出现时会要求你输入同样的字母验证(即字幕库中未有的字符),之后再出现同样字母就会被自动识别。全文识别结束后,SubRip还提供“PostOCRCorrection”功能对识别文件进行自动校正。最后点击“文件”→“另存为”将字幕保存为SubRip格式或.srt格式的字幕文件。SRT字幕转好后,当软件提醒你【是否保存字符点阵文件】(即字库),可以选择否。如果选择了是,那么识别错误的字符将被保存。因此有时就需要修正字符点阵文件了:
打开subrip-字符点阵-编辑/查看字符点阵-打开一个字符点阵文件-选择你的字符点阵文件-确定-查错误字符-修改/删除-确定-保存字符点阵文件。
3)用“SubToSrt 3.11”转换*.sub格式的中文字幕
前面讲到的两个文件都不太适合转换中文字幕,要转换中文字幕最好是用“SubToSrt 3.11”,
因为它拥有强大的字库,你可以自己导出导入字库也可下载最新字库,当你更新了字库后你会发现转换字幕的时间只需要1-5分钟!下面就看看“SubToSrt 3.11”的具体使用步骤吧!
(1) 用SubRip将*.sub文件转换为bmp图片
1. 首先安装SubRip 1.17.1,选择安装所有
3. 打开SubRip->文件->打开Vob文件
4. 打开文件目录->选定sub->语言数据流选Chinese->右面操作里选字幕图片保存为4bit的BMP文件,以及在加时间和尺寸上打勾->开始
5. 输入任意文件名->保存
6. 预设里选I-Author->选取Custom Colors and Contrast->把颜#1-4全部选择成白(#1-4分别代表字芯、字框、背景、消除走样,每个字幕的#1-4所代表的都不一样)->一一测试哪一个为字芯,设为黑,其他3项全部为白,重要!(参看附图)->点选确定:
7. SubRip自动将每一幅图片保存为BMP,并且加上相应时间顺序
乱码文字生成
输出格式->设置输出格式->Text Formats下的SubRip(*.srt)->转换成此格式
文件->另存为->保存
8. 关闭SubRip
(2) 使用“SubToSrt 3.11”将图片转化为*.srt文件
1. “SubToSrt 3.11”为完全绿软件,直接解压开即可使用。
2. 运行->文件->打开SRT或SSA文件->选取刚才保存的srt文件(此文件要与bmp图片存放在同一目录下)
3. 图片处理->自动裁剪->确定(推荐使用此步骤,可以使识别更快)
4. 依照字幕调节空格检测设置、空格宽度设置、行高检测设置的灵敏度
5. 识别->开始识别。当遇到不认识的字时,会自动跳出小窗口要求丰富字库,输入该字,按回车即可;当遇到半个字的时候,按扩展(Alt+E),即可显示全字;如果前面一个字打错,可以在小框中修改该字,程序会自动从该字所在行开始识别
6. 识别完毕后,会自动替换已知错误词组。
7. 这时,可以随便看一下字幕,如有需要,可以略做修改(如:原sub字幕中就是错误的)
8. 文件->保存为SRT或SSA格式->这里保存为srt
注意:要使字幕的转换速度快,就要经常更新字库,从网上下载最新的字库(即word.tst和word.wrd两个文件),用这两个文件替换原文件,打开"subtosrt",单击字库-〉生成索引文件
3、字幕的翻译(使用Subtitle Workshop软件)
Subtitle Workshop是由URUSOFT()公司推出的一款字幕软件, 集字幕制作、修改调整、合并/分割、格式转换、内容检查等功能于一身,几乎支持所有常见的字幕格式(我用的版本不支持*.sub格式,不知最新版本是否支持),支持自定义字幕格式,界面友好。
下面是Subtitle Workshop的界面
SW默认状态下安装完后是英文界面,但是它提供了丰富的语言包,
可以调整为中文界面:SETTINGS>> LANGUAGE>> CHINESE SIMPLIFIED
1)、介绍一下左面板:
A。这里可以设定字幕是按时间显示还是按帧率(FPS)显示。
B.看到字幕显示区有部分乱码了吗?可以从在字符编码集中把ANSI改为GB2312就可以显示中文了
C.左面板可以按F4显示或隐藏
2).字幕制作:
字幕文件格式多样,但是其组成不离主要两部分: 时间轴和字幕内容, 时间轴由开始时间和结束时间组成。 新字幕文件的制作就是不断的插入字幕的结果。
3) 插入字幕:
“编辑>>插入字幕”,快捷键为INSERT键 ,本命令会在当前选中的字幕后面插入一句新的字幕, 默认状态下字幕开始时间为前一句字幕结束时间加1微妙,
时间跨度为1秒,字幕内容为空 ;如果想在当前字幕前插入新的字幕,比如在第一句前加入, 就要SHIFT+INS
4) 删除字幕:
移除字幕”,快捷键为DEL键[$#61664]“编辑,本命令会跳出对话框,询问是否真的要删除。 如果没有对话框弹出,选择“设置>>设置>>基本设置”,选中“删除字幕须确认”。
5) 时间微调:
有时插入的新字幕的默认时间可能与我们想要的不一样,就需要进行字幕的微调
A.可以在“时间控件”中直接输入字幕的起止时间或者跨度(需要按回车后更改才生效)
B.可以上下翻动输入框右边的调整按钮(按键盘上的上下箭头亦可)
C.ALT+C设定字幕起始时间为影片当前时间,ALT+V设定字幕结束时间为影片当前时间