hinagikumoe 发表于 2014-10-26 09:13

python怎么用

本帖最后由 hinagikumoe 于 2014-10-26 10:36 编辑

正则表达式是个好东西

顺便鲍尔默必须死(唉?

hinagikumoe 发表于 2014-10-26 09:16

当然如果有现成的转换工具最好,能用webvtt格式的字幕的播放器也可以

robbielj 发表于 2014-10-26 09:28

搜了一下
http://git.xiph.org/?p=users/giles/digital-media-02.git;a=blob;f=tosrt.py;h=d1414255d90bb49795c077a7c80a9f1e0afd93ff;hb=46358e1d121d5d5e39eb5b71461a9264d7d0d5d4
https://github.com/xubuntu4iran/vtt2srt

hinagikumoe 发表于 2014-10-26 09:36

robbielj 发表于 2014-10-26 09:28
搜了一下
http://git.xiph.org/?p=users/giles/digital-media-02.git;a=blob;f=tosrt.py;h=d1414255d90bb4 ...

好像不行啊,他们那些都是vtt文件按行读取,问题我下的字幕换行全是错的,貌似用不了

而且第二个该怎么用,是什么语言的?

robbielj 发表于 2014-10-26 10:04

hinagikumoe 发表于 2014-10-26 09:36
好像不行啊,他们那些都是vtt文件按行读取,问题我下的字幕换行全是错的,貌似用不了

而且第二个该怎么 ...

bash

那就不知道了。

BlackFinger 发表于 2014-10-26 10:06

目标格式是什么样?

foolegg 发表于 2014-10-26 10:07

本帖最后由 foolegg 于 2014-10-26 11:18 编辑

hinagikumoe 发表于 2014-10-26 09:36
好像不行啊,他们那些都是vtt文件按行读取,问题我下的字幕换行全是错的,貌似用不了

而且第二个该怎么 ...
我觉得你写个脚本,把字幕的换行错误修正下就好了。

思路大概是:

1 把原文件里的换行全部去掉
2 用正则匹配找到时间戳,格式是"xx:xx:xx.xxx ---> xx:xx:xx.xxx"
3 在每个时间戳前面加个换行,直接用正则替换就行
4 去掉文件开头第一个空行

这样就能得到一个正确的vtt文件,再用现成的工具转换就好了。

hinagikumoe 发表于 2014-10-26 10:12

foolegg 发表于 2014-10-26 10:07
我觉得你写个脚本,把字幕的换行错误修正下就好了。

思路大概是:

嗯,也好
不过这点工作量直接在emeditor里弄行了,修正一下看看pot认不认
页: [1]
查看完整版本: python怎么用