22-04-2016, 22:46
Здравейте
Отново имам трудности в декодирането на текст на кирилица в python2. Вижте какво съм написал и дайте идеи как да конвертирам резултата към utf-8:
Отново имам трудности в декодирането на текст на кирилица в python2. Вижте какво съм написал и дайте идеи как да конвертирам резултата към utf-8:
Код:
# -*- coding: utf-8 -*-
import re
import urllib
import urllib2
import json
import time
response = urllib2.urlopen('https://i49.vbox7.com/subtitles/263/98263_2.js')
subs = response.read().split("var sSubsJson = '", 1)[-1].split("';", 1)[0].decode('string_escape')
s = re.compile('{"s":"(.*?)","t"\:(\d+),"f"\:(\d+)}')
items = s.findall(subs)
row = 0
subs = ''
for i in items:
row = row + 1
subs += str(row) +'\n'
subs += time.strftime("%H:%M:%S,000", time.gmtime(int(i[2]))) + ' --> ' + time.strftime("%H:%M:%S,000", time.gmtime(int(i[1]))) + '\n'
subs += i[0].decode('string_escape').replace('+',' ').replace('
','\n')
subs += '\n\n'
print subs