Оценете темата:
  • 0 гласа - средно 0
  • 1
  • 2
  • 3
  • 4
  • 5
Декодиране на string в python2
#1
Здравейте Shy

Отново имам трудности в декодирането на текст на кирилица в python2. Вижте какво съм написал и дайте идеи как да конвертирам резултата към utf-8:
Код:
 # -*- coding: utf-8 -*-
import re
import urllib
import urllib2
import json
import time

response = urllib2.urlopen('https://i49.vbox7.com/subtitles/263/98263_2.js')

subs = response.read().split("var sSubsJson = '", 1)[-1].split("';", 1)[0].decode('string_escape')
s = re.compile('{"s":"(.*?)","t"\:(\d+),"f"\:(\d+)}')
items = s.findall(subs)
row = 0
subs = ''
for i in items:
    row = row + 1
    subs += str(row) +'\n'
    subs += time.strftime("%H:%M:%S,000", time.gmtime(int(i[2]))) + ' --> ' + time.strftime("%H:%M:%S,000", time.gmtime(int(i[1]))) + '\n'
    subs += i[0].decode('string_escape').replace('+',' ').replace('
','\n')
    subs += '\n\n'
print subs
[Изображение: notrobosmall.jpg]
Отговори


Съобщения в темата
Декодиране на string в python2 - от Majide - 22-04-2016, 22:46

Отваряне на: