12-10-2017, 18:09
ID-тата на видеата и заглавията можеш да "хванеш" наведнъж с регулярен израз v=(.+?)>(.+?)</a> . Обърни внимание - там където се намира това което искаш, трябва да го оградиш с кръгли скоби т.е. capture group и съответно съдържанието в тези скоби да отговаря на реалното. Ако за всяко заглавие има отделна вътрешна страница можеш от нея да извлечеш обложката, описанието и опционалните атрибути след избиране на конкретното заглавие през Коди. Ако искаш да се виждат обложките и описанието при разлистване заглавията в общия списък (с който боравиш в момента) трябва на втори транш да пуснеш още един (втори) re.compile(regex).findall(data) след първия с който да хванеш обложките и/или описанието.
Код:
br = 0 #Брояч на видеата в страницата - 24 за този сайт
match1 = re.compile('v=(.+?)>(.+?)</a>').findall(data)
for url,title in match1:
addLink(title,url)