Благодаря, би ли пояснил
и по точно защо е това и как работи , точно тази част от кода < .+?"
Това е окончателният код , хваща програмата на БНТ 1,2,3,4 само с промяна на цифрата в url
Код:
('"hour">(.+?)<.+?"name">(.+?)<.+?"type">(.+?)<')
и по точно защо е това и как работи , точно тази част от кода < .+?"
Това е окончателният код , хваща програмата на БНТ 1,2,3,4 само с промяна на цифрата в url
Код:
#!/usr/bin/python env
import bs4
import re
import sys
from datetime import date
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
my_url='https://bnt.bg/program/bnt1'
today = date.today()
d = today.strftime("%Y%m%d")
s = 'in-tabs-descr tab tab-holder-'
uClient = uReq(my_url)
page_soup = soup(uClient.read(), "html.parser")
uClient.close()
containers = page_soup.find("div" ,{"class":s+d})
con = containers.findAll('span')
data = str(con).replace('><' , '> <')
match = re.compile('"hour">(.+?)<.+?"name">(.+?)<.+?"type">(.+?)<').findall(data)
#print (match)
for hour, name, type in match:
desc = hour.strip() + ' ' + name.strip() + ' - ' + type.strip()
print (desc)