Парсинг расписания готов

This commit is contained in:
lulzette 2023-05-13 15:43:57 +03:00
parent 7711f0c589
commit bffe213041

36
main.py
View File

@ -1643,6 +1643,7 @@ if __name__ == '__main__':
cur_day = "" cur_day = ""
cur_lesson = "" cur_lesson = ""
day_iterator = 0 day_iterator = 0
groups = list()
for cur_sibl in rasp_html_inside.find_next_siblings(): for cur_sibl in rasp_html_inside.find_next_siblings():
tag_type = cur_sibl.name tag_type = cur_sibl.name
# print(tag_type, cur_sibl.text) # print(tag_type, cur_sibl.text)
@ -1667,31 +1668,38 @@ if __name__ == '__main__':
case 'div': case 'div':
# Что за пара, препод, место, аудитория # Что за пара, препод, место, аудитория
up_or_down = "" # Верхняя или нижняя?
get_b = cur_sibl.find('b') up_or_down = 'none'
# Верхняя/Нижняя пара if cur_sibl.find('b', {'class':'up'}):
if get_b is None:
# Пара бывает всегда
pass
else:
if get_b.get('class') == 'up':
up_or_down = 'up' up_or_down = 'up'
else: if cur_sibl.find('b', {'class':'dn'}):
up_or_down = 'down' up_or_down = 'down'
# Что за пара
# Тип пары (лекция) # Тип пары (лекция)
lesson_type = cur_sibl.find('b', {'class': ''})
# Что за пара
lesson_name = lesson_type.next_sibling
# Препод # Препод
preps = list()
preps_block = cur_sibl.find('span', {'class': 'preps'})
for prep in preps_block.findAll('a'):
preps.append(prep.text)
# Группы
groups = list()
group_block = cur_sibl.find('span', {'class': 'groups'})
for group in group_block.findAll('a'):
groups.append(group.text)
# место, аудитория # место, аудитория
place = cur_sibl.find('em')
# Итого, пишем в rasp_summary # Итого, пишем в rasp_summary
print('sdfsdf ', day_iterator, cur_day, cur_lesson, up_or_down, cur_sibl.text) print('sdfsdf ', day_iterator, cur_day, cur_lesson, up_or_down, lesson_type.text, place.text, groups, preps)
# rasp_summary[cur_day][cur_lesson] = cur_sibl # rasp_summary[cur_day][cur_lesson] = cur_sibl
# print(cur_sibl.text) # print(cur_sibl.text)
case _: case _: