Для работы нужно использовать частотный словарь русского языка - https://goo.gl/1Q6fxq
В файле на каждой строчке записано слово, морфологическая информация о нем (часть речи, число и т.д.) в виде списка тегов, а затем его частотность в ipm (items per million).
Пример морфологической информации:
а|союз|9808.61
- союз
абажур|сущ неод ед муж им|7.77
- существительное, неодушевленное, единственное число, мужской род, именительный падеж
Все решение контрольной работы принимается единым файлом.
Каждое задание должно быть оформлено в виде отдельной функции. Разрешается и приветствуется использование вспомогательных функций.
Пример итогового файла:
FILENAME = 'freq.txt'
def task_01():
'''Решение для первого задания, которое просто что-то печатает и ничего не возвращает'''
pass
def task_02():
'''Решение для второго задания, которое просто что-то печатает и ничего не возвращает'''
pass
def task_03():
'''Решение для третьего задания, которое просто что-то печатает и ничего не возвращает'''
pass
5 баллов - одна задача
8 баллов - две задачи
10 баллов - три задачи
Программа должна открыть частотный словарь в кодировке UTF-8 и корректно вывести на экран только те строчки, которые подходят под условия:
- длина слова строго больше 2 символов
- 2 первые буквы слова равны двум последним буквам слова
Например, строка ажиотаж|сущ неод ед муж им|3.06
. Тут у слова первые 2 буквы равны двум последним - аж
.
Программа должна распечатать через запятую все существительные женского рода единственного числа, ipm которых строго больше 100.
После списка на отдельной строке напечатать самый большой ipm, который есть у выведенных слов.
Программа должна спрашивать у пользователя слова, пока тот не введёт пустое слово.
После этого она должна для каждого слова распечатать:
- само слово
- морфологическую информацию о слове
- ipm слова
Если слово не встретилось в словаре, то нужно вывести сообщение о том, что слово не нашлось. Если пользователь пишет с телефона и ввел слово с большой буквы, то оно все равно должно найтись.