Программа на Python для подсчета частоты слов в текстовом документе с выводом результатов в CSV формате.
Word Counter анализирует текстовый файл ("declaration.txt"), содержащий Декларацию независимости США, подсчитывает частоту каждого слова и выводит результаты в порядке убывания частоты. Программа также сохраняет полный список слов и их количество в CSV файл для дальнейшего анализа.
- Чтение текста из файла "declaration.txt"
- Удаление знаков пунктуации и приведение всех слов к нижнему регистру
- Подсчет частоты каждого слова в тексте
- Вывод 10 наиболее часто встречающихся слов в консоль
- Сохранение полного списка слов и их частоты в CSV файл "words.csv"
- Убедитесь, что файл "declaration.txt" находится в той же директории, что и скрипт
- Запустите скрипт с помощью Python:
python count_words.py - Программа выведет 10 самых часто встречающихся слов в консоль
- Полный список слов будет сохранен в файл "words.csv"
the: 147
of: 80
and: 66
to: 62
our: 36
has: 34
in: 33
for: 28
a: 25
we: 25
count_words.py- основной скрипт программыdeclaration.txt- текстовый файл с Декларацией независимости СШАwords.csv- результат работы программы (создается автоматически)
- Python 3.x
- Стандартные библиотеки: csv, string
- Скрипт открывает файл с текстом и считывает его содержимое
- Создается переводчик для удаления знаков пунктуации
- Текст разбивается на слова, каждое слово очищается от пунктуации и приводится к нижнему регистру
- Каждое слово добавляется в словарь с увеличением счетчика
- Слова сортируются по частоте в порядке убывания
- 10 самых частых слов выводятся в консоль
- Все слова с их частотой записываются в CSV файл