Каталог статей
Нахождение 10 наиболее частых слов на web странице,на питон,на Python
from urllib2 import urlopen
u = urlopen("http://python.org")
words = {}
# (словарь — неупорядоченный [[ассоциативный массив]])
for line in u:
# читаем u по строкам
line = line.strip(" \n")
# отбрасываем начальные и конечные пробелы
for word in line.split(" "):
# режем каждую строку на слова, ограниченные пробелами
try:
# блок обработки исключений
words[word] += 1
# пытаемся увеличить words[word] на единицу
except KeyError:
# если не получилось (раньше words [word] не было)
words[word] = 1
pairs = words.items()
# делаем из словаря список пар
# pairs == [("яблоко",5), ("апельсин",12), ("груша",8)]
pairs.sort(key=lambda x: x[1], reverse=True)
for p in pairs[:10]:
print p[0], p[1]
во простенький пример, думаю кому надо пойдет и использует |
Категория: примеры кодов | Добавил: bogdan-G (02 Сентября 2012)
|
Просмотров: 660
| Теги: на web странице, нахождение, частых, наиболее, на Python, на питон, 10, слов, Нахождение 10 наиболее частых слов
| Рейтинг: 0.0/0 |
Добавлять комментарии могут только зарегистрированные пользователи. [ Регистрация | Вход ]
|