forked from henriquebastos/pacote-desafios-pythonicos
-
Notifications
You must be signed in to change notification settings - Fork 0
/
13_wordcount.py
executable file
·96 lines (73 loc) · 2.59 KB
/
13_wordcount.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
"""
13. wordcount
Este desafio é um programa que conta palavras de um arquivo qualquer de duas
formas diferentes.
A. Lista todas as palavras por ordem alfabética indicando suas ocorrências.
Ou seja...
Dado um arquivo letras.txt contendo as palavras: A a C c c B b b B
Quando você executa o programa: python wordcount.py --count letras.txt
Ele deve imprimir todas as palavras em ordem alfabética seguidas
do número de ocorrências.
Por exemplo:
$ python wordcount.py --count letras.txt
a 2
b 4
c 3
B. Lista as 20 palavras mais frequêntes indicando suas ocorrências.
Ou seja...
Dado um arquivo letras.txt contendo as palavras: A a C c c B b b B
Quando você executa o programa: python wordcount.py --topcount letras.txt
Ele deve imprimir as 20 palavras mais frequêntes seguidas
do número de ocorrências, em ordem crescente de ocorrências.
Por exemplo:
$ python wordcount.py --topcount letras.txt
b 4
c 3
a 2
Abaixo já existe um esqueleto do programa para você preencher.
Você encontrará a função main() chama as funções print_words() e
print_top() de acordo com o parâmetro --count ou --topcount.
Seu trabalho é implementar as funções print_words() e depois print_top().
Dicas:
* Armazene todas as palavras em caixa baixa, assim, as palavras 'A' e 'a'
contam como a mesma palavra.
* Use str.split() (sem parêmatros) para fazer separar as palavras.
* Não construa todo o programade uma vez. Faça por partes executando
e conferindo cada etapa do seu progresso.
"""
import sys
# +++ SUA SOLUÇÃO +++
# Defina as funções print_words(filename) e print_top(filename).
# A função abaixo chama print_words() ou print_top() de acordo com os
# parêtros do programa.
def main():
if len(sys.argv) != 3:
print('Utilização: ./13_wordcount.py {--count | --topcount} file')
sys.exit(1)
option = sys.argv[1]
filename = sys.argv[2]
if option == '--count':
print_words(filename)
elif option == '--topcount':
print_top(filename)
else:
print('unknown option: ' + option)
sys.exit(1)
def count_words(filename):
with open(filename, 'r') as file:
words = file.read().lower().split()
count = dict()
for word in words:
if word in count:
count[word] +=1
else:
count[word] = 1
return count
def print_words(filename):
for k, v in count_words(filename).items():
print(k, v)
def print_top(filename):
for k, v in sorted(count_words(filename).items(), key=lambda x: x[1], reverse=True)[:20]:
print(k, ' ', v)
if __name__ == '__main__':
main()