Lei de Zipf

 

Imagem: Wikimedia Commons

Em qualquer idioma, a palavra usada com mais frequência ocorre cerca de duas vezes mais que a segunda palavra mais frequente, três vezes mais que a terceira palavra mais frequente e assim por diante.

Em textos em inglês americano, a palavra the ocorre com mais frequência, sendo responsável por quase 7% de todas as ocorrências de palavras. A segunda palavra mais frequente, de , é responsável por pouco mais de 3,5% das palavras e assim por diante.

Esse padrão é válido até mesmo em línguas não naturais como o Esperanto. Tem o nome em homenagem ao lingüista americano George Kingsley Zipf, que o popularizou.

24/12/2021 ATUALIZAÇÃO: Além dos idiomas, a lei é observada em medições das citações de artigos científicos, acessos na web, cópias de livros vendidos, ligações telefônicas, a magnitude dos terremotos, o diâmetro das crateras da lua, a intensidade solar chamas, a intensidade das guerras e as populações das cidades. Veja este artigo. (Obrigado, Snehal.) 

 

 

Fonte: (aqui)

Nenhum comentário: