Resumo Olímpiadas de Tokyo 2020
- Jonas Euler
- 23 de ago. de 2021
- 4 min de leitura
No dia 8 de agosto terminou os jogos olímpicos de Tokyo, evento que era para ter sido realizado em 2020 mas foi adiado para 2021 em virtude da pandemia da covid-19. Com o fim das olímpiadas, eu fiz um breve resumo com análise de dados sobre a competição. Não irei me aprofundar aqui nos códigos que utilizei, apenas nas estatísticas, mas todo código e soluções que utilizei estão disponíveis no notebook que está meu GitHub: https://github.com/Visheuleer/Analise-Olimpiadas-2020/blob/main/Notebook-Olimpiadas%202020.ipynb ,
Dito isso, vamos aos objetivos dessa análise consiste em algumas perguntas, são elas:
Qual país mais surpreendeu e qual mais decepcionou em quantidade de medalhas conquistadas?
Qual é país mais esportivo do Mundo?
Qual país mais satisfeito com o desempenho esportivo da própria pátria?
Qual continente teve o melhor desempenho nos jogos?
Algumas dessas perguntas podem parecer complexas de expressar com estatísticas, mas é só continuar lendo que tudo vai ficar mais claro lá na frente quando eu explicar os critérios e as métricas que vou utilizar pra responde-las.
Base de dados dos atletas
Utilizei 3 base de dados, todas elas disponíveis no meu GitHub. Então decidi começar a usar primeiro a base de dados dos atletas das olímpiadas.

Comecei verificando quantos atletas, nações e esportes participaram dos jogos. Segue os resultados na imagem logo abaixo:

Depois, resolvi descobrir quantos atletas os 80 primeiros países enviaram para a competição. Para isso usei o:

Os Estados Unidos foi de forma isolada a nação que mais enviou atletas para os jogos olímpicos, inclusive sendo o único a chegar e ultrapassar o número de 600 atletas. Já a Indonésia foi o país que enviou menos atletas. Um detalhe interessante no gráfico é que a distância entre os 3 países que menos cederam atletas é bem menos significativa que a distância dos 3 países que mais disponibilizaram atletas para o evento. Olho para o Brasil que foi o décimo segundo país que mais teve atletas na competição. Ok, mas existe uma forma mais clara de ver essa distribuição de atletas por países, basta utilizar a porcentagem.

Não se assuste, a base de dados tem muitos países, o que causa esse gráfico embolado. De qualquer forma, da para visualizar bem os principais países. Interessante observar que EUA e o Japão juntos representaram 10% dos atletas presentes nos jogos, se você considerar que 206 países participaram, é uma fatia bem considerável. Apliquei esse mesmo modelo para a modalidade e obtive o seguinte resultado:

O atletismo se destaca com 18.66% dos atletas da competição praticando a modalidade, isso é praticamente 12% a mais do que a natação, segundo esporte com mais atletas.
Base de dados de medalhas
Agora vem minha parte favorita do projeto, as medalhas. Comecei com o
Só para ver as colunas do dataset

A título de curiosidade, o Brasil foi o décimo segundo no rank de medalhas. Seguindo a mesma lógica que utilizei de distribuição dos atletas, fiz também a distribuição de medalhas por país e observei algumas coisas interessantes.

Lembra que o Japão era o segundo país com mais atletas no evento? Pois é, nesse gráfico observamos que mesmo assim ele foi apenas o quinto maior vencedor de medalhas. Com essa observação, eu decidi explorar esse tema e agora as coisas ficam interessantes. Duas coisas: Eu criei uma coluna chamada 'pontos', essa coluna será responsável em dar peso as medalhas conquistadas (ouro valendo 3 pontos, prata valendo 2 e bronze valendo 1). Daqui para frente eu vou utilizar o termo "potencial de medalhas", que nada mais é do que a razão entre os pontos conquistados por uma nação e números de atletas que aquele país enviou para os jogos.

Ressaltando: p_normalizado é o potencial que citei anteriormente, sendo 1 o potencial mais alto e 0 o mais baixo. Podemos ver que a Bermuda é o país com o maior potencial, pois mandou apenas 2 atletas para os jogos e conquistou uma medalha de ouro. Já a Argentina é a maior decepção, tendo enviado 180 atletas e não conseguindo nenhuma medalha de ouro. Para facilitar a visualização resolvi plotar um gráfico.

Base de dados sobre população em países
O último dataset eu utilizei para pegar a população dos países e continentes que participaram dos jogos olímpicos de Tokyo. Aqui o objetivo era definir a esportividade das nações, entendendo esportividade como a razão entre atletas cedidos pras olimpíadas e população total do país. Utilizei o mesmo método de números normalizados, ou seja, 1 sendo o mais esportivo, 0 sendo o menos.

A Austrália é o país mais esportivo do Mundo, com 470 atletas e uma população de 20.264.082. Em contrapartida, o Myanmar é o país menos esportivo, tendo cedido apenas 2 atletas mesmo tendo 47.382.633 de população.
Depois decidi usar um critério para definir a satisfação do país com seu desempenho na competição, pra isso utilizei a razão entre os pontos (explicado anteriormente) e o número de população. Lembrando que também segue o padrão de números normalizados.

O EUA é o país mais satisfeito com seu desempenho nos jogos, tendo feito incríveis 232 pontos com uma população de 298.444.215. O Paquistão é o país mais insatisfeito com seu desempenho, não tendo feito 1 ponto sequer com uma população de 165.803.560.
Para finalizar aqui fica alguns números por continente.



Conclusões
Qual país mais surpreendeu e qual mais decepcionou em quantidade de medalhas conquistadas? Como vimos na parte de potencial de medalhas, o país que mais surpreendeu foi a Bermuda e o que mais decepcionou foi a Argentina.
Qual é país mais esportivo do Mundo? Austrália.
Qual país mais satisfeito com o desempenho esportivo da própria pátria? Estados Unidos.
Qual continente teve o melhor desempenho nos jogos? No último gráfico vemos que é a Europa Ocidental com 27.83% das medalhas conquistas.
Esse foi meu resumo das Olimpíadas de Tokyo, foi muito legal de fazer e sinceramente fiquei muito satisfeito com o resultado. Lembrando que o código inteiro está no meu GitHub (link no início do post), obrigado!


Comentários