Carregando: Madonna In Rio

📌 Legenda

Menu de Informações

🔵 Introdução

O que o grafo representa?

Esta visualização interativa representa as interações entre usuários e os principais termos discutidos no Twitter/X durante a semana do show da Madonna - The Celebration Tour in Rio, ocorrido em 4 de maio de 2024.

O grafo busca capturar a dinâmica das conversas que aconteceram no Twitter ao longo do evento, identificando usuários influentes e os temas mais relevantes debatidos na plataforma.

📌 Como o grafo foi construído?

Os dados foram coletados entre os dias 29 de abril e 4 de maio, abrangendo tanto o dia do show quanto a semana que antecedeu o evento. A partir desses tweets, processamos informações-chave para criar conexões significativas entre usuários e termos.

Cada nó (ponto no grafo) representa um usuário ou um termo, e cada conexão entre eles indica a associação entre um perfil e uma palavra-chave usada em suas publicações.

🕵 O que podemos observar na rede?

  • Usuários influentes: perfis que geraram maior impacto na conversa sobre o evento.
  • Tendências de discussão: temas e hashtags que se destacaram ao longo da semana.
  • Conexões entre pessoas e palavras-chave: mostrando como diferentes grupos participaram das conversas.

🟡Análise Geral

📌 Considerações Gerais

A análise do grafo revelou que a conversa sobre o show da Madonna foi altamente centralizada, com poucos usuários dominando a narrativa e uma grande concentração de termos em um único cluster. Isso sugere que a comunicação sobre o evento seguiu uma linha narrativa homogênea, impulsionada - mais fortemente - por perfis influentes e marcas com alto impacto na rede, e não de uma forma orgânica entre os usuários.

Além disso, a presença de portais de notícias e perfis comerciais como hubs centrais indica que a cobertura midiática teve um papel significativo na construção da discussão. A predominância de termos como "madonnacelebrationtourinrio", "show" e "copacabana" reforça que a narrativa principal girou em torno da grandeza e da experiência do evento, com pouca segmentação temática.

📊 Estatísticas Gerais

  • Número total de nós 305 (Usuários e Termos combinados)
  • Número total de arestas: 472 (Conexões entre usuários e termos)
  • Densidade do grafo: 0.010 (Rede dispersa com poucos hubs de influência)

🌟 Principais Hubs de Influência

  • SiteMadonnaBR - 35 conexões
  • madonnacelebrationtourinrio - 32 conexões
  • madonna - 28 conexões
  • carlosalbanno - 27 conexões
  • americanas - 25 conexões
  • choquei - 21 conexões
  • madonnainrio - 17 conexões
  • QueriaSerVJ - 16 conexões
  • horadafofocatv - 16 conexões

🎯 Impact Score

  • Número de conexões (grau do nó)
  • Importância dentro da rede (interações recebidas e enviadas)
  • Peso das conexões (se algumas conexões têm mais influência)

💡 Principais Temas Discutidos

  • 🔥 A turnê de Madonna e seu impacto na conversa.
  • 📰 A presença de marcas e veículos de mídia como "americanas" e "choquei".

Como os Clusters Foram Definidos?

Os termos foram agrupados em clusters baseados em:

  • 📏 Comprimento do termo
  • 📈 Impact Score do termo

Isso permitiu a criação de três clusters distintos:

  • Cluster 1 (Vermelho Claro) → Termos mais influentes na conversa.
  • Cluster 2 (Laranja Claro) → Termos de influência intermediária.
  • Cluster 3 (Amarelo Claro) → Termos menos recorrentes, mas ainda relevantes.

📌 Diferenças entre Usuários e Termos

Grupo Descrição Cor
Usuários Large (Alto Impacto) Perfis de alto engajamento na rede. Vermelho Escuro
Usuários Medium (Médio Impacto) Perfis com participação moderada. Laranja Escuro
Usuários Small (Baixo Impacto) Perfis menos influentes. Amarelo Escuro
Cluster 1 (Termos) Termos altamente influentes. Vermelho Claro
Cluster 2 (Termos) Termos com impacto intermediário. Laranja Claro
Cluster 3 (Termos) Termos menos recorrentes. Amarelo Claro

🟣Base de Dados

Os dados foram coletados no Twitter/X entre os dias 29 de abril e 4 de maio de 2024. O objetivo da coleta foi capturar as interações e tendências sobre o show da Madonna - The Celebration Tour in Rio. O dataset contém informações sobre tweets, usuários, interações e palavras-chave associadas ao evento.

🟣Estrutura do Dataset

O dataset é composto por dados gerais, métricas de rede e conteúdo do usuário, sendo os mais relevantes:

  • Engajamento:
    • Retweets: Número de vezes que o tweet foi retweetado.
    • Comments: Número de comentários no tweet.
    • Favorites: Quantidade de curtidas recebidas.
  • Texto e Conteúdo:
    • Tweet Text: O conteúdo do tweet.
    • Tweet Keywords: Lista de palavras-chave extraídas do texto.
    • Topic Cluster: Classificação do tweet em um tema principal (exemplo: entretenimento).
  • Impacto e Influência:
    • Impact Score Atualizado: Pontuação que mede a relevância do usuário.
    • Influence Rank: Classificação do usuário com base no impacto.

🟣Processamento dos Dados

Criamos um script em Python que foi responsável pela estruturação dos dados no grafo, sendo as principais:

  • Clusterização com K-Means: Os termos foram agrupados em três grupos temáticos.
  • Categorização de impacto: Usuários foram classificados como Small, Medium ou Large, de acordo com a influência.
  • Geração do grafo JSON: Criou conexões entre usuários e termos para a visualização.

🔴 Organização do Grafo

O grafo foi construído para representar as interações entre os usuários mais influentes e os termos mais relevantes da discussão sobre o evento. Cada (ponto no grafo) representa um usuário ou um termo-chave. Cada aresta (linha conectando os nós) indica a relação entre um usuário e uma palavra-chave utilizada em seu tweet.

🔹 Grupos e Classificação

Os usuários foram categorizados em três grupos com base em seu impacto na rede:

  • Large: Usuários com alto impacto na conversa.
  • Medium: Usuários com impacto médio.
  • Small: Usuários com menor impacto.

Os termos foram agrupados automaticamente usando clusterização com K-Means, formando três grupos distintos.

🔴 Critérios para Conexões

As conexões entre os nós foram estabelecidas com base em regras específicas:

  • Cada usuário foi conectado às principais palavras-chave que utilizou.
  • Apenas conexões mais relevantes foram mantidas, eliminando nós isolados.
  • O peso das conexões foi determinado pelo Impact Score do usuário.

🔴 Algoritmo e Layout do Grafo

O grafo utiliza um layout dinâmico baseado no algoritmo force-directed, que distribui os nós para evitar sobreposição e facilitar a visualização.

  • Cores personalizadas foram aplicadas para diferenciar os grupos de usuários e termos. Mais escuras são os usuários, mais claras os termos
  • O tamanho dos nós é proporcional ao impacto do usuário ou termo na rede.
  • O algoritmo ajusta automaticamente a disposição dos nós para melhorar a compreensão das conexões.

🟠Ferramentas Utilizadas

Para estruturar os dados e prepará-los para o grafo, utilizamos:

  • 🐍 Python + Pandas: Manipulação e filtragem do dataset.
  • 🔢 Scikit-learn (K-Means): Clusterização dos termos para agrupar palavras-chave similares.
  • 📝 JSON: Conversão dos dados processados para um formato adequado para visualização interativa.

🟠Criação do Grafo

A visualização do grafo foi desenvolvida utilizando:

  • 📊 D3.js: Biblioteca JavaScript para renderização de grafos interativos.
  • 🖥️ Three.js: Implementação de gráficos 3D para melhor experiência visual.
  • 🌐 HTML, CSS e JavaScript: Construção da interface e interatividade do painel de informações.

🟠Destaques da Implementação

  • Filtragem e clusterização de dados: Identificação dos usuários e termos mais relevantes.
  • Geração automática do grafo JSON: Transformação dos dados para visualização dinâmica.
  • Visualização interativa: O grafo permite navegação e análise dinâmica das conexões.