Reposições de aula no Pré-Universitário (parte 3: análise)

Ao longo das duas últimas semanas, tenho recuperado, aos poucos, meu amor pela estatística e pela ciência da informação. Em especial, o dinamismo dos dados só se rivaliza com o da web, mas com a vantagem de cada análise bem-sucedida ser acompanhada pelo prazer da descoberta. Desta vez, surgiu a oportunidade de aplicar estatística computacional a um problema real e de grande complexidade (mas com baixo risco, tornando-o ideal para a experimentação). Esta será uma série bastante detalhada e, por isso, será dividida em várias postagens.

Parte 2: Execução
Parte 5: Conclusões

Análise

Começarei a análise pelas estatísticas de frequência:

Valor Pergunta 1 Pergunta 3 Pergunta 6 Expectativa*
espaço amostral 55.00000 55.00000 55.00000 55.00000
média 2.890909 2.618182 4.145455 2.581818
desvio-padrão 1.271813 1.367492 1.208277 1.583373
mínimo 0.000000 0.000000 0.000000 0.000000
1º quartil 2.000000 2.000000 3.500000 1.000000
mediana 3.000000 3.000000 5.000000 3.000000
3º quartil 4.000000 4.000000 5.000000 4.000000
máximo 5.000000 5.000000 5.000000 5.000000

*média para 100 cenários aleatórios

As estatísticas de frequência para as perguntas 1 e 3 não revelam nada sobre o dataset. De fato, são tão similares às dos cenários aleatórios que poderiam até ser confundidas com alguma das simulações. É na pergunta 6 que temos um resultado realmente expressivo: 75% dos alunos entrevistados responderam que a probabilidade de comparecerem aos domingos é alta ou muito alta. Ao contrário do que o senso comum sugere, porém, esta é uma informação do espaço amostral e não do universo amostral. Ou seja, a única coisa que descobri aqui é que 75% dos alunos que responderam o formulário estão entre os mais presentes, os mais eloquentes, os mais proativos, dispostos a comparecerem a todas as atividades do Projeto mesmo que não sintam a necessidade. Estes são meus alunos mais dedicados, e, justamente por isto, os que seriam menos afetados por eventuais reposições de aula.

Os histogramas repetem a história:

De posse desta informação, desejo extrair três informações do próximo conjunto de resultados:

  1. O que pensam os 75% dos alunos que representam a metade mais esforçada do corpo discente?
  2. O que pensam os 25% dos alunos que representam a metade menos presente do corpo discente?
  3. A diferença entre eles é significativa o suficiente para mantê-los em grupos distintos?

A regressão linear entre as perguntas 1 e 3 mostra forte correlação entre a percepção do andamento das disciplinas de sábado e de domingo:

O coeficiente de Pearson (r) indica que se pode esperar correlação de 70% entre as distribuições, num intervalo de confiança de 95%. Ou seja, se um aluno expressa preocupação com uma disciplina de sábado, há 70% de probabilidade dele também expressar a mesma preocupação com uma disciplina de domingo. A inversão dos eixos mostra que a recíproca é verdadeira.

A correlação desaparece quando a preocupação precisa se manifestar em disposição. O coeficiente passa a girar em torno de zero, o que indica que a percepção sobre o andamento das disciplinas é linearmente independente do compromisso com a presença no domingo. Seguem os gráficos:

Então, respondendo às perguntas propostas, não há diferença significativa entre os alunos que comparecem aos domingos e os demais. Somando-se a isso, a análise realizada nas estatísticas de frequência mostrou que a distribuição dos graus de preocupação pouco difere das simulações computacionais, o que me permite concluir que ambos os grupos de alunos exibem níveis normais de expectativa em relação ao cumprimento das ementas e, portanto, não há a necessidade de reposição.

Isto não exclui, logicamente, que haja um grupo de alunos que se sinta vulnerável e deseje mais aulas, ou que haja um grupo de alunos disposto a ter mais aulas mesmo sem ver a necessidade. A clusterização pelo algoritmo de Lloyd foi executada com a intenção de identificar estes grupos, se existirem. O número preciso de grupos é um problema à parte e, extremamente complexo, não é o foco desta análise. Em vez disso, publicarei e analisarei todos os cenários gerados, tentando evitar a redundância de informações. Para isso, vou começar do cenário mais complexo, com oito agrupamentos (k=8):

Os oito grupos podem ser divididos em:

  1. Os Tranquilos (em branco): despreocupados, confiam no juízo dos profissionais do Projeto e estão dispostos a terem mais aulas, se o curso assim decidir;
  2. Os Indecisos (em azul): julgando-se incapazes de avaliar o andamento das disciplinas, marcam opções intermediárias e preferem não se comprometer;
  3. Os Azarões (em verde): também se julgam incapazes de emitir opiniões sobre a evolução das ementas, mas estão dispostos a fazer o que preciso para alcançarem seus objetivos;
  4. Os Observadores (em turquesa): não veem necessidade iminente de nenhuma reposição, mas pretendem comparecer às atividades, se forem marcadas;
  5. Os Prevenidos (em amarelo): expressam alguma preocupação com o ritmo do calendário, mas se propõem a ter atividades de reforço aos domingos;
  6. Os Chutadores de Balde (em rosa): avaliam o estado do ensino como bastante atrasado, porém se recusam a aparecerem aos domingos;
  7. Os Tecnicistas (em vermelho): estressados com a aproximação dos exames vestibulares, preferem que os domingos sejam usados para intensificar os estudos em suas disciplinas específicas;
  8. Os Desesperados (em preto): encontram-se bastante ansiosos com o avanço da matéria e desejam que mais atividades aos domingos sejam oferecidas, independentemente de quais sejam.

A distribuição das frequências em cada grupo se dá desta forma:

Para sete agrupamentos, o gráfico ficou assim:

  • Os Azarões (em verde) e os Observadores (em turquesa) fundem-se num único grupo (aqui, em azul). Os demais grupos permanecem similares.

Com seis agrupamentos, ocorre a seguinte divisão:

  • Os Prevenidos aqui são divididos entre os Desesperados (em verde) e os Azarões-Observadores (em amarelo).

Para 5 agrupamentos, o gráfico fica mais enxuto. Este é meu cenário favorito, em termos de detalhamento e síntese. Segue o gráfico:

  • Os Tecnicistas são engolidos pelos Desesperados, formando um cluster de alunos extremamente motivados e interessados em aprender mais.

Para k=4, precisaremos de uma nova análise:

Os grupos aqui mudam bastante de personalidade:

  1. Sonserina (em verde): não enxergam problemas com o calendário, mas, mesmo que enxergassem, não estão lá muito motivados para possíveis reposições de aula;
  2. Grifinória (em vermelho): não possuem uma posição definida em relação ao andamento das ementas, e estão dispostos ao que for preciso;
  3. Lufa-Lufa (em amarelo): permeados pela dúvida, não conseguem se decidir quanto à evolução das disciplinas ou quanto à disponibilidade nos domingos;
  4. Corvinal (em azul): ansiosos pelo conhecimento, desejam revisão do que já aprenderam para seguirem em frente.

Tags: reposições 

 

Comments

There are currently no comments

New Comment