¬ Lição matemática nº12: desvio-padrão

Desvio-padrão é a medida de dispersão mais empregada, por ser relativamente estável já que leva em consideração a totalidade dos valores da variável em estudo. Porém, sofre influência de valores extremos, assim como a média. Além disso, baseia-se nos desvios em torno da média aritmética.

Quanto maior for o desvio-padrão, maior será a variação entre os valores estudados (da população ou de uma amostra). Quanto menor for o desvio-padrão menor será a variação dos valores e, desta forma, esses valores serão mais homogêneos. Logo, quando o desvio-padrão é igual a zero não temos variações dos valores com relação à média, ou seja, eles são completamente homogêneos.

  • Exemplo 1:

Pesos estudados:  5 5 5 5 5

Média aritmética = 5kg

Desvio padrão = 0

  • Exemplo 2:

Pesos estudados: 8 9 10 11 12

Média aritmética = 10kg

Desvio padrão = 1,58kg

.
Notamos que no exemplo2 os pesos estudados variam mais do que os pesos do exemplo1, o que é fácil de identificar visualmente. Isso é demonstrado pelo desvio padrão de 1,58kg. Ou seja, os dados são heterogêneos, indo de8 a12kg. Logo, quanto maior o desvio padrão maior a heterogeneidade dos elementos analisados. Como exemplo, façamos uma outra simulação alterando para cima o último peso para verificarmos seus efeitos sobre a média e o desvio-padrão.


  • Exemplo 3:

Pesos estudados: 8 9 10 11 52

Média aritmética = 18kg

Desvio padrão = 17kg

.
Como a média é influenciada por valores extremos, e esta acaba influenciando o desvio-padrão, notamos que ambos cresceram de forma relevante.

A fórmula básica do desvio-padrão pode ser traduzida como: somatório da raiz quadrada da média aritmética dos quadrados dos desvios e é representada por S. Logo,


S = √∑ (xi-X)2+ (xii-X)2
               n - 1

onde:

xi = dados da série

X = média da série
n = número de elementos da amostra (para calcularmos o desvio padrão de toda a população utilizaríamos n ao invés de n - 1)


Ex: Calcular o desvio padrão da amostra de uma população (preços) representada por $4, $3, $1, $2 ,$5



  X     média          ( X - média  )      (X - média )2 
 4311
 3300
13-24
23-11
5324
Total10



Sabemos que n = 5 - 1, logo  10 / 4 = 2,5.

A raiz quadrada de 2,5 é o desvio padrão = $1,58.


* A unidade na qual o desvio padrão é expresso é a mesma dos dados originais, ou seja, se os dados são em Reais, o desvio padrão também será em reais


Vejamos abaixo um exemplo de aplicação do desvio-padrão a partir de um artigo falando sobre o critério de seleção em algumas universidades.



"Desvio Padrão – Texto Vest Unicamp
Durante os 11 anos de escolaridade regular que antecedem o vestibular, os professores corrigem as provas e fornecem os resultados aos seus alunos em graus que, normalmente, variam numa escala de 0 (zero) a 10 (dez). São os chamados “graus brutos” que são facilmente entendidos por todos. Desta forma, se um aluno disser que tirou 10 (dez) em História, saberemos que ele acertou a prova toda. Por outro lado, se o mesmo aluno afirmar que tirou 5 (cinco) em Biologia, imaginaremos que ele acertou metade da prova. Tudo simples e fácil de entender!

Entretanto, chegada a hora do vestibular, os graus brutos a que estamos acostumados cedem lugar às notas padronizadas. E aí os estudantes fazem muitas perguntas. O que é uma nota padronizada? Como se faz para calculá-la? Por que não se podem usar as tradicionais notas brutas no vestibular? Nós, como professores e conhecedores das boas técnicas de avaliação, não podemos nos furtar a respondê-las.

As notas que são atribuídas na escola servem para verificar em que pontos da matéria o aluno está bem, em que partes ele precisa de reforço, se ele pode ser promovido de uma série para outra, se deve se submeter a um processo de recuperação e, finalmente, se deve ser reprovado. Nesta situação, caso o professor venha a “dar” 6 (seis) para um aluno e 8 (oito) para outro, em nada afetará a aprovação de ambos, nem interferirá na vida dos demais alunos. Em outras palavras, a nota na escola de primeiro e segundo graus não tem sentido comparativo, já que a aprovação ou a reprovação de um estudante não interfere na vida dos seus colegas. Mas no vestibular é diferente, pois a realidade atual impõe um sistema de comparação de notas, pois não há vagas para todos. Enquanto que na escola todos podem ser aprovados, no vestibular todos podem obter a nota mínima, mas somente os de melhor desempenho (maiores notas) ocuparão as vagas oferecidas. É a dos mais aptos pelo sistema do mérito intelectual.

E por que não podemos somar 8 (oito) de Matemática com o 8 (oito) de História no vestibular? Pela simples razão de que as provas não possuem o mesmo grau de dificuldade, já que, por exemplo, um 8 (oito) numa prova de Matemática que “teve” média 4 (quatro) vale mais do que um 8 (oito) numa prova de História que “teve” média 7 (sete)! Neste caso, a soma do 8 (oito) em Matemática com o 8 (oito) em História significa a mesma coisa que as seguintes somas: soma de 8 (oito) bananas com 8 (oito) laranjas! Soma de 8 (oito) centímetros com 8 (oito) polegadas! Soma de 8 (oito) litros com 8 (oito) galões! Um verdadeiro absurdo, não acham?

Para que duas ou mais parcelas sejam somadas é preciso que elas estejam numa mesma escala. Daí, a necessidade da padronização que utiliza a média e o desvio-padrão. E o que é desvio-padrão?  Desvio-padrão é uma medida do grau de dispersão dos resultados em torno da média, isto é, um número que mede o quanto os graus estão mais ou menos dispersos em relação à média. Exemplificando: se a maioria das notas de uma prova está nas proximidades da média, o desvio é pequeno, e se, num outro caso, as notas estão bastante espalhadas e distantes da média, o desvio é grande. E qual é a importância do desvio-padrão? Imaginemos que um aluno tire 7 (sete) numa prova de Física que “teve” média 4 (quatro) e 7 (sete) numa prova de Química que também “teve” média 4 (quatro). Qual o 7 (sete) que vale mais, o de Física ou de Química?

À primeira vista fica parecendo que os dois setes valem a mesma coisa, mas isto não é verdade. Vejamos porque. Imagine ainda que na prova de Física quase todos os graus estejam muito próximos da média (desvio pequeno) e que na prova de Química os graus estejam mais espalhados (desvio maior). Agora sim poderemos afirmar qual é o 7 (sete) que vale mais, pois o 7 (sete) em Física está situado acima de um maior número de notas que o 7 (sete) em Química. Em outras palavras, o 7 (sete) de Química não está tão afastado dos demais graus como o 7 (sete) em Física. Desta forma o 7 (sete) em Física “vale” mais. E como então poderemos calcular se uma nota “vale” mais ou menos que outra? Pelo cálculo da nota padronizada que traduz todas as notas para uma mesma escala, onde todas as provas, depois do tratamento matemático terão a mesma média e o mesmo desvio-padrão, isto é, terão o mesmo grau de dificuldade e a mesma distribuição de notas em torno da média. O cálculo é simples: diminui-se a nota que o aluno tirou da média da prova. Em seguida, divide-se o resultado pelo desvio-padrão e multiplica-se por 100. Finalmente, soma-se 500 a este último resultado e obtém-se a nota padronizada.

Esta nota padronizada pode ser somada às notas padronizadas de outras disciplinas porque estão na mesma escala. É por isso que a Unicamp, a Uerj, a UFF, a Fundação Cesgranrio, a PUC/RJ, a Access e a Fundação Carlos Chagas, entre outras, padronizam as notas dos vestibulares que realizam para que a seleção seja a mais justa possível. Pela mesma razão as grandes universidades dos países do primeiro mundo também se utilizam do método de padronização que foi popularizado no início do século pelo Colege Entrance Examination Board (USA)".



A partir do texto acima vamos a um exemplo:
Dois alunos fizeram provas de dois conteúdos no vestibular. O primeiro tirou 7 em uma e 7 na outra, ou seja, tem 14 pontos. O segundo tirou 10 em uma e 4 na outra, também com 14 pontos. Será que estão empatados? Se as notas forem padronizadas veremos que não.

Imaginemos que a média geral na primeira prova tenha sido 4, e a média da segunda 5. Porém, o desvio padrão da primeira tenha sido de 1 ponto, e da segunda 3 pontos. Ou seja, as notas estão mais afastadas no segundo caso e mais próximas no primeiro. Usando a metodologia do texto façamos uma simulação:


Aluno A (nota 1): 7,0

Desvio da média = 3 (7-4)

Desvio/desvio padrão = 3/1 = 3

3 x 100 = 300 + 500 = 800

Aluno A (nota 2): 7,0

Desvio com relação à média =  2 (7-5)

Desvio/desvio padrão = 2/3 = 0,666

0,66 x 100 = 66 + 500 = 566

Total de pontos = 1.366 (800 + 566)
                       

Aluno B (nota 1): 10,0

Desvio da média = 6 (10-4)

Desvio/desvio padrão = 6/1 = 6

6 x 100 = 600 + 500 = 1.100

Aluno B (nota 2): 4,0

Desvio com relação à média = -1 (4-5)

Desvio/desvio padrão = -1/3 = -0,33

-0,33 x 100 = -33 + 500 = 467

Total de pontos = 1.567 (467 + 1.100)

.

Ou seja, pela padronização das notas o Aluno B está na frente, pois foi bem em uma prova em que todo mundo foi mal, cuja média foi 4,0. Isto é, como nesta avaliação as notas estavam mais próximas de 4,0 (desvio - 1) e ele tirou 10, isso acabou favorecendo sua pontuação, uma vez que se destacou da maioria.



O Desvio padrão e a curva normal
O desvio padrão é utilizado também para indicar a dispersão dos dados dentro da amostra, isto é, o quanto os dados em geral estão distantes (diferem) da média. Quanto menor o desvio padrão, mais parecidos são os valores da amostra. Logo, por exemplo, quando uma série X  tem o mesmo número de dados de Y, e ambas tem a mesma média, se o desvio padrão de X for maior que de Y,  isso indica que os dados em X estão mais afastados da média que em Y.

Estudos estatísticos repetitivos mostram que numa distribuição de dados qualquer, quando o desvio padrão é calculado, temos uma ideia de onde estão localizados os valores da amostra, em torno da média. As conclusões são que:

68,26% dos valores da série (amostra) estão a até 1 desvio padrão de distância da média, isto é, estão entre  X - S   a   X + S

95,44% dos valores da série (amostra) estão a até 2 desvios padrão de distância da média, isto é, estão entre  X - 2S   a   X + 2S

99,73% dos valores da série (amostra) estão a até 3 desvios padrão de distância da média, isto é, estão entre  X - 3S   e   X + 3S

.
Imaginemos uma série estatística (amostra) relativa a alguma medida de uma população, peso dos alunos, por exemplo. Imaginemos que a média dessa amostra seja X = 100kg e desvio padrão S = 10Kg. De acordo com as afirmações acima, podemos inferir sobre a população, a partir da amostra selecionada, que:

68,26% dos alunos da amostra têm pesos entre 90kg (100 - 10) e 110kg (100 + 10)

95,44% dos alunos da amostra têm pesos entre 80kg (100 - 2 x 10) e 120kg (100 + 2 x 10)

99,73% dos alunos da amostra situam-se entre 70kg (100 - 3 x 10) e 130kg (100 + 3 x 10)
.

A figura abaixo mostra a curva normal e ilustra bem que vimos acima:


.

Veremos na lição seguinte a importância dessa curva normal e do desvio padrão no cálculo do tamanho da amostra e na interpretação do resultado de uma pesquisa quantitativa.

.

Nenhum comentário:

Postar um comentário