terça-feira, 20 de outubro de 2015

Domínio e declínio (?) do SPSS

Na Faculdade de Medicina da Universidade de Coimbra, o ensino da Bioestatística a alunos dos mestrados integrados de Medicina e Medicina Dentária tem vindo nos anos recentes a distanciar-se do ensino do SPSS.  Ainda é esse o software que recomendamos como preferencial aos nossos alunos, mas nas aulas focam-se mais os processos de decisão e de interpretação de resultados (que, a par da teoria estatística, sempre foram a componente principal das cadeiras de Bioestatística) do que como navegar nos menus do SPSS. Essa última parte, sendo importante, tem sido gradualmente deixada mais a cargo dos alunos, com a ajuda de materiais de apoio.

Há algumas razões para isso: 1) a cada geração, a relação com os computadores é mais íntima; 2) os programas evoluem rapidamente, os princípios do pensamento estatístico e da Medicina baseada na evidência não; 3) menos tempo das aulas dedicado a software significa mais tempo que se pode investir a incrementar espírito crítico e 4) o SPSS está rapidamente a perder influência. Quanto às primeiras três razões, são meras opiniões emitidas pelo autor destas linhas. Já a perda de influência do SPSS é bem ilustrada no gráfico seguinte (fonte), que mostra o número de artigos publicados (na verdade, número de hits no Google Scholar), por ano, desde 1995, usando diferentes programas que permitem fazer análise de dados:

Claramente o SPSS lidera, mas o número de artigos publicados está a diminuir de forma rápida. Também a perder influência neste sentido tem-se o SAS. Logo atrás, mas com o número de hits no Google Scholar a aumentar, aparece o R, que neste momento é o software usado para o ensino da Bioestatística no curso de Engenharia Biomédica. O gráfico seguinte é idêntico ao anterior, mas para melhor visulização dos novos contenders excluem-se dados relativos ao SPSS e ao SAS (a fonte é a mesma):

A continuada perda de domínio por parte do SPSS, a par da consciência aguda de que o ensino da Estatística não é o ensino de um software, tem levado a discussões no seio do Laboratório de Bioestatística. O ensino clássico de linguagens de programação como o R implica uma curva de aprendizagem maior que o SPSS (exigindo conhecimentos a priori que é duvidoso que um aluno típico que entre em Medicina ou Medicina Dentária tenha). O uso de linguagens como R traz vantagens muito claras, como a possibilidade da criação de scripts que asseguram maior reprodutiblidade de análise. Por outro lado, o uso de um software como o SPSS distancia o utilizador do pensamento estatístico: trata-se de uma blackbox sofisticada que tem a qualidade e o defeito de fazer exactamente o que o utilizador pedir. É muito fácil clicar apenas num botão e obter-se resultados, porém perde-se noção dos processos que estão envolvidos. Se haverá uma forma de compatibilizar os conhecimentos à entrada do curso com o ensino eficaz de Bioestatística operacionalizada numa linguagem como o R é neste momento, para nós, um problema em aberto. Se será esse o caminho a seguir é um tema de discussão. Colocar o foco no pensamento estatístico e não no software é a garantia de que os alunos sairão mais preparados.

As duas imagens acima foram retiradas do artigo The Popularity of Data Analysis Software, escrito por Robert Muenchen, o autor de R for SAS and SPSS Users. Uma outra imagem que se pode encontrar nesse artigo é a seguinte, em que se mostra o número de trabalhos analíticos no site Indeed.com, segmentados por software de análise. Vale a pena consultar o artigo para ver as tendências de uso de cada linguagem.
Nota: As opiniões emitidas neste post são apenas isso - meras opiniões - do abaixo assinado.

2 comentários:

  1. Só para lembrar que a Bioestatística do Mestrado Integrado em Eng. Biomédica também está sob a alçada do Laboratório de Bioestatística e que a opção de explorar R é consciente e resultante das discussões internas.

    ResponderEliminar
  2. O SPSS é uma ferramenta fácil de usar pela sua interface. O grande problema, seja qual for a preferência, para qualquer software, é mesmo saber o que se quer fazer, i.e., qual é a hipótese. Muitas vezes, mais do que o teste e a ferramenta estatística, a questão prende-se em saber organizar dados e ideias. (opinião)

    ResponderEliminar