CyberPhilosophy: BioEstatística e Matemática

Na aula de apresentação do módulo de BIOESTATÍSTICA da disciplina de Epidemiologia e Bioestatística, enunciei uma tese fundamental:

Tese I: A BioEstatística goza de uma certa autonomia em relação à matemática, em geral, e à estatística matemática, em particular.

Com o enunciado desta tese, pretendia exorcizar o «papão da matemática», de modo a tornar a aprendizagem da Bioestatística mais atractiva e acessível, optando desde logo pela integração da análise estatística dos dados biológicos numa perspectiva de investigação biomédica ou mesmo da saúde (Unidade 1). Aleguei a favor desta tese mais outras três teses:

Tese II: A expressão Bio-estatística é formada por uma palavra base — estatística —, à qual se antepõe o prefixo Bio, dando origem à palavra bioestatística. Isto significa literalmente que a bio-estatística é a aplicação re-elaborada e reformulada de conhecimentos e de técnicas estatísticas, provenientes do ramo da matemática chamado estatística, à solução de problemas biológicos, cuja especificidade e realidade própria não podem ser negligenciadas. Ora, um tal conceito parece implicar a noção preguiçosa de que a estatística seja apenas um conjunto de conhecimentos já preparados e dados de antemão que são, posteriormente, importados (metodologia importada) pelas ciências biológicas quando trabalham com dados mensuráveis e precisam de resolver problemas recorrendo às técnicas estatísticas. Um tal tipo de concepção é pouco interessante para a investigação biomédica!

Tese III: Por conseguinte, é preciso compreender o primado do prefixo Bio na expressão Bio-estatística. Com efeito, ele não só antecede a palavra estatística, como também lhe impõe determinadas regras e princípios gerados nas próprias ciências biológicas, biomédicas e médicas enquanto um dos continentes do conhecimento científico. Assim, este primado duplamente definido permite e possibilita ver a estatística como um instrumento ou ferramenta, ou melhor, como uma linguagem matemática susceptível de ser utilizada, de modo adequado, criativo e autónomo, pelas ciências biomédicas quando pretendem resolver os problemas que colocam rigorosamente e testar hipóteses que formulam para os resolver, no âmbito de um determinado tipo de estudo previamente delineado e planeado.

Esta prática de «recorrer» à estatística quando se lida com «situações de incerteza» não deve ser encarada como uma prática interdisciplinar, no sentido de Althusser (1976), mas antes como um laço orgânico que une a biologia e a estatística, semelhante ao que liga a física e a matemática, desde os tempos de Galileu, numa síntese concreta de conhecimentos teóricos e empíricos. A estatística é assim vista como uma linguagem «formal» capaz de trazer luz e rigor à biologia, ajudando-a a recolher, organizar e sumariar dados mensuráveis, testar hipóteses e tomar decisões em condições de incerteza.

Tese IV: Ora, esta aliança interna entre a biologia e a estatística é de tal modo orgânica que a biologia, à medida que os seus conhecimentos crescem e progridem em termos científicos, pode adaptar e criar os seus próprios procedimentos estatísticos e sobretudo teóricos, de resto os mais adequados para apreender a essência dos fenómenos que estuda, à luz do paradigma da Nova Síntese, a perspectiva que dá unidade às ciências biológicas. Os diversos estudos epidemiológicos e sobretudo genéticos e neurobiológicos exemplificam a criatividade intrinsecamente matemática, teórica e experimental das ciências biomédicas.

Outra maneira mais radical de mostrar a força persuasiva deste conjunto de teses provisórias seria explicitar as diferenças entre a matemática enquanto linguagem absolutamente formal e a estatística, mais preocupada com a verdade factual dos enunciados. Sem questionar a natureza matemática dos cálculos estatísticos, estas diferenças apontam para uma autonomia relativa mas substancial da estatística, sobretudo quando usada nas mais diversas áreas do conhecimento científico e humano, em relação à matemática pura, a qual, desde o projecto logicista, tenta «lutar» pela sua autonomia em relação à lógica formal ou simbólica, sem, no entanto, ter conseguido vedar o «assédio» da lógica simbólica, de resto bem presente no raciocínio matemático puro. Para pôr termo a este confronto entre matemáticos conservadores e filósofos tradicionais, Bertrand Russell (1988, 1983) afirma uma tese impopular, segundo a qual a matemática e a lógica formal são uma só e mesma coisa, ou seja, «matemática e lógica são idênticas», sobretudo pelo facto de preocuparem-se exclusivamente com a forma, deixando de lado o conteúdo, fundamental ao modo de pensar estatisticamente a realidade biológica variável.
Geralmente, são estabelecidos dois tipos de diferenças entre a matemática e a estatística: a primeira diz que a matemática é dedutiva, enquanto a estatística é indutiva, e a segunda afirma que, em regra geral, o que se conhece em estatística é desconhecido na matemática e vice-versa. Um exemplo destas diferenças seria a recta de regressão.
A tese geral que procurámos defender, a saber — a de que a bioestatística é relativamente independente da matemática, no sentido de poder ser compreendida e utilizada sem recorrer a conhecimentos matemáticos, não quer dizer que a matemática seja absolutamente desnecessária. Aliás, a matemática é uma das maravilhas do pensamento racional, abstracto, formal e universal, isto é, da racionalidade ocidental. Dado ser infinitamente mais que o conhecimento pessoal, a ciência consiste naquilo que pode ser comunicado de uma pessoa a outra pessoa: é um empreendimento intersubjectivo. Daqui resulta que os meios disponíveis da comunicação humana determinam — todos eles, cada um ao seu nível — as formas e, de certo modo, o conteúdo das mensagens e dos textos que formam o conhecimento humano e científico. Para ser capaz de exprimir-se numa linguagem universal inequívoca, a ciência deve aperfeiçoar constantemente a sua própria linguagem, começando por introduzir conceitos elaborados teoricamente e definir a seu sentido conceptual lá onde eles seriam apenas palavras de uma língua — a nossa língua materna ou outra — que usamos para comunicar uns com os outros, em contextos práticos da vida quotidiana. No entanto, a linguagem científica não se limita a apropriar-se conceptualmente da língua natural. A ciência deve formalizar essa linguagem, de modo a transformá-la em matemática. Cada palavra da linguagem científica deve ser definida com mais precisão e o seu sentido específico deve encontrar-se prefixado nas suas relações com outras palavras, em função de um determinado sistema teórico. Na ciência, as palavras funcionam como conceitos e as relações que os conceitos estabelecem entre si podem e devem adquirir a força de axiomas, de modo a que dois cientistas possam comunicar e trocar mensagens inequívocas.
Ora, a linguagem ideal da comunicação científica encontra-se, como já sabiam Platão, Galileu, Descartes e sobretudo Leibnitz, na linguagem matemática, dado esta ser, pela sua própria essência, inequívoca e universalmente válida, sem, no entanto, tornar, por si mesma, a linguagem mais verdadeira. Daqui resulta que, apesar da linguagem matemática ser uma característica desejável da ciência, sobretudo da ciência paradigmática, ela não é essencial: a linguagem natural pode ser imperfeitamente consensível, mas é infinitamente mais rica em vocabulário do que a álgebra, como demostraram a contra-gosto os lógicos do Círculo de Viena. A lógica formal não resolveu o problema dos «fundamentos da matemática», os quais revelam ambiguidades e paradoxos. A própria coerência lógica ou logicidade é uma condição necessária para a comunicação intersubjectiva, mas não é uma condição suficiente para o discurso científico, visto que nada diz sobre o conteúdo das mensagens cuja forma restringe. Apesar dos constrangimentos referidos, a comunicação científica não tem valor se não for expressa em linguagem precisa (conceptual e matemática) e se não tiver uma sólida estrutura lógico-filosófica.
Para compreender o conceito de matemática como uma gramática forte do discurso científico, daremos um exemplo. Suponha que «observamos 750 cisnes negros e 250 cisnes brancos que voam pelo céu» — uma observação grata a Konrad Lorenz. A nossa mensagem pode virtualmente ser registada ou dita de diversas maneiras, para além da já referida:

· «Dos 1000 cisnes que observamos, 75% são negros e 25% são brancos».
· «A proporção de cisnes negros para cisnes brancos é de três para um».
· «A probabilidade de qualquer cisne dado ser negro é de 0,75».
· «Se b é o número de cisnes brancos e n é o número de cisnes negros, então n + b = 1000 e n = 3b».
· Ou, por alguma razão teórica esotérica, poderíamos finalmente dizer o facto notável de que: (equação omitida).

E assim sucessivamente. Este exemplo mostra claramente que a linguagem matemática, dada a sua clareza e a sua universalidade, é o veículo ideal para a comunicação científica. Por um lado, porque a ciência é conhecimento público, e, por outro lado, porque as mensagens matemáticas podem ser simbolizadas, manipuladas e transformadas segundo regras precisas, sem perda de sentido (duas vantagens, portanto). As regras da aritmética, da álgebra, da trigonometria, do cálculo, da teoria dos conjuntos ou da teoria da função analítica permitem-nos gerar, no sentido de Chomsky, uma infinidade de declarações inequívocas, de vários graus de complexidade, todas elas logicamente equivalentes, como demonstrou H. Putnam, à mensagem original.
No Prefácio do seu livro «Statistics in Clinical Practice», David Coggan (2003) escreveu:

«The bad news for many medical students and doctors is that these days one cannot practice medicine without some understanding of statistics». E, imediatamente a seguir, acrescenta: «The good news is that clinicians need not be mathematicians to use statistics».

Ora, concordo absolutamente com David Coggan. Actualmente, não só os estudantes de medicina e os médicos, mas também os restantes profissionais de saúde, em particular os estudantes de enfermagem e os enfermeiros, precisam de adquirir conhecimentos fundamentais de bioestatística, para poderem prestar cuidados de saúde excelentes e, sobretudo, fazer investigação em enfermagem. Mas, como foi dito exaustivamente ao longo deste curso de Bioestatística, os estudantes de enfermagem e os enfermeiros, tal como os estudantes de medicina e os médicos, não precisam ser «matemáticos» para utilizar, de modo excelente, seguro e competente, as técnicas estatísticas. Estudar enfermagem, exercer a enfermagem e, sobretudo, fazer pesquisa em enfermagem de qualidade são «tarefas» que requerem conhecimentos de bioestatística mais aprofundados do que aqueles que leccionámos neste breve curso de Bioestatística. Assim, por exemplo, os métodos não paramétricos, alguns dos quais apenas referidos na Unidade 14, são altamente recomendados em determinadas pesquisas em saúde. Infelizmente, por razões de ordem temporal, não pudemos avançar mais no conhecimento destes testes não paramétricos, bem como dos testes paramétricos, e, a partir dessa base, aprofundar os conhecimentos relativos às tabelas de contingência e ao modelo linear simples, abrindo gradualmente as «portas» à análise multivariada a todos os níveis de mensuração. Este conhecimento mais alargado da Bioestatística exigiria um aprofundamento, sempre renovado, das Unidades Programáticas, de modo a introduzir e integrar novos horizontes conceptuais, a partir dos quais seria possível perspectivar, a uma nova luz, a investigação científica, nomeadamente na área da saúde.
Resta-me esperar, sem ansiedade, que saibam fazer uso excelente e generoso dos conhecimentos bioestatísticos adquiridos e que não se esqueçam dos valores em que todos nós fomos educados. Afinal, o ideal do conhecimento racional sempre foi a vida feliz! Sejam felizes! E permitam que os outros sejam também felizes!

(Este é de todos os meus textos bioestatísticos o mais acessível e. por isso, edito-o aqui. Também é o mais filosófico...)

J Francisco Saraiva de Sousa

CyberPhilosophy

quinta-feira, 6 de setembro de 2007

BioEstatística e Matemática

Sem comentários: