Introdução e Objetivo
Atualmente, saúde pública tem sido um dos maiores desafios do século XXI, tema muito discutido nos meios acadêmicos, por ONGs e “governantes”. Esta área engloba os surtos de epidemias, hospitais inadequados para o atendimento de pacientes, atendimento a idosos, taxas de natalidades, peso ao nascer de recém-nascidos entre outros. Assim, na tentativa de criar um modelo estatística para a variável baixo peso ao nascer de recém-nascidos, trabalhou-se com um banco de dados do DATASUS provenientes de um estudo transversal, cross-sectional, que refere-se ao baixo peso ao nascer de recém-nascidos. As informações foram coletadas: da criança, da mãe e do pai, a partir de 680 nascimentos consecutivos. A equipe de estudo que coletou os dados, tentou identificar se características da mãe e do pai estavam associadas ao baixo peso dos recém-nascidos. Neste sentido, objetivou-se neste trabalho, construir e propor um modelo gerado a partir de técnicas de Modelos Lineares Generalizados.
Metodologia
Após Identificar o banco de dados no DATASUS, iniciou-se análises prévias nos progamas SAS e R. Plotou-se gráficos de histogramas e Q-Q Plot para a verificação de qual distribuição de probabilidade se tratava o comportamento dos dados. Realizou-se a verificação de existência de indícios de alguma relação existente entre as covariáveis, comparando-as duas a duas na tentativa de perceber a existência de algumas relações que podem ser modeladas entre a variável resposta com as variáveis preditoras de interesse. Plotou-se as matrizes de dispersão para a variável resposta e as variáveis preditoras coletadas da criança, da mãe e do pai, afim de decidir quais covariáveis seriam mantidas no modelo. Calculou-se a razão entre a Deviance e os graus de liberdade para verificar se o modelo proposto seria um bom candidato para modelar bem os dados. Fez-se análises: dos resíduos, das medidas DFBeta, Leverages, distâncias de Cock, entre outras, para verificar a influências da covariáveis no modelo.
Resultados
Apresentando média aproximadamente zero e desvio padrão quase igual a um, pode-se afirmar que há indícios que os resíduos deviance padronizados seguiam distribuição normal. Baseando-se nas matrizes de dispersão, todas a variáveis analisadas estavam relacionadas com a variável resposta. Na comparação entre as variáveis duas a duas decidiu-se que a covariável mantida seria Idade Gestacional. Verificou-se a existência de uma relação direta entre a variável resposta e as variáveis Altura da Mãe e Peso Antes da Gravidez. A idade da mãe não influenciou no peso ao nascer dos bebês. Já com o aumento do número de cigarros que a mãe fumava, fez o peso da criança diminuir. Nas matrizes de dispersão relacionadas ao pai, identificou-se uma relação direta entre a variável resposta e a variável Altura do Pai. Percebeu-se também nos gráficos, homocedasticidade e comportamentos não tendenciosos nos resíduos. No gráfico: Predicted value vs Std Deviance Residual, notou-se que há vários valores extremos. Já no gráfico Preditor Linear pelos Resíduos elevados ao Quadrado, não se notou tendência. Desta forma, pode-se dar prosseguimento no ajuste do modelo. Como pode-se notar, a variável eta2 foi considerada significativa no modelo, porém, não houve muita diferença nas estatísticas Deviance e Pearson X2. Analisando-se os Leverages, vê-se que poucas observações realmente se destacaram, graficamente, das demais. No caso das Distâncias de Cook notou-se que visualmente as observações 60 e 506 se distanciaram das demais observações. Pela medida DFBeta, percebeu-se que as observações, visualmente, 9, 60 e 505 se destacaram. Mesmo o modelo completo tendo dado um bom ajuste, percebeu-se que algumas variáveis deveriam ser retiradas do modelo sem prejudica-lo, ou seja, ao se realizar a Análise de Deviance, chegou-se à conclusão de que as variáveis: Idade do Pai, Número de Cigarros que o Pai Fuma, Escolaridade do Pai e a Idade da Mãe, não foram relevantes no modelo. Considerando o modelo proposto tem-se que todas as variáveis preditoras (com exceção do Número de Cigarros - mãe) são influentes, positivamente, sobre a variável resposta, isso é, o aumento no valor de tais variáveis implica no aumento da variável resposta. Isso quer dizer que o aumento na Idade Gestacional, Altura do Pai, Altura da Mãe, Peso da Mãe (antes do nascimento) implica no aumento do Peso ao Nascer da criança. Por outro lado, a variável Número de Cigarros (mãe) contribuiu de forma negativa para a variável resposta.
Considerações Finais
Uma ferramenta importantíssima para modelar dados de baixo peso ao nascer em recém nascidos, são os Modelos Lineares Generalizados, pois, suas aplicações são imprescindíveis para se poder tomar a melhor decisão possível, otimizando e direcionando investimentos escassos, de maneira correta e, portanto, proveitosa. Assim, foi possível identificar neste trabalho a existência de algumas relações que podem ser modeladas entre a variável resposta e as variáveis preditoras aqui interessadas.