MÉTODOS ESTATÍSTICOS NA ANÁLISE DE DADOS GENÔMICOS
Aluno de Iniciação Científica: Deisy Morselli Gysi (PIBIC/UFPR-TN)
Curso: Estatística
Orientador: Suely Ruiz Giolo
Departamento: Estatística
Setor: Ciências Exatas
Palavras-chave: Modelos de Regressão Logística , Análise de Componentes Principais , Marcadores Genéticos
Área de Conhecimento: 10202005 - ESTATÍSTICA
A genotipagem de uma grande quantidade de indivíduos pode ser realizada hoje de forma veloz, eficaz e não muito onerosa. Como consequência, vem ocorrendo um aumento significativo no volume desse tipo de dados, havendo com isso a necessidade de que estes sejam processados e analisados de forma confiável. Análises realizadas com informações do genoma humano podem auxiliar, por exemplo, na escolha de tratamentos ou de medidas paliativas. Nesse contexto, é analisado neste trabalho um estudo caso controle sobre Artrite Reumatóide no qual se tem disponível uma grande quantidade de marcadores genéticos do tipo Single Nucleotide Polymorphism (SNP). Um dos objetivos desse estudo é o de investigar quais destes SNPs apresentam associação com a Artrite Reumatóide possibilitando, assim, a identificação de genes com potencial conexão com esta doença. Para essa finalidade fez-se uso neste trabalho dos modelos de regressão logística. Anterior a aplicação desses modelos foi realizada, contudo, uma limpeza dos SNPs a fim de remover aqueles que não estavam atendendo à alguns critérios, dentre eles o equilíbrio de Hard-Weiberg. Após tal limpeza, os três possíveis genótipos associados a cada um dos SNPs remanescentes foram codificados como 0, 1 e 2 (homozigoto com maior frequência alélica, heterozigoto e homozigoto com menor frequência alélica, respectivamente). Análise de componentes principais foi então realizada com base nesses SNPs a fim de identificar possíveis ancestrias. Finalmente, para cada SNP foi ajustado um modelo de regressão logística contendo como covariáveis as seis primeiras componentes principais obtidas, a presença do alelo de risco em DRB1 (0 se ausência de alelos de risco, 1 se um alelo de risco e 2 se dois alelos de risco), o SNP de interesse e a interação entre o SNP e o alelo de risco. No cromossomo 6 foram encontrados 166 SNPs associados com a Artrite Reumatóide (p-valor ≤ 10-4). Tais SNPs estão localizados na região HLA (Human Leukocyte Antigen), o que vem a corroborar com a literatura, uma vez que a Artrite Reumatóide é uma doença autoimune multifatorial, e que parte dela estaria, portanto, associada à esta região.