Table Of ContentUNIVERSIDADE DE LISBOA
FACULDADE DE CIÊNCIAS
DEPARTAMENTO DE ESTATÍSTICA E INVESTIGAÇÃO
OPERACIONAL
Métodos Estatísticos para análise
de Y-STRs
em Genética Forense
Cláudia Isabel Vieira da Silva
Mestrado em Bioestatística
2011
UNIVERSIDADE DE LISBOA
FACULDADE DE CIÊNCIAS
DEPARTAMENTO DE ESTATÍSTICA E INVESTIGAÇÃO
OPERACIONAL
Métodos Estatísticos para análise
de Y-STRs
em Genética Forense
Cláudia Isabel Vieira da Silva
Tese orientada por Prof. Maria Antónia Amaral Turkmann
Mestrado em Bioestatística
2011
Resumo
Resumo
A implementação dos marcadores de DNA nas ciências forenses consistiu no maior
avanço nesta área nos últimos vinte anos. Os fenómenos de mutação e recombinação
genética contribuem para uma grande diversidade genética, o que se traduz no facto de
todos os indivíduos, com excepção de gémeos verdadeiros, apresentarem sequências de
DNA diferentes entre si, mas invariváveis em todas as suas células. Estas características
permitem a sua aplicação na área forense em investigações criminais, relações de
parentesco, imigração, pessoas desaparecidas em acidentes de massa e estudos
históricos\antropológicos. Nos últimos dez anos os marcadores de DNA específicos dos
indivíduos do sexo masculino, Y-STRs, foram estudados e aplicados em diferentes
laboratórios na área forense. Estes marcadores permitem a identificação das linhagens
paternas do indivíduos e esta informação pode ser de grande importância nos casos de
abuso sexual e de investigação de parentesco. No entanto a sua correcta aplicação nos
casos do Serviço de Genética e Biologia Forense implica a implementação de um
método científico adequado para avaliar a probabilidade de coincidência de dois perfis
genéticos.
Para este objectivo foi implementado um kit de estudo de Y-STRs, designado por
AmpFlSTR® Yfiler™ (Applied Biosystems), previamente desenvolvido e validado para
a área forense e aplicado em 197 pares pai\filho, provenientes de uma base de dados da
população de referência do Sul de Portugal. Este estudo permitiu realizar inferências
populacionais, estimar taxas de mutação da linha germinal paterna e efectuar cálculos
de probabilidade de coincidência de perfis genéticos (matching probabilities) em
diferentes tipos de casos estudados. As inferências populacionais foram realizadas com
diferentes conjuntos deY-STRs, designadas por Haplotipo mínimo, Haplotipo Estendido
e Haplotipo completo, de forma a verificar qual o conjunto de Y STRs que permite
obter a maior diversidade genética
A análise com os diferentes conjuntos de haplótipos revelou a presença de 171, 183 e
191 haplotipos diferentes, correspondendo a diversidades genéticas de 0.6411, 0.6403 e
0.6508.
No que diz respeito à metodologia aplicada recorrendo à formulação bayesiana,
verificou-se que a metodologia recorrendo à distribuição a priori Beta permite estimar
Cláudia Isabel Vieira da Silva iii
Resumo
valores de taxas de mutação mais próximos dos valores referenciados por outros
autores, disponíveis no site www.yhrd.org. O valor mais baixo da taxa de mutação
obtido foi de 6.010-4 (5.747-4 – 3.242-4 ) para o marcador DYS438.
Estes resultados contribuiram para a estimativa das probabilidades de coincidência de
dois perfis genéticos. Estes cálculos foram efetuados recorrendo a diferentes
metodologias, nomeadamente, método frequencista, método de “haplotype survyeing” e
método de Charles Brenner.
Os resultados obtidos com as diferentes metodologias, permitiram concluir que a
metodologia “Haplotype Surveying” é presentemente a mais adequada para aplicação na
área forense como actualmente está implementada.
Palavras chave:Y-STRs, matching, germline mutation, Likelihood ratio.
Cláudia Isabel Vieira da Silva iv
Abstract
Abstract
DNA analysis has been the greatest technological advance in forensic science in the past
twenty years. Due to mutation and recombination no two persons, except true twins,
have the same DNA sequence, wich enables to determine DNA sequence in every
biological sample, and this knowlodge can be used in the investigation of crime, kinship
relationships, immigration, missing persons, mass disasters and historical cases. In the
last ten years, among DNA markers with forensic interest, a few with potencial to
identify male –specific DNA, Y-STRs, were described and implemented in most
forensic genetic laboratorys. These markers are very important since they contribute to
identify male lineages and this information can be invaluable in cases of sexual assault
and in kinship testing, as well as in anthropological and population genetics studies.
However to apply Y-STRs in Forensic Genetics Service from National Institute of
Legal Medicine, it is convenient to have a scientific method to analyse and evaluate the
evidential strength of a Y-haplotype match.
For this purpose, a 17 locus microsatellite kit, AmpFlSTR® Yfiler™ (Applied
Biosystems), previously developed and validated for forensic cases, was adopted in a
197 father son\pairs south Portugal reference database, in order to make population
inferences, Y-STR germline mutation rates estimation, and matching probabilities
evaluations. Population inferences were done with different sets of Y STRs markers,
classified as Complete Haplotype, Extended Haplotype and Minimal Haplotype, in order
to study which set can give the strongest genetic diversity.
A total of 171,183, 191 haplotypes were observed when analysed the Minimal
Haplotype, Extended Haplotype and Complete Haplotype, respectively, corresponding
to genetic diversity 0.6411, 0.6403 and 0.6508.
The locus specific mutation rates were estimated with Bayesian formulation, and the
best approximation was obtained with a priori Beta distribution.
These results contributed to estimate matching probabilities in different kind of cases,
kinship and criminal ones, with three distinct methodologies, frequencist, haplotype
surveying and Brenner’s, in order to distinguish the best one to apply in the laboratory.
Keywords:Y-STRs, haplotype matching, germline mutation, Likelihood ratio.
Cláudia Isabel Vieira da Silva v
Agadecimentos
Agradecimentos
À Prof. Maria Antónia Amaral Turkman pelo seu interesse neste trabalho de
dissertação, e por todo o apoio dispensado na execução deste trabalho.
Ao Prof. Jorge Costa Santos, Director do Instituto Nacional de Medicina Legal IP,
Delegação do Sul, pelo seu apoio e interesse na realização deste trabalho, pela
autorização na disponibilização dos dados, sem os quais este trabalho nunca teria sido
possível.
À Dra Rosa Maria Espinheira, Directora do Serviço de Genética e Biologia Forense da
delegação do Sul do INML IP, pelo seu interesse neste trabalho, pelo apoio e confiança
e pela disponibilização imediata dos dados do serviço para a realização deste trabalho.
Aos meus pais Fernando de Jesus Silva e Maria Isabel Lopes Vieira, a quem devo quase
tudo na vida, pelo incentivo e apoio à minha formação contínua, pela compreensão dos
muitos fins de semana ausentes e por estarem sempre presentes.
Aos meus amigos, sobretudo aos que se disponibilizaram desde o início para a leitura
das extensas páginas deste trabalho, bem como a todos os outros que aceitaram as
minhas muitas recusas para saídas e convívios, pelo apoio e carinho nos meus
momentos de dúvida e incerteza, sem cuja força e incentivo, atingir a meta teria sido
muito mais difícil.
Cláudia Isabel Vieira da Silva vi
Conteúdo
Conteúdo
Resumo...........................................................................................................................iii
Abstract...........................................................................................................................v
Agradecimentos.............................................................................................................vi
Conteúdo.......................................................................................................................vii
Lista de Tabelas.............................................................................................................ix
Lista de Figuras.............................................................................................................xi
Abreviaturas e Definições............................................................................................xii
Capítulo 1........................................................................................................................1
1. Introdução...............................................................................................................1
A evolução da Genética Forense..............................................................................1
A Estrutura do Genoma Humano e Hereditariedade................................................2
Classes de Polimorfismos de DNA..........................................................................4
O cromossoma Y......................................................................................................6
Vantagens da aplicação dos marcadores do cromossoma Y..................................10
Desvantagens da utilização do cromossoma Y.......................................................11
Análise dos resultados do Cromossoma Y.............................................................12
Taxas de Mutação dos Loci do cromossoma Y......................................................13
Valorização estatística dos resultados....................................................................14
Objectivo do Trabalho............................................................................................15
Capítulo 2......................................................................................................................17
2. Material e Métodos...............................................................................................17
Estudo Biológico....................................................................................................17
Amostras Biológicas...............................................................................................17
A extracção de DNA...............................................................................................17
Amplificação e Análise dos Y-STRs......................................................................18
Análise dos produtos amplificados.........................................................................19
Análise Estatística..................................................................................................20
Análise Estatística Populacional.............................................................................20
Estudo das Taxas de Mutação................................................................................27
Modelo de Probabilidade para as taxas de mutação...............................................28
Cláudia Isabel Vieira da Silva vii
Conteúdo
Estimativa do número de mutações assumindo uma distribuição de Poisson........34
Probabilidade de Matching.....................................................................................39
Princípios da probabilidade de transmissão alélica................................................39
Metodologia aplicada nos cálculos da probabilidade de paternidade em processos
com trio Presumível Pai(A)/Mãe(B)/Filho(a) (C)..................................................41
Aplicação dos Y-STRs nos casos de investigação de parentesco..........................43
A utilização dos Y-STRs nos casos criminais........................................................46
Metodologias para estimativa da frequência dos haplótipos na população............49
Método das Frequências.........................................................................................49
Método – Haplotype Surveying..............................................................................50
Método de Charles Brenner....................................................................................51
Análise de casos .....................................................................................................53
Capítulo 3......................................................................................................................64
3. Resultados.............................................................................................................64
Análise estatística populacional..............................................................................64
Análise das taxas de mutação.................................................................................70
Análise de casos Práticos........................................................................................77
Capítulo 4......................................................................................................................82
4. Conclusões.............................................................................................................82
5. Bibliografia............................................................................................................87
Cláudia Isabel Vieira da Silva viii
Lista de Tabelas
Lista de Tabelas
Tabela 1- Y-STRs usados actualmente na rotina dos casos forenses incluídos no AmpFlSTR®Y filer® PCR amplification kit,
estrutura da unidade de repetição e nº possível de repetições em cada um destes locus................................................................9
Tabela 2- Valores da taxa de mutação e respectivos intervalos de confiança para os marcadores Y-STRs em estudo obtidos no
site www.yhrd.org...........................................................................................................................................................................31
Tabela 3– Informação relativa ao nº de mutações obtido em cada marcador genético e respectiva extrapolação para a amostra
em estudo........................................................................................................................................................................................36
Tabela 4– resultados obtidos com os marcadores autossómicos..................................................................................................57
Tabela 5- resultados obtidos com Y-STRs.....................................................................................................................................58
Tabela 6- resultados obtidos com os marcadores autossómicos para o caso 2.............................................................................61
Tabela 7- resultados obtidos com os..............................................................................................................................................61
Tabela 8– resultados obtidos com os Y-STRs................................................................................................................................62
Tabela 9- resultados obtidos com os Y-STRs para o caso 4..........................................................................................................63
Tabela 10- Tabela do nº de características alélicas detectadas em cada Y-STR,.........................................................................64
Tabela 11--Resultados da Diversidade Genética em cada locus...................................................................................................66
Tabela 12- Resultados da Diversidade Genética média................................................................................................................66
Tabela 13- representação do nº médio de diferenças entre indivíduos uando estudados com diferentes conjuntos de Y-STRs e
respetiva Diversidade Haplótipica.................................................................................................................................................67
Tabela 14- haplotipos partilhados quando usados os Y-STRs do Haplotipo Mínimo..................................................................69
Tabela 15- haplotipos partilhados quando quando usados os Y-STRs do Haplotipo Estendido.................................................69
Tabela 16- haplótipos partilhados quando quando usados os Y-STRs do Haplotipo Completo..................................................70
Tabela 17– Valores dos parâmetros a priori e a posteriori para a priori Uniforme (1,1) e uniforme (1/2,1/2)..........................71
Tabela 18- Valores estimados para o valor médio da taxa de mutação (µ), variância e respectivos intervalos de credibilidade
com recurso à metodologia Bayesiana, com uma distribuição a priori uniforme (1,1)...............................................................71
Tabela 19- Valores estimados para o valor médio da taxa de mutação (µ), variância e respectivos intervalos de credibilidade
com recurso à metodologia Bayesiana, com uma distribuição a priori uniforme (1/2,1/2).........................................................72
Tabela 20-– valores dos parâmetros α, β, e dos Hiperparâmetros A e B das distribuições a priori e a posteriori beta...............73
Tabela 21- Valores estimados para o valor médio da taxa de mutação (µ), variância e e respectivos intervalos de credibilidade
com recurso à metodologia bayesiana, com uma distribuição a priori Beta................................................................................73
Tabela 22– valores dos parâmetros g,h, e dos Hiperparâmetros G e H........................................................................................75
Tabela 23-– Registo dos valores estimados para a taxa de mutação e respectivos intervalos de confiança quando aplicada a
distribuição a priori Gama usando o modelo de Poisson..............................................................................................................76
Cláudia Isabel Vieira da Silva ix
Lista de Tabelas
Tabela 24--cálculo da probabilidade de ocorrer coincidência de perfis genéticos presumindo a hipótese H em cada um dos
0
casos de investigação de parentesco em estudo.............................................................................................................................77
Tabela 25- Probabilidade de encontrar na população um indivíduo com um perfil coincidente com o dos filhos intervenientes
[ ]
nos processos de investigação de parentesco PY|H ,I .........................................................................................................78
1
Tabela 26-resultados do LR com as taxas de mutação obtidas no site www.yhrd.org................................................................78
Y
Tabela 27- resultados do LR recorrendo às taxas de mutação estimadas recorrendo à metodologia Bayesiana......................79
Y
Tabela 28- valores do LR obtidos com o software “Familias”.....................................................................................................79
A
Tabela 29– resultados finais do valor de LRC, resultantes da multiplicação do LR dos marcadores autossómicos com as
diferentes possibilidades de LR do cromossoma Y........................................................................................................................80
[ ] [ ]
Tabela 30– resultados dos valores de probabilidade PY|H ,I e PY|H ,I , para os casos práticos criminais em
0 1
estudo.............................................................................................................................................................................................81
Tabela 31– resultados do LR recorrendo às diferentes metodologias para estimação das frequências dos Haplótipos...........81
Y
Cláudia Isabel Vieira da Silva x
Description:permitem a sua aplicação na área forense em investigações criminais, relationships, immigration, missing persons, mass disasters and historical