Husdyr- og akvakulturvitenskap
Marie Lillehammer disputerte 5. september 2008
Ane Gro Siri Skjelfjord
Genotype by environment interactions have been described for several traits in several species, while few attempts have been made to identify the genes that contribute to such interactions. Identification of genes that interact with the environment could provide a better understanding of the biology behind genotype by environment interactions, as well as cause a higher power of gene detection and affect selection decisions
Detection of gene by environment interactions English language abstract Genotype by environment interactions have been described for several traits in several species, while few attempts have been made to identify the genes that contribute to such interactions. Identification of genes that interact with the environment could provide a better understanding of the biology behind genotype by environment interactions, as well as cause a higher power of gene detection and affect selection decisions. In dairy cattle, genotype by environment interactions have often been described to occur between production traits and environmental conditions, described by the production level. The aim of this thesis was to develop a method to identify genes affecting environmental sensitivity and search for such genes in dairy cattle.
In paper 1, a method to search for gene by environment interactions was developed and tested on simulated data. The gene-effects were modeled by a reaction norm, which is fitted by a random regression on an environmental descriptor. Production was assumed to change linearly with the environment. It was concluded that the random regression model was suitable for detection of gene-effects that interact with an environmental gradient. The method has a higher power to detect genes with re-ranking of allele-effects within the environmental range than genes where the alleles rank the same but differ in scaling over the environmental range.
In papers 2 and 3, the method from paper I was applied to Norwegian dairy cattle data. The environment was described by the production level which was estimated as the herd-year effect (from an initial analysis). Genes affecting the production traits milk yield, protein yield and fat yield were searched for. In paper 2, a genome scan (over all chromosomes except chromosome 6) was conducted. Two out of 5 detected genes affecting milk yield had environmentally dependent effects, while 3 out of 5 genes detected to affect protein yield had environmentally dependent effects. In paper 3, fine mapping of genes was performed on chromosome 6, identifying two genes with environmental sensitive effects on milk yield, in addition to the previously identified gene ABCG2 that seems to have environmental sensitive effect on milk yield. Neither in paper 2 or paper 3, genes with environmentally dependent effects on fat yield could be detected.
In paper 4, a dense single nucleotide polymorphism (SNP) marker map was used to search for genes with environmentally sensitive effects in Australian dairy cattle. Production data, consisting of first lactation test-day records for milk yield, fat yield, protein yield, protein percentage and fat percentage were obtained from daughters of 380 bulls, genotyped for 9919 SNP markers. Four different models of gene detection were compared. The results showed that analyzing marker effects on each daughter record was more powerful than estimating sire reaction norms and estimate marker effects on the reaction norm parameters. Accounting for relationships between the genotyped bulls was necessary to avoid a high number of false significants. Significant SNPs were found for all traits under investigation, and 15-50% of the genes detected for each trait had environmentally dependent effects. The detected genes were categorized after their joint effects on production and environmental sensitivity to describe their abilities as selection candidates. Some of the detected genes facilitate selection for robustness, where the most promising selection candidate is located on chromosome 7. This gene facilitates selection for robustness of milk yield, protein yield and fat yield.
Erroneous assumptions about the heterogeneity of residual variance over environments can cause biased estimates of variance components. When the sire model is used to describe genotype by environment interactions, a heterogeneous genetic variance will cause the residual variance to be heterogeneous as well, as 3/4 of the genetic variance is modeled in the residual. In paper 5, different ways to capture a possible heterogeneity of residual variance on simulated data with known variances and real data with unknown variances and a more complex variance structure were explored. When all the heterogeneity in residual variance had a genetic origin, an individual term with a (co)variance matrix restricted to be three times the sire (co)variance matrix could be used to model heterogeneity of residual variance. In this case, using an animal model gave unbiased estimates of the variance components. When some of the heterogeneity in the residual variance had non-genetic origins, models assuming that all heterogeneity had genetic origin gave biased estimates of genetic variance components. One way of modeling heterogeneous residual variance, regardless of origin, is to assume environmental classes, in which the residual variance is homogeneous within each class and heterogeneous between the classes, which removed the bias.
In general, accounting for genotype by environment interactions in gene searches increases the power of gene detection and provides a possibility to detect genes that facilitate selection for robustness, i.e. lower environmental sensitivity. Breeding for robustness would cause animals to be less affected by environmental changes and provide a more predictable production even in changing environments. Robustness is particularly important if animals are bred for multiple production systems or climates, and in sustainable animal breeding programmes. In dairy cattle, the correlation between production and robustness is disadvantageous, while some single genes show an advantageous correlation between production and robustness. The utilization of such single genes as were detected in papers 3 and 4 can be a useful tool when breeding for robust cows.
Key words / ISI database key words: gene mapping; gene by environment interaction; QTL detection; random regression; reaction norms; quantitative trait loci; autosome; dairy cattle; ABCG2; environmental sensitivity; genome scan; selection for robustness; dense SNP marker genotyping; sire model; biased estimation; heterogeneous residual variance
Address as of Sept. 2008: SSB, P.O.Box 8131 Dep, N-0033 Oslo
Påvisning av gen-miljø samspill Norsk sammendrag Hos mange arter er det beskrevet samspill mellom genotyper og miljø for ulike egenskaper. Gener som har forskjellig effekt i ulike miljøer bidrar til slike samspill. Hittil er det gjort få forsøk på å identifisere disse genene. Å påvise gener som virker i samspill med miljøet kan gi en bedre forståelse av biologien bak genotype-miljø samspill. Det kan også bidra til at flere gener blir oppdaget, og påvirke hvilke gener man ønsker å selektere for ved hjelp av markørassistert seleksjon. Hos melkekyr er genotype-miljø samspill ofte beskrevet mellom produksjonsegenskaper og miljø, der miljøet er beskrevet som produksjonsnivå. Målet med denne avhandlingen var å utvikle en generell metode for å identifisere gen-miljø samspill og å lete etter gener hos melkekyr som påvirker kyrnes miljøsensitivitet, dvs hvordan melkekyrnes produksjon endres når miljøet forandres.
En metode for å lete etter gen-miljø samspill ble utviklet i den første artikkelen og testet på simulerte data. Gen-effekter ble beskrevet som en lineær funksjon (reaksjonsnorm) av en kontinuerlig miljøvariabel, estimert ved tilfeldig regresjon. Tilfeldig regresjon er en metode som kan påvise gener som har samspillseffekter med miljø. Gener der samme allel virket positivt i alle miljøer, men størrelsen på gen-effekten varierer med miljø, var vanskeligere å oppdage enn gener der allelene omrangeres slik at det beste allelet i ett miljø er det dårligste i et annet miljø.
I artiklene 2 og 3 ble metoden fra artikkel 1 brukt til å lete etter gen-miljø samspill hos norske melkekyr. Miljøet ble beskrevet som produksjonsnivået i besetningen. Det ble søkt etter gener som påvirket produksjonsegenskapene kg melk, kg protein og kg fett produsert i løpet av første laktasjon. I artikkel 2 ble hele genomet unntatt kromosom 6 undersøkt. To av i alt fem gener som påvirket melkemengde hadde miljøsensitive effekter, mens tre av i alt fem gener som påvirket proteinmengde hadde miljøsensitive effekter. Artikkel 3 tok for seg finkartlegging av gener på kromosom 6 og identifiserte to gener som hadde miljøsensitiv effekt på melkemengden. I tillegg synes genet ABCG2, som tidligere er vist påvirker melkemengde, å ha en miljøsensitiv effekt. Det ble ikke oppdaget gener med miljøsensitiv effekt på kg fett i artikkel 2 eller i artikkel 3.
I artikkel 4 ble det brukt et tett kart over “single nucleotide polymorphism” (SNP) markører for å lete etter gener med miljøsensitive effekter hos australske melkekyr. Produksjonsdata, som bestod av første laktasjons observasjoner av melkemengde, proteinmengde, fettmengde, proteinprosent og fettprosent ble innhentet fra døtre etter 380 okser som var genotypet for 9919 SNP markører. Fire ulike statistiske modeller for å oppdage gener ble sammenlignet. Resultatene viste at å analysere markøreffektene på hver enkelt datter-observasjon førte til at flere gener med effekt ble oppdaget, sammenlignet med å estimere reaksjonsnormer for oksene og estimere markøreffekter på oksenes reaksjonsnorm-parametre. Det var nødvendig å ta hensyn til slektskap mellom de genotypede oksene for å unngå et høyt antall falske positive. For alle egenskapene ble det funnet gener med signifikante effekter, og 15-50% av genene som ble påvist for hver egenskap hadde miljøsensitiv effekt. De påviste genene ble kategorisert ut fra hva slags effekt de hadde både på egenskapen generelt og på miljøsensitivitet, for å beskrive hvordan de enkelte genene egnet seg for seleksjon. Noen av genene som ble oppdaget kan brukes til å selektere for lavere miljøsensitivitet. Dette er ønskelig for å redusere variasjonen i produksjonen i et variabelt eller ukontrollerbart miljø. Det mest lovende genet ligger på kromosom 7. Dette genet kan brukes i seleksjon for å redusere melkekyrnes miljøsensitivitet for melkemengde, proteinmengde og fettmengde.
Feilaktige antagelser angående heterogen residualvarians kan gjøre at de estimerte varianskomponentene ikke er forventningsrette. Når en farmodell blir brukt for å beskrive genotype-miljø samspill, så vil heterogen genetisk varians forårsake heterogen residualvarians, siden ¾ av den genetiske variansen blir modellert i residualen. I artikkel 5 ble ulike måter å modellere heterogen residualvarians på sammenlignet. Metodene ble testet på simulerte data med kjente varianser, og på virkelige data med ukjente varianser og en mer kompleks varians-struktur. Når all heterogenitet i residualvarians skyldtes genetikk, kunne heterogen residualvarians modelleres ved å inkludere en ny parameter i modellen med en (ko)variansmatrise som var bestemt til tre ganger (ko)variansmatrisen til far-komponenten. I dette tilfellet ga en dyremodell forventningsrette estimater av varianskomponentene. For å modellere heterogen residualvarians, uansett årsak, kan miljøet deles i klasser og man antar homogen residualvarians innen hver klasse, men heterogen residualvarians mellom klasser. Dette ga forventningsrette estimater av de genetiske varianskomponentene.
Å ta hensyn til gen-miljø samspill når man skal lete etter nye gener gjør at flere gener blir oppdaget. Dette kan medføre funn av gener som kan brukes til å selektere for lavere miljøsensitivitet. Avl for lavere miljøsensitivitet vil gjøre at dyrenes produksjon er mindre påvirket av endringer i miljøet. Avl for lav miljøsensitivitet gir et mer bærekraftig avlsprogram og er spesielt viktig hvis dyrene skal produsere i ulike produksjonssystemer eller klimaer. Hos melkekyr er korrelasjonen mellom produksjon og miljøsensitivitet uheldig, ved at høy produksjon er korrelert med høy miljøsensitivitet. Noen enkeltgener har imidlertid en negativ korrelasjon mellom produksjon og miljøsensitivitet, og disse er velegnet til å selektere for lavere miljøsensitivitet uten at produksjonen reduseres. Bruken av slike enkeltgener, som ble oppdaget og beskrevet i artikkel 3 og 4, kan bli et nyttig verktøy i avlsarbeidet for lavere miljøsensitivitet.
Nøkkelord til artikkelsøk: gene mapping; gene by environment interaction; QTL detection; random regression; reaction norms; quantitative trait loci; autosome; dairy cattle; ABCG2; environmental sensitivity; genome scan; selection for robustness; dense SNP marker genotyping; sire model; biased estimation; heterogeneous residual variance
Adresse pr. sept. 2008: SSB, Postboks 8131 Dep, 0033 Oslo
Til toppen
Publisert: 15.06.08
Oppdatert: 29.06.09
Utskriftsvennlig versjon
Del med en venn: