Bilgi

Bağlantı ve LD: nicel mi, nitel mi?

Bağlantı ve LD: nicel mi, nitel mi?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Anladığım kadarıyla "genetik bağlantı" kavramı aşağıdaki gibi nicel biçimde ifade edilebilir:

Y ile yakın genetik bağlantıda predispozan bir gen X bulundu.

Ve bu bağlantı dengesizliği (LD), hamile olmak gibi bir kalitedir, ya LD'desiniz ya da değilsiniz:

Y ile yakın genetik bağlantıda ve Z ile bağlantı dengesizliğinde predispozan bir gen X bulundu.

Bu doğru mu?


Bağlantı dengesizliği (LD), genotipler arasında rastgele olmayan bir ilişki veya korelasyon olduğunda ortaya çıkar. Not Korelasyon kelimesini kullandım; bu nicel bir özelliktir.

Bazı genotipler mükemmel bir şekilde korele olabilir (R=1), yani her zaman birlikte kalıtılırlar. Diğerleri 'mükemmel' bağlantıda olmayabilir (örn. R=0.9), ancak genotipler arasında güçlü bir korelasyon olduğu için hala LD'de olduğu kabul edilir (bence yayınlanmış makalelerde genellikle 'cut-off' olarak 0.8 görülür. ).

Korelasyon katsayısı D' değerinden türetilir - bu (basitçe) genotiplerin gözlenen ve beklenen frekanslarını (bağlantıda olsun veya olmasın) belirtir. Bu nedenle, her iki değer de kullanılabilir, ancak korelasyon katsayısını (veya daha kesin olmak gerekirse, belirleme katsayısı, R^2) ifade etmenin daha yaygın (ve daha yorumlanabilir) olduğunu düşünüyorum.

Bir örnek isterseniz: Herhangi bir SNP'nin rs10757278 ile LD'de olup olmadığını bilmek ilgimi çekebilir (9p21'de bulunur, kalp hastalığı ile ilişkili). SNAP kullanarak (BROAD tarafından) aramamı girebilir, seçeneklerimi seçebilir (örneğin 1000 genom verisi ve 0.8'lik bir R^2 kesmesi kullan) ve arama yapabilirim. ~5 SNP'nin 'mükemmel' LD'de (R^2=1) olduğu bulunur, ancak ~40'ın daha R^2 değerleri 0,8'in üzerinde olduğu için giriş-SNP ile bağlantılı olduğu düşünülür.

Özetle, her iki ifade de doğru bir şekilde kullanılabilir, ancak bağlantı derecesini belirtmek her zaman daha bilgilendiricidir (aksi halde mükemmel bir korelasyon içinde oldukları varsayılabilir).


Poligenik kalıtım

Mendel, deneylerini, özellikleri veya alelleri tam baskın olan bezelye bitkisi ile yapmış ve böylece kalıtım yasaları kanıtlanmıştır. Diğer bilim adamları deneylerini farklı bitki ve hayvanlar üzerinde gerçekleştirdiler ve Mendel oranlarında sapmalar buldular. Bu deney ve gözlemlere bağlı olarak, gen etkileşimleri adı verilen farklı bir kalıtım modeli keşfedildi. Bu çalışma Post – Mendel genetiği veya Neo-Mendel genetiği olarak bilinir. Bu yazımızda poligenik kalıtım kavramını inceleyeceğiz.

Poligenik Kalıtım veya Nicel Kalıtım:

Bu karakterler iki veya daha fazla gen çifti tarafından belirlenir ve aditif veya kümülatif etkiye sahiptir. Bu genlere kümülatif genler veya poligenler veya çoklu faktörler denir. Poligenler, farklı lokuslarda bulunan, tek bir fenotipik karakteri etkileyen ve aditif veya kümülatif etkiye sahip iki veya daha fazla farklı alelik olmayan gen çiftidir. Ayrıca nicel genler veya kümülatif genler veya çoklu faktörler olarak da adlandırılırlar.

Birden fazla gen çifti tarafından yönetilen tek bir fenotipik karaktere poligenik karakter veya nicel karakter denir. Poligenik karakterler veya nicel karakter sürekli varyasyon gösterir. Galton (1883), insan popülasyonunda boy, ten rengi ve zeka gibi karakterlerin yalnızca iki karşıt ifade değil, ifadede sürekli farklılıklar gösterdiğini tahmin etti.

Kümülatif veya poligenik kalıtımda her genin belirli bir etkisi vardır. Baskın genlerin sayısı ne kadar fazlaysa, karakterin ifadesi de o kadar büyük olur. Genellikle evrim sırasında kromozom veya kromozom parçalarının bir kopyası olduğuna inanılır. Bu, aynı genin birden fazla kopyasıyla sonuçlandı. Mendel'in tam baskınlığın gözlemlendiği nitel kalıtımı incelediğine dikkat edin.

Buğday Çekirdeği Renginde Poligenik Kalıtım:

İsveçli genetikçi H. Nilsson-Ehle poligenik kalıtımı keşfetti. Kırmızı çekirdekli buğday çeşidini beyaz çekirdekli çeşitle çaprazladı. F'de1 nesil tüm bitkiler, kırmızı ve beyaz arasında ara renkte tanelere sahiptir. F'de2 nesil beş farklı fenotipik ifade (en koyu kırmızı, orta kırmızı, orta kırmızı, açık kırmızı, beyaz) 1:4:6:4:1 oranında ortaya çıktı. Nilson Ehle, buğdaydaki çekirdek renginin iki çift gen, Aa ve Bb tarafından kontrol edildiğini öne sürdü. A ve B genleri kırmızı rengi belirler. a ve b kırmızı renk pigmenti üretmezler ve ifadeleri çekirdeğin beyaz rengidir.

İnsan Ten Renginde Poligenik Kalıtım:

Melanin pigmentinin varlığı, bir insanda cildin renginden sorumludur. Her baskın gen, sabit miktarda melanin sentezinden sorumludur. Sentezlenen melanin miktarı, baskın genlerin sayısı ile doğru orantılıdır.

Kişilerde gelişen melanin miktarı, A, B, C genlerinin üç paritesi tarafından belirlenir. Bunlar üç farklı lokusta bulunur ve her baskın gen, sabit miktarda melanin sentezinden sorumludur. Melanin üretildiği saf siyah bir ebeveynin genotipi AABBCC iken, saf beyaz albino olarak da adlandırılan melanin oluşmaz aabbcc'dir.

Melezler yani F1 yavru (2 3 = 8) farklı gamet türleri üretir. Genotipi AaBbCc olan melez ara ürünü ele alalım. İki melez ara ürün arasında çapraz yaparak F'de (2 6 = 64) kombinasyon elde ederiz.2 nesil. Ancak her baskın genin kümülatif etkisinden dolayı sadece 7 fenotip vardır.

Olası tüm kombinasyonları analiz ettiğimizde ve rengin frekans dağılımını, x ekseninde çeşitli tonlardaki baskın genlerin sayısını ve y ekseninde farklı tonların frekansını alarak olasılık grafiğini çizdiğimizde. Poligenik kalıtımda genellikle aşağıda gösterildiği gibi çan şeklinde bir eğri elde ederiz.

Bu, çoğu insanın ten rengi gibi fenotipik aralığın ortasına düştüğü, çok az insanın ise saf beyaz veya saf karanlık gibi uçlarda olduğu anlamına gelir. Eğrinin bir ucunda tüm aleller için çekinik olan bireyler olacaktır (örneğin, aabbcc). Diğer uçta nadirdirler, tüm aleller için baskın olan bireyler olacaktır (örneğin, AABBCC) nadirdirler. Eğrinin ortasında, baskın ve çekinik alellerin bir kombinasyonuna sahip bireyler olacaktır (örneğin, AaBbCc veya AaBBcc). Grafik ayrıca fenotipin ifade seviyesinin, katkıda bulunan alellerin sayısına bağlı olduğunu ve dolayısıyla daha nicel olduğunu gösterir.

Diğer örnekler, insan boyu, mısır koçanının uzunluğudur.

Nitel ve Nicel Kalıtımın Karşılaştırmalı Çalışması:

Niteliksel Kalıtım:

  • Nitel karakterler, iki zıt ifadeye sahip olan ve tek bir gen çifti tarafından kontrol edilen klasik Mendel özellikleridir. Örneğin. uzun boylu ve cüce bezelye bitkileri. Niteliksel bir karakter, tek bir gen çifti tarafından ifade edilebilir. Bu nedenle özelliklere monogenik özellikler denir. Monogenik özelliklerin (monojen) veya kalitatif karakterlerin kalıtımı, kalitatif veya monogenik kalıtım olarak adlandırılır.
  • Niteliksel bir özellik niteliksel olarak ifade edilir, bu da fenotipin farklı kategorilere ayrıldığı anlamına gelir. Bu kategorilerin mutlaka belirli bir sırası yoktur.
  • Niteliksel kalıtım ilk olarak Mendel tarafından incelenmiştir.

Niteliksel Kalıtımın Özellikleri:

  • Nicel bir kalıtım veya monogenik kalıtım, iki zıt ifadeye sahip olan nitel karakterlerin kalıtımlarıyla ilgilenir; uzun boylu ve cüce bezelye bitkileri.
  • Her karakter, tek bir zıt alel çifti tarafından kontrol edilir.
  • Ara tip yoktur.
  • Her karakterin iki farklı zıt ifadesi vardır, yani iki farklı fenotip sergilerler.
  • Karakter, baskın genlerden biri veya her ikisi tarafından kontrol edilsin, ifade derecesi aynı kalır.
  • Tek etkili genler görülür.
  • Çevresel faktörlerden etkilenmez.
  • Süreksiz bir kalıtım modeli gösterir.
  • F1 kuşağının bireyleri baskın ebeveyne benzer.
  • F2 neslinin bireyleri 3: 1 oranındadır. Bir ara ifade yoktur.
  • Bireysel çiftleşmeler ve onların nesilleri ile ilgilidir.
  • Bu kalıtımın analizi, oranların sayılması ve bulunmasıyla yapılabilir.
  • Örnekler: Bezelye bitkisinin boy, tohum kabuğu ve tohum rengi gibi niteliksel karakterlerin kalıtımları.

Nicel Miras:

Nicel bir kalıtım veya poligenik kalıtım, insan popülasyonundaki boy, kilo, ten rengi, zeka vb. nicel karakterlerin kalıtımıyla ilgilenir ve sürekli çeşitlilik gösterir. Bitkilerde boy, büyüklük, şekil, tohum ve meyve sayısı gibi az sayıda karakter de nicel kalıtım sergiler.

Kantitatif kalıtımda her genin belirli bir etkisi vardır ve baskın gen sayısı ne kadar fazlaysa, karakterin ifade derecesi de o kadar fazladır. Karakterlerin ifadesindeki gradasyon, gen çiftlerinin sayısı ile belirlenir ve tüm gen çiftlerinin ek veya kümülatif etkisi vardır.

Kantitatif veya poligenik kalıtım ilk olarak tütünde boy konusunda J. Kolreuter (1760) ve insanlarda boy ve zeka durumunda F. Galton (1883) tarafından incelenmiştir. Nilsson-Ehle (1908), buğdayda çekirdek rengi durumunda poligenik kalıtımın ilk deneysel kanıtını elde etti. Poligenik kalıtımın olası kökeni, bir kromozomun veya parçasının kopyalanması, kromozom sayısındaki artış (Poliploidi) veya benzer etkiye sahip genleri üreten mutasyonlardan kaynaklanmaktadır.


Belgeye Erişim

  • APA
  • Standart
  • Harvard
  • Vancouver
  • Yazar
  • BİBTEKS
  • RIS

İçinde: Genetik epidemiyoloji , Cilt. 22, No. 4, 2002, s. 298-312.

Araştırma çıktısı : Dergiye katkı › Makale › hakemlik

T1 - Nitel ve nicel özelliklerin çok noktalı bağlantı dengesizlik haritalaması için birleşik örnekleme yaklaşımı

N2 - Biyoteknolojideki hızlı gelişme, karmaşık hastalıklar için çok noktalı gen haritalama ile başa çıkma fırsatını arttırdı ve kantitatif özellikleri kullanan ilişkilendirme çalışmaları son zamanlarda çok dikkat çekti. Hassas haritalama için geleneksel hipotez testi yaklaşımından farklı olarak, nicel bir özelliği kontrol eden bir geni lokalize etmek için birleşik çok noktalı bir yöntem öneriyoruz. İlk olarak, üç farklı kalıtım modu altında ondalık olarak kategorize edilen nicel bir özellik için bağlantı ve bağlantı dengesizliğini (LD) tespit etmek için gereken örnek boyutunu hesaplıyoruz. Sonuçlarımız, aşırı düşük (EL) veya aşırı yüksek (EH) probandlardan yavruların ve ebeveynlerinin üçlü örneklemesinin, orta aralıkta örneklemeye göre daha büyük istatistiksel güç sağladığını göstermektedir. Daha sonra, amacın bir özellik lokusunun harita konumunu (τ) tahmin etmek ve örnekleme belirsizliği ile birlikte bir güven aralığı hesaplamak olduğu çok noktalı LD eşlemesi için birleşik bir örnekleme yaklaşımı öneriyoruz. Metodumuz, EL ve EH probandlarından örnekleme gibi, örnekleme şemasına bağlı rastgele bir lokusta beklenen bir tercihli aktarım istatistiği için bir model üzerine kuruludur. Bu yaklaşım, temeldeki genetik modelden bağımsız olarak geçerlidir. Bu model için temel varsayımlardan biri, haritalanan bölgeyle bağlantılı birden fazla nicel özellik lokusunun (QTL) olmamasıdır. Son olarak, Barbados'tan multipleks astımlı ailelerde toplanan toplam serum IgE seviyelerine ilişkin aile verilerini kullanarak önerilen yöntemi gösteriyoruz. Gözlenmeyen bir QTL, kromozom 12 üzerinde D12S1052 ve D12S1064 belirteçleri tarafından çerçevelenen 20-cM bölgesi boyunca %95 güven aralığı (40.84, 43.02) ile τ̂ = 41.93 cM'de yer alıyor gibi görünmektedir. Test istatistiği, güçlü bağlantı ve LD kanıtı göstermektedir ( ki-kare istatistiği = 2 df ile 18.39, P-değeri = 0.0001).

AB - Biyoteknolojideki hızlı gelişme, karmaşık hastalıklar için çok noktalı gen haritalama ile başa çıkma fırsatını arttırdı ve kantitatif özellikleri kullanan ilişkilendirme çalışmaları son zamanlarda çok dikkat çekti. Hassas haritalama için geleneksel hipotez testi yaklaşımından farklı olarak, nicel bir özelliği kontrol eden bir geni lokalize etmek için birleşik çok noktalı bir yöntem öneriyoruz. İlk olarak, üç farklı kalıtım modu altında ondalık olarak kategorize edilen nicel bir özellik için bağlantı ve bağlantı dengesizliğini (LD) tespit etmek için gereken örnek boyutunu hesaplıyoruz. Sonuçlarımız, aşırı düşük (EL) veya aşırı yüksek (EH) probandlardan yavruların ve ebeveynlerinin üçlü örneklemesinin, orta aralıkta örneklemeye göre daha büyük istatistiksel güç sağladığını göstermektedir. Daha sonra, amacın bir özellik lokusunun harita konumunu (τ) tahmin etmek ve örnekleme belirsizliği ile birlikte bir güven aralığı hesaplamak olduğu çok noktalı LD eşlemesi için birleşik bir örnekleme yaklaşımı öneriyoruz. Metodumuz, EL ve EH probandlarından örnekleme gibi, örnekleme şemasına bağlı rastgele bir lokusta beklenen bir tercihli aktarım istatistiği için bir model üzerine kuruludur. Bu yaklaşım, temeldeki genetik modelden bağımsız olarak geçerlidir. Bu model için temel varsayımlardan biri, haritalanan bölgeyle bağlantılı birden fazla nicel özellik lokusunun (QTL) olmamasıdır. Son olarak, Barbados'tan multipleks astımlı ailelerde toplanan toplam serum IgE seviyelerine ilişkin aile verilerini kullanarak önerilen yöntemi gösteriyoruz. Gözlenmeyen bir QTL, kromozom 12 üzerinde D12S1052 ve D12S1064 belirteçleri tarafından çerçevelenen 20-cM bölgesi boyunca %95 güven aralığı (40.84, 43.02) ile τ̂ = 41.93 cM'de yer alıyor gibi görünmektedir. Test istatistiği, güçlü bağlantı ve LD kanıtı göstermektedir ( ki-kare istatistiği = 2 df ile 18.39, P-değeri = 0.0001).


Gösterim ve Veri

Yorumlarımızın dayandığı çeşitli nicel TDT makalelerinde kullanılan notasyon bir yazardan diğerine tutarlı değildir ve bu makalelerinkine gevşek bir şekilde dayanan birleştirici bir notasyonu benimsiyoruz. Standart istatistiksel uygulamaya uygun olarak, rastgele değişkenler için büyük harf gösterimi ve bu rastgele değişkenlerin gözlenen değerleri için karşılık gelen küçük harf gösterimi kullanıyoruz. Bu açıklayıcı incelemedeki ana noktalara odaklanmak için, belirli (ve kısıtlı) bir veri biçimini varsayıyoruz. Verilerin bir işaretleyici lokusla ilgili olduğunu varsayıyoruz.A” ile gösterilen iki olası allele sahip A ve aile ilgili bilgilerden oluşur ve n aile üçlüleri, her bir üçlüdeki iki ebeveyn ve çocuk hakkında eksiksiz işaretleyici lokus genotip bilgisi. İlgilenilen nicel özelliğin değeri, her üçlüdeki çocuk için bilinir, ancak ebeveynler için bilinmez. Orijinal nitel TDT ile uyumlu olarak, tüm ebeveyn çiftleşme türlerinin bilgilendirici olduğunu varsayıyoruz (yani, en az bir tane içerir). aa ebeveyn). gözlemlenen sayısı A çocuktaki aleller üçlü ben ile gösterilir xben (ben = 1, 2,…, n) ve üçlü çocukta ilgi duyulan nicel özelliğin gözlenen değeri ben ile gösterilir yben.

Burada, aşağıda yapılan yorumların, yukarıda açıklananlar dışındaki verilere ne ölçüde taşındığını, örneğin her ailede birkaç çocuğun gözlendiği, ebeveyn fenotip bilgilerinin mevcut olduğu ve verilerin bilgilendirici olmayan aileleri içerdiği durumları dikkate almıyoruz. çiftleşme türleri. Düşündüğümüzden daha karmaşık veri formları için gerekli analizlere girmeden, tartıştığımız test prosedürlerinin ana özelliklerini vurgulamak için analizimizi bu şekilde sınırlandırıyoruz.

Test edilen boş hipotez, “işaretleyici lokusu ile nicel özellik ile ilgili bir lokus arasında bağlantı yok (veya bağlantı dengesizliği yok)” şeklindedir. Bu sıfır hipotezi altında, ortalama sayı A aleller, xben, çocukta üçlü ben ebeveyn çiftleşme türüne bağlı olacaktır, eğer öyleyse 0,5 olur aa×aa, 1.0 ise aa×aave 1.5 ise AA×aa. sıfır hipotezi varyansı xben ayrıca ebeveyn çiftleşme türüne de bağlıdır, eğer öyleyse 0.25'tir. aa×aa veya AA×aa ve 0,5 ise aa×aa. Sıklıkla uygun Abecasis [5] notasyonunu kullanırız Wben (“aile içinde”) tanımlamak için xben eksi sıfır hipotezi, üçlüdeki çiftleşme türünden hesaplandığı gibi ben. sıfır hipotezinin ortalaması Wben sıfırdır ve sıfır hipotez varyansı Wben bunun için aynıdır xben, ve üçlüdeki çiftleşme türüne bağlıdır ben. Tipik aileyi tartışırken son eki bırakıyoruz ben ve genel gösterimi kullanın W, w, x, x, Y, ve y.


Sonuçlar

Önerilen iki aşamalı işleme stratejimiz çerçevesinde LD'yi işlemek için farklı yöntemleri değerlendirdik. 1. adımda, hangi SNP alt kümesinin tam IC'yi koruduğunu belirlemek için LOD puanı yanlılığını azaltırken, etkilenen 2, 3 veya 4 kardeşi olan aileler ve sıfır veya iki eşlenmemiş ebeveyni olan aileler için farklı LD eşiklerinde simüle edilmiş verilerin 1.000 kopyası üzerinde NPL analizi gerçekleştirdik. . 2. adımda, sıfır veya iki eşlenmemiş ebeveyn ile 9 çalışma tasarımının tümü için 1. adımdan elde edilen SNP'lerin alt kümesini kullanarak farklı LD eşiklerinde simüle edilmiş verilerin 1.000 kopyası üzerinde NPL analizi gerçekleştirdik. Farklı LD derecelerinde (D' ve r 2 ) farklı yaklaşımları LOD puanı yanlılığını azaltma açısından değerlendirdik. Genel olarak, her iki ebeveynin de genotiplendirildiği tam verilerle, tüm çalışma tasarımlarında LOD puanı enflasyonu yoktu. Bu nedenle, takip edeceğimiz tartışmalarımız, esas olarak, her iki ebeveynin de çift tiplenmemiş olduğu sonuçlara odaklanmaktadır.

Aşama 1

Tablo ​ Tablo 1 1, ortalama maksimum LOD puanını (MLS) ve üç teknik kullanılarak elde edilen ortalama IC'yi, SNP'lerin ayarlanmamış alt kümesine kıyasla özetler. SNP'lerin ayarlanmamış alt kümesinde elde edilen IC değerleri, sırasıyla 2, 3 veya 4 kardeş verileri için 0.72, 0.80 ve 0.84 idi.

Tablo 1

Adım 1: Ortalama maksimum NPL LOD puanlarının ve nototipi olmayan ebeveynlerle ortalama IC'nin özet tanımlayıcı istatistikleri.

2 etkilenen kardeş3 etkilenen kardeş4 etkilenen kardeş
Ort # SNPMLS (SD)ICMLS (SD)ICMLS (SD)IC
ayarlanmamış601213.27 (2.77)0.7214.41 (3.64)0.807.86 (2.20)0.84
MAF ≥ 0.05538713.49 (2.66)0.7214.77 (3.64)0.808.06 (2.23)0.84
MAF ≥ 0.10461613.87 (2.64)0.7215.00 (3.61)0.808.18 (2.25)0.84
MAF ≥ 0.20320315.01 (2.69)0.7215.47 (3.61)0.797.90 (2.42)0.84
r 2 ≥ 0,9545965.47 (1.79)0.724.93 (2.06)0.802.96 (1.55)0.85
MAF ≥ 0,05 & r 2 ≥ 0,9537139.62 (2.75)0.7214.01 (3.43)0.805.02 (1.95)0.85

Bilgi vermeyen SNP'lerin kaldırılması, IC seviyesini korurken belirteçlerin sayısını azalttı, ancak LOD puanı enflasyonu, temel LOD puanı enflasyonuna kıyasla değişmeden kaldı. Fazla SNP'lerin çıkarılması, IC kaybıyla sonuçlanmadı ve LOD skor yanlılığında orta derecede azalma gösterdi ve kombinasyon tekniğinden daha iyi performans gösterdi, ancak yine de çok sayıda işaretçi seçildi. İki teknik birleştirildiğinde, IC korunurken SNP'lerin temel alt kümesinden %38 daha az SNP seçildi. Ek olarak, bu kombinasyon tekniği, LOD skor yanlılığında orta derecede azalma gösterdi. Genel olarak, tüm işaretleyici alt kümeleri için, ortalama MLS, boş beklentinin üzerinde kaldı ve yoğun işaret kümelerinde LD'nin yok sayılmasıyla ortaya çıkan yanlılığı azaltmak için daha fazla ayarlama/SNP seçimi ihtiyacına işaret etti. Aynı bilgi içeriğini yanlılığı azaltırken elde ettiğimiz için, kombinasyon yaklaşımı tarafından oluşturulan işaretleyici alt kümesini 2. adımda değerlendirilecek şekilde ileriye taşıdık. Adım 1'deki kombinasyon yaklaşımından elde edilen sonuçları Adım 2 için temel olarak ayarlamak, farklı yaklaşımları değerlendirmemize ve her bir yaklaşımın orta düzeyde bir sapma temelinden başlayarak azaltabileceği sapma düzeyini ölçmemize izin verdi.

Adım 2

2. adımda, 1. adımda seçilen 3.713 SNP alt kümesini temel işaretleyici alt kümesi olarak kullanarak yoğun SNP'ler arasında LD'yi işlemek için dört farklı yaklaşımı inceledik. Bu farklı yaklaşımlardan elde edilen ortalama MLS'yi taban çizgisiyle karşılaştırdık ve bunları, gözlemlenen ortalama MLS'yi taban çizgisinin en az %10 altında not ettiğimiz durumlarda yanlılıkta azalma gösterdiğini düşündük. Tablo ​ Tablo 2 2, LOD skor yanlılığının gözlemlendiği, nototiplendirilmemiş ebeveynlerle ortalama MLS'yi göstermektedir. Bir veya iki etkilenmemiş kardeşin eklenmesiyle, Tablo ​ Tablo1'de gösterildiği gibi daha düşük LOD puanı yanlılığı gözlemledik. 1. Örneğin, etkilenmiş 2 kardeşin aileleri için 9.62 (SD = 2.75), 8.66 (SD = 2.49) ve 4.41 (SD = 1.80) ortalama MLS'yi ve genotipi olmayan ebeveynleri olan sıfır, bir veya iki etkilenmemiş kardeşi gözlemledik. Etkilenen 3 veya 4 kardeşin olduğu diğer çalışma tasarımları için de benzer eğilimler gözlendi. IC açısından, bir ailedeki kardeşlik boyutu arttıkça ortalama IC'nin arttığını gözlemledik.

Tablo 2

Ortalama maksimum LOD puanlarının ve ortalama IC'nin özeti, tiplendirilmemiş ebeveynlerle 9 çalışma tasarımı için 1. adımdaki temel işaretleyici alt kümesini kullanarak.

Kardeş SayısıMLS (SD)ortalama IC
2 Etkilenen9.62 (2.75)0.72
3 Etkilenen14.01 (3.43)0.80
4 Etkilenen5.02 (1.95)0.85
2 Etkilenen + 1 Etkilenmeyen8.66 (2.49)0.80
3 Etkilenen + 1 Etkilenmeyen5.41 (2.12)0.85
4 Etkilendi + 1 Etkilenmedi3.17 (1.55)0.88
2 Etkilenen + 2 Etkilenmeyen4.41 (1.80)0.85
3 Etkilenen + 2 Etkilenmeyen3.18 (1.57)0.88
4 Etkilendi + 2 Etkilenmedi1.89 (1.29)0.90

Tablo ​ Tablo3 3 ve ​ ve4, 4'te, 2, 3 veya 4 etkilenmiş kardeşi ve genotipi olmayan ebeveynleri olan aileleri kullanarak değişen LD kesme noktalarında LD'nin ele alınmasında dört yöntemi kullanarak ortalama MLS'yi özetliyoruz. Tablo ​ Tablo 3 3, D' eşikleri kullanılarak elde edilen sonuçları gösterir ve Tablo ​ Tablo 4 4, 2, 3 veya 4 etkilenmiş kardeşi olan ebeveynleri olmayan ebeveynleri olan aileler için r 2 eşikleri kullanılarak elde edilen sonuçları gösterir. Ek olarak, etkilenmeyen 1 veya 2 ilave kardeşi olan aileler için LOD puanı yanlılığının daha da azalmasıyla LD kesme noktalarında benzer modeller gözlemlendi (veriler gösterilmemiştir). Bir ailede etkilenmemiş kardeş sayısı arttıkça, LOD puanlarının şişmesi daha da azaldı ve bazı durumlarda tamamen ortadan kalktı.

Tablo 3

Adım 2, D' LD eşiğini ve MT'yi kullanarak: Etkilenen 2, 3 veya 4 kardeşi ve genotipi olmayan* ebeveynleri olan aileler için ortalama maksimum NPL LOD puanlarının ve ortalama IC'nin özet tanımlayıcı istatistikleri.

2 etkilenen kardeş3 etkilenen kardeş4 etkilenen kardeş
YöntemLD eşiğiOrt # SNPMLS (SD)ICMLS (SD)ICMLS (SD)IC
ayarlanmamış 37139.62 (2.75)0.7214.01 (3.43)0.805.02 (1.95)0.85
MT8snp1cM4801.20 (0.96)0.721.34 (1.01)0.800.36 (0.47)0.85
MT4snp1cM2590.65 (0.67)0.710.60 (0.63)0.800.22 (0.36)0.85
MT2snp1cM1350.66 (0.68)0.670.76 (0.74)0.790.26 (0.38)0.84
MT1snp1cM680.76 (0.73)0.611.05 (0.88)0.760.34 (0.47)0.83
TEKRAR0.74090.44 (0.53)0.730.54 (0.61)0.800.2 (0.33)0.85
TEKRAR0.53090.37 (0.50)0.720.45 (0.55)0.800.18 (0.34)0.85
TEKRAR0.32000.43 (0.54)0.70.58 (0.60)0.800.23 (0.39)0.85
TEKRAR0.1620.73 (0.73)0.611.18 (0.96)0.760.44 (0.57)0.83
SNPLINK0.75310.65 (0.78)0.730.66 (0.79)0.800.3 (0.46)0.85
SNPLINK0.54010.75 (0.81)0.720.73 (0.83)0.800.31 (0.46)0.85
SNPLINK0.32870.85 (0.88)0.710.81 (0.84)0.800.33 (0.47)0.85
SNPLINK0.11200.65 (0.74)0.640.70 (0.81)0.770.31 (0.46)0.83

*Her iki ebeveynin de genotiplendirildiği tam verilerle, etkilenen 2, 3 veya 4 kardeş için ayarlanmamış ortalama MLS 0,58, 0,5 ve 0,47'dir.

Tablo 4

Adım 2 r 2 LD eşiğini kullanarak: Etkilenen 2, 3 veya 4 kardeşi ve genotipi olmayan* ebeveynleri olan aileler için ortalama maksimum NPL LOD puanlarının ve ortalama IC'nin özet tanımlayıcı istatistikleri.

2 etkilenen kardeş3 etkilenen kardeş4 etkilenen kardeş
YöntemLD eşiğiOrt # SNPMLS (SD)ICMLS (SD)ICMLS (SD)IC
ayarlanmamış 37139.62 (2.75)0.7214.01 (3.43)0.805.02 (1.95)0.85
TEKRAR0.715621.39 (0.98)0.732.00 (1.28)0.800.73 (0.70)0.85
TEKRAR0.512401.21 (0.90)0.731.67 (1.17)0.810.59 (0.63)0.85
TEKRAR0.38920.45 (0.53)0.730.66 (0.68)0.810.26 (0.39)0.85
TEKRAR0.14350.32 (0.44)0.720.40 (0.49)0.800.18 (0.34)0.85
MERLINLD0.75621.35 (0.97)0.731.83 (1.22)0.800.62 (0.61)0.85
MERLINLD0.55751.12 (0.96)0.731.53 (1.19)0.800.53 (0.59)0.85
MERLINLD0.35420.55 (0.61)0.740.77 (0.77)0.800.32 (0.43)0.85
MERLINLD0.14230.51 (0.58)0.740.69 (0.70)0.810.29 (0.41)0.85
SNPLINK0.725963.94 (1.85)0.735.10 (2.11)0.802.06 (1.23)0.85
SNPLINK0.523513.63 (1.81)0.734.88 (2.09)0.801.97 (1.20)0.85
SNPLINK0.320573.04 (1.73)0.734.10 (1.95)0.801.56 (1.07)0.85
SNPLINK0.115192.69 (1.64)0.733.57 (1.87)0.801.28 (0.98)0.85

*Her iki ebeveynin de genotiplendirildiği tam verilerle, etkilenen 2, 3 veya 4 kardeş için ayarlanmamış ortalama MLS 0,58, 0,5 ve 0,47'dir.

Marker İnceltme (MT) Algoritması

1 cM bölgesi başına 8, 4, 2 veya 1 SNP'li dört MT kesme noktası için ortalama MLS'yi 1,20 (SD = 0,96), 0,65 (SD = 0,67), 0,66 (SD = 0,68) ve 0,76 (SD) gözlemledik. = 0,73), sırasıyla (Tablo ​ (Tablo3). 3 ). Karşılık gelen ortalama IC değerleri sırasıyla 0,72, 0,71, 0,67 ve 0,61 idi. 9,62 (SD = 2,75) olan temel LOD puanı ile karşılaştırıldığında, dört belirteç alt kümesinin tümü, büyük ölçüde azaltılmış LOD puanı yanlılığı ile sonuçlandı. cM kesme noktası başına 8 ve 4 SNP'de ihmal edilebilir bilgi kaybı vardı, ancak diğer iki alt kesme noktasında 0,72'lik temel IC'ye kıyasla bir miktar bilgi kaybı vardı. Bununla birlikte, her iki ebeveynin de genotipli olduğu tam verilerle gözlemlenen ortalama MLS değerleriyle karşılaştırıldığında, bu belirteç setlerinin hiçbiri LOD puanı yanlılığını tamamen ortadan kaldırmadı. Benzer eğilimler 3 veya 4 kardeşli aileler için de gözlendi.

Özyinelemeli Eliminasyon (RE) Algoritması

D' kesme noktalarını kullanarak, Tablo ​ Tablo 3'te gösterilen 9,62'lik (SD = 2,75) başlangıç ​​LOD puanına kıyasla LOD puanı yanlılığında önemli bir azalma gözlemledik. 3. Tam veri ile gözlemlenen ortalama MLS ile karşılaştırıldığında, RE yaklaşımının kullanılması D' > 0.3'teki yanlılığı ortadan kaldırdı, ancak aynı modeli en düşük D' kesme noktasında gözlemlemedik. D' 0.3 (IC = 0.70) ve 0.1 (IC = 0.61) kesim noktalarında taban çizgisine kıyasla bir miktar bilgi kaybı gözlemlendi. Etkilenen 2 kardeşe sahip verilere uygulanan r 2 eşikleri ile, sırasıyla dört r 2 kesme noktası için LOD puanı yanlılığının azaldığını gözlemledik (Tablo ​ (Tablo4). 4). Tam verilerle karşılaştırıldığında, LOD puanı yanlılığı artık en düşük iki r 2 kesme noktasında gözlenmedi. Ek olarak, IC değerleri 0,72'lik temel IC'den değişmedi. Genel olarak her iki LD ölçümü için, etkilenen 3 veya 4 kardeşi olan aileler için benzer eğilimler gözlendi.

SNPLINK

9.62'lik temel LOD puanı ile karşılaştırıldığında, SNPLINK ayarlı işaretçi alt kümeleri, D' eşiklerini kullanırken (Tablo ​ (Tablo3) 3) LOD puanı sapmasını azalttı, ancak kesme noktalarından hiçbiri sapmayı tamamen ortadan kaldırmadı. 0,72'lik temel IC değerine kıyasla yalnızca en düşük kesme noktasında (IC = 0,64) bir miktar bilgi kaybı vardı. Buna karşılık, r 2 eşiklerini kullanarak, LOD puanı yanlılığında yalnızca orta derecede azalma gözlemledik (Tablo ​ (Tablo4), 4) ve herhangi bir eşik düzeyinde bilgi kaybı olmadı. Her iki LD ölçümü için tüm kesme noktalarında 3 veya 4 kardeşi olan ailelerde nispeten benzer azalma paternleri gözlendi.

MERLIN-LD

MERLIN, MERLIN-LD'de uygulanan kümeleme yöntemini dört r 2 kesme noktası kullanarak uyguladık. 0,7, 0,5, 0,3 ve 0,1 r 2 kesim noktasında sırasıyla 562, 575, 542 ve 423 küme oluşturulmuştur (Tablo ​ (Tablo4). 4). Tüm eşiklerde, IC, temel IC'den değişmeden kaldı. Etkilenen 2 kardeşi ve genotipi olmayan ebeveynleri olan aileler için, başlangıç ​​LOD puanı olan 9,62 ile karşılaştırıldığında LOD puanı yanlılığında önemli bir azalma gözlemledik (Tablo ​ (Tablo4). 4). En düşük iki kesme noktasında, tam verili ortalama MLS ile karşılaştırıldığında LOD puanı yanlılığının ortadan kaldırıldığını gözlemledik.


Soyut

Mevcut biyolojideki en büyük zorluk, nicel özellikler için varyasyonun genetik temelini anlamaktır. Kantitatif özellik lokus haritalama ilkelerini gözden geçiriyoruz ve son on yılda elde edilen kantitatif özelliklerin genetik mimarisi hakkındaki görüşleri özetliyoruz. Şu anda, transkript bolluğundaki genetik varyasyonu ve diğer ara moleküler fenotipleri nicel bir özellik lokus haritalama çerçevesine dahil etmemizi sağlayan bir genomik devrimin ortasındayız. Bu sistem genetiği yaklaşımı, genotip ve fenotip arasında yer alan 'kara kutu' içindeki biyolojiyi, etkileşen genlerin nedensel ağları açısından anlamamızı sağlar.


Sıkıca bağlanmış genom çapında verilerle ilişkilendirme eşlemesi için bağlantı dengesizliği kümelemeye dayalı yaklaşım

Ekolojik Genetik Araştırma Birimi, Organizma ve Evrimsel Biyoloji Araştırma Programı, Biyoloji ve Çevre Bilimleri Fakültesi, Biyolojik Bilimler Bölümü, Helsinki Üniversitesi, Helsinki, Finlandiya

Zitong Li, Ekolojik Genetik Araştırma Birimi, Organizma ve Evrimsel Biyoloji Araştırma Programı, Biyoloji ve Çevre Bilimleri Fakültesi, Biyolojik Bilimler Bölümü, Helsinki Üniversitesi, Helsinki, Finlandiya.

Ekolojik Genetik Araştırma Birimi, Organizma ve Evrimsel Biyoloji Araştırma Programı, Biyoloji ve Çevre Bilimleri Fakültesi, Biyolojik Bilimler Bölümü, Helsinki Üniversitesi, Helsinki, Finlandiya

Ekolojik Genetik Araştırma Birimi, Organizma ve Evrimsel Biyoloji Araştırma Programı, Biyoloji ve Çevre Bilimleri Fakültesi, Biyolojik Bilimler Bölümü, Helsinki Üniversitesi, Helsinki, Finlandiya

Ekolojik Genetik Araştırma Birimi, Organizma ve Evrimsel Biyoloji Araştırma Programı, Biyoloji ve Çevre Bilimleri Fakültesi, Biyolojik Bilimler Bölümü, Helsinki Üniversitesi, Helsinki, Finlandiya

Ekolojik Genetik Araştırma Birimi, Organizma ve Evrimsel Biyoloji Araştırma Programı, Biyoloji ve Çevre Bilimleri Fakültesi, Biyolojik Bilimler Bölümü, Helsinki Üniversitesi, Helsinki, Finlandiya

Zitong Li, Ekolojik Genetik Araştırma Birimi, Organizma ve Evrimsel Biyoloji Araştırma Programı, Biyoloji ve Çevre Bilimleri Fakültesi, Biyolojik Bilimler Bölümü, Helsinki Üniversitesi, Helsinki, Finlandiya.

Ekolojik Genetik Araştırma Birimi, Organizma ve Evrimsel Biyoloji Araştırma Programı, Biyoloji ve Çevre Bilimleri Fakültesi, Biyolojik Bilimler Bölümü, Helsinki Üniversitesi, Helsinki, Finlandiya

Ekolojik Genetik Araştırma Birimi, Organizma ve Evrimsel Biyoloji Araştırma Programı, Biyoloji ve Çevre Bilimleri Fakültesi, Biyolojik Bilimler Bölümü, Helsinki Üniversitesi, Helsinki, Finlandiya

Ekolojik Genetik Araştırma Birimi, Organizma ve Evrimsel Biyoloji Araştırma Programı, Biyoloji ve Çevre Bilimleri Fakültesi, Biyolojik Bilimler Bölümü, Helsinki Üniversitesi, Helsinki, Finlandiya

Soyut

Genom çapında ilişkilendirme çalışmaları (GWAS), aday genler ve belirteçler arasındaki bağlantı dengesizliğini (LD) kullanarak nicel özelliklerle güçlü bir şekilde ilişkili genetik belirteçleri tanımlamayı amaçlar. Bununla birlikte, yakındaki genetik belirteçler arasındaki LD nedeniyle, standart GWAS yaklaşımları tipik olarak uzun genomik bölgeleri kapsayan bir dizi ilişkili SNP'yi tespit eder ve çoklu testler için düzeltmeleri aşırı derecede muhafazakar hale getirir. Ek olarak, modern GWAS verilerinin yüksek boyutluluğu, hesaplama açısından yoğun olan permütasyon testleri gibi GWAS prosedürleri için önemli zorluklar ortaya çıkarmaktadır. İlk önce genomu birçok büyük örtüşmeyen pencereye bölen ve SNP verilerini bağlı lokus kümeleri içindeki bağımsız PC'lere özetlemek için boyutsal indirgeme araçları olarak temel bileşen (PC) analizi ile birlikte bağlantı dengesizliği ağ analizini kullanan küme tabanlı bir GWAS yaklaşımı öneriyoruz. yüksek LD ile. Ardından, bu tür yüksek boyutlu veriler üzerinde ilişkilendirme testlerini verimli bir şekilde yürütebilen tek ve çok konumlu modelleri tanıtıyoruz. Yöntemler, farklı model yapılarına uyarlanabilir ve vahşi veya iki ebeveynli F'den toplanan örnekleri analiz etmek için kullanılabilir.2 Ekolojik genetik haritalama çalışmalarında yaygın olarak kullanılan popülasyonlar. Yaklaşımlarımızın performansını bir tesisten halka açık iki veri seti ile gösteriyoruz (Arabidopsis thaliana) ve bir balık (pungitius pungitius), simüle edilmiş verilerle birlikte.

Lütfen dikkat: Yayıncı, yazarlar tarafından sağlanan herhangi bir destekleyici bilginin içeriğinden veya işlevinden sorumlu değildir. Herhangi bir sorgu (eksik içerik dışında) makale için ilgili yazara yönlendirilmelidir.


Tavuk popülasyonlarında karmaşık ve uzun menzilli bağlantı dengesizliği ve bunun Marek Hastalığı direnci için QTL ile ilişkisi

Tavuk uzun menzilli bağlantı dengesizliği (LRLD) ve LD blokları ve bunların daha önce tarif edilen Marek Hastalığı (MD) kantitatif özellik lokus bölgeleri (QTLR'ler) ile ilişkileri bir F'de incelenmiştir.6 tam kardeş gelişmiş çapraz çapraz hattan (FSAIL) ve sekiz ticari saf katman hattından popülasyon. Genom genişliğinde LRLD, F'de çalışılmıştır.6 Affymetrix HD 600K SNP dizisi tarafından genotiplenen sentetik olmayan ve sentetik işaretçi çiftlerinin rastgele örnekleriyle popülasyon. QTLR'ler ile ilişkiyi göstermek için, MD QTLR'ler içindeki ve arasındaki LRLD ve LD blokları, aynı F kullanılarak QTLR'lerdeki tüm dizi işaretleyicilerinin olası tüm işaretleyici çiftleri tarafından incelenmiştir.6 MD haritalama çalışmasında kullanılan sekiz satırdaki QTLR elemanlarının belirteçlerinin QTLR genotipleri ve genotipleri. LRLD, ≥ 1 Mb mesafede r 2 ≥ 0.7 olarak tanımlandı ve tüm sentenik işaretçi çiftlerinin %1,5'i LRLD olarak sınıflandırıldı. Birkaç yüz ila birkaç milyon baz arasında değişen mesafelerde karmaşık parçalanmış ve iç içe geçmiş LD blokları bulundu. MD QTLR'lerin ikisi arasında geniş yüksek, uzun menzilli ve karmaşık LD bulundu. Çapraz QTLR'ler STRING ağları ve gen etkileşimleri, bu istisnai QTLR'lerin LD'sinin olası kökenlerini önerdi. Bu nedenle, nedensel mutasyonlar, daha önce takdir edilenden çok daha büyük bir işaretleyiciden çok daha büyük bir mesafeye yerleştirilebilir. LRLD range and LD block complexity may be used to identify mapping errors, and should be accounted for while interpreting genetic mapping studies. All sites with high LD with a significant marker should be considered as candidate for the causative mutation.


Tartışma

This study provides an overview of LD in the Thoroughbred using a high density SNP panel. Validation work by Khatkar et al. (2008) on their cattle data suggests that our sample size of more than 800 horses is more than sufficient to obtain an unbiased picture of LD in our population. The pattern of decline of LD with distance in this population is consistent with that reported by Wade et al. (2009) in a sample of 24 Thoroughbreds, with both data sets exhibiting a decrease in r 2 from ∼0.6 to 0.2 when the distance between markers is increased to 0.5 Mb. The LD observed is higher at short distances and more extensive than that observed in human populations ( Shifman et al. 2003). Linkage disequilibrium declines more slowly in our population than in the range of cattle populations studied by de Roos et al. (2008) , with r 2 remaining above 0.3 for distances up to 185 kb in our data, compared with a maximum distance of 35 kb in the cattle data.

ortalama değeri r 2 between non-syntenic SNPs was 0.0018, and this provides an approximation of the LD that can be expected by chance, assuming that the markers used have not undergone simultaneous selection. The value observed here is lower than, but of a similar magnitude to, that observed by Khatkar et al. (2008) in a sample of over 1500 cattle (0.0032). The mean non-syntenic r 2 value reflects both sampling of animals and genetic sampling (drift), and hence may be expected to decrease with increases in both sample size and Ne. Therefore, the larger non-syntenic value in Australian Holstein–Friesian cattle may more reflect a lower Ne in this cattle population. The low LD seen between non-syntenic SNPs in our population suggests that the LD created by admixture during breed formation ( Hill et al. 2002 ) has declined to negligible levels for these markers. A similar decline of LD between non-syntenic markers was observed in Coopworth sheep approximately ten generations after the foundation of the breed through crossing ( McRae et al. 2002). At distances greater than 100 Mb, average r 2 between syntenic SNPs is reduced to non-syntenic or background levels, and is no longer a function of distance. This is expected, as the recombination rate at such distances approaches 0.5.

By using Sved’s (1971) formula for the expectation of r 2 , a non-linear regression model was fitted to the data to describe the relationship between linkage distance and LD. Without making any assumptions about the value of r 2 at the intercept, estimates of a ve B, as predicted using Eq. 3 and averaged over all autosomes, were 2.25 and 103, respectively. Parametre a determines the value of expected r 2 when the line crosses the y-axis (i.e. when the distance between markers is effectively zero). Our estimate of a supports an alternative version of Sved’s (1971) equation, derived by Tenesa et al. (2007) , which takes into account mutation and puts a equal to two, whilst at the same time raising the question of whether fixing a to unity in the model (as in Abasht et al. (2009) , Toosi et al. (2010) and Zhao et al. (2005) ) is appropriate. The impact of such model assumptions are explored in Corbin et al. (2010) . The heterogeneity of variance associated with the observed r 2 , such that the variance of r 2 declined with increasing distance between markers, may also have impacted on our results. We observed a significant negative relationship between chromosome length (cM) and estimates of B from the non-linear model, suggesting LD is higher in longer chromosomes. This contrasts with the findings of Tenesa et al. (2007) , who observed a positive relationship, but is in keeping with the observations of Khatkar et al. (2008) and Muir et al. (2008) in domestic livestock species.

Our estimate of B (103) is an estimate of Ne assuming constant population size. However, this assumption is difficult to sustain, and therefore, B more likely represents a conceptual average Ne over the period inferred from the marker distance range, for example see Toosi et al. (2010) . For this reason, Fig. 5 shows the results following the approach of Hayes et al. (2003) by calculating historical Ne, assuming linear population growth. The pattern observed shows a decrease in Ne up until around 20 generations ago, followed by an increase until one generation ago. The interpretation of such trends is difficult, with the observed dip in Ne potentially representing any one of a number of scenarios, including a founder event, an immigration event, a hybridization event or any combination of these ( Wang 2005 ). Therefore, it is useful to consider our observation in the context of what is known about the Thoroughbred’s demographic history.

Documentary evidence suggests that the Thoroughbred was derived from a cross between sires originating from the Mediterranean Middle East and British native breeds, and the breed was established during the seventeenth century ( Hill et al. 2002). It is not clear from published literature what effects an admixture like this would have on patterns of estimated Ne prior to the crossing event, although clues may be observed in Toosi et al. (2010) . However, what may be predicted is that such a crossing event would appear as a bottleneck in the population, creating an initially high level of LD in the beginning. Therefore, one might infer from our results that the lowest point of the curve reflects the point at which the breed was formed this approximately coincides with the findings of Mahon & Cunningham (1982) that Thoroughbreds born in the 1960s were separated from seventeenth century founders by an average of 21.5 generations. Cunningham et al. (2001) also found evidence for a population bottleneck at the time of breed formation.

The reliability of this method depends both on the technical implementation ( Corbin et al. 2010 ) and, as discussed above, on the demographic history of the breed. Some calibration of the accuracy of the Ne profile presented can be obtained by comparison with values obtained from pedigree analyses. For example, Cunningham et al. (2001) calculate the effective number of studbook founders of the Thoroughbred to be 28.2. As this relies on calculating the long-term contributions of the founders, quantitative genetic theory ( Woolliams & Bijma 2000 ) suggests that the Ne for this generation is twice this value if in HWE, providing an estimate of 56 soon after breed formation. This may be compared with the minimum Ne of 88 obtained in this analysis, which gives fair agreement. A further estimate of reliability can be obtained by comparing the mean inbreeding of 0.125 (SE 0.005) obtained by Mahon & Cunningham (1982) for the 21.5 generations from breed foundation to 1964 with the accumulated inbreeding for generations four to 25 (assuming four generations since 1964) using , with Ne being estimated from Fig. 5. The value obtained of 0.112 is remarkably close. Therefore, our minimum of Ne ≈ 90 is of the correct magnitude, and the increase in Ne over the last ten generations may be explained by an increase in actual population size. In Thoroughbreds, with low reproductive rate of the mare and the ban upon use of artificial insemination, there is a greater likelihood that increases in census size will be translated into effective population sizes. The trend in Ne observed in the most recent generations should be interpreted with caution because of the technical limitations of the methods.

Implications for genome-wide association studies, marker-assisted selection and genomic selection

The extent of LD in a population can be used to estimate the SNP density required for GWAS studies to be effective, as well as giving some indication as to the likely precision with which the QTL region will be located. The required sample size is said to be inflated by 1/r 2 , when it is necessary to rely on marker-QTL LD, rather than on the QTL itself ( Du et al. 2007 ), and this has prompted authors to propose thresholds for useful LD. The term ‘useful LD’ has been described as the proportion of QTL variance explained by a marker ( Zhao et al. 2005 ), and the consensus is that an average r 2 > 0.3 will permit reasonable sample sizes to be employed for GWAS ( Ardlie et al. 2002 Du et al. 2007 Khatkar et al. 2008). In this dataset, markers 185 kb apart achieve an average LD of r 2 = 0.3, and this corresponds to approximately 14 500 evenly spaced markers across the genome. However, because markers with r 2 = 1 will likely be excluded in genomic selection, and given the high variability of r 2 values at small distances, this is likely to be an underestimation of the actual number of SNPs needed. Indeed, in this study, whilst markers separated by less than 250 kb had a mean r 2 of 0.32 (after the exclusion of those pairs in complete LD), less than half the SNP pairs exhibited r 2 values of greater than 0.3. With MAS also relying on close and consistent linkage between markers and QTL, the high LD observed here is promising. Genomic selection (GS) appears to be effective at lower average r 2 than that required for GWAS, with simulation results demonstrating accuracies of up to 0.65 with an average r 2 between adjacent SNPs as low as 0.2 and a trait heritability of 0.1 ( Calus et al. 2008). Deterministic equations derived by ( Daetwyler et al. 2009 ) demonstrate that the accuracy of GS can be expressed as a function of the effective number of loci (Me) in a population. me relates to the number of independent chromosome segments and, given our current Ne estimate of ∼180 and assuming a random mating population, the Me for our population is ∼1500 ( Meuwissen 2009 ). Thus, we are now able to predict the potential accuracy of GS in this population for a range of scenarios.

In summary, we used dense SNP genotype data to characterize LD and make inferences regarding ancestral Ne for a large sample of Thoroughbred horses. In the population studied, LD extended for long distances, reaching baseline levels at around 50 Mb. From the decay in LD with distance, we inferred ancestral Ne and observed a decrease in Ne since the distant past, which reached a minimum of ∼90 20 generations ago, followed by an increase until the present time. Such an approach could be used to investigate the demographic histories and rates of inbreeding of horse breeds with less extensive pedigree records than the Thoroughbred. The results indicate that genomic methodologies which are reliant on LD between markers and QTL have the potential to perform well within Thoroughbred populations genotyped for the 50-K SNP chip.


Basic Genetics

David P. Clark , . Michelle R. McGehee, Moleküler Biyolojide (Üçüncü Baskı), 2019

8.1 Recombination During Meiosis Ensures Genetic Diversity

However, the alleles A, B, and C (or a, b, and c) do not always stay together during reproduction. Swapping of segments of the chromosomes can occur by breaking and rejoining of the neighboring DNA strands. Note that the breaking and joining occurs in equivalent regions of the two chromosomes and neither chromosome gains or loses any genes overall. The point at which the two strands of DNA cross over and recombine is called a chiasma (plural, chiasmata) . The genetic result of such karşıya geçmek , the shuffling of different alleles between the two members of a chromosomal pair, is called recombination ( Fig. 2.21 ). The farther apart two genes are on the chromosome, the more likely a crossover will form between them and the higher will be their frequency of recombination. Recombination frequency is an important value for a geneticist, and the values range between 0% or 0, which means that the two genes are so close together, they are always found in the same progeny after a mating, to 50% or 0.5, which means that the two genes are so far apart that they appear to be on separate chromosomes.

Figure 2.21 . Linkage of Genes and Recombination During Meiosis

At the top, the two members of a chromosome pair are shown, each carrying different alleles. Because the three alleles A, B, and C are on the same molecule of DNA, they will tend to stay together. So if the offspring inherits allele A from one parent, it will usually get alleles B and C, rather than b and c. If recombination occurs during meiosis, the DNA breaks and the chromosomes rejoin such that part of one chromosome is exchanged with the homologous partner. Now, the offspring can receive allele A with alleles b and c from one parent.

This type of recombination occurs during meiosis, the process that reduces the genome from diploid to haploid. The process of meiosis is divided into two parts, meiosis I and meiosis II ( Fig. 2.22 ). Table 2.01 describes the events that occur at each stage of meiosis. In a typical diploid organism, there are two homologs for each chromosome inside the normal cell. After a single round of DNA replication, there are four different copies of each chromosome, two copies of homolog 1 and two copies of homolog 2. These are attached at their centromeres and form what is called a tetrad .

Figure 2.22 . Meiosis Forms Haploid Gametes

This figure demonstrates how the diploid cell forms four haploid gametes during a special cell division called meiosis. Only one homologous chromosome (red and green) is shown for clarity, but it has undergone DNA replication to create two copies of each homolog.

BölümStage of MeiosisSubstage of Prophase IChromosome Structure
MEIOSIS IProfaz ILeptonemaTetrads begin to condense
ZygonemaHomologous chromosomes begin to pair up
PachynemaHomologous chromosomes are fully paired recombination occurs
DiplonemaHomologous chromosomes separate (except at the centromere) chiasmata are visible
DiakinesisPaired chromosomes condense further and attach to spindle fibers
metafaz I Paired tetrads align at the middle of the cell
anafaz I Homologous chromosomes split so that two copies move to each half of the cell
Telophase I Two new nuclei form, each containing a set of two sister chromatids
MEIOSIS IIProfaz II Each chromosome condenses once again and start to attach to spindle fibers
metafaz II Chromosomes align in the center of each new cell
Anafaz II Each of the sister chromatids separates and moves to each side of the new cell
Telofaz II Chromosomes decondense and two new nuclei form
Cytokinesis Each of the two cells divides, completely forming four new cells, each containing one copy of each chromosome (a haploid genome)

When cells are in the substages of meiosis I, the genetic information on each of the four copies of the chromosomes aligns perfectly, matching gene for gene along the entire length of each chromosome. When the chromosomes are in this state, genetic information is exchanged with the other copies, forming new genetic combinations. The alignment stage, called sinaps , occurs due to a set of conserved proteins that link the chromosomes. These proteins form a structure where the DNA of each pair of homologous chromosomes is linked together with a zipper-like structure consisting of lateral elements and central elements connected by transverse fibers ( Fig. 2.23 ).

Figure 2.23 . Sinaptonemal Kompleks

The synaptonemal complex is a set of proteins that link the two homologous chromosomes during the zygotema stage of meiosis I. Only one chromosome pair is shown for clarity. The red and green chromosomes form a homologous pair.

Genetic linkage is often defined, from a molecular viewpoint, as the tendency of alleles carried by the same DNA molecule to be inherited together. However, if two genes are very far apart on a very long DNA molecule, linkage may not be observed in practice. In this example, consider a long chromosome, carrying all five genes, A, B, C, D, and E. It can be observed that A is linked to B and C, and that C and D are linked to E, but that no linkage is observed between A and E ( Fig. 2.24 ). Given that A is on the same DNA molecule as B and that B is on the same DNA molecule as C, etc., it can be deduced that A, B, C, D, and E must all be on the same chromosome. In genetic terminology, it is said that A, B, C, D, and E are all in the same bağlantı grubu . Even though the most distant members of a linkage group may not directly show linkage to each other, their relationship can be deduced from their mutual linkage to intervening genes.

Figure 2.24 . Linkage Groups

In this example chromosome, genes A and E are linked even though the recombination frequencies suggest they are not linked. After this parent mates, the percentage of progeny that have a recombination event between the labeled genes is indicated above the chromosome. When the progeny are assayed for the presence of both the A and C allele, there are only 30% that have this combination of genes. When progeny are assayed for the presence of both the C and E allele, about 25% of the progeny have this combination. Since A is linked to C, and C is linked to E, it can be deduced that A and E are on the same linkage group.

The exchange of alleles between homologous chromosomes and independent assortment of chromosomes during anaphase provide all the new combinations of genes to make each person unique.


Videoyu izle: SOSYOLOJİDE ARAŞTIRMA YÖNTEM VE TEKNİKLERİ - Ünite 3 Konu Anlatımı 1 (Ağustos 2022).