Bilgi

Bir Exome genotipleme dizisi için çalışma katılımcılarının dışlanmasına ilişkin bir soru

Bir Exome genotipleme dizisi için çalışma katılımcılarının dışlanmasına ilişkin bir soru


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Lipid seviyeleri ve koroner kalp hastalığı riski ile ilişkili yeni düşük frekanslı ve nadir varyantları keşfetmek için bir Afrikalı-Amerikalı ve Avrupa popülasyonları üzerinde tüm ekzom dizilimini kullanan bir makale okuyorum.

12.000 bireyin ekzomlarının dizilenmesinden keşfedilen kodlama varyantlarına dayalı olarak tasarlanan Illumina Human ekzom genotipleme dizisini kullandılar. Bu nedenle, diziyi tasarlamak için kullanılan 12.000 kişi arasında olmayan bir çalışmadan katılımcılarını seçtiler.

Sorum şu: Diziyi tasarlamak için kullanılan 12.000 kişiden olmayan kişileri neden seçsinler? (Düşünüyorum çünkü belki yanlış pozitif çağrışımlar üretebilir? önyargı?)


Dizileri tasarlarken, yüzeyde algılamak istediğiniz diziyi tamamlayan problara sahip olmanız gerekir. Neyi tespit etmek istediğinize bağlı olarak, bu probları bilinen bir pozisyonda bilinen dizi ile tasarlamanız gerekir. Tek nükleotid polimorfizmlerini (SNP) tespit etmek istiyorsanız, ChIP'nizde temel olarak SNP'nin ve çevreleyen dizinin konumu olan bilinen bir SNP kitaplığına ihtiyacınız vardır.

SNP'ler kabaca iki alt gruba ayrılabilir: yaygın (ben onları böyle adlandırıyorum) ve nadir (nüfustaki sıklığı %0,1'den düşük). Bu ChIP tabanlı yöntemle ilgili sorun, yalnızca halihazırda bilinen (veya en azından bağlantı dengesizliği içinde oldukları bilinen SNP'lere yakın bulunan) SNP'leri tespit edebilmesidir. Dolayısıyla, popülasyon örneğinizde nadir bulunan SNP'leri tespit etmek istiyorsanız, SNP'leri ChIP tasarımınıza dahil ettiğiniz büyük bir insan grubuna ihtiyacınız vardır. Rakamlara bakarsanız, tasarımda kullanılan 12.000 kişiden sadece 12'sinde nadir bir varyant mevcut olacak.

O zaman çalışma grubunuz, ChIP tasarımını yapmak için kullanılan insan grubundan farklıdır. Burada belirli bir geçmişe sahip insanları (örneğin yüksek lipid seviyeleri) alıyor ve ardından koroner kalp problemleri olan kişilerin bu hastalığa bağlı olabilecek ortak SNP'leri olup olmadığını karşılaştırıyorsunuz. Bu, risk faktörü olan bir proteindeki mutasyonu tanımlamaya yardımcı olabilir.


DbGaP Toplama: NHLBI Kalp Yetmezliği ile İlgili dbGaP Verileri (IRB gereksinimi yok)

Ulusal Kalp, Akciğer ve Kan Enstitüsü (NHLBI) Büyük Veri Analizi Zorluğu: Kalp Yetmezliği için Yeni Paradigmalar Yaratma Araştırması sonuçlandı. NHLBI, bu veri koleksiyonunu araştırma topluluğunun kullanımına sunmaya devam edecektir.

NHLBI Büyük Veri Analizi Zorluğu: Kalp Yetmezliği Araştırmaları için Yeni Paradigmalar Yaratmak için Veri Toplama ile ilgili geçmiş bilgiler aşağıdadır.

Ulusal Sağlık Enstitüleri'nin (NIH) bir parçası olan Ulusal Kalp, Akciğer ve Kan Enstitüsü (NHLBI), NHLBI Büyük Veri Analizi Zorluğu için yeni Çözümler davet ediyor: Kalp Yetmezliği Araştırmaları için Yeni Paradigmalar Yaratmak. Zorluğun amacı, kalp yetmezliği araştırmalarında yeni paradigmaları belirlemek için büyük ölçekli NHLBI tarafından finanse edilen veri kümelerini kullanan hesaplamalı analiz ve makine öğrenimi yaklaşımlarında yeniliği teşvik etmektir. Zorluk, temelden klinik ortamlara kadar kalp yetmezliği araştırma alanlarında yeni araştırma hipotezleri ve araç geliştirme için bir sıçrama tahtası olarak hizmet etmek üzere yetişkin kalp yetmezliğinin alt kategorilerini tanımlayabilen yeni açık kaynaklı hastalık modellerine olan ihtiyacı ele almayı amaçlamaktadır.

NHLBI, uzun süredir devam eden, derinlemesine fenotiplenmiş epidemiyolojik kohortlar, yenilikçi klinik deneyler ve tüm genom dizilimi ve "diğer omik" verileri oluşturan büyük ölçekli hassas tıp çabaları dahil olmak üzere derin veri kaynaklarının oluşturulmasına önemli yatırımlar yapma geçmişine sahiptir. yüz binden fazla kişi için. NHLBI'nin kalp yetmezliği verilerini içeren sayısız çalışmasındaki verilere kolay erişim sağlayan katılımcılara, NHLBI bu dbGaP çalışma koleksiyonunu oluşturdu. Bu koleksiyon için veri erişimi, NHLBI'nin Veri Erişim Komitesi tarafından kontrol edilir. Yarışma katılımcılarının, orijinal veri setlerindeki kullanım kısıtlamalarını ve onay talimatlarını izlemeleri gerekmektedir. Lütfen bu koleksiyondaki verilerin çalışmalar arasında uyumlu hale getirilmediğini veya orijinal çalışmadan farklı şekilde değiştirilmediğini unutmayın.

NHLBI Büyük Veri Analizi Zorluğu: Kalp Yetmezliği Veri Toplama, şu anda dbGaP'de bulunan ve kalp yetmezliği araştırmalarıyla ilgili olabilecek verileri içeren tüm NHLBI çalışmalarını içerir. Bu koleksiyondaki çalışmalar, Genel Araştırma Kullanımı (GRU), Sağlık/Tıbbi/Biyomedikal Kullanım (HMB) veya Kalp yetmezliği araştırmalarına izin veren Hastalığa Özgü Kullanım (DS) için onaylanmıştır. Bu çalışmalar, çeşitli çalışma tasarımlarını, dahil etme ve hariç tutma kriterlerini, örnek boyutlarını kapsar ve çalışma katılımcıları hakkında geniş ve derinlikli fenotip verileri sağlar. Bu çalışmalarda mevcut genomik veriler, genotipleme dizileri, dizileme (hedeflenen, ekzom, tüm genom) ve ek -omik veriler (örn., RNA veya metabolit profilleri) dahil olmak üzere değişiklik gösterir. Çalışma verilerinin nasıl toplandığı hakkında daha fazla bilgi edinmek için lütfen her çalışmanın bireysel erişim sayfasına bakın.

Yarışma katılımcılarına, dbGaP'ye ek olarak, NHLBI'nin Biyolojik Numune ve Veri Deposu Bilgi Koordinasyon Merkezi'nin (BioLINCC) kalp yetmezliği ile ilgili verileri toplayan başka çalışmaları içerdiği ve Çözümlerinin geliştirilmesinde BioLINCC verilerini kullanmak isteyebilecekleri hatırlatılır.

Her bir çalışmanın geçmişi hakkında daha fazla bilgi edinmek için lütfen bu koleksiyondaki her çalışma için bireysel erişim sayfasına bakın.


177.882 UK Biobank katılımcısının ekzom dizilimi yoluyla nadir varyantların insan hastalığının genetik mimarisine katkısının araştırılması

UK Biobank (UKB), detaylı fenotipik verileri ve tıbbi kayıtlarla bağlantısı olan 502.543 katılımcının eşi benzeri görülmemiş bir nüfus tabanlı çalışmasını temsil etmektedir. Bu kohort için genotipleme dizisi verilerinin serbest bırakılması, ortak varyantlar için genomik keşfi desteklerken, nadir varyantların bu geniş fenotip koleksiyonuna katkısı nispeten bilinmemektedir. Burada, 10.533 ikili ve 1.419 kantitatif fenotip ile nadir protein kodlayan varyantlar arasındaki ilişkiyi değerlendirmek için 177.882 UKB katılımcısından gelen ekzom sıralama verilerini kullanıyoruz. Hem değişken düzeyinde fenomen çapında ilişkilendirme çalışması (PheWAS) hem de nadir varyantların toplam katkısını tespit etmek için uyarlanmış gen düzeyinde çöken analiz tabanlı PheWAS gerçekleştirdik. İkincisi, ikili özellikler için 15.7 medyan olasılık oranı ile istatistiksel olarak anlamlı 911 gen-fenotip ilişkisi ortaya çıkardı. Çöken analiz kullanılarak tanımlanan ikili özellik ilişkileri arasında, %83'ü tek varyant ilişkilendirme testleri kullanılarak tespit edilemezdi ve bu, yüksek alelik heterojenlik ayarında sinyali tespit etmek için çöken analizin gücünü vurguladı. Bir bütün olarak, bu genotip-fenotip ilişkileri, işlev kaybı aracılı özellikler ve şu anda onaylanmış ilaç hedefleri için önemli ölçüde zenginleştirildi. Bu sonuçları kullanarak, UKB fenomeni bağlamında yaygın hastalıklara nadir varyantların katkısını özetliyoruz ve yeni gen-fenotip ilişkilerinin terapötik hedef önceliklendirmeye nasıl yardımcı olabileceğine dair bir örnek sunuyoruz.


Sonuçlar

2006 ve 2011 yılları arasında, MeninGene çalışmasına 21 bakteriyel menenjitli 656 hasta dahil edildi. Bu hastaların 469'unda (%72) pnömokok menenjiti vardı. Kalite kontrol filtrelerinden sonra 408 pnömokok menenjit hastası ve 2072 kontrol menenjit hastalığına yatkınlık için genetik ilişki analizine dahil edildi. Başarılı genotiplendirilmiş hastaların demografik ve klinik verileri Tablo 1'de bulunabilir. Tüm monomorf ve cinsiyet kromozomu varyantlarının dışlanmasından sonra toplam 100.464 tek nükleotid polimorfizmi (SNP), >%95 çağrı oranı ve Hardy Weinberg dengesi kalite kontrol eşiklerini geçti ve ilişkilendirme analizine dahil edilmiştir.

Tüm varyasyonlar dahil edildiğinde genomik kontrol parametresi λ 0.31 idi. Bu, nadir varyantlar ve% 0.01'in altında küçük bir alel frekansına sahip varyantların hariç tutulması, λ'yı 0.93'e yükseltti (Ek Şekil 1). Bu nedenle, tekli markör analizimiz için minör alel frekansı %0.01'den yüksek olanları dahil ettik.

Test edilen genetik varyantların hiçbiri Bonferroni düzeltilmiş anlamlılık eşiğine ulaşmadı (p-değeri <5 × 10-7). Pnömokok menenjiti ile ilişkili altı genetik varyant, 1 × 10 −4'ten daha düşük p değerlerine ulaştı (Şekil 1). En güçlü sinyalimiz, kolajen tip XI alfa 1'deki yanlış algı rs139064549 idi (COL11A1) geni (p = 1.51 × 10 −6 G allel OR 3.21 [95% CI 2.05–5.02]) ve ikinci en güçlü, ekzokist kompleksi bileşeni 6B'deki intron varyantı rs9309464 idi (EXOC6B) gen (p = 6,01 × 10 -5 G allel OR 0,66 [%95 CI 0,54-0,81] Tablo 2). P değeri 1 x 10-4'ten düşük olan bu altı varyanttan üç varyant, fibröz kılıf CABYR bağlayıcı proteine ​​yerleştirildi (FSCB) geni, yani rs3809429 (p = 6.80 × 10 −5 A-allel OR 1.65 [%95 CI 1.30–2.09]), rs3825630 (p = 6.80 × 10 −5 G allel OR 1.65 [%95 CI 1.30–2.09]) ve rs1959379 (p = 8.81 × 10 -5 A allel VEYA 1.64 [%95 CI 1.30–2.09]). Altıncı varyant rs617169 (p = 7.33 x 10 −5 G allel OR 0.72 [%95 CI 0.61-0.85]) bir gen içinde yer almıyordu, ancak en yakın gen protein kinaz N2 idi (PKN2) 2. kromozomda bulunur.

p değerlerinin Manhattan grafiği.

Y ekseni –log'u gösterir10 İlişkilendirme analizindeki SNP'lerin (p-değerleri) ve x ekseni kromozomal pozisyonu gösterir. Yatay mavi çizgi, p = 1 × 10 −4 eşiğini gösterir. En yüksek çağrışım sinyaline sahip üç genin tüm belirteçleri, yani COL11A1 (rs139064549, p-değeri = 1.51 × 10 -6 , konum kromozomu 1), EXOC6B (rs9309464, p-değeri = 6.01 × 10 -5 , konum kromozomu 2) ve FSCB (rs3809429, rs3825630 rs1959379, p-değeri = 6.80 × 10 -5 , 6.80 × 10 -5 , 8.81 × 10 -5 konum kromozomu 14 ile), yeşil renklendirilmiştir.

Tek markör analizinde, MAF'si %0.01'in altında olan varyantları dahil etmedik. Bu nadir varyantların pnömokok duyarlılığının ilişkilendirme testindeki rolünü değerlendirmek için, bir gen bölgesindeki tüm yaygın ve nadir varyasyonları dahil etmemize olanak sağlayan bölge bazlı dizi çekirdeği ilişkilendirme testini (SKAT) kullandık. SKAT analizini kullanarak, önemli bir ilişkili gen bulduk: COL11A1 (p = 1.03 × 10 -7 ). Bu analizde toplam 12968 gen setini test ettik ve bu çoklu testler için düzeltme yaptıktan sonra COL11A1 p = 0,001 anlamlılığına ulaşır. p-değerinde fark yok COL11A1 vaka-kontrol dengesizliği oranı düzeltilirken gözlemlendi. SKAT analizindeki en güçlü ikinci sinyal polimeraz (DNA yönlendirmeli) lambda (ANKET) geni (p = 8.10 × 10 -5 ), çoklu test düzeltmesinden sonra anlamlı değildi. Vaka-kontrol dengesizliği oranı için bu p değeri düzeltildiğinde, ilişki biraz daha anlamlıydı (p = 7.05 × 10 -5 ). Ayrıca, nadir varyantlar eşiği toplam numune boyutunun bir fonksiyonu olarak tanımlandığında, yaygın ve nadir varyantların bir kısmının pnömokok menenjit duyarlılığı ile ilişkileri sürdürüp sürdürmediğini de inceledik 22 . Bu analiz sadece şunu gösterdi: ANKET (p = 1.90 × 10 −5) bu ilişki, yaygın ve nadir varyantların oranına dayanıyordu, ancak bu, çoklu test için düzeltme yapıldıktan sonra genom çapında anlamlılığa ulaşmadı.


Yöntemler ve analiz

Bu GWAS, Genetik İlişkilendirme Çalışmalarının Raporlanmasının Güçlendirilmesi yönergelerini takip eder. 25 Çalışma prosedürünün bir akış şeması şekil 1'de detaylandırılmıştır.

Çalışma prosedürü. Grafik, işe alımdan veri analizine kadar çalışma prosedürünü detaylandırır. Sarı kutular yeni prosedürleri temsil eder yeşil kutular veri üretimini ve toplama mavi kutular bir prosedür adımını gösterir. AITC, alil izotiyosiyanat BMI, vücut kitle indeksi CANDELA, Latin Amerika'nın Çeşitlilik ve Evriminin Analizi Konsorsiyumu CDT, soğuk algılama eşikleri GWAS, genom çapında ilişkilendirme çalışması HPT, ısı ağrısı eşiği MPT, mekanik ağrı eşiği PC'leri, ana bileşenler PPT , basınç ağrı eşiği QST, kantitatif duyusal test TSL, termal duyusal kireç VDT, titreşim algılama eşiği VAS, Görsel Analog Ölçek WDT, sıcak algılama eşikleri WUR, sarma oranı.

Katılımcılar

Kolombiya'nın Medellin kentinde, yerel üniversitelerdeki duyuru panoları, el ilanları dağıtımı ve yerel yazılı basın aracılığıyla 18'inci yaşlarındaki sağlıklı katılımcılar işe alınacaktır. Ayrıca, Latin Amerika'nın Çeşitlilik ve Evriminin Analizi Konsorsiyumu'ndan önceki katılımcıları bu projeye katılmaya davet ediyoruz.

Sağlıklı genç katılımcıları işe almanın GWAS çalışmalarında avantajları vardır. Biyolojik ağrı duyarlılığı yollarını etkileyebilecek tespit edilmemiş hastalıklara veya diğer sorunlara sahip olma olasılıkları daha düşüktür. Gençler ayrıca, ağrı duyarlılığını etkileyebilecek çevresel (dış) faktörlerden kaynaklanan genel birikmiş maruziyet veya risklere daha az sahip olacaklardır. Bu tür faktörler, katılımcıların ağrı algılama tepkisinin genel değişkenliğini arttırır ve genetik nedenleri tespit etme gücünü azaltır. Çoğu özellik, genetik ve çevresel faktörlerin bir kombinasyonundan etkilendiğinden, CANDELA dahil olmak üzere birçok çalışma, genetik varyant keşfi için genç katılımcıları kullanma eğilimindedir. 27

Katılımcılar, kronik ağrıları veya herhangi bir kronik tıbbi durumu (örneğin diyabet, nörodejeneratif, kas-iskelet sistemi veya psikiyatrik durumlar) varsa hariç tutulacaktır. Halihazırda analjezik, antiinflamatuar, opioid, antihistaminik, antidepresan veya antiepileptik ilaç kullanan katılımcılar çalışma dışı bırakılacaktır. Hamile olan veya adet döneminde olan (kendi beyanı ile) kadınlar çalışma dışı bırakılacaktır. Katılımcılara testten sonraki 1 saat içinde sigara içmemeleri veya kahve tüketmemeleri ve testten önceki 8 saat içinde psikoaktif maddelerden veya alkolden kaçınmaları tavsiye edilecektir. Diğer dışlama kriterleri arasında, kolu etkileyen dermatomal, travmatik veya enfeksiyöz durumlar ve herhangi bir ilaç, malzeme, yiyecek veya böcek ısırmasına karşı şiddetli alerjik reaksiyon öyküsünün yanı sıra mevcut veya geçmişte kendi kendine yaralanan yaralanmalar yer alır. Orta ila şiddetli anksiyetesi (Hamilton Anksiyete Derecelendirme Ölçeği 28'de � ) veya şiddetli depresyonu (16 maddelik Depresif Semptomatolojinin Kendi Bildirdiği Hızlı Envanterinde 㸕 (QIDS-SR16) 29 olan katılımcılar çalışmadan çıkarılacaktır. İşe alım Ocak 2013'te başladı ve yaklaşık 5'x020137 yıl sürmesi bekleniyor.

Prosedür

Katılımcılar, Universidad de Antioquia, Medell'deki nicel duyusal test (QST) laboratuvarında tek bir randevuya katılacaklardır. Bilgilendirilmiş rızanın ardından, yaş ve beyan edilen cinsiyet kaydedilecek ve katılımcılar beyan ettikleri ataları ile ilgili soruları yanıtlayacaktır (çevrimiçi ek ek 1'e bakınız). Boy ve kilo ölçülecek ve vücut kitle indeksi (BMI) hesaplanacaktır. Anksiyete gibi psikolojik faktörler, deneysel ağrı testi sırasında ağrı algısını etkileyebileceğinden, 30 katılımcı Hamilton Anksiyete Derecelendirme Ölçeği ve QIDS-SR16'nın İspanyolca versiyonunu tamamlayacaktır. QIDS-SR16, diğer depresyon puanları 31 ile karşılaştırıldığında kabul edilebilir bir iç tutarlılığa ve orta ila güçlü eşzamanlı geçerliliğe sahiptir ve İspanyolca versiyonu yeterli test tekrar test güvenilirliği ve yüksek iç tutarlılık göstermektedir. 32 Hamilton Anksiyete Derecelendirme Ölçeği, değerlendiriciler arası ve testin tekrar test güvenilirliğinin 33 yüksek ve yapı geçerliliğinin iyi olduğunu göstermiştir. 34

Yardımcı veriler

Nadir durumda duyusal fonksiyonun değerlendirilmesi

Yok durumda ve nosiseptif sensitizasyonu takiben duyusal işlevi belirleyeceğiz. Temel duyusal işlev, belirli statik ve dinamik QST kullanılarak değerlendirilecektir. Bunlar, bir ThermoTester (Q-sense, Medoc, İsrail, 30휰 mm termode boyutu) kullanan soğuk algılama eşiği ve sıcak algılama eşikleri, termal duyusal kireç ve ısı ağrısı eşiklerini (HPT) içerir. Termal eşiklerin kaydı, yayınlanmış QST yönergelerine kesinlikle uyacaktır. 35 Mekanik ağrı eşikleri (MPT), farklı kuvvetler (9.8, 13.7, 19.6, 39.2, 58.8, 78.5, 98.1, 147.1) uygulayan 20 parça von Frey saç seti (Touch Test, North Coast, ABD) kullanılarak değerlendirilecektir. , 255.0, 588.4, 980.7, 1765.2, 2942.0 mN). Von Frey kılları, 9,8mN temel uyarandan başlayarak, katılımcılar uyaranı ilk kez keskin (iğneleme) olarak algılayana kadar artan sırayla 2×02009s açık, 2×02009s oranında uygulanacaktır. Daha sonra, uyaran künt olarak algılanıncaya kadar kıllar azalan sırada uygulanacaktır. Beş dizi artan ve azalan uyaranın geometrik ortalaması MPT olarak tanımlanır. Kurma oranı, tek bir uyarıcı için Görsel Analog Skala (VAS 0�) üzerinde sayısal ağrı derecelendirmeleri ile belirlenecek ve ardından aynı 1𠂜m2 içinde 1 Hz'de uygulanan 10 uyarıcıdan oluşan bir tren için ortalama ağrı derecesi belirlenecektir. 255 mN von Frey saçı kullanarak. Bu, beş kez tekrarlanacak ve oran, uyaran dizilerinin ortalama derecelendirmesinin, tek uyaranların ortalama derecesine bölünmesiyle belirlenecektir. Titreşim algılama eşikleri (VDT), bir Rydel-Seiffer ayar çatalıyla 3 kaybolma eşiğinin ortalaması kaydedilerek belirlenecektir. Basınç ağrı eşikleri (PPT), manuel bir algometre (Wagner Instruments, Greenwich, Connecticut, USA) ve analiz için kullanılan ortalamaları ile üç kopya halinde kaydedilecektir.

Test edilecek taraf rastgele seçilecek ve hastalar, test kolunda gerçek ölçümler yapılmadan önce, kontrol tarafındaki ön koldaki duyusal testlere aşina olacaktır. VDT (ulnar stiloid) ve PPT (tenar kaslar) hariç tüm testler ön kolun volar tarafının yarısında yapılacaktır.

Hardal yağı nosiseptif duyarlılığı uyandırdı

Temel duyusal ölçümlerden sonra, ön kol üzerinde 1×02009cm'lik artışlarla her biri sekiz nokta içeren sekiz kollu bir yıldızı işaretlemek için bir asetat şablonu kullanılacaktır (şekil 2). Başlamadan önce 32×000b0C sıcak termode yıldızın merkezine 5×02009dk süreyle yerleştirilerek cilt sıcaklığı standartlaştırılacaktır. Daha sonra, daha önce yapıldığı gibi hardal yağı (zeytinyağı içinde %30 oranında seyreltilmiş AITC (Sigma) kullanarak) kullanarak bir duyarlılık paradigması uygulayacağız. 36 Hardal yağının aktif bileşeni olan AITC, TRPA1 iyon kanalını aktive eder ve ciltte parlama ve nosiseptif hassasiyet uyandırır. 37 Hardal yağına batırılmış küçük bir pamuklu çubuk, ön koldaki 0.64'lük bir alana uygulanacak ve bir Tegaderm (3M) ile 10'x02009dk boyunca yerinde tutulacaktır. 36 ਋u süre boyunca, 0 ila 100 arasında değişen bir elektronik VAS kullanılarak her 30 'da bir ağrı skorları kaydedilecektir. 10𠂝k sonra hardal yağı çıkarılacak ve cilt parlama alanı en yakın noktaya kaydedilecektir. Her bir kolda 0,5𠂜m. 7 Bitişik ispitlerdeki noktalar birleştirilerek sekiz üçgen şekil oluşturulacak ve tüm üçgen parçalar toplanarak toplam alan hesaplanacaktır. İkincil alevlenme alanını (parlama alanı) belirlemek için hardal yağı uygulama alanı toplam alandan çıkarılacaktır.

Alevlenme, noktasal hiperaljezi ve allodini alanını belirleme yöntemi. (A) Volar önkolda 1×02009 cm'lik artışlarla sekiz nokta içeren sekiz kollu bir yıldızı işaretlemek için bir asetat şablonu kullanılır. (B) %30 hardal yağına batırılmış küçük bir pamuklu çubuk yıldızın ortasına uygulanır ve (C) Tegaderm ile 10×02009 dakika yerinde tutulur. Bu süre boyunca, her 30'lu saniyede bir ağrı skorları kaydedilir. (D ve E) Hardal yağının çıkarılmasından sonra, cilt parlaması işaretlenecek ve alan hesaplanacaktır. (F) Fırça ile uyarılmış ve noktasal aşırı duyarlılık alanı, sekiz parmaklığın her noktasında potansiyel aşırı duyarlılığı test ederek sırasıyla bir fırça ve 98.1'lik bir von Frey saçı (resimde) ile belirlenecektir.

Parlama haritasının çıkarılmasından sonra, fırça ile uyarılmış aşırı duyarlılık alanı, dışarıdan başlayarak sekiz çubuk üzerindeki noktaların her birine 1×02009cm uzunluğunda darbeler uygulanarak bir fırça (Nr 5 Senselab, Somedic, İsveç) ile belirlenecektir. duyarlı merkeze doğru hareket eder. Noktasal aşırı duyarlılık alanı, aynı prosedür izlenerek 98.1'lik bir filament (Bailey Instruments, UK) ile belirlenecektir. 36 Parlamaya gelince, hardal yağı uygulamasının birincil alanı, kaydedilen alanlar ikincil hiperaljezi/aşırı duyarlılığı temsil edecek şekilde her iki aşırı duyarlı alandan çıkarılacaktır.

Hardal yağı hassaslaştırmasının ardından, MPT ve HPT, yukarıda tarif edilenle aynı yöntemler kullanılarak tekrarlanacaktır. Tüm postduyarlılık testleri hardal yağının çıkarılmasından sonraki 5𠂝k içinde gerçekleştirilecektir.

Naïve ve hassaslaştırılmış duyusal fonksiyon protokolünün güvenilirliği

Test cihazının güvenilirliğini belirlemek için, aynı araştırmacı tarafından n=12 sağlıklı gönüllülerde 2𠄶 hafta içinde iki farklı durumda gerçekleştirilen duyusal fonksiyon protokolünü tekrarladık. Sınıf içi korelasyon katsayıları (3.1), tüm duyusal test değişkenleri için iyi ila mükemmel uyum ortaya çıkardı (tablo 1). 38

Tablo 1

Duyusal fonksiyon protokolünün kurum içi güvenilirliği

Sınıf içi korelasyon katsayıları%95𠂜IPꃞğeri
CDT0.7280,277 ila 0,9140.003
WDT0.7640,351 ila 0,927π.0001
TSL0.6380.161 ila 0.8780.005
HPT0.7520,339 ila 0,9220.002
MPT0.9280.767 ila 0.979π.0001
WUR0.6340.113 ila 0.8800.012
VDT0.9560,860 ila 0,987π.0001
PPT0.7340,305 ila 0,9150.002
VAS0.8930,667 ila 0,970π.0001
Parlama alanı0.6100.095 ila 0.8690.015
Fırça ile uyarılmış allodini0.7560,365 ila 0,9220.001
noktasal hiperaljezi0.6150,094 ila 0,8710.013
Postsensitizasyon MPT0.9410,808 ila 0,983π.0001
Postsensitizasyon HPT0.7580,339 ila 0,9240.002

CDT, soğuk algılama eşiği HPT, ısı ağrı eşiği MPT, mekanik ağrı eşiği PPT, basınç ağrı eşiği TSL, termal duyusal kireç VDT, titreşim algılama eşiği VAS, Görsel Analog Ölçek WDT, sıcak algılama eşiği WUR, sarma oranı.

Genotipleme

Her katılımcı, DNA ekstraksiyonu için kan veya tükürük (Oragene OG-500, Genotek, Kanada) bağışlayacaktır. DNA örnekleri,  içeren Illumina HumanOmniExpress çipinde genotiplendirilecek

700� işaretleyici. Halihazırda CANDELA GWAS'a katılan gönüllülerde, aynı çip üzerinde genotiplenmiş kan örneklerinden 39 genotip verisi halihazırda mevcuttur ve yeniden kullanılacaktır.

Illumina dizisinden elde edilen tüm genom genotip verileri, sıkı eşikleri geçemeyen herhangi bir belirteç veya numuneyi hariç tutmak için kalite kontrolünden 40 geçirilecektir. Illumina GenomeStudio yazılımındaki genotip çağırma algoritması tarafından sağlanan, GenTrain skoru, küme ayırma skoru ve aşırı heterozigotluk oranları gibi 41 kalite metrikleri, zayıf genotipli SNP'leri filtrelemek için kullanılacaktır. Eksiklik gibi sonraki SNP düzeyinde ve örnek düzeyinde kalite kontrol eşikleri uygulanacaktır. X ve Y kromozomlarının kayıtları ve genetik verileri arasındaki cinsiyet uyuşmazlığı kontrol edilecektir. Yalnızca tüm kriterleri geçen numuneler ve SNP'ler analiz için tutulacaktır. CANDELA genotipli numuneler için şu anda kullanılan kalite kontrol protokolünün detayları çevrimiçi ek 2'de verilmiştir.

Yardımcı veriler

Istatistiksel analiz

Örnek boyutu hesaplama

Değişen numune ve etki büyüklükleri için deneysel ağrı fenotiplerinin GWAS gücü, Visscher'de açıklanan formüller takip edilerek tahmin edildi. ve diğerleri. 42 Mevcut deneysel ağrı çalışmalarından alınan deneysel ağrı fenotipleri için bir dizi etki boyutu için tahmini güç gösterilmektedir. Hesaplamaları gerçekleştirmek ve rakamları üretmek için istatistik yazılımı R V.3.4.1 43 kullanıldı. Kodlar https://github.com/kaustubhad/gwas-power adresinde yayınlanmaktadır.

Tam genomlu SNP tabanlı GWAS çalışmalarında, ilişkilendirme analizi genellikle çok değişkenli bir doğrusal regresyon modeliyle yürütülür; burada özellik değerleri bir SNP genotipine (ek kodlamalı) ve genellikle yaş, cinsiyet, BMI ve genetik temel bileşenler (PC'ler). Genom çapında anlamlı ilişkiler için p value eşiği 39 42 genellikle 5휐 𢄨 , anlamlı anlamlı bir ilişki için eşik ise genellikle 10 𢄥 'dir. Genom çapında ve anlamlı anlamlılık eşikleri ile GWAS'ta gücü hesaplamak için formüller, çevrimiçi ek Ek 3'te sunulur ve mevcut GWAS ayarı için hesaplanan güç, şekil 3'te gösterilir.

Tam genom genotipleme verilerinin kullanılmasına ilişkin standart genom çapında ilişkilendirme çalışmaları (GWAS) ayarları kapsamında tahmini güç (yüzde olarak). (A) Bir ısı haritası olarak tahmini güç (yüzde olarak), önem eşiğini GWAS çalışmalarında genom çapında önem için yaygın olarak kullanılan eşik olan 5휐 𢄨 olarak ayarlar. (B) Önem eşiği 10 𢄥 olarak ayarlanan tahmini güç, düşündürücü anlamlılık için yaygın olarak kullanılan eşik. A-B panellerinde, x ekseni bir GWAS'ta bir dizi numune boyutu (n) belirtir, y ekseni bir işaretleyici tarafından açıklanan özellik varyansının (q2) oranını temsil eder. Spesifik bir (n, q 2 ) kombinasyonda işaretçiyi saptama gücü, bir renk gradyanı ile temsil edilir. %10 aralıklarla güç için kontur çizgileri de gösterilir. Paneller C-D, bu çalışma için beklenen örnek boyutları için güç eğrilerini gösterir. (C) n=1500 örnek boyutu için genom çapında beklenen güç ve anlamlı anlamlılık eşikleri. (D) n=2000'lik bir örneklem büyüklüğü için tahmini güç. Paneller C-D'de, x ekseni, bir işaretleyici tarafından açıklanan özellik varyansının (q 2 ) oranını belirtir ve y ekseni, tahmini gücü (yüzde olarak) temsil eder. İki eğri, yaygın olarak kullanılan iki GWAS eşiğine karşılık gelir. Her panelde %80 güç noktası yeşil üçgen ile gösterilir, böylece gerekli parametre konfigürasyonları grafikten okunabilir. A-B panellerinde %80 güce karşılık gelen kontur da yeşil renkle işaretlenmiştir.

Yardımcı veriler

Şekil 3A, tam genom genotipleme verilerinin kullanıldığı standart GWAS ayarları altında bir ısı haritası olarak tahmini gücü (yüzde olarak) ve 5휐 𢄨 pꃞğeri anlamlılık eşiğini gösterir. Örnek boyutu (n) 100 ila 5000 arasında değişirken, işaretleyici (q 2, yüzde olarak) tarafından açıklanan özellik varyansının oranı %0.01 ila %6 arasında değişir. Örnek boyutu arttıkça, bir dizi özellik varyans değerlerinin %100'e ulaşması için güç hızla artar.

Şekil 3B, aynı ayarlar altında ancak 10 𢄥 değerinde anlamlı bir pꃞğeri anlamlılık eşiği altında tahmini gücü (yüzde olarak) göstermektedir. Beklendiği gibi, daha az katı olan bu eşik için benzer örneklem ve etki büyüklüklerinde güç daha yüksektir.

Basitleştirilmiş güç tahminleri, bu çalışma için beklenen örnek boyutları için şekil 3C,D'de güç eğrileri olarak gösterilmiştir. Şekil 3C, genom çapında beklenen gücü ve değişen etki büyüklüklerinde n=1500'lük bir örnek boyutu için anlamlı anlamlılık eşiklerini gösterirken, Şekil 3D, n=2000'lik bir örnek boyutu için tahmini gücü gösterir.

Özellik varyansı aralığı Doehring'den alınmıştır. ve diğerleri, 44, çeşitli deneysel ağrı fenotipleri ve çoklu belirteçler için bir SNP tarafından açıklanan özellik varyansının oranı için tahminler sağlar. Değerler %0.02 ila %6 arasında değişiyordu. Bazı özellikler burada incelenen özelliklerle aynıyken, diğer bazı özellikler farklıydı. Bununla birlikte, şekil 4A'da görüldüğü gibi, iki özellik grubu için özellik varyansının dağılımları çok benzerdir.

(A) Doehring'den tek bir işaretleyici tarafından açıklanan özellik varyansının dağılımları ve diğerleri 44 çalışmamıza dahil edilen ve dahil edilmeyen özellikler için. (B) Avrupalılar ve Kolombiyalılar için daha önce yayınlanmış kohortlarda deneysel ağrı ile ilişkili lokusların alel frekans dağılımları.

Bir GWAS'ın gücü, test istatistiği üzerindeki etkileri aracılığıyla SNP'lerin alel frekansına bağlıdır. Burada örneklem büyüklüğünü belirlemek için kullanılan deneysel ağrı çalışması da dahil olmak üzere, GWAS çalışmalarının çoğunluğu Avrupa kökenli bireylerde yürütülürken, 44 ilgi alanımız karma bir Latin Amerika popülasyonudur. Bu nedenle, çeşitli çalışmalarda deneysel ağrı için çalışılan veya deneysel ağrı ile ilişkilendirilen SNP'ler için Avrupalılarda Kolombiyalılara karşı alel frekanslarının dağılımını değerlendirmek istedik. 44 45 Minör alel frekansları, Batı Avrupalılar (İngiltere'den (GBR), Kuzey ve Batı Avrupa'dan (CEU), İspanya'dan (IBS) Utah sakinleri için) ve İtalya'daki Toskana için 1000 Genom proje veritabanından 17 bildirilen tüm bu tür SNP'ler için elde edildi ( TSI) ve Kolombiyalılar (bu çalışmanın gerçekleştirileceği Kolombiya'daki Medellin'den (CLM). Hem Avrupalılar hem de Kolombiyalılar için alel frekans dağılımları şekil 4B'de gösterilmektedir. Kolombiya dağılımı biraz daha yayılmış olmakla birlikte, iki dağılım oldukça benzerdir. Kolombiyalıların ortalama %60'ı Avrupa (İspanyol) soyuna sahip olduğu için bu biraz bekleniyor. 26 Düşük frekanslı aleller belirli bir örnek ve etki boyutu için daha düşük güce sahip olduğundan, bir GWAS'ta alel frekanslarının iyi yayılmış bir dağılımına sahip olmak önemlidir. 46 Burada, Avrupa alel frekans dağılımıyla karşılaştırma, mevcut Kolombiya kohortunun herhangi bir Avrupa tabanlı kohortla neredeyse eşdeğer güce sahip olacağını göstermektedir. Yine de, yalnızca Avrupalı ​​kohortların aksine, bizim kohortumuz, Sahra altı Afrikalılar veya Yerli Amerikalılar gibi diğer kıta popülasyonlarında bulunan ve Avrupalılarda bulunmayan alellerin de bir GWAS'ta saptanabilir olması ve takip edilebilmesi avantajına sahip olacaktır. belirli etnik kökenlerin replikasyon kohortlarında.

CANDELA projesi, & # x000a0 genotpylerini içerir

Medellin'den 2000 hasta. İlk örneği 1500�'e getirmek için bu katılımcıların %50�%'i ile iletişim kurmayı ve fenotiplendirmeyi ve ayrıca 500 katılımcıyla daha iletişim kurmayı bekliyoruz.

Veri analizi planı

Temizlenen genetik veriler ilk olarak 1000 Genom Projesi, 17 Simons Genom Çeşitlilik Projesi, 47 Estonya Biyomerkezi İnsan Genom Çeşitliliği Paneli, 48 ve özellikle Latin Amerika popülasyonları için ilgili olan ek Avrupa ve Kızılderili örnekleri gibi dünya çapındaki referans örneklerle birleştirilecektir. . 49 Birleştirilmiş veri seti, genetik PC'ler ve kıtasal ata oranları (denetimli Katkı 50 kullanılarak) aracılığıyla genetik aykırı değerler ve beklenmedik genetik benzerlikler açısından kontrol edilecektir. Bu adımlar, genellikle, cinsiyet uyumsuzluğu, beklenmedik genetik benzerlikler veya şişirilmiş heterozigotluk oranlarına yansıyabilecek herhangi bir numune yanlış yerleşimini veya kontaminasyonunu tespit edebilir. 40 51 Genetik ata tahminleri, özellikle genetik aykırı değerler veya beklenmedik sonuçlar gösteren örnekler için, kişinin bildirdiği ata bilgileriyle (çevrimiçi ek ek 1'e bakın) karşılaştırılacaktır. Doğu Asyalı veya Güney Asyalı gibi Kolombiyalılarda nadir görülen etnik kökenleri kendi kendine bildiren katılımcılar da aykırı değer olarak dışlanacak. The authors have extensive experience in conducting association analysis in admixed populations, including several GWAS publications on a wide range of phenotypes which contain detailed protocols on how to conduct such analyses. 27 39 52 53 Further details of the currently used quality control protocol for CANDELA samples 53 are provided in online supplementary appendix 2.

The genetic data allow estimation of the narrow-sense heritability of any quantitative trait, which is the fraction of trait variance that is explained by the genetic data. Estimates of heritability, obtained using the software GCTA, 54 will provide an idea of which traits have more of a biological basis versus which are more environmentally determined, and thus which traits would be more amenable to genetic analysis for discovery of associated genetic variants. Note however that relatively precise estimate (low SDs) of heritability by this method requires several thousand samples, 52 so the currently proposed sample size might be underpowered to estimate heritability accurately.

To facilitate better identification of associated loci, the genotype data will be imputed to approximately 10 million loci using the 1000 Genomes phase 3 imputation reference panel 52 by first haplotype phasing using SHAPEIT2 55 and then imputation using Impute2. 56 Quality control of the imputed genotypes will be performed using recommended thresholds on imputation quality score, concordance metrics and proportion of high-probability calls. Details of the currently used imputation protocol for CANDELA samples 52 are provided in online supplementary appendix 2.

GWAS studies will be conducted in Plink2 57 to perform single-locus association studies for each trait individually, across the whole genome in an additive multivariate linear regression model. 42 Covariates will be used in the regression to adjust for any other sources of trait variability, such as basic variables like age, sex, and BMI, and genetic PCs will be used to control for population substructure. 52 58

The number of genetic PCs to be included in the regression depends on the sample composition, such as variation in ancestry and presence/absence of genetic outliers. It would be determined by inspecting the proportion of variance explained by each PC (displayed on a scree plot) and by checking PC scatter plots.

In addition to being used as exclusion criteria, anxiety and depression scores could be used as covariates in GWAS. The exact set of covariates to be used will be determined based on initial diagnostic analyses such as correlation analysis.

These single-locus association results, obtained as p values, will be visualised via the Manhattan plot. Commonly used p value thresholds for selecting associated loci are 5휐 𢄨 for genome-wide significance and 10 𢄥 for suggestive significance. 42

An extension of this additive multivariate linear regression model, still within the single-trait single-locus setting, called the mixed linear model analysis which better controls for any cryptic relatedness or population substructure, will also be performed in GCTA. 54

There are several extensions of the single-trait single-locus association studies that increase power for detecting associated loci: combining several related traits that may share a biological basis, using multivariate Wald tests as implemented in MultiPhen 59 or gene-based tests that combine signals across all loci in a gene to increase signal strength and reduce the burden of multiple testing, such as set-based models implemented in Plink2 57 or fastBAT implemented in GCTA. 60 The admixed nature of the sample might be used in detecting associations by the method of admixture mapping, 61 though the potential of success of this method in detecting associated variants depends on the extent of stratification of the variant’s allele frequency across continents. These analyses might help detect additional loci that are underpowered in classical GWAS due to smaller effect sizes.

Handling of missing data

It might not be possible to record some traits in some individuals, even though the completeness of the first 100 samples suggests that missingness will be low. The single-trait methods used in traditional GWAS analyses automatically exclude individuals from the analysis of a trait who have missing values for that trait. The same applies to individuals having missing genotypes for any particular SNP. However, genotyping success rate using the Illumina HumanOmniExpress chip in the CANDELA cohort is very high (㺙.8%), so the number of excluded individuals in any analysis would be very low overall.

Some multivariate analyses such as PCs when applied on the set of phenotypes require having recorded values of all phenotypes for an individual. Instead of using the subset of individuals who have the complete set of phenotypes recorded, which would incur some loss in sample size, the missing phenotype data for each individual will be imputed following standard statistical procedures as implemented in the R package ‘mice’. 62 When the proportion of missing data is small, imputation is preferable in such multivariate analyses than sample exclusion, and is routinely applied to genetic data such as while calculating genetic PCs. 58


Tartışma

This GWAS including a well-defined cohort of healthy participants will provide important insights into the genetic aspects underlying experimental pain sensitivity in the naïve and sensitised state. This may allow further exploration of potential biological mechanisms underlying pain sensitivity. Future studies will be required to extrapolate these findings to patient populations with chronic pain.

Patient and public involvement

No patient involvement is performed during this study.

Ethics and dissemination

Findings will be disseminated to commissioners, clinicians and service users via papers and presentations at international conferences such as the biennial World Congress of International Association for the Study of Pain. We will also post our findings to the publicly available painnetworks.org database.


Gargis AS, Kalman L, Berry MW, Bick DP, Dimmock DP, Hambuch T, Lu F, Lyon E, Voelkerding KV, Zehnbauer BA, Agarwala R. Assuring the quality of next-generation sequencing in clinical laboratory practice. Nat Biyoteknoloji. 201230(11):1033.

Linderman MD, Brandt T, Edelmann L, Jabado O, Kasai Y, Kornreich R, Mahajan M, Shah H, Kasarskis A, Schadt EE. Analytical validation of whole exome and whole genome sequencing for clinical applications. BMC Med Genet. 20147(1):20.

Steemers FJ, Gunderson KL. Whole genome genotyping technologies on the BeadArray™ platform. Biotechnol J. 20072(1):41–9.

Beck TF, Mullikin JC, Biesecker LG, Comparative Sequencing Program NISC. Systematic evaluation of sanger validation of next-generation sequencing variants. Klinik Kimya. 201662(4):647–54.

Broad Institute. GATK Tools (version 3.8). Available from: http://github.com/broadinstitute/gatk/. Accessed 5 Mar 2018.

Rehm HL, Bale SJ, Bayrak-Toydemir P, Berg JS, Brown KK, Deignan JL, Friez MJ, Funke BH, Hegde MR, Lyon E. ACMG clinical laboratory standards for next-generation sequencing. Genet Med. 201315(9):733.

Ye J, Coulouris G, Zaretskaya I, Cutcutache I, Rozen S, Madden TL. Primer-BLAST: a tool to design target-specific primers for polymerase chain reaction. BMC Bioinform. 201213(1):134.

Wang Z, Liu X, Yang BZ, Gelernter J. The role and challenges of exome sequencing in studies of human diseases. Ön Genet. 20134:160.

Bolger AM, Lohse M, Usadel B. Trimmomatic: a flexible trimmer for Illumina sequence data. Biyoinformatik. 201430(15):2114–20.

Li H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv preprint arXiv:1303.3997 2013.

Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R. The sequence alignment/map format and SAMtools. Biyoinformatik. 200925(16):2078–9.

Li H. A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Biyoinformatik. 201127(21):2987–93.


Bağlantılar

Department of Health Sciences, University of Leicester, Leicester, UK

Iain R. Timmins & Frank Dudbridge

Diabetes Research Centre, University of Leicester, Leicester, UK

Francesco Zaccardi & Thomas Yates

Department of Cardiovascular Sciences, University of Leicester, Leicester, UK

NIHR Leicester Biomedical Research Centre, University Hospitals of Leicester NHS Trust & University of Leicester, Leicester, UK

Christopher P. Nelson & Thomas Yates

Department of Clinical Sciences, Lund University, Lund, Sweden

Bu yazarı PubMed Google Scholar'da da arayabilirsiniz.

Bu yazarı PubMed Google Scholar'da da arayabilirsiniz.

Bu yazarı PubMed Google Scholar'da da arayabilirsiniz.

Bu yazarı PubMed Google Scholar'da da arayabilirsiniz.

Bu yazarı PubMed Google Scholar'da da arayabilirsiniz.

Bu yazarı PubMed Google Scholar'da da arayabilirsiniz.

Katkılar

I.R.T. developed methods, performed analyses, interpreted results and wrote the manuscript. F.Z. conceived the study, interpreted results and edited the manuscript. C.P.N. interpreted results and edited the manuscript. P.W.F. interpreted results and edited the manuscript. T.Y. conceived the study, interpreted results and edited the manuscript. F.D. conceived the study, interpreted results and edited the manuscript.

Sorumlu yazar


Introduction

Epithelial ovarian cancer (EOC) has a strong heritable component, with an estimated three-fold increased risk among women with a first-degree relative having the disease ( 1). The excess familial risk that is not attributed to high penetrance mutations in genes such as BRCA1 ve BRCA2 may be due to a combination of common and rare alleles that confer low- to moderate penetrance ( 2, 3). Genome-wide association studies (GWAS) of EOC that have been conducted using most of the samples included in the current investigation have identified common variants at approximately 22 loci that collectively account for 4% of the estimated heritability ( 4–13). Few data exist regarding the contribution of rare (minor allele frequency (MAF) <0.5%) and low frequency (MAF 0.5–5%) protein-coding variants to EOC risk. This reflects the fact that protein- coding variants have not been targeted by conventional GWAS ( 14) despite prediction that their effects could be substantial ( 15) and imputation is known to be challenging for rare variants ( 16).

Following GWAS arrays of the mid-2000s, exome-based arrays were developed in 2012. The Affymetrix Axiom ® Exome Genotyping Array and the Illumina HumanExome Beadchip each contain >245,000 putative functional coding variants and other categories of variants selected from 16 exome sequencing initiatives that included approximately 12,000 individuals of diverse ethnic backgrounds and a range of diseases ( 17) ( Supplementary Material, Table 1 ). Variants were included as ‘fixed’ content on the arrays if they occurred at least three times and were seen in two or more of the 16 studies ( 17). Here, we report the first large-scale genetic association study of uncommon exome-wide variants and EOC risk among nearly 20,000 women ( Supplementary Material, Table 2 ).


Tartışma

In this EWAS of sporadic DCM we confirmed associations with variants in ZBTB17-HSPB7 ve BAG3 and identified six novel loci. Statistical analyses, cardiac tissue expression, and physiology suggest that the most likely causal genes are HSPB7, BAG3, TTN, SLC39A8, MLIP, FLNC, ALPK3 ve FHOD3.

Our data provide evidence that non-coding variants close to or within HSPB7 are more likely to account for the observed association at the ZBTB17 yer. The genetic mechanism linking the risk haplotype to HSPB7 functional modulation in absence of detectable eQTL is unknown. HSPB7 (commonly referred as cardiovascular Heat Shock Protein cvHSP) is a member of the small HSPB family of molecular chaperones. It is a potent polyglutamin aggregation suppressor that assists the loading of misfolded proteins or small protein aggregates into autophagosomes [15]. In addition, our laboratuvar ortamında experiments demonstrate a physical interaction of BAG3 with HSPB7 (Fig 4) suggesting functional relationships between the 2 proteins that may be relevant for their genetic implication in DCM pathophysiology. The strongest association with sporadic DCM in our EWAS involved rs2234962 which encodes a p.Cys151Arg substitution in BAG3. The interaction signal of BAG3 Arg151 and Cys151 isoforms with HSPB7 was similar (data not shown), suggesting no direct effect of the polymorphism on HSPB7 binding The p.Cys151Arg variant is located between two conserved Ile–Pro–Val (IPV) motifs involved in BAG3 complex formation with HSPB6 and HSPB8. Interestingly, a p.Pro209Leu mutation responsible for myofibrillar myopathy associated with cardiomyopathy is located in one of the two IPV motifs [16]. Whether p.Cys151Arg modifies the interaction of BAG3 with HSPBs partners and affects the functional potential of the complex is currently unknown.

Common haplotype-tagging variants of the titin gene were associated with small differences in DCM risk in this EWAS. This extends the spectrum of TTN genetic variants that affect DCM risk, from highly penetrant mutations responsible for familial DCM [12] to common haplotypes with low penetrance associated with sporadic DCM. A potential consequence of common DCM-associated TTN variants, in line with the pathogenic mechanisms suggested by the candidate genes identified in this EWAS, is the proteotoxic effect of accumulating truncated or aggregate prone mutant TTN in cardiomyocytes.

NS rs13107325 SNV in SLC39A8 has been shown in GWAS to be associated with several traits affecting cardiovascular risk, including blood pressure. It is therefore conceivable that it has systemic consequences that raise the risk of DCM but were not considered in our disease exclusion criteria. Çünkü SLC39A8 encodes a zinc transporter [17], its association with DCM may also be related to the cardioprotective role of zinc [18].

In the nuclear envelope, MLIP (also known as CIP) directly interacts with the N-terminal region of lamin (LMNA) [19]. Dominant mutations in LMNA cause DCM and other hereditary multisystemic diseases and several pathogenic mutations of LMNA are located in its MLIP interacting domain [20]. In mice, Mlip interacts with Isl1, a transcription factor required for cardiomyocyte differentiation, and represses its transcriptional activity [21]. Notably, the DCM-associated SNV (rs4712056, p.Val159Ile) is located within the Isl1-interacting region of MLIP. MLIP has recently been shown to be a key regulator of cardiomyopathy that has potential as a therapeutic target to attenuate heart failure progression [22].

Filamin C is involved in the organization of actin filaments, it serves as a scaffold for signaling proteins and interacts with several Z-disk proteins. FLNC mutations in humans and mice cause hypertrophic cardiomyopathy [23] and myofibrillar myopathy, a form of muscular dystrophy with concurrent cardiomyopathy [24]. These pathologies are characterized by myofibrillar disorganization, accumulation of myofibrillar degradation products and ectopic expression of multiple proteins [25]. FLNC mutations induce massive protein aggregates within skeletal muscle fibers and altered expression of chaperone proteins and components of proteasomal and autophagic degradation pathways. Interestingly, functional interaction between FLNC and HSPB7 or BAG3, two genes confirmed by this study, have been previously reported [26,27]. In addition to the fact that BAG3 mutations also causes myofibrillar myopathy it suggests the hypothesis that dysregulation of proteostasis could be a common mechanism underlying myofibrillar myopathy and DCM.

Cardiac FHOD3 plays a crucial role in the sarcomere organization of cardiomyocytes, is essential for heart myofibrillogenesis [28] and is required for the maintenance of the contractile structures in heart muscle. A cardiac isoform of FHOD3 is targeted to thin actin filaments via phosphorylation of tyrosine residue preventing autophagy dependent degradation [29]. Most DCM-associated SNVs in our EWAS are clustered in a region in 3' of FHOD3 that encodes the Formin FH2 domain of the protein, which is implicated in actin polymerization [30]. A FHOD3 variant, Y1249N, has been reported in a Japanese patient with a dominant form of DCM. canlılarda functional analysis showed that this variant may impair actin filament assembly, thus providing some support for the implication of FHOD3 in the pathogenesis of DCM [31].

Alpha-kinase 3 (ALPK3/MIDORI) was initially described as a myocyte-specific gene that promotes differentiation of P19CL6 cells into cardiomyocytes [32]. The pattern of expression of ALPK3 in differentiating cardiomyocytes nucleus is similar to that of transcription factors specific of the cardiogenic lineage [33] but its function is still largely unknown. Recently recessive mutations in ALPK3 have been reported to cause pediatric DCM [34].

Ek olarak TTN ve BAG3, MYBPC3 was present in the cardiomyopathy gene-set [2] and harbored variants associated with sporadic DCM in our EWAS. MYBPC3 is an actin, myosin and titin interacting protein of the M-band of the sarcomere. Mutations in this gene are a major cause of hypertrophic cardiomyopathy and have also been reported in familial forms of DCM [35]. Coding variants in MYBPC3 may affect actin-myosin interaction [36] and concurrently interfere with the ubiquitin proteasome system and autophagy in humans and animal models [37]. Both mechanisms could account for the association of common SNVs in MYBPC3 with sporadic DCM.

Considered as a whole, both rare and common variants with elevated CADD scores in the cardiomyopathy gene-set were associated with sporadic DCM (S3 Table) indicating that other loci than those found in this EWAS are involved in sporadic DCM, however identifying the responsible genes will require larger studies.

Proteostasis might be important for DCM

Three of the DCM-associated genes, FLNC, TTN (through its kinase activity) and cardiac specific FHOD3 encode maintenance partners of sarcomere and sarcomere-related structures, including Z-disk or F-actin myofibrils [29,38,39], which are disorganized or degraded in experimental models of cardiomyopathy [40]. Moreover the cellular level of FLNC, FHOD3 and TTN kinase targets such as MuRF2, appears regulated by proteostasis mechanisms [26,29,39]. One of these mechanisms, BAG3-associated chaperone-assisted selective autophagy (CASA) is described as a central adaptation mechanism that responds to acute physical exercise and to repeated mechanical stimulation [41]. BAG3 inactivation also leads to Z-disk disruption in mice and fruit fly [26]. Based on the functional similarities (also pertaining to HSPB7 ve MYBPC3) characterizing several of the DCM-associated genes identified in this study, we hypothesize that abnormal cardiomyocyte sarcomere maintenance and regulation of autophagy is a potential mechanism involved in DCM pathophysiology is. Further experimental exploration of this hypothesis may yield novel therapeutic targets for DCM.

Limitations of this study

This study has some limitations. The recruitment was focused on Önsel homogeneous sets of patients and controls of European ancestry and outliers were excluded based on genomic data. We also conducted a meta-analysis which did not reveal any significant heterogeneity across populations. Despite these precautions, we cannot fully exclude undetected population stratification. In addition, given the rather low prevalence of DCM, we conducted exome-wide genotyping in all available patients and controls instead of using a two-step discovery/replication design. As a consequence, even if we provide a series of arguments supporting the identified genes as plausible candidates, independent studies would certainly further refine and extend our results. It is likely that a genome-wide tagging array not limited to exon regions would identify other DCM-associated variants and loci than those reported here. Finally, as our power analyses show, our EWAS had limited power to detect the collective effect of rare variants present in our data set at the gene level.

Çözüm

We identified 6 novel loci associated with sporadic DCM and confirmed two previously reported associations with variants located within the ZBTB17-HSPB7 ve BAG3 genler. Fine mapping revealed that at the ZBTB17 yer HSPB7 is likely the implicated gene. The lead-SNVs at all associated loci are common variants and conditioning on them reduced considerably the associations of other variants in the regions of interest with DCM. We provide evidence that 7 of the DCM-associated genes are very plausible candidates from a pathogenic perspective.