Bilgi

VCF bilgi alanında boru karakteri kullanımı

VCF bilgi alanında boru karakteri kullanımı


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

VCF dosyama ClinVar ile açıklama eklerken, aşağıdaki değeri not ettim:CLNSIGalan (yani, klinik önem):

CLNSIG=2|2|2|2|2|2|2

Bu aslında bu örnekte rapor edilmiştir, bu yüzden boru kullanımının bu tür genomik açıklamalar için oldukça yaygın olduğunu düşünüyorum.

Borunun kullanımı nedir (|) karakter? VCF dosya biçimi belirtiminde aradım; ancak, yalnızca virgülün anlamı (,) belirtilir (yani, o alan için birden çok alternatif değerin varlığı). Bunun yerine borunun neyi temsil ettiğini merak ediyorum.

Teşekkürler.


Getfasta¶

bedtools getfasta, bir BED/GFF/VCF dosyasında tanımlanan aralıkların her biri için bir FASTA dosyasından dizileri ayıklar.

1. Giriş FASTA dosyasındaki başlıklar kesinlikle BED dosyasındaki kromozom sütununu eşleştirin.

2. FASTA çıktısının çizgi genişliğini ayarlamak için UNIX katlama komutunu kullanabilirsiniz. Örneğin, fold -w 60, kolay görüntüleme için FASTA dosyasının her satırının en fazla 60 nükleotide sahip olmasını sağlar.

3. Tek bir bölge içeren BED dosyaları, satırın sonunda yeni bir satır karakteri gerektirir, aksi takdirde boş bir çıktı dosyası üretilir.


KOMUTLAR

Her komutun, örneğin kullanılarak görüntülenebilen kendi kılavuz sayfası vardır. adam samtools-view veya yeni bir GNU adamı kullanarak adam samtools görünümü. Aşağıda, sözdizimi ve alt komut açıklamasının kısa bir özeti bulunmaktadır.

Tüm alt komutlar için ortak olan seçenekler aşağıda KÜRESEL KOMUT SEÇENEKLERİ bölümünde belgelenmiştir.

Hiçbir seçenek veya bölge belirtilmeden, belirtilen giriş hizalama dosyasındaki (SAM, BAM veya CRAM formatında) tüm hizalamaları SAM formatında (varsayılan olarak başlık olmadan) standart çıktıya yazdırır.

Çıktıyı yalnızca belirtilen bölge(ler) ile örtüşen hizalamalarla sınırlamak için girdi dosya adından sonra bir veya daha fazla boşlukla ayrılmış bölge belirtimi belirtebilirsiniz. Bölge spesifikasyonlarının kullanımı, koordinatlara göre sıralanmış ve indekslenmiş bir girdi dosyası gerektirir.

Çıktı biçimini SAM'den BAM veya CRAM'e değiştirmek için seçenekler mevcuttur, bu nedenle bu komut aynı zamanda bir dosya biçimi dönüştürme aracı olarak da işlev görür.

samtools izle [-P chr:konum] [-s STR] [-NS Görüntüle] <in.sorted.bam> [ref.fasta]

Metin hizalama görüntüleyici (ncurses kitaplığına dayalı). Görüntüleyicide `?' yardım için ve aynı referans dizisini görüntülerken 'chr10:10.000.000' veya '=10.000.000' biçimindeki bir bölgeden hizalama başlangıcını kontrol etmek için 'g'ye basın.

Giriş dosyalarının sağlam göründüğünü hızlıca kontrol edin. Dosyanın başında en az bir hedef dizi içeren geçerli bir başlık (tüm biçimler) olup olmadığını kontrol eder ve ardından dosyanın sonuna kadar arar ve bir dosya sonunun (EOF) mevcut ve bozulmamış (yalnızca BAM) olup olmadığını kontrol eder.

Dosyanın ortasındaki veriler okunmaz çünkü bu çok daha fazla zaman alır, bu yüzden lütfen bu komutun dahili bozulmayı algılamayacağını, ancak dosyalar üzerinde daha yoğun görevler gerçekleştirmeden önce kesilmediğini test etmek için yararlı olduğunu unutmayın.

Herhangi bir girdi dosyasında geçerli bir başlık yoksa veya bir EOF bloğu eksikse, bu komut sıfır olmayan bir çıkış koduyla çıkacaktır. Aksi takdirde başarıyla çıkacaktır (sıfır çıkış koduyla).

samtools dizini [-M.Ö] [-m INT] aln.sam.gz|aln.bam|aln.cram [out.index]

Hızlı rastgele erişim için koordinatlara göre sıralanmış bir SAM, BAM veya CRAM dosyasını indeksleyin. SAM için not, bu yalnızca dosya önce BGZF sıkıştırılmışsa çalışır.

Bu indeks gerektiğinde bölge argümanlar sınırlamak için kullanılır samtools görünümü ve belirli ilgi bölgelerine benzer komutlar.

Bir çıktı dosya adı verilirse, dizin dosyası şuraya yazılacaktır: out.index. Aksi takdirde, bir CRAM dosyası için aln.cram, dizin dosyası aln.cram.crai BAM veya SAM dosyası için oluşturulacak aln.bam, herhangi biri aln.bam.bai veya aln.bam.csi seçilen indeks formatına bağlı olarak oluşturulacaktır.

samtools sıralama [-l seviye] [-m maxMem] [ dışarı.bam] [ biçim] [-n] [-T etiket] [-T tmpprefix] [[email protected] İş Parçacığı] [in.sam|in.bam|in.cram]

Hizalamaları en soldaki koordinatlara göre veya okunan ada göre sıralayın. -n kullanıldı. Uygun @HD-SO sıralama düzeni başlık etiketi eklenecek veya gerekirse mevcut bir etiket güncellenecektir.

Sıralanan çıktı varsayılan olarak standart çıktıya veya belirtilen dosyaya yazılır (dışarı.bam) ne zaman kullanıldı. Bu komut aynı zamanda geçici dosyalar da oluşturacaktır. tmpprefix.%NS.bam tüm hizalama verileri belleğe sığamadığında gerektiği gibi ( -m seçenek).

kullanmayı düşünün samtools harmanlamak bunun yerine, tam bir sözlükbilimsel sıralama olmadan adla harmanlanmış verilere ihtiyacınız varsa.

Karıştırmalar ve gruplar isimlerine göre birlikte okur. Tam bir sorgu adı sıralamasına daha hızlı bir alternatif, harmanlamak aynı addaki okumaların bitişik gruplar halinde gruplandırılmasını sağlar, ancak okuma adlarının gruplar arasındaki sırası hakkında herhangi bir garanti vermez.

Bu komutun çıktısı, aynı şablondaki tüm okumaların birlikte gruplanmasını gerektiren herhangi bir işlem için uygun olmalıdır.

Girdi dosyasına karşılık gelen dizin dosyasındaki istatistikleri alın ve yazdırın. idxstats'ı çağırmadan önce, girdi BAM dosyası samtools indeksi tarafından indekslenmelidir.

Bir SAM veya CRAM dosyasında veya dizine eklenmemiş bir BAM dosyasında çalıştırılırsa, bu komut yine aynı özet istatistiklerini üretecektir, ancak bunu tüm dosyayı okuyarak yapar. Bu, BAM endekslerini kullanmaktan çok daha yavaştır.

Çıktı, referans dizi adı, dizi uzunluğu, # eşlenmiş okumalar ve # eşlenmemiş okumalardan oluşan her satırla SEKME ile sınırlandırılmıştır. stdout'a yazılır.

İstatistikleri hesaplamak ve stdout'a yazdırmak için giriş dosyasından tam geçiş yapar.

Öncelikle FLAG alanındaki bit bayraklarına dayalı olarak 13 kategorinin her biri için sayım sağlar. Çıktıdaki her kategori, "#PASS + #FAIL" olarak sunulan ve ardından kategorinin bir açıklaması olarak sunulan QC başarılı ve QC başarısız olarak ayrılır.

Metinsel ve sayısal bayrak gösterimi arasında dönüştürme.

BAYRAKLAR:

0x1EŞLİeşleştirilmiş uç (veya çok parçalı) sıralama teknolojisi
0x2PROPER_PAIRher segment hizalayıcıya göre düzgün şekilde hizalanır
0x4UNMAPsegment eşlenmemiş
0x8MUNMAPşablondaki sonraki segment eşlenmemiş
0x10TERSSEQ ters tamamlanır
0x20GERİŞablondaki bir sonraki bölümün SEQ'i ters tamamlanır
0x40READ1şablondaki ilk segment
0x80OKUMA2şablondaki son bölüm
0x100İKİNCİLikincil hizalama
0x200QCFAILkalite kontrollerini geçmemek
0x400DUPPCR veya optik kopya
0x800TAMAMLAYICIek hizalama

samtools stats, BAM dosyalarından istatistikleri toplar ve bir metin biçiminde çıktılar. Çıktı, çizim-bamstatları kullanılarak grafiksel olarak görselleştirilebilir.

Sağlanan BED dosyasında belirtilen her bir genomik bölge için toplam okuma tabanı sayısını (yani baz başına okuma derinliklerinin toplamını) bildirir. Bölgeler, BED dosyasında göründükleri gibi çıktılanır ve 0 tabanlıdır. Sağlanan her hizalama dosyası için sayımlar ayrı sütunlarda rapor edilir.

Her konum veya bölgede okuma derinliğini hesaplar.

samtools ampliconstats, bir veya daha fazla giriş hizalama dosyasından istatistik toplar ve metin biçiminde tablolar üretir. Çıktı, çizim-amplikonstatları kullanılarak grafiksel olarak görselleştirilebilir.

Hizalama dosyaları daha önce primer dizisinden kırpılmış olmalıdır, örneğin samtools amplikonclip ve bu primerlerin siteleri argümanlarda bir yatak dosyası olarak belirtilmelidir.

samtools mpileup [-EB] [-C capQcoef] [-r kayıt] [-F in.fa] [-l liste] [-Q minBaseQ] [-Q minMapQ] in.bam [in2.bam [. ]]

Bir veya daha fazla BAM dosyası için metin yığını oluşturun. VCF ve BCF çıktısı için lütfen bcftools yerine komut verin. Hizalama kayıtları, @RG başlık satırlarında örnek (SM) tanımlayıcılarına göre gruplandırılır. Örnek tanımlayıcılar yoksa, her girdi dosyası bir örnek olarak kabul edilir.

Yığın biçimi ve seçeneklerinin açıklaması için samtools-mpileup kılavuz sayfasına bakın.

Kromozom başına bir histogram veya kapsam tablosu üretir.

samtools birleştirme [-nur1f] [-H inh.sam] [-T etiket] [-R kayıt] [-B liste] dışarı.bam in1.bam [in2.bam in3.bam . inN.bam]

Tüm giriş kayıtlarını içeren ve mevcut sıralama düzenini koruyan tek bir sıralanmış çıktı dosyası üreterek birden çok sıralanmış hizalama dosyasını birleştirin.

Eğer -H belirtilirse, girdi dosyalarının @SQ başlıkları belirtilen başlıkta birleştirilir, aksi takdirde girdi başlıklarından oluşturulan bileşik bir başlıkta birleştirilirler. @SQ üstbilgileri sırayla farklıysa, bu, birleştirmeden sonra çıktı dosyasının yeniden sıralanmasını gerektirebilir.

Giriş dosyalarındaki kayıtların sırası, giriş dosyalarındaki kullanımla eşleşmelidir. -n ve -T komut satırı seçenekleri. Aksi takdirde, çıktı sırası tanımsız olacaktır. Görmek çeşit kayıt siparişi hakkında bilgi için.

samtools bölünmüş [seçenekler] birleştirilmiş.sam|birleştirilmiş.bam|birleştirilmiş.cram

Bir dosyayı okuma grubuna göre böler, her biri bir okuma grubu içeren ortak bir önekle (varsayılan olarak giriş dosya adına göre) eşleşen bir veya daha fazla çıktı dosyası üretir.

samtools kedisi [-B liste] [-H başlık.sam] [ dışarı.bam] in1.bam in2.bam [ . ]

BAM'leri veya CRAM'leri birleştirin. Bu, BAM veya CRAM üzerinde çalışsa da, tüm girdi dosyaları birbiriyle aynı biçimde olmalıdır. Bu komut bunu kontrol etmese de, her girdi dosyasının sıra sözlüğü aynı olmalıdır. Bu komut şuna benzer bir numara kullanır: yeniden başlık bu da hızlı BAM birleştirme sağlar.

samtools hızlı [seçenekler] in.bam
samtools hızlı [seçenekler] in.bam

Çağrılan komuta bağlı olarak bir BAM veya CRAM'i FASTQ veya FASTA formatına dönüştürür. Dosya adları .gz veya .bgzf uzantısına sahipse dosyalar otomatik olarak sıkıştırılacaktır.

Bu programa giriş, ada göre sıralanmalıdır. Kullanmak samtools harmanlamak veya samtools sıralama -n bunu sağlamak için.

samtools faidx <ref.fasta> [bölge1 [. ]]

FASTA formatında indeks referans dizisi veya indekslenmiş referans dizisinden alt diziyi çıkarın. Bölge belirtilmemişse, faidx dosyayı indeksleyecek ve oluşturacak <ref.fasta>.fai diskte. Bölgeler belirtilirse, alt diziler alınır ve FASTA formatında stdout'a yazdırılır.

Giriş dosyası şurada sıkıştırılabilir: BGZF biçim.

FASTQ dosyaları bu komutla okunabilir ve indekslenebilir. Kullanmadan --fastq çıkarılan herhangi bir alt dizi FASTA formatında olacaktır.

samtools fqidx <ref.fastq> [bölge1 [. ]]

FASTQ formatında indeks referans dizisi veya indekslenmiş referans dizisinden alt diziyi çıkarın. Bölge belirtilmemişse, fqidx dosyayı indeksleyecek ve oluşturacak <ref.fastq>.fai diskte. Bölgeler belirtilirse, alt diziler alınır ve FASTQ formatında stdout'a yazdırılır.

Giriş dosyası şurada sıkıştırılabilir: BGZF biçim.

samtools fqidx yalnızca az sayıda giriş içeren fastq dosyalarında kullanılmalıdır. Milyonlarca kısa dizi okuma içeren bir dosyada kullanmaya çalışmak, neredeyse orijinal dosya kadar büyük bir dizin üretecek ve dizini kullanan aramalar çok yavaş olacak ve çok fazla bellek kullanacak.

samtools dict ref.fasta|ref.fasta.gz

Bir fasta dosyasından bir dizi sözlüğü dosyası oluşturun.

samtools sakin [-Eeubr] [-C capQcoef] aln.bam ref.fasta

MD etiketini oluşturun. MD etiketi zaten mevcutsa, oluşturulan MD etiketi mevcut etiketten farklıysa bu komut bir uyarı verecektir. Varsayılan olarak SAM çıktısı alın.

Calmd ayrıca CRAM dosyalarını okuyabilir ve yazabilir, ancak çoğu durumda CRAM, MD ve NM etiketlerini anında yeniden hesapladığı için anlamsızdır. Bu durumun tek istisnası, hem giriş hem de çıkış CRAM dosyalarının no_ref seçenek.

samtools düzeltme arkadaşı [-rpcm] [ biçim] in.nameSrt.bam out.bam

Montaj ilişkisi koordinatlarını, ISIZE ve montaj ilişkisi ile ilgili bayrakları ada göre sıralanmış bir hizalamadan doldurun.

samtools işaretlemesi [-l uzunluk] [-r] [-s] [-T] [-S] in.algsort.bam çıkış.bam

Üzerinden çalıştırılan bir koordinat sıralı dosyadan yinelenen hizalamaları işaretleyin samtools düzeltme arkadaşı ile -m seçenek. Bu program fixmate'in sağladığı MC ve ms etiketlerine dayanır.

samtools rmdup [-sS] <input.srt.bam> <out.bam>

Bu komut eskidir. Bunun yerine işaretlemeyi kullanın.

samtools addreplacerg [-r rg hattı | -R rg-kimliği] [-m mod] [-l seviye] [ dışarı.bam] in.bam

Bir dosyadaki okuma grubu etiketlerini ekler veya değiştirir.

samtools yeniden başlığı [-iP] in.header.sam in.bam

başlığı değiştir in.bam başlığı ile in.header.sam. Bu komut, başlığı bir BAM&rarrSAM&rarrBAM dönüşümüyle değiştirmekten çok daha hızlıdır.

Varsayılan olarak bu komut, BAM veya CRAM dosyasının çıktısını standart çıktıya (stdout) verir, ancak CRAM formatındaki dosyalar için aynı dosyayı hem okuyup hem de yazarak yerinde düzenleme yapma seçeneğine sahiptir. Başlıkta hiçbir geçerlilik kontrolü yapılmaz ve sıra verilerinin kendisi ile kullanılmaya uygun değildir.

samtools hedef kesimi [-Q minBaseQ] [-ben penaltı] [-0 em0] [-1 em1] [-2 em2] [-F referans] in.bam

Bu komut, okuma derinliğinin sürekliliğini inceleyerek hedef bölgeleri tanımlar, hedeflerin haploid konsensüs dizilerini hesaplar ve her dizi bir hedefe karşılık gelen bir SAM çıkarır. Seçenek ne zaman -F kullanımda ise BAQ uygulanacaktır. Bu komut bir tek fosmid havuzu dizilemesinden fosmid klonlarını kesmek için tasarlanmıştır [Ref. Kitzman ve ark. (2010)].

samtools aşaması [-AF] [-k uzun] [-B önek] [-Q minLOD] [-Q minBaseQ] in.bam

Heterozigot SNP'leri çağırın ve fazlandırın.

samtools depad [-SsCu1] [-T referans] [ çıktı] in.bam

Dolgulu referansa göre hizalanmış bir BAM'yi, dolgulu referansa göre hizalanmış bir BAM'a dönüştürür. Dolgulu referans, içinde kelimesi kelimesine "*" bazları içerebilir, ancak "*" bazları da referans numaralandırmasında sayılır. Bu, bir "*" referansına göre hizalanmış bir dizi baz çağrısının bir puro eşleşmesi ("M" veya "X") operatörü olarak kabul edildiği anlamına gelir (temel çağrı "A", "C", "G" ise) veya "T"). Referans "*" bazları silindikten sonra silinir ve bu tür hizalanmış dizi baz çağrıları eklemeler haline gelir. Benzer şekilde, silme işlemleri ve puro işlemleri için de dönüşümler geçerlidir.

samtools amplikonclip [ out.file] [-F stat.dosyası] [--yumuşak-klip] [--sert klip] [--her iki uç] [--iplik] [--kırpılmış] [--hata] [--hayır-PG] -B bed.file in.file

Clip, bir BED dosyasındaki verilere dayalı olarak SAM uyumlu bir dosyada okur.


Uygulama

Genel Bakış vcfanno işlevsellik

Vcfanno BED, GFF, GTF, VCF ve BAM. Bellek tüketimini büyük ölçüde azaltmak ve hızı artırmak için sıralanmış girdi dosyalarından yararlanan bir "akış" kesişim algoritması kullanır. Akış kesişimi gerçekleştirilirken (ayrıntılar aşağıdadır), bir aralık kesişimi varsa, veritabanı aralıkları bir sorgu aralığı ile ilişkilendirilir. Belirli bir sorgu aralığı için tüm kesişimler bilindiğinde, açıklama, niteliklere uygulanan kullanıcı tanımlı işlemlere göre ilerler (örneğin, bir BED açıklama dosyasındaki "puan" sütunu veya bir VCF notunun INFO alanındaki bir nitelik). dosya) veri tabanı aralıkları içindeki veriler. Basit bir örnek olarak, dbSNP kaynağının bir VCF dosyası gibi bir açıklama veritabanından SNV'ler tarafından açıklama eklenen tek nükleotid varyantlarının (SNV'ler) bir VCF sorgusunu düşünün. Bu durumda, sorgu ve veritabanı varyantları, mevcut olduğunda konum, REF ve ALT alanlarında eşleştirilir ve çakışan veritabanı aralığından bir değer (örn. VCF'yi sorgulayın. Bir sorgu yapısal varyantının her bir veritabanından gelen birden çok açıklama aralığıyla kesiştiği daha karmaşık bir senaryoda, bu aralıklardan gelen bilgiler toplanmalıdır. Her bir özelliği “concat” işlemi aracılığıyla virgülle ayrılmış bir liste olarak rapor etmek istenebilir. Alternatif olarak, maksimum alel frekansı "maks" işlemi ile seçilebilir. Sorguyla yalnızca tek bir veritabanı aralığının ilişkilendirildiği durumlarda, işlem seçimi özetlenen değeri etkilemez.

Açıklamadan önce ve sonra tek bir varyanttan örnek bir VCF INFO alanı vcfanno Şekil 1'de gösterilmiştir. Hem kaynak dosyaları hem de eklenmesi gereken öznitelikler (VCF durumunda) veya sütunları (BED veya diğer sekmeyle ayrılmış biçimler durumunda) belirtmek için basit bir yapılandırma dosyası kullanılır. sorgu dosyasına. Ek olarak, yapılandırma dosyası, ortaya çıkan VCF INFO alanında açıklamaların yeniden adlandırılmasına izin verir. Örneğin, ExAC VCF dosyasından [9] alel frekansı (AF) özniteliğini çıkarabilir ve VCF sorgu kayıtlarının INFO alanında “exac_aaf” olarak yeniden adlandırabiliriz. Yapılandırma dosyası, herhangi bir sayıda ek açıklama veri kümesinden gerektiği kadar özniteliğin çıkarılmasına izin verir.

Genel Bakış vcfanno iş akışı. Açıklamasız bir VCF (a) gönderilir vcfanno (B) ek açıklama dosyalarına giden yolları, her dosyadan çıkarılacak öznitelikleri ve bu dosyalardan çıkarılan değerleri açıklamak veya özetlemek için kullanılması gereken yöntemleri gösteren bir yapılandırma dosyasıyla birlikte. Ortaya çıkan VCF'deki yeni açıklamalar (C) mavi metinle gösterilir ve INFO sütununa ek alanlar eklenir

Krom tarama algoritmasına genel bakış

Kromozom süpürme algoritması ("chrom-sweep"), akış, sıralama-birleştirme birleştirme algoritmasının bir uyarlamasıdır ve hem kromozom hem de aralık başlangıç ​​konumuna göre sıralandıkları sürece, birden çok aralık dosyası arasındaki aralık kesişimlerini verimli bir şekilde tespit etme yeteneğine sahiptir. . Hem BEDTOOLS [10, 11] hem de BEDOPS [12] tarafından kullanılan chrom-sweep, her dosyada genomik konumla senkronize edilmiş işaretçileri ilerleterek kesişmeleri tek bir geçişte bulur. Süpürmenin her adımında, bu işaretçiler belirli bir konumu kesen ve sırayla birbiriyle kesişen aralıklar kümesini korur. Bu strateji, büyük veri kümeleri için avantajlıdır, çünkü aralık ağaçları veya hiyerarşik kutular (örneğin, UCSC gruplama algoritması [13]) gibi veri yapılarının kullanılmasından kaçınır. Bu ağaç ve gruplama teknikleri, sıralanmış girdi gerektirmese de, bu yöntemlerin bellek ayak izi, özellikle tipik olarak düşük, ortalama durum bellek talepleri sergileyen akış algoritmalarıyla karşılaştırıldığında, zayıf ölçeklenir.

içinde uygulanan krom tarama algoritması vcfanno aşağıdaki gibi ilerler.İlk olarak, VCF sorgusu ve her veritabanı açıklama dosyası için bir aralık kayıtları yineleyicisi oluşturuyoruz. Daha sonra, VCF sorgusundan ve her ek açıklamadan gelen aralıkları, tüm dosyalardan aralıkları kromozom ve başlangıç ​​koordinatına göre sıralayan ve aynı zamanda her bir aralığın geldiği dosyayı izleyen tek bir öncelik kuyruğunda birleştiririz. Vcfanno öncelik kuyruğundan bir aralık isteyerek ilerler ve onu bir önbelleğe ekler. En son gözlemlenen aralık VCF sorgusundan geliyorsa, o anda önbellekte bulunan tüm veritabanı aralıklarıyla kesişimleri kontrol ederiz. Dan beri vcfanno tüm dosyaların sıralanmasını gerektirir, aralıkların başlangıç ​​koordinatına göre sıralanmış önbelleğe girdiğini biliyoruz. Bu nedenle, örtüşmeyi kontrol etmek için, yalnızca yeni aralığın başlangıcının, önbellekteki herhangi bir aralığın sonundan daha az olduğunu kontrol etmemiz gerekir (yarı açık aralıklar varsayılarak). Tek bir sorgu VCF'sinden iki açıklama dosyası ve üç kayıt içeren bir durum için süpürme algoritmasının bir örneği Şekil 2'de gösterilmektedir. Önbelleğin içeriği, tarama her yeni aralığın başlangıcına ulaştığında gösterilir. Yeni bir sorgu aralığı önbelleğe girdiğinde, onunla kesişmeyen herhangi bir aralık önbellekten çıkarılır. Kaldırılan aralık VCF sorgusundan kaynaklanıyorsa, kesişen açıklama aralıklarının her biri ile birlikte, yapılandırma dosyasında belirtilen işlemlere göre işlenmek üzere gönderilir. Elde edilen notlar, VCF dosyasının INFO alanında saklanır ve güncellenen VCF kaydı çıktı olarak rapor edilir.

Krom tarama aralığı kesişim algoritmasına genel bakış. Krom tarama algoritması, sol ile sağ Her kromozom boyunca ilerledikçe. Yeşil içindeki VCF sorgusundan aralıklar ilk sıra açıklama dosyaları A (Mavi) ve B (turuncu) içinde ikinci ve üçüncü sıra, sırasıyla. Önbellek satırı, süpürme algoritmasının ilerlemesindeki her bir noktada hangi aralıkların o anda önbellekte olduğunu gösterir. Aralıklar, kromozomal başlangıç ​​konumlarına göre önbelleğe girer. Öncelikle A1 önbelleğe girer ve ardından Q1. Dan beri Q1 kesişir A1, ilişkili oldukları gibi Q1 ve B1 ne zaman B1 önbelleğe girer. Yeni bir sorgu aralığı önbelleğe her girdiğinde, kesişmediği herhangi bir aralık çıkarılır. Bu nedenle, ne zaman Q2 önbelleğe girer, Q1 ve A1 atılırlar. Dan beri Q1 bir sorgu aralığıdır, çıktı olarak raporlanmak üzere gönderilir. Sağa ilerlerken, A2 ve daha sonra Q3 önbelleğe girin, ikincisi bir sorgu aralığıdır ve dolayısıyla onunla örtüşmeyen aralıklar—B1, Q2, ve A2— sorgu aralığı ile önbellekten çıkarılır, Q2, arayan kişiye gönderilir. Son olarak, gelen aralıkların sonuna geldiğimizde finali temizliyoruz. Q3 aralığı ve bu kromozom için çıktıyı sonlandırın. EOF: Dosyanın Sonu

Krom tarama algoritmasının sınırlamaları

Açıklama kümelerinin bellek yoğun veri yapılarına yüklenmemesi nedeniyle, krom tarama algoritması kolayca büyük veri kümelerine ölçeklenir. Ancak, bazı önemli sınırlamaları vardır. İlk olarak, tüm açıklama dosyalarından tüm aralıkların aynı kromozom sırasına uymasını gerektirir. Kavramsal olarak basit olsa da, GATK gibi değişken çağıranlar tarafından üretilen VCF'ler, MT'yi X'in önüne koyacak olan diğer sayısal olarak sıralanmış ek açıklama dosyalarının çoğundan farklı bir kromozom sırası (1, 2, …21, X, Y, MT) uyguladığından, bu özellikle zahmetlidir. ve Y. Elbette, sayısal kromozomları karakter veya tamsayı olarak sıralamak da farklı sıralama düzenleriyle sonuçlanır. Dosyalar arasında kromozom sıralamasındaki tutarsızlıklar, önemli bir hesaplama halihazırda gerçekleştirilinceye kadar genellikle tespit edilmez. İlgili bir sorun, bir dosya belirli bir kromozomdan diğerinin içermediği aralıkları içerdiğinde, kromozom sırasının farklı olup olmadığını veya tüm aralıklar ayrıştırılana kadar bu kromozomun dosyalardan birinde mevcut olup olmadığını ayırt etmek mümkün değildir.

İkincisi, standart krom tarama uygulaması optimal değildir çünkü çoğu zaman sorgu aralıklarıyla asla kesişmeyecek birçok açıklama aralığını dikkate almak (ve ayrıştırmak) zorunda kalır ve bu da gereksiz çalışmaya neden olur [14]. Örneğin, genom boyunca seyrek olarak dağılmış varyantlardan oluşan bir VCF dosyası (örneğin, tek bir ekzom çalışmasından bir VCF) ve tüm genom açıklamalarının yoğun veri setleri verildiğinde, krom tarama, bütünün her aralığını ayrıştırmalı ve test etmelidir. ilgi alanları dosyadaki bölgelerin %1'inden daha azını oluştursa da, bir sorgu aralığı ile kesişim için genom açıklamaları. Diğer bir deyişle, yoğun açıklama dosyalarına sahip seyrek sorgular, krom tarama performansı için en kötü durum senaryosunu temsil eder, çünkü veri kümelerindeki aralıkların yüksek bir oranı asla kesişmez.

Krom tarama algoritmasının üçüncü bir sınırlaması, algoritmanın doğası gereği seri doğası nedeniyle, aralık kesişimlerinin algılanmasını paralelleştirmenin zor olması ve tek CPU performansının, aralıkların ayrıştırılabileceği hız ile sınırlandırılmasıdır. Aralıklar sıralı bir düzende geldiğinden, farklı bir işleme iş parçacığındaki her dosyadan yeni bir bölgeyi işlemek için ileriye atlamak, önceden hesaplanmış bir uzamsal aralık indeksi olmadan zordur ve kesişmeden sonra aralıkları sıralı düzende raporlamak ek muhasebe gerektirir.

Paralel krom tarama algoritması

Bu eksiklikleri gidermek için, sorgu ve veritabanı aralıklarının "parçalarını" aynı anda krom taraması yapan paralel bir algoritma geliştirdik. Girişi [15] tek tip olarak bölen önceki bellek içi paralel süpürme yöntemlerinden farklı olarak, iki kriterden birini karşılayan ardışık sorgu aralıklarıyla (ön işlemeye gerek kalmadan [16]) yığınları tanımlarız: ya küme "yığın boyutuna" ulaşır eşik veya bir sonraki aralığa olan genomik mesafe, "boşluk boyutu" eşiğini aşıyor. Yığın boyutunu kısıtlamak, verimli yük dengelemeyi desteklemek için (yani görev farklılığını önlemek için) iş parçacıkları arasında makul ölçüde eşit çalışma yaratır. Boşluk boyutu sınırı, uzak sorgu aralıkları arasında yer alan çok sayıda ilişkisiz veritabanı aralığının işlenmesini önlemek için tasarlanmıştır.

Bir yığın tanımlanır tanımlanmaz, önceden tanımlanmış diğer parçalarla paralel olarak süpürülmesi planlanır. Yığındaki sorgu aralıklarının sınırları, her açıklama dosyasından istenen aralıkların aralığını belirler (Şekil 3). Şu anda bu istekler ya bir Tabix [17] dizinlenmiş dosyasına ya da bíogo paketi [18] aracılığıyla bir BAM dosyasına yöneliktir, ancak herhangi bir uzamsal sorgu kolayca desteklenebilir. Bu istekleri kullanarak veritabanı aralıklarını toplamanın önemli bir yan etkisi, açıklama dosyalarının sıralanması gerekirken, açıklamaların kromozom sıralarının eşleşmesine gerek olmamasıdır. Bu, herhangi bir "chr" önekini dahili olarak kaldırmanın yanı sıra, yukarıda ayrıntıları verilen ilgili kromozom sırasını ve temsil karmaşıklıklarını hafifletir. Bu isteklerden gelen aralıklar kümesi, daha sonra standart krom tarama algoritması tarafından işlenen yığını tamamlamak için sorgu aralıklarıyla entegre edilir. Bununla birlikte, pratikte bu, akışlar tarafından gerçekleştirilir, böylece chrom-sweep sırasında açıklama aralıkları yineleyicilerinden alınırken yalnızca sorgu aralıkları bellekte tutulur. Bu stratejideki bir performans darboğazı, çıktının sıralanması gerektiğidir ve parçalar herhangi bir sırada bitebileceğinden, sıralanmış düzeni geri yüklemek için tamamlanmış parçaları ara belleğe almamız gerekir. Bu, disk hızı sınırlamaları ile birlikte, optimum paralelleştirme verimliliğini önleyen birincil ek yük kaynağıdır.

Paralel süpürme algoritması. Şekil 2'de olduğu gibi, kromozomu alttan üst konumlara doğru tararız (ve sol ile sağ Şekilde). NS Yeşil sorgu aralıkları, ile gösterilen iki açıklama dosyasıyla açıklanmalıdır. Mavi ve turuncu aralıklar. Paralelleşme gerçekleşir parçalar tarafından tanımlanan sorgu aralıklarının siyah dikey çizgiler. Bir işlem, bir sonraki aralığa maksimum boşluk boyutuna ulaşılana kadar (örneğin, parçalar 2, 4) veya aralık sayısı, yığın boyutu eşiğini geçene kadar (örneğin, parçalar 1, 3) sorgu aralıklarını belleğe okur. Yeni bir dizi sorgu aralığı biriktikçe, ilk yığın, ilki tarafından sağa sınırlanır. dikey siyah çizgi yukarıdaki, süpürme için gönderilir ve bir FIFO (ilk giren ilk çıkar) kuyruğuna bir yer tutucu konur, böylece diğer parçalar önce bitse bile çıktı sıralanmış olarak kalır. Ek açıklama dosyaları, sorgu yığınındaki aralıkların sınırlarına dayalı olarak bölgelerle sorgulanır. Sorgular daha sonra aralık akışlarını döndürür ve son olarak bu akışlar yeni bir işlemde krom tarama algoritmasına gönderilir. Bittiğinde, yer tutucusu FIFO kuyruğundan çekilebilir ve çıktı için sonuçlar verilir.

Vcfanno uygulama

Vcfanno Go'da (https://golang.org) yazılmıştır, bu da birçok avantaj sağlar. İlk olarak Go, Mac, Linux ve Windows için 32 ve 64 bit sistemler için çapraz derlemeyi destekler. Go'nun performansı şu anlama gelir: vcfanno büyük veri kümelerini nispeten hızlı bir şekilde işleyebilir. Go ayrıca basit bir eşzamanlılık modeli sunar. vcfanno Yarış koşulları olasılığını en aza indirirken kesişmeleri paralel olarak gerçekleştirmek ve genellikle paralel uygulamaları rahatsız eden yük dengeleme sorunları. Ayrıca, Sonuçlar bölümünde gösterdiğimiz gibi, vcfannoKrom tarama algoritmasının paralel uygulaması hız ve ölçeklenebilirlik sağlar. Son olarak, BED, VCF, GFF, BAM ve GTF gibi birçok yaygın formatta sağlanan açıklamaları desteklemesi nedeniyle çok esnek bir araçtır.


%>% .$column_name R temel boru için eşdeğer |>

Temel boruda, borudan geçirilen veriler için yer tutucu sağlanmaz. Bu, magrittr borusu ile taban R borusu arasındaki farklardan biridir. Nesneye erişmek için anonim bir işlev kullanabilirsiniz.

$ |> içindeki doğrudan kullanımı şu anda devre dışı. Belki bir sebep yazmak olabilir

$ çağrısına (veya |>'deki diğer devre dışı bırakılmış işlevlere) hala ihtiyaç duyuluyorsa, @jay-sf'nin çözümüne benzer bir işlev oluşturmanın yanı sıra bir seçenek, temel olarak işlev :: aracılığıyla $ kullanmaktır: :`VCF bilgi alanında boru karakteri kullanımı - Biyoloji,[nobr][H1toH2] veya onu frenlere yerleştirin ( $ ) :

Başka bir seçenek, bir tuhaf boru ->. . Bazıları buna şaka diyor, diğerleri mevcut sözdizimini akıllıca kullanıyor.

Bu oluşturur veya üzerine yazar. .GlobalEnv içinde. rm(.) onu kaldırmak için kullanılabilir. Alternatif olarak yerel olarak işlenebilir:

Bu durumda, iris ve ortamında aynı iki nesneyi üretir. ama onlar olduğu sürece modifiye edilmemiş aynı adresi gösteriyorlar.


Ne var ne yok?

Eşi görülmemiş hız
Bitsel operatörlerin yoğun kullanımı, sıralı bellek erişim kalıpları, çoklu kullanım ve üst düzey algoritmik iyileştirmeler sayesinde PLINK 1.9, PLINK 1.07 ve diğer popüler yazılımlardan çok, çok daha hızlıdır. Kimlik bazında matris hesaplama, mesafe tabanlı kümeleme, LD tabanlı budama, haplotip blok tanımlama ve ilişkilendirme analizi max(T) permütasyon testleri dahil olmak üzere en zorlu işlerden bazıları artık yüzlerce hatta binlerce kez daha hızlı tamamlanıyor , ve en önemsiz işlemler bile G/Ç iyileştirmeleri nedeniyle 5-10 kat daha hızlı olma eğilimindedir.

PLINK 1.9'un performansına katkıda bulunan fikirlerin büyük çoğunluğunun birkaç durumda başka yerlerde geliştirildiğini eklemek için acele ediyoruz, önemli bir revizyon olmadan sadece az bilinen ancak olağanüstü uygulamaları aktardık (muhtemelen onları tanınmayacak kadar çirkinleştirsek bile bunun için üzgünüm, Roma. ). Teşekkür edilecek kişilerin kısmi listesi için kredi sayfasına bakın. İlgili bir notta, şu anda yaptığımızdan önemli ölçüde daha iyi olan bir PLINK komutunun uygulanmasının farkındaysanız, algoritmalarına geçmekten ve belgelerimizde ve makalelerimizde onlara kredi vermekten memnuniyet duyacağımızı bize bildirin.

Neredeyse sınırsız ölçek
Ana genomik veri matrisinin artık RAM'e sığması gerekmiyor, bu nedenle on binlerce örneğin ekzom veya tam genom dizilemesinden milyonlarca değişken çağrı içeren son teknoloji veri kümeleri sıradan masaüstlerinde işlenebilir (ve bu işlem genellikle tamamlanır). makul bir süre içinde). Ek olarak, birkaç temel örnek x örnek ve değişken x değişken matris hesaplamaları (aşağıda belirtilen GRM dahil), bilgi işlem kümeleri arasında temiz bir şekilde bölünebilir (veya tek bir bilgisayar tarafından yönetilebilir parçalar halinde seri olarak işlenebilir).

Komut satırı arayüzü iyileştirmeleri
Komut satırı ayrıştırıcısının nasıl çalıştığını standartlaştırdık, orijinal "her şey bir bayraktır" tasarımından daha düzenli bir bayraklar + değiştiriciler yaklaşımına geçtik (geriye dönük uyumluluğu korurken) ve kapsamlı bir komut satırı yardım tesisi ekledik.

İlave fonksiyonlar
2009'da GCTA yoktu. Bugün, karma model ilişkilendirme analizinde ve diğer hesaplamalarda genetik ilişki matrislerinin kullanımını destekleyen önemli ve büyüyen bir araç ekosistemi var. Linux'un yanı sıra macOS ve Windows üzerinde çalışan bin uygulaması ve optimuma yakın bir --rel-cutoff budayıcı.

Birkaç popülasyon genetikçisinin hayatını kolaylaştırabilecek küme tabanlı filtreler ve koordinat kökenli LASSO gibi ara sıra başka eklemeler de var. Yeni işlevler şu an için en önemli öncelik değil (%95+ geriye dönük uyumluluk ve destekleyici dozaj/aşamalı/trialelik veriler daha önemlidir. ), ancak isterseniz yalnızca program çekirdeği üzerinde çalışmaktan zaman ayırmaya hazırız. güzelce sor


Yapı
İşletim sistemiGeliştirme (8 Haz)Alfa 2.3 finali (24 Ocak 2020)
Linux AVX2 Intel 1 indirmekindirmek
Linux 64 bit Intel 1 indirmekindirmek
Linux 32 bitindirmekindirmek
macOS AVX2indirmekindirmek
macOS 64 bitindirmekindirmek
Windows AVX2indirmekindirmek
Windows 64 bitindirmekindirmek
Windows 32 bitindirmekindirmek

1: Bu yapılar AMD işlemcilerde çalışmaya devam edebilir, ancak Intel MKL'ye statik olarak bağlıdırlar, bu nedenle bazı doğrusal cebir işlemleri yavaş olacaktır. Destekleyici kitaplıklar kullanıma sunulur sunulmaz, AMD Zen için optimize edilmiş bir yapı sağlamaya çalışacağız.

Kaynak kodu ve derleme talimatları GitHub'da mevcuttur. (İşte kaynak kodun başka bir kopyası.)

Son sürüm geçmişi

8 Haz 2021: --sort-vars ile veya düşük bellek koşulları altında oluşabilecek çok allelik değişkenli yazma hatası (tipik olarak bir segmentasyon hatası veya onaylama hatası olarak ortaya çıkar) düzeltildi.

25 Mayıs: .fa yükleyici artık boş satırları tolere ediyor. birden çok akış veya sondaki çöp içeren gzip dosyaları yeniden kabul edilmelidir.

23 Mayıs: Sabit FID+IID+SID yüklemesi (son derlemeler yanlış bir "SID sütunu IID sütununu hemen izlemiyor" hatası veriyordu).

5 Mayıs: 16 Ocak'ta ortaya çıkan hata düzeltildi.

20 Nis: --het cols= artık düzgün çalışmalı.

16 Nisan: --data/--gen artık 6 önde gelen sütunlu .gen dosyalarını destekliyor. Bu biçim "--export oxford-v2" ile dışa aktarılabilir.

14 Nis: --pmerge-list artık sistemin #-of-open-files sınırı ile sınırlandırılmamalıdır.

13 Nisan: --glm yerel değişken işleme hata düzeltmesi. Çoklu allelik varyantlar mevcutken oluşturulan .pgen başlığının geçersiz olmasına neden olabilen --pmerge[-list] hatası düzeltildi.

6 Nis: --data/--sample artık 'C' sütun tipini 'P' (sürekli fenotip) ile eşanlamlı olarak tanıyor. (Bu derlemede yanlış bir "6 Mar" tarih damgası var, bunun için üzgünüm.)

28 Mart: --sample-counts chrX bilinmeyen erkek hata düzeltmesi.

25 Mart: --pmerge[-list] .bim işleme hata düzeltmesi.

23 Mar: Unbreak --make-pgen + --sort-vars (bu, 28 Şubat derlemesi tarafından bozuldu).

2 Mart: --pmerge[-list] hata düzeltmeleri (çıktı .pvar dosyası zaten mevcutsa, tüm varyantlar farklı konumlarda olduğunda artık segfault olmaz, bir giriş dosyası birden fazla kromozomu kapsıyorsa, önce eklemek yerine silinir, artık yok olası bir onaylama hatası, aynı konumdaki aynı kimlikli varyantların birleştirilmesiyle ilgili bazı sorunları düzeltti).

1 Mart: --pmerge-list-dir bayrağı uygulandı (tüm --pmerge-list girdileri için ortak bir dizin öneki belirtir).

28 Şub: --pmerge[-list] artık birleştirme benzeri işler için kullanılabilir.
unutmayın yapmaz mutlaka bir kromozom bölünmüş veri kümesinde saf birleştirme gerçekleştirin: bir dosyadaki iki değişken aynı konuma ve kimliğe sahipse, bir şekilde birleştirilirler. Olumsuz tek bir kimliği paylaşan 'bölünmüş' çok alelik varyantlarla uyumludur (bunlar, "bcftools norm -m +" gibi özel bir 'birleştirme' işlemiyle birleştirilmelidir). Sonuç olarak, --pmerge[-list] böyle bir bölünmüş değişken algıladığında varsayılan olarak hata verir. Çözümlerden biri, bölünmüş varyantın her bir parçasına farklı kimlikler atamak için --set-all-var-ids kullanmaktır.

3 Şubat: FILTER değerleri INFO/PR veya CM değerleriyle aynı anda alakalı olduğunda tetiklenen .pvar yükleme hatası düzeltildi. Hem REF hem de ALT'nin eksik olduğu varyantları içeren .ped'den türetilen dosya kümelerine yeniden izin verilir (bu tür varyantlar son sürümlerde yasaklanmıştır). --vcf-ref-n-missing bayrağı, .ped'den türetilen VCF'lerin yeniden içe aktarılmasını basitleştirmek için eklendi. --pgen-diff çıktısından fazladan sekmeler kaldırıldı.

23 Ocak: --chr-set şimdi MT'yi haploid olarak ayarlıyor. ##chrSet .pvar başlık satırı, karşılık gelen komut satırı bayrağı olmadan artık chrX, chrY ve MT ploidy'yi doğru şekilde başlatıyor.

18 Ocak: ##chrSet .pvar başlık satırları artık VCFv4.3 spesifikasyonuna uygundur (bir ID alanı dahildir). VCF/BCF dışa aktarma artık daha fazla başlık doğrulaması gerçekleştiriyor.

16 Ocak: --update-parents artık diğer komutlardaki 'maybeparents' çıktı sütun kümeleriyle düzgün çalışıyor.

14 Ocak: --update-ids artık bir FID sütunu oluşturduğunda diğer komutlardaki 'maybefid' çıktı sütun kümeleriyle düzgün şekilde çalışıyor.

4 Ocak: --normalize artık eksik ve '*' alellerini atlıyor.

3 Ocak: Aşamalı olmayan çok alelik varyantları etkileyen --bcf hatası düzeltildi (genellikle sahte bir "GT yarım arama" çökmesine neden olur, ancak bunu --vcf-half-call ile bastırırsanız veriler doğru şekilde içe aktarılmaz). Aynı adlara sahip FILTER/INFO/FORMAT anahtarlarına sahip başlıklarda oluşan "--export bcf" hatası ve birden çok FILTER hatası olan varyantlarda meydana gelen kilitlenme düzeltildi. --output-missing-genotip/--output-missing-fenotip hata düzeltmeleri/temizleme.

2 Ocak: --pgen-diff çoklu allelik-varyant işleme hata düzeltmesi. --pgen-diff DS karşılaştırması uygulandı. --adjust cols= ayrıştırma hata düzeltmesi ('cols=+qq' şimdi çalışmalıdır).

1 Ocak 2021: Birkaç SID işleme hatası düzeltmesi. --sample-diff 'dozaj' ve 'id-delim=' değiştirici komut satırı ayrıştırma hata düzeltmeleri. --sample-diff, karşılaştırılan numunelerde bulunmadığında daha sonraki ALT alellerini artık atlamaz. --pgen-diff GT karşılaştırması uygulandı (PLINK 1.x --merge-mode 6/7'nin genelleştirilmesi).

12 Aralık 2020: --q-skor aralığı puan ortalaması, ALLELE_CT, DENOM ve NAMED_ALLELE_DOSAGE_SUM sütunu hata düzeltmesi.

28 Ekim: Çoklu geçiş "--export A" hata düzeltmesi. Daha önce belleğe sığmayacak kadar büyük bir dosyada plink2 "--export A" çalıştırdıysanız, bu derlemeyle yeniden çalıştırmanızı öneririz.

20 Ekim: --fst Weir-Cockerham yöntemi uygulandı. --fst ids= ve chrX hata düzeltmeleri. --fst varyant raporu OBS_CT artık popülasyon çiftine özeldir.

19 Ekim: Linux ikili dosyaları artık --native belirtilmediği sürece makineler arasında tekrarlanabilir sonuçlar vermelidir (önceden Intel MKL, farklı kayan nokta yuvarlama davranışıyla işlemciye bağlı kod yollarını seçebiliyordu). --fst Hudson yöntemi uygulandı. Kategorik fenotiplerdeki kategoriler artık doğal sıralı düzende rapor ediliyor. --variant-score MISSING_CT/OBS_CT hata düzeltmesi.

23 Eylül: --update-ids no-FID hata düzeltmesi.

14 Eylül: --glm + --parametreler chrX/chrY hata düzeltmesi.

31 Ağu: --data/--sample artık QCTOOLv2'nin .sample lehçesini destekliyor. --export 'örnek-v2' dışa aktarır.

27 Tem: --glm 'cc-residualize' uygulandı. Önemli sayıda eksik genotipiniz varsa, bu yaklaşımların önerilmediğini unutmayın.

25 Tem: --glm 'firth-residualize' değiştiricisi eklendi. Bu, Mbatchou J et al. (2020) Kantitatif ve ikili özellikler için hesaplama açısından verimli tüm genom regresyonu.

6 Tem: --af-pseudocount bayrağı uygulandı bu, alel frekans tahmini için 0 veya 1 dışında bir sözde sayı belirlemenizi sağlar.

1 Tem: --make-[b]pgen 'dozajdan eksik doldurma' değiştiricisi, eksik sabit çağrı gerektirmeyen algoritmaları desteklemek için uygulandı.

27 Haz: --hardy/--hwe chrX çok allelik varyant işleme hata düzeltmeleri.

25 Haz: Yanıltıcı "Böyle bir dosya veya dizin yok" dosya okuma hata mesajı değiştirildi.

15 Haz: --glm local-covar= ID uzunlukları makul olduğu sürece uzun RFMix2 başlık satırlarında artık hata yok.

31 Mayıs: Tek duyarlıklı --değişken puan modu eklendi.

11 Mayıs: Kategorik ortak değişkenler mevcut olduğunda, ancak hiçbirinin 2'den fazla kategorisi olmadığında oluşan --glm segfault düzeltildi.

9 Nis: Firth regresyon uygulaması artık R logistf() ile aynı maxit=25 değerini kullanıyor. Daha da fazla yineleme ile değişecek olan lojistik/Firth regresyon sonuçlarını işaretlemek için 'BİTTİRİLMEDİ' hata kodu eklendi.

28 Mar: Sıfır MAF bialelik varyantları mevcutken segfault'lara neden olan 21 Mar yapısındaki --glm hatası düzeltildi. --glm artık, 'covars'a izin verme' değiştiricisi belirtilmedikçe, hiçbir ortak değişken dosyası belirtilmediğinde hata veriyor.

21 Mart: 'Genotipik', 'hethom', 'dominant', 'recessive', 'etkileşim' veya --testler belirtildiğinde ve 'baskın'/' düzeltildiğinde meydana gelebilecek --glm çoklu allelik varyant işleme hataları düzeltildi çekinik' belgeler. Diğer aleller için --glm sonuçları elde etmek için multiallelik varyantlardan sıfır (veya diğer sabit) dozaj alellerini kırpmak artık gerekli değildir.

14 Mart: --make-pgen/--make-just-pvar 'vcfheader' sütun seti eklendi (bu, doğrudan yalnızca sitelere yönelik geçerli bir VCF oluşturmayı mümkün kılar). .pvar dosyasının Bgzip'i doğrudan desteklenmez, ancak bunu düşük ek yük ile gerçekleştirmek için adlandırılmış bir kanal kullanabilirsiniz.

11 Mar: Hiçbir ortak değişken belirtilmediğinde oluşabilecek --glm segfault düzeltildi. VCF/BCF içe aktarıcıları artık varsayılan olarak geçici .pvar dosyasını sıkıştırıyor, böylece çok sayıda INFO alanı içeriğine sahip dosyalar çalışmak için orantısız derecede büyük miktarda boş disk alanı gerektirmez. --keep-autoconv artık .pvar dosyasının sıkıştırılmasını istemek için bir 'vzs' değiştiricisine sahiptir (ve tersine, --vcf/--bcf bare --keep-autoconv ile kullanıldığında, .pvar sıkıştırılmaz).

10 Mar: Herhangi bir aşamalı sabit çağrı olmadan aşamalı dozajlar mevcut olduğunda oluşan --make-pgen segfault düzeltildi.

8 Mart: "--export bcf" uygulandı. VCF-ihraç çok allelik HDS-force hata düzeltmeleri. Kaynaklar sayfasındaki tam genomlu 1000 Genom faz 3 açıklamalı .pvar dosyalarına eksik FILTER/fa başlık satırı eklendi.

25 Şubat: --ld çok alelik aşamalı veri işleme hata düzeltmesi.

22 Şubat: --bcf n_allele=1 (ALT='.') hata düzeltmesi.

19 Şubat: --bcf GQ/DP filtreleme hata düzeltmeleri. --vcf ve --bcf artık VCF contig adlandırma kısıtlamalarını zorunlu kılıyor.

11 Şubat: "--vcf-half-call referansı" tekrar düzgün çalışıyor (son derlemelerde "--vcf-half-call hatası" gibi davranıyordu).

8 Şub: BGZF ile sıkıştırılmış metin dosyaları artık dosya üzerinde birden çok geçiş yapan tüm komutlarla düzgün şekilde çalışmalıdır (önceden --vcf ile çalışıyorlardı, ancak bu türde neredeyse hiçbir komut yok). Bu komutlara adlandırılmış boru girişi, daha önce sonsuza kadar askıda kalabileceği makul bir süre içinde tutarlı bir şekilde bir hata mesajıyla sonuçlanmalıdır.

3 Şub: --missing-code artık --haps ile düzgün çalışıyor.

24 Ocak: --extract/--exclude hatası daha önce işlem sırasına göre başka bir değişken filtresi uygulandığında meydana gelebilecek hata düzeltildi (ör. --snps-only, --max-alleles, --extract-if-info). Bu hata düzeltmesi alfa 2'ye geri aktarıldı.

21 Ocak: "--extract aralığı" ve "--exclude aralığı", girdi dosyaları geçerli veri kümesinde bulunmayan bir kromozom kodu içerdiğinde artık hata vermiyor.

16 Ocak: --pca allel/varyant ağırlıklı çoklu kullanım hata düzeltmesi.

14 Ocak: --make-king-table yeniden kontrol hata düzeltmesi.

3 Ocak 2020: Ekim ayı sonlarında sunulan --extract-if-info/--exclude-if-info sayısal argüman hatası düzeltildi.

30 Aralık 2019 (alfa 3): Bu, aşağıdaki olası uyumluluğu bozan değişiklikleri yapar:

    ve --indep-pairwise, tüm varyant kimliklerinin benzersiz olmasını gerektirir. --write-snplist için bu, 'allow-dups' değiştiricisi eklenerek geçersiz kılınabilir. REF/ALT modunun açıkça bildirilmesini gerektirir. ikili fenotipler için varsayılan olarak 'birinci geri dönüş' moduna geçer. Eski davranış, 'no-firth' değiştiricisi ile talep edilebilir.
  • --glm, fenotip ve ortak değişkenler arasında doğrusal bir bağımlılık olduğunda, yalnızca fenotipi atlamak ve bir uyarı yazdırmak yerine hataları giderir. Eski davranış, 'atla' değiştiricisi ile talep edilebilir. 'nin 'var-wts' alt komutu, multiallelik varyantları düzgün şekilde işleyen 'allele-wts' ile değiştirildi. Yalnızca bialelik varyantları içeren veri kümeleri için eski çıktı formatı yine de 'biallelic-var-wts' ile talep edilebilir.
  • PLINK 2 artık 50'den az kurucuya sahip bir veri kümesinde bir LD hesaplaması talep ettiğinizde hata veriyor. Bu --bad-ld ile geçersiz kılınabilir. 'nin eski NMISS_ALLELE_CT sütunu (nüzerindeÖzlemekalel sayımı) ALLELE_CT olarak yeniden adlandırıldı ve sütun kümesi buna göre yeniden adlandırıldı, çünkü diğer bağlamlarda 'nmiss', nçok sayıda Özlemektemelde tam tersi olan değerlerdir. 'nin ID <1,2>sütunları, diğer PLINK 2 komutlarıyla tutarlılık için IID<1,2> ​​olarak yeniden adlandırıldı.

Ek olarak, GRM hesaplaması ("--pca yaklaşık" ve "--score varyans-standardize" ile birlikte) artık tüm küçük alelleri birlikte çökertmek yerine çok alelik varyantları düzgün bir şekilde ele alıyor --score, çok alelik bir varyanttaki her alelin, kendi puanı atanabilir ve --glm kategorik değişkenleri VIF taşmasına neden olma olasılığı daha düşük bir şekilde işler.

Son alfa 2 yapısı GitHub'da etiketlendi ve önümüzdeki birkaç ay boyunca buradan indirilebilir durumda kalacak.

29 Aralık: Bazı heterozigot-çift-ALT çok alelik türevlerinin işlenmesini etkileyen bir hata ve ALT2/ALT3/vb.'ye neden olan bir hata düzeltildi. alel frekanslarının bazı durumlarda uygun şekilde başlatılamamasıdır.

13 Aralık: 22 Kasım derlemesinde tanıtılan ve rapor edilen bazı dozajların/sayımların ( --freq'in OBS_CT sütunu gibi) iki katına çıkmasına neden olan hata düzeltildi. --loop-cats hata düzeltmeleri.

28 Kasım: Geçen ay tanıtılan bir VCF yarım çağrı işleme hatası düzeltildi.

26 Kasım: 16'dan fazla iş parçacığı ile yinelenmeye izin verilmeyen varyant kimliği araması yapıldığında segfault'a neden olan son hata düzeltildi.

25 Kasım: Contig sayısı 16'nın katı olduğunda --sort-vars'ın segfault yapmasına neden olan hata düzeltildi. --keep-fcol ve --extract-fcol kötü adlar olarak değerlendirildi ve yeniden adlandırıldı -- sırasıyla keep-col-match ve --extract-col-cond (eski adlar bu derlemede çalışmaya devam edecektir).
Çevrimiçi belgeler artık neredeyse tamamlandı. Kenar çubuğu arama kutusu çalışır.

22 Kasım: Firth regresyon hızı iyileştirmesi. "--freq sayımları" artık --read-freq'in .acount dosyasından orijinal alel frekanslarını mükemmel bir şekilde yeniden yapılandırması için dozajları yeterli hassasiyetle dışa aktarıyor ve --read-freq bunu yapacak şekilde değiştirildi.

15 Kasım: 'hide-covar' belirtilmediğinde çöp çıktısına neden olabilecek "--glm cols=+err" hatası düzeltildi. --covar-number kullanımdan kaldırıldı (önceden yanlış bir şekilde aynı semantiklere sahip olmayan --covar-col-nums'a dönüştürülüyordu).

12 Kas: All-vs.-all --make-king[-table] çalıştırmaları artık MAF < 1% varyantlarını çok daha verimli bir şekilde işliyor. --no-input-missing-fenotip seçeneği eklendi. --variant-score artık ikili çıktıyı destekliyor.

10 Kasım: 29 Ekim derlemesinde tanıtılan ve bir 'NA'/'nan' fenotipi veya ortak değişken değeriyle karşılaşıldığında segfault'a neden olan sabit hata.

9 Kasım: --variant-score (--score'un devrik) uygulandı.

4 Kasım: "--export vcf" geçersiz allel kodu uyarısı geri yüklendi.

31 Ekim: --split-cat-pheno 'omit-most' değiştiricisi uygulandı, --glm'nin yerleşik varyans-enflasyon faktörü denetimiyle 'omit-last'tan daha iyi çalışıyor ve --glm kategorik ortak değişkenleri işlemeye geçecek alfa 3'te bu şekilde.

30 Ekim: --covar-col-nums ve --covar iid-only'nin karıştırılmasına neden olan hata düzeltildi. Metin giriş dosyalarının çoğu için daha katı boş satır politikası: sonunda bunlara izin verilir (çünkü bu, manuel olarak düzenlenen dosyalarda arada bir gerçekleşir), ancak artık başka yerlerde izin verilmez. Bir .pvar dosyası (ör. 'pvar-cols=-info' ile) oluştururken FILTER ve/veya INFO sütunlarının kaldırılması artık ilgili başlık satırlarını kaldırıyor.

29 Ekim: --q-skor aralığı uygulandı. Bir sayı ile başlayan ancak sayısal olmayan içerik (ör. "-123.4abc") içeren dizeler artık bir kayan noktalı sayı beklendiğinde bir hata tetikliyor, örnek dize daha önce -123.4 olarak ayrıştırılmıştı.

25 Ekim: --make-king-table 'rel-check' değiştiricisi eklendi, bunun PLINK 1.9 --genome ile aynı etkiye sahip olduğunu ekledi. --pca 'var-wts' değiştiricisi kullanımdan kaldırıldı: verileriniz yalnızca bialelik varyantlar içeriyorsa ve varyant başına yalnızca bir ağırlık oluşturmaya devam etmek istiyorsanız 'biallelic-var-wts'ye geçin. (Alfa 3, allel başına bir ağırlık oluşturan bir 'alel-wts' değiştiricisini tanıtacaktır, bunun yerine bu, analitik olarak sağlam bir şekilde multiallelik varyantları desteklemek için gereklidir.)

22 Ekim: --recover-var-ids uygulandı. (Bu, --set-all-var-ids'i tersine çevirmek için tasarlanmıştır.)

20 Ekim: --sample-counts uygulandı bu, "bcftools stats" -s bayrağı tarafından bildirilen ana (indel olmayan) örnek sayılarını sağlar ve plink2 formatlı büyük veri kümeleri için >100x daha hızlıdır. --extract-fcol alt dize eşleşmelerini destekleyecek şekilde genişletildi.

15 Ekim: 12 Ekim Linux yapılarında plink2'nin --extract/--exclude/--snps ve benzer varyant kimliği filtrelerinde asılı kalmasına neden olan hata düzeltildi. Bir TSV sütununa göre değişkenleri filtreleyen --extract-fcol uygulandı (bu, PLINK 1.x --qual-scores'un bir uzantısıdır).

12 Ekim: "--hwe 0" artık az sayıda çok düşük HWE-p değeri varyantını kaldırmıyor.

9 Ekim: --pheno/--covar 'yalnızca iid' değiştiricisi eklendi, başlıksız dosyaları tek bir kimlik sütunuyla destekliyor. Windows BGZF sıkıştırması artık çok iş parçacıklı. Geliştirilmiş okuma hatası mesajları.

6 Ekim: Windows -- sessiz hata düzeltmesi. Kaynak kodu artık libzstd ile dinamik bağlantıyı desteklemektedir (yine de bu kitaplığın çok iş parçacıklı sürümünü oluşturmazsanız performans düşebilir).

4 Ekim: --king-table-subset + --parallel hata düzeltmesi. Otomatik Zstd metin dosyası açma, şimdi düzgün çalışması gereken 28 Eylül derlemesi tarafından birkaç komut için bozuldu.

3 Ekim: 28 Eylül yapısındaki BGZF dekompresyon hataları düzeltildi. (Bu, VCF &rarr .bed/.pgen dönüşümünü etkilemedi, ancak bazı daha nadir kullanım durumları etkilendi.) SID yükleme hatası düzeltmesi.

28 Eylül: Karışık geçici başvuru hata düzeltmeleri. --ref-allele/--alt1-allele/--update-map/--update-name atlama sayısı hata düzeltmesi. --glm local-covar satır atlama hatası düzeltmesi. Bir girdi dosya adı bir çıktı dosya adıyla eşleştiğinde otomatik yeniden adlandırma, hata vermek yerine yeniden düzgün çalışmalıdır (yine de bundan kaçınılmalıdır).

10 Eylül: --glm ortak testi p değeri hata düzeltmesi. (Bu hata yalnızca --tests'in 4 veya daha fazla tahmin ediciyle çağrıldığı çalıştırmaları etkiledi.)

26 Ağu: --read-freq, tüm değişkenler zaten filtrelenmişken, ayrım hatası yapmak veya sonsuz bir döngüye girmek yerine artık bir uyarı yazdırıyor.

21 Ağu: Sahte 'PR' INFO bayraklarının bildirilmesine neden olan --ref-from-fa/--ref-allel + VCF dışa aktarma etkileşimi düzeltildi.

10 Ağu: Açık-başarısız ve yazma-başarısız hata mesajları artık neyin yanlış gittiğine dair daha ayrıntılı bir açıklama içeriyor. --bgen, --data ve --gen artık ne ilk ne de son alelin tutarlı bir şekilde REF olmadığını açıkça belirtmek için bir 'ref-unknown' değiştiricisine sahiptir.

31 Tem: --score, bir girdi dosyası satırı kesildiğinde segfaulting yerine bir hata mesajı yazdırır. Tam olarak bir ortak değişken tanımlandığında tüm sonuçların 'Yok' olarak raporlanmasına neden olabilecek nadir --glm hatası düzeltildi. .log dosyaları yeniden '--out' ve '--d' yazdırır (bu, 24 Temmuz derlemesi tarafından bozuldu). --glm artık her 'NA' katsayısının nedenini bildiren isteğe bağlı bir çıktı sütununa ('err') sahiptir.

8 Temmuz: --rm-dup/--sample-diff/--ld çok allelik varyant hata düzeltmesi.

5 Temmuz: --read-freq, işlem sırasına göre olağan alel frekansı/sayım hesaplamasından önce hareket etti. Yüklenen alel frekansları artık yeniden hesaplanmaz.

28 Haz: --king-table-subset tekrar düzgün çalışmalı.

26 Haz: Ne 'hide-covar' ne de 'intercept' belirtilmediğinde, bir alelin iki kez raporlanmasına ve bir ortak değişken testinin bildirilmemesine neden olabilen --glm çok alelik varyant hatası düzeltildi. --glm genotypic/hethom'un ortak değişkenler olmadan segfault yapmasına neden olabilen sorun düzeltildi.

17 Haz: --glm p-değeri hesaplamasında bir onaylama hatasına neden olabilecek nadir taşma düzeltildi.

27 Mayıs: Kırılmamış --ayar dosyası. "--export ind-major-bed" performans iyileştirmesi.

12 Mayıs: > 240 boyutundaki gruplarda çökmeye (veya .bed formatlı verilerde yanlış sonuçlar üretmesine) neden olabilen --glm doğrusal regresyon fenotip-toplu işleme hatası düzeltildi.

29 Nis: BGEN 1.2/1.3 aşamalı dozaj içe aktarma hata düzeltmeleri. --make-pgen + --dosage-erase-threshold olmadan --hard-call-threshold artık kilitlenmiyor.

28 Nis: --update-ids ve --update-parents için PLINK 2'ye özel uzantılar basitleştirildi. --id-delim/--sample-diff 'sid' tek sınırlayıcı örnek kimliklerinin, IID-SID'nin --iid-sid bayrağına değiştirildiği şekilde yorumlanması gerektiğini belirtmek için değiştirici.

27 Nis: -- 17..31 (mod 32) ile uyumlu örnek sayıları için hata düzeltmesi olabilir. Bu, dosyanın yalnızca son birkaç örneğini etkiledi, ancak --haps daha önceki bir derlemede kullandıysanız, yeniden çalıştırmanızı şiddetle öneririz. --glm lojistik regresyon 'SE' sütunu, oran oranlarını bildirirken LOG(OR)_SE olarak yeniden adlandırıldı, böylece rapor edilen standart hatanın oran oran birimlerini kullanmadığını daha açık hale getirdi. --update-ebeveynler uygulandı.

2 Nisan: chrY ve MT varyantlarının yanlış filtrelenmesine neden olabilecek --hwe hatası düzeltildi. --glm 'feno-idler' artık nicel fenotip grupları için çalışıyor.

1 Nis: --glm olmadan --adjust şimdi aynı "eksiklik modeline" sahip nicel fenotip gruplarını algılar ve bunları birlikte işler (büyük bir hız artışıyla ancak dikkatli olun: disk alanı, muhtemelen 'gizle'yi kullanmak istersiniz -covar' değiştiricisi, 'zs' ve/veya --pfilter da yararlı olabilir). --glm lineer regresyon local-covar= hata düzeltme.

26 Mart: Minimac3-r2 hesaplama hata düzeltmesi. --glm artık 'feno-id' değiştiricisi eklenmedikçe her bir fenotip için kullanılan tüm örnekleri listeleyen .id dosyaları oluşturmaz. --güncelleme-kimlikleri uygulandı.

23 Mar: En fazla alel sayısının 6 veya 18 olduğu dosyaları etkileyebilecek çok alelik değişkenli yazar hatası düzeltildi. --minimac3-r2-filter ve --freq minimac3r2 sütunu uygulandı.

18 Mar: --write-covar artık hiçbir ortak değişken yüklenmediğinde, en az bir fenotip yüklenmişse ve fenotip çıktısı istenmişse kullanılabilir.

9 Mart: plink2 --version ve --help artık sıfırdan farklı çıkış kodları döndürmüyor.
Artık bir taslak PGEN spesifikasyonu mevcuttur.

6 Mar: Bir değişken filtresi etkinken sahte bir "Hatalı biçimlendirilmiş .pgen dosyası" hatasına neden olabilecek sabit alel frekansı hesaplama hatası.

5 Mart: Çok iş parçacıklı --extract/-exclude.

4 Mar: --doğrusal regresyon çıktı hata düzeltmesini test eder.

3 Mart: 1 Mart'ta tanıtılan --glm olasılık oranı yazdırma hatası düzeltildi.

2 Mart: Daha fazla yardım metni temizleme (artık çevrimiçi belgeler dahil).

1 Mart: --recode-allele uygulandı (ve tutarlılık için --export-allele olarak yeniden adlandırıldı). VCF içe aktarma artık boşluk içeren bir INFO değeri içe aktarıldığında hata veriyor. Komut satırı yardım metnindeki parantezler artık diğer araçlara daha benzer bir şekilde kullanılmaktadır.

21 Şubat: --glm ortak testleri artık daha iyi küçük örnek doğruluğu için F istatistiklerine dayanmaktadır.

20 Şubat: --import-dozaj-kesinliği, dozaj kesinliği yetersiz olduğunda VCF GT alanına geri dönmek yerine artık her zaman eksik bir çağrı üretiyor. --extract-intersect bayrağı eklendi.

19 Şubat: --glm hiçbir ortak değişken olmadan tekrar düzgün çalışıyor (sahte bir "bellek yetersiz" hatasıyla çıkıyordu). --import-dozaj-kesinliği artık sadece genotip-olasılık üçlüleri yerine tek değerli dozajlar üzerinde beklenen etkiye sahip.

18 Şubat: --missing'in dozaj verilerinde çökmesine neden olabilecek bir hata düzeltildi.

14 Şubat: Komut satırı tamsayı parametreleri artık bilimsel gösterimi kullanabilir.

12 Şubat: Aşamalı dozaj içe aktarma hata düzeltmesi.

2 Şubat: --tests + --parameters hata düzeltmesi.

31 Oca: --pca, varyantların sayısı bilgisayar sayısına göre çok küçük olduğunda hatalı sonuçları bildirmek yerine yaklaşık şimdi hata veriyor. --pca yaklaşık özdeğer hatası düzeltmesi.

30 Ocak: --glm ortak değişken ölçeği hatası artık gizemli bir bellek yetersiz hata iletisi üretmek yerine düzgün bir şekilde yayılıyor.

22 Ocak: --glm şimdi hata veriyor ve sayısal kararsızlığın önemli bir sorun olması için ortak değişkenler ölçekte yeterince değiştiğinde --covar-variance-standardize eklenmesini öneriyor.

2 Ocak 2019: Aşamalı dozaj içe aktarma hata düzeltmesi.

27 Aralık 2018: --ref-allele/--alt1-allele skipchar son birkaç aydır bozuldu, tekrar düzgün çalışması gerekiyor. Tamsayı olmayan bir dozaj varyantını içe aktarırken oluşan bir hata düzeltildi.

28 Ekim: --keep-fam/--remove-fam hata düzeltmesi.

2 Ekim: Çok uzun metin satırları (ör. 5 MB'den uzun VCF satırları) yüklenirken oluşabilecek hata düzeltildi.

22 Eylül: Varyantları sıra dışı işlerken oluşabilecek nadir hata düzeltildi. --sample-diff komutu uygulandı.

12 Eylül: --normalize 'liste' değiştiricisi eklendi.

11 Eylül: --rm-dup 'list' değiştiricisi, tüm çoğaltılmış varyant kimliklerini listelemek için eklendi. (Bu, bağımsız bir komut olarak çalıştırılabilir.)

9 Eylül: Metin açıcıda giriş satırlarının atlanmasına neden olabilecek nadir yarış durumu düzeltildi. (Son birkaç ayda bildirilen VCF içe aktarma "Dosya okuma hatası" çökmelerinin nedeninin bu olduğuna inanıyoruz.)

8 Eylül: Fazladan ##contig başlık satırları mevcut olduğunda oluşabilecek VCF-dışa aktarma hatası düzeltildi.--sort-vars hata düzeltmesi. --normalize artık normalleştirme sonrası değişkenlerin artık sıralı düzende olmadığını algılar ve bu durumda bir uyarı yazdırır.

7 Eylül: Aşamalı çok alelik varyantlar için --ld hata düzeltmesi. --rm-dup bayrağı eklendi (yinelenen kimlik türevlerini kaldırır, genotip/INFO/vb. eşitliğini kontrol edebilir).

4 Eylül: A1_CASE_FREQ ve --glm çıktısındaki ilgili sütunlar, son çok allelik güncelleme tarafından bozuldu. --geno-counts ve --hardy çıktısında birkaç sütun adı temizlendi.

31 Ağu: Sabit ve tüm-sabit-ama-1 ortak değişkenlerini işleme ile ilgili --glm hatası düzeltildi.

30 Ağustos: AVX2 ve 32-bit --export bgen-1.2/1.3 hata düzeltmeleri (esas olarak eksik genotipleri etkiler). VCF 4.3 dosyalarını reddeden programlarla (örn. SNPTEST) uyumluluk için "--export vcf-4.2" modu eklendi. Girdide PAR1 ve/veya PAR2 mevcut olduğunda, dışa aktarılan VCF'lerin artık daha uygun ##contig başlıklarına sahip olması gerekir. Sol normalleştirme (--normalize) bayrağı eklendi.

26 Ağu: --pca .eigenvec başlık satırının son sütunu artık atlanmıyor.

21 Ağu: Dünün yapısındaki --mac/--max-mac 'nref' ve 'alt1' modu hataları düzeltildi.

20 Ağu: VCF FORMAT/GP verilerini içe aktarmak için son üç buçuk aydaki herhangi bir derlemeyi kullandıysanız, 7 Mayıs'ta ortaya çıkan "--vcf dozaj=GP" hatası düzeltildi, daha yeni bir derlemeyle yeniden çalıştırın. Dosya ayrıca bir FORMAT/DS alanı içerdiğinde "--vcf dozaj=GP" artık uygun bir mesajla hata veriyor ve GP alanının içe aktarılabileceği nadir durumları kapsayacak şekilde bir 'dozaj=GP-kuvvet' seçeneği eklendi yine de değerli ol. --maf/--max-maf/--mac/--max-mac artık majör olmayan (varsayılan), referans olmayan, alt1 veya minör alel frekanslarını/sayımlarını filtrelemenize izin veriyor, bunun için bcftools notasyonunu kullanabilirsiniz (örn. "--min-af 0.01:minor"), ancak farklı varsayılanı aklınızda bulundurun.

18 Ağustos: Aşamalı haplotipler ve ek açıklamalar dahil ve resmi soyağacında birkaç düzeltme (KING-sağlam analiz yoluyla belirlenir) ile plink2 biçimli 1000 Genom aşama 3 dosyaları artık Kaynaklar sayfasından indirilebilir. --king-cutoff artık bir başlık satırı içeren örnek kimlik dosyalarını işleyebilir.

16 Ağu: --glm lojistik regresyon artık çok alelik varyantları destekliyor. Dünün yapısındaki --glm lineer regresyon dozaj işleme hatası düzeltildi.

15 Ağu: --glm lineer regresyon artık çok alelik varyantları destekliyor. --ld hata düzeltmesi. --parameters + "--glm etkileşimi" artık bir ortak değişken yalnızca bir etkileşimin parçası olarak dahil edildiğinde düzgün çalışıyor.

9 Ağu: --make-king[-table] singleton/monomorphic-variant optimizasyonu uygulandı.

7 Ağu: GRM yapısı ve --missing, artık çok alelik verilerden kopmuyor.

6 Ağu: VCF çok alelik (-fazlı) ithalat ve ihracatı uygulandı. --hwe şimdi çok alelik varyantlar için her aleli ayrı ayrı test ediyor. --min-allel/--max-allel filtreleme bayrakları eklendi.
(--glm, çok alelik varyantları henüz desteklememektedir, bu güncellemenin önümüzdeki hafta yapılması planlanmaktadır.)

30 Temmuz: --vcf-max-dp bayrağı eklendi.

26 Tem: --vcf-half-call artık aşamalı olmayan verilerde düzgün şekilde çalışmalıdır.

25 Temmuz: İstenmeyen sabit çağrı eşiğini tetikleyebilecek --sort-vars/low-memory-make-pgen dozaj işleme hatası düzeltildi. Dozaj verileriyle çalışmak için 14 Nisan - 19 Temmuz 2018 arası bir yapı kullandıysanız, sabit aramalar doğru şekilde eşiklenmemiş olabilir. Etkilenen bir yapı tarafından içe aktarılan filtrelenmemiş dozaj veri kümeleri, --make-pgen + açık --hard-call-threshold çalıştırılarak düzeltilebilir. --geno/--mind gibi sabit arama tabanlı filtreler yeniden çalıştırılmalıdır (sabit aramalar düzeltildikten sonra).

19 Temmuz: --update-alleller uygulandı.

16 Temmuz: Daha çok iş parçacıklı VCF ayrıştırma hata ayıklama günlüğü kodu eklendi.

13 Temmuz: --make-king/--make-grm/--pca'daki chrX/Y/MT otomatik kaldırma hatası düzeltildi.

12 Temmuz: Kırılmamış --mach-r2-filtre.

3 Tem: .fam/.psam dosyaları artık yalnızca IID sütunu istendiğinde veya mevcut olduğunda düzgün şekilde yükleniyor.

29 Haz: .bim/.pvar dosyaları birden fazla

134 milyon varyant yeniden düzgün şekilde yüklenir (yeterli bellek verilir).

25 Haziran: 30 Mayıs civarında kırılan birkaç tek örnekli ihracat vakası düzeltildi.

22 Haziran: 19-20 Haziran sürümlerinde bozulan birkaç günlük mesajı düzeltildi. Devam eden bir çoklu iş parçacığı-VCF-dozaj-içe aktarma hata araştırmasını desteklemek için hata ayıklama-yazdırma kodu eklendi (VCF içe aktarma sırasında gizemli "Dosya okuma hatası" hatalarıyla veya sonucu okurken "Hatalı biçimlendirilmiş .pgen" hatalarıyla karşılaşıyorsanız, "--threads" ekleyin VCF-import komutunuza 1" eklemeniz muhtemelen acil sorununuzu çözecektir, ancak başarısız olan çok iş parçacıklı çalıştırmadan (veya daha iyisi, test verileri) bana bir .log dosyası da gönderebilirseniz, bu çok yardımcı olacaktır).

20 Haziran: 30 Mayıs'ta tanıtılan GRM/PCA/skor hesaplama hatası düzeltildi. GRM/--pca/--score için 30 Mayıs veya Haziran başı derlemesini kullandıysanız, işlemi/işlemleri bu derlemeyle tekrarlamanız gerekir, hata için özür dileriz.

19 Haz: Eksik bir alel çok uzun bir alel ile değiştirildiğinde ortaya çıkabilecek nadir --ref-allel/--alt1-allel köşe durumu düzeltildi.

5 Haz: VCF, başlatılmamış değişken hata düzeltmesini içe aktarıyor. --score 'ignore-dup-ids' değiştiricisi eklendi.

30 Mayıs: "--export haps[legend]" hata düzeltmeleri ve bgzip desteği. "--export vcf vcf-dosage=DS" artık faz bilgisi mevcut olduğunda bildirilmemiş HDS değerlerini dışa aktarmıyor. Unbreak --import-dosage + --map, bu sefer gerçekten.

21 Mayıs: --pgen-info komutu eklendi (.pgen dosyası hakkında herhangi bir faz veya dozaj verisine sahip olup olmadığı gibi temel bilgileri görüntüler).

17 Mayıs: --import-dozaj ve .gen içe aktarma son birkaç haftadır bozuldu, bu şimdi düzeltilmeli. A1 sütunu --adjust çıktısına çoklu alelik varyantlar için hazırlanırken eklendi. --glm 'a0-ref' değiştiricisi 'omit-ref' olarak yeniden adlandırıldı.

15 Mayıs: Dozajlar mevcutken chrX alel frekansı hesaplama hatası düzeltildi. --ld, çok alelik varyantlarla daha iyi oynamak için referans aleller yerine majöre dayalı olacak şekilde değiştirildi. --hardy başlık satırı ve alel sütunları, multiallelik varyant desteğine hazırlanırken değiştirildi.

8 Mayıs: --vcf dozaj=HDS artık DS alanı olmayan dosyaları düzgün şekilde işlemelidir.

7 Mayıs: Nadir G/Ç kilitlenmesi düzeltildi. Geliştirilmiş VCF-içe aktarma paralelliği.

4 Mayıs: Dozaj hassas bitleri 8'in katı olmadığında --bgen içe/dışa aktarma düzeltildi (daha önce bu durumlar için spesifikasyon yanlış yorumlanmıştı, bunun için üzgünüm).

3 Mayıs: --bgen artık 28 bite kadar dozaj kesinliği ile varyant kayıtlarını içe aktarabilir (yalnızca

15 bit hayatta kalacaktır). "--export vcf-dosage=HDS-force" hata düzeltmesi.

2 Mayıs: --vcf dozaj= içe aktarma artık GT alanının mevcut olmasını gerektirmiyor. Sabit potansiyel --vcf dozajı=HDS arabellek taşması.

28 Nis: Otozomlar ve cinsiyet kromozom(lar)ının her ikisi de mevcut olduğunda veya hem chrX hem de chrY mevcut olduğunda oluşan --glm hatası düzeltildi. 9 Şubat 2018 veya daha sonraki bir derlemeyle tam genom --glm çalıştırması yaptıysanız, en son derlemeyle yeniden çalıştırmanız gerekir. Ancak, tek kromozomlu ve yalnızca otozomal --glm çalıştırmaları hatadan etkilenmedi.

24 Nisan: VCF aşamalı dozaj içe aktarma ("--vcf dozajı=HDS") ve dışa aktarma ("--dışa aktarma vcf vcf-dozaj=HDS"). --pca ve GRM hesaplaması artık tamamen haploid genomlar için doğru varyansı kullanıyor.

22 Nis: --export bgen-1.2/bgen-1.3 şimdi chrX/chrY/chrM için çalışmalı ve bu kromozomlar için içe aktarma hatalarını düzeltti.

16 Nisan: --ref-from-fa bitişik satır ayrıştırma hata düzeltmesi.

14 Nis: --export bgen-1.2/bgen-1.3 otozomal diploid verileri için uygulandı. Uygun alel frekansları gerektiren --pca gibi işlemler, --bad-freqs bayrağını eklemediğiniz sürece, frekanslar 50'den az örnekten tahmin edildiğinde artık hata veriyor. Aşamalı dozaj desteği uygulandı. Dışa aktarılan .sample dosyalarındaki örnek kayıp oranı artık sabit aramalardan ziyade dozajlara dayanmaktadır. AVX2 olmayan faz alt kümeleme hata düzeltmesi. --vcf + --psam hata düzeltmesi. --vcf dozaj= artık bunun yerine bir dozaj mevcut olduğunda sabit aramayı yok sayar, --hard-call-threshold 0,1 altında yeniden oluşturulur (farklı bir eşik belirtmediyseniz). --bgen 'ref-second' değiştiricisi, multiallelik varyantlara uygun şekilde genelleştirmek için 'ref-last' olarak yeniden adlandırıldı.

31 Mart: --export haps[legend] artık --ref-allele/--ref-from-fa/etc olduğunda düzgün çalışmalı. aynı koşuda bazı alelleri çevirir.

29 Mart: --set--var-ids AVX2 olmayan hata düzeltmesi. --pheno/--covar otomatik adlandırma hata düzeltmesi.

28 Mart: --bgen 1-bit aşamalı haplotip içe aktarma uygulandı.

26 Mart: --make-bed + --indiv-sort hata düzeltmesi.

23 Mart: Windows yapıları tekrar düzgün çalışmalı (20-21 Mart Windows yapıları kötü bir şekilde bozuldu). --glm artık log-pvalue çıktısını destekliyor ('log10' değiştiricisini ekleyin) ve bunlar çift kesinlikli kayan nokta sınırı olan p=5e-324'ün altında doğru kalıyor.

21 Mart: 3 sütunlu .sample dosyası yüklemesi yeniden düzgün çalışıyor. Dosya okuma yarışı durumu düzeltildi.

20 Mar: Çok uzun satırlar yüklenirken son derlemelerde olası kilitlenme düzeltildi.

19 Mart: Son derlemelerde --örnek segfault düzeltildi. .bgen içe/dışa aktarma hızının iyileştirilmesi. --oxford-single-chr 4 Mart derlemesinde doğru şekilde genişletilmedi, bu şimdi düzeltilmelidir.

11 Mart: Geçen haftaki derlemelerde --pheno segfault'u düzeltin, dosyanın bir başlık satırı olmadığında meydana gelebilir.

9 Mar: Tek bir yazma işlemi 2 GB'den büyük olduğunda oluşan "Dosya yazma hatası" hatası düzeltildi (bu, 128 binden fazla örnekle --make-bed çalıştırıldığında ortaya çıkabilir). Azaltılmış --make-bed bellek gereksinimi.

7 Mar: Son sürümlerde (23 Şubat veya sonrası) olası dosya okuma kilitlenmesi düzeltildi.

5 Mar: --glm local-covar= tekrar düzgün çalışmalı.

4 Mart: --oxford-single-chr artık .bgen dosyalarında kullanılabilir. --make-pgen kısmen aşamalı veri işleme hata düzeltmesi.

26 Şubat: --keep/--remove/etc. başlık satırı olmayan yalnızca IID dosyalarında artık düzgün çalışmalıdır.

23 Şubat: Alfa 2 --vcf + --id-delim hatası düzeltildi. Sıkıştırılmış VCF ve .pvar dosyaları için iyileştirilmiş ayrıştırma hızı.

20 Şubat: "--xchr-model 1" şimdi düzgün çalışmalı.

16 Şub 2018 (alfa 2): Bu, aşağıdaki olası uyumluluğu bozan değişiklikleri yapar:

  • FID artık isteğe bağlı bir alandır: giriş .psam dosyasında değilse, varsayılan olarak birkaç çıktı dosyasından çıkarılır (bunlar artık 'maybefid' ve 'fid' sütun kümelerine sahiptir, burada varsayılan küme 'maybefid'i içerir) ve FID değerleri gerektiren herhangi bir işlem ( --make-bed gibi) tarafından her zaman-'0' olarak kabul edilir. Genomik veri dosyalarını dışa aktarırken, 'belki', kalan tüm değerler '0' ise sütunu eksik olarak değerlendirir.
  • İlgili olarak, bir VCF veya .bgen dosyasından örnek kimlikleri içe aktarırken, varsayılan mod artık "--const-fid 0"dır ve diske hiçbir FID sütunu yazılmaz. --keep, --remove ve benzer komutlar, bir giriş satırı yalnızca bir simge içerdiğinde artık "--const-fid 0" semantiğine sahiptir. İş akışınız için en anlamlı olan şey buysa, artık IID tek örnek kimlik bileşeniymiş gibi davranabilirsiniz. Tersine, VCF/.bgen örnek kimliklerini birden çok bileşene bölmek istediğinizde --id-delim'i açıkça kullanmak artık gereklidir.
  • MT tekrar haploid kromozom olarak işlenir. PLINK 1.9 ve önceki plink2 yapılarında, sonuç olarak heteroplazmik mutasyonlar, --glm(/-linear/--logistic) genotip sütunu ve "--freq" gibi komutlar hakkında bilgi atmaktan kaçınmak için MT diploid-ish olarak ele alındı. sayar" bir 0..2 ölçeği kullandı. Artık plink2 dozajlar için uygun desteğe sahip olduğundan, bu çamur artık gerekli değildir.
  • --glm'nin 't' sütun seti, lineer regresyon için bir T istatistiği, ancak lojistik/Firth için bir Wald Z-skoru olduğunu yansıtmak için 'tz' olarak yeniden adlandırıldı. .glm.logistic[.hybrid] ve .glm.firth dosyalarındaki ilgili sütunun başlık satırında artık 'Z_STAT' var.

Ayrıca, --glm artık varsayılan olarak ALT alel dozajları yerine minör değerde gerilemeye geçer (bu, 'a0-ref' ile geçersiz kılınabilir).

Son alfa 1 yapısı GitHub'da etiketlendi ve önümüzdeki birkaç ay boyunca buradan indirilebilir durumda kalacak.

11 Şubat: .king.cutoff.in/.king.cutoff.out dosyaları, örnek kimlikleri olan ve başka hiçbir bilgi içermeyen diğer çıktı dosyalarıyla tutarlılık için artık .id ile bitiyor. Benzer şekilde, --mind'in çıktı dosyası artık .mindrem.id uzantısına sahiptir ve varsayılan olarak bir başlık satırına sahiptir. Artık tüm .id çıktı dosyalarında başlık satırını gizlemek (ve sütunları FID/IID olmaya zorlamak) için --no-id-header kullanabilirsiniz.

10 Şub: --update-sex 'male0' seçeneği eklendi ve özel sütun seçim arayüzü değişti (artık 'col-num='). --glm 'gcountcc' sütun adları güncellendi (şimdi 'CASE_NON_A1_CT', 'CASE_HET_A1_CT', vb.) A1=majör allele geçiş hazırlığında. --make-just-pvar + --ref-allele/--ref-from-fa, giriş .pvar bir başlık satırına sahip olduğunda artık tüm başlangıç ​​referans alellerini geçici olarak ele almıyor.

9 Şub: Bu tür değerler yüklenmediğinde .pvar QUAL/FILTER çıktısını zorlamak artık bir segfault'a neden olmaz.

5 Şubat: AVX2 aşama alt kümeleme hata düzeltmesi.

3 Şub: --score 'baskın' ve 'resesif' değiştiriciler eklendi.

30 Ocak: Varyant sayısı 64'ün katı ve örnek sayısı fazla olduğunda oluşan .pgen yazma hatası düzeltildi.

24 Ocak: "--export oxford" artık bgzip'li çıktıyı destekliyor.

21 Ocak: --glm artık her zaman, hangi alel(ler)in pozitif genotip sütun değerlerine karşılık geldiğini gösteren ek bir 'A1' sütunu rapor ediyor. --glm sütun kümeleri ALT yerine A1 çevresinde dönecek şekilde değiştirildi, bu nedenle bu yapıya geçiş yaparken küçük komut dosyası değişiklikleri gerekebilir.
Bu yapıda, A1 ve ALT hala eş anlamlıdır. Bu alfa 2'de değişecektir: A1, çoklu doğrusallığı azaltmak için ( --keep-allele-order yokluğunda PLINK 1.x'in davranışını taklit ederek) minör alel(ler)e varsayılan olacaktır, ancak yine de A1'i zorlama seçeneğiniz olacaktır. =ALT.

12 Ocak: Birbirini takip eden birden çok varyantta eksik çağrı olmadığında oluşan "--glm etkileşimi" hatası düzeltildi. 27 Kasım 2017 ile 10 Ocak 2018 arasında üretilmiş bir yapı ile gerçekleştirilen tüm --glm çalıştırmalarını "etkileşim" değiştiricisiyle yeniden yapmanızı öneririz.

10 Ocak: --adjust-file uygulandı (herhangi bir ilişkilendirme analiz dosyasında --adjust'ın çoklu test düzeltmesini gerçekleştirir).

9 Ocak: Birkaç komuta 'no-idheader' değiştiricileri eklendi ve birlikte çalışabilirliği bozmamak için bunu --make-grm-bin/--make-grm-list için varsayılan yaptı.

7 Ocak: --vcf'ye, çalıştırma genotip verisi gerektirmediğinde artık yalnızca sitelere yönelik bir VCF verilebilir. --write-samples tarafından üretilenler gibi örnek kimlik dosyaları artık varsayılan olarak bir başlık satırı içeriyor, bu gelecekte FID-IID ve IID-SID çıktılarını ayırt etmek için gerekli olacaktır. (--write-samples ile, 'noheader' değiştiricisini ekleyerek başlık satırını gizleyebilirsiniz.)

5 Ocak: --pheno-col-nums/--covar-col-nums uygulandı.

2 Ocak 2018: --keep-fcol (PLINK 1.x --filter ile eşdeğer) uygulandı.

19 Aralık 2017: --adjust uygulandı. --zst-level uygulandı (Zstd sıkıştırma seviyesini kontrol etmenizi sağlar). Bozulmamış --tekrar çalıştır.

18 Aralık: --extract/--exclude artık doğrudan UCSC interval-BED dosyalarında kullanılabilir (koordinatların 0 tabanlı olması veya 4. sütun olmaması için tamam). "--output-chr 26", alfabetik kromozom kodlarını işleyemeyen ADMIXTURE gibi programlarla birlikte çalışabilirliği geri yüklemek için artık PAR1/PAR2'nin '25' (insanlar için) olarak oluşturulmasına neden oluyor. --merge-x uygulandı (genellikle şimdi --sort-vars ile birleştirilmesi gerekiyor). --pvar genellikle 'yalnızca siteler' VCF dosyalarını (örneğin, gnomAD projesi tarafından yayınlananlar) şimdi işleyebilir. --thin, --thin-count, --thin-indiv ve --thin-indiv-count uygulandı.

16 Aralık: Çok iş parçacıklı zstd sıkıştırması uygulandı (Linux ve macOS'ta). --make-grm-gz, --make-grm-list olarak yeniden adlandırıldı ve gzip modu kaldırıldı.

15 Aralık: Bir sayı ile başlayan sayısal olmayan değerler için --extract-if-info ve --exclude-if-info'nun davranışı düzeltildi. Varlık denetimi bayrakları, adlandırma tutarlılığı için --require-info ve --require-no-info olarak yeniden adlandırıldı.

13 Aralık: INFO anahtar/değer çiftleri veya anahtar varlığı üzerinde basit filtreleme için --extract-if-info ve --exclude-if-info bayrakları eklendi.

11 Dec: --king-table-subset bayrağı eklendi. Bu, iki aşamalı ilişki/yinelenen algılamayı gerçekleştirmeyi kolaylaştırır: genom boyunca dağılmış az sayıda yüksek MAF varyantı üzerinde --make-king-table ile başlayın ve ardından --king-table-subset on ile yeniden çalıştırın. ilk aşamadan uygun bir aday örnek çifti alt kümesi. --bp-space uygulandı (yukarıdaki ilk aşama için kullanışlıdır).
İki aşamalı iş akışı ilk olarak Wei-Min Chen tarafından KING'in yeni bir sürümünde uygulandı ve alıntı bilgileri için onunla iletişime geçin.

7 Aralık: Aşamalı bir veri kümesinden örnekler filtrelenirken oluşabilecek sabit hata. Windows AVX2 derlemesi artık kullanılabilir.

28 Kasım: --import-dosage 'format=infer' (bu artık varsayılandır) ve 'id-delim=' ("--export A-transpose" verilerinin yeniden içe aktarılması için gerekli) seçenekleri eklendi. Format=1 altında eksik genotiplerde hata vermesine neden olan --import-dozaj hatası düzeltildi. --no-psam-pheno (veya --no-pheno/-no-fam-pheno) artık örnek dosyadaki tüm fenotipleri yoksaymak için kullanılabilir; biri belirtildi.

27 Kasım: --glm eksik genotip durumu için hızlı yol uygulandı (esas olarak doğrusal regresyonu etkiler). --make-king[-table] artık --parallel açıkça kullanılmadan belleğe sığmayacak kadar büyük matrisleri otomatik olarak işleyebilir. AVX2 örnek filtreleme performansı iyileştirmesi. -- hata düzeltmesini doğrulayın.

19 Kasım: 14 Kasım derlemesinde tanıtılan VCF FORMAT/GT başlık satırı ayrıştırma hatası düzeltildi.

18 Kasım: --make-king[-table] performans iyileştirmeleri.

16 Kasım: 14 Kasım derlemesinde ##chrSet başlık satırı ayrıştırmasını bozan hata düzeltildi.

14 Kasım: --export'a neden olan hata düzeltildi Varyant sayısı 65 ile bin arasında olduğunda asmak için.

4 Kas: Linux ve macOS önceden oluşturulmuş AVX2 ikili dosyaları artık mevcut, bunlar son 4 yıl içinde oluşturulmuş çoğu makinede iyi çalışıyor. Başka bir Firth regresyonu sahte NA hatası düzeltildi. Örnek filtre(ler) aynı anda uygulandığında oluşan --score hatası düzeltildi. --ld aşamalı sabit çağrı işleme hatası düzeltildi. Dizi-popcount yükseltmesi devam ediyor (Wojciech Muła, Nathan Kurz, Daniel Lemire ve Kim Walisch tarafından yapılan son çalışma sayesinde).

3 Kasım: Çoklu geçiş düzeltildi --export böcek. --dummy dozaj-freq= artık sabit aramaları --hard-call-threshold açıkça belirtilmediğinde varsayılan --hard-call-threshold 0,1 ile dolduruyor.

2 Kasım: --export uygulandı (doz desteği ile). --dummy dozaj frekansı= değiştiricisi artık 0.75'in üzerindeki dozaj frekansları için düzgün çalışıyor.

16 Ekim: --ref-from-fa bayrağı, bir FASTA dosyasından referans alelleri ayarlamak için uygulandı. (Uzunluk değişiklikleri söz konusu olduğunda bunun hangi alelin referans olduğunu belirleyemeyebileceğini unutmayın, ancak her zaman SNP'ler ve çoklu nükleotid polimorfizmleri için çalışması gerekir.) --update-name uygulandı. 13 Ekim derlemesinde sütun kümesi ayrıştırma hatası düzeltildi.

13 Ekim: Sahte NA sonuçları üretebilecek --glm lojistik/Firth regresyon hatası düzeltildi.

9 Ekim: --ld'nin bazı dozaj ve haploid vakaları ele alması düzeltildi. Küçük bir değişken alt kümesini ayıklarken --make-pgen'in faz/dozaj bilgilerini atmasına neden olabilen hata düzeltildi. --geno-counts artık chrY sayımlarını çift rapor etmiyor.

8 Ekim: --ld, aşamalı genotipler ve dozajlar için desteklenerek uygulandı ("--ld <var1> <var2> dozajını" deneyin). İş parçacığı sayısı değişken sayısını aştığında tetiklenen küçük bgen-1.1 içe aktarma hatası düzeltildi.Alel frekans hesaplaması, dozajlar mevcut olduğunda artık chrX'te çökmez, yalnızca sabit aramalar gerekir.

1 Ekim: Hem dozajlar hem de eksik değerler mevcut olduğunda bazen segfaultlara neden olan GRM hesaplama hatası düzeltildi. --glm, birçok ortak değişken mevcut olduğunda artık biraz daha hızlıdır.

20 Eylül: Firth regresyon Hessian matris inversiyon adımı, geçen haftaki yapıların tek kesinlikli inversiyonun güvenilmez olabileceğini ortaya çıkarmasından sonra çift kesinliğe yükseltildi.

15 Eylül: --vif/--varyant başına max-corr kontrolleri artık çalışıyor. Bunlar artık lojistik regresyon sırasında atlanmamaktadır.

8 Eylül: Alternatif VCF INFO/PR alanlarına artık izin veriliyor. Dünün --make-pgen'ini yavaşlatan hata ayıklama kodu kaldırıldı.

7 Eylül: --score başlatılmamış bellek hata düzeltmesi. Kısmen aşamalı veri işleme hata düzeltmesi.

6 Eylül: macOS yığın boyutu sorununu düzeltin (son derlemelerde --pca ve diğer bazı komutların çökmesine neden olabilir 1 Eylül derlemesinde eksik bir geçici çözüm vardı).

4 Eylül: --[covar-]varyans-eksik değer işleme hata düzeltmesini standartlaştırın. --ref-allele/--alt1-allele uygulandı (--a2-allele ve --a1-allele takma ad olarak kabul edilir).

1 Eylül: ---Kantil-normalleştirme eksik-fenotip işleme hata düzeltmesi.

29 Ağu: --glm 'gcountcc' sütun seti seçeneği eklendi (vaka/kontrol durumuna göre sınıflandırılan genotip sabit çağrı sayılarını bildirir). --write-samples komutu eklendi (--write-snplist'e benzer).

2 Ağu: --sort-vars uygulandı.

25 Tem: --loop-cats artık genotip tabanlı değişken filtrelerle düzgün çalışıyor.

24 Temmuz: 4 Haziran derlemesinde tanıtılan "--pca yaklaşık" alel frekansı işleme hatası düzeltildi. (Normal --pca etkilenmedi.) --loop-cats uygulandı (PLINK 1.x --loop-assoc'a benzer, ancak ilişkilendirme testleri ile sınırlı değildir). VCF dışa aktarma artık 'vcf-dosage=DS-force' modunu destekliyor. --sahte çoklu okuma + dozaj hatası düzeltmesi.

17 Temmuz: BGEN v1.2/1.3 ithalatçı bellek ayırma hatası düzeltmesi. Başarısız ayırmanın boyutu artık çoğu yetersiz bellek hatasında günlüğe kaydedilir.

2 Temmuz: BGEN v1.2/1.3 içe aktarıcısında geliştirilmiş çoklu iş parçacığı. Python yazıcısı artık aynı anda birden çok değişkenle çağrılabilir.

25 Haz: Temel BGEN v1.2/1.3 içe aktarma (ana UK Biobank veri sürümü için fazlandırılmamış bialelik dozajlar yeterlidir). --warning-errcode bayrağı eklendi (en az bir uyarı yazdırıldığında çıkışta işletim sistemine bir hata kodunun döndürülmesine neden olur).

20 Haz: --condition-list + varyant filtresi hata düzeltmesi.

5 Haz: --make-pgen bellek gereksinimi büyük ölçüde azaldı. Bitiş zamanı artık çoğu durumda konsola yazdırılıyor.

4 Haz: --hwe artık chrX mevcut olduğunda ve cinsiyet bilgisi bulunmadığında segfault'a neden olmuyor. Sabit -- kukla hata.

29 Mayıs: --import-dozaj formatı=1 hata düzeltmesi.

26 Mayıs: --glm 'standart-beta' değiştiricisi, --variance-standardize bayrağı ile değiştirildi. --quantile-normalize fonksiyonu eklendi. Eksik cinsiyet alel sayma hatası düzeltildi.

25 Mayıs: --hardy/--hwe, chrX varken ancak veri kümesinin başında olmadığında tekrar düzgün çalışır.

22 Mayıs: Sabit ana dozaj verileri + örnek filtre hatası, hem dozaj verilerini hem de önceki plink2 yapılarıyla gerçekleştirilen örnek filtrelemeyi içeren tüm işlemlerin yeniden çalıştırılmasını öneririz. --score 'liste varyantları' değiştiricisi eklendi.

19 Mayıs: Örnek filtre(ler) uygulandığında dozaj verilerinde alel frekansı hesaplamasında oluşan bir hata düzeltildi.

18 Mayıs: Birçok kategorik fenotip işleme bayrağı (--in, --keep-cats, --split-cat-pheno, . ) uygulandı. Uygulanan temel fenotip tabanlı filtreleme (örn. "--remove-if PHENO1 '>' 2.5", adsız fenotiplere 'PHENO1', 'PHENO2' vb. adlarının atandığını ve '<' ve '>' karakterlerinin çoğu kabukta alıntı yapılmalıdır). --write-covar uygulandı. --mach-r2-filter uygulandı ve ham MaCH r 2 değerleri "--freq cols=+machr2" ile atılabilir.

11 Mayıs: --condition[-list] + --covar hata düzeltmesi.

8 Mayıs: 6 Mayıs derlemesinde tanıtılan nicel fenotip/ortak değişken yükleme hatasını düzeltin.

7 Mayıs: --import-dozajı uygulandı.

6 Mayıs: '0'ın ikili fenotipler için eksik olmak yerine kontrol olarak ele alınmasına neden olan hata düzeltildi. --glm'nin sütun başlıklarında çok alelik verilere hazırlık olarak küçük değişiklik.

2 Mayıs: --score hata düzeltmesi. --maj-ref hata düzeltmesi. --vcf-min-dp ve "--export A-transpose" uygulandı.

1 Mayıs: VCF dozajı içe/dışa aktarma, --vcf-min-gq ve --read-freq uygulandı. --score artık standart hatalarla çalışabilir. --autosome[-par] artık düzgün çalışıyor. SNPHWE2 ve SNPHWEX işlevleri, HardyWeinberg R paketine dahil edilmesini sağlamak için GPL-2+ olarak yeniden lisanslanmıştır.

20 Nisan: .sample dışa aktarma hata düzeltmesi (dosya 256 KB'nin üzerindeyse ve hiçbir fenotip mevcut değilse çalışmadı). --dummy uygulandı (artık dozaj üretebilir).

19 Nisan: --hardy/--hwe chrX hata düzeltmesi (sorunu yakaladığı ve düzeltmeyi onayladığı için Jan Graffelman'a teşekkürler). --new-id-max-allele-len'in artık üç modu var ('hata', 'eksik' ve 'kesme'), ve varsayılan mod artık 'hata' (yani, --set-missing-var-ids ve --set-all-var-ids artık sessizce kesmek yerine 23 karakterden uzun bir alel koduyla karşılaşıldığında hata veriyor). --score uygulandı ve varyans normalleştirmeyi ve çoklu puan sütunlarını desteklemek için genişletildi (bu iki özellik, yeni örnekleri önceden hesaplanmış temel bileşenlere yansıtmak için basit bir yol sağlar).

11 Nisan: --pca var-wts hata düzeltmesi ve --pca özdeğer sıralama hata düzeltmesi. --glm doğrusal regresyon ve --condition[-list] desteği eklendi. --geno/--mind/--missing/--genotipleme-hızı artık sadece eksik sabit aramalar yerine eksik dozajlara atıfta bulunabilir (dozaj verilerini içe aktarırken, dozajların (0.1, 0.9) ve (1.1, 1.9) olduğunu unutmayın. kaydedilir, ancak genellikle ilişkili sabit aramalar olmaz).


İFADE

Bu filtreleme ifadeleri komutların çoğu tarafından kabul edilir.

Geçerli ifadeler şunları içerebilir:

sayısal sabitler, dize sabitleri, dosya adları (bu, şu anda yalnızca kimlik sütununa göre filtrelemek için desteklenmektedir)

". İfadeler, "/i" eklenmedikçe büyük/küçük harf duyarlıdır.

mantıksal operatörler. Ayrıca aşağıdaki örneklere ve "&&" ile "&" ve "||" arasındaki farkla ilgili filtreleme eğitimine bakın. vs "|".

INFO etiketleri, FORMAT etiketleri, sütun adları

1.11'den başlayarak FİLTRE sütunu aşağıdaki gibi sorgulanabilir:

1 (veya 0) bir bayrağın varlığını (veya yokluğunu) test etmek için

eksik genotipler bu ifadeler kullanılarak faz ve ploidiye (".|.", "./.", ".", "0|.") bakılmaksızın eşleştirilebilir.

eksik genotipler bu ifadeler kullanılarak faz ve ploidi (".|.", "./.", ".") dahil olmak üzere eşleştirilebilir.

numune genotipi: referans (haploid veya diploid), alternatif (hom veya het, haploid veya diploid), eksik genotip, homozigot, heterozigos, haploid, ref-ref hom, alt-alt hom, ref-alt het, alt-alt het, haploid ref, haploid alt (büyük/küçük harfe duyarsız)

REF,ALT sütunlarındaki değişken türü için TYPE (indel,snp,mnp,ref,bnd,diğer,overlap). Normal ifade operatörünü kullanın "

" verilen türde veya eşittir işaretinde en az bir alel gerektirmek için " literallayout">TYPE="snp" TYPE

dizi aboneleri (0 tabanlı), herhangi bir öğe için "*", bir aralığı belirtmek için "-". FORMAT vektörlerini sorgulamak için, aşağıdaki örneklerde gösterildiği gibi, iki nokta üst üste ":" vektörün bir örneğini ve bir öğesini seçmek için kullanılabilir.

birçok örnekle, her satırda bir örnek adı olacak şekilde örnek adları olan bir dosya sağlamak daha pratik olabilir

FORMAT etiketlerinde (örnekler üzerinde) ve INFO etiketlerinde (vektör alanları üzerinde) işlev: maksimum minimum aritmetik ortalama (AVG, MEAN ile eş anlamlıdır) ortalama toplamdan medyan standart sapma dize uzunluğundan mutlak değer öğelerin sayısı:

Yukarıdaki işlevlerin tüm örneklerde tek bir değer olarak değerlendirildiğini ve FORMAT etiketlerine uygulandığında bile örnekleri değil siteleri seçmeyi amaçladığını unutmayın. Bununla birlikte, SMPL_ (veya kısalık için "s" ön eki getirildiğinde, örneğin SMPL_MAX veya sMAX), FORMAT etiketlerine uygulandığında örnek başına değerlerin bir vektörü olarak değerlendirilirler:

iki kuyruklu binom testi. N=0 için testin eksik bir değer olarak değerlendirdiğine ve vektör indekslerini belirlemek için FORMAT/GT kullanıldığında, homozigot genotipler için 1 olarak değerlendirdiğine dikkat edin.

mevcut değilse anında hesaplanan değişkenler: alternatif alellerin sayısı alternatif alellerin sayısı minör alel sayısı (AC'ye benzer ancak her zaman 0,5'ten küçüktür) alternatif alellerin sıklığı (AF=AC/AN) minör alellerin sıklığı ( MAF=MAC/AN) denilen genotiplerdeki alel sayısı Eksik genotip indel uzunluğuna sahip numunelerin genotip fraksiyonu eksik olan numune sayısı (silmeler negatif, eklemeler pozitif)

ifadeyi geçen örneklerin sayısı (N_PASS) veya kesri (F_PASS)

özel perl filtreleme. Bu komutun varsayılan olarak derlenmediğini unutmayın, bkz. Perl ile Opsiyonel Derleme yardım için INSTALL dosyasında ve çalışan bir örnek için misc/demo-flt.pl. Demo, komut satırından çağrılabilen Perl alt yordamını "şiddet" olarak tanımladı:

Dizelerdeki virgül ayırıcı olarak yorumlanır ve birden çok değer karşılaştırıldığında VEYA mantığı kullanılır. Sonuç olarak, aşağıdaki iki ifade eşdeğerdir, ancak üçüncüsü değildir:

Birden çok değer sorgulanırken tüm elemanlar test edilir ve sonuçta OR mantığı kullanılır. Örneğin, "TAG=1,2,3,4" sorgulandığında aşağıdaki gibi değerlendirilecektir:

Kabuk genişletme:

Bazı karakterlerin kabukta özel anlamı olduğundan, ifadelerin sıklıkla alıntılanması gerektiğini unutmayın. Tüm ifadenin amaçlandığı gibi programa iletilmesine neden olan tek tırnak içine alınmış bir ifade örneği:

Ayrıntılar için lütfen kabuğunuzun belgelerine bakın.


Çoklu Kayıtları Kodla Sonrasında Verileri Toplu Olarak Toplarsınız

NS NIOSH Sanayi ve Meslek Bilgisayarlı Kodlama Sistemi (NIOCCS), endüstri ve meslek metinlerini standart endüstri ve meslek kodlarına çeviren ücretsiz, web tabanlı bir yazılım uygulamasıdır. NIOCCS, halihazırda toplamış olduğunuz büyük sektör ve meslek verisi gruplarını kodlar.

1. Şuraya gidin: NIOCCS sayfası. Kodlanacak çok sayıda kaydınız varsa, Güvenli Erişim Yönetim Hizmeti (SAMS) hesabına kaydolmanız gerekir. Kayıt olmak için adınızı, soyadınızı ve e-posta adresinizi [email protected] adresine gönderin. Kodlanacak yalnızca birkaç kaydınız varsa, hesap gerektirmeyen tek kayıt kodlayıcıyı kullanabilirsiniz.

Kodlamanız gereken sektör ve meslek metnini sağlayın. Sadece birkaç kaydınız varsa, bunları dosya yüklemeden girebilirsiniz. Çok sayıda kaydınız varsa, bilgileri bir dosya biçiminde yüklemek en hızlı yöntemdir. NIOCCS'ye yüklenen dosyalar, bir Sekme veya Düz çizgi karakteriyle (|) ayrılmış standart bir .txt dosya biçiminde olmalı ve en az şunları içermelidir:

Gönderilen her kaydın ID alanında bir değeri olmalı ve Endüstri Unvanı veya Meslek Unvanı'nda en az bir değere sahip olmalıdır – dosyanın nasıl görünebileceğine dair bir örnek burada gösterilmektedir:

2. NIOCCS kullanarak kodlayın. NIOCCS, iyi bilgiler girmeniz önemli olsa da, girilen tüm kayıtları otomatik olarak kodlar. Girdiğiniz iş tanımlarında yazım hataları veya eksik açıklamalar gibi sorunlar varsa, çıktınız o kadar iyi olmayacaktır.

3. Sonuçlarınızı indirin. Kodlama işlemi tamamlandıktan sonra, orijinal yüklenen verileri veya girdi veri alanlarını ve ayrıca standartlaştırılmış Sayımı içeren kodlanmış çıktı dosyanızı indirebilirsiniz., NAICS ve SOC endüstri ve meslek kodları.


Açıklama

Ay

Bir lorem ipsum kelimesinden ve Dolor Inc. veya Convallis Limited gibi uygun bir son ekten oluşan rastgele bir şirket adı oluşturur.

Bu Veri Türü, rastgele bir SIRET/SIREN Fransız işletme kimlik numarası üretir.

SIRET:

SİREN:

Daha fazla bilgi:

Bazı ülkelerde sosyal güvenlik sigortası için kullanılan kişisel bir numara oluşturur. Şu anda yalnızca İsveçliler desteklenmektedir. Kişisel numaralar belirttiğiniz formata göre oluşturulur:

KişiselNumaraTire Olmadan

PersonalNumberWith Tire

Bazı ülkelerde şirketlerin, derneklerin vb. kaydı için kullanılan kuruluş numaralarını oluşturur. Şu anda yalnızca İsveç numaraları desteklenmektedir. Organizasyon numaraları belirttiğiniz formata göre oluşturulur:

Kuruluş NumarasıTiresiz

Kısa Çizgili Kuruluş Numarası

Seçtiğiniz seçeneklere göre rastgele Kanada eyaletleri, eyaletleri, bölgeleri veya ilçeleri oluşturur. NS Ad Soyad ve Kısaltma alt seçenekler, çıktının tam dizeyi mi (örneğin, "British Columbia") yoksa kısaltmasını mı (örneğin "BC") içereceğini belirler. Birleşik Krallık ilçeleri için kısaltma, standart 3 karakterli Chapman kodudur.

Bu veri türü rastgele bir enlem ve/veya boylam üretir. Her ikisi de seçilirse, her ikisi de virgülle ayrılmış olarak görüntülenir.

Bu veri türü, belirttiğiniz biçime göre rastgele, geçerli kredi kartı numaraları üretir. Şu anda aşağıdaki markalar için numara üretme yeteneğine sahiptir: MasterCard, Vize, Vize elektron, American Express, Keşfetmek, Amerikan Lokantası, Carte Blanche, Diner's Club Uluslararası, , JCB, usta, Solo, Değiştirmek, Lazer.

1111'den 9999'a kadar rastgele bir kredi kartı PIN numarası üretir.

111'den 999'a kadar rastgele bir kredi kartı CVV numarası üretir.

Bu seçenek, standart lorem ipsum latin metninden alınan sabit sayıda rastgele sözcük üretir.

Bu seçenek, rastgele sayıda sözcük üretir - belirttiğiniz aralıktaki (dahil) toplam sayı. Sabit sayı seçeneğinde olduğu gibi, kelimeler standart lorem ipsum latin metnine çekilir.

Bu Veri Türü, rastgele alfasayısal dizeler oluşturmanıza olanak tanır. Aşağıdaki tablo, bu alan için karakter açıklamasını içerir. Bu alana girdiğiniz diğer karakterler çıkışsız olarak görünecektir.

İhtiyacınız olan biçimde bir Boole değeri üretir. Dikey çizgi (|) karakteriyle ayırarak birden çok biçim belirtebilirsiniz. Aşağıdaki dizeler Boole eşdeğerlerine dönüştürülecektir:

  • Evet veya Hayır
  • Yanlış veya Doğru
  • 0 veya 1
  • E veya H
  • Kale
  • yanlış veya doğru

true ve false değerleri özeldir. Dışa aktarma türüne bağlı olarak, bunlar çift tırnak olmadan alınabilir.

Girdiğiniz değer ne olursa olsun artan, her satırda benzersiz bir sayı içeren bir sütun oluşturur. Bu seçenek, verileri otomatik artışlı birincil anahtarla bir veritabanı alanına eklemek için yararlı olabilir.

İsteğe bağlı yer tutucu dize, oluşturulan artış değerini, Yer tutucu. Örneğin:

Bu, belirttiğiniz değerler arasında rastgele bir sayı üretir. Her iki alan da negatif sayılar girmenize izin verir.

Bu veri türü, istediğiniz biçim ve aralıkta rastgele para birimi değerleri üretir. Örnek açılır menü, nasıl çalıştığına dair bir fikir edinebilmeniz için birkaç seçenek içerir, ancak seçeneklerin her birinin anlamı şudur.

Biçim

Dan aralığı

Aralık - Varış

Para Birimi Sembolü

Ön ek Son ek

Bu veri türü, satırdan satıra yinelenen değerlere sahip bir veri sütunu oluşturmanıza olanak tanır. İşte size bunun nasıl çalıştığına dair bir fikir vermek için birkaç örnek.

  • Her satır için "1" değerini sağlamak istiyorsanız, Değer(ler) alanına "1", Döngü Sayısı alanına herhangi bir değeri (>0) girebilirsiniz.
  • 100 satır "Male" ve ardından 100 satır "Female" olmasını istiyorsanız ve tekrarlamak istiyorsanız, Döngü Sayısı alanına "100" Değer(ler) alanına "Erkek|Kadın" yazabilirsiniz.
  • 1'den 10'a kadar 5 satır isterseniz, Döngü Sayısı alanına "5" Değer(ler) alanına "1|2|3|4|5|6|7|8|9|10" girin.

Onunla uğraşmayı dene. Fikri anlayacaksın.

Bileşik veri türü, diğer herhangi bir satır veya satırdaki verileri birleştirmenize ve bunları işlemenize, değiştirmenize, bilgileri birleştirmenize ve daha pek çok şeye olanak tanır. İçerik Smarty şablonlama dilinde girilmelidir.

Değeri herhangi bir satırdan çıkarmak için yer tutucuları kullanın. , , vb. Geçerli satıra başvuramazsınız - bu, sunucuyu eritir ve/veya evrenin patlamasına neden olur.

  • 6. satırdan bir değer görüntüleyin:
  • Satır 1 ve satır 2'nin rastgele sayılar içerdiğini varsayarsak, aşağıdakiler bazı basit matematik örnekleridir:
    • - çıkarma
    • - çarpma işlemi
    • <$ROW2/$ROW1> - Bölüm

    Sözdizimi hakkında daha fazla bilgi için lütfen Smarty web sitesine bakın.

    Bu veri türü, ağacın gövdesi olan ilk satır hariç, her satırın başka bir satırın alt öğesi olduğu ağaç benzeri veriler oluşturmanıza olanak tanır. Bu veri türü, Otomatik Artış veri türü ile birlikte kullanılmalıdır: bu, her satırın, bu veri türünün üst satırlara başvurmak için kullandığı benzersiz bir sayısal değere sahip olmasını sağlar.

    Seçenekler, form alanlarınızdan hangisinin uygun otomatik artış alanı olduğunu ve bir düğümün sahip olabileceği maksimum çocuk sayısını belirlemenize olanak tanır.

    Bir çizgi ile ayrılmış bir öğe listesi girin | karakter. Sonra isteyip istemediğinizi seçin Aynen öyle X sayıda öğe veya en fazla Listeden X öğe. Sonuçlarda virgülle ayrılmış bir listede birden çok öğe döndürülür. Veri kümenizin boş değerler içermesini istiyorsanız, sonuna bir veya daha fazla boru karakteri eklemeniz yeterlidir - ne kadar çok boru girerseniz, boş bir değerin oluşturulma olasılığı o kadar yüksek olur.

    NS Hesaplanmış Veri Türü, bu bilgilere dayanarak istediğiniz çıktıyı oluşturmanıza izin vermek için satırdaki alanlar hakkındaki meta verilere erişmenizi sağlar. Sadece erişmeniz gerekiyorsa oluşturulan başka bir alandan dize değeri (yani çıktıda gördüğünüz şey), bkz. kompozit Veri tipi. Bu alan türü, her alana çok daha fazla erişim sağlar.

    , vb. belirli bir satır hakkında mevcut olan her şeyi içerir. İçerik, satırın Veri Türüne ve oluşturulana göre değişir, ancak yüksek düzeyde aşağıdaki özellikleri içerir:

    • - satır için arayüz/API çağrısında hangi seçenekler girildiyse
    • - Veri Türü için döndürülen ek meta veriler
    • - bu alan için oluşturulan gerçek rastgele içerik (her zaman bir "görüntüleme" özelliğindedir) artı oluşturulan içerikle ilgili diğer bilgiler
    • - satırdaki her şeyin kullanışlı bir JSON serileştirmesi, böylece neyin mevcut olduğunu görebilirsiniz. Sadece bir JSON biçimlendirici aracılığıyla çalıştırın.
    • - oluşturulan içeriğin cinsiyetini ("erkek", "kadın" veya "bilinmeyen") çıkaracaktır. İsimler Veri Türü alanı ("1"i doğru satır numarasıyla değiştirdiğinizden emin olun!). Eğer kullandıysanız KadınAdı yer tutucu dize olarak bu değişken her seferinde "female" değerini döndürür. "Ad" girdiyseniz, döndürülen değer oluşturulan dizeye bağlı olacaktır. Birden çok biçime sahip bir yer tutucu dize girdiyseniz, her iki cinsiyeti de içeriyorsa veya cinsiyet içermiyorsa (örneğin, adı olmayan bir soyadı) "bilinmeyen" değerini döndürür.

    de-nied. Bu Veri Kümesini başkalarıyla paylaşmak için önce kaydetmeniz gerekir.

    Bu Veri Kümesini paylaşmak için herkese açık hale getirmem gerektiğini anlıyorum.

    Kullanıcıya giriş bilgilerini e-posta ile gönderin

    Bu kullanıcı hesabını silmek istediğinizden emin misiniz?

    İlk adı
    Soy isim
    E-posta

    Paketleme/küçültmeyi etkinleştirdiniz. Eklentileri Sıfırla düğmesini tıklarsanız, çalıştırmanız gerekir. homurtu demetleri yeniden oluşturmak için. Daha fazla bilgi için bu belge sayfasını okuyun. Herhangi bir sorununuz varsa, paketlemeyi kapatmak isteyebilirsiniz.

    Hakkında

    Hiç özel biçimlendirilmiş örnek / test verilerine ihtiyaç duydunuz mu, kötü mü? Bu senaryonun fikri bu. JavaScript, PHP ve MySQL ile yazılmış ücretsiz, açık kaynaklı bir araçtır ve test yazılımında, veritabanlarını doldurmada ve çeşitli biçimlerde büyük hacimli özel verileri hızla oluşturmanıza olanak tanır. falan filan.

    Bu site, betiğin ne yaptığı, hangi özellikleri sunduğu ve nasıl çalıştığı hakkında bir fikir edinmek için biraz kurcalayabileceğiniz çevrimiçi bir demo sunar. Ardından, iştahınızı açtığınızda, indirebileceğiniz ücretsiz, tamamen işlevsel, GNU lisanslı bir sürüm var. Alternatif olarak, kendi sunucunuza kurma zahmetinden kurtulmak istiyorsanız, bu sitede bir hesap açmak için 20$ veya daha fazla bağış yaparak bir seferde 5.000 kayıt oluşturmanıza izin verebilirsiniz (maksimum 100 yerine), ve veri kümelerinizi kaydetmenize izin verir. Daha fazla bilgi için Bağış sekmesine tıklayın.

    Uzat

    Kullanıma hazır komut dosyası, genellikle ihtiyaç duyduğunuz işlevsellik türünü içerir. Ancak hiçbir şey tam değildir - belki de rastgele ezoterik matematik denklemleri oluşturmanız, rastgele tweet'ler çekmeniz veya Flickr'dan rastgele görüntüler ve başlığında "Kızıl destekli fare" kelimesiyle görüntülemeniz gerekir. Kim bilir. Herkesin kullanım durumu farklıdır.

    Bunu akılda tutarak, betiğin yeni sürümü (3.0.0+) tamamen genişletilebilir olacak şekilde tasarlanmıştır: geliştiriciler yeni rastgele veri türleri oluşturmak için kendi Veri Türlerini yazabilir ve hatta Dışa Aktarma Türlerini - yani hangi verilerin çıktısı alınır. Daha doğru yerelleştirilmiş coğrafi veriler oluşturmakla ilgilenen kişiler için bölge adları (eyaletler, iller, bölgeler vb.), şehir adları ve seçtikleri ülke için posta/posta kodu biçimleri sağlayan yeni Ülke eklentileri ekleyebilirler. Tüm bunlar hakkında daha fazla bilgi için Geliştirici Belgelerini ziyaret edin.

    İndirmek

    Komut dosyasının en son sürümünü github'dan indirmek için aşağıdaki düğmeyi tıklayın. Daha fazla bilgi için Kullanıcı Belgelerine bakın.

    Proje Haberleri

    Kullanıcı hesapları

    Bu bölüm, kişilerin komut dosyasına erişmesine izin vermek için istediğiniz sayıda kullanıcı hesabı oluşturmanıza olanak tanır. Yalnızca siz hesap oluşturabilir veya silebilirsiniz.

    Henüz eklenmiş kullanıcı hesabı yok.

    Şimdi Bağış yap!

    Bu, işinizde size yardımcı olduysa, bir bağış her zaman takdir edilir! Genel bir iyilik duygusu sizi bağış yapmaya ikna etmek için yeterli değilse, işte birkaç maddi teşvik daha:

    • Projeyi desteklemek harika yeni özelliklere yol açar! Açık sözlü!
    • 20$ veya daha fazla bağış yapmak size bu web sitesinde bir kullanıcı hesabı kazandıracaktır. Bir kullanıcı hesabıyla şunları yapabilirsiniz:
      • Maksimum 100 yerine bir seferde 10.000'e kadar satır oluşturun.
      • Siteye her döndüğünüzde veri kümelerinizi yeniden oluşturmak zorunda kalmamak için form yapılandırmalarınızı kaydedin.

      Bağışladığınız her 20$ yıl hesabınıza. Hesabınıza daha fazla zaman eklemek için daha sonraki bir tarihte geri dönebilirsiniz - mevcut zamanınızın sonuna eklenecektir. Sadece aynı e-posta adresiyle bağış yaptığınızdan emin olun. Bağış yapmakta veya kullanıcı hesabınızla ilgili herhangi bir sorun yaşarsanız, bana bir satır bırakın.

      Bağış yaptıktan sonra, hesabınızın kurulumunu nasıl tamamlayacağınızla ilgili ayrıntıları içeren bir e-posta alacaksınız (spam klasörünüzü kontrol edin!). Herhangi bir sorununuz varsa, lütfen benimle iletişime geçin.


      Videoyu izle: İşlemcilerde Boru Hattı Yöntemi (Mayıs Ayı 2022).