Debian Med Project
Help us to see Debian used by medical practitioners and biomedical researchers! Join us on the Salsa page.
Summary
Next Generation Sequencing
Debian Med bioinformatics applications usable in Next Generation Sequencing

It aims at gettting packages which specialize in the processing or interpretation of data generated with next- (and later-) generation high-thoughput sequencing technologies.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Med to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Med mailing list

Links to other tasks

Debian Med Next Generation Sequencing packages

Official Debian packages with high relevance

anfo
strumento per allineare/mappare letture corte da MPG
Versions of package anfo
ReleaseVersionArchitectures
bullseye0.98-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.98-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie0.98-4amd64,armel,armhf,i386
stretch0.98-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.98-7amd64,arm64,armhf,i386
Popcon: 3 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Anfo è uno strumento per mappatura nello spirito di Soap/Maq/Bowtie, ma la sua implementazione assomiglia più a BLAST/BLAT. È utile soprattutto per l'allineamento di letture di sequenze in cui la sequenza di DNA è in qualche modo modificata (si pensi a DNA ancestrale o a trattamento con bisolfito) o c'è più divergenza tra il campione e il riferimento di quanta viene gestita bene dai mappatori veloci (ad esempio il genoma di riferimento è mancante e viene usata invece una specie correlata).

Registry entries: SciCrunch 
Topics: Sequencing
arden
controllo di specificità per allineamento di letture che usa un riferimento artificiale
Versions of package arden
ReleaseVersionArchitectures
sid1.0-6all
stretch1.0-3all
buster1.0-4all
bullseye1.0-5all
jessie1.0-1amd64,armel,armhf,i386
bookworm1.0-5all
trixie1.0-6all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ARDEN (Artificial Reference Driven Estimation of false positives in NGS data) è un innovativo test che stima i tassi di errore basati su letture sperimentali e su un genoma di riferimento artificiale generato aggiuntivamente. Permette il calcolo di tassi di errore per un insieme specifico di dati e la costruzione di una curva ROC. Perciò può essere usato per ottimizzare i parametri per i mappatori di letture, per scegliere i mappatori di letture per uno specifico problema o anche per filtrare gli allineamenti sulla base della stima della qualità.

Please cite: Sven H. Giese, Franziska Zickmann and Bernhard Y. Renard: Specificity control for read alignments using an artificial reference genome-guided false discovery rate. (PubMed,eprint) Bioinformatics 30(1):9-16 (2013)
Registry entries: SciCrunch 
Topics: Sequencing
art-nextgen-simulation-tools
strumenti di simulazione per generare letture sintetiche di sequenziamento di prossima generazione
Versions of package art-nextgen-simulation-tools
ReleaseVersionArchitectures
bullseye20160605+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster20160605+dfsg-3amd64,arm64,armhf,i386
stretch20160605+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid20160605+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie20160605+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm20160605+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ART è un insieme di strumenti di simulazione per generare letture sintetiche di sequenziamento di prossima generazione. ART simula letture di sequenziamento imitando il procedimento reale di sequenziamento con modelli empirici di errore o profili di qualità riassunti da grandi dati di sequenziamento ricalibrati. ART può anche simulare letture usando modelli di errore o profili di qualità dell'utente. ART gestisce la simulazione di letture a estremità singole, estremità accoppiate/mate-pair delle tre principali piattaforme commerciali di sequenziamento di prossima generazione: Solexa di Illumina, 454 di Roche e SOLiD di Applied Biosystems. ART può essere usato per test o benchmark di svariati metodi o strumenti per analisi di dati di sequenziamento di prossima generazione, inclusi allineamento di letture, assemblaggio de novo, SNP e scoperta di variazioni di struttura. ART è stato usato come strumento principale per lo studio di simulazione del 1000 Genomes Project. ART è implementato in C++ con algoritmi ottimizzati ed è molto efficiente nella simulazione delle letture. ART fa l'output delle letture nel formato FASTQ e degli allineamenti nel formato ALN. ART può anche generare allineamenti nel formato di file SAM per allineamenti o UCSC BED. ART può esser usato insieme ai simulatori di varianti del genoma (es. VarSim) per valutare strumenti o metodi di identificazione di varianti.

Please cite: Weichun Huang, Leping Li, Jason R. Myers and Gabor T. Marth: ART: a next-generation sequencing read simulator. (PubMed,eprint) Bioinformatics 28(4):593-594 (2012)
Registry entries: SciCrunch  Bioconda 
artfastqgenerator
produce in output file FASTQ artificiali derivati da un genoma di riferimento
Versions of package artfastqgenerator
ReleaseVersionArchitectures
stretch0.0.20150519-2all
buster0.0.20150519-3all
bullseye0.0.20150519-4all
bookworm0.0.20150519-4all
trixie0.0.20150519-5all
sid0.0.20150519-5all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ArtificialFastqGenerator prende come input un genoma di riferimento (in formato FASTA) e produce in output file FASTQ artificiali nel formato Sanger. Può accettare punteggi di qualità delle basi Phred da file FASTQ esistenti e usarli per simulare errori di sequenza. Dato che i file FASTQ artificiali sono derivati dal genoma di riferimento, quest'ultimo fornisce un gold standard per l'identificazione delle varianti (SNP, polimorfismi a singolo nucleotide, e indel, inserzioni e delezioni). Questo permette la valutazione di una catena di elaborazione dati per l'analisi di NGS (Next Generation Sequencing, sequenziamento di prossima generazione) che allinea letture al genoma di riferimento e poi identifica le varianti.

Please cite: Matthew Frampton and Richard Houlston: Generation of Artificial FASTQ Files to Evaluate the Performance of Next-Generation Sequencing Pipelines. (PubMed,eprint) PLOSone 7(11):e49110 (2012)
bamtools
toolkit per manipolare file BAM (allineamento di genoma)
Versions of package bamtools
ReleaseVersionArchitectures
jessie2.3.0+dfsg-2amd64,armel,armhf,i386
sid2.5.2+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.5.2+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.5.2+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.5.1+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.5.1+dfsg-3amd64,arm64,armhf,i386
stretch2.4.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 7 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

BamTools facilita l'analisi in ricerca e la gestione dei dati usando file BAM. Fa fronte all'enorme quantità di dati prodotti dalle tecnologie di sequenziamento attuali che sono tipicamente memorizzati in formati binari compressi che non sono facilmente gestiti dagli analizzatori basati su testo comunemente usati nella ricerca bioinformatica.

BamTools fornisce sia un'API C++ per gestire file BAM, sia un toolkit a riga di comando.

Questo è il toolkit bamtools a riga di comando.

Comandi bamtools disponibili:

 convert  converte tra BAM e numerosi altri formati
 count    stampa il numero di allineamenti in file BAM
 coverage stampa statistiche di copertura dal file BAM in input
 filter   filtra file BAM secondo criteri specificati dall'utente
 header   stampa informazioni dell'intestazione BAM
 index    genera l'indice per un file BAM
 merge    unisce più file BAM in un singolo file
 random   sceglie allineamenti casuali da file BAM esistenti,
          è pensato principalmente come strumento di test
 resolve  risolve letture paired-end (segnando il flag IsProperPair
          quando necessario)
 revert   rimuove marcature duplicate e ripristina le qualità originali
          delle basi
 sort     ordina il file BAM secondo certi criteri
 split    divide un file BAM in base a una proprietà specificata
          dall'utente, creando in output un nuovo file BAM per ogni
          valore trovato
 stats    stampa alcune statistiche di base dai file BAM in input
The package is enhanced by the following packages: multiqc
Please cite: Derek W. Barnett, Erik K. Garrison, Aaron R. Quinlan, Michael P. Stromberg and Gabor T. Marth: BamTools: a C++ API and toolkit for analyzing and managing BAM files. (PubMed,eprint) Bioinformatics 27(12):1691-2 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bcftools
identificazione di varianti genomiche e manipolazione di file VCF/BCF
Versions of package bcftools
ReleaseVersionArchitectures
bullseye1.11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
stretch-backports1.8-1~bpo9+1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
stretch1.3.1-1amd64,arm64,armel,mips64el,mipsel,ppc64el
sid1.20-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.20-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.16-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster1.9-1amd64,arm64,armhf
upstream1.21
Popcon: 23 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

BCFtools è un insieme di utilità che manipolano identificazioni di varianti nel formato Variant Call Format (VCF) e nella sua controparte binaria BCF. Tutti i comandi funzionano in modo trasparente sia con VCF sia con BCF, compressi con BGZF e non.

The package is enhanced by the following packages: multiqc
Please cite: Petr Danecek and Shane A. McCarthy: BCFtools/csq: Haplotype-aware variant consequences. (2016)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bedtools
suite di utilità per confrontare tratti genomici
Versions of package bedtools
ReleaseVersionArchitectures
jessie2.21.0-1amd64,armhf,i386
trixie2.31.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.30.0+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.30.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.27.1+dfsg-4amd64,arm64,armhf
stretch2.26.0+dfsg-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
sid2.31.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package bedtools:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, filtering
works-withbiological-sequence
Popcon: 30 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Le utilità BEDTools permettono di affrontare compiti comuni negli studi genomici, come trovare i tratti che si sovrappongono e calcolare la copertura. Le utilità sono largamente basate su quattro formati di file di largo uso: BED, GFF/GTF, VCF e SAM/BAM. Usando BEDTools si possono sviluppare pipe sofisticate che rispondono a domande di ricerca complesse mediante l'uso di svariati BEDTools in un flusso comune.

L'utilità groupBy è distribuita nel pacchetto filo.

Please cite: Aaron R. Quinlan and Ira M. Hall: BEDTools: a flexible suite of utilities for comparing genomic features. (PubMed,eprint) Bioinformatics 26(6):841-842 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
berkeley-express
quantificazione in streaming per sequenziamento ad alte prestazioni
Versions of package berkeley-express
ReleaseVersionArchitectures
bullseye1.5.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.5.1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.5.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.5.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.5.2+dfsg-1amd64,arm64,armhf,i386
bookworm1.5.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

eXpress è uno strumento in streaming per quantificare l'abbondanza di un insieme di sequenze obiettivo da sottosequenze campionate. Applicazioni di esempio includono la quantificazione RNA-Seq a livello di trascritto, analisi di espressione allele-specifica/di aplotipi (da RNA-Seq), quantificazione del legame di fattori di trascrizione in ChIP-Seq e analisi di dati metagenomici. È basato su un algoritmo online-EM che ha requisiti di spazio (memoria) proporzionali alla dimensione totale delle sequenze obiettivo e requisiti di tempo che sono proporzionali al numero di frammenti campionati. Perciò, in applicazioni come RNA-Seq, eXpress può quantificare in modo accurato campioni molti più grandi degli altri strumenti attualmente disponibili, riducendo i requisiti per l'infrastruttura di calcolo. eXpress può essere utilizzato per costruire catene pipe leggere per elaborazione di sequenziamenti ad alte prestazioni quando affiancato con un allineatore in streaming (come Bowtie), dato che l'output può essere inviato in pipe direttamente in eXpress, eliminando di fatto la necessità di memorizzare allineamenti di letture in memoria o sul disco.

In un'analisi delle prestazioni di eXpress per dati RNA-Seq è stato osservato che questa efficienza non viene ottenuta a spese dell'accuratezza. eXpress è più accurato di altri strumenti disponibili, anche quando limitato a insiemi di dati più piccoli che non richiedono molta efficienza. Inoltre, come il programma Cufflink, eXpress può essere utilizzato per stimare l'abbondanza dei trascritti in geni multi-isoforma. eXpress è anche in grado di risolvere mappature multiple di lettura tra famiglie di geni e non necessita di un genoma di riferimento, perciò può essere usato insieme con assemblatori de novo come Trinity, Oases o Trans-ABySS. Il modello sottostante è basato su modelli probabilistici precedentemente descritti sviluppati per RNA-Seq, ma è applicabile ad altre configurazioni dove le sequenze obiettivo sono campionate, e include parametri per distribuzioni della lunghezza dei frammenti, errori nelle letture e bias dei frammenti specifici per sequenza.

eXpress può essere utilizzato per risolvere mappature ambigue in altre applicazioni basate su sequenziamento ad alte prestazioni. Gli unici input necessari per eXpress sono un insieme di sequenze obiettivo e un insieme di frammenti sequenziati di cui sono stati fatti gli allineamenti multipli con esse. Sebbene queste sequenze obiettivo spesso sono isoforme di geni, non è necessario che lo siano. Gli aplotipi possono essere usati come il riferimento per analisi di espressione allele-specifica, regioni di legame per ChIP-Seq o genomi target in esperimenti di metagenomica. eXpress è utile in qualsiasi analisi dove le letture possono avere mappature multiple su sequenze che differiscono per l'abbondanza.

Please cite: Adam Roberts and Lior Pachter: Streaming fragment assignment for real-time analysis of sequencing experiments. (PubMed) Nature Methods 10(1):71–73 (2013)
Registry entries: SciCrunch  Bioconda 
bio-rainbow
raggruppamento in cluster e assemblaggio di letture corte per bioinformatica
Versions of package bio-rainbow
ReleaseVersionArchitectures
sid2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.0.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.0.4+dfsg-1amd64,arm64,armhf,i386
bullseye2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Strumento efficiente per raggruppamento in cluster e assemblaggio di letture corte, specialmente per RAD.

Rainbow è sviluppato per fornire una soluzione ultra-veloce e che usa efficientemente la memoria per clustering e assemblaggio di letture corte prodotte da RAD-seq. Per prima cosa, Rainbow crea cluster di letture usando un metodo spaced seed. Poi, Rainbow implementa una strategia in stile identificazione eterozigota per dividere gruppi potenziali in aplotipi in maniera top-down. Lungo un albero guidato, fonde iterativamente le foglie sorelle in maniera bottom-up se sono sufficientemente simili. Qui, la similarità è definita confrontando le seconde letture di un segmento RAD. Questo approccio tenta di collassare l'eterozigota mentre discrimina sequenze ripetitive. Infine, Rainbow usa un algoritmo greedy per assemblare localmente le letture fuse in contig. Rainbow non fa solo l'output dei risultati ottimali dell'assemblaggio, ma anche di quelli subottimali. Sulla base di simulazioni e di dati RAD-seq reali della Poecilia reticulata, è dimostrato che Rainbow è più competente di altri strumenti nel trattare dati RAD-seq.

Please cite: Zechen Chong, Jue Ruan and Chung-I. Wu: Rainbow: an integrated tool for efficient clustering and assembling RAD-seq reads.. (PubMed) Bioinformatics 28(21):2732-2737 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
blasr
mappatura di letture di sequenziamento di singole molecole
Versions of package blasr
ReleaseVersionArchitectures
buster5.3.2+dfsg-1.1amd64,arm64
bullseye5.3.3+dfsg-5amd64,arm64,mips64el,ppc64el
bookworm5.3.5+dfsg-6amd64,arm64,mips64el,ppc64el
sid5.3.5+dfsg-6amd64,arm64,mips64el,ppc64el,riscv64
stretch5.3+0-1amd64,arm64,mips64el,ppc64el
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Basic Local Alignment with Successive Refinement (BLASR) è un metodo per mappare letture di sequenziamento di singole molecole contro un genoma di riferimento. Tali letture sono lunghe migliaia di basi con divergenze tra esse e il genoma dominate da errori di inserzione e delezione.

Registry entries: Bio.tools  SciCrunch  Bioconda 
bowtie
allineatore di letture brevi ultraveloce ed efficiente in termini di memoria
Versions of package bowtie
ReleaseVersionArchitectures
stretch1.1.2-6amd64,arm64,mips64el,ppc64el,s390x
jessie1.1.1-2amd64
trixie1.3.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid1.3.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye1.3.0+dfsg1-1amd64,arm64,mips64el,ppc64el,s390x
bookworm1.3.1-1amd64,arm64,mips64el,ppc64el,s390x
buster1.2.2+dfsg-4amd64,arm64
Debtags of package bowtie:
biologynuceleic-acids
fieldbiology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
useanalysing, comparing
works-withbiological-sequence
Popcon: 20 users (26 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto affronta il problema di interpretare i risultati delle più recenti (2010) tecnologie di sequenziamento del DNA. Esse restituiscono pezzi piuttosto corti che non possono essere interpretate direttamente. La sfida per gli strumenti come Bowtie è quella di fornire una posizione nei cromosomi per i brevi frammenti di DNA sequenziati in ogni corsa.

Bowtie allinea sequenze (letture) brevi di DNA al genoma umano a una velocità di oltre 25 milioni di 35 bp all'ora. Bowtie indicizza il genoma con un indice Burrows-Wheeler per mantenere piccola la propria impronta di memoria: tipicamente circa 2,2 GB per il genoma umano (2,9 GB per le estremità accoppiate).

The package is enhanced by the following packages: bowtie-examples multiqc
Please cite: Ben Langmead, Cole Trapnell, Mihai Pop and Steven L Salzberg: Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. (eprint) Genome Biology 10:R25 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
bowtie2
allineatore di letture brevi ultraveloce ed efficiente
Versions of package bowtie2
ReleaseVersionArchitectures
bookworm2.5.0-3amd64,arm64,mips64el,ppc64el
jessie2.2.4-1amd64
stretch2.3.0-2amd64
buster2.3.4.3-1amd64
bullseye2.4.2-2amd64,arm64,mips64el,ppc64el
trixie2.5.4-1amd64,arm64,mips64el,ppc64el,riscv64
sid2.5.4-1amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 20 users (16 upd.)*
Versions and Archs
License: DFSG free
Git

Uno strumento ultraveloce che usa la memoria in maniera efficiente per allineare letture di sequenziamento a sequenze lunghe di riferimento. È particolarmente adatto per allineare letture da circa 50 fino a centinaia o migliaia di caratteri e particolarmente adatto per allineare a genomi relativamente lunghi (es. mammiferi).

Bowtie 2 indicizza il genoma con un indice FM per mantenere bassa l'impronta di memoria: per il genoma umano, la sua impronta di memoria è tipicamente intorno a 3,2 GB. Bowtie 2 gestisce le modalità di allineamento con gap, locali e a estremità accoppiate.

The package is enhanced by the following packages: bowtie2-examples multiqc
Please cite: Ben Langmead and Steven L Salzberg: Fast gapped-read alignment with Bowtie 2. (PubMed) Nature Methods 9:357–359 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
bwa
Burrows-Wheeler Aligner
Versions of package bwa
ReleaseVersionArchitectures
stretch-backports0.7.17-1~bpo9+1amd64
stretch0.7.15-2+deb9u1amd64
bookworm0.7.17-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.7.17-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.7.10-1amd64
buster0.7.17-3amd64
sid0.7.18-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.7.18-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package bwa:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
useanalysing, comparing
Popcon: 20 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

BWA è un pacchetto software per mappare sequenze con bassa divergenza rispetto a vasti genomi di riferimento, come il genoma umano. Consiste di tre algoritmi: BWA-backtrack, BWA-SW e BWA-MEM. Il primo è progettato per sequenze Illumina fino a 100pb, mentre gli altri due per sequenze più lunghe da 70pb a 1Mpb. BWA-MEM e BWA-SH condividono funzionalità simili, come gestione per lunghe sequenze e allineamenti spezzati, ma BWA-MEM, che è il più recente, è generalmente quello raccomandato per interrogazioni di alta qualità perché più veloce e più accurato. BWA-MEM ha prestazioni migliori anche rispetto a BWA-backtrack per sequenze Illumina 70-100pb.

Please cite: Heng Li and Richard Durbin: Fast and accurate short read alignment with Burrows-Wheeler transform. (PubMed,eprint) Bioinformatics 25(14):1754-1760 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
canu
assemblatore di sequenze di molecole singole per genomi
Versions of package canu
ReleaseVersionArchitectures
sid2.2+dfsg-5amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch-backports1.7.1+dfsg-1~bpo9+1amd64
buster1.8+dfsg-2amd64
bullseye2.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Canu è un fork di Celera Assembler, progettato per sequenziamento con alto rumore di molecole singole (come PacBio RS II o Oxford Nanopore MinION).

Canu è una catena pipe di assemblaggio gerarchico che viene eseguita in quattro passi:

  • rilevamento di sovrapposizioni in sequenze con alto rumore usando MHAP;
  • generazione del consenso delle sequenze corrette;
  • taglio delle sequenze corrette;
  • assemblaggio delle sequenze corrette dopo il taglio.
Please cite: Sergey Koren, Brian P. Walenz, Konstantin Berlin, Jason R. Miller and Adam M. Phillippy: Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation.. Genome Res. (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
changeo
toolkit per assegnazione di repertori clonali (Python 3)
Versions of package changeo
ReleaseVersionArchitectures
bookworm1.3.0-1all
trixie1.3.0-2all
sid1.3.0-2all
bullseye1.0.2-1all
buster0.4.5-1all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Change-O è una raccolta di strumenti per elaborare l'output di strumenti di allineamento V(D)J, assegnando cluster clonali a sequenze di immunoglobuline (Ig) e ricostruendo sequenze di linee germinali.

Grandi miglioramenti nelle tecnologie di sequenziamento ad alte prestazioni permettono oggi la caratterizzazione su vasta scala di repertori di Ig, definiti come raccolte di proteine antigene-recettore trans-membrana situate sulla superficie delle cellule B e T. Change-O è una suite di utilità per facilitare l'analisi avanzata di sequenze di Ig e di TCR seguendo l'assegnazione di segmenti a linee germinali. Change-O gestisce l'output di IMGT/HighV-QUEST e IgBLAST, e fornisce un'ampia varietà di metodi di clustering per assegnare gruppi clonali a sequenze di Ig. Sono inclusi anche ordinamento dei record, raggruppamento e varie operazioni di manipolazione su database.

Questo pacchetto installa la libreria per Python 3.

Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Link to publication (PubMed,eprint) Bioinformatics 31(20):3356-3358 (2015)
Registry entries: Bioconda 
crac
analisi integrata di letture RNA-Seq
Versions of package crac
ReleaseVersionArchitectures
buster2.5.0+dfsg-3amd64,arm64
bookworm2.5.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el
trixie2.5.2+dfsg-6amd64,arm64,mips64el,ppc64el,riscv64
sid2.5.2+dfsg-6amd64,arm64,mips64el,ppc64el,riscv64
stretch2.5.0+dfsg-1amd64
bullseye2.5.2+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

CRAC è uno strumento per analizzare dati da HTS (High Throughput Sequencing) in confronto a un genoma di riferimento. È pensato per letture di sequenziamento genomico e trascrittomico. Più precisamente, con letture trascrittomiche come input, predice mutazioni puntuali, indel, giunzioni di splice e RNA chimerici (cioè giunzioni di splice non collineari). CRAC può anche emettere in output posizioni e natura di errori di sequenze che rileva nelle letture. CRAC usa un indice del genoma. Questo indice deve essere calcolato prima di eseguire l'analisi della lettura. Per questo scopo, usare il comando "crac-index" sui file del genoma. Si può poi elaborare le letture usando il comando crac. Consultare la pagina man di CRAC (file della guida) scrivendo "man crac". CRAC richiede grandi quantità di memoria principale nel computer. Per elaborazioni del genoma umano, circa 50 milioni di letture di 100 nucleotidi ciascuna, CRAC richiede circa 40 gigabyte di memoria principale. Verificare che il sistema del server di calcolo in uso sia equipaggiato con sufficiente quantità di memoria prima di lanciare un'analisi.

Please cite: Eliseos J. Mucaki, Natasha G. Caminsky, Ami M. Perri, Ruipeng Lu, Alain Laederach, Matthew Halvorsen, Joan H. M. Knoll and Peter K. Rogan: A unified analytic framework for prioritization of non-coding variants of uncertain significance in heritable breast and ovarian cancer. (PubMed) BMS Medical Genomics 9:19 (2016)
Registry entries: Bio.tools  SciCrunch 
cutadapt
pulisce sequenze biologiche provenienti da letture di sequenziamento ad alte prestazioni
Versions of package cutadapt
ReleaseVersionArchitectures
trixie4.7-2all
sid4.7-2all
buster1.18-1all
stretch1.12-2all
bookworm4.2-1all
bullseye3.2-2all
upstream4.9
Popcon: 8 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Cutadapt aiuta nei compiti di pulitura di sequenze biologiche trovando le sequenze adattatore o primer in maniera tollerante agli errori. Può anche modificare e filtrare in vari modi le letture. Le sequenze adattatore possono contenere metacaratteri IUPAC. Inoltre sono gestite letture con estremità accoppiate e anche dati sullo spazio dei colori. Se lo si desidera, si può anche solamente fare il demultiplex dei dati in input, senza rimuovere alcuna sequenza adattatore.

Questo pacchetto contiene l'interfaccia utente.

The package is enhanced by the following packages: multiqc
Please cite: Marcel Martin: Cutadapt removes adapter sequences from high-throughput sequencing reads. (eprint) EMBnet.journal 17(1):10-12 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
daligner
rilevazione di allineamenti locali tra letture lunghe di sequenze nucleotidiche
Versions of package daligner
ReleaseVersionArchitectures
bullseye1.0+git20200727.ed40ce5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0+git20240119.335105d-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0+git20180524.fd21879-1amd64,arm64,armhf,i386
sid1.0+git20240119.335105d-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0+20161119-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0+git20221215.bd26967-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questi strumenti permettono di trovare tutti gli allineamenti locali significativi tra letture codificate in un database Dazzler. Si assume che le letture provengano da un sequenziatore di letture lunghe Pacific Biosciences RS II, cioè che le letture siano lunghe e con rumore, fino in media al 15%.

Please cite: Gene Myers: Efficient Local Alignment Discovery amongst Noisy Long Reads. 8701:52-67 (2014)
Registry entries: SciCrunch  Bioconda 
deepnano
strumento di identificazione basi alternativo per letture MinION di sequenze genomiche
Versions of package deepnano
ReleaseVersionArchitectures
bullseye0.0+git20170813.e8a621e-3.1amd64,arm64,armhf,i386,ppc64el,s390x
buster0.0+git20170813.e8a621e-3amd64,arm64,i386
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

DeepNano è uno strumento di identificazione delle basi alternativo per letture Oxford Nanopore MinION basato su reti neurali ricorrenti profonde.

Attualmente funziona con chimica SQK-MAP-006 e SQK-MAP-005 e come post-elaboratore per Metrichor.

Please cite: Vladimír Boža, Broňa Brejová and Tomáš Vinař: DeepNano: Deep recurrent neural networks for base calling in MinION nanopore reads. PLOS one (2017)
discosnp
scopre Single Nucleotide Polymorphism da uno o più insiemi di letture grezze
Versions of package discosnp
ReleaseVersionArchitectures
trixie2.6.2-3amd64,arm64,mips64el,ppc64el,riscv64
sid2.6.2-3amd64,arm64,mips64el,ppc64el,riscv64
jessie1.2.5-1amd64,armel,armhf,i386
stretch1.2.6-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.4.4-1amd64,arm64,i386,mips64el,ppc64el,s390x
buster2.3.0-2amd64,arm64,i386
bookworm2.6.2-2amd64,arm64,mips64el,ppc64el
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il software discoSnp è progettato per scoprire SNP (Single Nucleotide Polymorphism - polimorfismo di nucleotide singolo) da uno o più insiemi di letture grezze ottenute tramite NGS (Next Generation Sequencers - sequenziatori di prossima generazione).

Notare che il numero di insiemi di letture in input non è vincolato, può essere uno, due o più. Notare anche che non sono necessari ulteriori dati come annotazioni o genoma di riferimento.

Il software è composto da due moduli. Il primo modulo, kissnp2, rileva gli SNP dagli insiemi di letture. Un secondo modulo, kissreads, potenzia i risultati di kissnp2 calcolando, per ogni insieme di letture e per ogni SNP trovato:

 1) la sua copertura di letture media,
 2) la qualità (phred) di letture che generano il polimorfismo.

Questo pacchetto è stato sorpassato da DiscoSnp++.

Registry entries: Bio.tools  SciCrunch  Bioconda 
dnaclust
strumento per raggruppare in cluster milioni di corte sequenze di DNA
Versions of package dnaclust
ReleaseVersionArchitectures
bullseye3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3-6amd64,arm64,armhf,i386
stretch3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3-2amd64,armel,armhf,i386
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

dnaclust è uno strumento per raggruppare in cluster un vasto numero di corte sequenze di DNA. I cluster vengono creati in un modo tale che il "raggio" di ogni cluster è più piccolo di una soglia specificata.

Le sequenze di input da raggruppare in cluster devono essere in formato Fasta. L'ID di ogni sequenza è basato sulla prima parola della sequenza nel formato Fasta. La prima parola è il prefisso dell'intestazione fino alla prima occorrenza di caratteri vuoti di spazio nell'intestazione.

Please cite: Mohammadreza Ghodsi, Bo Liu and Mihai Pop: DNACLUST: accurate and efficient clustering of phylogenetic marker genes. (PubMed,eprint) BMC Bioinformatics 12:271 (2011)
Registry entries: Bio.tools  SciCrunch 
dwgsim
simulatore di letture corte di sequenziamento
Versions of package dwgsim
ReleaseVersionArchitectures
sid0.1.14-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1.14-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.1.11-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.1.12-2amd64,arm64,armhf
bookworm0.1.14-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1.12-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

DWGSIM simula letture corte di sequenziamento da piattaforme moderne di sequenziamento. DWGSIM genera tassi di errore di base usando un modello parametrico, permettendo un profilo di errore più realistico. È stato originariamente sviluppato per l'uso nella valutazione di allineatori di letture corte.

Registry entries: SciCrunch  Bioconda 
ea-utils
strumenti a riga di comando per elaborare dati di sequenziamento biologici
Versions of package ea-utils
ReleaseVersionArchitectures
stretch1.1.2+dfsg-4amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.1.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.1.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.1.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.2+dfsg-6amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1.2+dfsg-5amd64,arm64,armhf,i386
Popcon: 10 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Ea-utils fornisce un insieme di strumenti a riga di comando per l'elaborazione di dati di sequenziamento biologici, demultiplexing di codici a barre, trimming di adattatori, ecc.

Scritto principalmente per gestire una catena di elaborazione dati basata su Illumina, ma dovrebbe funzionare con qualsiasi FASTQ.

Gli strumenti principali sono:

  • fastq-mcf Cerca adattatori in un file di sequenza e, basandosi su una soglia a scala logaritmica, determina un insieme di parametri di ritaglio ed esegue il taglio. Esegue anche la rilevazione di sbilanciamenti e il filtraggio di qualità.

  • fastq-multx Demultiplexa un fastq. È capace di determinare automaticamente gli id dei codici a barre in base a un insieme di campi master. Mantiene sincronizzate le letture multiple durante il demultiplexing. Può verificare che anche le letture siano sincronizzate e fallisce se non lo sono.

  • fastq-join Simile al programma stitch di audy, ma in C, più efficiente e gestisce alcuni benchmark e tarature automatiche. Usa la stessa "distanza al quadrato per gli allineamenti ancorati" come altri strumenti.

  • varcall Prende un pileup e calcola le varianti in una maniera parametrizzata in modo più facile rispetto ad altri strumenti.

Please cite: Erik Aronesty: Comparison of Sequencing Utility Programs. (eprint) The Open Bioinformatics Journal 7:1-8 (2013)
Registry entries: Bio.tools  SciCrunch 
fastaq
strumenti per manipolare file FASTA e FASTQ
Versions of package fastaq
ReleaseVersionArchitectures
buster3.17.0-2all
bullseye3.17.0-3all
stretch3.14.0-1all
bookworm3.17.0-5all
sid3.17.0-8all
trixie3.17.0-8all
jessie1.5.0-1all
Popcon: 4 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Fastaq rappresenta una raccolta eterogenea di script che effettuano compiti di manipolazione FASTA/FASTQ utili e comuni, come filtraggio, unione, suddivisione, ordinamento, taglio, ricerca/sostituzione, ecc. I file di input e output possono essere compressi con gzip (il formato viene determinato automaticamente) e i singoli comandi Fastaq possono essere concatenati insieme in pipe.

Topics: Bioinformatics
fastp
preprocessore di FASTQ ultraveloce tutto in uno
Versions of package fastp
ReleaseVersionArchitectures
bullseye0.20.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.23.4+dfsg-1amd64,arm64,armel,armhf,mips64el,ppc64el,riscv64,s390x
sid0.23.4+dfsg-1amd64,arm64,armel,armhf,mips64el,ppc64el,riscv64,s390x
buster0.19.6+dfsg-1amd64,arm64,armhf,i386
bookworm0.23.2+dfsg-2amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
upstream0.24.0
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Preprocessore FASTQ tutto in uno, fastp fornisce funzioni che includono profilazione della qualità, taglio di adattatore, filtraggio delle letture e correzione delle basi. Gestisce letture brevi a estremità singole e accoppiate e fornisce anche il supporto di base per dati di letture lunghe.

The package is enhanced by the following packages: multiqc
Please cite: Shifu Chen, Yanqing Zhou, Yaru Chen and Jia Gu: fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics 34(17):i884-i890 (2018)
Registry entries: Bioconda 
fastqc
controllo di qualità per elevati flussi di dati di sequenze
Versions of package fastqc
ReleaseVersionArchitectures
stretch0.11.5+dfsg-6all
jessie0.11.2+dfsg-3all
buster0.11.8+dfsg-2all
bullseye0.11.9+dfsg-4all
bookworm0.11.9+dfsg-6all
trixie0.12.1+dfsg-4all
sid0.12.1+dfsg-4all
Popcon: 19 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

FastQC mira a fornire un metodo rapido per effettuare alcuni controlli di qualità su elevati flussi attraverso pipe di dati di sequenze grezzi. Fornisce un insieme modulare di analisi che consentono di avere una veloce panoramica sui dati per individuare eventuali presenze di errori o problemi che bisogna tenere in considerazione prima di utilizzarli in analisi successive.

Le funzioni principali di FastQC sono:

  • importazione di dati da file BAM, SAM o FastQ (qualsiasi variante);
  • rapida panoramica per identificare in quali aree potrebbero esserci problemi;
  • grafici e tabelle riepilogative per una valutazione rapida dei dati;
  • esportazione dei risultati in un report permanente in formato HTML;
  • modalità offline che consente la generazione di report automatici senza eseguire l'applicazione interattiva.
The package is enhanced by the following packages: multiqc
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing
flexbar
rimozione flessibile di codice a barre e adattatore per piattaforme di sequenziamento
Versions of package flexbar
ReleaseVersionArchitectures
stretch2.50-2amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el
buster3.4.0-2amd64,arm64,armhf,i386
bullseye3.5.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.50-1amd64,armhf,i386
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Flexbar pre-elabora in modo efficiente grosse moli di dati di sequenziamento. Fa il demultiplexing di corse con codici a barre e rimuove sequenze adattatore. Inoltre sono fornite funzionalità di taglio e filtraggio. Flexbar aumenta i tassi di mappatura e migliora gli assemblati di genomi e trascrittomi. Gestisce dati di sequenziamento di nuova generazione in formato fasta/q e csfasta/q dalla piattaforma SOLiD, Illumina e Roche 454.

I nomi dei parametri in Flexbar sono cambiati. Rivedere i propri script. Negli ultimi mesi, le impostazioni predefinite sono state ottimizzate, sono stati risolti diversi bug e sono stati fatti vari miglioramenti, ad esempio un'interfaccia a riga di comando rimessa a nuovo, nuove modalità di taglio così come una quantità richiesta minore di tempo e memoria.

The package is enhanced by the following packages: multiqc
Please cite: Matthias Dodt, Johannes T. Roehr, Rina Ahmed and Christoph Dieterich: FLEXBAR — Flexible Barcode and Adapter Processing for Next-Generation Sequencing Platforms. (eprint) Biology 1(3):895-905 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
fml-asm
strumento per assemblare letture corte Illumina in piccole regioni
Versions of package fml-asm
ReleaseVersionArchitectures
bullseye0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1-5amd64
bookworm0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports0.1-4~bpo9+1amd64
stretch0.1-2amd64
experimental0.1+git20190320.b499514-2~0expamd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream0.1+git20221215.85f159e
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Fml-asm è uno strumento a riga di comando per assemblare letture corte Illumina in regioni con dimensioni da 100 pb a 10 milioni pb, sulla base della libreria fermi-lite. È in gran parte una versione leggera in memoria di fermikit senza la generazione di alcun file intermedio. Eredita le prestazioni, l'impronta di memoria relativamente piccola e le funzionalità di fermikit. In particolare, fermi-lite è capace di mantenere eventi di eterozigosi e perciò può essere usato per assemblare regioni diploidi con lo scopo dell'identificazione di varianti.

Registry entries: Bio.tools  SciCrunch  Bioconda 
fsm-lite
ricerca di stringhe basata sulla frequenza (lite)
Versions of package fsm-lite
ReleaseVersionArchitectures
sid1.0-8amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.0-8amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.0-8amd64,arm64,mips64el,ppc64el,s390x
bullseye1.0-5amd64,arm64,mips64el,ppc64el,s390x
buster1.0-3amd64,arm64
stretch1.0-2amd64,arm64,mips64el,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Un'implementazione per core singolo della ricerca di sottostringhe basata sulla frequenza usata in bioinformatica per estrarre sottostringhe che discriminano due (o più) insiemi di dati all'interno di dati di sequenziamento ad alte prestazioni.

Registry entries: SciCrunch  Bioconda 
giira
ricerca di geni che incorpora letture ambigue guidata da RNA-Seq
Versions of package giira
ReleaseVersionArchitectures
jessie0.0.20140210-2amd64
stretch0.0.20140625-1amd64
buster0.0.20140625-2amd64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

GIIRA è un metodo di predizione dei geni che identifica potenziali regioni codificanti esclusivamente sulla base della mappatura di letture da un esperimento RNA-Seq. È stato progettato principalmente per la predizione dei geni dei procarioti ed è in grado di risolvere geni all'interno della regione espressa di un operone. Tuttavia, è applicabile anche agli eucarioti e predice sia strutture esone introne, sia isoforme alternative.

Please cite: Franziska Zickmann, Martin S. Lindner and Bernhard Y. Renard: GIIRA—RNA-Seq driven gene finding incorporating ambiguous reads. (PubMed,eprint) Bioinformatics (2013)
Registry entries: Bio.tools  SciCrunch 
grinder
versatile simulatore di letture di sequenziamento "omiche" shotgun e di ampliconi
Versions of package grinder
ReleaseVersionArchitectures
bookworm0.5.4-6all
stretch0.5.4-1all
jessie0.5.3-3all
bullseye0.5.4-6all
buster0.5.4-5all
trixie0.5.4-6all
sid0.5.4-6all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Grinder è un versatile programma per creare librerie di sequenze casuali shotgun e di ampliconi basate su sequenze di riferimento proteiche, di RNA * di DNA, fornite in un file FASTA.

Grinder può produrre insiemi di dati shotgun e di ampliconi genomici, metagenomici, trascrittomici, metatrascrittomici, proteomici, metaproteomici da tecnologie di sequenziamento attuali come Sanger, 454 e Illumina. Questi insiemi di dati simulati possono essere usati per testare l'accuratezza di strumenti bioinformatici sotto ipotesi specifiche, ad esempio con o senza errori di sequenziamento o con bassa o alta diversità della comunità. Grinder può anche essere usato per aiutare a decidere tra metodi alternativi di sequenziamento per un progetto basato su sequenze, ad esempio se la libreria debba essere o meno con terminali accoppiati, quante letture debbano essere sequenziate.

Please cite: Florent E. Angly, Dana Willner, Forest Rohwer, Philip Hugenholtz and Gene W. Tyson: Grinder: a versatile amplicon and shotgun sequence simulator. (PubMed,eprint) Nucleic Acids Research Epub ahead of print (2012)
Registry entries: SciCrunch 
hilive
allineamento in tempo reale di letture Illumina
Versions of package hilive
ReleaseVersionArchitectures
bookworm2.0a-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.0a-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.0a-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.3-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
buster1.1-2amd64,arm64,armhf
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

HiLive è uno strumento per mappare letture che mappa letture HiSeq Illumina (o simili) verso un genoma di riferimento esattamente nel momento in cui sono prodotte. Ciò significa che la mappatura delle letture è terminata non appena il sequenziatore ha terminato di generare i dati.

Please cite: Martin S. Lindner, Benjamin Strauch, Jakob M. Schulze, Simon H. Tausch, Piotr W. Dabrowski, Andreas Nitsche and Bernhard Y. Renard: HiLive: real-time mapping of illumina reads while sequencing. (PubMed) Bioinformatics 33(6):917-919 (2017)
hinge
assemblatore di letture lunghe del genoma basato su hinging
Versions of package hinge
ReleaseVersionArchitectures
buster0.5.0-4amd64,arm64
bookworm0.5.0-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie0.5.0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid0.5.0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye0.5.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

HINGE è un assemblatore di genoma che cerca di ottenere una risoluzione ottimale delle ripetizioni distinguendo le ripetizioni che possono essere risolte sulla base dei dati, da quelle che non possono esserlo. Ciò è ottenuto aggiungendo "cerniere" alle letture per costruire un grafo di sovrapposizioni nel quale solo le ripetizioni irrisolvibili sono fuse. Come risultato, HINGE combina la resilienza agli errori degli assemblatori basati sulle sovrapposizioni con le capacità di risoluzione delle ripetizioni degli assemblatori di grafi de Bruijn.

Please cite: Govinda M Kamath, Ilan Shomorony, Fei Xia, Thomas Courtade and David N Tse: HINGE: Long-read assembly achieves optimal repeat resolution. (PubMed,eprint) Genome Research (2017)
hisat2
allineamento basato su grafi di letture corte di nucleotidi verso molti genomi
Versions of package hisat2
ReleaseVersionArchitectures
bookworm2.2.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.2.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.0.5-1amd64
buster2.1.0-2amd64
sid2.2.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.2.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

HISAT2 è un programma di allineamento veloce e sensibile per mappare le letture di sequenziamento della prossima generazione (sia DNA che RNA) su una popolazione di genomi umani (e anche su un singolo genoma di riferimento). Sulla base di un'estensione di BWT per i grafi, è stato progettato e implementato un indice GFM (graph FM). Oltre a usare un indice GFM globale che rappresenta una popolazione di genomi umani, HISAT2 usa un grande insieme di piccoli indici GFM che collettivamente coprono l'intero genoma (ciascun indice rappresenta una regione genomica di 56 kbp, con 55000 indici necessari per coprire la popolazione umana). Questi piccoli indici (chiamati indici locali), combinati con diverse strategie di allineamento, permettono un allineamento rapido e accurato delle letture di sequenziamento. Questo nuovo schema di indicizzazione è chiamato indice HGFM (Hierarchical Graph FM).

The package is enhanced by the following packages: multiqc
Please cite: Daehwan Kim, Joseph M. Paggi, Chanhee Park, Christopher Bennett and Steven L. Salzberg: Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology 37(8):907-915 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
idba
assemblatore iterativo con grafo di de Bruijn di letture corte
Versions of package idba
ReleaseVersionArchitectures
buster1.1.3-3amd64,arm64,armhf,i386
jessie1.1.2-1amd64,armel,armhf,i386
stretch1.1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.1.3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

IDBA sta per "Iterative De Bruijn graph Assembler" (assemblatore iterativo con grafo di de Bruijn). Nella biologia computazionale di sequenze, un assemblatore risolve il puzzle proveniente da macchine per grandi sequenziamenti che hanno molti gigabyte di letture corte da un grande genoma.

Questo pacchetto fornisce diverse versioni dell'assemblatore IDBA, dato che tutte condividono lo stesso albero sorgente ma assolvono scopi diversi e si sono evolute nel tempo.

IDBA è l'assemblatore iterativo con grafo di de Bruijn di base per letture di sequenze di seconda generazione. IDBA-UD, un'estensione di IDBA, è progettato per utilizzare letture ad estremità accoppiate per assemblare regioni a bassa profondità e usare profondità progressiva nei contig per ridurre gli errori nelle regioni ad alta profondità. È un assemblatore di uso generico ed è specialmente adatto per dati di sequenziamento di cellule singole e di metagenomica. IDBA-Hybrid è un'altra versione aggiornata di IDBA-UD che può utilizzare un genoma simile di riferimento per migliorare i risultati dell'assemblaggio. IDBA-Tran è un assemblatore iterativo con grafo di de Bruijn per dati RNA-Seq.

Please cite: Yu Peng, Henry C. M. Leung, S. M. Yiu and Francis Y. L. Chin: IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth. (PubMed,eprint) Bioinformatics 28(11):1420-1428 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
igdiscover
analizza repertori di anticorpi per trovare nuovi geni V
Versions of package igdiscover
ReleaseVersionArchitectures
bullseye0.11-3all
sid0.11-4all
upstream0.15.1
Popcon: 1 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

IgDiscover analizza repertori di anticorpi e scopre nuovi geni V da letture di sequenziamento ad alte prestazioni. Sono gestite catene pesanti e catene leggere kappa e lambda (per scoprire geni VH, VK e VL).

Please cite: Martin M. Corcoran, Ganesh E. Phad, Néstor Vázquez Bernat, Christiane Stahl-Hennig, Noriyuki Sumida, Mats A.A. Persson, Marcel Martin and Gunilla B. Karlsson Hedestam: Production of individualized V gene databases reveals high levels of immunoglobulin genetic diversity.. (eprint) Nature Communications 7:13642 (2016)
Registry entries: Bio.tools  Bioconda 
igor
inferisce processi di ricombinazione V(D)J da dati di sequenziamento
Versions of package igor
ReleaseVersionArchitectures
bookworm1.4.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.4.0+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.4.0+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.3.0+dfsg-1amd64,arm64,armhf,i386
bullseye1.4.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

IGoR (Inference and Generation of Repertoires) è un versatile software per analizzare e modellare generazione, selezione, mutazione e tutti gli altri processi relativi agli immunorecettori.

Please cite: Quentin Marcou, Thierry Mora and Aleksandra M. Walczak: High-throughput immune repertoire analysis with IGoR. (PubMed,eprint) Nature Communications 9(1):561 (2018)
Registry entries: Bioconda 
igv
Integrative Genomics Viewer
Versions of package igv
ReleaseVersionArchitectures
jessie2.3.38+dfsg-1 (non-free)all
sid2.18.5+dfsg-1all
stretch2.3.90+dfsg-1 (non-free)all
bullseye2.6.3+dfsg-3 (non-free)all
trixie2.18.5+dfsg-1all
bookworm2.16.0+dfsg-1all
Debtags of package igv:
fieldbiology
interfacex11
networkclient
roleprogram
scopeutility
useviewing
works-withbiological-sequence
Popcon: 9 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Integrative Genomics Viewer (IGV) è un visualizzatore ad alte prestazioni che gestisce in modo efficiente vasti insiemi di dati eterogenei, fornendo al contempo un'esperienza utente lineare e intuitiva a tutti i livelli di risoluzione del genoma. Una caratteristica chiave di IGV è la sua attenzione alla natura integrata degli studi genomici, con gestione dei dati sia basati su array sia su sequenziamento di prossima generazione, e l'integrazione di dati clinici e fenotipici. Sebbene IGV sia spesso utilizzato per visualizzare dati genomici da fonti pubbliche, è principalmente focalizzato a supportare i ricercatori che desiderano visualizzare i propri insiemi di dati o quelli di colleghi. A tale scopo IGV supporta il caricamento flessibile di insiemi di dati locali e remoti ed è ottimizzato per fornire visualizzazione ed esplorazione ad alte prestazioni su sistemi desktop standard.

Please cite: James T Robinson, Helga Thorvaldsdóttir, Wendy Winckler, Mitchell Guttman, Eric S Lander, Gad Getz and Jill P Mesirov: Integrative genomics viewer. (PubMed,eprint) Nature Biotechnology 29(1):24–26 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
iva
assemblatore iterativo di sequenze di virus
Versions of package iva
ReleaseVersionArchitectures
bullseye1.0.9+ds-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm1.0.11+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie1.0.11+ds-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
stretch1.0.8+ds-1amd64,arm64,mips64el,ppc64el
buster1.0.9+ds-6amd64,arm64
sid1.0.11+ds-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

IVA è un assemblatore de novo progettato per assemblare genomi di virus che non hanno sequenze ripetute, usando letture accoppiate Illumina sequenziate da popolazioni miste ad una profondità estremamente alta.

L'algoritmo principale di IVA funziona estendendo in maniera iterativa i contig usando letture accoppiate allineate. Il suo input possono essere semplicemente letture accoppiate o in aggiunta si può fornire un insieme esistente di contig da estendere. Come alternativa, può prendere le letture insieme a una sequenza di riferimento.

Please cite: M. Hunt, A. Gall, S. H. Ong, J. Brener, B. Ferns, P. Goulder, E. Nastouli, J. A. Keane, P. Kellam and T. D. Otto: IVA: accurate de novo assembly of RNA virus genomes. (PubMed) Bioinformatics 31(14):2374-2376 (2015)
Registry entries: Bio.tools  Bioconda 
khmer
attraversamento grafi, filtri e conteggi in memoria di k-meri in sequenze di DNA
Versions of package khmer
ReleaseVersionArchitectures
buster2.1.2+dfsg-6amd64,arm64
stretch2.0+dfsg-10amd64,arm64,mips64el,ppc64el
bullseye2.1.2+dfsg-8amd64,arm64
sid3.0.0~a3+dfsg-8amd64
bookworm3.0.0~a3+dfsg-4amd64
experimental3.0.0~a3+dfsg-9~0expamd64
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

khmer è una libreria e una suite di strumenti a riga di comando per lavorare con sequenze di DNA. È principalmente mirata ai dati di sequenziamento con letture corte, come quelli prodotti dalla piattaforma Illumina. khmer ha un approccio alla analisi di sequenze centrato sui k-meri, e da questo deriva il suo nome.

Please cite: Michael R. Crusoe, Hussien F. Alameldin, Sherine Awad, Elmar Bucher, Adam Caldwell, Reed Cartwright, Amanda Charbonneau, Bede Constantinides, Greg Edvenson, Scott Fay, Jacob Fenton, Thomas Fenzl, Jordan Fish, Leonor Garcia-Gutierrez, Phillip Garland, Jonathan Gluck, Iván González, Sarah Guermond, Jiarong Guo, Aditi Gupta, Joshua R. Herr, Adina Howe, Alex Hyer, Andreas Härpfer, Luiz Irber, Rhys Kidd, David Lin, Justin Lippi, Tamer Mansour, Pamela McA'Nulty, Eric McDonald, Jessica Mizzi, Kevin D. Murray, Joshua R. Nahum, Kaben Nanlohy, Alexander Johan Nederbragt, Humberto Ortiz-Zuazaga, Jeramia Ory, Jason Pell, Charles Pepe-Ranney, Zachary N Russ, Erich Schwarz, Camille Scott, Josiah Seaman, Scott Sievert, Jared Simpson, Connor T. Skennerton, James Spencer, Ramakrishnan Srinivasan, Daniel Standage, James A. Stapleton, Joe Stein, Susan R Steinman, Benjamin Taylor, Will Trimble, Heather L. Wiencko, Michael Wright, Brian Wyss, Qingpeng Zhang, en zyme and C. Titus Brown: The khmer software package: enabling efficient sequence analysis. (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
kissplice
rilevamento di vari tipi di polimorfismi in dati RNA-Seq
Versions of package kissplice
ReleaseVersionArchitectures
jessie2.2.1-3amd64
bullseye2.5.3-3amd64,arm64,mips64el,ppc64el
bookworm2.6.2-2amd64,arm64,mips64el,ppc64el
sid2.6.7-1amd64,arm64,mips64el,ppc64el,riscv64
trixie2.6.7-1amd64,arm64,mips64el,ppc64el,riscv64
stretch2.4.0-p1-1amd64,arm64,mips64el,ppc64el
buster2.4.0-p1-4amd64,arm64
Debtags of package kissplice:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
works-withbiological-sequence
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

KisSplice è un software che permette l'analisi di dati RNA-Seq con o senza un genoma di riferimento. È un assemblatore esatto di trascrittoma che permette di identificare SNP, indel e eventi di splicing alternativo. Può lavorare con un numero arbitrario di condizioni biologiche e quantifica ciascuna variante in ogni condizione. È stato provato su insiemi di dati Illumina con fino a 1G di letture. Il suo consumo di memoria è di circa 5Gb per 100M letture.

Please cite: Gustavo AT Sacomoto, Janice Kielbassa, Rayan Chikhi, Raluca Uricaru, Pavlos Antoniou, Marie-France Sagot, Pierre Peterlongo and Vincent Lacroix: KISSPLICE: de-novo calling alternative splicing events from RNA-seq data. (PubMed,eprint) BMC Bioinformatics 13((Suppl 6)):S5 (2012)
Registry entries: SciCrunch  Bioconda 
Topics: RNA-seq; RNA splicing; Gene structure
kraken
assegnazione di etichette tassonomiche a sequenze corte di DNA
Versions of package kraken
ReleaseVersionArchitectures
bookworm1.1.1-4amd64,arm64,mips64el,ppc64el
sid1.1.1-4amd64,arm64,mips64el,ppc64el,riscv64
bullseye1.1.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch-backports1.1-2~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
trixie1.1.1-4amd64,arm64,mips64el,ppc64el,riscv64
buster1.1-3amd64,arm64,armhf,i386
stretch0.10.5~beta-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Kraken è un sistema per assegnare etichette tassonomiche a sequenze corte di DNA, solitamente ottenute tramite studi metagenomici. Tentativi precedenti da parte di altri software di bioinformatica di compiere questo compito spesso hanno usato tecniche di allineamento delle sequenze o di apprendimento macchina che erano piuttosto lente, portando allo sviluppo di programmi di stima dell'abbondanza meno sensibili, ma molto più veloci. Kraken ha lo scopo di raggiungere alta sensibilità e alta velocità usando allineamenti esatti di k-meri e un nuovo algoritmo di classificazione.

Nella sua modalità operativa più veloce, per un metagenoma simulato di letture di 100 pb, Kraken ha elaborato più di 4 milioni di letture al minuto su un singolo core, oltre 900 volte più veloce di Megablast e oltre 11 volte più veloce del programma di stima dell'abbondanza MetaPhlAn. L'accuratezza di Kraken è confrontabile con Megablast, con una sensibilità leggermente inferiore e una precisione molto alta.

The package is enhanced by the following packages: jellyfish1 multiqc
Please cite: Derrick E Wood and Steven L Salzberg: Kraken: ultrafast metagenomic sequence classification using exact alignments. (PubMed,eprint) Genome Biol. 15(3):R46 (2014)
Registry entries: Bio.tools  Bioconda 
kraken2
taxonomic classification system using exact k-mer matches
Versions of package kraken2
ReleaseVersionArchitectures
trixie2.1.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.1.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.1.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.1.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Kraken 2 is the newest version of Kraken, a taxonomic classification system using exact k-mer matches to achieve high accuracy and fast classification speeds. This classifier matches each k-mer within a query sequence to the lowest common ancestor (LCA) of all genomes containing the given k-mer. The k-mer assignments inform the classification algorithm. [see: Kraken 1's Webpage for more details].

Kraken 2 provides significant improvements to Kraken 1, with faster database build times, smaller database sizes, and faster classification speeds. These improvements were achieved by the following updates to the Kraken classification program:

 1. Storage of Minimizers: Instead of storing/querying entire k-mers,
    Kraken 2 stores minimizers (l-mers) of each k-mer. The length of
    each l-mer must be ≤ the k-mer length. Each k-mer is treated by
    Kraken 2 as if its LCA is the same as its minimizer's LCA.
 2. Introduction of Spaced Seeds: Kraken 2 also uses spaced seeds to
    store and query minimizers to improve classification accuracy.
 3. Database Structure: While Kraken 1 saved an indexed and sorted list
    of k-mer/LCA pairs, Kraken 2 uses a compact hash table. This hash
    table is a probabilistic data structure that allows for faster
    queries and lower memory requirements. However, this data structure
    does have a <1% chance of returning the incorrect LCA or returning
    an LCA for a non-inserted minimizer. Users can compensate for this
    possibility by using Kraken's confidence scoring thresholds.
 4. Protein Databases: Kraken 2 allows for databases built from amino
    acid sequences. When queried, Kraken 2 performs a six-frame
    translated search of the query sequences against the database.
 5. 16S Databases: Kraken 2 also provides support for databases not
    based on NCBI's taxonomy. Currently, these include the 16S
    databases: Greengenes, SILVA, and RDP.
Please cite: Derrick E Wood and Steven L Salzberg: Kraken: ultrafast metagenomic sequence classification using exact alignments. (PubMed,eprint) Genome Biol. 15(3):R46 (2014)
Registry entries: Bio.tools  Bioconda 
last-align
confronto di sequenze biologiche su scala genomica
Versions of package last-align
ReleaseVersionArchitectures
trixie1542-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1179-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster963-2amd64,arm64,armhf,i386
stretch830-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1447-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1542-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie490-1amd64,armel,armhf,i386
Debtags of package last-align:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

LAST è un software per confrontare ed allineare sequenze, tipicamente DNA o sequenze proteiche. LAST è simile a BLAST, ma gestisce meglio quantità molto grandi di dati di sequenza. Ci sono due cose che LAST fa molto bene:

  • confrontare grandi genomi (ad esempio di mammiferi);
  • mappare molte etichette di sequenza su un genoma.

La principale innovazione tecnica è che LAST trova le corrispondenze iniziali in base alla loro molteplicità, invece di usare una dimensione fissa (BLAST ad esempio usa 10-meri). Ciò permette di mappare etichette su genomi senza fare la mascheratura delle ripetizioni e senza essere sopraffatti dalle corrispondenze ripetitive. Per trovare queste corrispondenze di dimensione variabile usa un array di suffissi (ispirato a Vmatch). Per ottenere un'alta sensibilità usa un array di suffissi non contigui, analogo a seed non consecutivi.

Please cite: Martin C. Frith, Raymond Wan and Paul Horton: Incorporating sequence quality data into alignment improves DNA read mapping. (PubMed,eprint) Nucl. Acids Res. 38(7):e100 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
libvcflib-tools
libreria C++ per analizzare e manipolare file VCF (strumenti)
Versions of package libvcflib-tools
ReleaseVersionArchitectures
sid1.0.9+dfsg1-3amd64,arm64,mips64el,ppc64el,riscv64
stretch-backports1.0.0~rc1+dfsg1-6~bpo9+1amd64
buster1.0.0~rc2+dfsg-2amd64
buster-backports1.0.1+dfsg-3~bpo10+1amd64
bullseye1.0.2+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.3+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.9+dfsg1-3amd64,arm64,mips64el,ppc64el,riscv64
stretch1.0.0~rc1+dfsg1-3amd64
upstream1.0.10
Popcon: 1 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

Variant Call Format (VCF) è un formato testuale semplice delimitato da tabulazioni pensato per descrivere in modo conciso variazioni tra individui indicizzate rispetto ad un riferimento. VCF fornisce un formato comune di interscambio per la descrizione di variazioni in individui e popolazioni di campioni, ed è diventato il formato standard di fatto per i rapporti per una vasta gamma di rilevatori di varianti genomiche.

vcflib fornisce metodi per manipolare ed interpretare variazioni di sequenza come possono essere descritte da VCF. È:

  • un'API per analizzare e lavorare su record di variazioni genomiche come possono essere descritte dal formato VCF;
  • una raccolta di utilità a riga di comando per eseguire manipolazioni complesse di file VCF.

Questo pacchetto contiene diversi strumenti che usano la libreria.

macs
analisi basata su modelli di ChIP-Seq su sequenziatori di letture corte
Versions of package macs
ReleaseVersionArchitectures
trixie3.0.2-1amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
sid3.0.2-1amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
jessie2.0.9.1-1amd64,armel,armhf,i386
bookworm2.2.7.1-6amd64,arm64,armel,armhf,i386,ppc64el,s390x
stretch2.1.1.20160309-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.2.1-1amd64,arm64,armhf,i386
bullseye2.2.7.1-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MACS modella in modo empirico la lunghezza dei frammenti ChIP sequenziati, che tende ad essere più corta delle stime di dimensione per sonicazione o costruzione di biblioteche genomiche, e la usa per migliorare la risoluzione spaziale dei siti di legame predetti. MACS usa anche una distribuzione di Poisson dinamica per catturare in modo efficace i bias locali nella sequenza del genoma, permettendo una predizione più sensibile e robusta. MACS si comporta bene al confronto degli algoritmi esistenti ChIP-Seq di ricerca di picchi, è disponibile pubblicamente come open source e può essere usato per ChIP-Seq con o senza campioni di controllo.

Please cite: Yong Zhang, Tao Liu, Clifford A Meyer, Jérôme Eeckhoute, David S. Johnson, Bradley E. Bernstein, Chad Nussbaum, Richard M. Myers, Myles Brown, Wei Li and X Shirley Liu: Model-based Analysis of ChIP-Seq (MACS). (PubMed,eprint) Genome Biol. 9(9):R137 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mapdamage
tracciamento e quantificazione di modelli di danno in sequenze di DNA antico
Versions of package mapdamage
ReleaseVersionArchitectures
stretch2.0.6+dfsg-2all
buster2.0.9+dfsg-1all
sid2.2.2+dfsg-1all
bookworm2.2.1+dfsg-3all
bullseye2.2.1+dfsg-1all
trixie2.2.2+dfsg-1all
Popcon: 7 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

MapDamage è un'infrastruttura computazionale scritta in Python e R che tiene traccia e quantifica i modelli di danno del DNA tra letture di sequenziamento di DNA antico generate da piattaforme di sequenziamento di prossima generazione.

MapDamage è sviluppato al Centre for GeoGenetics dall'Orlando Group.

Please cite: Hákon Jónsson, Aurélien Ginolhac, Mikkel Schubert and Philip Johnson and Ludovic Orlando: mapDamage2.0: fast approximate Bayesian estimates of ancient DNA damage parameters. (PubMed,eprint) Bioinformatics 29(13):1682-4 (2013)
Registry entries: SciCrunch  Bioconda 
mapsembler2
software per assemblaggio pensato per la bioinformatica
Versions of package mapsembler2
ReleaseVersionArchitectures
buster2.2.4+dfsg-3amd64,arm64,armhf,i386
bullseye2.2.4+dfsg1-3amd64,arm64,ppc64el,s390x
jessie2.1.6+dfsg-1amd64,armel,armhf,i386
sid2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
trixie2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
bookworm2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
stretch2.2.3+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Mapsembler2 è un software di assemblaggio pensato per la bioinformatica. Accetta in input un insieme di letture grezze NGS (fasta o fastQ, compresse con gzip o meno) e un insieme di sequenze di input (starter).

Come prima cosa determina se ogni starter è coerente a livello di letture, ad esempio se le letture confermano la presenza di ciascun starter nella sequenza originale. Poi, per ogni starter coerente con le letture, Mapsembler2 produce in output le sue sequenze vicine come sequenza lineare o come grafo, a seconda della scelta dell'utente.

Mapsempler2 può essere usato per (ma non è limitato a questo):

  • validare una sequenza assemblata (data in input come starter), per esempio da un assemblato con grafo di de Bruijn in cui non è stata imposta la coerenza con le letture;
  • controlla se un gene (dato in input come starter) ha un omologo in un insieme di letture;
  • controlla se un enzima conosciuto è presente in un insieme di letture NGS metagenomico;
  • arricchisce letture non mappabili estendendole, rendendole eventualmente mappabili;
  • controlla cosa accade alle estremità di un contig;
  • rimuove contaminanti o letture simbionti da un insieme di letture.
Please cite: Pierre Peterlongo and Rayan Chikhi: Mapsembler, targeted and micro assembly of large NGS datasets on a desktop computer. (PubMed) BMC Bioinformatics 13:48 (2012)
Registry entries: Bio.tools  Bioconda 
maq
mappatura di corte sequenze di lunghezza fissa di DNA polimorfo su sequenze di riferimento
Versions of package maq
ReleaseVersionArchitectures
bookworm0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.7.1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.7.1-8amd64,arm64,armhf,i386
bullseye0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.7.1-5amd64,armel,armhf,i386
stretch0.7.1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.7.1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package maq:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 7 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Maq (abbreviazione di Mappatura e Assemblaggio con Qualità) costruisce assemblaggi per mappatura a partire da corte letture generate dalle apparecchiature di sequenziamento di seconda generazione. È pensato principalmente per l'analizzatore Illumina-Solexa 1G Genetic Analyzer ed ha una preliminare capacità di gestire dati ABI SOLiD. Maq si chiamava prima mapass2.

Lo sviluppo di Maq si è fermato nel 2008. I suoi successori sono BWA e SAMtools.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.tools  SciCrunch 
maqview
visualizzatore grafico di allineamento di letture per brevi sequenze geniche
Versions of package maqview
ReleaseVersionArchitectures
sid0.2.5-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.2.5-9amd64,arm64,armhf,i386
stretch0.2.5-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.2.5-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.2.5-6amd64,armel,armhf,i386
bookworm0.2.5-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.2.5-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Maqview è un visualizzatore grafico di allineamenti di letture. È specificamente progettato per i file di allineamento Maq e permette di vedere non corrispondenze, qualità delle basi e qualità della mappatura. Maqview non è sofisticato come Consed o GAP, ma è solamente un semplice visualizzatore per vedere ciò che succede in una particolare regione.

In confronto a tgap-maq, il visualizzatore testuale di allineamenti di letture scritto da James Bonfield, Maqview è più veloce e usa molta meno memoria e spazio su disco durante l'indicizzazione. Ciò è possibile perché tgap mira ad essere un visualizzatore universale, mentre Maqview sfrutta a pieno il fatto che un file di allineamento Maq è già stato ordinato. Maqview è efficiente anche nella visualizzazione e fornisce uno strumento a riga di comando per recuperare velocemente qualsiasi regione in un file di allineamento Maq.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.tools  SciCrunch 
mhap
hash con sensibilità locale per rilevare sovrapposizioni di letture lunghe
Versions of package mhap
ReleaseVersionArchitectures
sid2.1.3+dfsg-3all
stretch2.1.1+dfsg-1all
stretch-backports2.1.3+dfsg-1~bpo9+1all
buster2.1.3+dfsg-2all
bullseye2.1.3+dfsg-3all
bookworm2.1.3+dfsg-3all
trixie2.1.3+dfsg-3all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

MinHash Alignment Process (MHAP, pronunciato MAP) è un'implementazione di riferimento di un algoritmo probabilistico per la sovrapposizione di sequenze. È progettato per rilevare in maniera efficiente tutte le sovrapposizioni tra letture lunghe in dati di sequenze con rumore. Stima in maniera efficiente la similarità di Jaccard comprimendo le sequenze nelle loro impronte digitali rappresentative composte su min-meri (minimi k-meri).

Please cite: Konstantin Berlin, Sergey Koren, Chen-Shan Chin, James P Drake, Jane M Landolin and Adam M Phillippy: Assembling large genomes with single-molecule sequencing and locality-sensitive hashing. (PubMed) Nature Biotechnology 33(6):623–630 (2015)
Registry entries: Bioconda 
microbiomeutil
utilità per analisi di microbioma
Versions of package microbiomeutil
ReleaseVersionArchitectures
sid20101212+dfsg1-6all
bullseye20101212+dfsg1-4all
stretch20101212+dfsg1-1all
jessie20101212+dfsg-1all
bookworm20101212+dfsg1-5all
buster20101212+dfsg1-2all
trixie20101212+dfsg1-6all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Il pacchetto microbiomeutil contiene le seguenti utilità:

  • ChimeraSlayer: ChimeraSlayer per la rilevazione di chimere;
  • NAST-iEr: strumento di allineamento basato su NAST;
  • WigeoN: una reimplementazione dell'utilità Pintail di rilevamento delle anomalie 16S;
  • RESOURCES: sequenze 16S e allineamenti NAST di riferimento utilizzati dagli strumenti precedenti.
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch 
mira-assembler
assemblatore di sequenze di genomi interi con metodo shotgun e di EST
Versions of package mira-assembler
ReleaseVersionArchitectures
bookworm4.9.6-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.9.6-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.0.2-1amd64,armel,armhf,i386
stretch4.9.6-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.9.6-4amd64,arm64,armhf,i386
bullseye4.9.6-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.9.6-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package mira-assembler:
roleprogram
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

L'assemblatore di frammenti di genoma mira è un assemblatore specializzato per progetti di sequenziamento considerati "difficili" a causa di un alto numero di ripetizioni simili. Per i trascritti di EST (expressed sequence tag, etichette di sequenze espresse), miraEst è specializzato nel ricostruire trascritti originali di mRNA, al contempo rilevando e classificando polimorfismi di singoli nucleotidi (SNP) che vi appaiono in diverse variazioni.

L'assemblatore viene normalmente utilizzato per compiti vari quali la rilevazione di mutazioni in diversi tipi di cellule, analisi di somiglianza di trascritti tra organismi diversi e l'assemblaggio originale di sequenze da varie fonti per la progettazione di oligonucleotidi in esperimenti clinici con microarray.

Il pacchetto fornisce gli eseguibili elencati in seguito. Binari forniti:

  • mira: per assemblare sequenze genomiche;
  • miramem: stima la memoria necessaria per assemblare progetti;
  • mirabait: uno strumento in stile "grep" per selezionare letture con k-meri fino a 256 basi;
  • miraconvert: uno strumento per convertire, estrarre e, a volte, ricalcolare tutte i tipi di dati relativi ai file di assemblaggio di sequenze.
Please cite: Bastien Chevreux, Thomas Pfisterer, Bernd Drescher, Albert J. Driesel, Werner E. G. Müller, Thomas Wetter and Sándor Suhai: Using the miraEST Assembler for Reliable and Automated mRNA Transcript Assembly and SNP Detection in Sequenced ESTs. (PubMed,eprint) Genome Research 14(6):1147-1159 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mothur
suite di analisi di sequenze per ricerche su microrganismi
Versions of package mothur
ReleaseVersionArchitectures
buster1.41.21-1amd64,arm64,armhf,i386
jessie1.33.3+dfsg-2amd64,armel,armhf,i386
stretch1.38.1.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.48.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.48.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.48.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.44.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.48.2
Debtags of package mothur:
roleprogram
Popcon: 3 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Mothur cerca di sviluppare un unico software open source, estensibile per soddisfare le necessità dei bioinformatici nel campo dell'ecologia microbica. Ha incorporate le funzionalità di dotur, sons, treeclimber, s-libshuff, unifrac e molto altro. In aggiunta a migliorare la flessibilità di questi algoritmi, sono state aggiunte svariate altre funzionalità inclusi strumenti di calcolo e visualizzazione.

Please cite: Patrick D Schloss, Sarah L Westcott, Thomas Ryabin, Justine R Hall, Martin Hartmann, Emily B Hollister, Ryan A Lesniewski, Brian B Oakley, Donovan H Parks, Courtney J Robinson, Jason W Sahl, Blaz Stres, Gerhard G Thallinger, David J Van Horn and Carolyn F Weber: Introducing mothur: Open-source, platform-independent, community-supported software for describing and comparing microbial communities. (PubMed) Appl Environ Microbiol 75(23):7537-7541 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Microbial ecology
nanopolish
identificatore di sequenze di consenso per dati di sequenziamento a nanopori
Versions of package nanopolish
ReleaseVersionArchitectures
stretch0.5.0-1amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
sid0.14.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
stretch-backports0.10.2-1~bpo9+1amd64
buster0.11.0-2amd64
bookworm0.14.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie0.14.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye0.13.2-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Nanopolish usa un modello di Markov nascosto segnale-livello per l'identificazione di sequenze di consenso di dati di sequenziamento a nanopori di genomi. Può eseguire l'analisi a livello di segnale di dati di sequenziamento Oxford Nanopore. Nanopolish può calcolare una sequenza di consenso migliorata per una bozza di assemblaggio genomico, rilevare modificazioni di basi, identificare SNP e indel in rapporto ad un genoma di riferimento e altro ancora.

Registry entries: Bio.tools  SciCrunch  Bioconda 
paleomix
pipelines and tools for the processing of ancient and modern HTS data
Versions of package paleomix
ReleaseVersionArchitectures
buster1.2.13.3-1amd64
sid1.3.8-2amd64,arm64
bookworm1.3.7-3amd64,arm64
bullseye1.3.2-1amd64,arm64,mips64el,ppc64el
trixie1.3.8-2amd64,arm64
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The PALEOMIX pipelines are a set of pipelines and tools designed to aid the rapid processing of High-Throughput Sequencing (HTS) data: The BAM pipeline processes de-multiplexed reads from one or more samples, through sequence processing and alignment, to generate BAM alignment files useful in downstream analyses; the Phylogenetic pipeline carries out genotyping and phylogenetic inference on BAM alignment files, either produced using the BAM pipeline or generated elsewhere; and the Zonkey pipeline carries out a suite of analyses on low coverage equine alignments, in order to detect the presence of F1-hybrids in archaeological assemblages. In addition, PALEOMIX aids in metagenomic analysis of the extracts.

The pipelines have been designed with ancient DNA (aDNA) in mind, and includes several features especially useful for the analyses of ancient samples, but can all be for the processing of modern samples, in order to ensure consistent data processing.

Please cite: Mikkel Schubert, Luca Ermini, Clio Der Sarkissian, Hákon Jónsson, Aurélien Ginolhac, Robert Schaefer, Michael D Martin, Ruth Fernández, Martin Kircher, Molly McCue, Eske Willerslev and Ludovic Orlando: Characterization of ancient and modern genomes by SNP detection and phylogenomic and metagenomic analysis using PALEOMIX. (PubMed) Nature Protocols 9(5):1056-82 (2014)
Registry entries: Bio.tools  SciCrunch 
pbhoney
genomic structural variation discovery
Versions of package pbhoney
ReleaseVersionArchitectures
bookworm15.8.24+dfsg-7all
bullseye15.8.24+dfsg-7all
stretch15.8.24+dfsg-2all
buster15.8.24+dfsg-3all
sid15.8.24+dfsg-7all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PBHoney is an implementation of two variant-identification approaches designed to exploit the high mappability of long reads (i.e., greater than 10,000 bp). PBHoney considers both intra-read discordance and soft-clipped tails of long reads to identify structural variants.

PBHoney is part of the PBSuite.

pbjelly
strumento per aggiornare assemblati di genoma
Versions of package pbjelly
ReleaseVersionArchitectures
bookworm15.8.24+dfsg-7all
stretch15.8.24+dfsg-2all
buster15.8.24+dfsg-3all
bullseye15.8.24+dfsg-7all
sid15.8.24+dfsg-7all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PBJelly è una catena di elaborazione dati estremamente automatizzata che allinea letture lunghe di sequenziamento (come letture PacBio RS o letture 454 lunghe in formato FASTA) in assemblati bozza con elevata fiducia. PBJelly riempie o riduce quanti più gap catturati possibile per produrre genomi bozza aggiornati.

PBJelly fa parte di PBSuite.

pbsuite
software per dati di sequenziamento di Pacific Biosciences
Versions of package pbsuite
ReleaseVersionArchitectures
bookworm15.8.24+dfsg-7all
buster15.8.24+dfsg-3all
bullseye15.8.24+dfsg-7all
stretch15.8.24+dfsg-2all
sid15.8.24+dfsg-7all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

PBSuite contiene due progetti creati per l'analisi di dati di sequenziamento di letture lunghe di Pacific Biosciences.

  • PBJelly - strumento per upgrade del genoma
  • PBHoney - scoperta di variazioni strutturali
picard-tools
strumenti a riga di comando per manipolare file SAM e BAM
Versions of package picard-tools
ReleaseVersionArchitectures
bookworm2.27.5+dfsg-2all
trixie3.1.1+dfsg-1all
sid3.1.1+dfsg-1all
stretch2.8.1+dfsg-1all
bullseye2.24.1+dfsg-1all
buster2.18.25+dfsg-2amd64
jessie1.113-1all
upstream3.3.0
Popcon: 10 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Il formato SAM (Sequence Alignment/Map, allineamento/mappa di sequenza) è un formato generico per memorizzare grandi allineamenti di sequenze nucleotidiche. In Picard Tools sono incluse le seguenti utilità per manipolare file SAM e BAM:

 AddCommentsToBam                  FifoBuffer
 AddOrReplaceReadGroups            FilterSamReads
 BaitDesigner                      FilterVcf
 BamIndexStats                     FixMateInformation
                                   GatherBamFiles
 BedToIntervalList                 GatherVcfs
 BuildBamIndex                     GenotypeConcordance
 CalculateHsMetrics                IlluminaBasecallsToFastq
 CalculateReadGroupChecksum        IlluminaBasecallsToSam
 CheckIlluminaDirectory            LiftOverIntervalList
 CheckTerminatorBlock              LiftoverVcf
 CleanSam                          MakeSitesOnlyVcf
 CollectAlignmentSummaryMetrics    MarkDuplicates
 CollectBaseDistributionByCycle    MarkDuplicatesWithMateCigar
 CollectGcBiasMetrics              MarkIlluminaAdapters
 CollectHiSeqXPfFailMetrics        MeanQualityByCycle
 CollectIlluminaBasecallingMetrics MergeBamAlignment
 CollectIlluminaLaneMetrics        MergeSamFiles
 CollectInsertSizeMetrics          MergeVcfs
 CollectJumpingLibraryMetrics      NormalizeFasta
 CollectMultipleMetrics            PositionBasedDownsampleSam
 CollectOxoGMetrics                QualityScoreDistribution
 CollectQualityYieldMetrics        RenameSampleInVcf
 CollectRawWgsMetrics              ReorderSam
 CollectRnaSeqMetrics              ReplaceSamHeader
 CollectRrbsMetrics                RevertOriginalBaseQualitiesAndAddMateCigar
 CollectSequencingArtifactMetrics  RevertSam
 CollectTargetedPcrMetrics         SamFormatConverter
 CollectVariantCallingMetrics      SamToFastq
 CollectWgsMetrics                 ScatterIntervalsByNs
 CompareMetrics                    SortSam
 CompareSAMs                       SortVcf
 ConvertSequencingArtifactToOxoG   SplitSamByLibrary
 CreateSequenceDictionary          SplitVcfs
 DownsampleSam                     UpdateVcfSequenceDictionary
 EstimateLibraryComplexity         ValidateSamFile
 ExtractIlluminaBarcodes           VcfFormatConverter
 ExtractSequences                  VcfToIntervalList
 FastqToSam                        ViewSam
The package is enhanced by the following packages: multiqc
Please cite: Broad Institute: Picard toolkit. Broad Institute, GitHub repository (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing; Document, record and content management
pirs
Profile based Illumina pair-end Reads Simulator
Versions of package pirs
ReleaseVersionArchitectures
sid2.0.2+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.0.2+dfsg-5.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.0.2+dfsg-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.0.2+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.0.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.0.2+dfsg-8amd64,arm64,armhf,i386
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The program pIRS can be used for simulating Illumina PE reads, with a series of characters generated by Illumina sequencing platform, such as insert size distribution, sequencing error(substitution, insertion, deletion), quality score and GC content-coverage bias.

The insert size follows a normal distribution, so users should set the mean value and standard deviation. Usually the standard deviation is set as 1/20 of the mean value. The normal distribution by Box-Muller method is simulated.

The program simulates sequencing error, quality score and GC content- coverage bias according to the empirical distribution profile. Some default profiles counted from lots of real sequencing data are provided.

To simulate reads from diploid genome, users should simulate the diploid genome sequence firstly by setting the ratio of heterozygosis SNP, heterozygosis InDel and structure variation.

Please cite: Xuesong Hu, Jianying Yuan, Yujian Shi, Jianliang Lu, Binghang Liu, Zhenyu Li, Yanxiang Chen, Desheng Mu, Hao Zhang, Nan Li, Zhen Yue, Fan Bai, Heng Li and Wei Fan: pIRS: Profile-based Illumina pair-end reads simulator. (PubMed,eprint) Bioinformatics 28(11):1533-5 (2012)
Registry entries: Bioconda 
pizzly
Identifies gene fusions in RNA sequencing data
Versions of package pizzly
ReleaseVersionArchitectures
bullseye0.37.3+ds-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.37.3+ds-9amd64,arm64,mips64el,ppc64el,s390x
trixie0.37.3+ds-9amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid0.37.3+ds-9amd64,arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

For the interpretation of the transcriptome (the abundance and sequence of RNA) of tomour cells one is particularly interested in transcripts that cannot be mapped to single genes but that are seen to be fused as parts from two genes. Likely eplanations are chromosomal translocations.

Pizzly can identify novel such peculiarities, building on interpretations on variable splicing by the tool kallisto. Both tools are elements of the bcbio workflow.

Registry entries: Bioconda 
placnet
progetto Plasmid Constellation Network
Versions of package placnet
ReleaseVersionArchitectures
trixie1.04-1all
bullseye1.03-3all
buster1.03-3all
stretch1.03-2all
sid1.04-1all
bookworm1.04-1all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Placnet è un nuovo strumento per l'analisi di plasmidi in progetti NGS. Placnet è ottimizzato per lavorare con sequenze Illumina, ma funziona anche con 454, Iontorrent o qualsiasi tecnologia di sequenziamento esistente.

L'input di Placnet è un insieme di contigui e uno o più file SAM con la mappatura tra le letture e i contigui. Placnet ottiene un insieme di file facilmente aperti nel software Cytoscape o in altri strumenti di rete.

Please cite: Val F. Lanza, María de Toro, M. Pilar Garcillán-Barcia, Azucena Mora, Jorge Blanco, Teresa M. Coque and Fernando de la Cruz: Plasmid Flux in Escherichia coli ST131 Sublineages, Analyzed by Plasmid Constellation Network (PLACNET), a New Method for Plasmid Reconstruction from Whole Genome Sequences. (PubMed,eprint) PLOS 10(12):e1004766 (2014)
poretools
toolkit per dati Nanopore di sequenziamento di nucleotidi
Versions of package poretools
ReleaseVersionArchitectures
buster0.6.0+dfsg-3all
stretch0.6.0+dfsg-2all
sid0.6.0+dfsg-7all
trixie0.6.0+dfsg-7all
bookworm0.6.0+dfsg-6all
bullseye0.6.0+dfsg-5all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

poretools è un toolkit flessibile per esplorare insiemi di dati generati da dispositivi Nanopore di sequenziamento da MinION con gli scopi di controllo di qualità e di analisi a valle. poretools opera direttamente sul formato di file nativo FAST5 (una variante dello standard HDF5) prodotto da ONT e fornisce una vasta gamma di utilità per convertire formati e strumenti per visualizzazione ed esplorazione dei dati.

Please cite: Nicholas Loman and Aaron Quinlan: Poretools: a toolkit for analyzing nanopore sequence data. (PubMed,eprint) Bioinformatics 30(23):3399-3401 (2014)
Registry entries: Bio.tools  Bioconda 
python3-airr
Data Representation Standard library for antibody and TCR sequences
Versions of package python3-airr
ReleaseVersionArchitectures
buster1.2.1-2all
trixie1.5.0-1all
bookworm1.3.1-1all
sid1.5.0-1all
bullseye1.3.1-1all
upstream1.5.1
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

This package provides a library by the AIRR community to for describing, reporting, storing, and sharing adaptive immune receptor repertoire (AIRR) data, such as sequences of antibodies and T cell receptors (TCRs). Some specific efforts include:

  • The MiAIRR standard for describing minimal information about AIRR datasets, including sample collection and data processing information.
  • Data representations (file format) specifications for storing large amounts of annotated AIRR data.
  • APIs for exposing a common interface to repositories/databases containing AIRR data.
  • A community standard for software tools which will allow conforming tools to gain community recognition.

This package installs the library for Python 3.

python3-gffutils
lavorare con file GFF e GTF in un'infrastruttura a database flessibile
Versions of package python3-gffutils
ReleaseVersionArchitectures
buster0.9-1all
sid0.13-1all
trixie0.13-1all
bookworm0.11.1-3all
bullseye0.10.1-2all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Un pacchetto Python per lavorare con i file in formato GFF e GTF, comunemente utilizzati per annotazioni genomiche, e per manipolarli. I file vengono caricati in un database sqlite3, permettendo una manipolazione molto più complessa delle caratteristiche gerarchiche (es.: geni, trascritti ed esoni) di quella possibile con i soli metodi in testo semplice.

Registry entries: Bio.tools  Bioconda 
python3-presto
toolkit per elaborare sequenze di cellule B e T (modulo Python 3)
Versions of package python3-presto
ReleaseVersionArchitectures
trixie0.7.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.5.10-1all
sid0.7.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.6.2-1all
bookworm0.7.1-1all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

pRESTO è un toolkit per elaborare letture grezze da sequenziamento ad alte prestazioni di repertori di cellule B e cellule T.

Gli enormi miglioramenti nelle tecnologie di sequenziamento ad alte prestazioni permettono ora la caratterizzazione su larga scala di repertori di linfociti, definiti come raccolte di proteine antigene-recettore trans-membrana posizionate sulla superficie di cellule B e cellule T. pRESTO (REpertoire Sequencing TOolkit) è composto da una suite di utilità per gestire tutti gli stadi dell'elaborazione di sequenze prima dell'assegnazione di segmenti a linee germinali. pRESTO è progettato per gestire letture singole o a terminali accoppiati. Include funzionalità per controllo di qualità, mascheramento dei primer, annotazione delle letture con codici a barre incorporati nelle sequenze, generazione di sequenze di consenso UMI (Unique Molecular Identifier), assemblaggio di letture a terminali accoppiati e identificazione di sequenze duplicate. Sono incluse anche numerose opzioni per operazioni di ordinamento, campionamento e conversione delle sequenze.

Questo pacchetto fornisce il modulo Python 3 di presto.

Please cite: Jason A. Vander Heiden, Gur Yaari, Mohamed Uduman, Joel N.H. Stern, Kevin C. O’Connor, David A. Hafler, Francois Vigneault and Steven H. Kleinstein: pRESTO: a toolkit for processing high-throughput sequencing raw reads of lymphocyte receptor repertoires. (PubMed,eprint) Bioinformatics 30(13):1930-1932 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
python3-pybedtools
wrapper in Python 3 intorno a BEDTools per lavori di bioinformatica
Versions of package python3-pybedtools
ReleaseVersionArchitectures
trixie0.10.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye0.8.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm0.9.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid0.10.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
buster0.8.0-1amd64,arm64
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

La suite di programmi BEDTools è ampiamente usata per la manipolazione di intervalli genomici, o "algebra del genoma". pybedtools fa da wrapper per BEDTools e lo estende, e offre manipolazioni a livello di tratti all'interno di Python.

Questa è la versione per Python 3.

Please cite: R. K. Dale, B. S. Pedersen and A. R. Quinlan: Pybedtools: a flexible Python library for manipulating genomic datasets and annotations". Bioinformatics 27(24):3423-3424 (2011)
Registry entries: Bio.tools  Bioconda 
python3-sqt
SeQuencing Tools for biological DNA/RNA high-throughput data
Versions of package python3-sqt
ReleaseVersionArchitectures
sid0.8.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie0.8.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm0.8.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster0.8.0-3amd64,arm64
bullseye0.8.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

sqt is a collection of command-line tools for working with high-throughput sequencing data. Conceptionally not fixed to use any particular language, many sqt subcommands are currently implemented in Python. For them, a Python package is available with functions for reading and writing FASTA/FASTQ files, computing alignments, quality trimming, etc.

The following tools are offered:

  • sqt-coverage -- Compute per-reference statistics such as coverage and GC content
  • sqt-fastqmod -- FASTQ modifications: shorten, subset, reverse complement, quality trimming.
  • sqt-fastastats -- Compute N50, min/max length, GC content etc. of a FASTA file
  • sqt-qualityguess -- Guess quality encoding of one or more FASTA files.
  • sqt-globalalign -- Compute a global or semiglobal alignment of two strings.
  • sqt-chars -- Count length of the first word given on the command line.
  • sqt-sam-cscq -- Add the CS and CQ tags to a SAM file with colorspace reads.
  • sqt-fastamutate -- Add substitutions and indels to sequences in a FASTA file.
  • sqt-fastaextract -- Efficiently extract one or more regions from an indexed FASTA file.
  • sqt-translate -- Replace characters in FASTA files (like the 'tr' command).
  • sqt-sam-fixn -- Replace all non-ACGT characters within reads in a SAM file.
  • sqt-sam-insertsize -- Mean and standard deviation of paired-end insert sizes.
  • sqt-sam-set-op -- Set operations (union, intersection, ...) on SAM/BAM files.
  • sqt-bam-eof -- Check for the End-Of-File marker in compressed BAM files.
  • sqt-checkfastqpe -- Check whether two FASTQ files contain correctly paired paired-end data.
Registry entries: Bioconda 
q2cli
interfaccia a riga di comando basata su clic per QIIME 2
Versions of package q2cli
ReleaseVersionArchitectures
bookworm2022.11.1-2all
bullseye2020.11.1-1all
sid2024.5.0-2all
upstream2024.10.1
Popcon: 16 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
qcumber
controllo di qualità di sequenze genomiche
Versions of package qcumber
ReleaseVersionArchitectures
trixie2.3.0-2all
buster1.0.14+dfsg-1all
bullseye2.3.0-2all
bookworm2.3.0-2all
sid2.3.0-2all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

QCPipeline è uno strumento per controllo di qualità. Il flusso di lavoro è il seguente:

 1. controllo di qualità con FastQC
 2. taglio delle letture con Trimmomatic
 3. controllo di qualità delle letture tagliate con FastQC
 4. mappatura delle letture sui riferimenti usando bowtie2
 5. classificazione delle letture con Kraken
Registry entries: Bioconda 
qiime
Quantitative Insights Into Microbial Ecology
Versions of package qiime
ReleaseVersionArchitectures
bullseye2020.11.1-1all
jessie1.8.0+dfsg-4amd64,armel,armhf,i386
bookworm2022.11.1-2all
sid2024.5.0-1all
upstream2024.10.1
Debtags of package qiime:
roleprogram
Popcon: 15 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

I microorganismi circondano noi, gli animali, le piante e tutti i loro parassiti con un grande effetto su tutti questi e sull'ambiente in cui vivono. Si può pensare alla qualità del suolo, ma anche all'effetto che i batteri hanno gli uni sugli altri. L'uomo influenza l'abbondanza assoluta e relativa dei batteri con gli antibiotici, il cibo, i fertilizzanti, e ogni altra cosa a cui si può pensare, e questi cambiamenti hanno un effetto su di noi.

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (PubMed,eprint) Nature Biotechnology 37:852 - 857 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Microbial ecology
quorum
QUality Optimized Reads di sequenze genomiche
Versions of package quorum
ReleaseVersionArchitectures
sid1.1.2-2amd64,arm64,mips64el,ppc64el,riscv64
bookworm1.1.1-7amd64,arm64,mips64el,ppc64el
trixie1.1.2-2amd64,arm64,mips64el,ppc64el,riscv64
buster1.1.1-2amd64,arm64
bullseye1.1.1-4amd64,arm64,mips64el,ppc64el
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

QuorUM permette di ottenere letture tagliate e con errori corretti che risultano in assemblati con contig più lunghi e meno errori. QuorUM fornisce le migliori prestazioni in confronto ad altri strumenti per correggere errori in svariate metriche. QuorUM è implementato in maniera efficiente facendo uso delle attuali architetture di calcolo multi-core ed è adatto per grandi insiemi di dati (1 miliardo di basi controllate e corrette al giorno per core). L'assemblatore di terze parti (SOAPdenovo) beneficia in maniera significativa dall'uso delle letture con gli errori corretti da QuorUM. Le letture con gli errori corretti da QuorUM risultano in un fattore di miglioramento da 1.1 a 4 nella dimensione dei contig N50 in confronto all'uso delle letture originali con SOAPdenovo per gli insiemi di dati investigati.

Please cite: Guillaume Marçais, James A. Yorke and Aleksey Zimin: QuorUM: An Error Corrector for Illumina Reads. (PubMed,eprint) PLoS One 10(6):e0130821 (2015)
Registry entries: SciCrunch 
r-bioc-deseq2
pacchetto R per analisi RNA-Seq di espressione differenziale
Versions of package r-bioc-deseq2
ReleaseVersionArchitectures
trixie1.44.0+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster1.22.2+dfsg-1amd64,arm64,armhf,i386
sid1.44.0+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye1.30.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.38.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.14.1-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream1.46.0
Popcon: 23 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

Analisi di espressione differenziale dei geni basata sulla distribuzione binomiale negativa. Stima di dipendenza varianza-media in dati di conteggi da saggi di sequenziamento ad alte prestazioni e test per espressione differenziale basata su un modello usando la distribuzione binomiale negativa.

Please cite: Michael I Love, Wolfgang Huber and Simon Anders: Moderated estimation of fold change and dispersion for {RNA}-seq data with {DESeq}2. (eprint) Genome Biol 15(12) (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-edger
analisi empiriche per dati digitali di espressione genica in R
Versions of package r-bioc-edger
ReleaseVersionArchitectures
stretch3.14.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid4.2.2+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm3.40.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.32.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.2.2+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
jessie3.8.2+dfsg-1amd64,armel,armhf,i386
upstream4.4.0
Popcon: 26 users (10 upd.)*
Newer upstream!
License: DFSG free
Git

Il pacchetto bioconductor per analisi dell'espressione differenziale di sequenziamenti di trascrittoma completo (sequenziamento di RNA) e profili digitali di espressione genica con replicazione biologica. Usa stimatori bayesiani empirici e test esatti basati sulla distribuzione binomiale negativa. È anche utile per analisi di segnali differenziali con altri tipi di dati di conteggio a livello di genoma.

Please cite: Mark D. Robinson, Davis J. McCarthy and Gordon K. Smyth: edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. (PubMed,eprint) Bioinformatics 26,:139-140 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-hilbertvis
pacchetto GNU R per visualizzare dati vettoriali lunghi
Versions of package r-bioc-hilbertvis
ReleaseVersionArchitectures
bullseye1.48.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.56.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.62.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid1.62.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster1.40.0-1amd64,arm64,armhf,i386
jessie1.24.0-1amd64,armel,armhf,i386
stretch1.32.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream1.64.0
Debtags of package r-bioc-hilbertvis:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
useanalysing
Popcon: 4 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Questo strumento permette la visualizzazione di vettori di dati molto lunghi in una maniera efficiente dal punto di vista dello spazio occupato, organizzandoli su una curva di Hilbert in due dimensioni. In seguito l'utente può giudicare visivamente la struttura e la distribuzione generali delle caratteristiche contemporaneamente alla forma e intensità approssimate delle singole caratteristiche.

In bioinformatica un caso d'uso tipico è ChIP-Chip e ChIP-Seq o praticamente tutti i generi di dati genomici, che sono convenzionalmente visualizzati come tracciato quantitativo ("wiggle data") in navigatori per genoma come quelli forniti da Ensembl o UCSC.

Please cite: Simon Anders: Visualization of genomic data with the Hilbert curve. (PubMed,eprint) Bioinformatics 25(10):1231-1235 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-metagenomeseq
analisi statistiche per GNU R per sequenziamento sparso ad alte prestazioni
Versions of package r-bioc-metagenomeseq
ReleaseVersionArchitectures
sid1.46.0-1all
buster1.24.1-1all
bookworm1.40.0-1all
bullseye1.32.0-1all
stretch1.16.0-2all
trixie1.46.0-1all
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

MetagenomeSeq è progettato per determinare caratteristiche (che siano OTU (Unità Tassonomiche Operative), specie, ecc.) che hanno differenze di abbondanza tra due o più gruppi di campioni multipli. metagenomeSeq è progettato per affrontare gli effetti sia della normalizzazione sia del sotto-campionamento di comunità microbiche sul rilevamento di associazione di malattie e su test di correlazione di caratteristiche.

Registry entries: Bio.tools  Bioconda 
r-bioc-rsubread
Subread Sequence Alignment and Counting for R
Versions of package r-bioc-rsubread
ReleaseVersionArchitectures
bookworm2.12.2-1amd64,arm64,mips64el,ppc64el,s390x
sid2.18.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie2.18.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye2.4.2-1amd64,arm64,mips64el,ppc64el,s390x
upstream2.20.0
Popcon: 14 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Alignment, quantification and analysis of second and third generation sequencing data. Includes functionality for read mapping, read counting, SNP calling, structural variant detection and gene fusion discovery.

Can be applied to all major sequencing techologies and to both short and long sequence reads.

Please cite: Yang Liao, Gordon K Smyth and Wei Shi: The R package Rsubread is easier, faster, cheaper and better for alignment and quantification of RNA sequencing reads,. (eprint) Nucleic Acids Research 47(8):e47 (2019)
Registry entries: Bio.tools  Bioconda 
r-cran-alakazam
analisi di linee clonali e diversità per immunoglobuline
Versions of package r-cran-alakazam
ReleaseVersionArchitectures
bookworm1.2.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
experimental1.3.0-2~0exp0amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye1.1.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.2.11-1amd64,arm64,armhf,i386
sid1.3.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.3.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Alakazam fa parte dell'infrastruttura di analisi Immcantation per AIRR-seq (Adaptive Immune Receptor Repertoire sequencing) e fornisce un insieme di strumenti per investigare linee clonali, diversità, uso di geni e altre proprietà a livello di repertorio dei recettori di linfociti, con particolare attenzione al sequenziamento ad alte prestazioni di immunoglobuline (Ig).

Alakazam ha 5 scopi principali:

  • Fornire funzionalità di base per altri pacchetti R nell'infrastruttura Immcantation. Ciò include compiti comuni come I/O su file, manipolazione di base di sequenze di DNA e interazione con segmenti V(D)J e annotazioni di geni.
  • Fornire un'interfaccia R per interagire con l'output delle suite di strumenti pRESTO e Change-O.
  • Effettuare ricostruzioni di linee su popolazioni clonali di sequenze di Ig e analizzare la topologia degli alberi delle linee risultanti.
  • Effettuare analisi di abbondanza e diversità clonali su repertori linfocitari.
  • Effettuare analisi di proprietà fisico-chimiche delle sequenze dei recettori linfocitari.
Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data. (eprint) 31(20):3356–3358 (2017)
r-cran-shazam
Immunoglobulin Somatic Hypermutation Analysis
Versions of package r-cran-shazam
ReleaseVersionArchitectures
trixie1.2.0-1all
bookworm1.1.2-1all
bullseye1.0.2-1all
buster0.1.11-1all
sid1.2.0-1all
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Provides a computational framework for Bayesian estimation of antigen-driven selection in immunoglobulin (Ig) sequences, providing an intuitive means of analyzing selection by quantifying the degree of selective pressure. Also provides tools to profile mutations in Ig sequences, build models of somatic hypermutation (SHM) in Ig sequences, and make model-dependent distance comparisons of Ig repertoires.

SHazaM is part of the Immcantation analysis framework for Adaptive Immune Receptor Repertoire sequencing (AIRR-seq) and provides tools for advanced analysis of somatic hypermutation (SHM) in immunoglobulin (Ig) sequences. Shazam focuses on the following analysis topics:

  • Quantification of mutational load SHazaM includes methods for determine the rate of observed and expected mutations under various criteria. Mutational profiling criteria include rates under SHM targeting models, mutations specific to CDR and FWR regions, and physicochemical property dependent substitution rates.
  • Statistical models of SHM targeting patterns Models of SHM may be divided into two independent components: 1) a mutability model that defines where mutations occur and 2) a nucleotide substitution model that defines the resulting mutation. Collectively these two components define an SHM targeting model. SHazaM provides empirically derived SHM 5-mer context mutation models for both humans and mice, as well tools to build SHM targeting models from data.
  • Analysis of selection pressure using BASELINe The Bayesian Estimation of Antigen-driven Selection in Ig Sequences (BASELINe) method is a novel method for quantifying antigen-driven selection in high-throughput Ig sequence data. BASELINe uses SHM targeting models can be used to estimate the null distribution of expected mutation frequencies, and provide measures of selection pressure informed by known AID targeting biases.
  • Model-dependent distance calculations SHazaM provides methods to compute evolutionary distances between sequences or set of sequences based on SHM targeting models. This information is particularly useful in understanding and defining clonal relationships.
Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data.. (PubMed,eprint) Bioinformatics 31(20):3356-3358 (2015)
Registry entries: Bioconda 
r-cran-tcr
Advanced Data Analysis of Immune Receptor Repertoires
Versions of package r-cran-tcr
ReleaseVersionArchitectures
bullseye2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.2.3-1amd64,arm64,armhf,i386
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Cells of the immune system are the grand exception to the rule that all cells of an individuum have (mostly exact) copies of the same DNA. B cells (which produce antibodies) and T cells (which communicate with cells) however have a section of their DNA with genes of the groups V, D and J that are reorganised within the genomic DNA to provide the flexibility to deal with yet unknown pathogens.

This package provides a platform for the advanced analysis of T cell receptor repertoire data and its visualisations.

Caveat: This package is soon to be replaced by http://github.com/immunomind/immunarch which is not yet available as a Debian package.

Please cite: Vadim I. Nazarov, Mikhail V. Pogorelyy, Ekaterina A. Komech, Ivan V. Zvyagin, Dmitry A. Bolotin, Mikhail Shugay, Dmitry M. Chudakov, Yury B. Lebedev and Ilgar Z. Mamedov: tcR: an R package for T cell receptor repertoire advanced data analysis. (eprint) BMC Bioinformatics 16:175 (2015)
Registry entries: Bio.tools  Bioconda 
r-cran-tigger
Infers new Immunoglobulin alleles from Rep-Seq Data
Versions of package r-cran-tigger
ReleaseVersionArchitectures
buster0.3.1-1all
sid1.1.0-1all
trixie1.1.0-1all
bullseye1.0.0-1all
bookworm1.0.1-1all
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Summary: Infers the V genotype of an individual from immunoglobulin (Ig) repertoire-sequencing (Rep-Seq) data, including detection of any novel alleles. This information is then used to correct existing V allele calls from among the sample sequences.

High-throughput sequencing of B cell immunoglobulin receptors is providing unprecedented insight into adaptive immunity. A key step in analyzing these data involves assignment of the germline V, D and J gene segment alleles that comprise each immunoglobulin sequence by matching them against a database of known V(D)J alleles. However, this process will fail for sequences that utilize previously undetected alleles, whose frequency in the population is unclear.

TIgGER is a computational method that significantly improves V(D)J allele assignments by first determining the complete set of gene segments carried by an individual (including novel alleles) from V(D)J-rearrange sequences. TIgGER can then infer a subject’s genotype from these sequences, and use this genotype to correct the initial V(D)J allele assignments.

The application of TIgGER continues to identify a surprisingly high frequency of novel alleles in humans, highlighting the critical need for this approach. TIgGER, however, can and has been used with data from other species.

Core Abilities:

  • Detecting novel alleles
  • Inferring a subject’s genotype
  • Correcting preliminary allele calls

Required Input

  • A table of sequences from a single individual, with columns containing the following:
  • V(D)J-rearranged nucleotide sequence (in IMGT-gapped format)
  • Preliminary V allele calls
  • Preliminary J allele calls
  • Length of the junction region
  • Germline Ig sequences in IMGT-gapped fasta format (e.g., as those downloaded from IMGT/GENE-DB)

The former can be created through the use of IMGT/HighV-QUEST and Change-O.

Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data. (eprint) 31(20):3356–3358 (2017)
Registry entries: Bioconda 
rna-star
allineatore universale e ultraveloce di sequenziamento di RNA
Versions of package rna-star
ReleaseVersionArchitectures
sid2.7.11b+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64
trixie2.7.11b+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64
stretch-backports2.7.0a+dfsg-1~bpo9+1amd64,arm64,mips64el,ppc64el
buster2.7.0a+dfsg-1amd64,arm64
stretch2.5.2b+dfsg-1amd64,arm64,mips64el,ppc64el
bookworm2.7.10b+dfsg-2amd64,arm64,mips64el,ppc64el
bullseye2.7.8a+dfsg-2amd64,arm64,mips64el,ppc64el
Popcon: 6 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Software STAR (Spliced Transcripts Alignment to a Reference) basato su un algoritmo di allineamento per RNA-seq mai descritto prima, che usa la ricerca di seed mappabili sequenziali massimi in array di suffissi non compressi seguita da raggruppamento in cluster dei seed e procedure di cucitura. STAR supera in prestazioni altri strumenti di allineamento di un fattore maggiore di 50 in velocità di mappatura, facendo l'allineamento con il genoma umano di 550 milioni di letture a terminali accoppiati 2 x 76 pb all'ora su un modesto server con 12 core, al contempo migliorando la sensibilità e la precisione dell'allineamento. In aggiunta a rilevazioni de novo senza bias di giunzioni canoniche, STAR può anche scoprire trascritti chimerici (fusione) e splice non canonici, ed è anche in grado di mappare sequenze di RNA a sequenza intera. Usando il sequenziamento Roche 454 di ampliconi PCR di trascrizione inversa, gli autori hanno validato sperimentalmente 1960 nuove giunzioni di splice intergeniche con un tasso di successo dell'80-90%, confermando l'elevata precisione della strategia di mappatura di STAR.

The package is enhanced by the following packages: multiqc
Please cite: Alexander Dobin, Carrie A. Davis, Felix Schlesinger, Jorg Drenkow, Chris Zaleski, Sonali Jha, Philippe Batut, Mark Chaisson and Thomas R. Gingeras: STAR: ultrafast universal RNA-seq aligner. (PubMed,eprint) Bioinformatics 29(1):15-21 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
rtax
classificazione di letture di sequenze di geni per RNA ribosomiale 16S
Versions of package rtax
ReleaseVersionArchitectures
bookworm0.984-8all
bullseye0.984-7all
buster0.984-6all
stretch0.984-5all
jessie0.984-2all
trixie0.984-8all
sid0.984-8all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Le tecnologie a letture corte per la profilazione di comunità microbiche sono sempre più popolari, eppure le tecniche passate per assegnazioni tassonomiche a letture paired-end hanno prestazioni non buone. RTAX fornisce assegnazioni tassonomiche rapide di letture paired-end che usano un algoritmo di consenso.

Please cite: David A. W. Soergel, Neelendu Dey, Rob Knight and Steven E. Brenner: Selection of primers for optimal taxonomic classification of environmental 16S rRNA gene sequences. (PubMed,eprint) The ISME Journal 6:1440–1444 (2012)
salmon
wicked-fast transcript quantification from RNA-seq data
Versions of package salmon
ReleaseVersionArchitectures
buster0.12.0+ds1-1amd64
bullseye1.4.0+ds1-1amd64,arm64
stretch0.7.2+ds1-2amd64
bookworm1.10.1+ds1-1amd64,arm64
trixie1.10.2+ds1-1amd64,arm64
sid1.10.2+ds1-1amd64,arm64
upstream1.10.3
Popcon: 1 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Salmon is a wicked-fast program to produce a highly-accurate, transcript-level quantification estimates from RNA-seq data. Salmon achieves is accuracy and speed via a number of different innovations, including the use of lightweight alignments (accurate but fast-to-compute proxies for traditional read alignments) and massively-parallel stochastic collapsed variational inference. The result is a versatile tool that fits nicely into many different pipelines. For example, you can choose to make use of the lightweight alignments by providing Salmon with raw sequencing reads, or, if it is more convenient, you can provide Salmon with regular alignments (e.g. computed with your favorite aligner), and it will use the same wicked-fast, state-of-the-art inference algorithm to estimate transcript-level abundances for your experiment.

The package is enhanced by the following packages: multiqc
Please cite: Rob Patro, Geet Duggal, Michael I Love, Rafael A Irizarry and Carl Kingsford: Salmon provides fast and bias-aware quantification of transcript expression. (eprint) Nature Methods 14(4):417-419 (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sambamba
strumenti per lavorare con dati SAM/BAM
Versions of package sambamba
ReleaseVersionArchitectures
trixie1.0.1+dfsg-2amd64,arm64,riscv64
bookworm1.0+dfsg-1amd64,arm64
bullseye0.8.0-1amd64,arm64
sid1.0.1+dfsg-2amd64,arm64,riscv64
Popcon: 5 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Sambamba si posiziona come alternativa performante a samtools e fornisce strumenti per:

  • filtraggio potente con sambamba view --filter;
  • unione di intestazioni in stile Picard nello strumento merge;
  • opzionale per operazioni su interi BAM;
  • copia veloce di una regione su un nuovo file con lo strumento slice;
  • marcatura/rimozione di duplicati usando il criterio Picard.
Please cite: Artem Tarasov, Albert J. Vilella, Edwin Cuppen, Isaac J. Nijman and Pjotr Prins: Sambamba: fast processing of NGS alignment formats. (PubMed,eprint) Bioinformatics 31(12):2032-2034 (2015)
Registry entries: Bio.tools  Bioconda 
samblaster
marks duplicates, extracts discordant/split reads
Versions of package samblaster
ReleaseVersionArchitectures
bullseye0.1.26-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.26-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.1.26-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.24-2amd64,arm64,armhf,i386
sid0.1.26-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Current "next-generation" sequencing technologies cannot tell what exact sequence they will be reading. They take what is available. And if some sequences are read very often, then this needs some extra biomedical thinking. The genome could for instance be duplicated.

samblaster is a fast and flexible program for marking duplicates in read-id grouped paired-end SAM files. It can also optionally output discordant read pairs and/or split read mappings to separate SAM files, and/or unmapped/clipped reads to a separate FASTQ file. When marking duplicates, samblaster will require approximately 20MB of memory per 1M read pairs.

The package is enhanced by the following packages: multiqc
Please cite: Gregory G. Faust and Ira M. Hall: SAMBLASTER: fast duplicate marking and structural variant read extraction. (PubMed,eprint) Bioinformatics 30(17):2503-2505 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
samtools
elaborazioni di allineamenti di sequenze nei formati SAM, BAM e CRAM
Versions of package samtools
ReleaseVersionArchitectures
buster1.9-4amd64,arm64,armhf
jessie0.1.19-1amd64,armhf,i386
trixie1.20-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.3.1-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
stretch-backports1.7-2~bpo9+1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
sid1.20-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.16.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.21
Debtags of package samtools:
fieldbiology
interfacecommandline
networkclient
roleprogram
scopeutility
uitoolkitncurses
useanalysing, calculating, filtering
works-withbiological-sequence
Popcon: 53 users (29 upd.)*
Newer upstream!
License: DFSG free
Git

Samtools è un insieme di utilità che manipolano allineamenti di sequenze di nucleotidi nel formato binario BAM. Importa ed esporta nei formati SAM (Sequence Alignment/Map - allineamento/mappa di sequenze) e CRAM ASCII, effettua ordinamenti, unioni e indicizzazioni e permette di rintracciare letture in qualsiasi regione in modo veloce. È stato progettato per funzionare su flussi di dati ed è in grado di aprire un file BAM o CRAM (non SAM) su un server FTP o HTTP remoto.

The package is enhanced by the following packages: libbio-samtools-perl multiqc
Please cite: Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis, Richard Durbin and 1000 Genome Project Data Processing Subgroup: The Sequence Alignment/Map (SAM) Format and SAMtools. (PubMed,eprint) Bioinformatics 25(16):2078-2079 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package samtools
scoary
studi di associazione per intero pangenoma
Versions of package scoary
ReleaseVersionArchitectures
stretch-backports1.6.16-1~bpo9+1all
trixie1.6.16-9all
bookworm1.6.16-5all
bullseye1.6.16-2all
buster1.6.16-1all
sid1.6.16-9all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Scoary è progettato per prendere il file gene_presence_absence.csv da Roary e un file dei tratti creato dall'utente e calcolare le associazioni tra tutti i geni nel genoma accessorio e i tratti. Produce un elenco dei geni ordinato per forza di associazione per tratto.

Please cite: Ola Brynildsrud, Jon Bohlin, Lonneke Scheffer and Vegard Eldholm: Rapid scoring of genes in microbial pan-genome-wide association studies with Scoary. (PubMed,eprint) Genome Biology 17(238) (2016)
Registry entries: Bio.tools  Bioconda 
scythe
strumento bayesiano di taglio di adattatori per letture di sequenze
Versions of package scythe
ReleaseVersionArchitectures
buster0.994+git20141017.20d3cff-1amd64,arm64,armhf,i386
bullseye0.994+git20141017.20d3cff-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.994+git20141017.20d3cff-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.994+git20141017.20d3cff-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.994+git20141017.20d3cff-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.994-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Scythe utilizza un approccio bayesiano naive per classificare sottostringhe contaminanti in letture di sequenze. Considera le informazioni sulla qualità e ciò lo può rendere robusto nella scelta di adattatori dell'estremità 3', che spesso includono basi con scarsa qualità.

Registry entries: SciCrunch 
seqprep
rimozione di adattatori e/o unione di letture accoppiate di sequenze di DNA con sovrapposizioni
Versions of package seqprep
ReleaseVersionArchitectures
trixie1.3.2-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.3.2-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.3.2-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3.2-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.3.2-3amd64,arm64,armhf,i386
stretch1.3.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SeqPrep è un programma per unire letture Illumina con estremità accoppiate che si sovrappongono in un'unica lettura più lunga. Può anche essere usato per la sua funzionalità di taglio dell'adattatore, senza fare alcuna sovrapposizione delle estremità accoppiate. Quando è presente una sequenza adattatore, ciò significa che le due letture devono sovrapporsi (nella maggior parte dei casi) perciò vengono forzatamente unite. Quando le letture non hanno una sequenza adattatore devono essere trattate con cautela durante l'unione, perciò viene utilizzato un approccio molto più specifico. I parametri predefiniti sono stati scelti pensando alla specificità, perciò possono essere usati con insiemi di dati dove ci si aspetta di trovare molte poche letture con sovrapposizioni. Tuttavia la cosa più sicura è sempre quella di riservare la procedura di sovrapposizione per gli insiemi di dati per i quali si hanno conoscenze pregresse sul fatto che una porzione significativa delle sequenze ha delle sovrapposizioni.

Registry entries: Bio.tools  SciCrunch  Bioconda 
seqtk
strumento veloce e leggero per elaborare sequenze in formato FASTA o FASTQ
Versions of package seqtk
ReleaseVersionArchitectures
buster1.3-1amd64,arm64,armhf,i386
bookworm1.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0-1amd64,armel,armhf,i386
stretch1.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.4-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.4-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Attualmente, seqtk gestisce il taglio basato sulla qualità con l'algoritmo phred, convertendo fastq in fasta, sequenze complementari inverse, l'estrazione o il mascheramento di sottosequenze in regioni date in un file BED/elenco di nomi e altro. Contiene un modulo di sottocampionamento per campionare esattamente n sequenze o una frazione di sequenze.

seqtk gestisce file di input sia fasta sia fastq, che possono opzionalmente essere compressi con gzip.

Registry entries: Bio.tools  Bioconda 
Screenshots of package seqtk
sga
assemblatore de novo di genoma che usa grafi di stringhe
Versions of package sga
ReleaseVersionArchitectures
trixie0.10.15-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid0.10.15-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm0.10.15-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster0.10.15-4amd64,arm64
bullseye0.10.15-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
stretch0.10.15-2amd64,arm64,mips64el,ppc64el
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

L'obiettivo principale di SGA è di essere molto efficiente in termini di memoria, il che è raggiunto usando una rappresentazione compressa delle letture di sequenze di DNA.

SGA è un assemblatore de novo per letture di sequenze di DNA. È basato sulla formulazione di assemblaggio di grafi di stringhe di Gene Myers e usa l'FM-index/trasformata di Burrows-Wheeler per trovare in maniera efficiente le sovrapposizioni tra letture di sequenze.

Please cite: Jared T. Simpson and Richard Durbin: Efficient de novo assembly of large genomes using compressed data structures.. (PubMed,eprint) Genome Res 22(3):549-555 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sickle
windowed adaptive trimming tool for FASTQ files using quality
Versions of package sickle
ReleaseVersionArchitectures
bookworm1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.33+git20150314.f3d6ae3-1amd64,arm64,armhf,i386
stretch1.33-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Most modern sequencing technologies produce reads that have deteriorating quality towards the 3'-end. Incorrectly called bases here negatively impact assembles, mapping, and downstream bioinformatics analyses.

Sickle is a tool that uses sliding windows along with quality and length thresholds to determine when quality is sufficiently low to trim the 3'-end of reads. It will also discard reads based upon the length threshold. It takes the quality values and slides a window across them whose length is 0.1 times the length of the read. If this length is less than 1, then the window is set to be equal to the length of the read. Otherwise, the window slides along the quality values until the average quality in the window drops below the threshold. At that point the algorithm determines where in the window the drop occurs and cuts both the read and quality strings there. However, if the cut point is less than the minimum length threshold, then the read is discarded entirely.

Sickle supports four types of quality values: Illumina, Solexa, Phred, and Sanger. Note that the Solexa quality setting is an approximation (the actual conversion is a non-linear transformation). The end approximation is close.

Sickle also supports gzipped file inputs.

The package is enhanced by the following packages: multiqc
Registry entries: Bio.tools  SciCrunch  Bioconda 
smalt
strumento per mappatura e allineamento di sequenze
Versions of package smalt
ReleaseVersionArchitectures
stretch0.7.6-6amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
bookworm0.7.6-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.7.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.7.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.7.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.7.6-8amd64,arm64,armhf
jessie0.7.6-4amd64,armhf,i386
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SMALT allinea in modo efficiente letture di sequenziamenti di DNA con un genoma di riferimento. Le letture da una vasta gamma di piattaforme di sequenziamento, per esempio Illumina, Roche-454, Ion Torrent, PacBio o ABI-Sanger, possono essere elaborate incluse letture accoppiate.

Il software utilizza un indice di hash perfetto di brevi parole (lunghezza < 20 nucleotidi), campionate a intervalli equidistanti lungo le sequenze genomiche di riferimento.

Per ogni lettura, i segmenti nel riferimento che potenzialmente corrispondono vengono identificati a partire da corrispondenze con "seed" nell'indice e successivamente vengono allineati con la lettura usando un algoritmo Smith-Waterman a bande.

Vengono riportati i migliori allineamenti con gap di ciascuna lettura, incluso un punteggio per l'affidabilità dell'allineamento migliore. L'utente può regolare il compromesso tra sensibilità e velocità, regolando la lunghezza e la spaziatura fra le parole di cui viene fatto l'hash.

È fornita una modalità per l'identificazione delle letture divise (chimere). È gestita l'esecuzione del programma in modalità multi-thread.

Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: This can be regarded as successor of ssaha2

This program is from the same author as ssaha2 and according to its author faster and more precise than ssaha2 (except for sequences > 2000bp).

smrtanalysis
suite software per sequenziamento in tempo reale di molecole singole
Versions of package smrtanalysis
ReleaseVersionArchitectures
bullseye0~20210111all
bookworm0~20210112all
sid0~20210112all
stretch0~20161126all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

SMRT® Analysis è una suite di software per bioinformatica potente e open source disponibile per l'analisi di dati di sequenziamento di DNA dalla tecnologia SMRT di Pacific Biosciences. Gli utenti possono scegliere tra una varietà di protocolli di analisi che utilizzano PacBio® e strumenti di terze parti. I protocolli di analisi includono assemblaggio de novo di genoma, mappatura cDNA, rilevazione delle modifiche delle basi del DNA e analisi di ampliconi lunghi per determinare sequenze di consenso con fase.

Questo è un metapacchetto che dipende dai componenti di SMRT Analysis.

Registry entries: Bio.tools  SciCrunch 
snap-aligner
programma scalabile per allineamento di nucleotidi
Versions of package snap-aligner
ReleaseVersionArchitectures
bullseye1.0.0+dfsg-2amd64,arm64,mips64el,ppc64el
sid2.0.3+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64
trixie2.0.3+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64
stretch1.0~beta.18+dfsg-1amd64,arm64,mips64el,ppc64el
bookworm2.0.2+dfsg-1amd64,arm64,mips64el,ppc64el
buster1.0~beta.18+dfsg-3amd64,arm64
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SNAP (Scalable Nucleotide Alignment Program) è un nuovo allineatore di sequenze che è da 3 a 20 volte più veloce, e altrettanto accurato, rispetto agli strumenti esistenti come BWA-mem, Bowtie2 e Novoalign. Gira su normali processori x86 e gestisce un ricco modello di errori che gli permette con poco sforzo di trovare corrispondenze per letture con più differenze rispetto a quelle di riferimento, di quanto non facciano altri strumenti. Questo dà a SNAP un tasso di errore fino a due volte inferiore agli strumenti esistenti (in certi casi) e gli permette di trovare corrispondenze in caso di mutazioni più ampie che essi potrebbero non trovare. Inoltre SNAP legge nativamente BAM, FASTQ o FASTQ compresso con gzip, e scrive nativamente SAM o BAM, con ordinamento incorporato, marcatura di duplicati e indicizzazione BAM.

Please cite: Matei Zaharia, William J. Bolosky, Kristal Curtis, Armando Fox, David Patterson, Scott Shenker, Ion Stoica, Richard M. Karp and Taylor Sittler: Faster and More Accurate Sequence Alignment with SNAP. (eprint) arXiv preprint arXiv:1111.5572 (2011)
Registry entries: SciCrunch 
sniffles
strumento per identificare varianti strutturali usando sequenziamento di terza generazione
Versions of package sniffles
ReleaseVersionArchitectures
bullseye1.0.12b+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.11+ds-1amd64,arm64,armhf,i386
stretch1.0.2+ds-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.2-1all
bookworm2.0.7-1all
sid2.2-1all
upstream2.5.1
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Sniffles è uno strumento per identificare varianti strutturali (SV) usando dati di sequenziamento di terza generazione come quelli delle piattaforme Pacific Biosciences o Oxford Nanopore. Rileva tutti i tipi di SV usando allineamenti di letture divise, regioni con elevata non corrispondenza e analisi di copertura come indizi.

Please cite: Fritz J. Sedlazeck, Philipp Rescheneder, Moritz Smolka, Han Fang, Maria Nattestad, Arndt von Haeseler and Michael Schatz: Accurate detection of complex structural variations using single molecule sequencing. (eprint) bioRxiv (2017)
Registry entries: Bio.tools  Bioconda 
snp-sites
codice binario per il pacchetto snp-sites
Versions of package snp-sites
ReleaseVersionArchitectures
bookworm2.5.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.3.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.5.0-1amd64,armel,armhf,i386
buster2.4.1-1amd64,arm64,armhf,i386
sid2.5.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.5.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.5.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Questo programma trova siti di polimorfismo a singolo nucleotide (SNP) da file di input di allineamenti multi-fasta (che possono essere compressi). Il suo output può essere in vari formati largamente usati (Multi Fasta Alignment, Vcf, phylip).

Il software è stato sviluppato al Wellcome Trust Sanger Institute.

Un polimorfismo a singolo nucleotide (SNP, pronunciato snip) è una variazione della sequenza di DNA che si verifica quando un singolo nucleotide, A, T, C o G, nel genoma (o un'altra sequenza condivisa) è differente nei membri di una specie biologica o in coppie di cromosomi. Per esempio, due frammenti di sequenze di DNA da individui diversi, AAGCCTA e AAGCTTA, contengono una differenza in un unico nucleotide. In questo caso ci sono due alleli. Quasi tutti i comuni SNP hanno due alleli.

Please cite: Andrew J. Page, Ben Taylor, Aidan J. Delaney, Jorge Soares, Torsten Seemann, Jacqueline A. Keane and Simon R. Harris: SNP-sites: rapid efficient extraction of SNPs from multi-FASTA alignments. (eprint) Microbial Genomics 2(4) (2016)
Topics: Genetic variation
Screenshots of package snp-sites
snpomatic
software per mappatura di letture corte veloce e stringente
Versions of package snpomatic
ReleaseVersionArchitectures
bookworm1.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0-4amd64,arm64,armhf,i386
bullseye1.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le tecnologie di sequenziamento ad alte prestazioni generano grandi quantità di letture corte. La mappatura di queste ultime in una sequenza di riferimento consuma grandi quantità di tempo di elaborazione e memoria, e gli errori di mappatura delle letture possono portare a allineamenti con rumore o non corretti.

SNP-o-matic è un software per mappatura di letture corte veloce e stringente. Gestisce una moltitudine di tipi e formati di output, per l'utilizzo nel filtraggio di letture, allineamenti, identificazione di genotipi sulla base di sequenze, riassemblaggio assistito di contigui, ecc.

Please cite: Heinrich Magnus Manske and Dominic P. Kwiatkowski: SNP-o-matic. (PubMed,eprint) Bioinformatics 25(18):2434-2435 (2009)
Registry entries: Bio.tools  Bioconda 
Topics: Genetic variation; Mapping
soapdenovo
metodo per assemblaggio di letture corte per costruire assemblati bozza de novo
Versions of package soapdenovo
ReleaseVersionArchitectures
bookworm1.05-6amd64
sid1.05-6amd64
buster1.05-5amd64
trixie1.05-6amd64
bullseye1.05-6amd64
stretch1.05-3amd64
jessie1.05-2amd64
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SOAPdenovo è un nuovo metodo per assemblaggio di sequenze corte che può creare una bozza di assemblaggio de novo per genomi di dimensioni come quelle umane. Il programma è specificamente progettato per assemblare sequenze corte Illumina GA.

Crea nuove opportunità per creare sequenze di riferimento ed effettuare analisi accurate di genomi inesplorati in un modo efficiente dal punto di vista dei costi.

Questa versione non è più mantenuta, considerare l'utilizzo di soapdenovo2.

Please cite: Ruiqiang Li, Hongmei Zhu, Jue Ruan, Wubin Qian, Xiaodong Fang, Zhongbin Shi, Yingrui Li, Shengting Li, Gao Shan, Karsten Kristiansen, Songgang Li, Huanming Yang, Jian Wang and Jun Wang: De novo assembly of human genomes with massively parallel short read sequencing. (PubMed,eprint) Genome Research 20(2):265-72 (2009)
Registry entries: Bio.tools  SciCrunch 
soapdenovo2
metodo per assemblaggio di letture corte per costruire assemblati bozza de novo
Versions of package soapdenovo2
ReleaseVersionArchitectures
buster241+dfsg-3amd64
jessie240+dfsg-2amd64
stretch240+dfsg1-2amd64
bullseye242+dfsg-1amd64
bookworm242+dfsg-3amd64
trixie242+dfsg-4amd64
sid242+dfsg-4amd64
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SOAPdenovo è un nuovo metodo per assemblaggio di sequenze corte che può creare una bozza di assemblaggio de novo per genomi di dimensioni come quelle umane. Il programma è specificamente progettato per assemblare sequenze corte Illumina GA.

Crea nuove opportunità per creare sequenze di riferimento ed effettuare analisi accurate di genomi inesplorati in un modo efficiente dal punto di vista dei costi.

Please cite: Ruibang Luo, Binghang Liu, Yinlong Xie, Zhenyu Li, Weihua Huang, Jianying Yuan, Guangzhu He, Yanxiang Chen, Qi Pan, Yunjie Liu, Jingbo Tang, Gengxiong Wu, Hao Zhang, Yujian Shi, Yong Liu, Chang Yu, Bo Wang, Yao Lu, Changlei Han, David W Cheung, Siu-Ming Yiu, Shaoliang Peng, Zhu Xiaoqian, Guangming Liu, Xiangke Liao, Yingrui Li, Huanming Yang, Jian Wang, Tak-Wah Lam and Jun Wang: SOAPdenovo2: an empirically improved memory-efficient short-read de novo assembler. Giga Science 1(1):18 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sortmerna
strumento per filtraggio, mappatura e scelta di OTU per letture NGS
Versions of package sortmerna
ReleaseVersionArchitectures
sid4.3.7-1amd64,i386
stretch2.1-1amd64,i386
buster2.1-3amd64,i386
bullseye2.1-5amd64,i386
trixie4.3.7-1amd64,i386
bookworm4.3.6-2amd64,i386
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SortMeRNA è uno strumento per analisi di sequenze biologiche per filtrare, mappare e scegliere OTU per letture NGS. L'algoritmo centrale è basato su seed approssimati e permette analisi veloci e sensibili di sequenze nucleotidiche. L'applicazione principale di SortMeRNA è filtrare rRNA da dati di metatrascrittomica. Applicazioni aggiuntive includono la scelta di OTU e assegnamenti tassonomici disponibili attraverso QIIME v1.9+ (http://qiime.org - v1.9.0-rc1). SortMeRNA prende come input un file di letture (in formato fasta o fastq) e uno o più file di database di rRNA, e suddivide gli rRNA e le letture scartate in due file specificati dall'utente. Opzionalmente può fornire allineamenti locali di alta qualità di letture rRNA rispetto al database di rRNA. SortMeRNA funziona con dati Illumina, 454, Ion Torrent e PacBio, e può produrre allineamenti SAM e simili a BLAST.

The package is enhanced by the following packages: multiqc
Please cite: Evguenia Kopylova, Laurent Noé and Hélène Touzet: SortMeRNA: fast and accurate filtering of ribosomal RNAs in metatranscriptomic data". (PubMed,eprint) Bioinformatics 28(24):3211-3217 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
spades
assemblatore di genomi per singola-cellula e insiemi di dati di isolati
Versions of package spades
ReleaseVersionArchitectures
buster3.13.0+dfsg2-2amd64
sid3.15.5+dfsg-7amd64
trixie3.15.5+dfsg-7amd64
bookworm3.15.5+dfsg-2amd64
experimental4.0.0+dfsg1-1amd64
bullseye3.13.1+dfsg-2amd64
stretch3.9.1+dfsg-1amd64
stretch-backports-sloppy3.13.1+dfsg-2~bpo9+1amd64
stretch-backports3.12.0+dfsg-1~bpo9+1amd64
upstream4.0.0
Popcon: 2 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

L'assemblatore di genomi SPAdes - St. Petersburg è pensato per assemblaggi di isolati standard e di MDA batterici da singola cellula. Funziona con letture Illumina o IonTorrent ed è in grado di fornire assemblati ibridi usando letture PacBio e Sanger. Si possono anche fornire contigui aggiuntivi che verranno usati come letture lunghe.

Questo pacchetto fornisce le seguenti catene di elaborazione aggiuntive:

  • metaSPAdes – catena per insiemi di dati metagenomici
  • plasmidSPAdes – catena per estrarre e assemblare plasmidi da insiemi di dati WGS
  • metaplasmidSPAdes – catena per estrarre e assemblare plasmidi da insiemi di dati metagenomici
  • rnaSPAdes – assemblatore de novo di trascrittomi da dati RNA-Seq
  • truSPAdes – modulo per assemblamento di barcode TruSeq
  • biosyntheticSPAdes – modulo per assemblamento di cluster di geni per biosintesi con letture a estremità accoppiate

SPAdes fornisce diversi binari autonomi con un'interfaccia a riga di comando relativamente semplice: conteggio di k-meri (spades-kmercounter), costruzione di grafi di assemblamento (spades-gbuilder) e allineatore da letture lunghe a grafo (spades-gmapper).

Please cite: Anton Bankevich, Sergey Nurk, Dmitry Antipov, Alexey A. Gurevich, Mikhail Dvorkin, Alexander S. Kulikov, Valery M. Lesin, Sergey I. Nikolenko, Son Pham, Andrey D. Prjibelski, Alexey V. Pyshkin, Alexander V. Sirotkin, Nikolay Vyahhi, Glenn Tesler, Max A. Alekseyev and Pavel A. Pevzner: SPAdes: A New Genome Assembly Algorithm and Its Applications to Single-Cell Sequencing. (PubMed,eprint) Journal of Computational Biology 19(5):455-477 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sprai
single-pass sequencing read accuracy improver
Versions of package sprai
ReleaseVersionArchitectures
trixie0.9.9.23+dfsg1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.9.9.23+dfsg-2amd64,arm64,armhf,i386
stretch0.9.9.22+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.9.9.23+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.9.9.23+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.9.9.23+dfsg1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Sprai is a tool to correct sequencing errors in single-pass reads for de novo assembly. It is originally designed for correcting sequencing errors in single-molecule DNA sequencing reads, especially in Continuous Long Reads (CLRs) generated by PacBio RS sequencers. The goal of Sprai is not maximizing the accuracy of error-corrected reads. Instead, Sprai aims at maximizing the continuity (i.e., N50 contig length) of assembled contigs after error correction.

sra-toolkit
utilità per Sequence Read Archive di NCBI
Versions of package sra-toolkit
ReleaseVersionArchitectures
bookworm3.0.3+dfsg-6~deb12u1amd64,arm64
jessie2.3.5-2+dfsg-1amd64,i386
stretch2.8.1-2+dfsg-2amd64,i386
buster2.9.3+dfsg-1amd64
bullseye2.10.9+dfsg-2amd64
trixie3.0.3+dfsg-9amd64,arm64
sid3.0.3+dfsg-9arm64
experimental3.0.9+dfsg-6amd64,arm64
sid3.0.9+dfsg-7amd64
upstream3.1.1
Popcon: 11 users (7 upd.)*
Newer upstream!
License: DFSG free
Git

Strumenti per leggere l'archivio SRA, generalmente convertendo singole corse in alcuni formati comunemente usati come fastq.

In questo rilascio sono forniti gli strumenti per dump testuali "sra-dump" e "vbd-dump", per aiutare nell'ispezione a vista. È probabile che l'effettiva formattazione del loro output venga in futuro modificata in una rappresentazione più stringente e formalizzata. NON FARE AFFIDAMENTO SUL FORMATO DI OUTPUT VISTO IN QUESTO RILASCIO.

Altri strumenti distribuiti in questo pacchetto:

 abi-dump, abi-load
 align-info
 bam-load
 cache-mgr
 cg-load
 copycat
 fasterq-dump
 fastq-dump, fastq-load
 helicos-load
 illumina-dump, illumina-load
 kar
 kdbmeta
 latf-load
 pacbio-load
 prefetch
 rcexplain
 remote-fuser
 sff-dump, sff-load
 sra-pileup, sra-sort, sra-stat, srapath
 srf-load
 test-sra
 vdb-config, vdb-copy, vdb-decrypt, vdb-encrypt, vdb-get, vdb-lock,
 vdb-passwd, vdb-unlock, vdb-validate

Le informazioni dell'"Aiuto" verranno migliorate nei prossimi rilasci e le opzioni per gli strumenti verranno standardizzate tra gli insiemi. Ulteriore documentazione verrà anche fornita sul sito web dell'NCBI.

Nel prossimo rilascio le opzioni per gli strumenti potrebbero essere modificate. La versione 1 delle opzioni per gli strumenti continuerà ad essere gestita ovunque sia possibile, per preservare il funzionamento degli script esistenti.

Please cite: Rasko Leinonen, Ruth Akhtar, Ewan Birney, James Bonfield, Lawrence Bower, Matt Corbett, Ying Cheng, Fehmi Demiralp, Nadeem Faruque, Neil Goodgame, Richard Gibson, Gemma Hoad, Christopher Hunter, Mikyung Jang, Steven Leonard, Quan Lin, Rodrigo Lopez, Michael Maguire, Hamish McWilliam, Sheila Plaister, Rajesh Radhakrishnan, Siamak Sobhany, Guy Slater, Petra Ten Hoopen, Franck Valentin, Robert Vaughan, Vadim Zalunin, Daniel Zerbino and Guy Cochrane: Improvements to services at the European Nucleotide Archive. (PubMed,eprint) Nucleic Acids Research 38(Database issue):D39-45 (2010)
Registry entries: Bio.tools  Bioconda 
srst2
tipizzazione di sequenze di letture corte per batteri patogeni
Versions of package srst2
ReleaseVersionArchitectures
trixie0.2.0-12amd64,arm64,mips64el,ppc64el,riscv64
stretch0.2.0-4amd64
buster0.2.0-6amd64
bullseye0.2.0-8amd64,arm64,mips64el,ppc64el
bookworm0.2.0-9amd64,arm64,mips64el,ppc64el
sid0.2.0-12amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questo programma è progettato per prendere dati di sequenziamento Illumina, un database MLST e/o un database di sequenze geniche (es. geni di resistenza, geni di virulenza, ecc.) e riporta la presenza di ST o di geni di riferimento.

Please cite: Michael Inouye, Harriet Dashnow, Lesley-Ann Raven, Mark B Schultz, Bernard J Pope, Takehiro Tomita, Justin Zobel and Kathryn E Holt: SRST2: Rapid genomic surveillance for public health and hospital microbiology labs. (PubMed,eprint) Genome Medicine 6(11):90 (2014)
Registry entries: Bioconda 
ssake
applicazione genomica per assemblare milioni di cortissime sequenze di DNA
Versions of package ssake
ReleaseVersionArchitectures
jessie3.8.2-1all
sid4.0.1-2all
trixie4.0.1-2all
bookworm4.0.1-1all
bullseye4.0-3all
buster4.0-2all
stretch3.8.4-1all
Debtags of package ssake:
biologynuceleic-acids
fieldbiology
interfaceshell
roleprogram
scopeutility
useanalysing
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SSAKE (Short Sequence Assembly by K-mer search and 3′ read Extension, assemblaggio di sequenze corte con ricerca di K-meri ed estensione per lettura 3') è un'applicazione genomica per assemblare in modo aggressivo milioni di corte sequenze di nucleotidi cercando progressivamente k-meri all'estremità 3' perfetti usando un albero di prefissi di DNA. SSAKE è progettato per aiutare a sfruttare le informazioni provenienti dalla lettura di corte sequenze riunendole in maniera stringente in frammenti continui che possono essere usati per caratterizzare innovativi target di sequenziamento.

Please cite: Rene L. Warren, Granger G. Sutton, Steven J. M. Jones and Robert A. Holt: Assembling millions of short DNA sequences using SSAKE. (PubMed,eprint) Bioinformatics 23(4):500-501 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
stacks
pipeline for building loci from short-read DNA sequences
Versions of package stacks
ReleaseVersionArchitectures
buster2.2+dfsg-1amd64,arm64,armhf
sid2.68+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.62+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.55+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.44-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
trixie2.68+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Stacks is a software pipeline for building loci from short-read sequences, such as those generated on the Illumina platform. Stacks was developed to work with restriction enzyme-based data, such as RAD-seq, for the purpose of building genetic maps and conducting population genomics and phylogeography.

Note that this package installs Stacks such that all commands must be run as: $ stacks

The package is enhanced by the following packages: multiqc
Please cite: Julian Catchen, Paul A. Hohenlohe, Susan Bassham, Angel Amores and William A. Cresko: Stacks: an analysis tool set for population genomics. (PubMed) Molecular Ecology 22(11):3124-40 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
stringtie
assemble short RNAseq reads to transcripts
Versions of package stringtie
ReleaseVersionArchitectures
trixie2.2.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.2.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.2.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.1.4+ds-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream2.2.3
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

The abundance of transcripts in a human tissue sample can be determined by RNA sequencing. The exact sequence sampled may be random, depending on the technology used. And it may be short, i.e. shorter than the transcript. At some point, many shorter reads need to be assembled to the model the complete transcripts.

StringTie knows how to assemble of RNA-Seq into potential transcripts without the need of a reference genome and provides a quantification also of the splice variants.

Please cite: Mihaela Pertea, Geo M. Pertea, Corina .M. Antonescu, Tsung-Cheng Chang, Joshua T. Mendell and Steven L. Salzberg: StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology 33:290–295 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
subread
toolkit per elaborare dati di sequenziamento di nuova generazione
Versions of package subread
ReleaseVersionArchitectures
stretch1.5.1+dfsg-4amd64,arm64,armel,armhf,i386,ppc64el
sid2.0.7+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie2.0.7+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm2.0.3+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
bullseye2.0.1+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
buster-backports2.0.0+dfsg-1~bpo10+1amd64,arm64,armel,armhf,i386,ppc64el
buster1.6.3+dfsg-1amd64,arm64,armhf,i386
upstream2.0.8
Popcon: 7 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

L'allineatore Subread può essere utilizzato per allineare sia letture di sequenze gDNA che RNA. L'allineatore Subjunc è stato specificatamente progettato per rilevare giunzioni esone-esone. Per fare la mappa di letture di sequenze di RNA, Subread esegue allineamenti locali e Subjunc esegue allineamenti globali.

Please cite: Yang Lian, Gordon K. Smyth and Wei Shi: The R package Rsubread is easier, faster, cheaper and better for alignment and quantification of RNA sequencing reads. (PubMed) Nucleic Acids Research 47(8):e47-e47 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sumaclust
raggruppamento veloce in cluster di sequenze genomiche
Versions of package sumaclust
ReleaseVersionArchitectures
sid1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.36+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.31-2amd64,arm64,armhf,i386
stretch1.0.20-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Con lo sviluppo del sequenziamento di prossima generazione, sono necessari strumenti efficienti per gestire milioni di sequenze in un tempo ragionevole. Sumaclust è un programma sviluppato da LECA; mira a raggruppare sequenze in cluster in un modo che sia veloce e corretto al tempo stesso. Questo strumento è stato sviluppato per essere adattato ai tipi di dati generati dal DNA metabarcoding, cioè marcatori corti, interamente sequenziati. Sumaclust raggruppa le sequenze in cluster usando lo stesso algoritmo di clustering di UCLUST e CD-HIT. Questo algoritmo è utile principalmente per rilevare sequenze "erronee" create durante i protocolli di amplificazione e sequenziamento e che derivano da sequenze "vere".

Registry entries: Bioconda 
sumatra
confronto e raggruppamento in cluster di sequenze veloci ed esatti
Versions of package sumatra
ReleaseVersionArchitectures
buster1.0.31-2amd64,arm64,armhf,i386
stretch1.0.20-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.36+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Con lo sviluppo del sequenziamento di prossima generazione, sono necessari strumenti efficienti per gestire milioni di sequenze in quantità di tempo ragionevoli. Sumatra è un programma sviluppato dal LECA. Sumatra mira a confrontare sequenze in un modo che sia veloce e al contempo esatto. Questo strumento è stato sviluppato per essere adattato al tipo di dati generati da metabarcoding di DNA, cioè marcatori corti interamente sequenziati. Sumatra calcola i punteggi di allineamenti a coppie per un insieme di dati * tra due insiemi di dati, con la possibilità di specificare una soglia di similarità, per cui sequenze che hanno una similarità al di sotto di essa non vengono riportate. L'output può quindi passare attraverso un processo di classificazione con programmi quali MCL e MOTHUR.

Registry entries: SciCrunch 
tabix
indicizzatore generico per file di posizioni del genoma delimitate da TAB
Versions of package tabix
ReleaseVersionArchitectures
jessie0.2.6-2armhf
bullseye1.11-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.1-1amd64,armel,i386
stretch1.3.2-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
stretch-backports1.7-2~bpo9+1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
buster1.9-12~deb10u1amd64,arm64,armhf,i386
experimental1.21+ds-0+exp1amd64,arm64
sid1.20+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.20+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.16+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.21
Debtags of package tabix:
roleprogram
works-with-formathtml
Popcon: 24 users (23 upd.)*
Newer upstream!
License: DFSG free
Git

Tabix indicizza i file in cui alcune colonne indicano coordinate di sequenze: nome (solitamente un cromosoma), inizio e fine. Il file di dati di input deve essere ordinato in base alla posizione e compresso con bgzip (fornito in questo pacchetto), che ha un'interfaccia simile a gzip. Dopo l'indicizzazione, tabix è in grado di recuperare velocemente righe di dati in base alle coordinate cromosomiche. Il veloce recupero dei dati funziona anche via rete se viene fornito un URI come nome di file.

Questo pacchetto è compilato dai sorgenti di HTSlib e fornisce gli strumenti bgzip, htsfile e tabix.

Please cite: Heng Li: Tabix: fast retrieval of sequence features from generic TAB-delimited files. (PubMed,eprint) Bioinformatics 27(5):718-719 (2011)
Registry entries: Bio.tools  Bioconda 
Screenshots of package tabix
transrate-tools
ausilio per transrate
Versions of package transrate-tools
ReleaseVersionArchitectures
bullseye1.0.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.0-2amd64,arm64,armhf,i386
stretch1.0.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.0.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Transrate è una libreria e uno strumento a riga di comando per la valutazione della qualità di assemblati di trascrittomi de-novo.

Questo pacchetto fornisce strumenti a riga di comando usati da transrate per elaborare file BAM.

Please cite: Richard Smith-Unna, Chris Boursnell, Rob Patro, Julian M. Hibberd and Steven Kelly: TransRate: reference-free quality assessment of de novo transcriptome assemblies.. (PubMed,eprint) Genome Research 26(8):1134-1144 (2016)
Registry entries: Bioconda 
trimmomatic
strumento flessibile per il taglio di letture per i dati NGS di Illumina
Versions of package trimmomatic
ReleaseVersionArchitectures
trixie0.39+dfsg-2all
sid0.39+dfsg-2all
buster0.38+dfsg-1all
bullseye0.39+dfsg-2all
bookworm0.39+dfsg-2all
jessie0.32+dfsg-4all
stretch0.36+dfsg-1all
Popcon: 9 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

Trimmomatic effettua una varietà di utili compiti di ritaglio per i dati Illumina a terminali accoppiati e singoli. La selezione dei passi di ritaglio e i loro parametri associati sono forniti sulla riga di comando.

I passi attuali di ritaglio sono:

  • ILLUMINACLIP: taglia l'adattatore e altre sequenze specifiche di Illumina dalla lettura;
  • SLIDINGWINDOW: effettua un ritaglio a finestra mobile, tagliando una volta che la qualità media all'interno della finestra scende al di sotto di una soglia;
  • LEADING: taglia basi dall'inizio di una lettura, se al di sotto di una soglia di qualità;
  • TRAILING: taglia basi dalla fine di una lettura, se al di sotto di una soglia di qualità;
  • CROP: taglia la lettura ad una lunghezza specificata;
  • HEADCROP: taglia il numero specificato di basi dall'inizio di una lettura;
  • MINLEGHT: elimina la lettura se è al di sotto di una lunghezza specificata;
  • TOPHRED33: converte punteggi di qualità in Phred-33;
  • TOPHRED64: converte punteggi di qualità in Phred-64. Funziona con FASTQ (usando punteggi di qualità Phred+33 o Phred+64, a seconda della pipeline Illumina usata), sia non compresso sia compresso con gzip. L'uso del formato gzip viene determinato sulla base dell'estensione .gz.
The package is enhanced by the following packages: multiqc
Please cite: A.M. Bolger, M. Lohse and B. Usadel: Trimmomatic: a flexible trimmer for Illumina sequence data. (PubMed,eprint) Bioinformatics 30(15):2114-2120 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing
Screenshots of package trimmomatic
trinityrnaseq
assemblati de novo di RNA-Seq
Versions of package trinityrnaseq
ReleaseVersionArchitectures
stretch2.2.0+dfsg-2amd64
sid2.15.2+dfsg-1amd64,arm64,ppc64el,riscv64
trixie2.15.2+dfsg-1amd64,arm64,ppc64el,riscv64
bullseye2.11.0+dfsg-6amd64,arm64
buster2.6.6+dfsg-6amd64
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Trinity rappresenta un metodo innovativo per una ricostruzione de novo efficiente e robusta di trascrittomi da dati di RNA-seq. Trinity combina tre moduli software indipendenti: Inchworm, Chrysalis e Butterfly, applicati sequenzialmente per elaborare grandi volumi di letture di RNA-seq. Trinity partiziona i dati delle sequenze in molti grafi de Bruijn individuali, ciascuno dei quali rappresenta la complessità trascrizionale ad un dato gene o locus, e poi elabora ciascun grafo indipendentemente per estrarre isoforme di splicing a lunghezza intera e per separare i trascritti derivati da geni paraloghi.

Please cite: Manfred G Grabherr, Brian J Haas, Moran Yassour, Joshua Z Levin, Dawn A Thompson, Ido Amit, Xian Adiconis, Lin Fan, Raktima Raychowdhury, Qiandong Zeng, Zehua Chen, Evan Mauceli, Nir Hacohen, Andreas Gnirke, Nicholas Rhind, Federica di Palma, Bruce W Birren, Chad Nusbaum, Kerstin Lindblad-Toh, Nir Friedman and Aviv Regev: Full-length transcriptome assembly from RNA-Seq data without a reference genome.. (PubMed) Nature Biotechnology 29(7):644-652 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
uc-echo
algoritmo a correzione di errore progettato per letture corte per NGS
Versions of package uc-echo
ReleaseVersionArchitectures
bullseye1.12-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.12-11amd64,arm64,armhf,i386
sid1.12-19amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.12-7amd64,armel,armhf,i386
stretch1.12-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.12-19amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.12-18amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ECHO è un algoritmo a correzione di errore progettato per letture corte per le piattaforme di sequenziamento di prossima generazione come Genome Analyzer II di Illumina. L'algoritmo usa un'infrastruttura Bayesiana per migliorare la qualità delle letture in un insieme di dati fornito impiegando una stima del massimo a posteriori.

Please cite: W.-C. Kao, A.H. Chan and Y.S. Song: ECHO: A reference-free short-read error correction algorithm. (PubMed,eprint) Genome Research 21:1181-1192 (2011)
Registry entries: Bio.tools  SciCrunch 
Topics: Data management; Sequencing
vcftools
raccolta di strumenti per lavorare con file VCF
Versions of package vcftools
ReleaseVersionArchitectures
stretch0.1.14+dfsg-4+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.1.12+dfsg-1amd64,armel,armhf,i386
trixie0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.1.16-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie-security0.1.12+dfsg-1+deb8u1amd64,armel,armhf,i386
buster0.1.16-1amd64,arm64,armhf,i386
Debtags of package vcftools:
roleprogram
Popcon: 17 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

VCFtools è un pacchetto di programmi progettato per lavorare con file VCF, come quelli generati dal 1000 Genomes Project. Lo scopo di VCFtools è quello di fornire metodi per lavorare con file VCF: validare, unire, confrontare e calcolare alcune statistiche di base di genetica di popolazione.

The package is enhanced by the following packages: multiqc
Please cite: Petr Danecek, Adam Auton, Goncalo Abecasis, Cornelis A. Albers, Eric Banks, Mark A. DePristo, Robert E. Handsaker, Gerton Lunter, Gabor T. Marth, Stephen T. Sherry, Gilean McVean and Richard Durbin: The variant call format and VCFtools. (PubMed,eprint) Bioinformatics 27(15):2156-8 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvet
assemblatore di sequenze di acidi nucleici da sequenze molto corte
Versions of package velvet
ReleaseVersionArchitectures
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2.10+dfsg1-5amd64,arm64,armhf,i386
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
bullseye1.2.10+dfsg1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.10+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.10+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package velvet:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet è un assemblatore genomico de novo progettato specificatamente per le tecnologie di sequenziamento basate su sequenze corte, come Solexa o 454, sviluppato da Daniel Zerbino e Ewan Birney all'European Bioinformatics Institute (EMBL-EBI), vicino a Cambridge, in Gran Bretagna.

Velvet attualmente accetta sequenze molto corte, rimuove errori e poi produce frammenti contigui unici di alta qualità. Poi usa informazioni sulle paired-read, se disponibili, per recuperare le aree ripetute tra i vari frammenti contigui.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvet-long
assemblatore di sequenze di acidi nucleici da sequenze molto corte, versione lunga
Versions of package velvet-long
ReleaseVersionArchitectures
buster1.2.10+dfsg1-5amd64,arm64,armhf,i386
sid1.2.10+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.2.10+dfsg1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.10+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet è un assemblatore genomico de novo progettato specificatamente per le tecnologie di sequenziamento basate su sequenze corte, come Solexa o 454, sviluppato da Daniel Zerbino e Ewan Birney all'European Bioinformatics Institute (EMBL-EBI), vicino a Cambridge, in Gran Bretagna.

Velvet attualmente accetta sequenze molto corte, rimuove errori e poi produce frammenti contigui unici di alta qualità. Poi usa informazioni sulle paired-read, se disponibili, per recuperare le aree ripetute tra i vari frammenti contigui.

Questo pacchetto installa versioni speciali in modalità lunga di Velvet, come raccomandato nei tutorial di Velvet.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvetoptimiser
ottimizza automaticamente i parametri per assemblaggio de novo di Velvet
Versions of package velvetoptimiser
ReleaseVersionArchitectures
bullseye2.2.6-3all
trixie2.2.6-5all
jessie2.2.5-2all
stretch2.2.5-5all
bookworm2.2.6-5all
sid2.2.6-5all
buster2.2.6-2all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

VelvetOptimiser è uno script multi-thread in Perl per ottimizzare automaticamente le opzioni dei tre parametri primari (K, -exp_cov, -cov_cutoff) per l'assemblatore di sequenze de novo Velvet.

Registry entries: Bio.tools  Bioconda 
vsearch
strumento per elaborare sequenze metagenomiche
Versions of package vsearch
ReleaseVersionArchitectures
stretch2.3.4-1amd64
trixie2.29.1-1amd64,arm64,mips64el,ppc64el,riscv64
buster2.10.4-1amd64
bookworm2.22.1-1amd64,arm64,ppc64el
bullseye2.15.2-3amd64,arm64,ppc64el
sid2.29.1-1amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 4 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Strumento versatile e multi-thread a 64 bit per elaborare sequenze metagenomiche, incluse ricerca, raggruppamento in cluster, rilevamento di chimere, dereplicazione, ordinamento, mascheramento e rimescolamento.

Lo scopo di questo progetto è di creare un'alternativa allo strumento USEARCH sviluppato da Robert C. Edgar (2010). Il nuovo strumento dovrebbe:

  • avere un design a 64 bit che gestisca database molto grandi e molto più di 4 GB di memoria;
  • essere accurato almeno quanto usearch o di più;
  • essere veloce almeno quanto usearch o di più.
The package is enhanced by the following packages: vsearch-examples
Please cite: Torbjørn Rognes, Tomáš Flouri, Ben Nichols, Christopher Quince and Frédéric Mahé: VSEARCH: a versatile open source tool for metagenomics. (eprint) PeerJ 4:e2584
Registry entries: Bio.tools  Bioconda 
wham-align
Wisconsin's High-Throughput Alignment Method
Versions of package wham-align
ReleaseVersionArchitectures
bookworm0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto fornisce funzionalità analoghe a BWA o bowtie nell'allineamento di letture da macchine di sequenziamento del DNA di prossima generazione rispetto a un genoma di riferimento.

Please cite: Yinan Li, Allie Terrell and Jignesh M. Patel: WHAM: A High-throughput Sequence Alignment Method (eprint) Proceedings of the ACM SIGMOD International Conference on Management of Data, SIGMOD 2011, Athens, Greece (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
wigeon
reimplementazione dell'utilità Pintail di rilevazione di anomalie nel DNA 16S
Versions of package wigeon
ReleaseVersionArchitectures
trixie20101212+dfsg1-6all
buster20101212+dfsg1-2all
bullseye20101212+dfsg1-4all
bookworm20101212+dfsg1-5all
stretch20101212+dfsg1-1all
sid20101212+dfsg1-6all
jessie20101212+dfsg-1all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

WigeoN esamina la conservazione delle sequenze tra un'interrogazione e una sequenza di riferimento fidata, entrambe nel formato di allineamento NAST. Sulla base dell'identità della sequenza tra l'interrogazione e la sequenza di riferimento esiste una quantità attesa di variazione nell'allineamento. Se la variazione osservata è maggiore del quantile del 95% della distribuzione di variazione osservata tra sequenze non anomale, allora è segnalata come anomalia.

WigeoN è una reimplementazione flessibile a riga di comando dell'algoritmo Pintail pubblicato in Appl Environ Microbiol. 2005 Dec;7112:7724-36.

WigeoN è utile per contrassegnare chimere e anomalie solo in sequenze di rRNA 16S di lunghezza quasi completa. WigeoN non ha la sensibilità per sequenze inferiori a 1000 pb.

Per eseguire WigeoN servono delle sequenze in formato NAST generate dall'utilità nast-ier.

WigeoN fa parte della suite microbiomeutil.

The package is enhanced by the following packages: microbiomeutil-data
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch 

Official Debian packages with lower relevance

nanolyse
rimuove le letture del fago lambda da un file fastq
Versions of package nanolyse
ReleaseVersionArchitectures
bookworm1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.2.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

NanoLyse è uno strumento per la rimozione rapida di DNA contaminante, che usa l'allineatore Minimap2 attraverso il collegamento Python mappy. Un'applicazione tipica è la rimozione del frammento di DNA di controllo del fago lambda fornito da ONT, per il quale è inclusa in questo pacchetto la sequenza di riferimento. Questo approccio, tuttavia, può portare a perdite non volute di letture da regioni altamente omologhe al genoma del fago lambda.

Please cite: Wouter De Coster, Svenn D’Hert, Darrin T Schultz, Marc Cruts and Christine Van Broeckhoven: NanoPack: visualizing and processing long-read sequencing data. (PubMed,eprint) Bioinformatics 34(15):2666-2669 (2018)
Registry entries: Bioconda 
python3-anndata
annotated gene by sample numpy matrix
Versions of package python3-anndata
ReleaseVersionArchitectures
sid0.10.6-1all
bookworm0.8.0-4all
bullseye0.7.5+ds-3all
upstream0.11.0
Popcon: 0 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

AnnData provides a scalable way of keeping track of data together with learned annotations. It is used within Scanpy, for which it was initially developed. Both packages have been introduced in Genome Biology (2018).

Please cite: F. Alexander Wolf, Philipp Angerer and Fabian J. Theis: SCANPY: large-scale single-cell gene expression data analysis.. (PubMed) Genome Biol. 19:15 (2018)
Registry entries: Bioconda 
r-bioc-isoformswitchanalyzer
Identify, Annotate and Visualize Alternative Splicing and
Versions of package r-bioc-isoformswitchanalyzer
ReleaseVersionArchitectures
sid2.4.0+ds-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie2.4.0+ds-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.20.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream2.6.0
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Isoform Switches with Functional Consequences from both short- and long-read RNA-seq data. Analysis of alternative splicing and isoform switches with predicted functional consequences (e.g. gain/loss of protein domains etc.) from quantification of all types of RNASeq by tools such as Kallisto, Salmon, StringTie, Cufflinks/Cuffdiff etc.

Registry entries: Bio.tools  Bioconda 

Debian packages in contrib or non-free

bcbio
toolkit for analysing high-throughput sequencing data
Versions of package bcbio
ReleaseVersionArchitectures
sid1.2.9-2 (contrib)all
bullseye1.2.5-1 (contrib)all
bookworm1.2.9-2 (contrib)all
buster1.1.2-3all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free, but needs non-free components
Git

This package installs the command line tools of the bcbio-nextgen toolkit implementing best-practice pipelines for fully automated high throughput sequencing analysis.

A high-level configuration file specifies inputs and analysis parameters to drive a parallel pipeline that handles distributed execution, idempotent processing restarts and safe transactional steps. The project contributes a shared community resource that handles the data processing component of sequencing analysis, providing researchers with more time to focus on the downstream biology.

This package builds and having it in Debian unstable helps the Debian developers to synchronize their efforts. But unless a series of external dependencies are not installed manually, the functionality of bcbio in Debian is only a shadow of itself. Please use the official distribution of bcbio for the time being, which means "use conda". The TODO file in the Debian directory should give an overview on progress for Debian packaging.

Registry entries: Bio.tools  Bioconda 
cufflinks
Transcript assembly, differential expression and regulation for RNA-Seq
Versions of package cufflinks
ReleaseVersionArchitectures
bullseye2.2.1+dfsg.1-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.2.1-3 (non-free)amd64
buster2.2.1+dfsg.1-3 (non-free)amd64,arm64,armhf,i386
trixie2.2.1+dfsg.1-10 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.2.1+dfsg.1-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2.1+dfsg.1-10 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.2.1-1 (non-free)amd64
Popcon: 0 users (1 upd.)*
Versions and Archs
License: non-free
Git

Cufflinks assembles transcripts, estimates their abundances, and tests for differential expression and regulation in RNA-Seq samples. It accepts aligned RNA-Seq reads and assembles the alignments into a parsimonious set of transcripts. Cufflinks then estimates the relative abundances of these transcripts based on how many reads support each one.

This package provides the binary of cufflinks and associated tools, i.e. compress_gtf, cuffcompare, cuffdiff, cuffmerge, cuffnorm, cuffquant and gtf_to_sam.

Please cite: Cole Trapnell, Brian A Williams, Geo Pertea, Ali Mortazavi, Gordon Kwan, Marijke J van Baren, Steven L Salzberg, Barbara J Wold and Lior Pachter: Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. (PubMed) Nature Biotechnology 28(5):511-515 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
vdjtools
framework for post-analysis of B/T cell repertoires
Versions of package vdjtools
ReleaseVersionArchitectures
trixie1.2.1+git20190311+repack-2 (non-free)all
bookworm1.2.1+git20190311+repack-1 (non-free)all
bullseye1.2.1+git20190311-5 (non-free)all
sid1.2.1+git20190311+repack-2 (non-free)all
Popcon: 0 users (1 upd.)*
Versions and Archs
License: non-free
Git

VDJtools is an open-source Java/Groovy-based framework designed to facilitate analysis of immune repertoire sequencing (RepSeq) data. VDJtools computes a wide set of statistics and is able to perform various forms of cross-sample analysis. Both comprehensive tabular output and publication-ready plots are provided.

The main aims of the VDJtools Project are:

  • To ensure consistency between post-analysis methods and results
  • To save the time of bioinformaticians analyzing RepSeq data
  • To create an API framework facilitating development of new RepSeq analysis applications
  • To provide a simple enough command line tool so it could be used by immunologists and biologists with little computational background
Please cite: M Shugay, D.V. Bagaev, M.A. Turchaninova, D.A. Bolotin, O.V. Britanova, E.V. Putintseva, M.V. Pogorelyy, V.I. Nazarov VI, I.V. Zvyagin, V.I. Kirgizova, K.I. Kirgizov, E.V. Skorobogatova and D.M. Chudakov: VDJtools: Unifying Post-analysis of T Cell Receptor Repertoires. (PubMed,eprint) PLoS Comput Biol. 11(11):e1004503 (2015)

Packaging has started and developers might try the packaging code in VCS

graphmap2
highly sensitive and accurate mapper for long, error-prone reads
Versions of package graphmap2
ReleaseVersionArchitectures
VCS0.6.4-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 0.6.4-1

GraphMap2 is a highly sensitive and accurate mapper for long, error- prone reads. The mapping algorithm is designed to analyse nanopore sequencing reads, which progressively refines candidate alignments to robustly handle potentially high-error rates and a fast graph traversal to align long reads with speed and high precision (>95%). Evaluation on MinION sequencing data sets against short- and long-read mappers indicates that GraphMap increases mapping sensitivity by 10–80% and maps

95% of bases. GraphMap alignments enabled single-nucleotide variant calling on the human genome with increased sensitivity (15%) over the next best mapper, precise detection of structural variants from length 100 bp to 4 kbp, and species and strain-specific identification of pathogens using MinION reads.

Please cite: Ivan Sović, Mile Šikić, Andreas Wilm, Shannon Nicole Fenlon, Swaine Chen and Niranjan Nagarajan: Fast and sensitive mapping of nanopore sequencing reads with GraphMap. (PubMed,eprint) Nature Communications 7(11307) (2016)
Registry entries: Bioconda 
mosaik-aligner
reference-guided aligner for next-generation sequencing
Versions of package mosaik-aligner
ReleaseVersionArchitectures
VCS2.2.30+20140627-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 2.2.30+20140627-1

MosaikBuild converts various sequence formats into Mosaik’s native read format. MosaikAligner pairwise aligns each read to a specified series of reference sequences. MosaikSort resolves paired-end reads and sorts the alignments by the reference sequence coordinates. Finally, MosaikText converts alignments to different text-based formats.

At this time, the workflow consists of supplying sequences in FASTA, FASTQ, Illumina Bustard & Gerald, or SRF file formats and producing results in the BLAT axt, the BAM/SAM, the UCSC Genome Browser bed, or the Illumina ELAND formats.

nanoplot
plotting scripts for long read sequencing data
Versions of package nanoplot
ReleaseVersionArchitectures
VCS1.36.2-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 1.36.2-1

NanoPlot provides plotting scripts for long read sequencing data.

These scripts perform data extraction from Oxford Nanopore sequencing data in the following formats:

  • fastq files (optionally compressed)
  • fastq files generated by albacore, guppy or MinKNOW containing additional information (optionally compressed)
  • sorted bam files
  • sequencing_summary.txt output table generated by albacore, guppy or MinKnow basecalling (optionally compressed)
  • fasta files (optionally compressed)
  • multiple files of the same type can be offered simultaneously
Please cite: Wouter De Coster, Svenn D'Hert, Darrin T Schultz, Marc Cruts and Christine Van Broeckhoven: NanoPack: visualizing and processing long-read sequencing data. (PubMed,eprint) Bioinformatics 34(15):2666-2669 (2018)
Registry entries: Bioconda 
r-bioc-mofa2
Multi-Omics Factor Analysis v2
Versions of package r-bioc-mofa2
ReleaseVersionArchitectures
VCS1.2.2+ds-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 1.2.2+ds-1

The MOFA2 package contains a collection of tools for training and analysing multi-omic factor analysis (MOFA). MOFA is a probabilistic factor model that aims to identify principal axes of variation from data sets that can comprise multiple omic layers and/or groups of samples. Additional time or space information on the samples can be incorporated using the MEFISTO framework, which is part of MOFA2. Downstream analysis functions to inspect molecular features underlying each factor, vizualisation, imputation etc are available.

Registry entries: Bio.tools  Bioconda 
umap
quantify genome and methylome mappability
Versions of package umap
ReleaseVersionArchitectures
VCS1.0.0-1all
Versions and Archs
License: GPL-3.0
Debian package not available
Git
Version: 1.0.0-1

Umap identifies uniquely mappable regions of any genome. Its Bismap extension identifies mappability of the bisulfite converted genome (methylome).

Please cite: Mehran Karimzadeh, Carl Ernst, Anshul Kundaje and Michael M. Hoffman: Umap and Bismap: quantifying genome and methylome mappability. (PubMed,eprint) Nucleic Acids Res. 46(20):e120 (2018)
Registry entries: Bioconda 

No known packages available

annovar
annotate genetic variants detected from diverse genomes
License: Open Source for non-profit
Debian package not available

ANNOVAR is an efficient software tool to utilize update-to-date information to functionally annotate genetic variants detected from diverse genomes (including human genome hg18, hg19, as well as mouse, worm, fly, yeast and many others). Given a list of variants with chromosome, start position, end position, reference nucleotide and observed nucleotides, ANNOVAR can perform:

 1. Gene-based annotation: identify whether SNPs or CNVs cause protein coding
    changes and the amino acids that are affected. Users can flexibly use RefSeq
    genes, UCSC genes, ENSEMBL genes, GENCODE genes, or many other gene definition
    systems.
 2. Region-based annotations: identify variants in specific genomic regions,
    for example, conserved regions among 44 species, predicted transcription
    factor binding sites, segmental duplication regions, GWAS hits, database
    of genomic variants, DNAse I hypersensitivity sites, ENCODE
    H3K4Me1/H3K4Me3/H3K27Ac/CTCF sites, ChIP-Seq peaks, RNA-Seq peaks, or many
    other annotations on genomic intervals.
 3. Filter-based annotation: identify variants that are reported in dbSNP,
    or identify the subset of common SNPs (MAF>1%) in the 1000 Genome Project,
    or identify subset of non-synonymous SNPs with SIFT score>0.05, or many
    other annotations on specific mutations.
 4. Other functionalities: Retrieve the nucleotide sequence in any
    user-specific genomic positions in batch, identify a candidate gene list
    for Mendelian diseases from exome data, identify a list of SNPs from
    1000 Genomes that are in strong LD with a GWAS hit, and many other
    creative utilities.

In a modern desktop computer (3GHz Intel Xeon CPU, 8Gb memory), for 4.7 million variants, ANNOVAR requires ~4 minutes to perform gene-based functional annotation, or ~15 minutes to perform stepwise "variants reduction" procedure, making it practical to handle hundreds of human genomes in a day.

forge
genome assembler for mixed read types
License: Apache 2.0
Debian package not available

Forge Genome Assembler is a parallel, MPI based genome assembler for mixed read types.

Forge is a classic "Overlap layout consensus" genome assembler written by Darren Platt and Dirk Evers. Implemented in C++ and using the parallel MPI library, it runs on one or more machines in a network and can scale to very large numbers of reads provided there is enough collective memory on the machines used. It generates a full consensus alignment of all reads, can handle mixtures of sanger, 454 and illumina reads. There is some support for solid color space and it includes built in tools for vector trimming and contamination screening.

Forge and was originally developed at Exelixis and they have kindly agreed to place the software which underwent much subsequent development outside Exelixis, into the public domain. Forge works with most of the common MPI implementations.

Remark of Debian Med team: Competitor to MIRA2 and wgs-assembler

This package was requested by William Spooner whs@eaglegenomics.com as a competitor to MIRA2 and wgs-assembler.

*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 246672