Debian Med Project
Help us to see Debian used by medical practitioners and biomedical researchers! Join us on the Salsa page.
Summary
Cloud
applications bio-informatiques de Debian Med utilisables dans les nuages

Ce méta-paquet installera des paquets Debian liés à biologie moléculaire, à la biologie structurale et à la bio-informatique utilisable dans les sciences de la vie, qui ne dépendent pas de ressources graphiques et qui ne peuvent donc pas s'adapter sur des images système pour l'utilisation dans les grappes de nuages, où l'espace peut être limité.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Med to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Med mailing list

Links to other tasks

Debian Med Cloud packages

Official Debian packages with high relevance

abyss
assembleur de séquences de novo parallèles pour les lectures courtes
Versions of package abyss
ReleaseVersionArchitectures
jessie1.5.2-1 (non-free)amd64
trixie2.3.9-1amd64,arm64,mips64el,ppc64el,riscv64
bullseye2.2.5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.3.10-1amd64,arm64,mips64el,ppc64el,riscv64
buster2.1.5-7amd64,arm64,armhf,i386
stretch2.0.2-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch-backports2.1.5-7~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.3.5+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
Debtags of package abyss:
roleprogram
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

ABySS est un assembleur de séquences de novo parallèles conçu pour les lectures courtes. Il peut servir à assembler des données de séquences de génome ou de transcriptome. La parallélisation est permise par MPI, OpenMP et pthread.

Please cite: Shaun D. Jackman, Benjamin P. Vandervalk, Hamid Mohamadi, Justin Chu, Sarah Yeo, S. Austin Hammond, Golnaz Jahesh, Hamza Khan, Lauren Coombe, Rene L. Warren and İnanç Birol: "ABySS 2.0: resource-efficient assembly of large genomes using a Bloom filter". (PubMed,eprint) Genome Research 27(5):768-777 (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
acedb-other
Récupération d'ADN ou de séquences de protéines
Versions of package acedb-other
ReleaseVersionArchitectures
stretch4.9.39+dfsg.02-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.9.39+dfsg.02-4amd64,arm64,armhf,i386
jessie4.9.39+dfsg.01-5amd64,armel,armhf,i386
sid4.9.39+dfsg.02-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.9.39+dfsg.02-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye4.9.39+dfsg.02-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package acedb-other:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
scopeutility
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet rassemble toutes les petites applications qu'acedb regroupe sous la cible « other » de son Makefile.

efetch: vraisemblablement le raccourci pour « entry fetch » (collecteur d'entrées en base de données), assemble les informations de séquence des principales bases de données d'ADN et de protéines.

Please cite: L. D. Stein and J. Thierry-Mieg: AceDB: a genome database management system. Computing in Science and Engineering 1(3):44-52 (1999)
Registry entries: Bio.tools 
aevol
modèle numérique de génétique pour lancer des expériences d'évolution in silico
Versions of package aevol
ReleaseVersionArchitectures
jessie4.4-1amd64,armel,armhf,i386
sid5.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie5.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm5.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye5.0+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster5.0-2amd64,arm64,armhf,i386
stretch4.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Aevol est un modèle numérique de génétique : des populations d'organismes numériques sont assujetties à un processus de sélection et de variation, qui crée une dynamique Darwinienne.

En modifiant les caractéristiques de sélection (par exemple, la taille de la population, le type d'environnement, les variations environnementales) ou de variation (par exemple, les taux de mutation, les taux de réarrangement chromosomique, les types de réarrangement, le transfert horizontal), on peut étudier expérimentalement l'impact de ces paramètres sur la structure d'organismes évolués. En particulier, puisque Aevol intègre un modèle de génome précis et réaliste, il permet l'étude de variations structurelles du génome (par exemple, le nombre de gènes, la synténie, la proportion de séquences de codage).

La plate-forme de simulation est livrée avec un ensemble d'outils pour l'analyse des phylogénies et la mesure de plusieurs caractéristiques des organismes et populations au cours de l'évolution.

Please cite: Dusan Misevic, Antoine Frenoy, David P. Parsons and Francois Taddei: Effects of public good properties on the evolution of cooperation. (eprint) :218-225 (2012)
alien-hunter
Distribution des motifs d'ordre variable (IVOM) pour identifier l'ADN acquis par transfert horizontal
Versions of package alien-hunter
ReleaseVersionArchitectures
sid1.7-10all
bookworm1.7-10all
bullseye1.7-8all
buster1.7-7all
stretch1.7-5all
jessie1.7-3all
trixie1.7-10all
Debtags of package alien-hunter:
fieldbiology, biology:structural
roleprogram
scopeutility
useanalysing
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Alien_hunter est une application pour la détection des gènes acquis par transfert horizontal grâce au programme IVOM (Interpolated Variable Order Motifs). IVOM identifie des biais compositionnels en utilisant la distribution des motifs d’ordre variable et capture la composition d'une séquence locale de manière plus fiable que les méthodes à ordre fixe. Les régions prédites peuvent aussi être analysées dans un HMM (Hidden Markov Model) à deux états et du second ordre, avec un algorithme de détection du points de changement, pour optimiser la localisation des liaisons des régions prédites. Les prédictions (au format embl) peuvent être chargées automatiquement dans l'afficheur de génome Artemis, disponible gratuitement sur : http://www.sanger.ac.uk/Software/Artemis/.

Please cite: Georgios S. Vernikos and Julian Parkhill: Interpolated variable order motifs for identification of horizontally acquired DNA: revisiting the Salmonella pathogenicity islands. (PubMed,eprint) Bioinformatics 22(18):2196-2203 (2006)
Registry entries: SciCrunch 
altree
programme pour faire de l'association basée sur la phylogénétique et l'analyse de localisation
Versions of package altree
ReleaseVersionArchitectures
jessie1.3.1-2amd64,armel,armhf,i386
sid1.3.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.3.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.3.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3.1-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.3.1-7amd64,arm64,armhf,i386
stretch1.3.1-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package altree:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram, shared-lib
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

ALTree est conçu pour la détection d'association et de localisation de sites susceptibles en utilisant des arbres phylogénétiques haplotypes : tout d'abord il permet une détection d'une association entre le gène candidat et la maladie, puis de faire des hypothèses sur les loci susceptibles.

Please cite: Claire Bardel, Vincent Danjean and Emmanuelle Genin: ALTree: association detection and localization of susceptibility sites using haplotype phylogenetic trees. (PubMed,eprint) Bioinformatics 22(11):1402-1403 (2006)
Registry entries: SciCrunch 
amap-align
alignement multiple de séquences protéiques par appariement
Versions of package amap-align
ReleaseVersionArchitectures
bullseye2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.2-4amd64,armel,armhf,i386
trixie2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.2-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.2+git20080214.600fc29+dfsg-1amd64,arm64,armhf,i386
bookworm2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package amap-align:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 15 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

AMAP est un outil en ligne de commande pour effectuer des alignements multiples de séquences peptidiques. Il utilise le décodage a posteriori, et l'alignement par appariement de séquence, au lieu de la méthode traditionnelle d'alignement progressif. C'est le seul programme permettant le contrôle de la sensibilité et de la spécificité. Il est basé sur le code source de ProbCons mais utilise une métrique de précision et élimine la transformation de cohérence.

L'outil Java de visualisation d’AMAP 2.2 n'est pas encore disponible dans Debian.

Please cite: Ariel S. Schwartz and Lior Pachter: Multiple alignment by sequence annealing. (eprint) Bioinformatics 23(2):e24-e29 (2007)
Registry entries: SciCrunch  Bioconda 
ampliconnoise
suppression du bruit pour les amplicons PCR séquencés 454
Versions of package ampliconnoise
ReleaseVersionArchitectures
sid1.29-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.29-2amd64,armel,armhf,i386
stretch1.29-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.29-8amd64,arm64,armhf,i386
bullseye1.29-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.29-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package ampliconnoise:
roleprogram
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

AmpliconNoise est un ensemble d'applications pour nettoyer les données de séquences haute fréquence. Il est constitué de trois parties principales :

  • Pyronnoise : rassemble les mauvais points en se basant sur un diagramme de flux ;
  • SeqNoise : enlève les mutations de point PCR ;
  • Perseus : enlève les chimères PCR sans avoir besoin d'un ensemble de séquences de références.
Please cite: Christopher Quince, Anders Lanzen, Russell J Davenport and Peter J Turnbaugh: Removing Noise From Pyrosequenced Amplicons. (PubMed,eprint) BMC Bioinformatics 12:38 (2011)
Registry entries: Bio.tools  SciCrunch 
Topics: Sequencing
anfo
aligneur/mappeur de lectures courtes à partir de MPG
Versions of package anfo
ReleaseVersionArchitectures
stretch0.98-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.98-4amd64,armel,armhf,i386
sid0.98-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.98-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.98-7amd64,arm64,armhf,i386
Popcon: 3 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Anfo est un mappeur dans l'esprit de Soap/Maq/Bowtie, mais sa mise en œuvre relève plus de BLAST/BLAT. Il est plus utile pour l'alignement de séquences de lectures où la séquence ADN est quelque peu modifiée (pensez à de l'ADN ancien ou au traitement au bisulfite) et/ou il existe plus de divergence entre l'échantillon et la référence, que ces mappeurs rapides géreront avec élégance (considérant que le génome de référence est manquant, une variante proche est utilisée en lieu et place).

Registry entries: SciCrunch 
Topics: Sequencing
aragorn
détection ARNt et ARNtm dans les séquences de nucléotides
Versions of package aragorn
ReleaseVersionArchitectures
buster1.2.38-2amd64,arm64,armhf,i386
trixie1.2.41-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.2.36-4amd64,armel,armhf,i386
sid1.2.41-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.2.38-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.38-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.2.38-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le programme utilise des algorithmes heuristiques pour prédire les structures secondaires d'ARNt, basés sur l'homologie avec des séquences consensus d'ARNt reconnues et sur la faculté de former des paires de base en feuille de trèfle. Les gènes ARNtm sont identifiés en utilisant une version modifiée du programme BRUCE.

Please cite: Dean Laslett and Bjorn Canback: ARAGORN, a program to detect tRNA genes and tmRNA genes in nucleotide sequences. (PubMed,eprint) Nucleic Acids Research 32(1):11-16 (2004)
Registry entries: SciCrunch  Bioconda 
Topics: Functional, regulatory and non-coding RNA
arden
contrôle de spécificité pour les alignements de lecture utilisant une référence artificielle
Versions of package arden
ReleaseVersionArchitectures
trixie1.0-6all
jessie1.0-1amd64,armel,armhf,i386
stretch1.0-3all
buster1.0-4all
bullseye1.0-5all
bookworm1.0-5all
sid1.0-6all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ARDEN (estimation de faux positifs dans des données NGS déterminée par référence artificielle) est un étalonnage novateur qui estime les taux d'erreur basés sur des lectures expérimentales réelles et un génome de référence artificiel généré en supplément. Il permet le calcul de taux d'erreur spécifiquement pour un ensemble de données et la construction d'une courbe ROC. Toutefois, il peut être utilisé pour optimiser des paramètres pour des mappeurs de lecture, pour sélectionner des mappeurs de lecture pour un problème spécifique mais aussi pour filtrer des alignements basés sur une estimation de qualité.

Please cite: Sven H. Giese, Franziska Zickmann and Bernhard Y. Renard: Specificity control for read alignments using an artificial reference genome-guided false discovery rate. (PubMed,eprint) Bioinformatics 30(1):9-16 (2013)
Registry entries: SciCrunch 
Topics: Sequencing
autodock
Analyse de liaison de ligand à la structure d'une protéine
Versions of package autodock
ReleaseVersionArchitectures
jessie4.2.6-2amd64,armel,armhf,i386
buster4.2.6-6amd64,arm64,armhf,i386
bullseye4.2.6-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch4.2.6-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package autodock:
fieldbiology, biology:structural
interfacecommandline
roleprogram
scopeutility
useanalysing
works-with3dmodel
Popcon: 9 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Autodock est un des programmes principaux d'amarrage moléculaire (docking) de ligands de faible poids moléculaire à des récepteurs protéiques. Dans les versions précédentes le ligand était complètement flexible tandis que la protéine était rigide. La version 4 permet de considérer la protéine de manière partiellement flexible pour les chaînes latérales de résidus de surface sélectionnés en prenant en compte les rotamères.

Le programme AutoDock réalise l'amarrage moléculaire de ligands en utilisant des grilles pré-calculées qui décrivent la protéine cible en terme de préférence spatiale physico-chimique. AutoGrid pré-calcule ces grilles.

The package is enhanced by the following packages: autogrid
Screenshots of package autodock
autodock-vina
chargement de petites molécules jusqu'aux protéines
Versions of package autodock-vina
ReleaseVersionArchitectures
bookworm1.2.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.1.2-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1.2-5amd64,arm64,armhf,i386
stretch1.1.2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.1.2-3amd64,armel,armhf,i386
Popcon: 14 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

AutoDock Vina est un programme pour la découverte de médicaments, le chargement de molécules et l'affichage virtuel des bibliothèques de composés. Il offre des capacités multicœurs, de bonnes performances, une précision améliorée et est facile d'utilisation.

Le même institut développe également autodock, qui est très utilisé.

O. Trott, A. J. Olson, AutoDock Vina : improving the speed and accuracy of docking with a new scoring function, efficient optimization and multithreading, Journal of Computational Chemistry 31 (2010) 455-461

Please cite: Oleg Trott and Arthur J. Olson: AutoDock Vina: Improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. (eprint) Journal of Computational Chemistry 31(2):455-461 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
autogrid
Pré-calculer les liaisons de ligands à leur récepteur
Versions of package autogrid
ReleaseVersionArchitectures
bullseye4.2.6-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster4.2.6-6amd64,arm64,armhf,i386
trixie4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch4.2.6-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie4.2.6-2amd64,armel,armhf,i386
Debtags of package autogrid:
fieldbiology, biology:structural
interfacecommandline
roleprogram
scopeutility
useanalysing
works-with3dmodel
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

AutoDockSuite permet l'analyse de l'amarrage de molécules de faible poids moléculaire à des récepteurs dont la structure tri-dimensionnelle est connue.

Le programme AutoGrid crée les grilles calculées en prévision de l'amarrage moléculaire de ligands à des grilles qui décrivent l'effet de l'environnement créé par la protéine sur des sondes moléculaires ponctuelles, chargées ou non, permettant de décrire les différents types d'interactions intermoléculaires ligand-protéine (charges positives, négatives, liaisons hydrogènes accepteur, liaisons hydrogènes donneur, hydrophobe, aliphatique, ...). L'effet de ces forces est ensuite analysé avec le programme AutoDock.

bamtools
boîte à outils de manipulation de fichiers BAM (alignement de génomes)
Versions of package bamtools
ReleaseVersionArchitectures
jessie2.3.0+dfsg-2amd64,armel,armhf,i386
trixie2.5.2+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.5.2+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.5.1+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.5.1+dfsg-3amd64,arm64,armhf,i386
stretch2.4.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.5.2+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 7 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

BamTools facilite l'analyse de recherche et la gestion de données grâce aux fichiers BAM. Il surmonte les énormes quantités de données produites par les technologies de séquençage actuelles qui sont généralement stockées dans des formats binaires compressés difficiles à gérer avec les analyseurs de textes couramment utilisés dans la recherche en bioinformatique.

BamTools fournit une API C++ pour la prise en charge des fichiers BAM ainsi qu'une boîte à outils en ligne de commande.

Il s'agit de la boîte à outils en ligne de commande bamtools.

Les commandes bamtools disponibles sont :

 − convert : conversion entre BAM et beaucoup d'autres formats ;
 − count : affichage du nombre d'alignements dans un ou plusieurs fichiers
   BAM ;
 − coverage :affichage des statistiques de couverture à partir d'un
   fichier d'entrée BAM ;
 − filter : filtrage des fichiers BAM selon des critères indiqués par
   l'utilisateur ;
 − header : affichage des informations d'en-tête BAM ;
 − index : création d'index pour un fichier BAM ;
 − merge : fusion de plusieurs fichiers BAM en un seul ;
 − random : sélection aléatoire d'alignements depuis des fichiers BAM
   existants à des fins de test ;
 − resolve : résolution de lectures de fins en paires (affichant le
   drapeau IsProperPair requis) ;
 − revert : suppression des marques dupliquées et restauration des
   qualités de base d'origine ;
 − sort : tri d'un fichier BAM en suivant certains critères ;
 − split : séparation d'un fichier BAM en fonction d'une propriété définie
   par l'utilisateur, créant un nouveau fichier BAM en sortie pour chaque
   valeur trouvée ;
 − stats : affichage de statistiques de base à partir d'un ou plusieurs
   fichiers BAM en entrée.
The package is enhanced by the following packages: multiqc
Please cite: Derek W. Barnett, Erik K. Garrison, Aaron R. Quinlan, Michael P. Stromberg and Gabor T. Marth: BamTools: a C++ API and toolkit for analyzing and managing BAM files. (PubMed,eprint) Bioinformatics 27(12):1691-2 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bedtools
suite d'utilitaires pour la comparaison des caractéristiques de génomes
Versions of package bedtools
ReleaseVersionArchitectures
sid2.31.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.27.1+dfsg-4amd64,arm64,armhf
bullseye2.30.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.30.0+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.21.0-1amd64,armhf,i386
stretch2.26.0+dfsg-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
trixie2.31.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package bedtools:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, filtering
works-withbiological-sequence
Popcon: 30 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Les utilitaires BEDTools permettent de traiter les tâches génomiques ordinaires telles que trouver les chevauchements de caractéristiques et informatiser les données. Les utilitaires sont en grande partie basés sur quatre formats de fichier très utilisés : BED, GFF/GTF, VCF et SAM/BAM. En utilisant BEDTools, il est possible de développer des enchainements sophistiqués qui répondent à des questions de recherche en utilisant plusieurs outils séquentiellement.

L'outil groupBy est fourni par le paquet filo.

Please cite: Aaron R. Quinlan and Ira M. Hall: BEDTools: a flexible suite of utilities for comparing genomic features. (PubMed,eprint) Bioinformatics 26(6):841-842 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bioperl
outils en Perl pour la bio-informatique
Versions of package bioperl
ReleaseVersionArchitectures
jessie1.6.924-1all
stretch1.7.1-2all
bookworm1.7.8-1all
trixie1.7.8-1all
sid1.7.8-1all
buster1.7.2-3all
bullseye1.7.7-2all
Debtags of package bioperl:
devellang:perl, library
fieldbiology, biology:bioinformatics
roledevel-lib, shared-lib
Popcon: 44 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Le projet Bioperl est un effort coordonné ayant pour but de rassembler des méthodes utilisées couramment en bio-informatique dans un ensemble de modules Perl de type CPAN, bien documentés et disponibles librement. Il est bien accepté dans la communauté et est utilisé dans de nombreux projets de grande envergure, par exemple Ensembl.

Les paquets recommandés sont requis par certains des exécutables inclus. Une explication détaillée comprenant les modules spécifiques à Perl se trouve dans le fichier README.Debian.

Le paquet suggéré améliore les pages de manuel.

Please cite: Jason E Stajich, David Block, Kris Boulez, Steven E Brenner, Stephen A Chervitz, Chris Dagdigian, Georg Fuellen, James G R Gilbert, Ian Korf, Hilmar Lapp, Heikki Lehvaslaiho, Chad Matsalla, Chris J Mungall, Brian I Osborne, Matthew R Pocock, Peter Schattner, Martin Senger, Lincoln D Stein, Elia Stupka, Mark D Wilkinson and Ewan Birney: The Bioperl toolkit: Perl modules for the life sciences. (PubMed,eprint) Genome Res. 12(10):1611-1618 (2002)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bioperl-run
scripts d'enveloppe BioPerl
Versions of package bioperl-run
ReleaseVersionArchitectures
stretch1.7.1-3all
sid1.7.3-11all
jessie1.6.9-2all
bookworm1.7.3-9all
buster1.7.2-4all
bullseye1.7.3-6all
Debtags of package bioperl-run:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
Popcon: 7 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit des scripts du paquet BioPerl-Run. Il installe également toutes les applications enveloppables empaquetées dans Debian. Les applications non libres sont « suggérées » par ce paquet.

The package is enhanced by the following packages: clustalw exonerate kalign mcl
biosquid
utilitaire d'analyse de séquences biologiques
Versions of package biosquid
ReleaseVersionArchitectures
bullseye1.9g+cvs20050121-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.9g+cvs20050121-15.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.9g+cvs20050121-15.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.9g+cvs20050121-4amd64,armel,armhf,i386
stretch1.9g+cvs20050121-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch-backports1.9g+cvs20050121-11~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.9g+cvs20050121-11amd64,arm64,armhf,i386
bookworm1.9g+cvs20050121-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package biosquid:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing, converting, editing
Popcon: 6 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

BioSQUID est une bibliothèque de routines C pour l'analyse de séquences. Elle est livrée avec quelques petits programmes pour convertir, afficher quelques statistiques, manipuler et effectuer d'autres tâches sur des fichiers de séquence.

BioSQUID s'est d'abord appelée SQUID, mais un paquet Debian nommé Squid (un serveur mandataire cache) existant déjà, SQUID a été renommé.

Ce paquet fournit certains outils de démonstration des fonctions de la bibliothèque BioSQUID.

blast2
paquet factice de transition vers ncbi-blast+-legacy
Versions of package blast2
ReleaseVersionArchitectures
jessie2.2.26.20120620-8amd64,armel,armhf,i386
stretch2.6.0-1all
buster2.8.1-1+deb10u1all
Debtags of package blast2:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
usesearching
works-withbiological-sequence
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet factice de transition pour ncbi-blast+-legacy. Il peut être supprimé en toute sécurité.

The package is enhanced by the following packages: mcl
Registry entries: Bio.tools  SciCrunch  Bioconda 
bowtie
aligneur ultra-rapide de lectures courtes avec une faible empreinte mémoire
Versions of package bowtie
ReleaseVersionArchitectures
bullseye1.3.0+dfsg1-1amd64,arm64,mips64el,ppc64el,s390x
buster1.2.2+dfsg-4amd64,arm64
trixie1.3.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.3.1-1amd64,arm64,mips64el,ppc64el,s390x
sid1.3.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
jessie1.1.1-2amd64
stretch1.1.2-6amd64,arm64,mips64el,ppc64el,s390x
Debtags of package bowtie:
biologynuceleic-acids
fieldbiology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
useanalysing, comparing
works-withbiological-sequence
Popcon: 20 users (26 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet aborde le problème de l'interprétation des résultats des dernières technologies (2010) de séquençage de l'ADN. Celles-ci produiront des étirements assez courts et qui ne peuvent pas directement être interprétés. C'est le défi d'outils comme Bowtie de donner un emplacement chromosomique aux courts étirements de l'ADN séquencé à chaque exécution.

Bowtie aligne des (lectures de) séquences d'ADN du génome humain à un débit de 25 millions de lectures de paires de bases 35 par heure. Le paquet Bowtie indexe le génome humain avec un indice de Burrows-Wheeler pour garder une faible empreinte mémoire : typiquement environ 2,2 Go pour le génome humain (2,9 Go pour le séquençage à partir des deux extrémités).

The package is enhanced by the following packages: bowtie-examples multiqc
Please cite: Ben Langmead, Cole Trapnell, Mihai Pop and Steven L Salzberg: Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. (eprint) Genome Biology 10:R25 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
bowtie2
aligneur ultra-rapide de lectures courtes avec une faible empreinte mémoire
Versions of package bowtie2
ReleaseVersionArchitectures
buster2.3.4.3-1amd64
sid2.5.4-1amd64,arm64,mips64el,ppc64el,riscv64
stretch2.3.0-2amd64
jessie2.2.4-1amd64
trixie2.5.4-1amd64,arm64,mips64el,ppc64el,riscv64
bookworm2.5.0-3amd64,arm64,mips64el,ppc64el
bullseye2.4.2-2amd64,arm64,mips64el,ppc64el
Popcon: 20 users (16 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet est un outil à faible empreinte mémoire et ultra-rapide pour l'alignement de lectures de séquençage à séquences longues de référence. Il est particulièrement performant pour l'alignement de lectures d'environ 50 symboles et jusqu'à des centaines ou des milliers de symboles, et particulièrement performant pour l'alignement de génomes relativement longs (par exemple, le génome de mammifères).

Bowtie 2 indexe le génome avec un FM-index pour garder une faible empreinte mémoire : pour le génome humain, son empreinte en mémoire vive est typiquement d'environ 3,2 Go. Bowtie 2 gère les modes d'alignement écarté, local, et par paire.

The package is enhanced by the following packages: bowtie2-examples multiqc
Please cite: Ben Langmead and Steven L Salzberg: Fast gapped-read alignment with Bowtie 2. (PubMed) Nature Methods 9:357–359 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
boxshade
Rendu élégant d'alignements multiples de séquences
Versions of package boxshade
ReleaseVersionArchitectures
trixie3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.3.1-12amd64,arm64,armhf,i386
stretch3.3.1-10amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.3.1-8amd64,armel,armhf,i386
Debtags of package boxshade:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usetypesetting
works-with-formathtml, plaintext, postscript, tex
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Boxshade est conçu pour l'impression de documents de qualité présentant des séquences d'ADN ou des alignements multiples de protéines. Ce n'est pas un programme de calcul d'alignements, il lui faut un fichier en entrée créé par un outil de calcul d'alignement ou édité à la main.

Boxshade lit les alignements de séquences depuis les fichiers générés par les logiciels PILEUP-PSF, CLUSTAL-ALN, MALIGNED et ESEE (dans la limite de 150 séquences contenant au maximum 10 000 éléments chacune). De nombreux jeux d'ombre peuvent être utilisés. La sortie est affichée à l'écran ou peut être envoyée dans un fichier dans les formats suivants : ANSI/VT100, PS/EPS, RTF, HPGL, ReGIS, LJ250-printer, ASCII, xFIG, PICT, HTML.

Registry entries: Bio.tools  SciCrunch 
bwa
dispositif d'alignement Burrows-Wheeler
Versions of package bwa
ReleaseVersionArchitectures
trixie0.7.18-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.7.18-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch-backports0.7.17-1~bpo9+1amd64
stretch0.7.15-2+deb9u1amd64
jessie0.7.10-1amd64
buster0.7.17-3amd64
bookworm0.7.17-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.7.17-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package bwa:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
useanalysing, comparing
Popcon: 20 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

BWA est un paquet logiciel pour mettre en correspondance des séquences à faible divergence avec un grand génome de référence tel que le génome humain. Il est constitué de trois algorithmes : BWA-backtrack, BWA-SW et BWA-MEM. Le premier algorithme est conçu pour les lectures de séquences Illumina jusqu'à 100 paires de bases, alors que les deux autres sont conçus pour des lectures de séquences allant de 70 à 1 000 paires de bases. BWA-MEM et BWA-SW partagent des fonctionnalités communes telles que la prise en charge des lectures longues et des alignements de découpages (« split alignment »), mais BWA-MEM, plus récent, est généralement recommandé pour les requêtes de haute qualité, car il est plus rapide et plus précis. BWA-MEM a également de meilleures performances que BWA-backtrack pour les lectures Illumina de 70 à 100 paires de bases.

Please cite: Heng Li and Richard Durbin: Fast and accurate short read alignment with Burrows-Wheeler transform. (PubMed,eprint) Bioinformatics 25(14):1754-1760 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
cassiopee
outil d'indexation et de recherche dans les séquences génomiques
Versions of package cassiopee
ReleaseVersionArchitectures
bookworm1.0.9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.9-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0.9-2amd64,arm64,armhf,i386
stretch1.0.5-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0.1+dfsg-3amd64,armel,armhf,i386
bullseye1.0.9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.9-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Cassiopee est une bibliothèque d'indexation et de recherche implémentée en C. Il s'agit d'une réécriture complète de la gemme ruby Cassiopee. Elle scanne une séquence génomique d'entrée (ADN, ARN, protéine) et recherche une sous-séquence avec une correspondance parfaite ou en permettant des substitutions (mesurées avec la distance de Hamming), des insertions ou des suppressions.

Ce paquet fournit les outils cassiopee et cassiopeeknife.

Registry entries: SciCrunch  Bioconda 
cd-hit
suite de programmes conçus pour grouper rapidement des séquences
Versions of package cd-hit
ReleaseVersionArchitectures
buster4.6.8-2amd64,arm64,armhf,i386
bullseye4.8.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.8.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.8.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid4.8.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.6.1-2012-08-27-2amd64,armel,armhf,i386
stretch4.6.6-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 8 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

cd-hit contient un certain nombre de programmes conçus pour grouper rapidement des séquences. cd-hit groupe les protéines en grappes qui satisfont à un seuil de similitudes défini par l'utilisateur. cd-hit-est est similaire à cd-hit, mais conçu pour grouper des séquences (sans introns). cd-hit-est-2d est similaire à cd-hit-2d mais conçu pour comparer 2 ensembles de données de nucléotides. Un certain nombre d'autres programmes associés sont aussi dans ce paquet. De plus amples informations se trouvent dans le manuel utilisateur de cd-hit, qui se trouve dans ce paquet.

Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
cdbfasta
indexation avec Constant DataBase et outils de recherche pour les fichiers multi-FASTA
Versions of package cdbfasta
ReleaseVersionArchitectures
jessie0.99-20100722-1amd64,armel,armhf,i386
buster0.99-20100722-5amd64,arm64,armhf,i386
bullseye1.00+git20181005.014498c+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.00+git20181005.014498c+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.00+git20230710.da8f5ba+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.00+git20230710.da8f5ba+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.99-20100722-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

CDB (« Constant DataBase ») peut être utilisé pour la créer des indexes pour la recherche rapide de n'importe quelle séquence dans des fichiers au format multi-FASTA (concaténation de plusieurs fichiers au format FASTA) de taille importante. Il a la possibilité de compresser les enregistrements de données afin d'économiser de l'espace.

Registry entries: SciCrunch 
circos
outil de dessin pour visualiser des données
Versions of package circos
ReleaseVersionArchitectures
bullseye0.69.9+dfsg-2all
sid0.69.9+dfsg-2all
bookworm0.69.9+dfsg-2all
trixie0.69.9+dfsg-2all
jessie0.66-1all
stretch0.69.4+dfsg-1all
buster0.69.6+dfsg-2all
Debtags of package circos:
fieldbiology:bioinformatics
roleprogram
useviewing
Popcon: 7 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Circos affiche les données dans un graphe circulaire, de manière idéale pour étudier les relations entre objets ou positions et créer des graphiques hautement informatifs et de qualité publiable.

Ce paquet fournit le moteur de dessin de graphiques Circos qui se pilote à la ligne de commande (comme gnuplot) et est entièrement scriptable.

Please cite: Martin I Krzywinski, Jacqueline E Schein, Inanc Birol, Joseph Connors, Randy Gascoyne, Doug Horsman, Steven J Jones and Marco A Marra: Circos: An information aesthetic for comparative genomics. (PubMed,eprint) Genome Research 19(9):1639-45 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
clearcut
reconstruction d'arbre phylogénétique extrêmement efficace
Versions of package clearcut
ReleaseVersionArchitectures
jessie1.0.9-1amd64,armel,armhf,i386
sid1.0.9+git20211013.b799afe-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.9+git20211013.b799afe-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.9-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.9+git20211013.b799afe-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.9-3amd64,arm64,armhf,i386
stretch1.0.9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Clearcut est l'implémentation de référence de l'algorithme RNJ (« Relaxed Neighbor Joining ») de J. Evans, L. Sheneman et J. Foster de l'initiative pour la bioinformatique et les études évolutionnaires (IBEST) à l'université de l'Idaho.

Please cite: Jason Evans, Luke Sheneman and James A. Foster: Relaxed Neighbor-Joining: A Fast Distance-Based Phylogenetic Tree Construction Method. (PubMed) J. Mol. Evol. 62(6):785-792 (2006)
Registry entries: SciCrunch  Bioconda 
clonalframe
inférence de microévolution bactérienne en utilisant des données de séquence multilocus
Versions of package clonalframe
ReleaseVersionArchitectures
stretch1.2-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2-9amd64,arm64,armhf,i386
jessie1.2-3amd64,armel,armhf,i386
Debtags of package clonalframe:
roleprogram
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ClonalFrame identifie les relations clonales entre les membres d'un échantillon et estime la position chromosomale des évènements de recombinaison homologue qui peuvent perturber l'héritage clonal.

ClonalFrame peut être appliqué à n'importe quelle séquence de données, d'un fragment d'ADN à des génomes entiers. Il est performant dans l'analyse de données MLST, où 7 fragments de gène ont été séquencés, et devient progressivement de plus en plus performant à mesure que les régions séquencées augmentent en longueur et nombre jusqu'au génome entier. Il nécessite cependant que les séquences soient alignées. Si les données génomiques ne sont pas alignées, il est recommandé d'utiliser Mauve qui produit un alignement de génomes bactériens entiers au format requis par ClonalFrame pour l'analyse.

Please cite: Xavier Didelot and Daniel Falush: Inference of Bacterial Microevolution Using Multilocus Sequence Data. (PubMed,eprint) Genetics Advance 175:1251-1266 (2006)
Registry entries: SciCrunch 
clustalo
programme à usage général d'alignement de plusieurs séquences pour les protéines
Versions of package clustalo
ReleaseVersionArchitectures
sid1.2.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.2.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2.4-2amd64,arm64,armhf,i386
bullseye1.2.4-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.4-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.2.1-1amd64,armel,armhf,i386
Popcon: 17 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Clustal-Omega est un programme à usage général d'alignement, principalement pour les séquences d’acide aminé. Il produit des alignements de plusieurs séquences de haute qualité et est capable de manipuler des ensembles de données de centaines de milliers de séquences en un temps raisonnable en utilisant plusieurs processeurs si disponibles.

Please cite: Fabian Sievers, Andreas Wilm, David Dineen, Toby J Gibson, Kevin Karplus, Weizhong Li, Rodrigo Lopez, Hamish McWilliam, Michael Remmert, Johannes Söding, Julie D Thompson and Desmond G Higgins: Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. (PubMed,eprint) Molecular Systems Biology 7:539 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
clustalw
alignement de séquences de nucléotides ou de peptides
Versions of package clustalw
ReleaseVersionArchitectures
bookworm2.1+lgpl-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.1+lgpl-7amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster2.1+lgpl-6amd64,arm64,armhf,i386
stretch2.1+lgpl-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.1+lgpl-4amd64,armel,armhf,i386
bullseye2.1+lgpl-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.1+lgpl-7amd64,arm64,mips64el,ppc64el,riscv64,s390x
Debtags of package clustalw:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 15 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

Ce programme réalise l'alignement de séquences multiples de nucléotides ou d'acides aminés. Il identifie le format des séquences en entrée et détermine s'il s'agit d'acides nucléiques (ADN/ARN) ou d'acides aminés (peptides). Le format en sortie peut être choisi parmi divers formats pour les alignements multiples, comme Phylip ou FASTA. Clustal W est largement reconnu.

Les données en sortie de Clustal W peuvent être modifiées manuellement ou avec un éditeur d'alignement comme Seaview ou le logiciel compagnon Clustal X. Lorsqu'un modèle est construit à partir des alignements, il peut être utilisé pour améliorer les recherches dans les bases de données. Celles-ci peuvent être créées sous forme de modèles de Markov (HMM) avec le paquet HMMER.

The package is enhanced by the following packages: clustalw-mpi
Please cite: M. A. Larkin, G. Blackshields, N. P. Brown, R. Chenna, P. A. McGettigan, H. McWilliam, F. Valentin, I.M. Wallace, A. Wilm, R. Lopez, J. D. Thompson, T. J. Gibson and D. G. Higgins: Clustal W and Clustal X version 2.0. (PubMed,eprint) Bioinformatics 23(21):2947-2948 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
concavity
prédicteur de sites de liaisons de ligands de la protéine à partir de la structure et de la conservation
Versions of package concavity
ReleaseVersionArchitectures
buster0.1+dfsg.1-4amd64,arm64,armhf,i386
stretch0.1+dfsg.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.1-2amd64,armel,armhf,i386
sid0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ConCavity prédit les sites de liaisons de ligands en combinant la conservation évolutive et la structure en 3D.

ConCavity prend en entrée une structure de protéine au format PDB (« Protein Data Bank ») et des fichiers facultatifs qui caractérisent la séquence de conservation évolutive des chaînes dans le fichier de structure.

Les fichiers de résultat suivants sont produits par défaut :

 −⋅les prédictions de liaisons de ligands résidus pour chaque chaîne
    (*.scores) ;
 −⋅les prédictions de liaisons de ligands résidus au format PDB (les scores
    des résidus sont placés dans le champ dépendant de la température,
    *_residue.pdb) ;
 −⋅les emplacements de prédictions de poche au format DX (*.dx) ;
 −⋅le script PyMOL pour visualiser les prédictions (*.pml).
The package is enhanced by the following packages: conservation-code
Please cite: John A. Capra, Roman A. Laskowski, Janet M. Thornton, Mona Singh and Thomas A. Funkhouser: Predicting Protein Ligand Binding Sites by Combining Evolutionary Sequence Conservation and 3D Structure. (PubMed) PLoS Computational Biology 5(12):e1000585 (2009)
Registry entries: SciCrunch 
conservation-code
outil de notation de la conservation des séquences de protéines
Versions of package conservation-code
ReleaseVersionArchitectures
jessie20110309.0-3all
stretch20110309.0-5all
buster20110309.0-7all
bullseye20110309.0-8all
bookworm20110309.0-8all
trixie20110309.0-8all
sid20110309.0-8all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit score_conservation(1), un outil pour noter la conservation des séquences de protéines.

Les méthodes de notation de conservation suivantes sont mises en œuvre :

  • somme de paires ;
  • somme pondérées de paires ;
  • entropie de Shannon ;
  • entropie de Shannon avec des groupements de propriété (Mirny et Shakhnovich 1995, Valdar et Thornton 2001) ;
  • entropie relative avec des groupements de propriété (Williamson 1995) ;
  • entropie de von Neumann (Caffrey et al 2004) ;
  • entropie relative (Samudrala et Wang 2006) ;
  • divergence de Jensen-Shannon (Capra et Singh 2007).

Une extension à base de fenêtres intégrant la conservation estimée de résidus séquentiellement adjacents dans le score pour chaque colonne est également fournie. Cette approche de fenêtres peut être appliquée à n'importe quelle méthode de notation de conservation.

Le programme accepte les alignements dans les formats CLUSTAL et FASTA.

La sortie spécifique d'une séquence peut être utilisée comme l'entrée de conservation pour ConCavity.

La conservation est hautement prédictive dans l'identification des sites catalytiques et des résidus proches des ligands liés.

Please cite: John A. Capra and Mona Singh: Predicting functionally important residues from sequence conservation. (PubMed) Bioinformatics 23(15):1875-82 (2007)
datamash
outil de statistiques pour interface en ligne de commande
Versions of package datamash
ReleaseVersionArchitectures
buster1.4-1amd64,arm64,armhf,i386
bullseye1.7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.7-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0.6-2amd64,armel,armhf,i386
Popcon: 43 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Datamash de GNU est un programme en ligne de commande réalisant des opérations de base numériques, textuelles et statistiques sur des fichiers de données textuelles. Il est conçu pour être portable et fiable, et pour aider les chercheurs à créer facilement des enchaînements d’analyse automatiques, sans écrire de code, ni même de courts scripts.

Registry entries: SciCrunch 
dialign
alignement de plusieurs séquences par segments
Versions of package dialign
ReleaseVersionArchitectures
stretch2.2.1-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.2.1-7amd64,armel,armhf,i386
trixie2.2.1-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.2.1-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.2.1-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.2.1-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.2.1-10amd64,arm64,armhf,i386
Debtags of package dialign:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 14 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

Dialign2 est un outil qui s'utilise en ligne de commande pour réaliser plusieurs alignements de séquences de protéines ou d'ADN. Il construit les alignements de paires sans écart de segments similaires des séquences. Il est à noter que Dialign n'emploie aucun type de pénalité de l'écart.

Please cite: Burkhard Morgenstern: DIALIGN 2: improvement of the segment-to-segment approach to multiple sequence alignment. (PubMed,eprint) Bioinformatics 15(3):211-218 (1999)
Registry entries: Bio.tools  SciCrunch  Bioconda 
dialign-tx
alignement séquentiel multiple basé sur les segments
Versions of package dialign-tx
ReleaseVersionArchitectures
bookworm1.0.2-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.2-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0.2-12amd64,arm64,armhf,i386
bullseye1.0.2-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.2-7amd64,armel,armhf,i386
stretch1.0.2-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.2-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package dialign-tx:
fieldbiology, biology:bioinformatics
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 9 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

DIALIGN-TX est un outil en ligne de commandes pour réaliser un alignement multiple de séquences de protéines ou d'ADN. C'est une ré-implémentation complète de l'approche basée sur les segments incluant plusieurs nouvelles améliorations et heuristiques qui améliore significativement la qualité des alignements en sortie comparée à DIALIGN 2.2 et DIALIGN-T. Pour les alignements par paires, DIALIGN-TX utilise un algorithme de « fragment- chaining » qui favorise les chaînes d'alignements locaux de faible score plutôt que les fragments isolés de score élevé. Pour l'alignement multiple, DIALIGN-TX utilise une procédure gloutonne améliorée qui est moins sensible aux fausses similitudes locales des séquences.

The package is enhanced by the following packages: dialign-tx-data
Please cite: Amarendran R. Subramanian, Michael Kaufmann and Burkhard Morgenstern: DIALIGN-TX: greedy and progressive approaches for segment-based multiple sequence alignment. (PubMed) Algorithms for Molecular Biology 3(1):6 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
discosnp
détection du polymorphisme d'un seul nucléotide pour des ensembles bruts de lectures
Versions of package discosnp
ReleaseVersionArchitectures
bookworm2.6.2-2amd64,arm64,mips64el,ppc64el
sid2.6.2-3amd64,arm64,mips64el,ppc64el,riscv64
bullseye4.4.4-1amd64,arm64,i386,mips64el,ppc64el,s390x
stretch1.2.6-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.3.0-2amd64,arm64,i386
trixie2.6.2-3amd64,arm64,mips64el,ppc64el,riscv64
jessie1.2.5-1amd64,armel,armhf,i386
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Software discoSnp is designed for discovering Single Nucleotide Polymorphism (SNP) from raw set(s) of reads obtained with Next Generation Sequencers (NGS).

Note that number of input read sets is not constrained, it can be one, two, or more. Note also that no other data as reference genome or annotations are needed.

The software is composed by two modules. First module, kissnp2, detects SNPs from read sets. A second module, kissreads, enhance the kissnp2 results by computing per read set and for each found SNP:

 1) its mean read coverage
 2) the (phred) quality of reads generating the polymorphism.

This program is superseded by DiscoSnp++.

Registry entries: Bio.tools  SciCrunch  Bioconda 
disulfinder
prédiction de pont disulfure et de leur connectivité
Versions of package disulfinder
ReleaseVersionArchitectures
trixie1.2.11-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.2.11-4amd64,armel,armhf,i386
stretch1.2.11-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2.11-8amd64,arm64,armhf,i386
bullseye1.2.11-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.11-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.11-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package disulfinder:
roleprogram
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Disulfinder sert à la prédiction de pont disulfure pour des cystéines et leur connectivité en partant d’une séquence seule. Les ponts disulfures jouent un rôle majeur dans la stabilisation des processus de repliement pour plusieurs protéines. La prédiction de ponts disulfures à partir d'une séquence seule est par conséquent utile pour l’étude des propriétés structurelles et fonctionnelles de protéines particulières. De plus, la connaissance de l’état de pont disulfure de cystéines peut aider le processus de détermination expérimentale de la structure et peut être utile pour d’autres travaux d’annotations génomiques.

Disulfinder prédit les modèles disulfures en deux étapes de calcul : (1) l’état de pont disulfure de chaque cystéine est prédit par une classification binaire BRNN-SVM. (2) Les cystéines connues pour participer à la formation de ponts sont associées par un réseau neuronal récursif (Recursive Neural Network) pour obtenir un modèle de connectivité.

Please cite: Alessio Ceroni, Andrea Passerini, Alessandro Vullo and Paolo Frasconi: DISULFIND: a disulfide bonding state and cysteine connectivity prediction server. (PubMed) Nucleic Acids Res 34(Web Server issue):W177-181 (2006)
Registry entries: Bio.tools  SciCrunch 
dnaclust
outil de regroupement de millions de séquences courtes d’ADN
Versions of package dnaclust
ReleaseVersionArchitectures
trixie3-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid3-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3-6amd64,arm64,armhf,i386
stretch3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3-2amd64,armel,armhf,i386
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Dnaclust est un outil pour grouper un grand nombre de séquences courtes d’ADN. Les regroupements sont créés de telle façon que le « rayon » de chaque regroupement est inférieur au seuil précisé.

Les séquences entrées pour être regroupées doivent être au format Fasta. L’identifiant de chaque séquence est basé sur le premier mot de la séquence au format Fasta. Le premier mot est le préfixe de l’en-tête jusqu’à la première occurrence d’une espace dans l’en-tête.

Please cite: Mohammadreza Ghodsi, Bo Liu and Mihai Pop: DNACLUST: accurate and efficient clustering of phylogenetic marker genes. (PubMed,eprint) BMC Bioinformatics 12:271 (2011)
Registry entries: Bio.tools  SciCrunch 
dssp
assignation de la structure secondaire de la protéine basée sur la structure en 3D
Versions of package dssp
ReleaseVersionArchitectures
bookworm4.2.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.0.0-3amd64,arm64,armhf,i386
stretch2.2.1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.2.1-2amd64,armel,armhf,i386
trixie4.4.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid4.4.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye4.0.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

DSSP (« Define Secondary Structure of Proteins ») est un algorithme utilisé pour définir la structure secondaire d'une protéine en se basant sur sa structure résolue en 3D.

Cette version (4.2) de DSSP est une réécriture qui écrit des fichiers mmCIF annotés par défaut, mais qui peut toujours produire l’ancien format dssp. Une nouveauté est la prise en charge des hélices PP.

Registry entries: Bio.tools  SciCrunch 
embassy-domainatrix
commandes supplémentaires EMBOSS pour manipuler un fichier de classification de domaines
Versions of package embassy-domainatrix
ReleaseVersionArchitectures
stretch0.1.660-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64
buster0.1.660-3amd64,arm64,armhf,i386
bullseye0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64
jessie0.1.650-1amd64,armel,armhf,i386
bookworm0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package embassy-domainatrix:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, converting, editing, searching
works-with-formatplaintext
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Les logiciels DOMAINATRIX ont été développés par Jon Ison et ses collègues pour le projet HGMP (« Human Genome Mapping Project » − projet de cartographie du génome humain) au Medical Research Council (MRC) en Angleterre, pour leurs recherches dans le domaine de la protéine. Ils sont inclus dans un paquet embassy comme un travail en cours.

Les logiciels de la publication actuelle de domainatrix sont :

  • cathparse : crée un fichier DCF à partir de fichiers bruts CATH ;
  • domainnr : supprime les domaines redondants d'un fichier DCF ;
  • domainreso : supprime les domaines à faible résolution d'un fichier DCF ;
  • domainseqs : ajoute des enregistrements de séquences à un fichier DCF ;
  • domainsse : ajoute des enregistrements de structure secondaire à un fichier DCF ;
  • scopparse : crée un fichier DCF à partir de fichiers bruts SCOP ;
  • ssematch : parcourt un fichier DCF à la recherche de correspondances de la structure secondaire.
embassy-domalign
commandes EMBOSS additionnelles pour l'alignement dans le domaine des protéines
Versions of package embassy-domalign
ReleaseVersionArchitectures
stretch0.1.660-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64
jessie0.1.650-1amd64,armel,armhf,i386
trixie0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64
buster0.1.660-3amd64,arm64,armhf,i386
bullseye0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package embassy-domalign:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, editing
works-with-formatplaintext
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Les programmes DOMALIGN ont été développés par Jon Ison et ses collègues de MRC HGMP dans le cadre de leurs travaux de recherche dans le domaine des protéines. Ils sont inclus comme un paquet EMBASSY en cours de développement.

Les applications de la version courante de DOMALIGN sont allversusall (comparaison de données de séquences similaires à partir de all-versus- all), domainalign (génère des alignements (fichier DAF) pour des nœuds d'un fichier DCF), domainrep (réordonne un fichier DCF afin d'identifier des structures représentatives) et seqalign (étend les alignements (fichier DAF) avec des séquences (fichier DHF)).

embassy-domsearch
commandes supplémentaires EMBOSS pour la recherche dans les domaines de la protéine
Versions of package embassy-domsearch
ReleaseVersionArchitectures
bookworm0.1.660-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1.660-4amd64,arm64,mips64el,ppc64el,riscv64
bullseye0.1.660-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.660-3amd64,arm64,armhf,i386
jessie0.1.650-1amd64,armel,armhf,i386
stretch0.1.660-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.1.660-4amd64,arm64,mips64el,ppc64el,riscv64
Debtags of package embassy-domsearch:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Les logiciels domsearch ont été développés par Jon Ison et ses collègues pour le projet HGMP (« Human Genome Mapping Project » − projet de cartographie du génome humain) au Medical Research Council (MRC) en Angleterre, pour leurs recherches dans le domaine de la protéine. Ils sont inclus dans un paquet embassy comme un travail en cours.

Les logiciels de cette publication de domsearch sont :

  • seqfraggle : supprime des séquences de fragments des fichiers DHF ;
  • seqnr : supprime la redondance des fichiers DHF ;
  • seqsearch : crée des succès (« hits ») PSI-BLAST (de fichier DHF) à partir d'un fichier DAF ;
  • seqsort : supprime les séquences classifiées ambigues des fichiers DHF ;
  • seqwords : crée des fichiers DHF à partir de la recherche par mot-clé de la base de données UniProt.
emboss
ensemble de logiciels libres pour la biologie moléculaire européenne
Versions of package emboss
ReleaseVersionArchitectures
bullseye6.6.0+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid6.6.0+dfsg-15amd64,arm64,mips64el,ppc64el,riscv64
trixie6.6.0+dfsg-15amd64,arm64,mips64el,ppc64el,riscv64
jessie6.6.0+dfsg-1amd64,armel,armhf,i386
stretch6.6.0+dfsg-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster6.6.0+dfsg-7amd64,arm64,armhf,i386
bookworm6.6.0+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package emboss:
fieldbiology, biology:bioinformatics, biology:molecular
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, editing, organizing, searching, text-formatting, typesetting, viewing
works-withdb
works-with-formatplaintext
Popcon: 27 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

EMBOSS (« European Molecular Biology Open Software Suite ») est un paquet de logiciels d'analyse libre et gratuit, spécialement développé pour les besoins de la communauté d'utilisateurs de la biologie moléculaire (par exemple EMBnet – « European Molecular Biology network »). Le logiciel prend automatiquement en charge les données dans divers formats et permet même une recherche transparente des données de séquences à partir du web. De plus, comme des bibliothèques importantes sont fournies avec le paquet, il s'agit d'une plate-forme permettant aux autres scientifiques de développer et publier des logiciels dans l'esprit du libre. EMBOSS intègre également un ensemble de paquets actuellement disponibles et des outils pour l'analyse de séquences dans un tout cohérent. EMBOSS casse la tendance historique vers des logiciels commerciaux.

The package is enhanced by the following packages: clustalw primer3
Please cite: Peter Rice, Ian Longden and Alan Bleasby: EMBOSS: The European Molecular Biology Open Software Suite. (PubMed) Trends in Genetics 16(6):276 - 277 (2000)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package emboss
exonerate
outil générique pour la comparaison de deux séquences
Versions of package exonerate
ReleaseVersionArchitectures
stretch2.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.2.0-6amd64,armel,armhf,i386
sid2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.0-4amd64,arm64,armhf,i386
Debtags of package exonerate:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usesearching
works-with-formatplaintext
Popcon: 59 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet exonerate permet d'aligner des séquences en utilisant de nombreux modèles d'alignement, en utilisant soit de la programmation dynamique exhaustive, soit divers procédés heuristiques. La plupart des fonctionnalités de l'ensemble de la programmation dynamique ont été réécrites en C pour une meilleure efficacité. Le paquet exonerate est un composant intrinsèque de la construction des bases de données du projet Ensembl genome (par le centre de recherche European Bioinformatics Institute pour fournir des données à l'échelle du génome pour des espèces non-vertébrée), fournissant des notes de similitudes entre les séquences ARN et ADN et ainsi des variants d'épissage et les séquences de codage en général.

Un système In-silico PCR Experiment Simulation (voir la page du manuel d'ipcress) est fourni avec le paquet exonerate.

Ce paquet vient aussi avec une sélection d'utilitaires pour la réalisation rapide de manipulations simples avec des fichiers FASTA dépassant 2 Go.

Please cite: Guy C. Slater and Ewan Birney: Automated generation of heuristics for biological sequence comparison. (PubMed,eprint) BMC Bioinformatics 6(1):31 (2005)
Registry entries: Bio.tools  SciCrunch  Bioconda 
fastdnaml
outil pour la construction d'arbres phylogénétiques de séquences d'ADN
Versions of package fastdnaml
ReleaseVersionArchitectures
buster1.2.2-14amd64,arm64,armhf,i386
jessie1.2.2-10amd64,armel,armhf,i386
sid1.2.2-17amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.2-17amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.2-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2.2-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.2.2-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package fastdnaml:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

fastDNAml est un logiciel dérivé de la version 3.3 du logiciel DNAML (« DNA Maximum Likelihood ») de Joseph Felsenstein faisant partie de son paquet PHYLIP (« PHYLogeny Inference Package »). Les utilisateurs devraient consulter la documentation de DNAML avant d'utiliser ce logiciel.

Le logiciel fastDNAml est une tentative de résoudre le même problème que DNAML, mais de le faire plus rapidement et en utilisant moins de mémoire. Ainsi, les grands arbres phylogénétiques qui reproduisent l'amorçage deviennent traitables. Une grande partie du logiciel fastDNAml est simplement un recodage de la version 3.3 du DNAML de PHYLIP du langage Pascal au C.

La page d'accueil de ce logiciel n'étant plus disponible, ce logiciel ne verra donc probablement pas d'autres mises à jour.

Please cite: Gary J. Olsen, Hideo Matsuda, Ray Hagstrom and Ross Overbeek: fastDNAml: a tool for construction of phylogenetic trees of DNA sequences using maximum likelihood. (PubMed,eprint) Comput Appl Biosci 10(1):41-48 (1994)
fastlink
version plus rapide des programmes de généalogie génétique Linkage
Versions of package fastlink
ReleaseVersionArchitectures
sid4.1P-fix100+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.1P-fix100+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.1P-fix100+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie4.1P-fix95-3amd64,armel,armhf,i386
stretch4.1P-fix100+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.1P-fix100+dfsg-2amd64,arm64,armhf,i386
bullseye4.1P-fix100+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package fastlink:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

L'analyse de généalogie génétique est une technique statistique utilisée pour cartographier les gènes et trouver une approximation de l'emplacement de gènes malades. C'était un paquet logiciel standard pour la généalogie génétique appelée LINKAGE. FASTLINK est une version significativement modifiée et améliorée des programmes principaux de LINKAGE qui fonctionne plus rapidement de manière séquentielle, peut fonctionner en parallèle, permet à l'utilisateur une bonne récupération après un plantage de l'ordinateur et fournit une documentation nouvelle et abondante. FASTLINK a été utilisé dans plus de 1000 publications de généalogie génétique.

Ce paquet contient les programmes suivants :

 – ilink :    procédure d'optimisation GEMINI pour trouver une valeur
              optimale locale du vecteur thêta des fractions de
              recombinaison ;
 – linkmap :  calcul les scores de localisation d'un « locus » sur une
              carte déterminée d'autres « loci » ;
 – lodscore : comparaison des vraisemblances à un thêta optimum local ;
 – mlink :    calcul des « LOD score » et le risque avec deux « loci »
              et plus ;
 – unknown :  identification des génotypes possibles pour des inconnus.
Please cite: R. W. Cottingham Jr., R. M. Idury and A. A. Schaffer: Faster Sequential Genetic Linkage Computations. (PubMed,eprint) American Journal of Human Genetics 53(1):252-263 (1993)
Registry entries: SciCrunch 
fastqc
contrôle qualité pour les données de séquences à haut débit
Versions of package fastqc
ReleaseVersionArchitectures
trixie0.12.1+dfsg-4all
buster0.11.8+dfsg-2all
sid0.12.1+dfsg-4all
bullseye0.11.9+dfsg-4all
bookworm0.11.9+dfsg-6all
stretch0.11.5+dfsg-6all
jessie0.11.2+dfsg-3all
Popcon: 19 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

FastQC a pour objectif de fournir un moyen simple de faire des contrôles de qualité sur des données de séquences brutes provenant de pipelines de séquençage à haut débit. Il propose un ensemble modulaire d'analyses pouvant être utilisées pour donner une impression rapide des problèmes dont l'utilisateur devrait être au courant avant de faire une analyse plus poussée.

Les principales fonctions de FastQC sont :

  • import des données des fichiers BAM (version binaire compressée de SAM), SAM (« Sequence Alignment/Map ») ou FastQ (n'importe quelle variante) ;
  • fournir un aperçu rapide pour indiquer les zones dans lesquelles il peut y avoir des problèmes ;
  • des graphes de résumé et des tables pour évaluer rapidement les données ;
  • export des résultats vers un rapport permanent en HTML ;
  • fonctionnement hors ligne afin de permettre la génération de rapports automatiques sans exécuter l'application interactive.
The package is enhanced by the following packages: multiqc
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing
fasttree
arbres phylogénétiques à partir d'alignements de nucléotides ou des séquences de protéines
Versions of package fasttree
ReleaseVersionArchitectures
trixie2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.1.10-2amd64,arm64,armhf,i386
stretch2.1.9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.1.7-2amd64,armel,armhf,i386
sid2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 7 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet FastTree déduit les arbres phylogénétiques de probabilité approximativement maximale des alignements de nucléotides ou des séquences de protéines. Il manipule des alignements jusqu'à un million de séquences en une quantité de temps et de mémoire raisonnable. Pour de grands alignements, le paquet FastTree est 100 à 1000 fois plus rapide que la version 3.0 du paquet PhyML ou la version 7 du paquet RAxML.

Le paquet FastTree est plus précis que la version 3 du paquet PhyML avec des paramètres par défaut, et bien plus précis que les méthodes de matrices de distances qui sont traditionnellement utilisées pour de grands alignements. Le paquet FastTree utilise les modèles de Jukes-Cantor (1969) ou « Generalized Time Reversible » (GTR . Simon Tavaré , 1986) de l'évolution de nucléotides et le modèle de Jones, Taylor and Thornton (1992) de l'évolution des acides aminés. Pour tenir compte des taux variants de l'évolution à travers les sites, FastTree utilise un taux unique de chaque site (l'approximation CAT). Pour estimer rapidement la fiabilité de chaque scission dans l'arbre, le paquet FastTree calcule les valeurs d'appui avec le test de Shimodaira-Hasegawa (1999 ; Ces valeurs d'appui sont les mêmes que « les appuis locaux de type Shimodaira-Hasegawa » de la version 3 du paquet PhyML.)

Ce paquet contient une version à processus en série (fasttree) et une version à processus en parallèle qui utilise OpenMP (fasttreMP).

Please cite: Morgan N. Price, Paramvir S. Dehal and Adam P. Arkin: FastTree 2 -- Approximately Maximum-Likelihood Trees for Large Alignments.. (PubMed,eprint) PLoS ONE 5(3):e9490 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
fitgcp
fitting genome coverage distributions with mixture models
Versions of package fitgcp
ReleaseVersionArchitectures
sid0.0.20150429-5all
trixie0.0.20150429-5all
jessie0.0.20130418-2amd64,i386
stretch0.0.20150429-1amd64,arm64,mips64el,ppc64el
buster0.0.20150429-2amd64,arm64
bullseye0.0.20150429-4all
bookworm0.0.20150429-5all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Genome coverage, the number of sequencing reads mapped to a position in a genome, is an insightful indicator of irregularities within sequencing experiments. While the average genome coverage is frequently used within algorithms in computational genomics, the complete information available in coverage profiles (i.e. histograms over all coverages) is currently not exploited to its full extent. Thus, biases such as fragmented or erroneous reference genomes often remain unaccounted for. Making this information accessible can improve the quality of sequencing experiments and quantitative analyses.

fitGCP is a framework for fitting mixtures of probability distributions to genome coverage profiles. Besides commonly used distributions, fitGCP uses distributions tailored to account for common artifacts. The mixture models are iteratively fitted based on the Expectation-Maximization algorithm.

Please cite: Martin S. Lindner, Maximilian Kollock, Franziska Zickmann and Bernhard Y. Renard: Analyzing genome coverage profiles with applications to quality control in metagenomics. (PubMed,eprint) Bioinformatics 29(10):1260-1267 (2013)
Registry entries: SciCrunch 
flexbar
code-barres flexible et suppression de l'adaptation pour les plateformes de séquençage
Versions of package flexbar
ReleaseVersionArchitectures
bullseye3.5.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.50-1amd64,armhf,i386
sid3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.4.0-2amd64,arm64,armhf,i386
trixie3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.50-2amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el
bookworm3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet Flexbar prétraite les données de séquençage efficacement et à haut débit. Il démultiplexe les lectures de code-barres et enlève les séquences d'adaptation. De plus, les fonctionnalités de découpage et de filtrage sont fournies. Le paquet Flexbar augmente les taux de correspondance et améliore les assemblages du génome et du transcriptome. Il gère les données de séquençage de dernière génération aux formats FASTA/Q et CSFASTA/Q des plateformes de l'entreprise Illumina, 454 de l'entreprise Roche et SOLiD de l'entreprise AppliedBIosystems.

Les noms de paramètres ont changé dans le paquet Flexbar. Veuillez donc vérifier vos scripts. Ces derniers mois, les paramètres par défaut ont été optimisés, plusieurs bogues ont été réparés, et diverses améliorations ont été effectuées, par exemple une interface en ligne de commande rénovée, de nouveaux modes de découpage ainsi que des exigences plus faibles en temps et en mémoire.

The package is enhanced by the following packages: multiqc
Please cite: Matthias Dodt, Johannes T. Roehr, Rina Ahmed and Christoph Dieterich: FLEXBAR — Flexible Barcode and Adapter Processing for Next-Generation Sequencing Platforms. (eprint) Biology 1(3):895-905 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
freecontact
prédicteur rapide de contact de protéine
Versions of package freecontact
ReleaseVersionArchitectures
bullseye1.0.21-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.21-3amd64,armel,armhf,i386
stretch1.0.21-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.21-7amd64,arm64,armhf,i386
bookworm1.0.21-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.21-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0.21-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

FreeContact est un prédicteur de contact de résidu de protéine optimisé pour la vitesse. Son entrée est un alignement de séquences multiples. FreeContact peut servir comme un remplaçant accéléré des prédicteurs de contact existants EVfold-mfDCA de DS. Marks (2011) et PSICOV de D. Jones (2011).

FreeContact est accéléré par une combinaison de vecteurs, plusieurs fils d’exécution et une implémentation plus rapide des parties clés. Selon l’alignement, des accélérations de huit fois ou supérieures sont possibles.

Un alignement suffisamment grand est nécessaire pour des résultats significatifs. Comme minimum, un alignement avec un nombre de séquences effectif (après pondération) supérieur à la longueur de la séquence recherchée devrait être utilisé. Des alignements de dizaines de milliers de séquences (effectives) sont considérés comme une bonne entrée.

Par exemple, jackhmmer(1) du paquet hmmer ou hhblits(1) de hhsuite peuvent être utilisés pour générer les alignements.

Ce paquet fournit l’outil en ligne de commande freecontact(1).

Please cite: László Kaján, Thomas A. Hopf, Matúš Kalaš, Debora S. Marks and Burkhard Rost: FreeContact: fast and free software for protein contact prediction from residue co-evolution. BMC Bioinformatics (2014)
Topics: Structure prediction; Sequence analysis
gasic
genome abundance similarity correction
Versions of package gasic
ReleaseVersionArchitectures
bullseye0.0.r19-7all
jessie0.0.r18-2amd64
stretch0.0.r19-1amd64
buster0.0.r19-4amd64
sid0.0.r19-8all
trixie0.0.r19-8all
bookworm0.0.r19-8all
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

One goal of sequencing based metagenomic analysis is the quantitative taxonomic assessment of microbial community compositions. However, the majority of approaches either quantify at low resolution (e.g. at phylum level) or have severe problems discerning highly similar species. Yet, accurate quantification on species level is desirable in applications such as metagenomic diagnostics or community comparison. GASiC is a method to correct read alignment results for the ambiguities imposed by similarities of genomes. It has superior performance over existing methods.

The package is enhanced by the following packages: gasic-examples
Please cite: Martin S. Lindner and Bernhard Y. Renard: Metagenomic abundance estimation and diagnostic testing on species level. (PubMed,eprint) Nucleic Acids Research 41(1):e10 (2013)
Registry entries: SciCrunch 
genometools
boîte à outils polyvalente d'analyse du génome
Versions of package genometools
ReleaseVersionArchitectures
jessie1.5.3-2amd64,armel,armhf,i386
sid1.6.5+ds-2.2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.6.5+ds-2.2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm-backports1.6.5+ds-2~bpo12+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye-backports-sloppy1.6.5+ds-2~bpo11+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.6.2+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.6.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster-backports1.6.1+ds-3~bpo10+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.5.10+ds-3amd64,arm64,armhf,i386
stretch1.5.9+ds-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package genometools:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
uitoolkitncurses
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet GenomeTools contient une collection d'outils utiles pour l'analyse de séquences biologiques et la présentation regroupés en un simple exécutable.

La boîte à outils contient les programmes exécutables pour les séquences et la manipulation des annotations, la compression de séquences, la génération de la structure de l'index et de l'accès, la visualisation de l'annotation, et bien plus.

Please cite: Gordon Gremme, Sascha Steinbiss and Stefan Kurtz: GenomeTools: a comprehensive software library for efficient processing of structured genome annotations.. (PubMed) IEEE/ACM Transactions on Computational Biology and Bioinformatics 10(3):645-656 (2013)
Registry entries: Bio.tools 
gff2aplot
tracés d'alignements par paires pour les séquences génomiques avec PostScript
Versions of package gff2aplot
ReleaseVersionArchitectures
bullseye2.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.0-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.0-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.0-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.0-7amd64,armel,armhf,i386
stretch2.0-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.0-11amd64,arm64,armhf,i386
Debtags of package gff2aplot:
fieldbiology, biology:bioinformatics
interfacecommandline, shell
roleprogram
scopeutility
useconverting, viewing
works-withimage:vector
works-with-formatplaintext, postscript
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Gff2aplot est un logiciel pour visualiser ensemble l'alignement de deux séquences de génomes et leurs annotations. À partir de fichiers d'entrée au format GFF, il produit les images PostScript pour cet alignement. Le menu suivant liste les nombreuses fonctionnalités du logiciel gff2aplot⋅:

 -⋅des tracés d'alignements complets pour toute caractéristique du fichier
   GFF. Les attributs sont définis séparément, de sorte que vous pouvez
   les modifier uniquement quels que soient les attributs pour un fichier
   donné ou partager la même personnalisation à travers différents
   ensembles de données⋅;
 -⋅tous les paramètres sont définis par défaut à l'intérieur du logiciel,
   mais ils peuvent être aussi pleinement configurés par des fichiers de
   personnalisation flexibles de type gff2ps. Le logiciel peut manipuler
   plusieurs de ces fichiers, résumant tous les paramètres avant de
   produire la figure correspondante. De plus, tous les paramètres de
   personnalisation peuvent être définis par des interrupteurs en ligne
   de commande, qui permettent aux utilisateurs de jouer avec ces
   paramètres avant d'en ajouter à un fichier de personnalisation.
   L'ordre de la source est choisi à partir des fichiers d'entrée, si
   vous échangez l'ordre des fichiers, vous pouvez visualiser
   l'alignement et ses annotations avec la nouvelle disposition en
   entrée⋅;
 -⋅l'ordre des fichiers source est choisi à partir des fichiers d'entrée,
   si vous échangez l'ordre des fichiers, vous pouvez visualiser
   l'alignement et ses annotations avec la nouvelle disposition⋅;
 -⋅tous les scores des alignements peuvent être visualisés dans la boîte
   «⋅Picture in Picture⋅» en dessous la zone gff2aplot, utilisant des
   niveaux de gris en couleur, des niveaux de la couleur définie par
   l'utilisateur ou des gradients dépendants du score⋅;
 -⋅des polices vectorielles, qui peuvent être choisies parmi les polices de
   base par défaut avec PostScript. Les labels de caractéristiques et de
   groupes peuvent être pivotés pour améliorer la lisibilité dans les deux
   axes d'annotation⋅;
 -⋅le logiciel est toujours défini comme un filtre Unix, ainsi il peut
   manipuler des données des fichiers, redirections et pipes, l'écriture
   produite vers la sortie standard et avertissements vers la sortie
   d'erreur standard⋅;
 -⋅le logiciel gff2aplot est capable de gérer de nombreux formats de page
   réelle (de A0 à A10, et plus - voir les tailles de page disponibles
   dans son manuel), incluant celles définies par l'utilisateur. Cela
   permet, par exemple, la génération de cartes génomiques de la taille
   d'un poster ou l'utilisation d'un appareil de traçage gérant le papier
   continu, en portrait ou en paysage⋅;
 -⋅vous pouvez dessiner différents alignements sur le même tracé et les
   distinguer en utilisant différentes couleurs pour chaque alignement⋅;
 -⋅le dictionnaire de formes a été élargi, de sorte que d'autres
   caractéristiques de formes sont maintenant disponible (voir le
   manuel)⋅;
 -⋅les projections d'annotation à travers les tracés d'alignements
   (appelés rubans) émulent les transparences par des modèles de
   remplissage de couleurs complémentaires. Cette fonctionnalité permet
   de montrer la pseudo-fusion de couleur lorsque les rubans horizontaux
   et verticaux se chevauchent.
Please cite: J. F. Abril, R. Guigó and T. Wiehe: gff2aplot: Plotting sequence comparisons. (PubMed,eprint) Bioinformatics 19(18):2477-2479 (2003)
Registry entries: Bio.tools 
gff2ps
Produit des graphiques PostScript à partir de fichiers GFF
Versions of package gff2ps
ReleaseVersionArchitectures
buster0.98l-2all
bookworm0.98l-6all
trixie0.98l-6all
sid0.98l-6all
stretch0.98d-5all
bullseye0.98l-4all
jessie0.98d-4all
Debtags of package gff2ps:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useconverting, viewing
works-withimage:vector
works-with-formatpostscript
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

gff2ps est un script développé pour convertir des enregistrements au format GFF en dessins PostScript de haute qualité. De tels graphiques peuvent être utiles pour comparer des structures génomiques et visualiser les résultats des programmes d'annotation de génomes. Il peut être utilisé très facilement car il suppose que le fichier GFF contient assez d'informations de formatage mais il possède aussi un grand nombre d'options et un fichier de configuration pour une meilleure personnalisation.

Please cite: J. F. Abril and R. Guigó: gff2ps: visualizing genomic annotations.. (PubMed,eprint) Bioinformatics 16(8):743-744 (2000)
Registry entries: Bio.tools  SciCrunch 
giira
RNA-Seq driven gene finding incorporating ambiguous reads
Versions of package giira
ReleaseVersionArchitectures
buster0.0.20140625-2amd64
stretch0.0.20140625-1amd64
jessie0.0.20140210-2amd64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

GIIRA is a gene prediction method that identifies potential coding regions exclusively based on the mapping of reads from an RNA-Seq experiment. It was foremost designed for prokaryotic gene prediction and is able to resolve genes within the expressed region of an operon. However, it is also applicable to eukaryotes and predicts exon intron structures as well as alternative isoforms.

Please cite: Franziska Zickmann, Martin S. Lindner and Bernhard Y. Renard: GIIRA—RNA-Seq driven gene finding incorporating ambiguous reads. (PubMed,eprint) Bioinformatics (2013)
Registry entries: Bio.tools  SciCrunch 
glam2
motifs de protéines lacunaires de séquences non alignées
Versions of package glam2
ReleaseVersionArchitectures
sid1064-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1064-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1064-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1064-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1064-5amd64,arm64,armhf,i386
stretch1064-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1064-3amd64,armel,armhf,i386
Debtags of package glam2:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Glam2 est un paquet pour trouver des motifs dans les séquences, typiquement les séquences d'acides aminés ou de nucléotides. Un motif est un motif de séquence qui se reproduit : les exemples typiques sont la boîte TATA et le motif de prénylation CaaX. La principale innovation de glam2 est qu'il permet les insertions et les suppressions dans les motifs.

Ce paquet fournit des programmes pour découvrir les motifs partagés par un ensemble de séquences et trouver des correspondances à ces motifs dans une base de données de séquences, ainsi que des utilitaires pour convertir les motifs de glam2 en formats d’alignement standard, masquant les motifs de glam2 dans des séquences de façon que des motifs moindres puissent être trouvés et en retirant des portions hautement similaires d’un ensemble de séquences.

Le paquet inclut les logiciels suivants :

 — glam2 :découvrir les motifs partagés par un jeu de séquences ;
 — glam2scan : trouver des correspondances, dans une base de données de
    séquences, pour un motif découvert par glam2 ;
 — glam2format : conversion des motifs avec glam2 aux formats d'alignement
    standard ;
 — glam2mask : masquage des motifs de séquences avec glam2, de sorte que
    les motifs plus faibles peuvent être trouvés ;
 — glam2-purge : suppression de membres très similaires d'un ensemble de
    séquences.

Dans ce paquet, la transformée de Fourier rapide (FFT) a été activée pour glam2.

Please cite: Martin C. Frith, Neil F. W. Saunders, Bostjan Kobe and Timothy L. Bailey: Discovering Sequence Motifs with Arbitrary Insertions and Deletions. (PubMed) PLoS Computational Biology 4(5):e1000071 (2008)
Screenshots of package glam2
gmap
alignement d’épissage et tolérante sur les SNP pour les lectures courtes et mNRA
Versions of package gmap
ReleaseVersionArchitectures
jessie2014-10-22-1 (non-free)amd64
bullseye2021-02-22+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm2021-12-17+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie2024-10-20+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid2024-10-20+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
buster2019-01-24-1 (non-free)amd64
stretch2017-01-14-1 (non-free)amd64
Debtags of package gmap:
fieldbiology, biology:bioinformatics, biology:structural
roleprogram
useanalysing
Popcon: 2 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les programmes GMAP et GSNAP ainsi que des utilitaires pour gérer des bases de données concernant le génome au format GMAP/GSNAP. GMAP (Genomic Mapping and Alignment Program) est un outil pour aligner les séquences EST, mRNA et cDNA. GSNAP (Genomic Short-read Nucleotide Alignment Program) est un outil pour aligner les lectures de transcriptome à partir d’une ou de deux extrémités. Ces deux outils peuvent utiliser une base de données de :

 – sites d’épissage connus et des sites nouveaux identifiés d’épissage ;
 – polymorphismes de nucléotide simple connus (SNP).
GSNAP peut aligner de l’ADN traité avec du bisulfite.
Please cite: Thomas D. Wu and Serban Nacu: Fast and SNP-tolerant detection of complex variants and splicing in short reads. (PubMed,eprint) Bioinformatics 26(7):873-81 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
grinder
simulateur polyvalent de lecture de séquençage global et d'amplicon omiques
Versions of package grinder
ReleaseVersionArchitectures
trixie0.5.4-6all
bullseye0.5.4-6all
buster0.5.4-5all
bookworm0.5.4-6all
stretch0.5.4-1all
jessie0.5.3-3all
sid0.5.4-6all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Grinder est un programme polyvalent pour créer des bibliothèques de séquences aléatoires globales et d'amplicons basées sur des séquences de référence d'ADN, d'ARN ou de protéines fournies dans un fichier FASTA.

Grinder peut produire des ensembles de données globales et d'amplicons génomiques, méta-génomiques, transcriptomiques, méta-transcriptomiques, protéomiques, méta-protéomiques à partir de technologies de séquençage actuelles comme Sanger, 454, Illumina. Ces ensembles de données simulés peuvent être utilisés pour tester la précision d'outils bio-informatiques sous des hypothèses spécifiques, par exemple sans ou avec erreurs de séquençage, ou avec une grande ou faible diversité de communauté. Grinder peut aussi être utilisé pour aider à choisir entre des méthodes de séquençage alternatives pour un projet basé sur séquences, par exemple, si la banque doit être à extrémités appariées ou non, ou combien de lectures doivent être séquencées.

Please cite: Florent E. Angly, Dana Willner, Forest Rohwer, Philip Hugenholtz and Gene W. Tyson: Grinder: a versatile amplicon and shotgun sequence simulator. (PubMed,eprint) Nucleic Acids Research Epub ahead of print (2012)
Registry entries: SciCrunch 
gromacs
Simulateur de dynamique moléculaire avec outils d'analyse et de préparation
Versions of package gromacs
ReleaseVersionArchitectures
stretch2016.1-2amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2020.6-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2019.1-1amd64,arm64,armhf,i386
bookworm2022.5-2amd64,arm64,mips64el,ppc64el,s390x
trixie2024.3-2amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid2024.4-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
jessie5.0.2-1amd64,armel,armhf,i386
Debtags of package gromacs:
fieldbiology, biology:structural, chemistry
interfacecommandline, x11
roleprogram
uitoolkitxlib
x11application
Popcon: 21 users (16 upd.)*
Versions and Archs
License: DFSG free
Git

GROMACS est un paquet polyvalent pour faire de la dynamique moléculaire, comme la simulation d'équations newtoniennes du mouvement de systèmes de millions de particules.

Il a été créé en premier lieu pour les molécules biochimiques comme les protéines et les lipides qui ont beaucoup d'interactions covalentes compliquées, mais comme GROMACS est extrêmement rapide pour calculer les interactions non covalentes (qui souvent dominent les simulations), beaucoup de groupes l'utilisent aussi pour la recherche sur des systèmes non biologiques, comme les polymères.

Ce paquet fournit des variantes pour l’exécution sur une seule machine et pour utiliser l’interface MPI sur plusieurs machines.

Please cite: Berk Hess, Carsten Kutzner, David van der Spoel and Erik Lindahl: GROMACS 4: Algorithms for Highly Efficient, Load-Balanced, and Scalable Molecular Simulation. (eprint) J. Chem. Theory Comput. 4(3):435-447 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
hhsuite
recherche de séquence de protéines basée sur l’alignement HMM-HMM
Versions of package hhsuite
ReleaseVersionArchitectures
trixie3.3.0+ds-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid3.3.0+ds-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm3.3.0+ds-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye3.3.0+ds-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
jessie2.0.16-5amd64
stretch3.0~beta2+dfsg-3amd64
buster3.0~beta3+dfsg-3amd64
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

HH-suite est un logiciel au code source ouvert pour la recherche de séquences de protéines basé sur l’alignement par paire de modèles de Markov cachés (HMM).

Ce paquet fournit HHsearch et HHblits parmi d’autres programmes et utilitaires.

HHsearch prend en entrée un alignement de plusieurs séquences (MSA) ou de HMM de profil et recherche dans une base de données d’HMM (par exemple, PDB, Pfam ou InterPro) pour des protéines homologues. HHsearch est souvent utilisé pour la prédiction de structure de protéines pour détecter des modèles homologues et pour construire des alignements par paire précis de modèle de requête pour la modélisation d’homologie.

HHblits peut construire des MSA de haute qualité à partir d’une seule séquence ou de plusieurs. Il les transforme en HMM de requête et, en utilisant une stratégie de requêtes itératives, ajoute des séquences significativement semblables de la recherche précédente pour l’HMM de requête mis à jour pour la prochaine itération de recherche. Comparé à PSI-BLAST, HHblits est plus rapide, jusqu’à deux fois plus sensible et produit des alignements plus précis.

Please cite: Michael Remmert, Andreas Biegert, Andreas Hauser and Johannes Söding: HHblits: Lightning-fast iterative protein sequence searching by HMM-HMM alignment.. (PubMed) Nat. Methods 9(2):173-175 (2011)
Registry entries: SciCrunch  Bioconda 
hisat2
graph-based alignment of short nucleotide reads to many genomes
Versions of package hisat2
ReleaseVersionArchitectures
stretch2.0.5-1amd64
sid2.2.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.2.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.1.0-2amd64
bookworm2.2.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.2.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

HISAT2 is a fast and sensitive alignment program for mapping next-generation sequencing reads (both DNA and RNA) to a population of human genomes (as well as against a single reference genome). Based on an extension of BWT for graphs a graph FM index (GFM) was designed and implementd. In addition to using one global GFM index that represents a population of human genomes, HISAT2 uses a large set of small GFM indexes that collectively cover the whole genome (each index representing a genomic region of 56 Kbp, with 55,000 indexes needed to cover the human population). These small indexes (called local indexes), combined with several alignment strategies, enable rapid and accurate alignment of sequencing reads. This new indexing scheme is called a Hierarchical Graph FM index (HGFM).

The package is enhanced by the following packages: multiqc
Please cite: Daehwan Kim, Joseph M. Paggi, Chanhee Park, Christopher Bennett and Steven L. Salzberg: Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology 37(8):907-915 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
hmmer
profilage de modèles de Markov cachés pour la recherche de séquences
Versions of package hmmer
ReleaseVersionArchitectures
sid3.4+dfsg-2amd64,arm64,i386
stretch3.1b2+dfsg-5amd64,i386
bullseye3.3.2+dfsg-1amd64,i386
jessie3.1b1-3amd64,armel,armhf,i386
buster3.2.1+dfsg-1amd64,i386
bookworm3.3.2+dfsg-1amd64,i386
trixie3.4+dfsg-2amd64,arm64,i386
Debtags of package hmmer:
biologyformat:aln, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usesearching
works-withdb
works-with-formatplaintext
Popcon: 21 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

HMMER est une implémentation des profils de modèles de Markov cachés pour rechercher des séquences biologiques dans des banques de données en les interrogeant avec des alignements multiples de séquences.

À partir d'un alignement multiple de séquences, HMMER construit un modèle statistique appelé « modèle de Markov caché », qui peut ensuite être utilisé pour interroger une banque de séquences afin de trouver plus d'homologues à la famille de séquences et, éventuellement, de les aligner.

Please cite: S. R. Eddy: Profile hidden Markov models. (PubMed,eprint) Bioinformatics 14(9):755-763 (1998)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package hmmer
idba
iterative De Bruijn Graph short read assemblers
Versions of package idba
ReleaseVersionArchitectures
bullseye1.1.3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.1.2-1amd64,armel,armhf,i386
stretch1.1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.3-3amd64,arm64,armhf,i386
bookworm1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

IDBA stands for iterative de Bruijn graph assembler. In computational sequence biology, an assembler solves the puzzle coming from large sequencing machines that feature many gigabytes of short reads from a large genome.

This package provides several flavours of the IDBA assembler, as they all share the same source tree but serve different purposes and evolved over time.

IDBA is the basic iterative de Bruijn graph assembler for second-generation sequencing reads. IDBA-UD, an extension of IDBA, is designed to utilize paired-end reads to assemble low-depth regions and use progressive depth on contigs to reduce errors in high-depth regions. It is a generic purpose assembler and especially good for single-cell and metagenomic sequencing data. IDBA-Hybrid is another update version of IDBA-UD, which can make use of a similar reference genome to improve assembly result. IDBA-Tran is an iterative de Bruijn graph assembler for RNA-Seq data.

Please cite: Yu Peng, Henry C. M. Leung, S. M. Yiu and Francis Y. L. Chin: IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth. (PubMed,eprint) Bioinformatics 28(11):1420-1428 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
infernal
inférence d’alignements structurels secondaires d’ARN
Versions of package infernal
ReleaseVersionArchitectures
bookworm1.1.4-1amd64,i386
trixie1.1.5-2amd64,arm64,i386
bullseye1.1.4-1amd64,i386
buster1.1.2-2amd64,i386
jessie1.1.1-2amd64,i386
sid1.1.5-2amd64,arm64,i386
stretch1.1.2-1amd64,i386
Debtags of package infernal:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 13 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Infernal ("INFERence of RNA ALignment") recherche dans des bases de données de séquences d’ADN des similarités de structures ou séquences d’ARN. Il fournit une implémentation d’une variante spéciale de grammaires de profil stochastiques indépendantes du contexte appelées modèles de covariance. Un modèle est comme un profil de séquence, mais il marque une combinaison de séquence consensus et de structure consensus secondaire d’ARN, aussi dans bien des cas, il est plus capable d’identifier des homologues d’ARN qui conservent leur structure secondaire plus que leur séquence primaire.

Cet outil est un composant essentiel de la base de données Rfam.

Please cite: Eric P. Nawrocki, Diana L. Kolbe and Sean R. Eddy: Infernal 1.0: inference of RNA alignments. (PubMed,eprint) Bioinformatics 25(10):1335-1337 (2009)
Registry entries: SciCrunch  Bioconda 
jellyfish
count k-mers in DNA sequences
Versions of package jellyfish
ReleaseVersionArchitectures
buster2.2.10-2amd64,arm64
jessie2.1.4-1amd64
bullseye2.3.0-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm2.3.0-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el
trixie2.3.1-3amd64,arm64,mips64el,ppc64el,riscv64
sid2.3.1-3amd64,arm64,mips64el,ppc64el,riscv64
stretch2.2.6-1amd64
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

JELLYFISH is a tool for fast, memory-efficient counting of k-mers in DNA. A k-mer is a substring of length k, and counting the occurrences of all such substrings is a central step in many analyses of DNA sequence. JELLYFISH can count k-mers using an order of magnitude less memory and an order of magnitude faster than other k-mer counting packages by using an efficient encoding of a hash table and by exploiting the "compare-and-swap" CPU instruction to increase parallelism.

JELLYFISH is a command-line program that reads FASTA and multi-FASTA files containing DNA sequences. It outputs its k-mer counts in an binary format, which can be translated into a human-readable text format using the "jellyfish dump" command.

The package is enhanced by the following packages: multiqc
Please cite: Guillaume Marcais and Carl Kingsford: A fast, lock-free approach for efficient parallel counting of occurrences of k-mers. Bioinformatics 27(6):764-770 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
kalign
Alignement séquentiel multiple global et progressif
Versions of package kalign
ReleaseVersionArchitectures
sid3.4.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.03+20110620-5amd64,arm64,armhf,i386
stretch2.03+20110620-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.03+20110620-2amd64,armel,armhf,i386
trixie3.4.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.3.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package kalign:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 12 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Kalign est un outil en ligne de commande pour l'alignement de séquences biologiques (ADN, ARN, proteïnes). Il utilise l'algorithme de concordance de chaînes Muth-Manber pour améliorer la précision et la vitesse de l'alignement. Il utilise une démarche d'alignement globale, progressive, enrichie par l'usage d'un algorithme de concordance de chaînes approché pour calculer les différences de séquence et par l'incorporation des correspondances locales dans tout autre alignement global.

Please cite: Lassmann, Timo.: Kalign 3: multiple sequence alignment of large datasets. (eprint) Bioinformatics 36(6):1928-1929 (2020)
Registry entries: Bio.tools  SciCrunch 
kissplice
détection de diverses sortes de polymorphismes dans les données du séquençage de l'ARN
Versions of package kissplice
ReleaseVersionArchitectures
trixie2.6.7-1amd64,arm64,mips64el,ppc64el,riscv64
sid2.6.7-1amd64,arm64,mips64el,ppc64el,riscv64
bullseye2.5.3-3amd64,arm64,mips64el,ppc64el
buster2.4.0-p1-4amd64,arm64
jessie2.2.1-3amd64
stretch2.4.0-p1-1amd64,arm64,mips64el,ppc64el
bookworm2.6.2-2amd64,arm64,mips64el,ppc64el
Debtags of package kissplice:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
works-withbiological-sequence
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

KisSplice est un logiciel qui permet l'analyse des données du séquençage de l'ARN avec ou sans génome de référence. C'est un assembleur de transcriptome local et exact, qui permet d'identifier les SNP (« Single-Nucleotide Polymorphism »), les insertions et les suppressions de bases azotées dans l'ADN d'un organisme et les événements d'épissage alternatif. Il peut traiter un nombre arbitraire de conditions biologiques, et quantifiera chaque type de données dans chaque condition biologique. Il a été testé sur des ensembles de données issus d'un système de séquençage de l'entreprise Illumina jusqu'à 1 milliards de lectures. Sa consommation en mémoire vive est d'environ 5 Go pour 100 millions de lectures.

Please cite: Gustavo AT Sacomoto, Janice Kielbassa, Rayan Chikhi, Raluca Uricaru, Pavlos Antoniou, Marie-France Sagot, Pierre Peterlongo and Vincent Lacroix: KISSPLICE: de-novo calling alternative splicing events from RNA-seq data. (PubMed,eprint) BMC Bioinformatics 13((Suppl 6)):S5 (2012)
Registry entries: SciCrunch  Bioconda 
Topics: RNA-seq; RNA splicing; Gene structure
last-align
comparaison de séquences biologiques à l'échelle du génome
Versions of package last-align
ReleaseVersionArchitectures
bullseye1179-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster963-2amd64,arm64,armhf,i386
stretch830-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie490-1amd64,armel,armhf,i386
sid1542-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1542-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1447-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package last-align:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

LAST est un logiciel permettant de comparer et aligner des séquences, typiquement des séquences d'ADN ou de protéines. LAST est similaire à BLAST, mais il s'en sort mieux avec les grandes quantités de données de séquences. Voici deux choses pour lesquelles LAST est bon :

  • la comparaison de grands génomes (ceux de mammifères par exemple) ;
  • la mise en correspondance de nombreuses étiquettes de séquences avec un génome.

La principale innovation technique vient du fait que LAST trouve les correspondances initiales en se basant sur leur multiplicité au lieu d'utiliser une taille fixe (par exemple, BLAST utilise des 10-mers). Cela permet de faire correspondre des étiquettes aux génomes sans masques répétitifs, sans être débordé par les correspondances répétitives. Pour trouver ces correspondances de tailles variables, il utilise un tableau de suffixes inspiré de Vmatch. Afin d'avoir une grande sensibilité, LAST utilise a tableau de suffixes non contigu, similaires aux seeds espacées.

Please cite: Martin C. Frith, Raymond Wan and Paul Horton: Incorporating sequence quality data into alignment improves DNA read mapping. (PubMed,eprint) Nucl. Acids Res. 38(7):e100 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
loki
analyse de déséquilibre de liaison avec des chaînes de Markov
Versions of package loki
ReleaseVersionArchitectures
sid2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.7.4-8amd64,arm64,armhf,i386
stretch2.4.7.4-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.4.7.4-5amd64,armel,armhf,i386
Debtags of package loki:
fieldbiology
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 48 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Ce programme opère une analyse de liaison multipoint par une méthode utilisant des chaînes de Markov Monte Carlo (MCMC) sur des généalogies complexes et de grande taille. Pour le moment, le paquet ne propose que l'analyse de caractères quantitatifs, mais cette restriction sera levée dans une version future. L'estimation combinée du nombre de QTL (Quantitative Trait Loci), de leur position et de leurs effets est faite par un saut réversible MCMC (RJMCMC). Il est aussi possible de faire des analyses de type « affected only IBD (Identity By Descent) sharing ».

The package is enhanced by the following packages: loki-doc
macs
analyse basée sur modèles de ChIP-Seq venant de séquenceurs de lectures courtes
Versions of package macs
ReleaseVersionArchitectures
sid3.0.2-1amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
stretch2.1.1.20160309-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.2.1-1amd64,arm64,armhf,i386
jessie2.0.9.1-1amd64,armel,armhf,i386
trixie3.0.2-1amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
bullseye2.2.7.1-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
bookworm2.2.7.1-6amd64,arm64,armel,armhf,i386,ppc64el,s390x
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MACS modélise empiriquement la longueur des fragments ChIP séquencés, qui tend à être plus courte que les estimations de taille par sonication ou banque de construction, et l'utilise pour améliorer la résolution spatiale de sites de liaison prévisible. MACS utilise aussi une distribution de Poisson dynamique pour capturer efficacement des biais locaux dans la séquence du génome, permettant une prédiction plus sensible et robuste. MACS est tout à fait comparable aux algorithmes existants de recherche de pics dans les ChIP-Seq, est disponible publiquement en open source, et peut être utilisé pour des ChIP-Seq sans ou avec échantillons de contrôle.

Please cite: Yong Zhang, Tao Liu, Clifford A Meyer, Jérôme Eeckhoute, David S. Johnson, Bradley E. Bernstein, Chad Nussbaum, Richard M. Myers, Myles Brown, Wei Li and X Shirley Liu: Model-based Analysis of ChIP-Seq (MACS). (PubMed,eprint) Genome Biol. 9(9):R137 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mafft
programme d'alignement multiple pour des séquences de nucléotides ou d'acides aminés
Versions of package mafft
ReleaseVersionArchitectures
bookworm7.505-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye7.475-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster7.407-2amd64,arm64,armhf,i386
stretch7.307-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie7.205-1amd64,armel,armhf,i386
sid7.505-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie7.505-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream7.525
Debtags of package mafft:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 18 users (8 upd.)*
Newer upstream!
License: DFSG free
Git

MAFFT est un programme d'alignement multiple de séquences qui offre trois méthodes orientées précision : - L-INS-i : probablement la plus précise ; recommandée pour moins de

   200 séquences ; méthode de raffinement itératif qui incorpore les
   informations d'alignement des paires locales ;
- G-INS-i : convient pour des séquences de longueurs similaires ;
   recommandée pour moins de 200 séquences ; méthode de raffinement
   itératif qui incorpore les informations d'alignement des paires
   globales ;
- E-INS-i : convient pour des séquences qui contiennent de grandes régions
   non-alignables ; recommandée pour moins de 200 séquences.
   MAFFT fournit également cinq méthodes orientées vitesse :
 - FFT-NS-i : méthode de raffinement itératif de deux cycles seulement ;
 - FFT-NS-i : méthode de raffinement itératif d'un maximum de 1 000
itérations ;

- FFT-NS-2 : rapide, méthode progressive ; - FFT-NS-1 : très rapide, recommandé pour plus de 2 000 séquences ; méthode progressive avec un arbre de recherche grossier ; - NW-NS-PartTree-1 : recommandé pour environ 50 000 séquences ; méthode progressive avec l'algorithme PartTree.

Please cite: Kazutaka Katoh and Hiroyuki Toh: Recent developments in the MAFFT multiple sequence alignment program. (PubMed) Brief Bioinform 9(4):286-298 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mapsembler2
bioinformatics targeted assembly software
Versions of package mapsembler2
ReleaseVersionArchitectures
bullseye2.2.4+dfsg1-3amd64,arm64,ppc64el,s390x
jessie2.1.6+dfsg-1amd64,armel,armhf,i386
stretch2.2.3+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
bookworm2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
trixie2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
buster2.2.4+dfsg-3amd64,arm64,armhf,i386
sid2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Mapsembler2 is a targeted assembly software. It takes as input a set of NGS raw reads (fasta or fastq, gzipped or not) and a set of input sequences (starters).

It first determines if each starter is read-coherent, e.g. whether reads confirm the presence of each starter in the original sequence. Then for each read-coherent starter, Mapsembler2 outputs its sequence neighborhood as a linear sequence or as a graph, depending on the user choice.

Mapsembler2 may be used for (not limited to):

  • Validate an assembled sequence (input as starter), e.g. from a de Bruijn graph assembly where read-coherence was not enforced.
  • Checks if a gene (input as starter) has an homolog in a set of reads
  • Checks if a known enzyme is present in a metagenomic NGS read set.
  • Enrich unmappable reads by extending them, possibly making them mappable
  • Checks what happens at the extremities of a contig
  • Remove contaminants or symbiont reads from a read set
Please cite: Pierre Peterlongo and Rayan Chikhi: Mapsembler, targeted and micro assembly of large NGS datasets on a desktop computer. (PubMed) BMC Bioinformatics 13:48 (2012)
Registry entries: Bio.tools  Bioconda 
maq
correspondance de lectures de séquences d'ADN polymorphique de longueur courte à des séquences de référence
Versions of package maq
ReleaseVersionArchitectures
stretch0.7.1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.7.1-8amd64,arm64,armhf,i386
bookworm0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.7.1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.7.1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.7.1-5amd64,armel,armhf,i386
Debtags of package maq:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 7 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Maq (« Mapping and Assembly with Quality » − correspondance et assemblage de qualité) construit des associations de correspondance de lectures courtes générées par des machines de séquençage de nouvelles générations. Le logiciel a été particulièrement conçu pour l'analyseur de génome Solexa à 1 milliard de bases par exécution, par l'entreprise Illumina, et dispose d'une fonctionnalité préliminaire pour manipuler des données ABI SOLiD. Le logiciel Maq est déjà connu sous le nom de mapass2.

Le développement du logiciel Maq s'est arrêté en 2008. Ses successeurs sont BWA (« Burrows-Wheeler Aligner ») et SAMtools (« Sequence Alignment/Map tools »).

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.tools  SciCrunch 
melting
calcule la température de fusion de duplex d'acide nucléique
Versions of package melting
ReleaseVersionArchitectures
buster5.2.0-1all
jessie4.3.1+dfsg-1amd64,armel,armhf,i386
stretch4.3.1+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid5.2.0-2all
trixie5.2.0-2all
bookworm5.2.0-2all
bullseye5.2.0-2all
Debtags of package melting:
biologynuceleic-acids
fieldbiology, biology:molecular
interfacecommandline
roleprogram
scopeutility
suitegnu
useanalysing
works-with-formatplaintext
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ce programme calcule, pour un duplex d'acide nucléique, l'enthalpie, l'entropie et la température de fusion des transitions de la spire hélicoïde. Trois types d'hybridation sont possibles : ADN/ADN, ADN/ARN, et ARN/ARN. Le programme calcule d'abord l'enthalpie et l'entropie d'hybridation à partir des paramètres élémentaires de chaque paire de Crick par la méthode de proximité. Ensuite, la température de fusion est calculée. L'ensemble des paramètres thermodynamiques peut être facilement modifié, par exemple pour suivre une avancée expérimentale.

Please cite: Le Novère, Nicolas: MELTING, computing the melting temperature of nucleic acid duplex. (PubMed,eprint) Bioinformatics 17(12):1226-1227 (2001)
Registry entries: Bio.tools 
Screenshots of package melting
minia
assembleur de lectures courtes de séquences biologiques
Versions of package minia
ReleaseVersionArchitectures
trixie3.2.6-4amd64,arm64,mips64el,ppc64el,riscv64
sid3.2.6-4amd64,arm64,mips64el,ppc64el,riscv64
buster1.6906-2amd64,arm64,armhf,i386
stretch1.6906-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.2.6-3amd64,arm64,mips64el,ppc64el
jessie1.6088-1amd64,armel,armhf,i386
bullseye3.2.1+git20200522.4960a99-1amd64,arm64,i386,mips64el,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Ce qui était mentionné comme séquençage « nouvelle génération » d’ADN jusqu’à 2020 produisait seulement des lectures « courtes » jusqu’à environ 600 paires de base en longueur qui devaient être entremêlées selon des chevauchements aléatoires dans leur séquence pour obtenir un génome complet. C’est l’assemblage de génome, mais il existe de nombreux écueils biologiques sur de longs tronçons de régions sans grande complexité et de variations de nombre de copies et d’autres sortes de redondance qui rendent cela difficile.

Ce paquet fournit un assembleur de lectures courtes de séquences d’ADN basé sur le graphe de Bruijn, capable d’assembler le génome humain sur un ordinateur de bureau en un jour.

La sortie de Minia est un ensemble de contigs, c’est-à-dire de tronçons de chevauchements linéaires sans trou de lectures courtes. Dans le meilleur des cas, il s’agit du chromosome entier.

Minia produit des résultats de contiguïté et de précision similaires à ceux des autres assembleurs de Bruijn (par exemple, Velvet).

Please cite: Rayan Chikhi and Guillaume Rizk: Space-Efficient and Exact de Bruijn Graph Representation Based on a Bloom Filter.. (PubMed,eprint) Algorithms for Molecular Biology 8(1):22 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
mipe
Outil de sauvegarde de données dérivées de PCR
Versions of package mipe
ReleaseVersionArchitectures
trixie1.1-9all
stretch1.1-5all
sid1.1-9all
bookworm1.1-9all
bullseye1.1-9all
buster1.1-7all
jessie1.1-4all
Debtags of package mipe:
fieldbiology, biology:bioinformatics, biology:molecular
interfacecommandline
roledocumentation, program
scopeutility
useorganizing
works-with-formatxml
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

MIPE fournit un format standard pour échanger et/ou enregistrer toutes les informations associées aux expérimentations PCR en utilisant un fichier texte simple. Cela permet :

  • d'échanger des données PCR entre chercheurs/laboratoires ;
  • de fournir une traçabilité des données ;
  • d'éviter des problèmes lors de la soumission de données à dbSTS ou dbSNP ;
  • d'écrire des scripts standards d'extraction de données (par exemple une liste de « PCR primers », positions SNP ou haplotypes pour différents animaux).

Bien que cet outil puisse être utilisé pour enregistrer des données, son but principal est l'échange de données. Pour de plus grands dépôts de données, des bases de données relationnelles sont plus appropriées pour leur enregistrement. Le format MIPE pourrait alors être utilisé pour importer et/ou exporter vers ces bases de données.

Please cite: Jan Aerts and T. Veenendaal: MIPE - a XML-format to facilitate the storage and exchange of PCR-related data. Online Journal of Bioinformatics 6(2):114-120 (2005)
Registry entries: SciCrunch 
mira-assembler
assembleur de séquences génomiques exprimées utilisant la méthode globale
Versions of package mira-assembler
ReleaseVersionArchitectures
bookworm4.9.6-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.9.6-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.9.6-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.0.2-1amd64,armel,armhf,i386
stretch4.9.6-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.9.6-4amd64,arm64,armhf,i386
bullseye4.9.6-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package mira-assembler:
roleprogram
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

L’assembleur de fragments de génome mira est un assembleur spécialisé pour les projets classés comme difficiles car concernant un nombre élevé de répétitions. Pour la transcription de marqueurs de séquence exprimée (EST), miraEST est spécialisé dans la reconstruction de transcriptions d’ARNm pures tout en détectant et classifiant les polymorphismes d'un seul nucléotide (SNP) se produisant dans celles-ci.

L’assembleur est systématiquement utilisé pour des tâches variées telles que la détection de mutation dans différents types de cellule, l’analyse de similarités de transcriptions de divers organismes, l’assemblage de séquences pures à partir de diverses sources pour la conception d’oligonucléotides dans les expérimentations cliniques de biopuces.

Ce paquet fournit les binaires (exécutables) suivants :

 — mira : assemblage de séquences génomiques ;
 — miramem : estimation de la mémoire nécessaire pour les projets
   d’assemblage ;
 – mirabait : outil de type « grep » pour choisir les lectures pour des
   k-mer jusqu’à 256 bases ;
 – miraconvert : outil pour convertir, extraire et parfois recalculer
   toutes sortes de données relatives aux fichiers d’assemblage de
   séquences.
Please cite: Bastien Chevreux, Thomas Pfisterer, Bernd Drescher, Albert J. Driesel, Werner E. G. Müller, Thomas Wetter and Sándor Suhai: Using the miraEST Assembler for Reliable and Automated mRNA Transcript Assembly and SNP Detection in Sequenced ESTs. (PubMed,eprint) Genome Research 14(6):1147-1159 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mlv-smile
Find statistically significant patterns in sequences
Versions of package mlv-smile
ReleaseVersionArchitectures
sid1.47-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.47-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.47-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.47-6amd64,arm64,armhf,i386
stretch1.47-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.47-3amd64,armel,armhf,i386
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Smile determines sequence motifs on the basis of a set of DNA, RNA or protein sequences.

  • No hard limit on the number of combinations of motifs to describe subsets of sequences.
  • The sequence alphabet may be specified.
  • The use of wildcards is supported.
  • Better determination of significance of motifs by simulation.
  • Introduction of a set of sequences with negative controls that should not match automatically determined motifs.
mothur
ensemble pour analyse de séquences pour la recherche sur le microbiome
Versions of package mothur
ReleaseVersionArchitectures
stretch1.38.1.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.33.3+dfsg-2amd64,armel,armhf,i386
bullseye1.44.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.48.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.48.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.48.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.41.21-1amd64,arm64,armhf,i386
upstream1.48.2
Debtags of package mothur:
roleprogram
Popcon: 3 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Mothur cherche à développer une application unique à source ouvert, extensible, remplissant tous les besoins les besoins de la bio-informatique pour la communauté de l’écologie microbienne. Sont intégrées, entre autres, les fonctions de DOTUR, SONS, TreeClimber, S-LibShuff et UniFrac. De plus pour améliorer la flexibilité de ces algorithmes, un certain nombre de fonctions ont été ajoutées telles que des outils de calcul ou d’affichage.

Please cite: Patrick D Schloss, Sarah L Westcott, Thomas Ryabin, Justine R Hall, Martin Hartmann, Emily B Hollister, Ryan A Lesniewski, Brian B Oakley, Donovan H Parks, Courtney J Robinson, Jason W Sahl, Blaz Stres, Gerhard G Thallinger, David J Van Horn and Carolyn F Weber: Introducing mothur: Open-source, platform-independent, community-supported software for describing and comparing microbial communities. (PubMed) Appl Environ Microbiol 75(23):7537-7541 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Microbial ecology
mrbayes
Bayesian Inference of Phylogeny
Versions of package mrbayes
ReleaseVersionArchitectures
sid3.2.7a-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.2.7a-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie3.2.3+dfsg-1amd64,armel,armhf,i386
bullseye3.2.7a-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.2.6+dfsg-2amd64,arm64,armhf,i386
bookworm3.2.7a-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.2.6+dfsg-1amd64,arm64,armhf,i386
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Bayesian inference of phylogeny is based upon a quantity called the posterior probability distribution of trees, which is the probability of a tree conditioned on the observations. The conditioning is accomplished using Bayes's theorem. The posterior probability distribution of trees is impossible to calculate analytically; instead, MrBayes uses a simulation technique called Markov chain Monte Carlo (or MCMC) to approximate the posterior probabilities of trees.

The package is enhanced by the following packages: mrbayes-doc
Please cite: Fredrik Ronquist, Maxim Teslenko, Paul van der Mark, Daniel L. Ayres, Aaron Darling, Sebastian Höhna, Bret Larget, Liang Liu, Marc A. Suchard and John P. Huelsenbeck: MrBayes 3.2: Efficient Bayesian Phylogenetic Inference and Model Choice across a Large Model Space. (PubMed,eprint) Systematic Biology (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package mrbayes
mummer
Alignement de séquence efficace de génomes complets
Versions of package mummer
ReleaseVersionArchitectures
stretch3.23+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.23~dfsg-2amd64,armel,armhf,i386
buster3.23+dfsg-4amd64,arm64,armhf,i386
bullseye3.23+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.23+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.23+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.23+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream4.0.0.~beta5
Debtags of package mummer:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 56 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

MUMmer a été conçu pour aligner rapidement des génomes entiers, bruts ou finis. Par exemple, MUMmer 3.0 peut trouver toutes les régions identiques sur plus de 20 paires de bases entre deux génomes de 5 mégabases en 13,7 secondes, sur un ordinateur tournant à 2.4 GHz en utilisant 78 Mo de mémoire. MUMmer peut aussi aligner des génomes incomplets ; il manipule les centaines ou les milliers de contigs d'un projet de séquençage « shotgun » avec aisance, et les alignera sur un autre génome ou une autre collection de contigs en utilisant le programme NUCmer, inclus dans le système. Si les génomes proviennent d'espèces trop différentes pour que des similarités soient détectées au niveau nucléotidique, le programme PROmer générera des alignements basés sur la traduction des six phases de lectures de chaque génome.

The package is enhanced by the following packages: e-mem
Please cite: Stefan Kurtz, Adam Phillippy, Arthur L. Delcher, Michael Smoot, Martin Shumway, Corina Antonescu and Steven L. Salzberg: Versatile and open software for comparing large genomes. (PubMed) Genome Biology 5(2):R12 (2004)
Registry entries: Bio.tools  Bioconda 
Topics: Sequence analysis
Screenshots of package mummer
muscle
programme d'alignements multiples de séquences de protéine
Versions of package muscle
ReleaseVersionArchitectures
jessie3.8.31-1amd64,armel,armhf,i386
sid5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.8.31+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.8.1551-2amd64,arm64,armhf,i386
bullseye3.8.1551-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream5.3
Debtags of package muscle:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 17 users (12 upd.)*
Newer upstream!
License: DFSG free
Git

MUSCLE est un programme d'alignements multiples de séquences de protéine. L'acronyme MUSCLE signifie « MUltiple Sequence Comparison by Log-Expectation ». D'après les tests des auteurs, MUSCLE réalise les meilleurs résultats de tous les programmes testés sur plusieurs bancs de mesure concernant la précision d'alignement et est aussi un des plus rapides.

Muscle v5 est une réécriture majeure de MUSCLE basée sur de nouveaux algorithmes.

Les utilisateurs doivent faire attention à ce que les arguments de ligne de commande ne sont plus les mêmes que ceux des versions 3.x de MUSCLE.

Meilleure précision, extensible à des milliers de séquences

Comparé aux version précédentes, Muscle v5 est plus précis, souvent plus rapide et extensible à des ensembles de données plus grands. Au moment de son écriture (fin 2021), Muscle v5 réalise les meilleurs scores sur plusieurs bancs d’essai dont Balibase, Bralibase, Prefab et Balifam. Il peut aligner des milliers de séquences avec une grande précision sur un ordinateur de bas prix (par exemple, un CPU 8 cœurs d’Intel avec 32 Gb de RAM). Pour de grands ensembles de données, Muscle v5 est 20 à 30 % plus précis que MAFFT et Clustal-Omega.

Ensembles d’alignements

Muscle v5 peut générer des ensembles d’alignements alternatifs de haute précision. Toutes les réplications ont une précision moyenne égale lors de test sur banc d’essai, y compris les alignements multiples de séquences avec les paramètres par défaut. En comparant les résultats d’analyse en aval (arbres, prédiction de structure…) de différentes réplications, il est possible d’évaluer les effets des erreurs d’alignements lors d’études.

Please cite: Robert C. Edgar: MUSCLE: multiple sequence alignment with high accuracy and high throughput. (PubMed,eprint) Nucleic Acids Research 32(5):1792-1797 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
Screenshots of package muscle
muscle3
multiple alignment program of protein sequences
Versions of package muscle3
ReleaseVersionArchitectures
sid3.8.1551-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.8.1551-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.8.1551-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

MUSCLE is a multiple alignment program for protein sequences. MUSCLE stands for multiple sequence comparison by log-expectation. In the authors tests, MUSCLE achieved the highest scores of all tested programs on several alignment accuracy benchmarks, and is also one of the fastest programs out there.

This is version 3 of the muscle program. It is a different program than muscle version 5 which is packaged as muscle in Debian.

Please cite: Robert C. Edgar: MUSCLE: multiple sequence alignment with high accuracy and high throughput. (PubMed,eprint) Nucleic Acids Research 32(5):1792-1797 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
mustang
alignement structurel multiple de protéines
Versions of package mustang
ReleaseVersionArchitectures
stretch3.2.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.2.2-1amd64,armel,armhf,i386
sid3.2.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.2.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.2.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.2.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.2.3-3amd64,arm64,armhf,i386
Debtags of package mustang:
biologypeptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing, comparing
works-with-formatplaintext
Popcon: 12 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

Mustang est un algorithme pour aligner des structures multiples de protéines. Avec un ensemble donné de fichiers PDB, le programme utilise l'information spatiale dans les atomes Calpha de l'ensemble pour produire une séquence d'alignement. Basé sur un appairage heuristique progressif, l'algorithme traite ensuite un certain nombre de repasses d'affinage. Mustang rapporte les alignements de séquence multiples et la superposition de structures correspondantes.

The package is enhanced by the following packages: mustang-testdata
Please cite: Arun S. Konagurthu, James C. Whisstock, Peter J. Stuckey and Arthur M. Lesk: MUSTANG: A multiple structural alignment algorithm. (PubMed) Proteins: Structure, Function, and Bioinformatics 64(3):559-574 (2006)
Registry entries: Bio.tools 
Screenshots of package mustang
ncbi-epcr
outil pour vérifier la présence d'un marqueur dans une séquence d'ADN
Versions of package ncbi-epcr
ReleaseVersionArchitectures
sid2.3.12-1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.3.12-1-2amd64,armel,armhf,i386
stretch2.3.12-1-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.3.12-1-7amd64,arm64,armhf,i386
bullseye2.3.12-1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.3.12-1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3.12-1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package ncbi-epcr:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usechecking, searching
works-with-formatplaintext
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

« Electronic PCR » (« e-PCR ») est une procédure de calcul utilisée pour tester la présence de séquences uniques d'ADN (en anglais : STS, sequence tagged sites) dans une séquence génomique. e-PCR recherche de potentielles STS dans des séquences génomiques en recherchant des sous-séquences très similaires aux amorces de PCR (en anglais : Polymerase Chain Reaction) et correctement ordonnées, orientées et espacées qui puissent représenter les amorces PCR utilisées pour générer les STS connus.

La nouvelle version de E-PCR implémente une stratégie de reconnaissance floue. Pour réduire les chances qu'une vraie STS puisse être oubliée, des mots multiples et discontinus peuvent être utilisés au lieu d'un seul mot exact. Chacun de ces mots a des groupes de positions significatives séparés par des positions « joker » qui ne sont pas requises pour correspondre. De plus il est possible d'autoriser des trous dans les alignements de l'amorce.

La principale motivation pour implémenter une recherche inversée (« Reverse e-PCR ») était de rendre possible la recherche de séquence dans le génome humain et d'autres gros génomes. La nouvelle version de e-PCR fournit un mode de recherche utilisant une requête de séquence dans une base de données.

Ce programme est abandonné par l’amont et il est conseillé d’utiliser Primer-Blast (https://www.ncbi.nlm.nih.gov/tools/primer-blast/) à la place.

Please cite: Gregory D. Schuler: Sequence Mapping by Electronic PCR. (PubMed,eprint) Genome Research 7(5):541-550 (1997)
Registry entries: Bioconda 
ncbi-tools-bin
bibliothèques du NCBI pour applications de biologie –⋅utilitaires en mode texte
Versions of package ncbi-tools-bin
ReleaseVersionArchitectures
sid6.1.20170106+dfsg2-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie6.1.20170106+dfsg2-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm6.1.20170106+dfsg1-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye6.1.20170106+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster6.1.20170106+dfsg1-0+deb10u2amd64,arm64,armhf,i386
stretch6.1.20170106+dfsg1-0+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie6.1.20120620-8amd64,armel,armhf,i386
Debtags of package ncbi-tools-bin:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
networkclient
roleprogram
sciencecalculation
scopeutility
useanalysing, calculating, converting, searching
works-withbiological-sequence
works-with-formatplaintext, xml
Popcon: 7 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit certains utilitaires distribués avec le kit de développement en⋅C du NCBI dont les outils de développement asntool et errhdr (antérieurement dans le paquet libncbi6-dev). Aucun des programmes de ce paquet n'a besoin de⋅X⋅; les utilitaires basés sur⋅X se trouvent dans le paquet ncbi-tools-x11. BLAST et les outils qui lui sont liés sont issus maintenant d'une base de sources différentes, correspondant aux anciens paquets ncbi-blast+ et ncbi-blast+-legacy.

The package is enhanced by the following packages: mcl
Registry entries: Bio.tools  SciCrunch 
ncoils
prédiction de structure secondaire de superhélice
Versions of package ncoils
ReleaseVersionArchitectures
bookworm2002-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2002-4amd64,armel,armhf,i386
stretch2002-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2002-7amd64,arm64,armhf,i386
bullseye2002-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2002-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2002-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 9 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Ce programme prévoit la structure secondaire des superhélices de séquences de protéine. L’algorithme a été publié dans Lupas, van Dyke & Stock, Predicting coiled coils from protein sequences Science, 252, 1162-1164, 1991.

Please cite: Andrei Lupas, Marc Van Dyke and Jeff Stock: Predicting coiled coils from protein sequences. (PubMed) Science 252:1162-1164 (1991)
Registry entries: Bio.tools  SciCrunch 
neobio
calcul d'alignements de séquences d'acides aminés et de nucléotides
Versions of package neobio
ReleaseVersionArchitectures
buster0.0.20030929-4all
jessie0.0.20030929-1.1all
bullseye0.0.20030929-6all
bookworm0.0.20030929-6all
trixie0.0.20030929-6all
sid0.0.20030929-6all
stretch0.0.20030929-2all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit une bibliothèque et et une interface graphique utilisateur pour les alignements de séquences par paires. Il s'agit dune mise en œuvre des méthodes de programmation dynamique de Needleman & Wunsch (alignement global) et de Smith & Waterman (alignement local).

Please cite: Maxime Crochemore, Gad M. Landau and Michal Ziv-Ukelson: A sub-quadratic sequence alignment algorithm for unrestricted cost matrices. :679-688 (2002)
Registry entries: Bio.tools 
Screenshots of package neobio
paraclu
Parametric clustering of genomic and transcriptomic features
Versions of package paraclu
ReleaseVersionArchitectures
sid10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster9-2amd64,arm64,armhf,i386
bullseye9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie9-1amd64,armel,armhf,i386
stretch9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm10-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Paraclu finds clusters in data attached to sequences. It was first applied to transcription start counts in genome sequences, but it could be applied to other things too.

Paraclu is intended to explore the data, imposing minimal prior assumptions, and letting the data speak for itself.

One consequence of this is that paraclu can find clusters within clusters. Real data sometimes exhibits clustering at multiple scales: there may be large, rarefied clusters; and within each large cluster there may be several small, dense clusters.

Please cite: Martin C. Frith, Eivind Valen, Anders Krogh, Yoshihide Hayashizaki, Piero Carninci and Albin Sandelin: A code for transcription initiation in mammalian genomes. (eprint) Genome Research 18(1):1-12 (2008)
parsinsert
Parsimonious Insertion of unclassified sequences into phylogenetic trees
Versions of package parsinsert
ReleaseVersionArchitectures
buster1.04-4amd64,arm64,armhf,i386
stretch1.04-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.04-15amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
trixie1.04-15amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.04-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.04-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.04-1amd64,armel,armhf,i386
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ParsInsert efficiently produces both a phylogenetic tree and taxonomic classification for sequences for microbial community sequence analysis. This is a C++ implementation of the Parsimonious Insertion algorithm.

The package is enhanced by the following packages: parsinsert-testdata
pdb2pqr
Preparation of protein structures for electrostatics calculations
Versions of package pdb2pqr
ReleaseVersionArchitectures
trixie3.6.1+dfsg-1all
stretch2.1.1+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.9.0+dfsg-1amd64,armel,armhf,i386
bookworm3.5.2+dfsg-3all
bullseye2.1.1+dfsg-7+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.6.1+dfsg-1all
buster2.1.1+dfsg-5amd64,arm64,armhf,i386
upstream3.6.2
Popcon: 11 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

PDB2PQR is a Python software package that automates many of the common tasks of preparing structures for continuum electrostatics calculations. It thus provides a platform-independent utility for converting protein files in PDB format to PQR format. These tasks include:

  • Adding a limited number of missing heavy atoms to biomolecular structures
  • Determining side-chain pKas
  • Placing missing hydrogens
  • Optimizing the protein for favorable hydrogen bonding
  • Assigning charge and radius parameters from a variety of force fields
Please cite: Todd J Dolinsky, Paul Czodrowski, Hui Li, Jens E Nielsen, Jan H Jensen, Gerhard Klebe and Nathan A Baker: PDB2PQR: Expanding and upgrading automated preparation of biomolecular structures for molecular simulations. (PubMed,eprint) Nucleic Acids Research 35:W522-5 (2007)
perm
efficient mapping of short reads with periodic spaced seeds
Versions of package perm
ReleaseVersionArchitectures
stretch0.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.4.0-1amd64,armel,armhf,i386
bullseye0.4.0-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.4.0-4amd64,arm64,armhf,i386
bookworm0.4.0-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.4.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.4.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PerM is a software package which was designed to perform highly efficient genome scale alignments for hundreds of millions of short reads produced by the ABI SOLiD and Illumina sequencing platforms. Today PerM is capable of providing full sensitivity for alignments within 4 mismatches for 50bp SOLID reads and 9 mismatches for 100bp Illumina reads.

Please cite: Yangho Chen, Tade Souaiaia and Ting Chen: PerM: efficient mapping of short sequencing reads with periodic full sensitive spaced seeds. (PubMed,eprint) Bioinformatics 25(19):2514-21 (2009)
Registry entries: Bio.tools  SciCrunch 
phyml
estimation phylogénétique utilisant la probabilité maximale
Versions of package phyml
ReleaseVersionArchitectures
bullseye3.3.20200621-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.2.0+dfsg-7amd64,arm64,armhf,i386
jessie20120412-2amd64,armel,armhf,i386
sid3.3.20220408-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.3.20220408-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.3.20220408-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.3.20180621-2amd64,arm64,armhf,i386
Debtags of package phyml:
biologypeptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing, comparing
works-withbiological-sequence
Popcon: 13 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

PhyML est un logiciel qui estime la probabilité maximale de phylogénies à partir d'alignements de séquences de nucléotides ou d'acides aminés . Il fournit de nombreuses options qui ont été conçues pour faciliter les analyses phylogénétiques classiques. Les principales forces du logiciel PhyML reposent sur la grande quantité de modèles de substitution couplés avec de nombreuses options pour rechercher l'espace des topologies d'arbres phylogénétiques, allant de méthodes très rapides et efficaces à des approches moins rapides mais généralement plus précises. Il met également en œuvre deux méthodes pour évaluer les supports de branches dans une structure statistique fiable (le test du ratio de l'amorçage sans paramètre et de la probabilité approximative).

Le logiciel PhyML a été conçu pour traiter des ensembles de données modérés à volumineux. En théorie, les alignements jusqu'à 4 000 séquences de 2 000 000 symboles de longueur peuvent être analysés. Cependant, en pratique, la quantité de mémoire nécessaire pour traiter un ensemble de données est proportionnelle au produit du nombre de séquences par leur longueur. Par conséquent, un grand nombre de séquences peuvent seulement être traitées pour autant qu'elles soient courtes. Le logiciel PhyML peut aussi manipuler des séquences longues mais peu nombreuses. Avec les ordinateurs personnels les plus classiques, la « zone de confort » du logiciel PhyML se situe généralement entre 3 et 500 séquences de moins de 2 000 symboles de longueur.

Ce paquet fournit aussi PhyTime.

Please cite: Stéphane Guindon: Bayesian estimation of divergence times from large sequence alignments. (PubMed,eprint) Molecular Biology and Evolution 27(8):1768-81 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package phyml
phyutility
simple analyses or modifications on both phylogenetic trees and data matrices
Versions of package phyutility
ReleaseVersionArchitectures
bullseye2.7.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.7.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.7.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.7.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.7.3-1amd64,armel,armhf,i386
stretch2.7.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.7.3+dfsg-2amd64,arm64,armhf,i386
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Phyutility (fyoo-til-i-te) is a command line program that performs simple analyses or modifications on both trees and data matrices.

Currently it performs the following functions (to suggest another feature, submit an Issue and use the label Type-Enhancement) :

Trees

  • rerooting
  • pruning
  • type conversion
  • consensus
  • leaf stability
  • lineage movement
  • tree support

Data Matrices

  • concatenate alignments
  • genbank parsing
  • trimming alignments
  • search NCBI
  • fetch NCBI
Please cite: Stephen A. Smith and Casey W. Dunn: Phyutility: a phyloinformatics utility for trees, alignments, and molecular data. (PubMed,eprint) Bioinformatics 24(5):715-716 (2008)
picard-tools
outils en ligne de commande pour manipuler les fichiers SAM et BAM
Versions of package picard-tools
ReleaseVersionArchitectures
jessie1.113-1all
trixie3.1.1+dfsg-1all
bullseye2.24.1+dfsg-1all
stretch2.8.1+dfsg-1all
sid3.1.1+dfsg-1all
buster2.18.25+dfsg-2amd64
bookworm2.27.5+dfsg-2all
upstream3.3.0
Popcon: 10 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Le format « Sequence Alignment/Map » (SAM) est un format générique pour le stockage d'alignements de grandes séquences de nucléotides. Le logiciel Picard Tools fournit ces utilitaires pour manipuler les fichiers SAM et BAM (Binary Alignment/Map) :

  AddCommentsToBam                  FifoBuffer
  AddOrReplaceReadGroups            FilterSamReads
  BaitDesigner                      FilterVcf
  BamIndexStats                     FixMateInformation
                                    GatherBamFiles
  BedToIntervalList                 GatherVcfs
  BuildBamIndex                     GenotypeConcordance
  CalculateHsMetrics                IlluminaBasecallsToFastq
  CalculateReadGroupChecksum        IlluminaBasecallsToSam
  CheckIlluminaDirectory            LiftOverIntervalList
  CheckTerminatorBlock              LiftoverVcf
  CleanSam                          MakeSitesOnlyVcf
  CollectAlignmentSummaryMetrics    MarkDuplicates
  CollectBaseDistributionByCycle    MarkDuplicatesWithMateCigar
  CollectGcBiasMetrics              MarkIlluminaAdapters
  CollectHiSeqXPfFailMetrics        MeanQualityByCycle
  CollectIlluminaBasecallingMetrics MergeBamAlignment
  CollectIlluminaLaneMetrics        MergeSamFiles
  CollectInsertSizeMetrics          MergeVcfs
  CollectJumpingLibraryMetrics      NormalizeFasta
  CollectMultipleMetrics            PositionBasedDownsampleSam
  CollectOxoGMetrics                QualityScoreDistribution
  CollectQualityYieldMetrics        RenameSampleInVcf
  CollectRawWgsMetrics              ReorderSam
  CollectRnaSeqMetrics              ReplaceSamHeader
  CollectRrbsMetrics                RevertOriginalBaseQualitiesAndAddMateCigar
  CollectSequencingArtifactMetrics  RevertSam
  CollectTargetedPcrMetrics         SamFormatConverter
  CollectVariantCallingMetrics      SamToFastq
  CollectWgsMetrics                 ScatterIntervalsByNs
  CompareMetrics                    SortSam
  CompareSAMs                       SortVcf
  ConvertSequencingArtifactToOxoG   SplitSamByLibrary
  CreateSequenceDictionary          SplitVcfs
  DownsampleSam                     UpdateVcfSequenceDictionary
  EstimateLibraryComplexity         ValidateSamFile
  ExtractIlluminaBarcodes           VcfFormatConverter
  ExtractSequences                  VcfToIntervalList
  FastqToSam                        ViewSam
The package is enhanced by the following packages: multiqc
Please cite: Broad Institute: Picard toolkit. Broad Institute, GitHub repository (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing; Document, record and content management
plink
outils d'analyse d'associations sur le génome entier
Versions of package plink
ReleaseVersionArchitectures
bullseye1.07+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.07+dfsg-2amd64,arm64,armhf,i386
jessie1.07-3amd64,armel,armhf,i386
stretch1.07-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.07+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.07+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.07+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package plink:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
Popcon: 28 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Plink traite les données provenant de fragments SNP (single nucleotide polymorphism) de nombreux individus et leur description d'un phénotype pathologique. Il trouve les associations entre un phénotype et les variations d'ADN simple ou double brin et il peut récupérer les annotations SNP depuis une ressource en ligne.

Les SNP peuvent être analysés individuellement ou en tant que paires pour leur association avec les phénotypes pathologiques. L'étude conjointe des variations du nombre de copies est prise en charge. Divers tests statistiques ont été implémentés.

Remarque : l'exécutable a été renommé plink1 du fait d'un conflit de noms. Pour en savoir plus, lire /usr/share/doc/plink/README.Debian.

Please cite: Shaun Purcell, Benjamin Neale, Kathe Todd-Brown, Lori Thomas, Manuel A. R. Ferreira, David Bender, Julian Maller, Pamela Sklar, Paul I. W. de Bakker, Mark J. Daly and Pak C. Sham: PLINK: a toolset for whole-genome association and population-based linkage analysis. (PubMed) American Journal of Human Genetics 81(3):559-75 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
plink1.9
outils d'analyse d'associations sur le génome entier
Versions of package plink1.9
ReleaseVersionArchitectures
stretch1.90~b3.45-170113-1amd64,armel,armhf,i386,mipsel
buster1.90~b6.6-181012-1amd64,armhf,i386
bullseye1.90~b6.21-201019-1amd64,armel,armhf,i386,mipsel
bookworm1.90~b6.26-220402-1amd64,armel,armhf,i386,mipsel
trixie1.90~b7.2-231211-1amd64,armel,armhf,i386
sid1.90~b7.2-231211-1amd64,armel,armhf,i386
Popcon: 85 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Plink traite les données provenant de fragments SNP (single nucleotide polymorphism — polymorphisme d'un seul nucléotide) de nombreux individus et leur description d'un phénotype pathologique. Il trouve les associations entre un phénotype et les variations d'ADN simple ou double brin et il peut récupérer les annotations SNP depuis une ressource en ligne.

Les SNP peuvent être analysés individuellement ou en tant que paires pour leur association avec les phénotypes pathologiques. L'étude conjointe des variations du nombre de copies est prise en charge. Divers tests statistiques ont été implémentés.

Plink1.9 est une mise à jour complète de plink avec de nouveaux algorithmes et de nouvelles méthodes et une utilisation de la mémoire plus faible et rapide que le premier plink.

Il est à noter que l'exécutable a été renommé en plink1.9 en raison d'un conflit de noms. Consulter /usr/share/doc/plink1.9/README.Debian pour plus d'informations.

Please cite: Christopher C. Chang, Carson C. Chow, Laurent C.A.M. Tellier, Shashaank Vattikuti, Shaun M. Purcell and James J. Lee: Second-generation PLINK: rising to the challenge of larger and richer datasets. (eprint) GigaScience 4(1):7 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
plink2
whole-genome association analysis toolset
Versions of package plink2
ReleaseVersionArchitectures
bullseye2.00~a3-210203+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.00~a5.8-231123+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.00~a3.5-220809+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.00~a5.8-231123+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

plink expects as input the data from SNP (single nucleotide polymorphism) chips of many individuals and their phenotypical description of a disease. It finds associations of single or pairs of DNA variations with a phenotype and can retrieve SNP annotation from an online source.

SNPs can evaluated individually or as pairs for their association with the disease phenotypes. The joint investigation of copy number variations is supported. A variety of statistical tests have been implemented.

plink2 is a comprehensive update of plink and plink1.9 with new algorithms and new methods, faster and less memory consumer than the first plink.

Please cite: Christopher C. Chang, Carson C. Chow, Laurent C.A.M. Tellier, Shashaank Vattikuti, Shaun M. Purcell and James J. Lee: Second-generation PLINK: rising to the challenge of larger and richer datasets. (eprint) GigaScience 4(1):7 (2015)
Registry entries: SciCrunch 
poa
alignement d'ordre partiel pour les alignements multiples de séquences
Versions of package poa
ReleaseVersionArchitectures
bookworm2.0+20060928-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.0+20060928-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.0+20060928-3amd64,armel,armhf,i386
stretch2.0+20060928-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.0+20060928-7amd64,arm64,armhf,i386
bullseye2.0+20060928-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.0+20060928-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package poa:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
works-with-formatplaintext
Popcon: 9 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

POA signifie Alignement d'Ordre Partiel (Partial Order Aligment en anglais). C'est un programme rapide de MSA (alignement multiple de séquences) en bio-informatique. Ses points forts sont la vitesse, la déployabilité, la sensibilité et son aptitude supérieure à gérer les branchements et les indels dans l'alignement. L'alignement d'ordre partiel est une approche pour MSA qui peut être combinée avec d'autres méthodes comme l'alignement progressif. POA aligne de manière optimale une paire de MSA et peut donc être utilisé directement avec des méthodes progressives comme CLUSTAL. Pour les alignements de grande taille, POA est de dix à trente fois plus rapide que CLUSTALW.

Registry entries: Bioconda 
Screenshots of package poa
prank
Probabilistic Alignment Kit for DNA, codon and amino-acid sequences
Versions of package prank
ReleaseVersionArchitectures
jessie0.0.140110-1amd64,armel,armhf,i386
sid0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.0.150803-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.0.170427+dfsg-2amd64,arm64,armhf,i386
bullseye0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 11 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

PRANK is a probabilistic multiple alignment program for DNA, codon and amino-acid sequences. It's based on a novel algorithm that treats insertions correctly and avoids over-estimation of the number of deletion events. In addition, PRANK borrows ideas from maximum likelihood methods used in phylogenetics and correctly takes into account the evolutionary distances between sequences. Lastly, PRANK allows for defining a potential structure for sequences to be aligned and then, simultaneously with the alignment, predicts the locations of structural units in the sequences.

PRANK is a command-line program for UNIX-style environments but the same sequence alignment engine is implemented in the graphical program PRANKSTER. In addition to providing a user-friendly interface to those not familiar with Unix systems, PRANKSTER is an alignment browser for alignments saved in the HSAML format. The novel format allows for storing all the information generated by the aligner and the alignment browser is a convenient way to analyse and manipulate the data.

PRANK aims at an evolutionarily correct sequence alignment and often the result looks different from ones generated with other alignment methods. There are, however, cases where the different look is caused by violations of the method's assumptions. To understand why things may go wrong and how to avoid that, read this explanation of differences between PRANK and traditional progressive alignment methods.

Please cite: Ari Löztznoja: Phylogeny-aware alignment with PRANK. (PubMed) Methods Mol. Biol. 1079:155-170 (2014)
Registry entries: Bio.tools  Bioconda 
Screenshots of package prank
prime-phylo
bayesian estimation of gene trees taking the species tree into account
Versions of package prime-phylo
ReleaseVersionArchitectures
sid1.0.11-13amd64
jessie1.0.11-2amd64,armel,armhf,i386
stretch1.0.11-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.11-7amd64,arm64,armhf,i386
bullseye1.0.11-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.11-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.11-12amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid1.0.11-12arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PrIME (Probabilistic Integrated Models of Evolution) is a package supporting inference of evolutionary parameters in a Bayesian framework using Markov chain Monte Carlo simulation. A distinguishing feature of PrIME is that the species tree is taken into account when analyzing gene trees.

The input data to PrIME is a multiple sequence alignment in FASTA format and the output data contains trees in Newick format.

Please cite: Ö. Åkerborg, B. Sennblad, L. Arvestad and J. Lagergren: Simultaneous Bayesian gene tree reconstruction and reconciliation analysis. (PubMed,eprint) Proceedings of the National Academy of Sciences 106(14):5714-5719 (2009)
Registry entries: Bio.tools 
primer3
outil de choix d'amorces l'amplification d'ADN
Versions of package primer3
ReleaseVersionArchitectures
bullseye2.4.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.3.7-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.4.0-2amd64,arm64,armhf,i386
bookworm2.6.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.6.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.6.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.3.6-1amd64,armel,armhf,i386
Debtags of package primer3:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
works-with-formatplaintext
Popcon: 18 users (14 upd.)*
Versions and Archs
License: DFSG free
Git

Primer3 choisit des amorces pour des réactions de polymérisation en chaîne, avec les critères suivants : la température de fusion des oligonucléotides, leur taille, leur contenu en GC et la possibilité de former des dimères ; la taille du produit de PCR ; les contraintes positionnelles dans la séquence source ; diverses autres contraintes. Tous ces critères peuvent êtres spécifiés comme des contraintes par l'utilisateur et certains sont spécifiables comme les termes d'une fonction objective qui caractérise une paire idéale d'amorces.

Please cite: Steve Rozen and Helen J. Skaletsky: Primer3 on the WWW for general users and for biologist programmers. (PubMed,eprint) Methods Mol Biol. 132(3):365-86 (2000)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package primer3
probabel
Toolset for Genome-Wide Association Analysis
Versions of package probabel
ReleaseVersionArchitectures
bullseye0.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.4.3-2amd64,armel,armhf,i386
bookworm0.5.0+dfsg-6amd64,i386
sid0.5.0+dfsg-6amd64,i386
trixie0.5.0+dfsg-6amd64,i386
stretch0.4.5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster0.5.0+dfsg-3amd64,arm64,armhf,i386
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The ProbABEL package is part of the GenABEL project for analysis of genome-wide data. ProbABEL is used to run GWAS. Using files in filevector/DatABEL format even allows for running GWAS on computers with only a few GB of RAM.

The package is enhanced by the following packages: probabel-examples
Please cite: Yurii S Aulchenko, Maksim V Struchalin and Cornelia M van Duijn: ProbABEL package for genome-wide association analysis of imputed data.. (PubMed,eprint) BMC Bioinformatics 11:134 (2010)
Registry entries: Bio.tools  SciCrunch 
probcons
alignement de séquences multiples basé sur la cohérence probabiliste
Versions of package probcons
ReleaseVersionArchitectures
stretch1.12-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.12-12amd64,arm64,armhf,i386
bullseye1.12-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.12-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.12-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.12-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.12-9amd64,armel,armhf,i386
Debtags of package probcons:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 13 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Ceci est un outil pour la génération d'alignements de séquences multiples de protéines. En utilisant une combinaison de techniques d'alignements basées sur la modélisation probabiliste et la cohérence, le logiciel PROBCONS a atteint les meilleures précisions des méthodes d'alignement à ce jour. Sur la base de données d'alignements de test de performance BAliBASE (« Benchmark ALIgnment dataBASE »), les alignements produits par le logiciel PROBCONS montrent une amélioration statistiquement significative sur les logiciels actuels, contenant une moyenne de plus de 7 % de colonnes alignées correctement que celles du logiciel T-Coffee, plus de 11 % de colonnes alignées correctement que celles du logiciel ClustalW, et plus de 11 % de colonnes alignées que celles du logiciel Dialign.

Please cite: Chuong B. Do, Mahathi S.P. Mahabhashyam, Michael Brudno and Serafim Batzoglou: ProbCons: Probabilistic consistency-based multiple sequence alignment. (PubMed,eprint) Genome Research 15(2):330-340 (2005)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package probcons
proda
Alignement multiple de séquences protéiques
Versions of package proda
ReleaseVersionArchitectures
jessie1.0-8amd64,armel,armhf,i386
buster1.0-12amd64,arm64,armhf,i386
bullseye1.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0-10amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package proda:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 11 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

ProDA est un programme pour détecter et aligner les régions homologues dans des collections de protéines comportant divers arrangements de domaines. À partir d'un ensemble de séquences non alignées, ProDA identifiera toutes les régions homologues apparaissant dans une ou plusieurs séquences et renverra une collection d'alignements multiples locaux pour chacune d'entre elles.

Please cite: Tu Minh Phuong, Chuong B. Do, Robert C. Edgar and Serafim Batzoglou: Multiple alignment of protein sequences with repeats and rearrangements. (PubMed,eprint) Nucl. Acids Res. 34(20):5932-5942 (2006)
Registry entries: Bio.tools  Bioconda 
Screenshots of package proda
prodigal
Microbial (bacterial and archaeal) gene finding program
Versions of package prodigal
ReleaseVersionArchitectures
trixie2.6.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.6.3-4amd64,arm64,armhf,i386
stretch2.6.3-1amd64,arm64,armel,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.6.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.6.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.6.1-1amd64,armel,i386
bullseye2.6.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Prodigal (Prokaryotic Dynamic Programming Genefinding Algorithm) is a microbial (bacterial and archaeal) gene finding program developed at Oak Ridge National Laboratory and the University of Tennessee. Key features of Prodigal include:

Speed: Prodigal is an extremely fast gene recognition tool (written in very vanilla C). It can analyze an entire microbial genome in 30 seconds or less.

Accuracy: Prodigal is a highly accurate gene finder. It correctly locates the 3' end of every gene in the experimentally verified Ecogene data set (except those containing introns). It possesses a very sophisticated ribosomal binding site scoring system that enables it to locate the translation initiation site with great accuracy (96% of the 5' ends in the Ecogene data set are located correctly).

Specificity: Prodigal's false positive rate compares favorably with other gene identification programs, and usually falls under 5%.

GC-Content Indifferent: Prodigal performs well even in high GC genomes, with over a 90% perfect match (5'+3') to the Pseudomonas aeruginosa curated annotations.

Metagenomic Version: Prodigal can run in metagenomic mode and analyze sequences even when the organism is unknown.

Ease of Use: Prodigal can be run in one step on a single genomic sequence or on a draft genome containing many sequences. It does not need to be supplied with any knowledge of the organism, as it learns all the properties it needs to on its own.

Please cite: Doug Hyatt, Gwo-Liang Chen, Philip F. Locascio, Miriam L. Land, Frank W. Larimer and Loren J. Hauser: Prodigal: prokaryotic gene recognition and translation initiation site identification. (PubMed,eprint) BMC Bioinformatics 11:119 (2010)
Registry entries: SciCrunch  Bioconda 
python3-biomaj3-cli
BioMAJ client
Versions of package python3-biomaj3-cli
ReleaseVersionArchitectures
buster3.1.10-1all
bookworm3.1.11-4all
trixie3.1.11-5all
sid3.1.11-5all
bullseye3.1.11-1all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

BioMAJ downloads remote data banks, checks their status and applies transformation workflows, with consistent state, to provide ready-to-use data for biologists and bioinformaticians. For example, it can transform original FASTA files into BLAST indexes. It is very flexible and its post-processing facilities can be extended very easily.

BioMAJ3 is a rewrite of BioMAJ v1.x, see online documentation for migration.

This package contains the client to execute BioMAJ3 or communicate with the BioMAJ daemon process (python3-biomaj3-daemon) in case of microservice config.

python3-biopython
bibliothèque de Python 3 pour la bio-informatique
Versions of package python3-biopython
ReleaseVersionArchitectures
bookworm1.80+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.84+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.73+dfsg-1amd64,arm64,armhf,i386
sid1.84+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.78+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.68+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.64+dfsg-5amd64,armel,armhf,i386
Popcon: 49 users (43 upd.)*
Versions and Archs
License: DFSG free
Git

Le projet Biopython est une association internationale de programmeurs d'outils libres en Python pour la bio-informatique.

C'est une initiative collaborative distribuée pour le développement de bibliothèques et d'applications en Python 3 pour répondre aux besoins des travaux actuels et futurs en bio-informatique. Le code source est disponible sous la licence Biopython qui est extrêmement libérale et compatible avec presque toutes les licences au monde. Le projet travaille avec la Open Bioinformatics Foundation qui fournit généreusement au projet un espace web et CVS.

Please cite: Peter J. A. Cock, Tiago Antao, Jeffrey T. Chang, Brad A. Chapman, Cymon J. Cox, Andrew Dalke, Iddo Friedberg, Thomas Hamelryck, Frank Kauff, Bartek Wilczynski and Michiel J. L. de Hoon: Biopython: freely available Python tools for computational molecular biology and bioinformatics. (PubMed,eprint) Bioinformatics 25(11):1422-1423 (2009)
Registry entries: Bio.tools  SciCrunch 
python3-cogent3
framework pour la biologie du génome
Versions of package python3-cogent3
ReleaseVersionArchitectures
sid2024.5.7a1+dfsg-3amd64,arm64,mips64el,ppc64el
bullseye2020.12.21a+dfsg-4+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2023.2.12a1+dfsg-2+deb12u1amd64,arm64,mips64el,ppc64el,s390x
sid2023.12.15a1+dfsg-1s390x
upstream2024.7.19a9
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

PyCogent est une bibliothèque pour la biologie du génome. C'est un framework complètement intégré et testé en profondeur pour :

  • le pilotage d'applications tierces ;
  • la conception de workflows ; l'interrogation des bases de données ;
  • la conduite de nouvelles analyses probabilistes de l'évolution de séquences biologiques ;
  • la génération de publications avec des graphismes de qualité. Il se distingue par de nombreuses fonctionnalités uniques intégrées (telles que l'alignement de codons véritables) et l'ajout fréquent de méthodes complètement nouvelles pour l'analyse de données de génomes.
Please cite: Rob Knight, Peter Maxwell, Amanda Birmingham, Jason Carnes, J Gregory Caporaso, Brett C Easton, Michael Eaton, Micah Hamady, Helen Lindsay, Zongzhi Liu, Catherine Lozupone, Daniel McDonald, Michael Robeson, Raymond Sammut, Sandra Smit, Matthew J Wakefield, Jeremy Widmann, Shandy Wikman, Stephanie Wilson, Hua Ying and Gavin A Huttley: PyCogent: a toolkit for making sense from sequence. (PubMed,eprint) Genome Biology 8(8):R171 (2007)
Registry entries: Bio.tools  Bioconda 
qiime
QIIME, Quantitative Insights Into Microbial Ecology
Versions of package qiime
ReleaseVersionArchitectures
bullseye2020.11.1-1all
bookworm2022.11.1-2all
sid2024.5.0-1all
jessie1.8.0+dfsg-4amd64,armel,armhf,i386
upstream2024.10.1
Debtags of package qiime:
roleprogram
Popcon: 15 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Les microbes sont omniprésents autour des humains, des animaux, des plantes et de tous leurs parasites, avec un forte interaction sur eux et sur leur environnement. La qualité du sol vient à l’esprit, mais aussi l’effet qu’ont les bactéries sur tous. Les humains influent sur leur abondance relative et absolue par des antibiotiques, des aliments, des engrais ou tout ce qui vient à l’esprit, et ces changements affectent tout le monde.

QIIME 2 est un paquet pour l’analyse de microbiome, extensible et décentralisée avec une attention particulière sur la transparence des données et analyses. QIIME 2 permet aux chercheurs de commencer une analyse avec des données de séquences d’ADN et de terminer avec des figures et des résultats statistiques de qualité professionnelle. Principales caractéristiques :

 — suivi intégré et automatique de la provenance des données ;
 — système de type sémantique ;
 — système de greffons pour étendre les fonctionnalités d’analyse de
   microbiome ;
 — prise en charge de plusieurs types d’interface (par exemple, API,
   ligne de commande, graphique) ;

QIIME 2 est une nouvelle conception et une réécriture de la tuyauterie d’analyse de microbiome, QIIME 1. QIIME 2 corrigera la plupart des limitations de QIIME 1, tout en conservant les fonctions qui font de QIIME 1 une tuyauterie d’analyse puissante et largement utilisée.

QIIME 2 actuellement prend en charge une première tuyauterie d’analyse de microbiome de bout en bout. De nouvelles fonctionnalités seront régulièrement disponibles à travers des greffons de QIIME 2. Une liste de greffons peut être consultée sur la page de disponibilité de greffons de QIIME 2. La page des futurs greffons liste les greffons en cours de développement.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (PubMed,eprint) Nature Biotechnology 37:852 - 857 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Microbial ecology
r-bioc-edger
analyse empirique de données numériques d’expressions de gène avec R
Versions of package r-bioc-edger
ReleaseVersionArchitectures
jessie3.8.2+dfsg-1amd64,armel,armhf,i386
sid4.2.2+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm3.40.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.32.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.2.2+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch3.14.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream4.4.0
Popcon: 26 users (10 upd.)*
Newer upstream!
License: DFSG free
Git

Il s’agit d’un paquet de Bioconductor pour l’analyse différentielle des expressions de tout le séquençage du transcriptome (RNA-seq) et des profils numériques d’expressions de gène avec réplication biologique. Il utilise l’estimation empirique de Bayes et des tests exacts basés sur la loi binomiale négative. Il est aussi utile pour l’analyse différentielle de signaux avec d’autres types de données de dénombrement à l’échelle du génome.

Please cite: Mark D. Robinson, Davis J. McCarthy and Gordon K. Smyth: edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. (PubMed,eprint) Bioinformatics 26,:139-140 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-hilbertvis
paquet de GNU R pour visualiser de grands vecteurs de données
Versions of package r-bioc-hilbertvis
ReleaseVersionArchitectures
buster1.40.0-1amd64,arm64,armhf,i386
trixie1.62.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid1.62.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.56.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.24.0-1amd64,armel,armhf,i386
stretch1.32.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.48.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.64.0
Debtags of package r-bioc-hilbertvis:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
useanalysing
Popcon: 4 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Cet outil permet d’afficher de très grands vecteurs de données d’une manière efficace du point de vue espace, en les organisant le long d’une courbe de Hilbert en 2D. L’utilisateur peut visuellement évaluer la structure de grande échelle et la distribution des caractéristiques simultanément avec la forme et l’intensité grossières des caractéristiques individuelles.

En bio-informatique, un cas typique d’utilisation est ChIP-Chip et ChIP- Seq, ou, fondamentalement, toutes les sortes de donnée génomique affichées conventionnellement sous forme de traces quantitatives (« données wiggle ») dans les navigateurs de génomes tels que ceux fournis par Ensembl ou UCSC.

Please cite: Simon Anders: Visualization of genomic data with the Hilbert curve. (PubMed,eprint) Bioinformatics 25(10):1231-1235 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-cran-pvclust
regroupement hiérarchique avec valeurs-p par la méthode du bootstrap multi-échelle
Versions of package r-cran-pvclust
ReleaseVersionArchitectures
bullseye2.2-0-2all
jessie1.3-0-1all
stretch2.0-0-1all
buster2.0-0-4all
bookworm2.2-0-2all
trixie2.2-0-2all
sid2.2-0-2all
Popcon: 48 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

pvclust est un paquet pour évaluer l'incertitude d'une analyse d'un regroupement hiérarchique. Il offre des valeurs-p AU (approximativement non-biaisées) ainsi que des valeurs BP (probabilité du boostrap) calculées par de rééchantillonnage de bootstrap multi-échelle.

Please cite: Ryota Suzuki and Hidetoshi Shimodaira: Pvclust: an R package for assessing the uncertainty in hierarchical clustering. (PubMed,eprint) Bioinformatics 22(12):1540-1542 (2006)
r-cran-qtl
paquet de GNU R d’analyse de liaisons de marqueurs génétiques
Versions of package r-cran-qtl
ReleaseVersionArchitectures
stretch1.40-8-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.44-9-1amd64,arm64,armhf,i386
bullseye1.47-9-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.33-7-1amd64,armel,armhf,i386
trixie1.70-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.70-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.58-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package r-cran-qtl:
devellang:r, library
fieldbiology, statistics
roleapp-data
suitegnu
Popcon: 17 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

R/qtl est un environnement interactif et extensible pour cartographier les QTL (locus de caractères quantitatifs) dans des croisements expérimentaux. Il est implanté comme un module complémentaire pour le langage/logiciel de statistiques libre et largement utilisé « R » (voir http://www.r- project.org).

Le développement de ce logiciel comme extension de R permet de profiter des fonctions mathématiques et statistiques basiques ainsi que des capacités graphiques puissantes fournies avec R. De plus, l’utilisateur bénéficie de l’intégration transparente du logiciel de cartographie QTL dans le programme d’analyse statistique générale. Le but est rendre les méthodes complexes de mappage de QTL très accessibles et de permettre aux utilisateurs de se concentrer plutôt sur la modélisation que sur le calcul.

Un composant clef des méthodes de calcul pour le mappage QTL est la technologie du modèle de Markov caché (MMC/HMM) pour composer avec les données de génotype manquantes. Les algorithmes MMC principaux, avec compensation de la présence d’erreurs de génotypage, pour rétrocroisement, intercroisement, croisement « four-way » à phases connues ont été implémentés.

La version actuelle de R/qtl inclut des structures pour estimer les cartes génétiques, identifier les erreurs du génotype, lancer des recherches de QTL simple et QTL double, des recherches bi-dimensionnelles, par correspondance d’intervalle (avec l’algorithme EM), la régression de Haley-Knott, et l’imputation multiple. Tout cela peut être réalisé en la présence de covariantes (comme le sexe, l’âge ou le traitement). Il est aussi possible de faire correspondre des modèles de QTL d’ordre plus élevé par imputation multiple.

Please cite: Karl W. Broman, Hao Wu, Saunak Sen and Gary A. Churchill: R/qtl: QTL mapping in experimental crosses. (PubMed,eprint) Bioinformatics 19:889-890 (2003)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-cran-vegan
Community Ecology Package for R
Versions of package r-cran-vegan
ReleaseVersionArchitectures
trixie2.6-8+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.0-10-1amd64,armel,armhf,i386
buster2.5-4+dfsg-3amd64,arm64,armhf,i386
bullseye2.5-7+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.4-2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.6-8+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.6-4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 167 users (157 upd.)*
Versions and Archs
License: DFSG free
Git

R package for community ecologists. It contains most multivariate analysis needed in analysing ecological communities, and tools for diversity analysis. Most diversity methods assume that data are counts of individuals.

These tools are sometimes used outside the field of ecology, for instance to study populations of white blood cells or RNA molecules.

Registry entries: SciCrunch 
r-other-mott-happy.hbrem
GNU R package for fine-mapping complex diseases
Versions of package r-other-mott-happy.hbrem
ReleaseVersionArchitectures
sid2.4-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.4-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.4-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4-3amd64,arm64,armhf,i386
stretch2.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.4-1amd64,armel,armhf,i386
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Happy is an R interface into the HAPPY C package for fine-mapping Quantitative Trait Loci (QTL) in Heterogenous Stocks (HS). An HS is an advanced intercross between (usually eight) founder inbred strains of mice. HS are suitable for fine-mapping QTL. It uses a multipoint analysis which offers significant improvements in statistical power to detect QTLs over that achieved by single-marker association.

The happy package is an extension of the original C program happy; it uses the C code to compute the probability of descent from each of the founders, at each locus position, but the happy packager allows a much richer range of models to be fit to the data.

Read /usr/share/doc/r-other-mott-happy/README.Debian for a more detailed explanation.

Please cite: Richard Mott, Christopher J. Talbot, Maria G. Turri, Allan C. Collins and Jonathan Flint: A method for fine mapping quantitative trait loci in outbred animal stocks. (PubMed,eprint) Proc. Natl. Acad. Sci. USA 97(23):12649-12654 (2000)
Registry entries: SciCrunch 
raster3d
outils pour la génération d'images de protéines ou d'autres molécules
Versions of package raster3d
ReleaseVersionArchitectures
bookworm3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.0-3-5amd64,arm64,armhf,i386
stretch3.0-3-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.0-3-1amd64,armel,armhf,i386
Debtags of package raster3d:
fieldbiology, biology:structural
interfacecommandline
roleprogram
scopeapplication
useconverting, viewing
works-with3dmodel, image, image:raster
works-with-formatjpg, png
Popcon: 11 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Raster3D est un ensemble d'outils pour la génération d'images matricielles de protéines ou d'autres molécules. Le logiciel principal rend les sphères, les triangles, les cylindres, les surfaces quadriques avec la surbrillance spéculaire, l'ombrage de Phong et l'ombrage. Il utilise l'algorithme efficace du logiciel Z-buffer, qui est indépendant de la carte graphique. Les logiciels annexes traitent les coordonnées atomiques des fichiers Protein Data Bank (PDB) dans les descriptions de rendu pour les images composées de rubans, les atomes remplissant l'espace, les liaisons, "ball+stick", etc. Raster3D peut aussi être utilisé pour rendre des images composées dans d'autres logiciels tels que Molscript en 3D avec des surbrillances et des ombrages, etc. La sortie est en fichiers d'images avec 24 bits d'information de couleur par pixel.

Please cite: E.A. Merritt and D.J. Bacon: Raster3D Photorealistic Molecular Graphics. (PubMed) Methods in Enzymology 277:505-524 (1997)
Registry entries: Bio.tools 
readseq
conversion entre formats de séquences
Versions of package readseq
ReleaseVersionArchitectures
bookworm1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1-13amd64,arm64,armhf,i386
stretch1-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1-11amd64,armel,armhf,i386
sid1-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package readseq:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useconverting
works-with-formatplaintext
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ce logiciel lit et écrit les séquences de nucléotides/protéines dans divers formats. Les fichiers de données peuvent avoir de multiples séquences. Le logiciel Readseq est particulièrement utile car il détecte automatiquement de nombreux formats de séquences, et convertit entre les formats.

Please cite: Don Gilbert: Sequence file format conversion with command-line readseq. (PubMed,eprint) Current Protocols in Bioinformatics Appendix 1:E (2003)
Registry entries: Bio.tools  Bioconda 
rnahybrid
prédiction rapide et efficace des complexes microARN/cible
Versions of package rnahybrid
ReleaseVersionArchitectures
buster2.1.2-5amd64,arm64,armhf,i386
bullseye2.1.2-6amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.1.1-2amd64,armel,armhf,i386
bookworm2.1.2-7amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.1.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.1.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.1.2-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package rnahybrid:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

RNAhybrid est un outil permettant de déterminer l'hybridation d'énergie minimale entre deux brins d'ARN, l'un court et l'autre long. L'hybridation est réalisée en quelque sorte sur la base de la reconnaissance d'un domaine, c'est-à-dire que la séquence courte est hybridée sur le domaine de la séquence longue présentant la plus grande similarité. Cet outil est principalement destiné à la prédiction de cibles pour microARNs.

Please cite: Marc Rehmsmeier, Peter Steffen, Matthias Höchsmann and Robert Giegerich: Fast and effective prediction of microRNA/target duplexes. (PubMed,eprint) RNA 10(10):1507-1517 (2004)
Registry entries: Bio.tools  SciCrunch 
rtax
classification de lectures de séquence d’ARN ribosomique 16S
Versions of package rtax
ReleaseVersionArchitectures
trixie0.984-8all
sid0.984-8all
buster0.984-6all
stretch0.984-5all
bookworm0.984-8all
bullseye0.984-7all
jessie0.984-2all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Les technologies de lectures courtes pour le profilage de communautés bactériennes sont de plus en plus populaires, tandis que les techniques précédentes d’assignation taxinomique par lectures d’extrémités par paires ne fonctionnent pas très bien. RTAX fournit rapidement des assignations taxinomiques de lectures d’extrémités par paires en utilisant un algorithme de consensus.

Please cite: David A. W. Soergel, Neelendu Dey, Rob Knight and Steven E. Brenner: Selection of primers for optimal taxonomic classification of environmental 16S rRNA gene sequences. (PubMed,eprint) The ISME Journal 6:1440–1444 (2012)
samtools
traitement d'alignements de séquence pour les formats SAM et BAM et CRAM
Versions of package samtools
ReleaseVersionArchitectures
jessie0.1.19-1amd64,armhf,i386
bullseye1.11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.20-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.20-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch-backports1.7-2~bpo9+1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
stretch1.3.1-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
buster1.9-4amd64,arm64,armhf
bookworm1.16.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.21
Debtags of package samtools:
fieldbiology
interfacecommandline
networkclient
roleprogram
scopeutility
uitoolkitncurses
useanalysing, calculating, filtering
works-withbiological-sequence
Popcon: 53 users (29 upd.)*
Newer upstream!
License: DFSG free
Git

Samtools est un ensemble d'utilitaires qui manipulent les alignements de séquence de nucléotides dans le format binaire BAM. Il est capable d'importer et d'exporter à partir des formats ASCII SAM (Sequence Alignment/Map) et CRAM, de trier, de fusionner, d'indexer et de récupérer des enregistrements dans n'importe quelle région facilement. Il est conçu pour travailler sur un flux de données et est capable d'ouvrir un fichier BAM ou CRAM (mais pas SAM) sur un serveur HTTP ou FTP distant.

The package is enhanced by the following packages: libbio-samtools-perl multiqc
Please cite: Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis, Richard Durbin and 1000 Genome Project Data Processing Subgroup: The Sequence Alignment/Map (SAM) Format and SAMtools. (PubMed,eprint) Bioinformatics 25(16):2078-2079 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package samtools
seqan-apps
C++ library for the analysis of biological sequences
Versions of package seqan-apps
ReleaseVersionArchitectures
stretch-backports2.4.0+dfsg-11~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
experimental2.5.0~rc2+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
stretch2.3.1+dfsg-4amd64,arm64,i386,mips64el,ppc64el,s390x
jessie1.4.1+dfsg-2amd64,armhf,i386
sid2.4.0+dfsg-16amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.4.0+dfsg-16amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4.0+dfsg-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.4.0+dfsg-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.0+dfsg-11amd64,arm64,armhf,i386
Debtags of package seqan-apps:
devellibrary
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SeqAn is a C++ template library of efficient algorithms and data structures for the analysis of sequences with the focus on biological data. This library applies a unique generic design that guarantees high performance, generality, extensibility, and integration with other libraries. SeqAn is easy to use and simplifies the development of new software tools with a minimal loss of performance. This package contains the applications dfi, pair_align, micro_razers, seqan_tcoffee, seqcons, razers and tree_recon.

Please cite: Andreas Doring, David Weese, Tobias Rausch and Knut Reinert: SeqAn An efficient, generic C++ library for sequence analysis. (PubMed,eprint) BMC Bioinformatics 9(1):11 (2008)
Registry entries: Bio.tools  Bioconda 
sibsim4
Alignement de séquences d'ARN sur une séquence d'ADN
Versions of package sibsim4
ReleaseVersionArchitectures
stretch0.20-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.20-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.20-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.20-4amd64,arm64,armhf,i386
jessie0.20-2amd64,armel,armhf,i386
Debtags of package sibsim4:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing, searching
works-with-formatplaintext
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Le projet SIBsim4 est basé sur sim4, un programme pour aligner une séquence d'ADNc sur une séquence génomique, en tenant compte de l'existence d'introns. Dans SIBsim4, le code source original a été fortement remanié avec comme buts :

  • l'amélioration de la vitesse ;
  • l'utilisation de séquences d'ADN de l'ordre de grandeur d'un chromosome ;
  • une meilleure description des variants d'épissage ;
  • une meilleure description des sites de polyadénylation ;
  • des corrections et améliorations de code.
Registry entries: Bio.tools 
sigma-align
alignement de multiples séquences d'ADN non codant
Versions of package sigma-align
ReleaseVersionArchitectures
bookworm1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.3-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.1.3-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.1.3-3amd64,armel,armhf,i386
stretch1.1.3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.3-6amd64,arm64,armhf,i386
bullseye1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package sigma-align:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SIGMA (« SImple Greedy Multiple Alignment ») est un logiciel d'alignement. Son algorithme et schéma de notation sont conçus spécialement pour une séquence d'ADN non codant.

Il utilise une stratégie de recherche d'alignements locaux avec le moins d'espacement possible. Ceci se produit à chaque étape, ce qui rend le meilleur alignement possible compatible avec les alignements existants. Il note l'importance de l'alignement sur ​​la base des longueurs des fragments alignés et un modèle de fond. Ceux-ci peuvent être communiqués ou estimés à partir d'un fichier complémentaire de l'ADN intergénique.

Please cite: Siddharthan, Rahul: Sigma: multiple alignment of weakly-conserved non-coding DNA sequence. (PubMed) BMC Bioinformatics 7(1):143 (2006)
Registry entries: Bio.tools 
sim4
Outil d'alignement d'ADNc et d'ADN génomique
Versions of package sim4
ReleaseVersionArchitectures
bullseye0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.0.20121010-1amd64,armel,armhf,i386
stretch0.0.20121010-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.0.20121010-5amd64,arm64,armhf,i386
bookworm0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package sim4:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing, searching
works-with-formatplaintext
Popcon: 13 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

sim4 est un outil se basant sur les similitudes pour aligner une séquence d'ADN exprimée (EST, ADNc, ARNm) avec une séquence génomique pour un gène. Il détecte également les correspondances de terminaisons lorsque deux séquences entrées se recouvrent sur une terminaison (c.-à-d. le début d'une séquence recouvre la fin de l'autre).

sim4 emploie une technique de découpage pour d'abord déterminer les blocs de base en correspondance représentant les exons fondamentaux. Dans un premier temps, il détermine toutes les correspondances exactes possibles entre W-mères (c.-à-d. les séquences d'ADN de taille W) des deux séquences et les étend jusqu'à une taille maximale de segment sans lacune. Dans un second temps, les exons fondamentaux sont étendus aux fragments adjacents n'ayant pas encore de correspondance en utilisant des algorithmes d'alignement gourmands, et des approches heuristiques sont utilisées pour privilégier les configurations conformes aux signaux de reconnaissance de site soudé (GT-AG, CT-AC). Si nécessaire, le traitement est répété avec des paramètres moins contraignants sur les fragments sans correspondance.

Please cite: Liliana Florea, George Hartzell, Zheng Zhang, Gerald M. Rubin and Webb Miller: A Computer Program for Aligning a cDNA Sequence with a Genomic DNA Sequence. (PubMed,eprint) Genome Research 8:967-974 (1998)
Registry entries: Bio.tools 
smalt
Sequence Mapping and Alignment Tool
Versions of package smalt
ReleaseVersionArchitectures
stretch0.7.6-6amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
sid0.7.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.7.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.7.6-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.7.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.7.6-8amd64,arm64,armhf
jessie0.7.6-4amd64,armhf,i386
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SMALT efficiently aligns DNA sequencing reads with a reference genome. Reads from a wide range of sequencing platforms, for example Illumina, Roche-454, Ion Torrent, PacBio or ABI-Sanger, can be processed including paired reads.

The software employs a perfect hash index of short words (< 20 nucleotides long), sampled at equidistant steps along the genomic reference sequences.

For each read, potentially matching segments in the reference are identified from seed matches in the index and subsequently aligned with the read using a banded Smith-Waterman algorithm.

The best gapped alignments of each read is reported including a score for the reliability of the best mapping. The user can adjust the trade-off between sensitivity and speed by tuning the length and spacing of the hashed words.

A mode for the detection of split (chimeric) reads is provided. Multi-threaded program execution is supported.

Registry entries: Bio.tools  SciCrunch  Bioconda 
snap
location of genes from DNA sequence with hidden markov model
Versions of package snap
ReleaseVersionArchitectures
stretch2013-11-29-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2013-11-29-1amd64,armel,armhf,i386
sid2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2013-11-29-9amd64,arm64,armhf,i386
bullseye2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1534 users (96 upd.)*
Versions and Archs
License: DFSG free
Git

SNAP is a general purpose gene finding program suitable for both eukaryotic and prokaryotic genomes. SNAP is an acroynm for Semi-HMM-based Nucleic Acid Parser.

Please cite: Ian Korf: Gene finding in novel Genomes. (PubMed,eprint) BMC Bioinformatics 5:59 (2004)
Registry entries: Bio.tools 
Screenshots of package snap
soapdenovo
méthode d'assemblage de lectures courtes pour construire une ébauche d’assemblage de novo
Versions of package soapdenovo
ReleaseVersionArchitectures
bullseye1.05-6amd64
trixie1.05-6amd64
stretch1.05-3amd64
buster1.05-5amd64
sid1.05-6amd64
jessie1.05-2amd64
bookworm1.05-6amd64
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le logiciel SOAPdenovo est une nouvelle méthode d'assemblage à lectures courtes qui peut construire une ébauche d’assemblage de novo pour les génomes de taille humaine. Le logiciel est spécialement conçu pour assembler les lectures courtes de la machine Genome Analyzer de l'entreprise Illumina.

Il crée de nouvelles opportunités pour la construction de séquences de référence et la réalisation d’analyses précises de génomes inexplorés de manière économique.

Cette version n’est plus entretenue, soapdenovo2 est à envisager.

Please cite: Ruiqiang Li, Hongmei Zhu, Jue Ruan, Wubin Qian, Xiaodong Fang, Zhongbin Shi, Yingrui Li, Shengting Li, Gao Shan, Karsten Kristiansen, Songgang Li, Huanming Yang, Jian Wang and Jun Wang: De novo assembly of human genomes with massively parallel short read sequencing. (PubMed,eprint) Genome Research 20(2):265-72 (2009)
Registry entries: Bio.tools  SciCrunch 
soapdenovo2
méthode d'assemblage de lectures courtes pour construire un assemblage brouillon de novo
Versions of package soapdenovo2
ReleaseVersionArchitectures
buster241+dfsg-3amd64
sid242+dfsg-4amd64
trixie242+dfsg-4amd64
bookworm242+dfsg-3amd64
bullseye242+dfsg-1amd64
jessie240+dfsg-2amd64
stretch240+dfsg1-2amd64
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Le logiciel SOAPdenovo est une nouvelle méthode d'assemblage à lectures courtes qui peut construire un assemblage brouillon de novo pour les génomes de taille humaine. Le logiciel est spécialement conçu pour assembler les lectures courtes de la machine Genome Analyzer IIx de l'entreprise Illumina.

Il crée de nouvelles opportunités pour la construction de séquences de référence et la réalisation des analyses précises des génomes inexplorés de manière économique.

Please cite: Ruibang Luo, Binghang Liu, Yinlong Xie, Zhenyu Li, Weihua Huang, Jianying Yuan, Guangzhu He, Yanxiang Chen, Qi Pan, Yunjie Liu, Jingbo Tang, Gengxiong Wu, Hao Zhang, Yujian Shi, Yong Liu, Chang Yu, Bo Wang, Yao Lu, Changlei Han, David W Cheung, Siu-Ming Yiu, Shaoliang Peng, Zhu Xiaoqian, Guangming Liu, Xiangke Liao, Yingrui Li, Huanming Yang, Jian Wang, Tak-Wah Lam and Jun Wang: SOAPdenovo2: an empirically improved memory-efficient short-read de novo assembler. Giga Science 1(1):18 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sra-toolkit
utilities for the NCBI Sequence Read Archive
Versions of package sra-toolkit
ReleaseVersionArchitectures
stretch2.8.1-2+dfsg-2amd64,i386
experimental3.0.9+dfsg-6amd64,arm64
sid3.0.3+dfsg-9arm64
trixie3.0.3+dfsg-9amd64,arm64
bookworm3.0.3+dfsg-6~deb12u1amd64,arm64
buster2.9.3+dfsg-1amd64
bullseye2.10.9+dfsg-2amd64
jessie2.3.5-2+dfsg-1amd64,i386
sid3.0.9+dfsg-7amd64
upstream3.1.1
Popcon: 11 users (7 upd.)*
Newer upstream!
License: DFSG free
Git

Tools for reading the SRA archive, generally by converting individual runs into some commonly used format such as fastq.

The textual dumpers "sra-dump" and "vdb-dump" are provided in this release as an aid in visual inspection. It is likely that their actual output formatting will be changed in the near future to a stricter, more formalized representation[s]. PLEASE DO NOT RELY UPON THE OUTPUT FORMAT SEEN IN THIS RELEASE.

Other tools distributed in this package are:

 abi-dump, abi-load
 align-info
 bam-load
 cache-mgr
 cg-load
 copycat
 fasterq-dump
 fastq-dump, fastq-load
 helicos-load
 illumina-dump, illumina-load
 kar
 kdbmeta
 latf-load
 pacbio-load
 prefetch
 rcexplain
 remote-fuser
 sff-dump, sff-load
 sra-pileup, sra-sort, sra-stat, srapath
 srf-load
 test-sra
 vdb-config, vdb-copy, vdb-decrypt, vdb-encrypt, vdb-get, vdb-lock,
 vdb-passwd, vdb-unlock, vdb-validate

The "help" information will be improved in near future releases, and the tool options will become standardized across the set. More documentation will also be provided documentation on the NCBI web site.

Tool options may change in the next release. Version 1 tool options will remain supported wherever possible in order to preserve operation of any existing scripts.

Please cite: Rasko Leinonen, Ruth Akhtar, Ewan Birney, James Bonfield, Lawrence Bower, Matt Corbett, Ying Cheng, Fehmi Demiralp, Nadeem Faruque, Neil Goodgame, Richard Gibson, Gemma Hoad, Christopher Hunter, Mikyung Jang, Steven Leonard, Quan Lin, Rodrigo Lopez, Michael Maguire, Hamish McWilliam, Sheila Plaister, Rajesh Radhakrishnan, Siamak Sobhany, Guy Slater, Petra Ten Hoopen, Franck Valentin, Robert Vaughan, Vadim Zalunin, Daniel Zerbino and Guy Cochrane: Improvements to services at the European Nucleotide Archive. (PubMed,eprint) Nucleic Acids Research 38(Database issue):D39-45 (2010)
Registry entries: Bio.tools  Bioconda 
ssake
application de génomique pour assembler des millions de séquences très courtes d’ADN
Versions of package ssake
ReleaseVersionArchitectures
buster4.0-2all
bullseye4.0-3all
stretch3.8.4-1all
jessie3.8.2-1all
bookworm4.0.1-1all
trixie4.0.1-2all
sid4.0.1-2all
Debtags of package ssake:
biologynuceleic-acids
fieldbiology
interfaceshell
roleprogram
scopeutility
useanalysing
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Short Sequence Assembly par recherche de K-mer et l’extension de troisième lecture (SSAKE) est une application de génomique pour assembler énergiquement des millions de séquences courtes de nucléotides en recherchant progressivement les « 3′-most k-mers » en utilisant un arbre de préfixes d’ADN. SSAKE est conçu pour aider à exploiter les informations de lectures de courtes séquences en les regroupant rigoureusement dans des contigs pouvant être utilisés pour caractériser les cibles de séquençage nouvelles.

Please cite: Rene L. Warren, Granger G. Sutton, Steven J. M. Jones and Robert A. Holt: Assembling millions of short DNA sequences using SSAKE. (PubMed,eprint) Bioinformatics 23(4):500-501 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
staden-io-lib-utils
programs for manipulating DNA sequencing files
Versions of package staden-io-lib-utils
ReleaseVersionArchitectures
trixie1.15.0-1.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.14.15-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.14.13-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.15.0-1.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.13.7-1amd64,armel,armhf,i386
stretch1.14.8-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.14.11-6amd64,arm64,armhf,i386
Debtags of package staden-io-lib-utils:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

The io_lib from the Staden package is a library of file reading and writing code to provide a general purpose trace file (and Experiment File) reading interface. It has been compiled and tested on a variety of unix systems, MacOS X and MS Windows.

This package contains the programs that are distributed with the Staden io_lib for manipulating and converting sequencing data files, and in particular files to manipulate short reads generated by second and third generation sequencers and stored in SRF format.

Registry entries: Bioconda 
t-coffee
alignement multiple de séquences
Versions of package t-coffee
ReleaseVersionArchitectures
stretch11.00.8cbe486-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster12.00.7fb08c2-4amd64,arm64,armhf,i386
sid13.45.0.4846264+really13.41.0.28bdc39+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm13.45.0.4846264+really13.41.0.28bdc39+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye13.41.0.28bdc39+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie13.45.0.4846264+really13.41.0.28bdc39+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie11.00.8cbe486-1amd64,armel,armhf,i386
Debtags of package t-coffee:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 13 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

T-Coffee est un programme d'alignement multiple de séquences. À partir d'un ensemble de séquences (protéines ou ADN), T-Coffee crée un alignement multiple. Les versions 2.00 et supérieures peuvent mélanger les séquences et les structures.

T-Coffee permet la combinaison de collection d'alignements multiples ou par paires de séquences, globaux ou locaux, dans un modèle unique. Il peut aussi estimer le niveau de cohérence de chaque position dans le nouvel alignement avec les autres alignements. Veuillez vous référer à l'épreuve incluse pour plus d'informations.

T-Coffee dispose d'une variante appelée M-Coffee qui permet la combinaison de sorties de nombreux paquets d'alignement de séquences. Dans sa version publiée, il utilise MUSCLE, PROBCONS, POA, DiAlign-TS, MAFFT, Clustal W, PCMA et T-Coffee. Une version spéciale, DM-Coffee, a été faite pour Debian. Cette version n'utilise que des logiciels libres grâce au remplacement de Clustal W par Kalign. L'utilisation des huit méthodes proposées par M-Coffee peut parfois s'avérer lourde. Il est néanmoins possible de n'en utiliser qu'un sous-ensemble de son choix.

The package is enhanced by the following packages: clustalw dialign-tx kalign mafft muscle muscle3 ncbi-blast+ poa prank probcons tm-align
Please cite: Cédric Notredame, Desmond G. Higgins and Jaap Heringa: T-coffee: a novel method for fast and accurate multiple sequence alignment. (PubMed) Journal of Molecular Biology 302(1):205-217 (2000)
Registry entries: Bio.tools  SciCrunch  Bioconda 
tabix
indexeur générique pour fichiers de positions de génome, délimités par des tabulations
Versions of package tabix
ReleaseVersionArchitectures
bullseye1.11-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.9-12~deb10u1amd64,arm64,armhf,i386
bookworm1.16+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.20+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.20+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
experimental1.21+ds-0+exp1amd64,arm64
stretch-backports1.7-2~bpo9+1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
jessie0.2.6-2armhf
jessie1.1-1amd64,armel,i386
stretch1.3.2-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
upstream1.21
Debtags of package tabix:
roleprogram
works-with-formathtml
Popcon: 24 users (23 upd.)*
Newer upstream!
License: DFSG free
Git

Tabix indexe des fichiers où certaines colonnes indiquent les coordonnées de séquence : nom (habituellement un chromosome), départ et fin. Le fichier de données d'entrée doit être trié en fonction du positionnement et compressé par bgzip (fourni dans ce paquet), qui a une interface similaire à celle de gzip. Après indexation, tabix est en mesure de récupérer rapidement les lignes de données par coordonnées chromosomiques. La récupération rapide des données fonctionne aussi sur le réseau si une URI est donnée comme nom de fichier.

Ce paquet a été compilé à partir du code source de HTSlib et fournit les outils bgzip, htsfile et tabix.

Please cite: Heng Li: Tabix: fast retrieval of sequence features from generic TAB-delimited files. (PubMed,eprint) Bioinformatics 27(5):718-719 (2011)
Registry entries: Bio.tools  Bioconda 
Screenshots of package tabix
theseus
superimpose macromolecules using maximum likelihood
Versions of package theseus
ReleaseVersionArchitectures
jessie3.0.0-1amd64,armel,armhf,i386
buster3.3.0-8amd64,arm64,armhf,i386
bullseye3.3.0-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.3.0-14amd64,i386
trixie3.3.0-14amd64,i386
sid3.3.0-14amd64,i386
stretch3.3.0-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package theseus:
biologypeptidic
fieldbiology, biology:bioinformatics, biology:structural
interfacecommandline
roleprogram
useanalysing, comparing
works-with-formatplaintext
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Theseus is a program that simultaneously superimposes multiple macromolecular structures. Theseus finds the optimal solution to the superposition problem using the method of maximum likelihood. By down-weighting variable regions of the superposition and by correcting for correlations among atoms, the ML superposition method produces very accurate structural alignments.

When macromolecules with different residue sequences are superimposed, other programs and algorithms discard residues that are aligned with gaps. Theseus, however, uses a novel superimposition algorithm that includes all of the data.

The package is enhanced by the following packages: theseus-examples
Please cite: Douglas L. Theobald and Deborah S. Wuttke: THESEUS: maximum likelihood superpositioning and analysis of macromolecular structures. (eprint) Bioinformatics 22(17):2171-2172 (2006)
tigr-glimmer
Gene detection in archea and bacteria
Versions of package tigr-glimmer
ReleaseVersionArchitectures
trixie3.02b-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.02b-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.02b-2amd64,arm64,armhf,i386
jessie3.02-3amd64,armel,armhf,i386
stretch3.02b-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.02b-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.02b-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package tigr-glimmer:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usesearching
works-with-formatplaintext
Popcon: 9 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Developed by the TIGR institute this software detects coding sequences in bacteria and archea.

Glimmer is a system for finding genes in microbial DNA, especially the genomes of bacteria and archaea. Glimmer (Gene Locator and Interpolated Markov Modeler) uses interpolated Markov models (IMMs) to identify the coding regions and distinguish them from noncoding DNA.

Please cite: Steven L. Salzberg, Arthur L. Delcher, S. Kasif and O. White: Microbial gene identification using interpolated Markov models. (PubMed,eprint) Nucleic Acids Research 26(2):544-8 (1998)
Registry entries: Bio.tools  SciCrunch  Bioconda 
tree-ppuzzle
Parallelized reconstruction of phylogenetic trees by maximum likelihood
Versions of package tree-ppuzzle
ReleaseVersionArchitectures
trixie5.3~rc16+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie5.2-7amd64,armel,armhf,i386
stretch5.2-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster5.2-11amd64,arm64,armhf,i386
bullseye5.3~rc16+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm5.3~rc16+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid5.3~rc16+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package tree-ppuzzle:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

TREE-PUZZLE (the new name for PUZZLE) is an interactive console program that implements a fast tree search algorithm, quartet puzzling, that allows analysis of large data sets and automatically assigns estimations of support to each internal branch. TREE-PUZZLE also computes pairwise maximum likelihood distances as well as branch lengths for user specified trees. Branch lengths can also be calculated under the clock-assumption. In addition, TREE-PUZZLE offers a novel method, likelihood mapping, to investigate the support of a hypothesized internal branch without computing an overall tree and to visualize the phylogenetic content of a sequence alignment.

This is the parallelized version of tree-puzzle.

Please cite: Heiko A. Schmidt, Korbinian Strimmer, Martin Vingron and Arndt von Haeseler: TREE-PUZZLE: maximum likelihood phylogenetic analysis using quartets and parallel computing. (PubMed,eprint) Bioinformatics 18(3):502-504 (2002)
Registry entries: Bio.tools 
tree-puzzle
Reconstruction of phylogenetic trees by maximum likelihood
Versions of package tree-puzzle
ReleaseVersionArchitectures
stretch5.2-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid5.3~rc16+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie5.3~rc16+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm5.3~rc16+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye5.3~rc16+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster5.2-11amd64,arm64,armhf,i386
jessie5.2-7amd64,armel,armhf,i386
Debtags of package tree-puzzle:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

TREE-PUZZLE (the new name for PUZZLE) is an interactive console program that implements a fast tree search algorithm, quartet puzzling, that allows analysis of large data sets and automatically assigns estimations of support to each internal branch. TREE-PUZZLE also computes pairwise maximum likelihood distances as well as branch lengths for user specified trees. Branch lengths can also be calculated under the clock-assumption. In addition, TREE-PUZZLE offers a novel method, likelihood mapping, to investigate the support of a hypothesized internal branch without computing an overall tree and to visualize the phylogenetic content of a sequence alignment.

Please cite: Heiko A. Schmidt, Korbinian Strimmer, Martin Vingron and Arndt von Haeseler: TREE-PUZZLE: maximum likelihood phylogenetic analysis using quartets and parallel computing. (PubMed,eprint) Bioinformatics 18(3):502-504 (2002)
Registry entries: Bio.tools 
vcftools
Collection of tools to work with VCF files
Versions of package vcftools
ReleaseVersionArchitectures
bullseye0.1.16-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.1.12+dfsg-1amd64,armel,armhf,i386
jessie-security0.1.12+dfsg-1+deb8u1amd64,armel,armhf,i386
stretch0.1.14+dfsg-4+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.1.16-1amd64,arm64,armhf,i386
Debtags of package vcftools:
roleprogram
Popcon: 17 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

VCFtools is a program package designed for working with VCF files, such as those generated by the 1000 Genomes Project. The aim of VCFtools is to provide methods for working with VCF files: validating, merging, comparing and calculate some basic population genetic statistics.

The package is enhanced by the following packages: multiqc
Please cite: Petr Danecek, Adam Auton, Goncalo Abecasis, Cornelis A. Albers, Eric Banks, Mark A. DePristo, Robert E. Handsaker, Gerton Lunter, Gabor T. Marth, Stephen T. Sherry, Gilean McVean and Richard Durbin: The variant call format and VCFtools. (PubMed,eprint) Bioinformatics 27(15):2156-8 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvet
Nucleic acid sequence assembler for very short reads
Versions of package velvet
ReleaseVersionArchitectures
trixie1.2.10+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.2.10+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.2.10+dfsg1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
bookworm1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2.10+dfsg1-5amd64,arm64,armhf,i386
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package velvet:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet is a de novo genomic assembler specially designed for short read sequencing technologies, such as Solexa or 454, developed by Daniel Zerbino and Ewan Birney at the European Bioinformatics Institute (EMBL-EBI), near Cambridge, in the United Kingdom.

Velvet currently takes in short read sequences, removes errors then produces high quality unique contigs. It then uses paired read information, if available, to retrieve the repeated areas between contigs.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
veryfasttree
Speeding up the estimation of phylogenetic trees from sequences
Versions of package veryfasttree
ReleaseVersionArchitectures
sid4.0.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.0.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

VeryFastTree is a highly efficient implementation inspired by the FastTree-2 tool, designed to expedite the inference of approximately-maximum-likelihood phylogenetic trees from nucleotide or protein sequence alignments. It is an optimized implementation designed to accelerate the estimation of phylogenies for large alignments. By leveraging parallelization and vectorization strategies, VeryFastTree significantly improves the performance and scalability of phylogenetic analysis, allowing it to construct phylogenetic trees in a fraction of the time previously required.

Maintaining the integrity of FastTree-2, VeryFastTree retains the same phases, methods, and heuristics used for estimating phylogenetic trees. This ensures that the topological accuracy of the trees produced by VeryFastTree remains equivalent to that of FastTree-2. Moreover, unlike the parallel version of FastTree-2, VeryFastTree guarantees deterministic results, eliminating any potential variations in the output.

To facilitate a seamless transition for users, VeryFastTree adopts the exact same command line arguments as FastTree-2. This means that by simply substituting FastTree-2 with VeryFastTree, and using the same set of options, users can significantly enhance the overall performance of their phylogenetic analyses.

wise
comparison of biopolymers, like DNA and protein sequences
Versions of package wise
ReleaseVersionArchitectures
bullseye2.4.1-23amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.4.1-25amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.4.1-25amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.4.1-21amd64,arm64,armhf,i386
stretch2.4.1-19amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.4.1-17amd64,armel,armhf,i386
bookworm2.4.1-23amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package wise:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
Popcon: 16 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

Wise2 is a package focused on comparisons of biopolymers, commonly DNA and protein sequences. There are many other packages which do this, probably the best known being BLAST package (from NCBI) and the Fasta package (from Bill Pearson). There are other packages, such as the HMMER package (Sean Eddy) or SAM package (UC Santa Cruz) focused on hidden Markov models (HMMs) of biopolymers.

Wise2's particular forte is the comparison of DNA sequence at the level of its protein translation. This comparison allows the simultaneous prediction of say gene structure with homology based alignment.

Wise2 also contains other algorithms, such as the venerable Smith-Waterman algorithm, or more modern ones such as Stephen Altschul's generalised gap penalties, or even experimental ones developed in house, such as dba. The development of these algorithms is due to the ease of developing such algorithms in the environment used by Wise2.

Wise2 has also been written with an eye for reuse and maintainability. Although it is a pure C package you can access its functionality directly in Perl. Parts of the package (or the entire package) can be used by other C or C++ programs without namespace clashes as all externally linked variables have the unique identifier Wise2 prepended.

Please cite: Ewan Birney, Michele Clamp and Richard Durbin: GeneWise and Genomewise. (PubMed,eprint) Genome Research 14(5):988-95 (2004)
Registry entries: Bio.tools  Bioconda 

Debian packages in contrib or non-free

cufflinks
Transcript assembly, differential expression and regulation for RNA-Seq
Versions of package cufflinks
ReleaseVersionArchitectures
stretch2.2.1-3 (non-free)amd64
trixie2.2.1+dfsg.1-10 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.2.1+dfsg.1-10 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.2.1+dfsg.1-3 (non-free)amd64,arm64,armhf,i386
jessie2.2.1-1 (non-free)amd64
bookworm2.2.1+dfsg.1-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.2.1+dfsg.1-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: non-free
Git

Cufflinks assembles transcripts, estimates their abundances, and tests for differential expression and regulation in RNA-Seq samples. It accepts aligned RNA-Seq reads and assembles the alignments into a parsimonious set of transcripts. Cufflinks then estimates the relative abundances of these transcripts based on how many reads support each one.

This package provides the binary of cufflinks and associated tools, i.e. compress_gtf, cuffcompare, cuffdiff, cuffmerge, cuffnorm, cuffquant and gtf_to_sam.

Please cite: Cole Trapnell, Brian A Williams, Geo Pertea, Ali Mortazavi, Gordon Kwan, Marijke J van Baren, Steven L Salzberg, Barbara J Wold and Lior Pachter: Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. (PubMed) Nature Biotechnology 28(5):511-515 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
embassy-phylip
EMBOSS conversions of the programs in the phylip package
Versions of package embassy-phylip
ReleaseVersionArchitectures
buster3.69.660-3 (non-free)amd64
jessie3.69.650-2 (non-free)amd64
stretch3.69.660-1 (non-free)amd64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: non-free
Git

This package is the adaptation of the PHYLIP package in which its programs can operate with the biological sequence formats and databases of the European Molecular Biology Open Software Suite (EMBOSS). The software packages adapted for EMBOSS are called EMBASSY.

PHYLIP (the PHYLogeny Inference Package) is a package of programs for inferring phylogenies (evolutionary trees). Methods that are available in the package include parsimony, distance matrix, and likelihood methods, including bootstrapping and consensus trees. Data types that can be handled include molecular sequences, gene frequencies, restriction sites and fragments, distance matrices, and discrete characters.

The EMBASSY PHYLIP programs all have the prefix "f" to distinguish them from the original programs and avoid namespace conflict.

Packaging has started and developers might try the packaging code in VCS

bagpipe
genomewide LD mapping
Versions of package bagpipe
ReleaseVersionArchitectures
VCS2012.02.15-1all
Versions and Archs
License: GPL3+
Debian package not available
Git
Version: 2012.02.15-1

Bagpipe is a program for performing genomewide linkage disequilibrium mapping of quantitative trait loci in populations whose genome structure can be accommodated in the HAPPY framework [Mott00]. This includes most diploid crosses where the founders of the individuals have known genotypes.

  • Bagpipe is a simplified and streamlined version of Bagphenotype that does not currently include resample model averaging (RMA) capabilities.
  • Bagpipe can help fit single locus regression models (with or without random effects) to marker intervals whose genetic ancestry is inferred using the HAPPY software.
  • Bagpipe cannot help you decide what is a sensible model to fit.
  • Bagpipe does not currently accommodate populations with significant population structure, except through the specification of simple random intercepts based on unpatterned covariance matrices.
  • Bagpipe is named after the Scottish wind instrument "the bagpipes" and after Bagphenotype, which in turn was a PIPEline for BAGging-based multiple QTL analysis of phenoTYPEs. Bagphenotype was in turn based on software written by Richard Mott and William Valdar to analyze heterogeneous stock mice in [Valdar06].
  • Bagpipe is experimental software, is provided free of charge subject to copyleft restrictions, and comes with no guarantees whatsoever.
Please cite: Richard Mott, Christopher J. Talbot, Maria G. Turri, Allan C. Collins and Jonathan Flint: A method for fine mapping quantitative trait loci in outbred animal stocks. (PubMed) Proc Natl Acad Sci U S A. 97(23):12649-54 (200)
*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 246672