Debian Science Project
Summary
Workflow
workflow management systems useful for scientific research

This task lists some packages providing workflow management systems useful for scientific research.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Science to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Science mailing list

Links to other tasks

Debian Science Workflow packages

Official Debian packages with high relevance

capsule-nextflow
outil d’empaquetage et de déploiement pour des applications en Java
Versions of package capsule-nextflow
ReleaseVersionArchitectures
trixie1.1.1+dfsg-1all
bookworm1.1.1+dfsg-1all
sid1.1.1+dfsg-1all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Une capsule est un exécutable JAR unique qui contient tout ce dont une application a besoin pour être exécutée, soit sous la forme de fichiers embarqués ou comme des métadonnées déclaratives. Il peut contenir des artefacts JAR, des dépendances et des ressources, des bibliothèques natives, la version nécessaire du « Java Runtime Environment », les drapeaux de la machine virtuelle Java nécessaires pour bien exécuter l’application, des agents Java ou natifs et d’autres choses. En résumé, une capsule est un JAR qui sait contenant tout ce qui doit être connu pour exécuter l’application de la façon dont elle doit fonctionner.

Une façon d’envisager une capsule est de penser à un gros JAR dopé (qui permet aussi des bibliothèques natives et qui n’interfère jamais avec des dépendances) et a un script déclaratif de démarrage enroulés ensemble. Une autre façon est de l’envisager comme un équivalent au moment du déploiement d’un outil de construction. Comme un outil de construction gère la construction, capsule gère le démarrage d’une application.

Ce paquet fournit le fourchage du projet capsule originel. Il est approprié comme dépendance de nextflow.

coop-computing-tools
outils de calcul coopératif
Versions of package coop-computing-tools
ReleaseVersionArchitectures
stretch4.0-1.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid9.9-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie9.9-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm9.9-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye7.1.2-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster7.0.9-2amd64,arm64,armhf,i386
Debtags of package coop-computing-tools:
uitoolkitncurses
Popcon: 1 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'une collection de logiciels aidant les utilisateurs à partager des ressources dans un environnement de calcul complexe, hétérogène et non fiable. Elle inclut :

  • Chirp : Un protocole d'entrée/sortie et un système de fichiers personnel qui prmet à des utilisateurs non privilégiés de partager un espace de manière sécurisée, efficace et commode. Associé à Parrot, Chirp permet aux utilisateurs de créer des systèmes de fichiers distribués dans des endroits personnalisés
  • Parrot : Un système de fichiers virtuel transparent au niveau utilisateur permettant de rlier à n'importe quel programme un périphérique de stockage distant tel qu'un serveur FTP ou Chirp.
  • Makeflow : un système de flux pour le calcul parallèle et distribué qui utilise un langage très proche de Make.
  • Work Queue : Un système et une API pour construire des programmes à la façon master-worker, capables d'aller jusqu'à des milliers de processeurs.
  • All Pairs : Une abstraction de calcul pour exécuter de très gros produits cartésiens.
  • Wavefront : Une abstraction de calcul pour exécuter de très gros problèmes de programmation dynamique.
  • The Fault Tolerant Shell : Un langage de programmation de haut niveau qui permet aux utilisateurs de combiner la facilité des scripts shell, la puissance de la programmation distribuée et la précision des langages compilés. C'est de la programmation parallèle de base et de la gestion d'exceptions pour des scripts.
cwltool
implémentation de la référence du langage Common Workflow
Versions of package cwltool
ReleaseVersionArchitectures
bullseye3.0.20210124104916-3+deb11u1all
bookworm3.1.20230209161050-1all
trixie3.1.20241024121129-1all
sid3.1.20241024121129-1all
stretch1.0.20170114120503-1all
buster1.0.20181217162649+dfsg-10all
upstream3.1.20241112140730
Popcon: 34 users (20 upd.)*
Newer upstream!
License: DFSG free
Git

C'est l'implémentation de référence des standards de Common Workflow Language.

Les standards ouverts CWL servent à décrire des analyses de flux de travail et des outils afin de les rendre portables et déployabls sur une grande diversité d'environnements logiciels et matériels, des stations de travail aux clustrs en passant par le cloud et le calcul haute performance (HPC). CWL a été conçu pour satisfaire les besoins des scientifiques manipulant beaucoup de données comme la bioinformatique, l'imagerie médicaale, l'astronomie, la physique et la chimie.

L'implémentation de la référence CWL (cwltool) vise à être entièrement personnalisée et à offrir une validation exhaustive de fichiers CWL, mais aussi d'autres outils de travail avec des descriptions CWL.

Please cite: Michael R. Crusoe, Sanne Abeln, Alexandru Iosup, Peter Amstutz, John Chilton, Nebojša Tijanić, Hervé Ménager, Stian Soiland-Reye, Bogdan Gavrilović, Carole Goble and The CWL Community: Methods included: standardizing computational reuse and portability with the Common Workflow Language. Communications of the ACM 65(6):54-63 (2022)
Registry entries: SciCrunch  Bioconda 
gearman
file d’attente de travaux distribués
Versions of package gearman
ReleaseVersionArchitectures
buster-backports1.1.19.1+ds-2~bpo10+1all
sid1.1.20+ds-1.2all
bookworm1.1.20+ds-1all
jessie1.0.6-5all
trixie1.1.20+ds-1.2all
stretch1.0.6-9all
buster1.1.18+ds-3all
bullseye1.1.19.1+ds-2all
upstream1.1.21
Debtags of package gearman:
rolemetapackage
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

Gearman est un système pour confier des travaux à d’autres machines, en répartissant les appels de fonction aux machines les plus adaptées, pour travailler en parallèle, pour répartir les charges de beaucoup d’appels de fonction ou appeler des fonctions entre langages.

Ce paquet est un paquet vide qui dépend à la fois du client et du serveur.

gearman-tools
outils pour la file d’attente de travaux distribués de Gearman
Versions of package gearman-tools
ReleaseVersionArchitectures
stretch1.0.6-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.1.20+ds-1.2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.1.20+ds-1.2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.1.19.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster-backports1.1.19.1+ds-2~bpo10+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.18+ds-3amd64,arm64,armhf,i386
jessie1.0.6-5amd64,armel,armhf,i386
bookworm1.1.20+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.1.21
Popcon: 10 users (9 upd.)*
Newer upstream!
License: DFSG free
Git

Gearman est un système pour confier des travaux à d’autres machines, en répartissant les appels de fonction aux machines les plus adaptées, pour travailler en parallèle, pour répartir les charges de beaucoup d’appels de fonction ou appeler des fonctions entre langages.

Ce paquet fournit quelques outils en ligne de commande pour manipuler les travaux de Gearman.

make
utilitaire pour mener la compilation
Versions of package make
ReleaseVersionArchitectures
experimental4.4.1-1~exp1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch4.1-9.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.2.1-1.2amd64,arm64,armhf,i386
bullseye4.3-4.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.3-4.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.3-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid4.3-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.0-8.1amd64,armel,armhf,i386
upstream4.4.1
Debtags of package make:
develbuildtools
interfacecommandline
roleprogram
scopeutility
suitegnu
works-withsoftware:source
Popcon: 35026 users (7854 upd.)*
Newer upstream!
License: DFSG free
Git

L'utilitaire GNU Make contrôle la création d'exécutables et autres fichiers d'un programme à partir des sources. Il détermine automatiquement quelles parties d'un long programme doivent être (re)créées et génère les commandes pour les (re)créer. Make peut être utilisé pour organiser toute tâche pour laquelle des cibles (fichiers) doivent être automatiquement mises à jour à partir d'un ensemble de fichiers sources quand la source est plus récente - il n'est pas limité à la compilation de programmes informatiques. En fait, Make est un résolveur de dépendances généraliste.

The package is enhanced by the following packages: make-doc
Screenshots of package make
pegasus-wms
Scientific workflow management system for HTCondor
Versions of package pegasus-wms
ReleaseVersionArchitectures
stretch4.4.0+dfsg-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.4.0+dfsg-8amd64,arm64,armhf,i386
jessie4.4.0+dfsg-4amd64,armel,armhf,i386
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free

The Pegasus project encompasses a set of technologies the help workflow-based applications execute in a number of different environments including desktops, campus clusters, grids, and now clouds. Scientific workflows allow users to easily express multi-step computations, for example retrieve data from a database, reformat the data, and run an analysis. Once an application is formalized as a workflow the Pegasus Workflow Management Service can map it onto available compute resources and execute the steps in appropriate order.

Screenshots of package pegasus-wms
python3-nipype
Neuroimaging data analysis pipelines in Python3
Versions of package python3-nipype
ReleaseVersionArchitectures
bookworm1.8.5-3all
bullseye1.6.0-2all
sid1.9.0-1all
upstream1.9.1
Popcon: 12 users (14 upd.)*
Newer upstream!
License: DFSG free
Git

Nipype interfaces Python to other neuroimaging packages and creates an API for specifying a full analysis pipeline in Python. Currently, it has interfaces for SPM, FSL, AFNI, Freesurfer, but could be extended for other packages (such as lipsia).

Please cite: SS Ghosh, C Burns, D Clark, K Gorgolewski, YO Halchenko, C Madison, R Tungaraza and KJ Millman: Nipype: Opensource platform for unified and replicable interaction with existing neuroimaging tools (eprint) 16th Annual Meeting of the Organization for Human Brain Mapping :106 (2010)
python3-wdlparse
Workflow Description Language (WDL) parser for Python
Versions of package python3-wdlparse
ReleaseVersionArchitectures
bookworm0.1.0-3all
bullseye0.1.0-2all
sid0.1.0-3all
trixie0.1.0-3all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

A Python package that provides the generated Hermes and Antlr4 WDL parsers for Python.

snakemake
pythonic workflow management system
Versions of package snakemake
ReleaseVersionArchitectures
stretch3.10.0-1all
trixie7.32.4-6all
sid7.32.4-6all
bullseye5.24.1-2all
buster5.4.0-1all
bookworm7.21.0-1all
upstream8.25.3
Popcon: 34 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Build systems like GNU Make are frequently used to create complicated workflows, e.g. in bioinformatics. This project aims to reduce the complexity of creating workflows by providing a clean and modern domain specific language (DSL) in Python style, together with a fast and comfortable execution environment.

Please cite: Johannes Köster and Sven Rahmann: Snakemake-a scalable bioinformatics workflow engine. Bioinformatics (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
toil
cross-platform workflow engine
Versions of package toil
ReleaseVersionArchitectures
bullseye5.2.0-5all
sid6.1.0-4all
bookworm5.9.2-2+deb12u1all
buster3.18.0-2all
upstream7.0.0
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Toil is a scalable, efficient, cross-platform and easy-to-use workflow engine in pure Python. It works with several well established load balancers like Slurm or the Sun Grid Engine. Toil is also compatible with the Common Workflow Language (CWL) via the "toil-cwl-runner" interface, which this package make available via the Debian alternativess system under the alias "cwl-runner".

Please cite: John Vivian, Arjun Arkal Rao, Frank Austin Nothaft, Christopher Ketchum, Joel Armstrong, Adam Novak, Jacob Pfeil, Jake Narkizian Alden D. Deran, Audrey Musselman-Brown, Hannes Schmidt, Peter Amstutz, Brian Craft, Mary Goldman, Kate Rosenbloom, Melissa Cline, Brian O'Connor, Megan Hanna, Chet Birger, W. James Kent David A. Patterson, Anthony D. Joseph, Jingchun Zhu, Sasha Zaranek, Gad Getz, David Haussler and Benedict Paten: Toil enables reproducible, open source, big biomedical data analyses. Nature Biotechnology 35(4):314–316 (2017)
Registry entries: Bioconda 

Official Debian packages with lower relevance

cwlformat
code formatter for Common Workflow Language
Versions of package cwlformat
ReleaseVersionArchitectures
sid2022.02.18-3all
bookworm2022.02.18-2all
trixie2022.02.18-3all
bullseye2021.01.05-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

CWL Format is a specification and a reference implementation for a very opinionated CWL code formatter.

It outputs Common Workflow Language(CWL) in a standardized YAML format. It has no settings or options because you have better things to do with your time. And because CWL Format is always correct.

libbenchmark-tools
bibliothèque de prise en charge de micro-benchmark –⋅outils et documentation
Versions of package libbenchmark-tools
ReleaseVersionArchitectures
bullseye1.5.2-2all
stretch-backports1.3.0-1~bpo9+1all
buster1.4.1-3all
bookworm1.7.1-1all
trixie1.8.3-3all
sid1.8.3-3all
experimental1.8.4-1~exp1all
upstream1.9.0
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

Il s'agit d'une bibliothèque pour mesurer la performance de fonctions, semblable à unit-tests.

Ce paquet fournit les outils et la documentation.

*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 248069