[bdp]registry

Reproduzierbare Bioinformatik-Daten, für jedes Team. Versionieren Sie Referenzgenome, Annotationsdatenbanken und Datensätze wie Sie Code versionieren.

- Datenquellen
- Organisationen

Holen Sie sich Ihren ersten Datensatz in 30 Sekunden

$
curl -sSfL https://bdp.dev/install.sh | sh# BDP installieren
$
bdp init# Projekt initialisieren
$
bdp source add uniprot:P01308-fasta@1.0# Datenquelle hinzufügen
$
bdp pull# Herunterladen und zwischenspeichern

Danach in Nextflow/Snakemake integrieren, Zitate & Datenverfügbarkeitserklärungen erstellen oder Post-Pull-Skripte zur Datenverarbeitung ausführen

Warum BDP?

Wie conda oder pip, aber für Ihre Datendateien — mit Reproduzierbarkeit, Provenienz und Zitierungen standardmäßig.

Vollständige Reproduzierbarkeit

Lock-Dateien für Daten, nicht nur Code. Fixieren Sie jedes Referenzgenom, jede Annotationsdatenbank und jeden Datensatz auf eine exakte Version.

Nahtlose Zusammenarbeit

Teilen Sie exakte Datenumgebungen teamübergreifend. Jeder arbeitet mit denselben Dateien — keine manuellen Downloads, kein Versionsdrift.

Intelligentes Ressourcenmanagement

Gemeinsamer Cache für Teammitglieder. Einmal herunterladen, überall nutzen. Bandbreite und Speicher sparen.

Automatisierte Zitierung

Erstellen Sie korrekte Zitate für jede Datenquelle. Verpassen Sie keine Referenz in Ihren Publikationen.

Integritätsprüfung

Automatische Prüfsummenvalidierung erkennt Manipulationen und Beschädigungen. Audit-Trails für Compliance.

Zentralisierte Entdeckung

Suchen Sie in Hunderten von Bioinformatik-Ressourcen an einem Ort. UniProt, NCBI, ChEBI, Ensembl und mehr.

Workflow-Integration

Native Unterstützung für Nextflow, Snakemake und CWL. Nahtlos in bestehende Pipelines integrieren.

Open Source

Vollständig transparente und überprüfbare Codebasis. Prüfen, evaluieren und beitragen. Offen für die Community entwickelt.

So funktioniert es

Drei Befehle. Reproduzierbare Daten für immer.

1

Im Registry suchen

Datensätze nach Name, Organismus oder Kennung finden. Hunderte kuratierter Quellen — UniProt, NCBI, Ensembl, ChEBI und mehr — an einem Ort.

2

Zum Projekt hinzufügen

Die Quelle in bdp.yml deklarieren und committen. Jeder im Team — und jeder zukünftige Pipeline-Lauf — löst dieselbe Version auf.

3

Herunterladen und verifizieren

Lokal oder in einem gemeinsamen Team-Speicher zwischenspeichern. Prüfsummen werden automatisch verifiziert. Bereits gecachte Dateien werden übersprungen.

MCP-Server

Für das Zeitalter der KI-Forschung entwickelt

BDP enthält einen vollständigen Model Context Protocol-Server. KI-Agenten können autonom Gen → Krankheit → Phänotyp → Signalweg → Medikament → Literatur traversieren.

24 MCP-Tools

Biomedizinischen Wissensgraphen suchen, abrufen und traversieren

Vollständiges Graph-Traversal

Gen → Krankheit → Phänotyp → Signalweg → Medikament → Literatur

MCP-kompatibel

Funktioniert mit Claude, jedem MCP-Client und benutzerdefinierten KI-Forschungsagenten

Für alle im Labor entwickelt

Egal ob Sie Pipelines schreiben, Artikel veröffentlichen oder KI-Forschungsagenten entwickeln.

Forscher

Datensätze auf exakte Versionen fixieren. Automatisch Zitate und Datenverfügbarkeitserklärungen für jede verwendete Quelle generieren.

Pipeline-Ingenieure

Native Integration mit Nextflow, Snakemake und CWL. bdp pull in jeden Workflow-Schritt einbinden — keine benutzerdefinierten Download-Skripte.

KI-Agenten

24 MCP-Tools für autonomes Daten-Traversal. KI-Agenten können Bioinformatik-Daten ohne menschliches Eingreifen suchen, abrufen und verarbeiten.

In 30 Sekunden starten

BDP installieren, eine Datenquelle hinzufügen und den ersten Datensatz herunterladen.