Why is fchollet/keras a recommended Compute Backends GitHub Repositories repository?

Allows swapping between different compute backends to optimize model execution for specific hardware or performance needs.

Why is ray-project/ray a recommended Compute Backends GitHub Repositories repository?

Allows choosing between actor-based or task-based execution backends to optimize resource usage for dataset transformations.

Why is dask/dask a recommended Compute Backends GitHub Repositories repository?

Allows switching between different computing engines to optimize performance based on the specific data structure or hardware environment.

Why is modin-project/modin a recommended Compute Backends GitHub Repositories repository?

Allows switching between different distributed processing frameworks by swapping the underlying compute backend.

4 Repos

Awesome GitHub RepositoriesCompute Backends

Configurations for selecting execution strategies in data processing.

Distinguishing note: Focuses on choosing between task-based or actor-based backends.

Explore 4 awesome GitHub repositories matching data & databases · Compute Backends. Refine with filters or upvote what's useful.

Finde die besten Repos mit KI.Wir suchen mit KI nach den am besten passenden Repositories.

fchollet/keras
fchollet/keras
64,095Auf GitHub ansehen
Keras is a high-level deep learning API used to design, build, and train neural networks for tasks such as computer vision, natural language processing, and time series forecasting. It provides a framework for defining model architectures and optimizing weights through a structured interface. The project is defined by a backend-agnostic design that allows the same model code to run across different compute engines. This multi-backend execution enables users to swap underlying engines to optimize for specific hardware or performance requirements. The system supports distributed model training
Allows swapping between different compute backends to optimize model execution for specific hardware or performance needs.
Python
Auf GitHub ansehen64,095
ray-project/ray
ray-project/ray
42,895Auf GitHub ansehen
Ray is a distributed computing framework designed to scale Python and Java applications across clusters by abstracting task scheduling and resource management. It functions as a resource-aware execution engine that manages task dependencies, placement, and fault tolerance across networked compute nodes. At its core, the system provides a stateful actor model, allowing developers to define classes that run in dedicated processes to maintain and mutate internal state across remote method calls. The framework distinguishes itself through a robust cross-language interoperability layer, enabling f
Allows choosing between actor-based or task-based execution backends to optimize resource usage for dataset transformations.
Pythondata-sciencedeep-learningdeployment
Auf GitHub ansehen42,895
dask/dask
dask/dask
13,746Auf GitHub ansehen
Dask ist ein Framework für paralleles Rechnen und ein verteilter Task-Scheduler, der darauf ausgelegt ist, Python-Data-Science-Workflows von einzelnen Maschinen auf große Cluster zu skalieren. Es fungiert als Cluster-Ressourcenmanager, der die Berechnungslogik orchestriert, indem Aufgaben und deren Abhängigkeiten als gerichtete azyklische Graphen dargestellt werden. Diese Architektur ermöglicht es dem System, die Verteilung von Workloads auf verfügbare Hardware zu automatisieren und gleichzeitig komplexe Ausführungsanforderungen zu verwalten. Das Projekt zeichnet sich durch eine Lazy-Evaluation-Engine aus, die Datenoperationen verzögert, bis sie explizit angefordert werden, was eine globale Graphoptimierung und effiziente Ressourcenzuweisung ermöglicht. Es integriert speicherbewusstes Data-Spilling, um Systemabstürze bei der Verarbeitung von Datensätzen zu verhindern, die den verfügbaren Speicher überschreiten, und nutzt Task-Graph-Fusion, um Sequenzen von Operationen in einzelne Ausführungsschritte zu kombinieren, wodurch Scheduling-Overhead und Inter-Node-Kommunikation minimiert werden. Die Plattform bietet eine umfassende Oberfläche für die Datenanalyse im großen Maßstab, einschließlich Unterstützung für verteiltes maschinelles Lernen, Integration in das Hochleistungsrechnen und parallele Datenverarbeitung. Sie bietet umfangreiche Werkzeuge für das Cluster-Lebenszyklusmanagement, Performance-Profiling und die Echtzeitüberwachung der Aufgabenausführung. Benutzer können diese Umgebungen über verschiedene Infrastrukturen hinweg bereitstellen, einschließlich lokaler Hardware, Cloud-Anbietern, containerisierten Systemen und Hochleistungsrechner-Clustern.
Allows switching between different computing engines to optimize performance based on the specific data structure or hardware environment.
Pythondasknumpypandas
Auf GitHub ansehen13,746
modin-project/modin
modin-project/modin
10,389Auf GitHub ansehen
Modin is a distributed dataframe library and parallel data processing engine designed to handle large datasets that exceed system memory. It functions as a distributed computing framework that parallelizes data manipulation tasks across multiple CPU cores or clusters to increase throughput and avoid memory errors. The project mirrors the Pandas API, allowing for the distribution of data workflows without changing core code logic. It utilizes a pluggable backend interface, which enables users to switch between different distributed execution engines to optimize performance based on available h
Allows switching between different distributed processing frameworks by swapping the underlying compute backend.
Pythonanalyticsdata-sciencedataframe
Auf GitHub ansehen10,389

Awesome Compute Backends GitHub Repositories

fchollet/keras

ray-project/ray

dask/dask

modin-project/modin