7 Repos
Standardized neutral formats that decouple neural network architectures and weights from specific framework implementations.
Distinct from Intermediate Representation Translation: Existing IR candidates focus on general programming language compilers or HTML, not ML model frameworks.
Explore 7 awesome GitHub repositories matching artificial intelligence & ml · Model Intermediate Representations. Refine with filters or upvote what's useful.
MMdnn ist ein Deep-Learning-Modellkonverter und -Migrator, der darauf ausgelegt ist, neuronale Netzwerkarchitekturen und Gewichte zwischen verschiedenen Frameworks wie TensorFlow, PyTorch und Keras zu übersetzen. Es nutzt eine standardisierte Zwischenrepräsentation, um Netzwerkstrukturen und Gewichte von spezifischen Framework-Implementierungen zu entkoppeln, was die Transformation vortrainierter Modelle über verschiedene Umgebungen hinweg ermöglicht. Das Projekt zeichnet sich dadurch aus, dass es aus seinen Zwischenrepräsentationen nativen Python-Rekonstruktionscode generiert, wodurch Modelle in Zielumgebungen neu aufgebaut und feinabgestimmt werden können. Es enthält zudem spezialisierte Tools für das Deployment auf Mobilgeräten, die Deep-Learning-Modelle in mobile Formate wie CoreML und TensorFlow Lite umwandeln. Das System bietet ein breiteres Spektrum an Funktionen, darunter die Visualisierung neuronaler Netzwerkarchitekturen zur Untersuchung von Graphstrukturen und Metadaten sowie die Ausführung von Modellinferenzen, um zu validieren, dass konvertierte Modelle ihr ursprüngliches Verhalten und ihre Genauigkeit beibehalten. Zusätzliche Dienstprogramme verwalten das Abrufen vortrainierter Gewichte aus Remote-Repositories und das Zusammenstellen bereitstellbarer Modell-Checkpoints.
Uses a standardized intermediate representation to decouple model structures from specific deep learning framework implementations.
SynapseML ist eine Apache Spark Machine-Learning-Bibliothek, die für den Aufbau und die Skalierung von Machine-Learning-Workflows und Datenpipelines über verteilte Cluster hinweg entwickelt wurde. Sie dient als Framework für verteilte Machine-Learning-Pipelines und als verteilte Inferenz-Engine zur Ausführung hardwarebeschleunigter Vorhersagen und Deep-Learning-Aufgaben auf großskaligen Datensätzen. Das Projekt fungiert als Cloud-KI-Integrationsschicht, die es Benutzern ermöglicht, vortrainierte KI-Dienste für Text, Bild und Sprache innerhalb verteilter Pipelines anzuwenden. Es enthält zudem eine dedizierte Suite von Tools für verteilte Anomalieerkennung, um multivariate und Zeitreihen-Ausreißer in hochdimensionalen Daten zu identifizieren. Die Bibliothek deckt ein breites Spektrum an Funktionen ab, einschließlich verteilter Computer Vision für Gesichts- und Bildanalyse, skalierbarem Natural Language Processing für Textanalysen und Übersetzungen sowie das Training von Gradient Boosted Decision Trees. Sie bietet Tools für Ähnlichkeitssuche mittels k-Nearest-Neighbor-Modellierung, Modellerklärbarkeit durch Feature-Attribution und die Orchestrierung von Reinforcement-Learning-Workflows. Das System nutzt eine zusammensetzbare Pipeline-Architektur und unterstützt ONNX-basierte Modellinferenz für plattformübergreifende Kompatibilität.
Enables the extraction of intermediate nodes from models to utilize internal layers as outputs.
Dieses Projekt ist eine umfassende Bildungsressource und ein Lehrplan, der sich auf das Design und die Implementierung des gesamten Machine-Learning-Software- und Hardware-Stacks konzentriert. Es dient als technische Referenz für die Architektur von Machine-Learning-Systemen, die von Low-Level-Programmierschnittstellen bis hin zur Deployment-Infrastruktur im großen Maßstab reicht. Das Projekt bietet instruktive Anleitungen zu mehreren spezialisierten Bereichen, einschließlich der Entwicklung von KI-Compilern durch Zwischenrepräsentationen und Graph-Optimierungen. Es deckt die Architekturmuster ab, die für verteiltes Training über GPU-Cluster hinweg erforderlich sind, sowie die Programmierung von Hardware-Beschleunigern zur Optimierung von Workloads auf spezialisierten Chips. Die Ressource beschreibt zudem die Implementierung von Modell-Serving-Frameworks für Produktionsumgebungen und das Design von Reinforcement-Learning-Pipelines. Ihr Umfang erstreckt sich auf die Kernkomponenten von ML-Systemen, wie automatische Differenzierung, Tensor-Abstraktionen und die Orchestrierung von GPU-Ressourcen.
Defines standardized neutral formats that decouple neural network architectures from specific framework implementations.
Dieses Projekt ist eine umfassende Lehrressource und ein Kurs zum Aufbau neuronaler Netze mit PyTorch. Es deckt die grundlegenden Bausteine des Deep Learning ab, einschließlich Tensor-Manipulation, automatischer Differenzierung und der Konstruktion modularer Komponenten für neuronale Netze. Das Repository dient als technischer Leitfaden für verschiedene spezialisierte Bereiche. Es bietet Implementierungsdetails für Computer-Vision-Aufgaben wie Bildklassifizierung, Objekterkennung und semantische Segmentierung sowie Workflows für die Verarbeitung natürlicher Sprache (NLP) mit Transformern, rekurrenten Netzen und generativen Modellen. Zudem enthält es eine Referenz für generative KI, mit Fokus auf die Synthese von Bildern mittels Diffusionsmodellen und adversarialen Netzwerken. Das Material erstreckt sich auf Modelloptimierung und Deployment-Pipelines. Es behandelt Techniken zur Reduzierung der Modellgröße und zur Erhöhung der Inferenzgeschwindigkeit durch Quantisierung und den Export von Modellen in Formate wie ONNX und TensorRT. Weitere Kompetenzbereiche umfassen Data Engineering für paralleles Laden, Modellevaluierung mittels benutzerdefinierter Metriken und das Deployment von Open-Source Large Language Models. Das Projekt wird primär als eine Reihe von Jupyter Notebooks bereitgestellt.
Provides capabilities for extracting intermediate nodes or internal layers from a model as outputs.
evo2 ist ein genomisches Large Language Model und Foundation Model, das darauf ausgelegt ist, genetische Informationen über verschiedene Spezies hinweg vorherzusagen, zu generieren und zu analysieren. Es fungiert als Nukleotid-Sequenz-Modellierer und DNA-Sequenz-Generator und nutzt Transformer-basiertes Sequenz-Modeling zur Verarbeitung genomischer Daten. Das System bietet Funktionen zur synthetischen DNA-Generierung, um neue genetische Sequenzen basierend auf biologischen Prompts oder spezies-spezifischen Tags zu erstellen. Es führt zudem Nukleotid-Wahrscheinlichkeitsvorhersagen durch, um genomische Varianten zu bewerten und biologische Eigenschaften innerhalb von DNA-Sequenzen zu analysieren. Das Modell unterstützt die Analyse genomischer Sequenzen durch die Extraktion hochdimensionaler Repräsentationen aus Zwischenschichten. Diese Embeddings ermöglichen spezialisierte Klassifizierungen und weiterführende Analysen genetischer Daten.
Captures high-dimensional representations from intermediate model layers for specialized downstream biological analysis.
Dieses Projekt ist ein integriertes Software-Framework, das darauf ausgelegt ist, generative Bildsynthese und leistungsstarke Modell-Inferenz auf Intel-Prozessoren und Grafikhardware zu erleichtern. Es bietet eine spezialisierte Inferenz-Engine, die latente Diffusionsmodelle ausführt, um natürlichsprachliche Beschreibungen in visuelle Ausgaben umzuwandeln. Die Bibliothek zeichnet sich dadurch aus, dass sie das OpenVINO-Toolkit nutzt, um Machine-Learning-Modelle für spezifische Intel-Hardwarearchitekturen zu optimieren. Durch die Nutzung von Hardwarebeschleunigung auf Kernebene und statischer Graphoptimierung verbessert das Framework den Ausführungsdurchsatz und die Ressourceneffizienz beim Ausführen komplexer neuronaler Netzwerk-Pipelines. Die Software unterstützt eine Reihe generativer Fähigkeiten, einschließlich Text-zu-Bild-Generierung, Bild-zu-Bild-Transformation und selektivem Image-Inpainting. Diese Funktionen ermöglichen es Benutzern, neue visuelle Inhalte zu erstellen oder bestehende Bilder zu modifizieren, während die ursprüngliche Komposition und Struktur durch hardwarebeschleunigte Diffusionsprozesse erhalten bleiben.
Provides standardized intermediate representations to decouple neural network architectures from specific hardware-optimized execution backends.
This project is a machine learning interoperability tool designed to translate models from various training frameworks into the standardized open neural network exchange format. It functions as a model deployment pipeline that enables consistent execution across diverse inference engines and hardware environments. The tool utilizes graph-based translation and an operator mapping layer to convert framework-specific mathematical functions into a common intermediate representation. It distinguishes itself through a pluggable converter architecture, which allows developers to register custom tran
Uses a structured graph format to define model topology and operator parameters for consistent cross-platform execution.