2 Repos
Transformer architectures that utilize a bidirectional encoder to process inputs and an autoregressive decoder to generate outputs.
Distinct from Encoder-Decoder Generation Methods: The candidates are either vision-specific or overly narrow; this covers the general NLP encoder-decoder architecture.
Explore 2 awesome GitHub repositories matching artificial intelligence & ml · Encoder-Decoder Transformers. Refine with filters or upvote what's useful.
Dies ist ein Machine-Learning-Framework zur Behandlung diverser Natural-Language-Processing-Aufgaben als einheitliches Text-zu-Text-Problem. Es bietet ein Toolkit für das Pre-Training und Fine-Tuning groß angelegter Transformer-Modelle und nutzt ein System, bei dem sowohl Eingaben als auch Ausgaben als rohe Textsequenzen formatiert sind. Das Framework zeichnet sich durch sein verteiltes Trainingssystem aus, das Mesh-basierte Strategien verwendet, um Modellgewichte und Trainings-Batches über mehrere TPU-Kerne hinweg zu skalieren. Es unterstützt Multi-Task-Learning durch die Kombination diverser Datensätze in einem einzigen Trainingsstrom unter Verwendung konfigurierbarer Mischraten, wodurch ein einziges Modell verschiedene Sprachaufgaben bewältigen kann. Das System deckt ein breites Spektrum an Funktionen ab, einschließlich Encoder-Decoder-Architekturen, Beam-Search-Decoding für Textgenerierung und Transfer-Learning-Workflows. Es enthält Dienstprogramme für die Vorbereitung von NLP-Datensätzen, die Bewertung der Modellleistung und den Export trainierter Checkpoints für die produktive Bereitstellung. Die Bibliothek unterstützt das Laden vortrainierter Modell-Checkpoints verschiedener Größen, um die Entwicklung zu beschleunigen.
Provides a transformer architecture featuring a bidirectional encoder and an autoregressive decoder for sequence-to-sequence tasks.
Dieses Projekt ist eine umfassende Bildungsressource für Machine Learning und eine Tutorial-Reihe, die als Sammlung interaktiver Jupyter Notebooks bereitgestellt wird. Es bietet praktische Python-Implementierungen für den gesamten Machine-Learning-Lebenszyklus und deckt überwachtes (supervised) und unüberwachtes (unsupervised) Lernen, Deep Learning sowie Reinforcement Learning ab. Die Ressource zeichnet sich durch detaillierte Implementierungsanleitungen für komplexe Architekturen aus, darunter Transformer, Generative Adversarial Networks (GANs) und Convolutional Neural Networks (CNNs). Zudem enthält sie spezialisierte Kursmaterialien für die Entwicklung von Reinforcement-Learning-Agenten mittels Q-Learning und Deep Q-Networks in simulierten Umgebungen. Die Inhalte decken ein breites Spektrum an Data-Science-Fähigkeiten ab, einschließlich Data-Engineering-Pipelines, Feature-Encoding und Dimensionsreduktion. Es bietet umfangreiches Material zur Modellevaluierung durch Kreuzvalidierung und diagnostische Metriken sowie fortgeschrittene Themen wie Natural Language Processing (NLP), Sentiment-Analyse und generative KI. Der gesamte Lehrplan ist für die interaktive Ausführung in Jupyter Notebooks konzipiert und kombiniert ausführbaren Code, Rich Text und Visualisierungen.
Implements transformer architectures using encoder-decoder structures for processing and generating sequential information.