10 repositorios
The process of adjusting model weights using optimization algorithms based on computed gradients.
Distinct from Incremental Model Updating: Candidates focus on batching, efficiency, or incremental updates rather than the fundamental act of updating weights via SGD/Adam.
Explore 10 awesome GitHub repositories matching artificial intelligence & ml · Gradient-Based Parameter Updates. Refine with filters or upvote what's useful.
DeepLearningZeroToAll is a comprehensive educational resource and implementation collection focused on deep learning and machine learning. It provides a structured learning path using TensorFlow to move from foundational linear models to complex neural network architectures. The project is distinguished by its practical implementations of various network types, including multilayer perceptrons for logic problems, convolutional neural networks for spatial data and image recognition, and recurrent neural networks using LSTM cells for time-series forecasting and character sequence prediction. It
Implements the fundamental process of adjusting model weights using computed gradients.
Este proyecto es una colección de algoritmos y herramientas fundamentales de machine learning implementados desde cero en Python. Sirve como una librería de implementaciones centrales para modelos de regresión, clasificación y clustering, diseñada para demostrar las estructuras matemáticas subyacentes de estos algoritmos sin depender de frameworks de machine learning de alto nivel. El proyecto se centra en la implementación manual de la lógica algorítmica, incluyendo redes neuronales con propagación hacia adelante y actualizaciones de pesos, así como varios modelos de aprendizaje supervisado y no supervisado. Utiliza NumPy para la vectorización para realizar cálculos matriciales y operaciones matemáticas en grandes datasets. El toolkit cubre una amplia gama de capacidades, incluyendo reducción de dimensionalidad mediante Análisis de Componentes Principales (PCA) y preprocesamiento de datos para datasets numéricos y de imágenes. Las implementaciones algorítmicas abarcan regresión lineal y bayesiana, clustering K-Means y múltiples métodos de clasificación como Máquinas de Vectores de Soporte (SVM), Árboles de Decisión y K-Vecinos Más Cercanos (KNN). El proyecto se entrega como una serie de Jupyter Notebooks.
Implements weight adjustment logic using gradient descent to minimize prediction error.
Este proyecto es una base de código educativa y una biblioteca de referencia que traduce conceptos teóricos de deep learning en código ejecutable de PyTorch. Sirve como una implementación práctica de un libro de texto de deep learning, proporcionando una estructura similar a un curso con ejercicios guiados y ejemplos arquitectónicos con fines de aprendizaje. El repositorio incluye una biblioteca de arquitecturas de redes neuronales estándar, incluyendo modelos lineales, convolucionales, recurrentes y transformers. Implementa específicamente una variedad de patrones de deep learning como perceptrones multicapa, redes VGG, unidades recurrentes cerradas (GRU) y redes de memoria a largo plazo (LSTM). La base de código cubre amplias áreas de capacidad, incluyendo visión artificial para clasificación de imágenes y detección de objetos, así como procesamiento de lenguaje natural para modelado de secuencias y traducción. También implementa componentes fundamentales de machine learning como regresión lineal y softmax, clasificación probabilística y un conjunto de algoritmos de optimización basados en gradientes. El proyecto se entrega principalmente como una colección de Jupyter Notebooks.
Provides algorithms for updating model weights using gradients calculated from loss functions.
Este proyecto es un curso educativo de aprendizaje profundo y una guía de implementación diseñada para construir y entrenar redes neuronales. Proporciona un plan de estudios para desarrollar modelos que resuelvan tareas de reconocimiento de patrones y generación. El material incluye módulos especializados para entrenamiento en visión artificial, procesamiento de lenguaje natural e IA generativa. Cubre la aplicación práctica del aprendizaje por transferencia (transfer learning) para clasificar nuevos datos y la creación de medios sintéticos. El proyecto abarca el diseño de arquitecturas de red, la construcción de pipelines de datos de aprendizaje automático y el uso de diagnósticos de rendimiento del modelo para identificar subajuste (underfitting) o sobreajuste (overfitting). El contenido se entrega a través de Jupyter Notebooks.
Implements the process of adjusting model weights using optimization algorithms based on computed gradients.
Este proyecto es un recurso educativo integral y un manual de tutoriales para construir, entrenar y desplegar modelos de machine learning usando TensorFlow 2. Sirve como una guía de aprendizaje estructurada que cubre conceptos fundamentales de deep learning, incluyendo arquitecturas de redes neuronales, diferenciación automática y operaciones con tensores. El manual proporciona orientación técnica sobre cómo optimizar la eficiencia de ejecución mediante la gestión de memoria de GPU, entrenamiento distribuido y cuantización de modelos. También incluye guías detalladas para construir pipelines de datos de alto rendimiento y exportar modelos para servidores de producción, dispositivos móviles y navegadores web. El material abarca una amplia gama de capacidades, incluyendo el desarrollo de modelos con redes convolucionales y recurrentes, la implementación de funciones de pérdida y capas personalizadas, y el uso de modelos preentrenados para transfer learning. También aborda estrategias de despliegue para dispositivos edge y el uso de entornos de ejecución en la nube para aceleración por hardware. El recurso está implementado como una colección de Jupyter Notebooks.
Explains how to adjust model weights using gradient-based optimizers to minimize loss functions.
This project is a framework for fine-tuning large language models using parameter-efficient training techniques. It provides a structured pipeline for adapting pre-trained transformer models to specific tasks while minimizing the computational resources and memory required during the training process. The system distinguishes itself by utilizing low-rank adaptation, which injects trainable rank-decomposition matrices into frozen transformer layers. By updating only this small subset of injected parameters rather than the entire model, the framework reduces the overhead associated with gradien
Adjusts model weights using optimization algorithms based on computed gradients to minimize loss.
Este proyecto es un framework para alinear modelos de lenguaje extensos (LLM) con las preferencias humanas. Proporciona una librería para optimizar el comportamiento del modelo mapeando los datos de preferencia directamente a un objetivo de política, evitando la necesidad de un modelo de recompensa independiente. El framework utiliza un objetivo matemático de forma cerrada para ajustar los pesos del modelo maximizando la probabilidad de las respuestas preferidas frente a las no preferidas. Incluye un kit de herramientas para el ajuste fino supervisado (SFT), lo que permite a los usuarios establecer una línea base estable con datos de demostración antes de aplicar técnicas de optimización basadas en preferencias. La librería admite entrenamiento distribuido, lo que permite escalar la alineación del modelo en múltiples aceleradores de hardware mediante estrategias de fragmentación de datos y paralelización. También proporciona utilidades para preparar datasets de preferencia personalizados, mapeando pares de prompts y respuestas para estructurar la retroalimentación humana para el pipeline de entrenamiento.
Updates model parameters by calculating divergence between preferred and rejected outputs to shift probability distributions.
Este repositorio es una colección de implementaciones prácticas de machine learning diseñadas para demostrar técnicas centrales de análisis predictivo, visión por computadora y procesamiento de lenguaje natural. Sirve como un recurso para aplicar frameworks de machine learning estándar para resolver diversos problemas de ciencia de datos, que van desde la clasificación automatizada hasta el reconocimiento de patrones complejos. El proyecto se distingue por proporcionar ejemplos concretos a través de múltiples dominios, incluyendo el desarrollo de interfaces conversacionales, el análisis de datos geoespaciales y la implementación de arquitecturas de deep learning para el procesamiento de contenido visual. Cada módulo se centra en metodologías específicas, como el entrenamiento de modelos para interpretar la entrada del usuario, la previsión de tendencias temporales y la identificación de objetos dentro de transmisiones de imagen o video. La colección cubre una amplia superficie de capacidades, incluyendo pipelines de aprendizaje supervisado y no supervisado, estimación basada en regresión y optimización de redes neuronales. Estas implementaciones abordan tareas como la categorización de patrones de datos, la estimación de resultados numéricos y la realización de análisis automatizados en conjuntos de datos estructurados y no estructurados. El repositorio está organizado como una serie de Jupyter Notebooks que proporcionan implementaciones prácticas de estos flujos de trabajo de machine learning.
Updates internal model parameters by calculating loss function gradients to minimize prediction error during the iterative training process.
Este proyecto es un plan de estudios educativo estructurado diseñado para enseñar los fundamentos de la construcción y el entrenamiento de modelos de aprendizaje profundo. Proporciona una guía integral para implementar redes neuronales utilizando frameworks de machine learning de alto nivel y el lenguaje de programación Python, centrándose en ejercicios prácticos para principiantes. El tutorial se distingue por cubrir el ciclo de vida completo del desarrollo de modelos, desde la construcción inicial hasta la optimización lista para producción. Incluye módulos específicos sobre cómo refinar el rendimiento del modelo mediante la cuantización de pesos y abordar el sesgo de los datos mitigando los desequilibrios de clase. El plan de estudios también enfatiza la importancia de la preparación de datos, ofreciendo técnicas para la aumentación de imágenes y la creación de incrustaciones de palabras (word embeddings) para mejorar la generalización del modelo. Más allá del entrenamiento básico, el repositorio explora tareas avanzadas de procesamiento de lenguaje natural y visión por computadora. Demuestra cómo construir modelos de transformadores, utilizar redes neuronales recurrentes para la clasificación de texto y optimizar los pipelines de entrada de datos para garantizar un procesamiento eficiente. Los materiales también cubren prácticas de monitoreo esenciales, como la visualización de métricas de entrenamiento y funciones de pérdida para evaluar la precisión del modelo a lo largo del proceso de aprendizaje.
Updates model parameters iteratively using gradient-based backpropagation to minimize loss.
Este proyecto es una biblioteca de deep learning y framework de entrenamiento de redes neuronales construido para el ecosistema TensorFlow. Funciona como un repositorio estructurado de algoritmos y herramientas diseñadas para ejecutar rutinas de aprendizaje iterativas, ajustar conjuntos de datos complejos a modelos predictivos y gestionar el despliegue de redes neuronales entrenadas. La biblioteca proporciona una interfaz estandarizada para la investigación y prototipado de machine learning, permitiendo a los usuarios experimentar con varias arquitecturas y validar modelos de datos. Admite el ciclo de vida completo del desarrollo de modelos, desde el entrenamiento inicial de redes neuronales en conjuntos de datos personalizados hasta la aplicación de pesos preentrenados para inferencia en tiempo real. El framework abarca una amplia gama de capacidades para procesar datos multidimensionales a través de capas modulares y apilables. Utiliza rutinas automatizadas para el ajuste de parámetros y la minimización de pérdidas, asegurando que los modelos estén optimizados para una generación de resultados precisa.
Adjusts model weights using optimization algorithms based on computed gradients to minimize loss during training.