2 repositorios
Techniques for retrieving specific elements from complex data structures using indices, logic, or names.
Distinguishing note: Candidates focus on web scraping or DB plugins; this is about in-memory data frame and vector indexing.
Explore 2 awesome GitHub repositories matching data & databases · Data Subsetting and Extraction. Refine with filters or upvote what's useful.
r4ds es un currículo de ciencia de datos y recurso educativo diseñado para dominar el lenguaje de programación R. Proporciona una ruta de aprendizaje estructurada para el proceso de extremo a extremo de importar, limpiar, transformar y visualizar datos. El proyecto enfatiza una guía de ciencia de datos reproducible y un currículo integral para la manipulación de datos (data wrangling). Incluye tutoriales especializados sobre la gramática de gráficos para la visualización de datos en capas y publicaciones técnicas creadas con Quarto que combinan código ejecutable con prosa narrativa. El material cubre una amplia gama de capacidades analíticas, incluyendo la ingesta de datos de diversas fuentes, unión de datos relacionales y la gestión de variables categóricas. También aborda la limpieza de datos, modelado matemático y la generación de informes y presentaciones profesionales en múltiples formatos. El currículo se centra en la aplicación práctica de la programación funcional y los principios de datos ordenados (tidy data) para crear análisis transparentes y repetibles.
Implements techniques for retrieving specific elements from vectors and data frames using indices, logic, or names.
Danfo.js es una biblioteca de análisis y preprocesamiento de datos para JavaScript que proporciona estructuras de datos etiquetadas de alto rendimiento. Implementa dataframes y series para permitir análisis de datos complejos, computación estadística y la manipulación de datos tabulares estructurados. El proyecto sirve como una biblioteca de preprocesamiento para machine learning, ofreciendo utilidades para codificación de etiquetas categóricas, one-hot encoding y escalado y estandarización de características numéricas. Facilita específicamente la conversión de estructuras de datos etiquetadas en tensores para el entrenamiento y evaluación de modelos. La biblioteca cubre un amplio conjunto de capacidades, incluyendo estadísticas descriptivas, operaciones relacionales como merge y join, y procesamiento de series temporales. Incluye herramientas para limpieza, filtrado y agrupación de datos, así como una interfaz de visualización para generar gráficos interactivos directamente desde los dataframes. El sistema soporta la importación y exportación de datos mediante formatos CSV, JSON y Excel.
Retrieves specific columns, rows, or cross-sections using labels, integer positions, or slice notation.