7 repository-uri
Capabilities to apply user-defined functions across multiple columns of a tabular dataset.
Distinct from Virtual Column Functions: Candidates focus on virtual columns or specific signal columns, not general-purpose function application across a sequence of columns.
Explore 7 awesome GitHub repositories matching data & databases · Custom Column Functions. Refine with filters or upvote what's useful.
This project is an educational resource and a collection of instructional materials for performing data manipulation and statistical analysis using Python. It provides a comprehensive set of guides and code examples for using the Pandas, NumPy, and Matplotlib libraries to analyze structured data. The resource includes a dedicated guide for reshaping, cleaning, and aggregating tabular data and time series via Pandas, alongside a reference for high-performance vectorized operations and linear algebra using NumPy. It also features tutorials for creating publication-quality charts, distribution p
Provides examples of executing custom functions across every row or column of a tabular dataset.
Torchtune is a PyTorch-native library for fine-tuning, aligning, and quantizing large language models. It provides a configurable training pipeline orchestrated through YAML recipes, with CLI overrides and component swapping, distributed training via FSDP2, memory optimizations, and parameter-efficient fine-tuning methods like LoRA, DoRA, and QLoRA. The library distinguishes itself through its YAML-driven configuration system that defines all training parameters and instantiates components from config files, with full CLI override capability for any field or component at launch time. It suppo
Maps custom column names in datasets to expected conversation fields for flexible data loading.
Torchtune is a PyTorch-native library for fine-tuning, aligning, and quantizing large language models. It provides a config-driven system for instantiating components, orchestrating distributed training, and managing parameter-efficient fine-tuning with quantization support, all through YAML-based configurations and command-line overrides. The library distinguishes itself through its comprehensive post-training workflow orchestration, combining supervised fine-tuning, preference optimization (DPO, PPO, GRPO), knowledge distillation, and quantization-aware training in a single configurable pip
Maps dataset column names to conversation message fields for fine-tuning workflows.
Acest proiect este un plugin de bază de cunoștințe și manager de context RAG care utilizează o interfață de bază de date vectorială locală pentru a permite căutarea semantică și maparea relațiilor. Transformă textul în vectori numerici pentru a găsi note și fragmente corelate semantic pe baza semnificației conceptuale, nu doar a potrivirilor de cuvinte cheie. Sistemul se diferențiază printr-un vizualizator de grafuri semantice care mapează notele în clustere pentru a dezvălui conexiuni conceptuale. De asemenea, dispune de un manager de context capabil să grupeze note și fragmente locale în pachete reutilizabile pentru a oferi baze factuale solide pentru conversațiile cu modele de limbaj mari (LLM). Instrumentul acoperă o gamă largă de capabilități, inclusiv interogarea cunoștințelor în limbaj natural, executarea automatizată a fluxurilor de lucru pentru crearea de note și capacitatea de a ruta prompturile între modele AI locale și cele bazate pe cloud. Oferă mai multe interfețe de descoperire, cum ar fi indicatori de conținut corelat inline și un panou de subsol pentru afișarea documentelor similare în timpul procesului de editare.
Uses custom functions in formula columns to retrieve connection scores or related links.
dplyr este o bibliotecă R pentru manipularea datelor care oferă o gramatică pentru transformarea cadrelor de date (data frames) tabelare. Funcționează ca un procesor de data frames în memorie și un instrument de algebră relațională, folosind un set consistent de verbe pentru a filtra, selecta și sumariza datele. Proiectul include un motor de traducere SQL care convertește expresiile de manipulare a datelor de nivel înalt în interogări optimizate. Acest lucru permite utilizatorilor să efectueze transformări direct pe baze de date relaționale la distanță și în stocarea cloud, fără a descărca datele local. Biblioteca acoperă o gamă largă de operațiuni tabelare, inclusiv mutarea coloanelor, subsetarea rândurilor și join-uri de date relaționale. De asemenea, oferă capabilități pentru analiza datelor grupate, permițând partiționarea seturilor de date pentru agregări și rezumate independente.
Executes user-defined functions across multiple columns identified by their names, positions, or properties.
dcat-admin este un framework de panou de administrare Laravel utilizat pentru a construi rapid interfețe administrative bazate pe date. Funcționează ca un generator CRUD și instrument de scaffolding backend care produce automat interfețe de creare, citire, actualizare și ștergere bazate pe schemele tabelelor din baza de date. Sistemul se distinge printr-o arhitectură de extensii bazată pe plugin-uri și capacitatea de a rula mai multe instanțe administrative independente într-o singură instalare. Oferă instrumente specializate pentru maparea API-urilor externe către formulare și tabele, precum și un ciclu de viață al formularului bazat pe evenimente pentru executarea de logică personalizată în timpul rezoluției și trimiterii. Framework-ul acoperă o gamă largă de domenii de capabilități, inclusiv controlul accesului bazat pe roluri (RBAC) pentru gestionarea permisiunilor ierarhice, o suită completă de grile de gestionare a datelor cu editare inline și fluxuri de lucru pentru formulare în mai mulți pași. Include, de asemenea, instrumente de vizualizare a datelor pentru dashboard-uri operaționale și o varietate de utilitare de manipulare a conținutului pentru încărcări de fișiere mari și editare text îmbogățit. Sunt furnizate utilitare de linie de comandă pentru a automatiza generarea componentelor administrative și a claselor de acțiune.
Allows adding custom methods to column classes via macros for project-specific data rendering in grids.
DataFrame is a C++ tabular data library and manipulation engine designed for managing heterogeneous data in contiguous memory. It functions as a statistical analysis framework and time series analysis toolkit, providing the means to store, index, and transform multidimensional datasets. The project distinguishes itself through a high-performance execution model that utilizes column-major storage, SIMD-aligned memory allocation, and a thread-pool for parallel computations. It employs a visitor-based algorithm dispatch system and policy-driven transformations to decouple data processing logic f
Applies custom user-defined functions across multiple columns of a tabular dataset.