13 dépôts
Mechanisms for organizing analysis outputs based on specific criteria like alphabetical order or numerical sequences.
Distinct from Result Sequencers: None of the candidates cover general output sorting; they focus on phrase matching, parallel execution sequencing, or biological sequence analysis.
Explore 13 awesome GitHub repositories matching data & databases · Result Sorting. Refine with filters or upvote what's useful.
pyWhat is a Python-based data extraction tool designed to scan files and text for sensitive identifiers, credentials, and network artifacts using regular expressions. It functions as a pattern matching engine and PII scanner capable of identifying personal identifiers and sensitive data patterns across directories and binary files. The project specializes in the identification of unknown data formats through file signatures and the extraction of high-value identifiers, such as URLs, IP addresses, and phone numbers, from network capture files. It utilizes a rarity-based filtering system and sp
Organize matching results by keys in ascending or descending sequences for improved data review.
Eve is a REST API framework that maps database collections to web resources through declarative configuration files. It functions as a database-to-API mapper, automatically exposing data as RESTful endpoints with built-in support for CRUD operations and schema-based request validation. The project distinguishes itself through a HATEOAS API engine that generates hypermedia links and resource schemas for dynamic client discovery. It also includes an automated Swagger documentation generator that produces interactive specifications for client SDK generation and testing. The framework provides a
Orders returned documents by one or more fields via query parameters.
Pinot is a distributed, columnar analytical database designed for high-concurrency, low-latency query processing. It functions as a real-time OLAP datastore, enabling interactive, user-facing analytics by ingesting and querying massive datasets from both streaming and batch sources. The system architecture relies on a centralized controller for cluster coordination and a distributed segment-based storage model to ensure horizontal scalability. The platform distinguishes itself through a hybrid ingestion pipeline that unifies real-time event streams and historical batch data into a single quer
Improves efficiency by applying sorting and limits before evaluating projection expressions.
GraphQL.NET est un framework côté serveur pour construire et exécuter des API GraphQL au sein d'applications C#. Il fournit une boîte à outils complète pour la construction de schémas, un moteur fédéré pour les graphes de données distribués et un gestionnaire d'abonnements pour gérer les flux de données en temps réel. Le projet se distingue par un constructeur de schéma flexible qui prend en charge à la fois les définitions programmatiques code-first et les approches déclaratives schema-first utilisant le langage de définition de schéma standard. Il inclut un moteur de fédération dédié pour diviser les graphes de données en sous-graphes et les composer en une passerelle unifiée, ainsi qu'une implémentation de chargeur de données (data loader) spécifiquement conçue pour résoudre le problème de requête N+1 via le traitement par lots et la mise en cache. Le framework couvre un large éventail de capacités opérationnelles, notamment l'intégration de l'injection de dépendances pour la gestion du cycle de vie des services, des pipelines de middleware pour l'interception de la résolution de champs, et un pipeline d'exécution optimisé avec des types de valeur pour réduire les allocations mémoire. Il fournit également des outils pour l'analyse de la complexité des requêtes, la mise en cache des documents et le contrôle d'accès basé sur les rôles pour sécuriser les endpoints de l'API. La prise en charge de la compilation de schéma en avance de phase (ahead-of-time) permet au framework de s'exécuter dans des environnements qui interdisent la génération de code dynamique.
Uses custom comparers to determine the order of results returned by discovery queries.
Apache Hive is a SQL-on-Hadoop data warehouse that enables querying and managing petabytes of data stored in distributed storage such as HDFS and cloud storage services. It provides a familiar SQL interface for batch analytics and reporting, supported by a core set of components including the HiveServer2 Thrift service for remote query execution, the Hive Metastore Service for central metadata management, the Hive ACID Transaction Engine for concurrent read-write operations, and the Hive LLAP Interactive Engine for low-latency analytical processing. The WebHCat REST API offers an HTTP interfac
Orders or distributes rows across reducers using ORDER BY, SORT BY, DISTRIBUTE BY, or CLUSTER BY clauses.
django-filter est une bibliothèque pour filtrer les QuerySets Django en mappant les paramètres d'URL aux recherches en base de données en utilisant une syntaxe déclarative. Elle fonctionne comme un générateur de filtres de modèle et un outil de recherche en base de données qui traduit les paramètres de requête en requêtes pour affiner les résultats de données. Le projet permet la génération automatique de filtres de recherche et de formulaires orientés utilisateur basés sur les définitions de champs de modèle. Il prend en charge une logique de récupération avancée via des méthodes de recherche personnalisées, des chemins de relation et l'intégration de recherche plein texte, tout en fournissant un système pour affiner les résultats au sein des endpoints d'API REST. Sa surface de capacité inclut la création de formulaires de filtrage interactifs, le rendu de vues de liste filtrées et l'utilisation de fonctions de fabrique pour l'instanciation dynamique de jeux de filtres. Le système gère également le filtrage spécifique au type pour les booléens, les UUID et les horodatages ISO 8601, ainsi que le filtrage basé sur la requête utilisant l'identité de l'utilisateur authentifié.
Orders the resulting data set based on specified fields, including computed values or non-model properties.
MiniOB is an open-source educational relational database kernel designed for learning the internals of database systems. It implements a dual-engine storage architecture combining B+ Tree and LSM-Tree, supports SQL parsing and query execution, and provides transactional processing with multi-version concurrency control. The system communicates with clients using the MySQL wire protocol and includes a vector database extension for storing and querying high-dimensional vectors. The project distinguishes itself through its comprehensive coverage of core database concepts in a single, learnable c
Order the result set by specified columns in ascending or descending order using the ORDER BY clause.
Mapshaper est un outil pour traiter, simplifier et convertir des données vectorielles géographiques, disponible sous forme d'interface en ligne de commande, d'outil de navigateur web et de bibliothèque Node.js. Il fonctionne comme un projecteur de coordonnées, un convertisseur de données vectorielles et un optimiseur d'actifs de carte web conçu pour transformer les jeux de données spatiaux entre différents systèmes de référence de coordonnées et formats de fichiers. Le projet se distingue par sa simplification de géométrie préservant la topologie, qui réduit le nombre de sommets tout en maintenant les limites partagées pour éviter les lacunes et les chevauchements. Il optimise davantage les actifs pour le web grâce à la quantification des coordonnées et au filtrage des attributs pour réduire la taille des fichiers. Le système couvre un large éventail de capacités, y compris la reprojection de coordonnées utilisant des chaînes PROJ et des codes EPSG, et la conversion de données entre des formats tels que Shapefile, GeoJSON, TopoJSON, GeoPackage et KML. Il fournit des outils de traitement de géométrie étendus pour la mise en mémoire tampon, le découpage, la dissolution et la réparation des topologies, ainsi que des utilitaires de gestion de données pour la jointure, le filtrage et la transformation d'attributs. De plus, il inclut des fonctionnalités de visualisation pour générer des exportations SVG stylisées, des graticules et des cartes à symboles proportionnels. Les capacités de traitement spatial peuvent être intégrées directement dans les applications JavaScript et les pipelines de build via sa bibliothèque Node.js.
Orders features in a layer based on the result of an expression.
fsearch is a high-performance desktop file search tool and filesystem indexing engine. It provides near-instant location of files and folders on a local filesystem by utilizing a background indexing system that monitors filesystem changes in real time. The utility distinguishes itself through advanced query capabilities, including support for boolean search logic using AND, OR, and NOT operators, as well as regular expression and wildcard filtering. It allows for precise result refinement using literal character handling and specific search modifiers such as case sensitivity and exact matches
Organizes search results by comparing stored attributes like file size and modification dates.
La WordPress REST API est une interface web et une API de contenu basée sur JSON qui permet de récupérer et de modifier le contenu, les utilisateurs et les métadonnées d'un site via des méthodes HTTP standard. Elle fonctionne comme une interface de CMS headless, découplant la gestion du contenu du frontend en exposant les données du site via un contrôleur RESTful programmable. Le système se distingue par sa découverte pilotée par hypermédia et sa validation basée sur JSON-schema, permettant aux clients de localiser les ressources par programmation et d'assurer des échanges de données prévisibles. Il utilise l'enregistrement de points de terminaison par espaces de noms pour organiser les routes et prend en charge une couche d'authentification flexible incluant des mots de passe d'application, des cookies de session et des standards d'identité tiers. L'API couvre un large éventail de capacités de gestion des ressources, incluant la manipulation des articles, des pages, des médias et du contenu basé sur des blocs. Elle fournit des utilitaires complets pour la gestion des réponses, tels que l'imbrication de ressources, la pagination et le filtrage de champs, ainsi que des outils pour gérer les révisions de contenu et l'administration du site. La prise en charge de SDK spécifiques au langage est fournie pour abstraire les requêtes réseau en interfaces programmatiques de haut niveau.
Organizes returned data in ascending or descending order based on specific resource fields.
Ce projet est un framework de traitement de données tabulaires haute performance pour R, conçu pour gérer des jeux de données massifs avec efficacité mémoire et vitesse. Il fournit une structure de données améliorée qui utilise la sémantique de référence et la modification sur place pour effectuer des transformations complexes sans la surcharge de copies d'objets inutiles. La bibliothèque se distingue par ses optimisations architecturales de bas niveau, incluant le traitement parallèle multi-threadé, le tri basé sur radix et l'analyse de fichiers mappés en mémoire. En déchargeant les routines critiques de manipulation et d'agrégation de données vers du code C compilé, elle permet une exécution rapide des tâches qui seraient autrement coûteuses en calcul. Son moteur principal prend en charge des opérations relationnelles avancées, telles que les jointures non-équi, glissantes et à intervalles chevauchants, parallèlement à l'indexation secondaire automatique pour accélérer l'accès répété aux données. Au-delà de ses capacités de traitement principales, le projet offre une suite complète d'outils pour la gestion du cycle de vie des données. Cela inclut des utilitaires d'ingestion et de sérialisation à haute vitesse avec détection automatique de type, ainsi qu'un support spécialisé pour l'analyse de séries temporelles et l'agrégation multidimensionnelle. Le framework est conçu pour évoluer, permettant aux utilisateurs d'effectuer des opérations complexes de regroupement, de filtrage et de remodelage sur des jeux de données contenant des milliards de lignes tout en maintenant la stabilité et les performances du système.
Groups data and automatically sorts the resulting output by the grouping variables.
Inspektor Gadget is an eBPF observability toolset and program framework designed for tracing Linux systems and debugging Kubernetes nodes. It provides a suite of tools to collect kernel-level telemetry and export system metrics via the OpenTelemetry standard. The project distinguishes itself by packaging inspection tools as OCI-compliant container images, allowing for standardized distribution and deployment across clusters and hosts. It employs a modular data processing pipeline that utilizes WebAssembly modules to transform and filter telemetry, and leverages Compile Once Run Everywhere for
Organizes the resulting inspection data streams based on specified field criteria.
Pothos is a code-first GraphQL schema builder and framework designed for type-safe development. It allows developers to construct schemas using typed definitions in TypeScript, eliminating the need for external code generation steps. The framework distinguishes itself through a dedicated data mapper that connects GraphQL types to relational databases and ORMs, such as Prisma, while optimizing query resolution. It provides a full implementation of the Relay specification, including global object identification and cursor-based pagination. The project covers several core capability areas, incl
Aligns returned data with original request identifiers using custom sorting to maintain correct order during batching.