2 dépôts
Using regex to find and identify specific character sequences within text data.
Distinct from Pattern-Based Data Identification: Candidates focus on file-system filtering or high-frequency string algorithms; this is general data pattern matching.
Explore 2 awesome GitHub repositories matching data & databases · Regular Expression Pattern Identification. Refine with filters or upvote what's useful.
r4ds est un cursus de science des données et une ressource pédagogique conçue pour maîtriser le langage de programmation R. Il fournit un chemin d'apprentissage structuré pour le processus de bout en bout d'importation, de nettoyage, de transformation et de visualisation des données. Le projet met l'accent sur un guide de science des données reproductible et un cursus complet pour le data wrangling. Il inclut des tutoriels spécialisés sur la grammaire des graphiques pour la visualisation de données en couches et des publications techniques créées avec Quarto qui mélangent code exécutable et prose narrative. Le matériel couvre un large éventail de capacités analytiques, incluant l'ingestion de données à partir de sources diverses, la jointure de données relationnelles et la gestion des variables catégorielles. Il aborde également le nettoyage de données, la modélisation mathématique et la génération de rapports et présentations professionnels multi-formats. Le cursus se concentre sur l'application pratique de la programmation fonctionnelle et des principes de tidy data pour créer des analyses transparentes et répétables.
Uses regular expressions to find and highlight specific character sequences, metacharacters, and quantifiers.
vim-easy-align est un plugin d'alignement de texte et une extension pour l'éditeur Vim. Il fonctionne comme un formateur de texte basé sur des expressions régulières conçu pour aligner verticalement le texte sur plusieurs lignes. L'outil identifie les points d'ancrage d'alignement en utilisant des caractères ou des expressions régulières pour créer des mises en page tabulaires et un formatage de code source organisé. Il supporte le ciblage d'occurrences spécifiques pour déterminer quelle instance d'un caractère répété sert d'ancrage, ainsi que la capacité de définir des règles d'alignement et des délimiteurs personnalisés. Les capacités incluent l'alignement de texte multiligne avec des modes gauche, droite ou centré, et la capacité de restreindre les opérations d'alignement à des blocs de texte rectangulaires. Le système intègre un filtrage conscient de la syntaxe pour ignorer les délimiteurs trouvés dans les chaînes ou les commentaires et fournit un aperçu visuel en temps réel du résultat de l'alignement avant qu'il ne soit appliqué.
Uses regular expressions to identify the character sequences that serve as alignment anchor points.