2 个仓库
Using regex to find and identify specific character sequences within text data.
Distinct from Pattern-Based Data Identification: Candidates focus on file-system filtering or high-frequency string algorithms; this is general data pattern matching.
Explore 2 awesome GitHub repositories matching data & databases · Regular Expression Pattern Identification. Refine with filters or upvote what's useful.
r4ds 是一个数据科学课程和教育资源,专为精通 R 编程语言而设计。它为导入、整理、转换和可视化数据的端到端过程提供了结构化的学习路径。 该项目强调可重复的数据科学指南和全面的数据整理课程。它包括关于用于分层数据可视化的图形语法(grammar of graphics)的专业教程,以及使用 Quarto 创建的融合可执行代码与叙述性文本的技术出版物。 该材料涵盖了广泛的分析能力,包括来自不同来源的数据摄取、关系数据连接以及分类变量的管理。它还涉及数据清洗、数学建模以及多格式专业报告和演示文稿的生成。 该课程侧重于函数式编程和整洁数据(tidy data)原则的实际应用,以创建透明且可重复的分析。
Uses regular expressions to find and highlight specific character sequences, metacharacters, and quantifiers.
vim-easy-align 是一个用于 Vim 编辑器的文本对齐插件和扩展。它作为一个基于正则表达式的文本格式化工具,旨在跨多行垂直对齐文本。 该工具通过字符或正则表达式识别对齐锚点,以创建表格布局和组织化的源代码格式。它支持特定出现次数定位,以确定重复字符的哪一个实例作为锚点,以及定义自定义对齐规则和分隔符的能力。 功能包括具有左、右或居中模式的多行文本对齐,以及将对齐操作限制为矩形文本块的能力。该系统整合了语法感知过滤,以忽略字符串或注释内的分隔符,并在应用前提供对齐结果的实时视觉预览。
Uses regular expressions to identify the character sequences that serve as alignment anchor points.