4 个仓库
Reading relational data from various file formats into structured data frames for analysis.
Distinct from Excel Data Import: Candidates are either too specific to one format (Excel/JSON) or unrelated to data analysis frames.
Explore 4 awesome GitHub repositories matching data & databases · Tabular Data Import. Refine with filters or upvote what's useful.
Danfo.js 是一个 JavaScript 数据分析和预处理库,提供高性能的标签化数据结构。它实现了数据帧(DataFrames)和序列(Series),以支持复杂的数据分析、统计计算和结构化表格数据的操作。 该项目作为一个机器学习预处理库,提供用于分类标签编码、独热编码(One-hot encoding)以及数值特征缩放和标准化的实用程序。它特别促进了将标签化数据结构转换为张量(Tensors)以进行模型训练和评估的过程。 该库涵盖了广泛的能力,包括描述性统计、合并和连接等关系操作以及时间序列处理。它包括用于数据清洗、过滤和分组的工具,以及用于直接从数据帧生成交互式图表和绘图的视觉化界面。 该系统支持通过 CSV、JSON 和 Excel 格式导入和导出数据。
Reads relational data from CSV, Excel, and JSON files into structured formats for analysis.
Tablib 是一个用于导入、导出和操作表格数据集的 Python 库。它作为多格式数据转换器和管理器,允许用户在不同的文件标准之间迁移信息。 该库支持 CSV、JSON、YAML 和 Excel 格式之间的数据转换。它提供了一个编程接口,通过添加行、过滤列和分离记录来管理这些数据集。 系统使用通用的内部表示和基于适配器的映射来规范化不同的输入源,从而在支持的文件格式之间实现一致的读写操作。
Reads relational data from various file formats into a common internal representation for further processing.
该项目是一个用于 Node.js 的 MySQL 数据库驱动程序,通过原生通信协议建立网络连接并执行 SQL 查询。它作为异步 SQL 客户端,提供基于 Promise 的查询接口和对 async/await 模式的支持,以管理非阻塞数据库操作。 该库包含完整的 MySQL 协议实现,可作为构建自定义数据库服务器、代理或客户端的工具包。它还作为连接池管理器和注入预防工具,利用预处理语句和参数化查询来保护数据库交互。 该项目涵盖了广泛的数据库集成功能,包括原子事务协调、二进制日志流式传输以及用于批量导入的表格数据流式传输。它通过自动连接清理管理资源生命周期,并提供多种身份验证机制,如密码哈希验证和安全握手协商。 连接性进一步通过 SSL 加密、网络流量压缩以及通过自定义双工流传输路由流量的能力得到支持。
Streams local tabular data into the database using a readable stream factory for efficient bulk imports.
Mapshaper 是一个用于处理、简化和转换地理矢量数据的工具,提供命令行界面、Web 浏览器工具和 Node.js 库。它作为一个坐标投影器、矢量数据转换器和 Web 地图资产优化器,旨在在不同的坐标参考系统和文件格式之间转换空间数据集。 该项目以其拓扑保持几何简化而著称,在减少顶点数量的同时保持共享边界,以防止间隙和重叠。它还通过坐标量化和属性过滤进一步优化 Web 资产,以减小文件大小。 该系统涵盖了广泛的功能,包括使用 PROJ 字符串和 EPSG 代码进行坐标重投影,以及跨 Shapefile、GeoJSON、TopoJSON、GeoPackage 和 KML 等格式的数据转换。它提供了广泛的几何处理工具,用于缓冲、裁剪、溶解和修复拓扑,以及用于属性连接、过滤和转换的数据管理实用程序。此外,它还包括用于生成样式化 SVG 导出、经纬网和比例符号地图的视觉功能。 空间处理功能可以通过其 Node.js 库直接集成到 JavaScript 应用程序和构建流水线中。
Converts CSV and TSV files into attribute data or point layers by mapping coordinates.