4 مستودعات
Utilities for importing and preparing data from diverse sources for downstream processing.
Distinguishing note: Focuses on data ingestion for AI pipelines, not general ETL.
Explore 4 awesome GitHub repositories matching data & databases · Data Loaders. Refine with filters or upvote what's useful.
This project is a comprehensive platform for quantitative investment research, machine learning, and algorithmic trading. It provides an end-to-end environment for developing, testing, and executing financial strategies, supporting the entire lifecycle from data ingestion and feature engineering to model training and backtesting. The system is distinguished by its configuration-driven workflow orchestration, which allows researchers to automate complex pipelines and manage experiments through declarative files. It features a high-performance data infrastructure that utilizes custom binary for
Imports raw financial information from diverse sources into processing pipelines using configurable loaders.
Acts as a drop-in replacement for data loaders in TensorFlow, PyTorch, and MXNet.
GraphQL.NET هو إطار عمل من جانب الخادم لبناء وتنفيذ واجهات برمجة تطبيقات GraphQL داخل تطبيقات C#. يوفر مجموعة أدوات شاملة لبناء المخططات، ومحركاً اتحادياً لرسوم البيانات الموزعة، ومعالج اشتراكات لإدارة تدفقات البيانات في الوقت الفعلي. يتميز المشروع بمنشئ مخططات مرن يدعم كلاً من تعريفات الكود أولاً البرمجية ونهج المخطط أولاً التصريحي باستخدام لغة تعريف المخطط القياسية. يتضمن محرك اتحاد مخصص لتقسيم رسوم البيانات إلى رسوم فرعية وتكوينها في بوابة موحدة، بالإضافة إلى تنفيذ محمل بيانات مصمم خصيصاً لحل مشكلة استعلام N+1 من خلال التجميع والتخزين المؤقت. يغطي إطار العمل مجموعة واسعة من القدرات التشغيلية، بما في ذلك تكامل حقن التبعية لإدارة عمر الخدمة، وخطوط أنابيب البرمجيات الوسيطة لاعتراض دقة الحقول، وخط أنابيب تنفيذ محسن بأنواع القيم لتقليل تخصيصات الذاكرة. كما يوفر أدوات لتحليل تعقيد الاستعلام، والتخزين المؤقت للمستندات، والتحكم في الوصول القائم على الأدوار لتأمين نقاط نهاية API. يسمح دعم تجميع المخططات مسبقاً لإطار العمل بالتنفيذ في البيئات التي تحظر إنشاء الكود الديناميكي.
Supports sequencing multiple data loading operations where the output of one loader serves as the input for another.
This is a structured deep learning curriculum for programmers, delivered as a collection of Jupyter notebooks. It teaches the fundamentals of training neural networks for computer vision, natural language processing, tabular data analysis, and collaborative filtering using PyTorch and the fastai library. The course is designed to be hands-on, guiding learners from building a training loop from scratch to fine-tuning pretrained models for a variety of practical tasks. The curriculum distinguishes itself by covering the full lifecycle of a deep learning project, from data preparation and augmen
Creates test data loaders that reuse validation preprocessing transforms for consistent evaluation.