2 مستودعات
Techniques for retrieving specific elements from complex data structures using indices, logic, or names.
Distinguishing note: Candidates focus on web scraping or DB plugins; this is about in-memory data frame and vector indexing.
Explore 2 awesome GitHub repositories matching data & databases · Data Subsetting and Extraction. Refine with filters or upvote what's useful.
r4ds هو منهج لعلوم البيانات ومورد تعليمي مصمم لإتقان لغة البرمجة R. يوفر مسار تعلم منظماً للعملية الشاملة لاستيراد البيانات، وتنظيمها، وتحويلها، وتصورها. يركز المشروع على دليل علوم البيانات القابل للتكرار ومنهج شامل لمعالجة البيانات. يتضمن دروساً تعليمية متخصصة حول قواعد الرسومات لتصور البيانات الطبقي والمنشورات التقنية التي تم إنشاؤها باستخدام Quarto والتي تمزج بين الكود القابل للتنفيذ والنثر السردي. تغطي المادة مجموعة واسعة من القدرات التحليلية، بما في ذلك استيعاب البيانات من مصادر متنوعة، وربط البيانات العلائقية، وإدارة المتغيرات الفئوية. كما تتناول تنظيف البيانات، والنمذجة الرياضية، وإنشاء تقارير وعروض تقديمية احترافية متعددة التنسيقات. يركز المنهج على التطبيق العملي للبرمجة الوظيفية ومبادئ البيانات المرتبة (Tidy data) لإنشاء تحليلات شفافة وقابلة للتكرار.
Implements techniques for retrieving specific elements from vectors and data frames using indices, logic, or names.
Danfo.js هي مكتبة لتحليل البيانات والمعالجة المسبقة لـ JavaScript توفر هياكل بيانات مصنفة عالية الأداء. تنفذ إطارات البيانات (DataFrames) والسلاسل لتمكين تحليل البيانات المعقد، والحوسبة الإحصائية، ومعالجة البيانات الجدولية المهيكلة. تعمل المكتبة كمكتبة للمعالجة المسبقة لتعلم الآلة، حيث تقدم أدوات لتشفير التسميات الفئوية، والتشفير الأحادي (One-hot encoding)، وتوسيع نطاق الميزات الرقمية وتوحيدها. تسهل بشكل خاص تحويل هياكل البيانات المصنفة إلى tensors لتدريب النماذج وتقييمها. تغطي المكتبة مجموعة واسعة من القدرات بما في ذلك الإحصاءات الوصفية، والعمليات العلائقية مثل الدمج والربط، ومعالجة السلاسل الزمنية. تتضمن أدوات لتنظيف البيانات، والتصفية، والتجميع، بالإضافة إلى واجهة مرئية لإنشاء مخططات ورسوم بيانية تفاعلية مباشرة من إطارات البيانات. يدعم النظام استيراد وتصدير البيانات عبر تنسيقات CSV وJSON وExcel.
Retrieves specific columns, rows, or cross-sections using labels, integer positions, or slice notation.