409 مستودعات
This group focuses on tools and techniques for analyzing, interpreting, and visually representing data.
Explore 409 awesome GitHub repositories matching data & databases · Data Analysis & Visualization. Refine with filters or upvote what's useful.
Developer Roadmap هي منصة يقودها المجتمع توفر مسارات تعليمية منظمة وقائمة على الرسوم البيانية لهندسة البرمجيات. تعمل كمستودع معرفي شامل حيث يتم تنظيم المجالات التقنية في تسلسلات مرئية لتوجيه اكتساب المهارات المهنية والنمو الوظيفي. يتميز المشروع بنظام بيئي تعاوني يتيح للمستخدمين المساهمة في خرائط الطريق، وتنظيم أفضل ممارسات الصناعة، والحفاظ على الملفات الشخصية المهنية. يدمج أطر تقييم تشخيصية لتقييم الكفاءة التقنية، مما يساعد المطورين على تحديد فجوات المعرفة والتحضير للمقابلات المهنية من خلال تسلسلات تعليمية مستهدفة. إلى جانب قدرات التخطيط الأساسية، توفر المنصة أفكاراً لمشاريع عملية ودروساً تفاعلية لتعزيز المفاهيم الهندسية. وتوفر مساحة مركزية للمجتمع لمشاركة الموارد، وتتبع تطوير المهارات التدريجي، والتنقل في المشاهد التقنية المعقدة.
Provides visual representations of technical learning paths and skill progression.
هذا المشروع عبارة عن دليل شامل منسق من قبل المجتمع ينظم مشهداً واسعاً من مكتبات وأطر عمل وأدوات برمجيات Python. يعمل كقاعدة معرفية مركزية مصممة لتسهيل التنقل في النظام البيئي وتسريع اكتشاف المطورين عبر دورة حياة تطوير البرمجيات بأكملها. يتميز الدليل بتوفير فهرس منظم للموارد مصنف حسب المجال التقني، بدءاً من أدوات التطوير الأساسية وصولاً إلى المجالات الهندسية المتخصصة. ويغطي قدرات عالية المستوى بما في ذلك الذكاء الاصطناعي، وعلوم البيانات، وتطوير الويب، وإدارة البنية التحتية، مما يسمح للمطورين بتحديد حلول موثوقة لتحديات تقنية محددة. يشمل المشروع نطاقاً واسعاً من القدرات، بما في ذلك أدوات إدارة التبعيات، والتحليل الثابت للكود، والاختبار الآلي. كما يقوم بفهرسة موارد تخزين البيانات المستمرة، وأوركسترا البنية التحتية السحابية، وتطوير الواجهات، مما يوفر مرجعاً موحداً لبناء وصيانة الأنظمة البرمجية المعقدة.
Process large-scale datasets and perform complex statistical exploration using high-level computational engines.
هذا المشروع عبارة عن دليل منسق من قبل المجتمع للبرمجيات مفتوحة المصدر المصممة للنشر في بيئات الخوادم الخاصة والمختبرات المنزلية. يعمل كمورد شامل لاكتشاف بدائل مستقلة ذاتية الاستضافة لخدمات السحابة السائدة، مما يمكن المستخدمين من الحفاظ على ملكية كاملة للبيانات والتحكم في بنيتهم التحتية الرقمية. يتم تنظيم الدليل من خلال تصنيف هرمي ينظم مجموعة واسعة من التطبيقات في فئات منطقية، تتراوح من إدارة الوسائط وتحليل البيانات إلى التواصل الخاص وأدوات إنتاجية الفريق. يتميز بعملية مراجعة أقران تعاونية، حيث يقوم أعضاء المجتمع بالتحقق من جودة وملاءمة كل طلب لضمان بقاء الدليل دقيقاً وموثوقاً. يغطي المشروع نطاقاً واسعاً من القدرات، بما في ذلك أتمتة البنية التحتية، ونشر الخدمات القائمة على الحاويات، وإدارة التكوين التصريحي. تساعد هذه الأدوات المستخدمين في الحفاظ على بيئات خادم قابلة للتكرار وإدارة تبعيات الخدمات المعقدة عبر الأجهزة الخاصة. يتم الحفاظ على الدليل كمستودع خاضع للتحكم في الإصدار، مما يضمن تتبع جميع التحديثات والتغييرات التي يقودها المجتمع وأنها شفافة.
Collects and reports website event data over short-term periods to provide insights into user activity.
هذا المشروع عبارة عن مستودع مركزي يقوده المجتمع للدروس العملية المصممة لتسهيل اكتساب المهارات من خلال البناء العملي لتطبيقات برمجية واقعية. يعمل كدليل شامل يجمع التوثيق الخارجي والمواد التعليمية، مما يوفر مساراً منظماً للمطورين لإتقان لغات برمجة ومجالات تقنية محددة. يتميز المستودع بتنظيم الموارد التقنية المتباينة في هيكل هرمي قائم على التصنيف يتيح للمطورين اكتشاف وتصفح تخصصات هندسة البرمجيات المتنوعة. من خلال تجميع المشاريع الفردية في تسلسلات منطقية، فإنه يوفر خارطة طريق تساعد المتعلمين على التقدم من المفاهيم الأساسية إلى التنفيذ المتقدم. يتم الحفاظ على المحتوى من خلال مساهمات تعاونية، مما يضمن بقاء المجموعة مورداً حالياً وواسع النطاق لمجتمع المطورين. يغطي المشروع نطاقاً واسعاً من القدرات، عبر مجالات مثل تطوير الويب full-stack، وهندسة تطبيقات الهاتف المحمول، وتطوير الألعاب التفاعلية. يتضمن موارد لمجموعة واسعة من لغات البرمجة، بدءاً من اللغات على مستوى النظام مثل C و C++ و Rust وصولاً إلى اللغات عالية المستوى والوظيفية مثل Python و Ruby و Haskell و Clojure. تدعم هذه المواد الإتقان التقني المتخصص في مجالات تشمل تعلم الآلة، وعلوم البيانات، وبرمجة الشبكات. تم تنظيم الدليل للسماح بالاكتشاف الفعال حسب لغة البرمجة والمجال التقني، مع جدول محتويات واضح لمساعدة المستخدمين في تحديد موقع معلومات محددة. يعمل كفهرس مستمر للروابط الخارجية، حيث يربط المطورين بالتوثيق والدروس التعليمية التابعة لجهات خارجية لتعميق فهمهم للمفاهيم التقنية.
Render dynamic and interactive data visualizations by binding arbitrary data to document elements and applying transformations to the underlying structure.
يوفر هذا المشروع إطار عمل لمنهج علوم الحاسوب مصمم للمتعلمين ذاتياً. وهو ينظم الموارد الأكاديمية مفتوحة الوصول، بما في ذلك الكتب المدرسية والمحاضرات والواجبات، في مسار متماسك يحاكي متطلبات درجة البكالوريوس الرسمية. من خلال دمج الدراسة النظرية مع منهجيات هندسة البرمجيات العملية، تُمكّن المنصة الطلاب من إتقان المفاهيم الأساسية والمهارات التقنية المتقدمة بشكل مستقل. يتميز المنهج باستخدام سير عمل قائم على التحكم في الإصدار لإدارة التجربة التعليمية. يستخدم المتعلمون أدوات قائمة على المستودعات لتتبع الإنجازات الأكاديمية، والحفاظ على سجل دائم للواجبات المكتملة، والتحقق من صحة حلولهم التقنية مقابل المتطلبات المحددة. يشجع هذا النهج على تبني ممارسات هندسية قياسية في الصناعة، مثل تهيئة بيئات تطوير معزولة وإدارة تبعيات المشروع، طوال عملية التعلم. تدعم المنصة مجموعة واسعة من التطوير التقني، وتغطي مجالات مثل حل المشكلات الحسابية، والتصميم كائني التوجه، وتحليل البيانات. كما تسهل التعلم التعاوني من خلال منصات يقودها المجتمع، مما يسمح للطلاب بالمشاركة في التفاعل مع الأقران والتحقق من أعمالهم. يتم الحفاظ على المنهج كمورد مفتوح المصدر، مما يوفر دليلاً شاملاً لبناء الكفاءة المهنية في هندسة البرمجيات.
Provides resources and guidance for analyzing and visualizing data as part of the broader computer science curriculum.
n8n is a workflow automation platform that combines a visual interface with code-based extensibility to design, orchestrate, and manage automated processes. It provides a comprehensive suite of tools for data transformation, filtering, and storage, allowing users to build complex logic through conditional branching, looping, and sub-workflow execution. The platform supports both pre-built integration nodes and custom code execution in JavaScript or Python, enabling connectivity with a wide range of external services and APIs. The platform includes a suite of generative AI capabilities, such a
Captures and manages operational metrics with configurable retention and compaction settings for self-hosted instances.
This project is a comprehensive, day-by-day curriculum designed to guide learners through the Python programming language and its professional applications. The content spans from fundamental syntax and object-oriented design to advanced topics including database management, web development, data analysis, and machine learning. The curriculum is structured into distinct modules that cover practical software engineering practices, such as version control, containerization, and system architecture. It also provides resources for technical interview preparation and an analysis of career paths wi
Implement numerical computing, data manipulation, and visualization workflows using industry-standard analytical libraries.
D3 is a modular library providing low-level primitives for creating data-driven visualizations. It functions as a flexible framework that allows for direct control over visual presentation by mapping abstract data dimensions to graphical properties, such as position, color, and size, without imposing predefined chart abstractions. The library distinguishes itself by offering specialized tools for complex data representation, including algorithmic layouts for hierarchical structures and geographic projection utilities for mapping spherical coordinates. It also includes a comprehensive suite fo
Implement interactive selection areas that allow users to highlight and isolate specific data ranges within a visualization.
This project functions as a curated software directory and developer resource index, providing a centralized platform for discovering and evaluating high-quality open-source repositories. It serves as an aggregator that monitors trending software and educational resources, organizing them by technical domain and programming language to assist developers in identifying tools for their specific technical challenges. The directory distinguishes itself through a community-driven curation workflow, where repository lists are validated and updated based on collective developer consensus. This infor
Monitors open-source project activity and ecosystem trends to deliver insights into software popularity and health.
This project serves as a centralized directory and interoperability hub for the Model Context Protocol, providing a curated collection of standardized service connectors that bridge artificial intelligence models with external software, databases, and APIs. It facilitates the integration of AI agents with diverse ecosystems by offering a registry of machine-readable interface definitions that enable dynamic tool discovery and structured context injection. The directory distinguishes itself by focusing on the protocol-based interoperability required for autonomous AI agents to interact with he
Bridges high-performance mathematical engines with analytical frameworks to execute complex data processing and visualization tasks.
This project is a client-side rendering engine that transforms declarative, text-based syntax into visual diagrams directly within the browser. By utilizing a domain-specific language, it allows users to define complex structures—such as software architectures, process flows, and system behaviors—without the need for manual layout configuration. The library functions as a browser-based runtime that parses these definitions into intermediate abstract syntax trees, which are then processed by specialized engines to generate high-fidelity, resolution-independent graphics. The system distinguishe
Converts plain-text configuration into visual charts and graphs without requiring manual layout adjustments.
Stirling-PDF is a self-hosted document processing suite designed for secure, private file management. It functions as a comprehensive transformation engine that executes complex operations—such as merging, splitting, converting, and redacting documents—directly on the host machine. The platform provides both a browser-based interface for interactive editing and a programmatic, API-first architecture that allows for the automation of document workflows through standard HTTP requests. The project distinguishes itself through its focus on private, infrastructure-agnostic deployment and granular
Tracks system metrics and feature engagement using privacy-conscious analytics services.
This project is a general-purpose command-line filter that provides an interactive interface for processing standard input streams. It enables real-time fuzzy searching, data selection, and transformation, allowing users to navigate complex information or file systems directly within their terminal. By utilizing a pipe-oriented architecture, it integrates into existing shell pipelines and workflows to facilitate efficient data exploration. What distinguishes this tool is its highly extensible, event-driven design that allows for deep integration with external processes. It supports asynchrono
Toggles between predefined column configurations during runtime to allow flexible data viewing.
This project is a serverless service that generates dynamic, themeable visual summaries of software development activity. It functions as an automated metadata visualizer, transforming raw platform logs and repository metrics into resolution-independent vector graphics that can be embedded directly into markdown environments. The service distinguishes itself by offering highly configurable, query-parameter-driven rendering that allows users to customize the visual presentation of their coding patterns, language proficiency, and repository details. It supports both real-time generation via ser
Caches and serves platform-specific performance metrics through configurable, high-performance image endpoints.
GPT4All is a cross-platform runtime environment designed to execute large language models directly on local consumer hardware. By leveraging an optimized C++ inference backend, it enables private, offline AI interactions without requiring an internet connection or external cloud services. The project provides a comprehensive ecosystem for managing the entire model lifecycle, including discovery, downloading, and configuration of local weights. What distinguishes the platform is its integrated retrieval-augmented generation engine, which allows users to index local documents into semantic vect
Allows users to attach spreadsheet data to conversations for local analysis and report generation.
Elasticsearch is a distributed search engine and document store designed for the high-performance indexing and retrieval of massive volumes of unstructured data. It functions as a centralized analytics platform, providing a schema-flexible architecture that organizes information into searchable indices while maintaining global cluster state through a distributed consensus mechanism. The platform distinguishes itself through its integrated approach to observability, security, and advanced analytics. It combines full-text, vector, and hybrid search capabilities with machine learning-driven insi
Powers high-performance computation for executing complex analytical queries and processing large-scale data.
This project is a community-maintained, open-access directory of high-quality public datasets. It serves as a centralized reference point for researchers, developers, and data scientists to locate reliable information sources across a wide spectrum of industries and scientific fields. By providing a structured index, the repository facilitates the discovery of data necessary for exploratory analysis, machine learning model training, and the development of data-intensive applications. The directory distinguishes itself through a lightweight, platform-agnostic approach to resource indexing that
Benchmarks machine learning algorithms and data science models through standardized datasets.
Grafana is an observability data platform designed to aggregate metrics, logs, and traces from diverse sources into a unified environment. It functions as a centralized interface for visualizing complex telemetry data, transforming raw streams into interactive dashboards that support real-time system health tracking and performance monitoring. The platform distinguishes itself through a plugin-based modular architecture that integrates disparate databases, cloud services, and monitoring tools via a standardized data abstraction layer. This framework allows for the dynamic loading of external
Renders interactive interfaces that allow teams to visualize and explore complex telemetry data in real-time.
Superset is a web-based business intelligence platform designed for data exploration, visualization, and interactive dashboarding. It functions as a query-driven analytics engine that connects to various SQL databases, allowing users to perform ad-hoc analysis, define virtual metrics, and build complex data visualizations through a centralized interface. The platform distinguishes itself through a robust semantic layer that transforms raw database schemas into calculated columns and virtual metrics, enabling consistent business logic across an organization. It features a plugin-based visualiz
Enables ad-hoc SQL querying and advanced data transformations to inspect and analyze large datasets within a web interface.
This project is a comprehensive, community-driven directory of machine learning resources, software libraries, and educational materials. It serves as a centralized knowledge base for developers and researchers, organizing tools and frameworks by their primary programming language and technical domain to simplify discovery across the artificial intelligence ecosystem. The collection distinguishes itself by providing a cross-language development index that spans diverse programming environments, including C, C++, Rust, Clojure, and Python. It covers a wide range of specialized capabilities, fr
Directs users to high-performance libraries optimized for querying and manipulating tabular datasets.