17 مستودعات
Tools for importing, querying, and exporting data between various formats directly within the browser.
Distinct from Client-Side Data Filtering: Covers the full pipeline of import-query-export, which is broader than simple filtering [f6_mt4] or exporting [f6_mt5].
Explore 17 awesome GitHub repositories matching data & databases · Client-Side Data Processing. Refine with filters or upvote what's useful.
sql.js is a serverless, in-memory SQL database engine that ports SQLite to WebAssembly for use within a web browser. It provides a JavaScript interface to initialize relational databases, execute SQL queries, and manage structured data without requiring a backend server. The project enables the import and export of database states using typed arrays, allowing in-memory data to be persisted as files. It supports high-precision integer retrieval via BigInt and utilizes prepared statements to increase execution speed and security. The engine includes capabilities for client-side data management
Facilitates the complete pipeline of importing, querying, and exporting relational data directly in the browser.
AlaSQL is a JavaScript SQL database engine that allows for the filtering, grouping, and joining of in-memory object arrays and JSON data. It functions as an in-memory SQL database and client-side data processor, enabling the execution of SQL statements against JavaScript arrays and external data sources in both browser and server environments. The project serves as a universal data query tool capable of performing relational joins across diverse sources, such as merging Google Spreadsheets, SQLite files, and remote APIs into a single result set. It also acts as an IndexedDB SQL wrapper, allow
Provides a complete pipeline for importing, querying, and exporting data across CSV, Excel, and JSON formats in the browser.
zotero-gpt is an extension that integrates large language models with a reference management system to assist in the analysis and summarization of academic research papers. It functions as a research paper AI assistant capable of querying PDF documents and extracting insights directly from academic libraries. The tool features a contextual research search system that locates items within a library based on the semantic meaning of selected text. It includes a visual interface that renders AI-generated responses using Markdown and supports the display of complex mathematical formulas. The syst
Extracts and cleans content from academic papers locally before sending targeted segments to the AI model.
SandDance is a hardware-accelerated visualization library and web-based data explorer designed for the interactive analysis of large, non-aggregated datasets. It functions as an interactive data visualization tool that renders complex datasets and intricate visuals within a browser. The project provides an embeddable data canvas consisting of web components and tags, allowing for the integration of full visualization interfaces and interactive charts into external web applications. It utilizes WebGL hardware acceleration to efficiently render large volumes of data as interactive graphics. Th
Performs data filtering and type inference directly in the browser to reduce server requests.
This project is a browser extension and toolset designed to integrate real-time web search results and extracted page content into large language model prompts. It functions as a web search integrator and content parser that feeds current internet data into conversational AI interfaces to ensure responses are grounded in evidence. The system includes a prompt template manager for storing and executing pre-defined structures that trigger automated web crawls. It enables deep research workflows by performing comprehensive searches to generate detailed responses supported by citations and links
Processes and formats raw HTML and search results directly within the browser to prepare data for LLMs.
FeHelper هو صندوق أدوات لإضافات متصفح الويب ومجموعة أدوات تطوير الواجهة الأمامية مدمجة في Chrome و Firefox و Edge. يعمل كأداة لتحويل البيانات، وأداة لتصحيح أخطاء صفحات الويب، ومساعد برمجة مدعوم بالذكاء الاصطناعي. يتميز المشروع بدمج نماذج محلية وواجهات برمجة تطبيقات متوافقة مع OpenAI لكتابة وإعادة هيكلة وإصلاح الكود مباشرة داخل المتصفح. كما يوفر قدرات لتوليد مخططات TypeScript وتعريفات Zod من عينات البيانات باستخدام الذكاء الاصطناعي. تغطي مجموعة الأدوات نطاقاً واسعاً من أدوات المطورين، بما في ذلك تصحيح أخطاء الشبكة لاتصالات HTTP و WebSocket، وترميز وفك ترميز البيانات لتنسيقات مثل JWT و Base64، وأدوات معالجة JSON للتنسيق والإصلاح والمقارنة بين الهياكل. كما تتضمن أدوات الواجهة الأمامية لقياس تخطيط الصفحة، وتنسيق الكود المصدري، وحقن سكربتات المستخدم المخصصة. تشمل القدرات الإضافية مجموعة متنوعة من أدوات الوسائط والمستندات لتحرير Markdown، ومعالجة رموز QR، وتحويل الصور، إلى جانب مولدات أدوات للمعرفات الفريدة وكلمات المرور الآمنة.
Performs complex data transformations and JSON parsing locally in the browser to ensure user data privacy.
Battery Historian هي أداة تصور وتوصيف لتحليل استهلاك الطاقة ونفاد البطارية على أجهزة Android. تعمل كعارض لتقارير الأخطاء وموصّف لاستهلاك الطاقة يقوم بتحليل سجلات النظام لاستخراج إحصائيات البطارية وبيانات النواة إلى واجهة قائمة على الويب. تتخصص الأداة في ربط مصادر البيانات المتباينة على جدول زمني متزامن. تحدد الأنشطة المستنزفة للطاقة من خلال تتبع انتقالات wakelock في مساحة المستخدم والنواة، وربط مصادر استيقاظ النواة بالطوابع الزمنية في الوقت الفعلي، وتراكب سجلات مراقبة طاقة العتاد الخارجية على أحداث النظام. يوفر النظام قدرات للتحليل المقارن، مما يسمح بحساب الفروق بين تقارير أخطاء متعددة لقياس التغييرات في سلوك الطاقة. كما يجمع المقاييس على مستوى التطبيق وأحداث النظام لتحديد محفزات برمجية محددة تمنع الجهاز من الدخول في وضع السكون.
Processes and displays large volumes of event data within a web browser to allow interactive zooming and filtering.
PathOfBuilding هو مخطط بناء غير متصل بالإنترنت ومحاكي لإحصائيات الشخصيات للعبة Path of Exile. يعمل كنموذج للمعدات والمهارات ورسام خرائط سلبي لمساعدة المستخدمين على تصميم الشخصيات من خلال محاكاة إحصائيات القتال، وأشجار المهارات السلبية، ومجموعات المعدات. توفر الأداة بيئة محاكاة لاختبار نتائج صياغة العناصر ومجموعات مقابس الأحجار الكريمة لتحديد أفضل التجهيزات. كما تتيح تحسين الشجرة السلبية من خلال تخطيط تخصيصات العقد ومواضع الجواهر لتعظيم قوة الشخصية. يغطي البرنامج محاكاة إحصائيات الشخصية للقيم الهجومية والدفاعية، ونمذجة العناصر والصياغة، والقدرة على استيراد بيانات الشخصية أو مشاركة إعدادات البناء عبر رموز فريدة.
Performs all character and build calculations locally on the user's device for offline availability.
هذا تطبيق Windows للتعرف التلقائي على الكلام يقوم بنسخ الصوت المنطوق من ملفات الفيديو إلى ملفات ترجمة SRT ذات طابع زمني. يعمل كمولد ترجمة وأداة ترجمة تحول كلام الوسائط إلى نص متزامن. يعمل البرنامج كناسخ وسائط دفعي، مما يسمح بالمعالجة المتزامنة لملفات صوت وفيديو متعددة لتوليد ترجمات بشكل جماعي. يتضمن سير عمل ترجمة لتحويل النسخ بين لغات مختلفة لإنشاء ملفات ثنائية اللغة أو مترجمة محلياً. يوفر النظام أيضاً قدرات تنقيح النصوص، باستخدام التعبيرات النمطية وفلاتر مخصصة لتنظيف النسخ عن طريق إزالة كلمات الحشو والأنماط غير المرغوب فيها. يتم دعم ذلك من خلال واجهة مستخدم رسومية أصلية لـ Windows.
Cleans transcription text locally using regular expressions to remove unwanted patterns.
Grid.js هي مكتبة JavaScript مستقلة عن إطار العمل لتصيير شبكات البيانات التفاعلية. تسمح المكتبة بعرض المعلومات المهيكلة في تنسيقات جدولية عبر بيئات واجهة أمامية مختلفة، مع دعم ملء البيانات من مصفوفات ثابتة أو استيرادات JSON. تتميز المكتبة بنظام إضافات لتوسيع مكونات واجهة المستخدم والمنطق، بالإضافة إلى خط أنابيب بيانات مخصص لتحويل المعلومات قبل عرضها. تتضمن المكتبة دعماً مدمجاً للتعريب متعدد اللغات لترجمة عناصر الواجهة والرسائل. يغطي المشروع إمكانيات تصور البيانات الأساسية بما في ذلك الفرز والتصفية وتصور الشبكة الديناميكي. توفر المكتبة أدوات لإدارة إعدادات التكوين والتكامل مع بيئات JavaScript المختلفة.
Implements a client-side grid for populating and managing tabular data from static arrays or JSON imports.
هذا المشروع عبارة عن مورد تعليمي شامل ودورة تدريبية لبناء الشبكات العصبية باستخدام PyTorch. يغطي اللبنات الأساسية للتعلم العميق، بما في ذلك معالجة الموترات (tensors)، والتمايز التلقائي، وبناء مكونات الشبكة العصبية المعيارية. يعمل المستودع كدليل تقني للعديد من المجالات المتخصصة. يوفر تفاصيل تنفيذ لمهام رؤية الكمبيوتر مثل تصنيف الصور، واكتشاف الكائنات، والتجزئة الدلالية، بالإضافة إلى سير عمل معالجة اللغات الطبيعية التي تتضمن المحولات (transformers)، والشبكات المتكررة، والنماذج التوليدية. بالإضافة إلى ذلك، يتضمن مرجعاً للذكاء الاصطناعي التوليدي، مع التركيز بشكل خاص على تركيب الصور عبر نماذج الانتشار (diffusion models) والشبكات التنافسية. تمتد المادة إلى تحسين النماذج وخطوط أنابيب النشر. تغطي تقنيات لتقليل حجم النموذج وزيادة سرعة الاستنتاج من خلال التكميم (quantization) وتصدير النماذج إلى تنسيقات مثل ONNX وTensorRT. تشمل مجالات القدرة الأخرى هندسة البيانات للتحميل المتوازي، وتقييم النموذج باستخدام مقاييس مخصصة، ونشر نماذج اللغات الكبيرة مفتوحة المصدر. يتم تقديم المشروع بشكل أساسي كسلسلة من دفاتر Jupyter.
Cleans raw text by removing irrelevant characters and stop words to create semantic sequences.
MikuTools هي مجموعة أدوات ويب متعددة الأغراض ومنصة لتوليد الوسائط المتعددة بالذكاء الاصطناعي. توفر مجموعة من الأدوات خفيفة الوزن القائمة على المتصفح لإنشاء وتحرير الصور والفيديو والصوت باستخدام نماذج ذكاء اصطناعي متنوعة. تتميز المنصة بإمكانيات ترجمة وتحرير المحتوى بالذكاء الاصطناعي المتكاملة، بما في ذلك تبديل الوجوه، وإزالة الخلفية، والارتقاء بالدقة العالية، واستنساخ الصوت. كما تتيح إنشاء أصول رقمية احترافية مثل بطاقات العمل، وتوقيعات البريد الإلكتروني، ولقطات شاشة الكود الأنيقة. تغطي مجموعة الأدوات نطاقاً واسعاً من الأدوات التقنية، بما في ذلك تحويل التنسيق عبر الإنترنت للمستندات والوسائط، وحسابات تكوين الشبكة لنطاقات CIDR و IP، وتحويلات البيانات التقنية لترميز الكود والنص. تشمل القدرات الإضافية حساب التجزئة التشفيرية، وإدارة لوحة الألوان، واسترجاع البيانات العامة.
Performs text manipulation and network calculations directly in the browser to reduce latency.
CrawlerTutorial is a comprehensive Python web scraping tutorial and framework designed for extracting data from static and dynamic websites. It functions as a web data extraction pipeline and an HTTP request orchestrator, covering the full lifecycle of scraping applications from initial fetching to final data storage. The project provides specialized guidance on anti-bot bypass techniques and web API reverse engineering. It includes methods for evading browser detection through identity masking and proxy rotation, as well as techniques for identifying hidden API endpoints by analyzing network
Cleans raw scraped text by removing HTML tags and fixing encoding for structured analysis.
هذا المشروع عبارة عن دليل شامل وخارطة طريق لتطوير الواجهات الأمامية (Front-end)، مصمم لمساعدة المهندسين على إتقان المهارات والمعايير المهنية المطلوبة لتطوير الويب الحديث. يعمل كمرجع تقني لإتقان HTML وCSS وJavaScript، ويوفر مسارات تعلم مهيكلة وخارطة للكفاءات المهنية اللازمة للانتقال من مبتدئ إلى مهندس ويب محترف. يعمل المورد كدليل مصنف ونظرة عامة على نظام JavaScript البيئي. حيث يفهرس أطر العمل والمكتبات والأدوات القياسية في الصناعة، ويقدم توصيات محددة لإدارة الحالة، وأطر عمل CSS، ومولدات المواقع الساكنة. يغطي الدليل طيفاً واسعاً من كفاءات الهندسة، بما في ذلك معمارية واجهة المستخدم، وتحسين أداء الويب، وتدقيق إمكانية الوصول. كما يوفر توجيهات حول أتمتة البناء، واستراتيجيات النشر، واختيار أدوات المطورين لسير العمل المهني.
Covers methods for managing and querying data directly within the browser environment.
Spark NLP هي مجموعة أدوات لتحليل النصوص القابل للتوسع والتعلم الآلي مبنية على إطار عمل الحوسبة الموزعة Apache Spark. توفر إطار عمل للتعلم الآلي متعدد الوسائط ونظام خط أنابيب موزع لتسلسل أدوات التعليق لمعالجة البيانات اللغوية على نطاق واسع. تتضمن المكتبة معالج نصوص محولاً (transformer) لتوليد تضمينات متجهات سياقية ومحرك استدلال مخصص لإدارة نماذج اللغة الكبيرة. يتميز المشروع بقدرته على معالجة أنواع البيانات غير المتجانسة، بما في ذلك النصوص والصوت والصور، ضمن بنية رؤية-لغة موحدة. ويدعم إمكانيات الذكاء الاصطناعي التوليدي المتقدمة مثل هندسة الأوامر (prompt engineering)، واستخراج الكيانات المهيكلة مع مخرجات JSON مقيدة، والاستدلال المحلي للقضاء على زمن انتقال الشبكة. بالإضافة إلى ذلك، يوفر أدوات للترجمة عبر اللغات والتصنيف بدون تدريب عبر كل من وسائط النص والصورة. يغطي إطار العمل مجموعة واسعة من الإمكانيات، بما في ذلك تدريب النماذج الخاضعة للإشراف للتعرف على الكيانات وتحليل المشاعر، بالإضافة إلى الإجابة على الأسئلة الاستخراجية وتلخيص المستندات. ويدمج دعم قاعدة بيانات المتجهات للبحث عن التشابه ويوفر بنية تحتية لتسريع GPU وإدارة دورة حياة النموذج عبر سجل مركزي. تسمح مجموعة الأدوات بتوزيع النماذج وخطوط الأنابيب المخصصة عبر مستودع عام وتدعم نشر النماذج عبر واجهات برمجة تطبيقات REST.
Cleans and prepares text data through tokenization and stop word removal for AI consumption.
python-ftfy is a Unicode text repair library designed to fix mojibake and encoding glitches. It provides utilities for byte encoding detection, HTML entity decoding, and the recovery of corrupted text to restore it to its intended Unicode form. The project distinguishes itself through a multi-layered decoding pipeline that identifies and reverts complex encoding mix-ups. It uses heuristic-based detection to resolve instances where text was decoded using the wrong codec across multiple layers of corruption, and it can handle non-standard UTF-8 variants and sloppy encoding mappings. The librar
Cleans Unicode data by removing terminal escapes and decomposing ligatures to prepare text for analysis.
This project is a Unicode text repair tool and mojibake correction library designed to fix encoding glitches and restore original characters from mangled strings. It functions as a text encoding detector and a Unicode normalization tool to resolve issues where text has been incorrectly decoded. The library specializes in reversing multi-layered encoding errors and repairing complex mojibake patterns. It includes capabilities for detecting lossy encoding sequences, guessing byte encodings, and decoding non-standard UTF-8 variants. The toolset covers a broad range of text cleaning and normaliz
Cleans text data by removing invisible control characters and terminal escapes while standardizing ligatures.