4 Repos
Tools for grouping, filtering, and summarizing structured tabular datasets.
Distinguishing note: Shortlist candidates focused on medical images or org settings; this is general tabular data organization.
Explore 4 awesome GitHub repositories matching data & databases · Tabular Data Organization. Refine with filters or upvote what's useful.
SlickGrid is a high-performance JavaScript data grid and virtualized data table designed to render large datasets in the browser. It functions as a web spreadsheet component and tabular data manager, utilizing virtual scrolling to maintain responsiveness when displaying hundreds of thousands of entries. The library employs a canvas-based UI system to draw grid lines and elements, reducing the total number of DOM nodes. It separates raw data from visual presentation through column-based mapping and uses a formatter pipeline to transform data values into HTML strings. Capabilities include row
Groups and filters rows while applying custom aggregators to summarize information within a structured grid.
Dieses Projekt ist ein Lehrplan für Machine Learning und eine Lernplattform, die über interaktive Jupyter Notebooks bereitgestellt wird. Es dient als umfassender Leitfaden zur Beherrschung des Python-Data-Science-Toolkits und bietet strukturierte Tutorials für numerisches Rechnen, Manipulation tabellarischer Daten und statistische Visualisierung. Der Lehrplan enthält spezifische Implementierungsleitfäden für Scikit-Learn und einen praktischen Kurs zu TensorFlow für den Aufbau, das Training und das Deployment neuronaler Netze und Computer-Vision-Modelle. Er deckt den End-to-End-Prozess des Aufbaus prädiktiver Modelle ab, von der anfänglichen Problemformulierung und Aufgabenkategorisierung bis hin zum Deployment der Modelle über interaktive Weboberflächen. Das Projekt deckt ein breites Funktionsspektrum ab, einschließlich numerischem Rechnen mit mehrdimensionalen Arrays, explorativer Datenanalyse und Datenvorverarbeitungsroutinen. Es bietet detaillierte Workflows für überwachtes und unüberwachtes Lernen, automatisierte Machine-Learning-Pipelines, Hyperparameter-Optimierung und Modellbewertung mittels Klassifizierungsmetriken und Kreuzvalidierung. Der Bildungsinhalt ist als eine Reihe von Notebooks strukturiert, die Python-Code mit narrativen Erklärungen verknüpfen, um Data-Science-Workflows zu dokumentieren.
Teaches how to build dataframes and series from dictionaries or lists to organize data for analysis.
Danfo.js ist eine Bibliothek für Datenanalyse und Vorverarbeitung für JavaScript, die leistungsstarke gelabelte Datenstrukturen bereitstellt. Sie implementiert Dataframes und Series, um komplexe Datenanalysen, statistische Berechnungen und die Manipulation strukturierter tabellarischer Daten zu ermöglichen. Das Projekt dient als Bibliothek für die Vorverarbeitung beim maschinellen Lernen und bietet Dienstprogramme für kategoriales Label-Encoding, One-Hot-Encoding sowie die Skalierung und Standardisierung numerischer Features. Es erleichtert insbesondere die Konvertierung gelabelter Datenstrukturen in Tensoren für das Modelltraining und die Evaluierung. Die Bibliothek deckt eine breite Palette an Funktionen ab, einschließlich deskriptiver Statistik, relationaler Operationen wie Merging und Joining sowie Zeitreihenverarbeitung. Sie enthält Tools für die Datenbereinigung, Filterung und Gruppierung sowie eine Visualisierungsschnittstelle zur Erstellung interaktiver Diagramme und Plots direkt aus Dataframes. Das System unterstützt den Import und Export von Daten über CSV-, JSON- und Excel-Formate.
Builds dataframes and series from JSON objects, arrays, tensors, and dictionaries.
Learn_Prompting ist ein pädagogisches Projekt mit Fokus auf Prompt Engineering. Es vermittelt die Prinzipien und Techniken, die erforderlich sind, um effektive Inputs zu erstellen und die Qualität von generativen KI-Outputs zu verbessern. Das Projekt deckt fortgeschrittene Prompting-Strategien ab, um Reasoning, Zuverlässigkeit und Output-Qualität zu steigern. Dies umfasst Techniken für Task-Decomposition, Chain-of-Thought-Reasoning sowie den Einsatz von Few-Shot- und Zero-Shot-Guidance. Es adressiert zudem Modellsicherheit durch das Studium von Prompt-Hacking, Schwachstellenanalyse und Privacy-Auditing, um sensible Datenlecks zu verhindern. Der Umfang erstreckt sich auf die praktische Anwendung generativer KI über diverse Medien und Workflows hinweg, einschließlich Textgenerierung, fotorealistischer Bilderstellung und audiovisueller Produktion. Es behandelt zudem die Entwicklung autonomer Agenten, KI-gestützte Programmierung und die Automatisierung von Business-Workflows für Marketing und Kommunikation. Das Projekt bietet Ressourcen für Modelloptimierung, Evaluierung und das Management von Prompt-Lifecycles innerhalb einer interaktiven Experimentierumgebung.
Teaches how to use prompting to transform raw, unstructured text into organized tabular formats.