6 dépôts
The use of Python programming and its ecosystem to process and analyze structured and unstructured datasets.
Distinct from Python Data Analysis Tutorials: Candidates focus on tutorials, deserialization, or code analysis rather than the general domain of data analysis using Python.
Explore 6 awesome GitHub repositories matching data & databases · Python Data Analysis. Refine with filters or upvote what's useful.
Ce projet est une bibliothèque d'analyse de données Python et un framework d'analyse exploratoire de données conçu pour traiter des jeux de données bruts. Il fournit une suite d'outils pour examiner les données, identifier les anomalies et appliquer des méthodes statistiques pour découvrir des modèles. Le dépôt fonctionne comme une boîte à outils de modélisation de machine learning et une suite de modélisation statistique de données. Il inclut des algorithmes prédictifs et des modèles mathématiques utilisés pour analyser les relations entre les variables de données et tirer des enseignements de jeux de données complexes. Le projet couvre un large éventail de capacités, notamment la science des données, la modélisation par machine learning et l'analyse exploratoire de données. Celles-ci sont implémentées via la manipulation de données, le calcul numérique et la visualisation de données.
Uses Python to process raw datasets and apply statistical methods to find meaningful patterns.
Ce projet est une collection complète de matériel pédagogique de programmation Python, y compris des tutoriels, des exercices et des exemples de code organisés. Il sert de programme d'apprentissage et de boîte à outils d'ingénierie logicielle, utilisant des Jupyter Notebooks pour combiner du code exécutable avec un texte éducatif descriptif. Le dépôt fournit des guides d'implémentation pratiques pour construire des applications de grand modèle de langage, telles que des systèmes de génération augmentée par récupération, des agents IA avec état et des flux de travail d'apprentissage automatique. Il se distingue en offrant une approche structurée des flux de travail de codage agentique, couvrant la distillation de la fenêtre de contexte, le routage de modèle agnostique au fournisseur et les sorties structurées imposées par schéma. Le matériel couvre un large éventail de capacités d'ingénierie logicielle, notamment la programmation asynchrone avec des files d'attente de tâches distribuées, le développement d'applications web avec des API REST et les flux de travail d'analyse de données. Il inclut également des ressources pour maîtriser la conception orientée objet, implémenter des pipelines CI/CD et appliquer des normes professionnelles de linting et de formatage.
Uses the Python ecosystem to process and analyze structured and unstructured datasets.
Fast-F1 est une bibliothèque de données Python et un analyseur de télémétrie conçu pour la Formule 1. Il sert de wrapper d'API programmatique pour récupérer et traiter les données de chronométrage, les résultats de session et les métriques de capteurs de véhicule à haute fréquence. Le projet fournit des outils spécialisés pour le benchmarking de performance en sport automobile et la visualisation. Il permet la comparaison de la télémétrie du véhicule, telle que les traces de vitesse et les changements de rapport, et génère des cartes de piste spatiales avec des superpositions de vitesse et de virage. La bibliothèque couvre un large éventail de capacités de récupération et d'analyse de données, incluant l'extraction des calendriers de course, des classements de championnat et des métadonnées de circuit. Elle prend en charge la surveillance de l'activité de course en direct et des messages de contrôle de course, tout en utilisant la mise en cache sur disque local pour minimiser les requêtes réseau pendant le chargement des données.
Provides a Python-based ecosystem to process and analyze complex Formula 1 timing and telemetry datasets.
Ce projet est une collection d'implémentations Python pour le web scraping, l'interception de trafic réseau, l'analyse de données et l'analyse de sentiment. Il fournit des méthodes pour extraire des données structurées à partir de sites web et d'interfaces d'applications mobiles. La collection inclut des outils pour capturer et analyser les paquets réseau provenant d'applications mobiles afin d'identifier des points de terminaison API internes cachés. Elle propose également des scripts pour évaluer le ton émotionnel et la perception publique des données textuelles. Le projet couvre la manipulation et la transformation de données de grands ensembles de données, ainsi que la génération de graphiques pour identifier les tendances et modèles démographiques.
Uses Python and its ecosystem to process and analyze structured datasets for pattern and trend discovery.
ThinkStats2 is a computational statistics course and educational library designed to teach probability and statistics through a programmatic approach. It provides a framework for studying statistical concepts by writing Python code and running simulations on real-world datasets. The project uses interactive notebooks and a collection of Python modules to deliver guided lessons. It emphasizes the verification of theoretical statistical laws through iterative computational experiments and simulation-driven testing. The resource covers broad capabilities in data analysis and data science traini
Provides a Python-based environment for verifying statistical theories through computational experiments and data testing.
Rodeo is an interactive Python notebook environment and integrated development environment designed for data science. It provides a workspace for combining executable code, rich text, and data visualizations within a single document to manage the lifecycle of research scripts. The platform facilitates data science workflow management, covering the process from initial data exploration to final model execution. It supports the development of Python scripting environments tailored for data analysis, modeling, and iterative hypothesis testing. The system utilizes a cell-based document structure
Provides an integrated development environment for writing and executing Python data analysis and modeling scripts.