5 Repos
Introductory educational resources covering Python programming, NumPy arrays, Pandas DataFrames, and visualization libraries for data exploration.
Distinct from Python Data Science Courses: No existing candidate specifically covers the combination of Python basics, arrays, DataFrames, and visualization in a single primer. Closest candidate [f4_mt1] is a course list, not a singular primer resource.
Explore 5 awesome GitHub repositories matching artificial intelligence & ml · Python Data Science Primers. Refine with filters or upvote what's useful.
This repository is a comprehensive collection of instructional guides and practical examples for Python development, focusing on machine learning, data science, and web scraping. It provides implementations for neural networks, reinforcement learning algorithms, and deep learning architectures using PyTorch, alongside detailed manuals for scientific computing and data visualization. The project distinguishes itself by offering specialized tutorials on concurrent programming to optimize CPU performance and guides for setting up Linux development environments. It covers the implementation of ad
Provides introductory educational resources covering NumPy arrays, Pandas DataFrames, and visualization libraries for data exploration.
Dieses Projekt ist ein pandas-Datenanalyse-Kochbuch und ein Python-Data-Science-Leitfaden. Es bietet eine Sammlung programmatischer Rezepte und Beispiele für das Bereinigen, Manipulieren und Analysieren strukturierter Daten. Das Projekt konzentriert sich auf die Bereitstellung einer containerisierten Analyseumgebung, um einen konsistenten Arbeitsbereich und reproduzierbare Abhängigkeiten bei der Ausführung von Datenverarbeitungsskripten zu gewährleisten. Es deckt ein breites Spektrum an Data-Science-Fähigkeiten ab, einschließlich Datenaufnahme aus externen Quellen, Rohdatenbereinigung und explorativer Datenanalyse. Diese Rezepte demonstrieren, wie strukturierte Datenanalyse durch Techniken wie Filtern, Aggregieren gruppierter Daten und die Verarbeitung von Textdaten durchgeführt wird.
Serves as a reference guide for importing datasets and applying mathematical functions to extract insights from real-world information.
Dieses Projekt ist ein Lehrplan für Machine Learning und eine Lernplattform, die über interaktive Jupyter Notebooks bereitgestellt wird. Es dient als umfassender Leitfaden zur Beherrschung des Python-Data-Science-Toolkits und bietet strukturierte Tutorials für numerisches Rechnen, Manipulation tabellarischer Daten und statistische Visualisierung. Der Lehrplan enthält spezifische Implementierungsleitfäden für Scikit-Learn und einen praktischen Kurs zu TensorFlow für den Aufbau, das Training und das Deployment neuronaler Netze und Computer-Vision-Modelle. Er deckt den End-to-End-Prozess des Aufbaus prädiktiver Modelle ab, von der anfänglichen Problemformulierung und Aufgabenkategorisierung bis hin zum Deployment der Modelle über interaktive Weboberflächen. Das Projekt deckt ein breites Funktionsspektrum ab, einschließlich numerischem Rechnen mit mehrdimensionalen Arrays, explorativer Datenanalyse und Datenvorverarbeitungsroutinen. Es bietet detaillierte Workflows für überwachtes und unüberwachtes Lernen, automatisierte Machine-Learning-Pipelines, Hyperparameter-Optimierung und Modellbewertung mittels Klassifizierungsmetriken und Kreuzvalidierung. Der Bildungsinhalt ist als eine Reihe von Notebooks strukturiert, die Python-Code mit narrativen Erklärungen verknüpfen, um Data-Science-Workflows zu dokumentieren.
Offers introductory guides covering Python programming, NumPy arrays, Pandas DataFrames, and Matplotlib for data science exploration.
ThinkStats2 ist ein Kurs für computergestützte Statistik und eine Bildungsbibliothek, die darauf ausgelegt ist, Wahrscheinlichkeit und Statistik durch einen programmatischen Ansatz zu lehren. Sie bietet ein Framework zum Studium statistischer Konzepte durch das Schreiben von Python-Code und das Ausführen von Simulationen auf realen Datensätzen. Das Projekt verwendet interaktive Notebooks und eine Sammlung von Python-Modulen, um geführte Lektionen bereitzustellen. Es betont die Verifizierung theoretischer statistischer Gesetze durch iterative computergestützte Experimente und simulationsgestütztes Testen. Die Ressource deckt breite Funktionen in der Datenanalyse und Ausbildung im Bereich Data Science ab, was es Benutzern ermöglicht, Datensätze zu erkunden und statistische Analysen innerhalb einer programmierbaren Umgebung durchzuführen.
Builds a foundation in data science by applying statistical techniques to datasets using Python libraries.
This project is a structured data science curriculum and Python-based textbook designed to teach the fundamentals of data science through executable scripts and hands-on lessons. It functions as a guided programming tutorial for data manipulation and analysis within the Python ecosystem. The content covers introductory machine learning, including the implementation of basic models and algorithms, alongside Python data analysis for cleaning and processing datasets. The material is delivered via Jupyter Notebooks, combining modular exercises and markdown-driven documentation to map theoretical
Serves as a comprehensive primer on data science fundamentals using NumPy, Pandas, and visualization libraries.