PyData Miami 2019 - Presentation: Pandas and plots for data analysis

Pandas and plots for data analysis

Audience level:

Novice

Description

This tutorial will use a stack of packages including pandas and seaborn that provide tools for data manipulation, summaries, analyses and visualization. This will be a practical tutorial using public data sets.

Abstract

Outline of tutorial

Introducing the Anaconda Python distribution and JupyterLab IDE
Data types
Loops and list comprehensions
Loading and using packages
Introduction to the pandas package
- Importing data from CSV, Excel and SQL databases
- Data types in pandas (numerical, categorical, binary, boolean)
- Creating numerical summaries
- Exploring data grouped by a set of variables
Exploratory statistical graphics using the seaborn package
Estimating basic statistics like mean, median, standard deviation and quantiles
Basic probability distributions (normal/Gaussian, binomial, Poisson, exponential, Chi-squared) including generating random numbers and finding critical values.
How pandas creates dummy variables from categorical variables
Linear & logistic regression and the formula interface
Creating publication-quality graphics
Best practices for data analyses

Thursday 10:35 AM–12:20 PM in Tutorial Room

Pandas and plots for data analysis

Abhijit Dasgupta

Description

Abstract

Outline of tutorial

Subscribe to Receive PyData Updates

Tickets