45
Python para la Ciencia de Datos por : Isabel Rodríguez https://www.linkedin.com/profile/view? id=384254439&trk=hp-identity-name

Summer school python in spanish

Embed Size (px)

Citation preview

Page 1: Summer school python in spanish

Python para la Ciencia de Datos

por : Isabel Rodríguezhttps://www.linkedin.com/profile/view?

id=384254439&trk=hp-identity-name

Page 2: Summer school python in spanish

PythonPython en realidad su nombre a una serie de comedia de la BBC de los años setenta "de

Monty Python Flying Circus". El diseñador necesita un nombre que fuera corto, único, y un poco misterioso.

Page 3: Summer school python in spanish

What is PythonPython is a widely used general-purpose, high-level programming language.

Its design philosophy emphasizes code readability, and its syntax allows programmers to express concepts in fewer lines of code

Guido van Rossum is the creator of Python.

core philosophy of the language is summarized by

● Beautiful is better than ugly

● Explicit is better than implicit

● Simple is better than complex

● Complex is better than complicated

● Readability countshttps://www.python.org/https://wiki.python.org/moin/BeginnersGuide/Programmershttps://wiki.python.org/moin/BeginnersGuide/NonProgrammersPython uses whitespace indentation, rather than curly braces or keywords, to delimit blocks; this feature is also termed the off-side rule.

Page 4: Summer school python in spanish

Que es PythonPython su propósito general, es el lenguaje de la programación utilizado en alto nivel.

Su filosofía de diseño hace hincapié en la legibilidad del código, y su sintaxis permite a los programadores para expresar conceptos en menos líneas de código

Guido van Rossum es el creador de Python.

filosofía de la base de la lengua se resume en

● Hermoso es mejor que feo

● Explícito es mejor que implícito

● Simple es mejor que complejo

● Complejo es mejor que complicado

● recuentos de legibilidadhttps://www.python.org/https://wiki.python.org/moin/BeginnersGuide/Programmershttps://wiki.python.org/moin/BeginnersGuide/NonProgrammersPython usa sangría espacios en blanco, en lugar de llaves o palabras clave rizado, para delimitar bloques; esta característica también se denomina la regla outside de juego.

Page 5: Summer school python in spanish

Que es Python?

Page 6: Summer school python in spanish

Que es Python?

Porque Error?

Page 7: Summer school python in spanish

Que es iPythonIPython es un shell de comandos para la computación interactiva en múltiples lenguajes de programación, desarrollado originalmente para el lenguaje de programación Python, que ofrece la introspección mejorado, rich media, sintaxis adicional cáscara, la implementación del tabulador, y su rica historia.http://ipython.org/

Ipython Notebook

IPython Notebook es un entorno computacional interactiva basada en la web para la creación de cuadernos IPython. Un cuaderno IPython es un documento JSON que contiene una lista ordenada de las células de entrada / salida que pueden contener código, texto, matemáticas, solares y rich media.

Page 8: Summer school python in spanish

Scipy

Page 9: Summer school python in spanish

NumPyNumPy

NumPy es el paquete fundamental para la computación científica con Python. Contiene entre otras cosas:

● un poderoso objeto de matriz N-dimensional

● sofisticadas funciones (radiodifusión)

● herramientas para la integración de C / C ++ y Fortran

● álgebra lineal útil, transformada de Fourier, y capacidades de números aleatorios

http://www.numpy.org/

Page 10: Summer school python in spanish

Statsmodels Statsmodels es un módulo de Python que permite a los usuarios explorar datos, estiman modelos estadísticos, y realizar pruebas estadísticas. Una extensa lista de estadística descriptiva, pruebas estadísticas, funciones de trazado, y las estadísticas de resultados están disponibles para diferentes tipos de datos y cada estimador. Los investigadores a través de campos pueden encontrar que statsmodels cumple plenamente sus necesidades de computación estadística y análisis de datos en Python. Las características incluyen:

● Modelos de regresión lineal

● Modelos lineales generalizados

● Modelos de elección discreta

● Modelos lineales robustas

● Muchos modelos y funciones para el análisis de series de tiempo

● Estimadores no paramétricos

● Una colección de conjuntos de datos para ver ejemplos

● Una amplia gama de pruebas estadísticas

● Herramientas de entrada-salida para la producción de tablas en varios formatos (texto, LaTeX, HTML) y para la lectura de archivos de Stata en NumPy y pandas

http://statsmodels.sourceforge.net/http://statsmodels.sourceforge.net/devel/examples/notebooks/generated/ols.html

Page 11: Summer school python in spanish

Statsmodels

http://statsmodels.sourceforge.net/devel/examples/notebooks/generated/ols.html

Page 12: Summer school python in spanish

Sci-kit learnhttp://scikit-learn.org/stable/

Scikit-learn: Machine Learning in Python, Pedregosa et al., JMLR 12, pp. 2825-2830, 2011.

Page 13: Summer school python in spanish

Sci-kit learnhttp://scikit-learn.org/stable/

Page 14: Summer school python in spanish

Matplotlibmatplotlib es una biblioteca conspirar python 2D que produce figuras de calidad la publicación en una variedad de formatos impresos y entornos interactivos a través de plataformas. matplotlib se puede utilizar en scripts python, la pitón y ipython shell (ala MATLAB® * o Mathematica® †), servidores de aplicaciones web, y seis juegos de herramientas de interfaz gráfica de usuario.

Page 15: Summer school python in spanish

Seaborn Seaborn es una librería de visualización basado en Python matplotlib. Proporciona una interfaz de alto nivel para la elaboración

de gráficos estadísticos atractivos. http://stanford.edu/~mwaskom/software/seaborn/

Page 16: Summer school python in spanish

ggplot http://ggplot.yhathq.com/Seaborn es una librería de visualización basado en Python matplotlib. Proporciona una interfaz de alto nivel para la elaboración de gráficos estadísticos atractivos. http://stanford.edu/~mwaskom/software/seaborn/

Page 17: Summer school python in spanish

Pandas

Page 18: Summer school python in spanish

Pandaspandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language .

Python has long been great for data munging and preparation, but less so for data analysis and modeling. pandas helps fill this gap, enabling you to carry out your entire data analysis workflow in Python without having to switch to a more domain specific language like R.

pandas does not implement significant modeling functionality outside of linear and panel regression; for this, look to statsmodels

and scikit-learn.

http://pandas.pydata.org/

Page 19: Summer school python in spanish

Interfaces to Python :IDLE

Page 20: Summer school python in spanish

Interfaces to Python :Spyder

Page 21: Summer school python in spanish

Interfaces to Python :RodeoRodeo es un IDE centrado en datos para Python. Usted puede pensar en él como una interfaz de usuario alternativa a la portátil para el IPython Kernel.

Page 22: Summer school python in spanish

Que es iPython Notebook

Page 23: Summer school python in spanish
Page 24: Summer school python in spanish
Page 25: Summer school python in spanish

Pandas Un objeto trama de datos rápido y eficiente para la manipulación de datos con la indexación integrado;

● Herramientas para la lectura y escritura de datos: CSV y archivos de texto,Microsoft Excel, bases de datos SQL, etc.

● Alineación inteligente de datos y el manejo integrado de los datos faltantes

● Rebanar inteligente basado en etiquetas, la indexación de lujo, y subconjuntos de grandes conjuntos de datos;

● Remodelación Flexible y giro de los conjuntos de datos; Las columnas pueden ser insertados y borrados de las estructuras de datos para el tamaño de la mutabilidad; La agregación o la transformación de datos con un grupo poderoso motor de búsqueda que permite dividir a aplicar-se combinan

● Alto rendimiento fusión y unión de los conjuntos de datos con la indexación ejej erárquica

● Tiempo serie funcionalidad:

Altamente optimizado para un rendimiento, con rutas de código críticos escritos en C.

Python con pandas está en uso en una amplia variedad de ámbitos académicos y comerciales, incluyendo Finanzas, Neurociencia, Economía, Estadística,Publicidad, Web Analytics, y más.

http://pandas.pydata.org/

Page 26: Summer school python in spanish

Data input read_csvdiamonds=pd.read_csv("diamondsbig.csv")#nota cabecera = 0 significa que tomamos la primera fila como encabezado (por defecto) más que podamos especificar encabezado = Ninguno

Page 27: Summer school python in spanish

Data Inputhttp://pandas.pydata.org/pandas-docs/stable/io.html

The pandas I/O API es un conjunto de las mejores funciones de lector nivel de acceso como pd.read_csv() que por lo general

devuelven un objetivo pandas .

● read_csv

● read_excel

● read_hdf

● read_sql

● read_json

● read_msgpack (experimental)

● read_html

● read_gbq (experimental)

● read_stata

● read_clipboard

● read_pickle

Las funciones escritor correspondientes son métodos de objeto que se accede como df.to_csv()

Page 28: Summer school python in spanish

Data Input http://www.sqlalchemy.org/

Page 29: Summer school python in spanish

Data Inputhttp://docs.sqlalchemy.org/en/latest/dialects/index.html

Page 30: Summer school python in spanish

Instalar paquetes adicionales en Pypip instalar packagename

Page 31: Summer school python in spanish

Data Inputhttp://crs4.github.io/pydoop/

Pydoop es un paquete que ofrece a

Python API for Hadoop.

http://crs4.github.io/pydoop/tutorial/hdfs_api.html

Page 32: Summer school python in spanish

Data Input

Page 33: Summer school python in spanish

Data Inspección objname=read_csv(‘name”)

objname.info()#checking object import

objname.head()#checking dataobjname.tail()#checking data

Page 34: Summer school python in spanish

Data inspecciónobjname.columns

len(objname)

random sampling

Page 35: Summer school python in spanish

Describe

Page 36: Summer school python in spanish

Describe

Page 37: Summer school python in spanish

Grupos por

Page 38: Summer school python in spanish

Grupos por

Page 39: Summer school python in spanish

Cross Tab

Page 40: Summer school python in spanish

Cross Tab

Page 41: Summer school python in spanish

Corelación

Page 42: Summer school python in spanish

Corelación

Page 43: Summer school python in spanish

Data visualización

Page 44: Summer school python in spanish

Data visualización

Page 45: Summer school python in spanish

Modelado