San Carlos R User Group

Primer Taller

Frans van Dunné
frans@ixpantia.com
@fransvandunne

CCIT, Ciudad Quesada
2016-02-25

Objetivos del taller

  • Introducirnos
  • Mise en place
    • R
    • Marcos de referencia
    • IDE
    • Gestión de versiones
  • El mundo CRANtástico
    • Paquetes (7958)
  • Actividad!
  • Shiny
  • Definir el siguiente taller …

Introducciones

Hola!

Mi nombre es …

Mis objetivos son …

Quiero aportar …

Mis en place

Estadísticas

  • Variabilidad
  • Aleatoriedad
  • Muestreo y distribución
  • Testeo de hipótesis
  • Collección, validación y gestión de datos
  • Asociación vs Causalidad
  • Significancia

Ciencia de Datos












Hadley Wickham
Fuente:@evbln 2016-02-17

Ciencia de Datos

Programar

Larry Wall compara programar computadoras con escribir una receta.

  • Ingredientes
  • Instrucciones como usar los ingredientes

Puedes tomar la receta de otro chef como base, para crear tu propia versión.

Distribuciones:

IDE’s

  • RStudio

  • Vim / EMACS
  • R Commander
  • RKWard
  • Sublime/Notepad++/ etc.

Gestión de versiones

Mis en place

  • Marco de referencia estadísticas
  • Marco de referencia ciencia de datos
  • Marco de referencia programación
  • R (CRAN)
  • IDE (RStudio)
  • Repositorio SC-RUG (Github)

Suficientes temas para el San Carlos R User Group!

El mundo CRANtástico

Rcpp

  • C++ para cuando R no es lo suficientemente rápido
  • O cuando hay bibliotecas de interés
  • Sigue la tradición de incorporar FORTRAN
  • Es lo que requiere RTools.exe para instalar desde fuente
  • Es lo que puedes olvidar y disfrutar

MASS

El Hadleyverso básico

  • readr - leer archivos
  • readxl - leer archivos excel
  • lubridate - Date and time handling
  • stringr - Trabajar con cadenas de texto
  • tidyr - Trabajar con datos organizados
  • dplyr - Gramática de datos
  • ggplot2 - Gramática de gráficos

El Hadleyverso avanzado

  • MultiDplyr - Trabajar con dplyr paralelizado
  • ggvis - Gráficas interactivas
  • rvest - Recolectar de la red
  • devtools - Desarrollo de paquetes
  • roxygen2 - Documentación de paquetes
  • testthat - Testeo automatizado

Su turno!

Usar RStudio

  • Busca ayuda sobre el uso de RStudio
  • Busca ayuda sobre la función plot
  • Verifica si la biblioteca readxl esta instalada

5:00

demo()

demo()

# Puedes ejecutar cualquier demo en la lista
# especificandolo en la funcion demo()

demo(recursion)
demo(colors)

5:00

Escribir R

En R hay varios sets de datos disponibles por defecto (cuales?). Usando los datos airquality genera una gráfica del nivel de Ozono contra Temperatura.

5:00

Shiny

Siguiente(s) taller(es)

Ideas, comentarios

  • Queremos un taller cada mes? Bimensual? Anual?
  • Cual formato nos mantiene involucrados a todos?
    • Walk-in workshop?
    • Temas preparados / liderados?
    • Otra forma?
  • Hay preferencias de comunicación?
    • Meetup cubre mucho (incluye mensajes)
    • Twitter (#sancarlosr)?
    • Facebook?

Siguentes pasos

Agradecemos

Fuentes y referencias