# Operaciones aritméticas básicas en R
2 + 3 # Suma[1] 5
5 - 2 # Resta[1] 3
4 * 5 # Multiplicación[1] 20
10 / 2 # División[1] 5
2^3 # Potencia (2 elevado a 3)[1] 8
Equipo Agoralab
Invalid Date
¡Bienvenido al material introductorio de R! En este documento aprenderás los conceptos básicos de R a través de ejemplos claros y concisos.
Este es el primer material del Club de R de Agoralab. En esta sesión, aprenderemos los fundamentos de R y RStudio, herramientas esenciales para el análisis de datos y la visualización.
R es un lenguaje de programación y entorno de software libre especializado en análisis estadístico y visualización de datos. Algunas características clave:
Veamos algunas operaciones básicas en R:
# Operaciones aritméticas básicas en R
2 + 3 # Suma[1] 5
5 - 2 # Resta[1] 3
4 * 5 # Multiplicación[1] 20
10 / 2 # División[1] 5
2^3 # Potencia (2 elevado a 3)[1] 8
En R, puedes asignar valores a variables utilizando el operador <- (aunque también funciona =). La flecha <- es la forma preferida por la comunidad de R:
# Asignación de valores a variables
x <- 10 # Creamos una variable llamada 'x' y le asignamos el valor 10
y <- 5 # Creamos una variable llamada 'y' y le asignamos el valor 5
# Operaciones con variables
x + y # Suma las variables (10 + 5)[1] 15
x * y # Multiplica las variables (10 * 5)[1] 50
x / y # Divide las variables (10 / 5)[1] 2
R maneja varios tipos de datos. Los más comunes son:
# Numéricos (números)
numero <- 42.5
class(numero) # La función class() nos dice el tipo de dato[1] "numeric"
# Texto (character o cadenas de texto)
texto <- "Hola mundo"
class(texto)[1] "character"
# Lógicos (TRUE/FALSE - verdadero/falso)
logico <- TRUE # Nota: TRUE y FALSE siempre en mayúsculas
class(logico)[1] "logical"
Los vectores son una estructura de datos fundamental en R. Un vector es simplemente una colección ordenada de elementos del mismo tipo:
# Crear un vector numérico usando la función c() (combine)
numeros <- c(1, 2, 3, 4, 5) # c() combina valores en un vector
numeros # Mostrar el vector[1] 1 2 3 4 5
# Operaciones con vectores (se aplican a cada elemento)
numeros * 2 # Multiplica cada elemento por 2[1] 2 4 6 8 10
numeros + 10 # Suma 10 a cada elemento[1] 11 12 13 14 15
Podemos crear vectores de cualquier tipo de datos:
Los factores se utilizan para representar variables categóricas (por ejemplo, género, grupos, categorías):
Los data frames son la estructura principal para datos tabulares en R (similar a una hoja de cálculo o tabla):
# Crear un data frame (tabla de datos)
datos <- data.frame(
nombre = c("Ana", "Juan", "Carlos", "María"), # Primera columna
edad = c(25, 30, 22, 28), # Segunda columna
altura = c(165, 180, 175, 168) # Tercera columna
)
# Ver el data frame completo
datos nombre edad altura
1 Ana 25 165
2 Juan 30 180
3 Carlos 22 175
4 María 28 168
# Dimensiones (filas y columnas)
dim(datos) # Muestra (filas, columnas)[1] 4 3
# Acceder a una columna usando $
datos$edad # Muestra solo la columna edad[1] 25 30 22 28
# Filtrar filas que cumplan una condición
datos[datos$edad > 25, ] # Solo las filas donde la edad sea mayor a 25 nombre edad altura
2 Juan 30 180
4 María 28 168
R tiene muchos paquetes que extienden su funcionalidad. Un paquete es un conjunto de funciones adicionales:
# Instalar un paquete (solo se hace una vez)
# Para ejecutar esto, quita el símbolo # del principio
# install.packages("dplyr")
# Cargar un paquete (se hace cada vez que iniciamos R)
library(stats) # Este viene preinstalado con RR tiene excelentes capacidades de visualización. Veamos algunos ejemplos básicos:
# Datos de ejemplo
set.seed(123) # Para que los resultados sean reproducibles
x <- rnorm(100) # 100 números aleatorios con distribución normal
y <- x + rnorm(100, sd = 0.5) # Valores relacionados con x + algo de ruido
# Gráfico de dispersión (scatter plot)
plot(x, y, main = "Gráfico de dispersión",
xlab = "Eje X", ylab = "Eje Y",
col = "blue", pch = 19) # pch es el tipo de punto
# Histograma (distribución de frecuencias)
hist(x, main = "Histograma", col = "lightblue",
border = "white", breaks = 20) # breaks es el número de barras
# Gráfico de barras
barplot(table(round(x)), main = "Gráfico de barras",
col = "salmon") # Cuenta los valores redondeados
R tiene un sistema de ayuda integrado que es muy útil para aprender:
# Obtener ayuda sobre una función
?mean # Ayuda sobre la función mean (promedio)
help(sd) # Ayuda sobre la función sd (desviación estándar)
# Buscar funciones por tema
??correlation # Busca funciones relacionadas con correlaciónEn la próxima sesión, exploraremos la manipulación de datos utilizando el paquete dplyr, parte del universo tidyverse.
¿Preguntas o sugerencias? Contacta al equipo de Agoralab en agoralab@saedcnt.com.
---
title: "Introducción a R y RStudio"
author: "Equipo Agoralab"
date: "05 de marzo de 2025"
output:
html_document:
theme: cosmo
highlight: tango
toc: true
toc_float: true
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE, message = FALSE, warning = FALSE)
```
<div class="alert alert-info">
<p><strong>¡Bienvenido al material introductorio de R!</strong> En este documento aprenderás los conceptos básicos de R a través de ejemplos claros y concisos.</p>
</div>
# Bienvenida al Club de R de Agoralab
Este es el primer material del Club de R de Agoralab. En esta sesión, aprenderemos los fundamentos de R y RStudio, herramientas esenciales para el análisis de datos y la visualización.
## ¿Qué es R?
R es un lenguaje de programación y entorno de software libre especializado en análisis estadístico y visualización de datos. Algunas características clave:
- Es **gratuito y de código abierto** (no hay que pagar licencias)
- Tiene una **comunidad activa** de usuarios y desarrolladores (siempre hay ayuda disponible)
- Cuenta con más de **18,000 paquetes** para diferentes aplicaciones (extensible)
- Es **extensible** y permite crear tus propias funciones y paquetes (personalizable)
- Tiene excelentes capacidades de **visualización** (gráficos profesionales)
### Primeros ejemplos
Veamos algunas operaciones básicas en R:
```{r}
# Operaciones aritméticas básicas en R
2 + 3 # Suma
5 - 2 # Resta
4 * 5 # Multiplicación
10 / 2 # División
2^3 # Potencia (2 elevado a 3)
```
## Primeros pasos con R
### Asignación de variables
En R, puedes asignar valores a variables utilizando el operador `<-` (aunque también funciona `=`). La flecha `<-` es la forma preferida por la comunidad de R:
```{r}
# Asignación de valores a variables
x <- 10 # Creamos una variable llamada 'x' y le asignamos el valor 10
y <- 5 # Creamos una variable llamada 'y' y le asignamos el valor 5
# Operaciones con variables
x + y # Suma las variables (10 + 5)
x * y # Multiplica las variables (10 * 5)
x / y # Divide las variables (10 / 5)
```
### Tipos de datos básicos
R maneja varios tipos de datos. Los más comunes son:
```{r}
# Numéricos (números)
numero <- 42.5
class(numero) # La función class() nos dice el tipo de dato
# Texto (character o cadenas de texto)
texto <- "Hola mundo"
class(texto)
# Lógicos (TRUE/FALSE - verdadero/falso)
logico <- TRUE # Nota: TRUE y FALSE siempre en mayúsculas
class(logico)
```
## Vectores
Los vectores son una estructura de datos fundamental en R. Un vector es simplemente una colección ordenada de elementos del mismo tipo:
```{r}
# Crear un vector numérico usando la función c() (combine)
numeros <- c(1, 2, 3, 4, 5) # c() combina valores en un vector
numeros # Mostrar el vector
# Operaciones con vectores (se aplican a cada elemento)
numeros * 2 # Multiplica cada elemento por 2
numeros + 10 # Suma 10 a cada elemento
```
Podemos crear vectores de cualquier tipo de datos:
```{r}
# Vector de texto (character)
nombres <- c("Ana", "Juan", "Carlos", "María")
nombres
# Vector lógico (TRUE/FALSE)
logicos <- c(TRUE, FALSE, TRUE, TRUE)
logicos
```
## Factores
Los factores se utilizan para representar variables categóricas (por ejemplo, género, grupos, categorías):
```{r}
# Crear un factor (variable categórica)
genero <- factor(c("M", "F", "F", "M", "M"))
genero
# Niveles del factor (categorías únicas)
levels(genero)
# Tabla de frecuencias (contar ocurrencias)
table(genero) # Muestra cuántas M y F hay
```
## Data frames
Los data frames son la estructura principal para datos tabulares en R (similar a una hoja de cálculo o tabla):
```{r}
# Crear un data frame (tabla de datos)
datos <- data.frame(
nombre = c("Ana", "Juan", "Carlos", "María"), # Primera columna
edad = c(25, 30, 22, 28), # Segunda columna
altura = c(165, 180, 175, 168) # Tercera columna
)
# Ver el data frame completo
datos
# Dimensiones (filas y columnas)
dim(datos) # Muestra (filas, columnas)
# Acceder a una columna usando $
datos$edad # Muestra solo la columna edad
# Filtrar filas que cumplan una condición
datos[datos$edad > 25, ] # Solo las filas donde la edad sea mayor a 25
```
## Instalación y carga de paquetes
R tiene muchos paquetes que extienden su funcionalidad. Un paquete es un conjunto de funciones adicionales:
```{r eval=FALSE}
# Instalar un paquete (solo se hace una vez)
# Para ejecutar esto, quita el símbolo # del principio
# install.packages("dplyr")
# Cargar un paquete (se hace cada vez que iniciamos R)
library(stats) # Este viene preinstalado con R
```
## Visualización básica
R tiene excelentes capacidades de visualización. Veamos algunos ejemplos básicos:
```{r}
# Datos de ejemplo
set.seed(123) # Para que los resultados sean reproducibles
x <- rnorm(100) # 100 números aleatorios con distribución normal
y <- x + rnorm(100, sd = 0.5) # Valores relacionados con x + algo de ruido
# Gráfico de dispersión (scatter plot)
plot(x, y, main = "Gráfico de dispersión",
xlab = "Eje X", ylab = "Eje Y",
col = "blue", pch = 19) # pch es el tipo de punto
# Histograma (distribución de frecuencias)
hist(x, main = "Histograma", col = "lightblue",
border = "white", breaks = 20) # breaks es el número de barras
# Gráfico de barras
barplot(table(round(x)), main = "Gráfico de barras",
col = "salmon") # Cuenta los valores redondeados
```
## Ayuda en R
R tiene un sistema de ayuda integrado que es muy útil para aprender:
```{r eval=FALSE}
# Obtener ayuda sobre una función
?mean # Ayuda sobre la función mean (promedio)
help(sd) # Ayuda sobre la función sd (desviación estándar)
# Buscar funciones por tema
??correlation # Busca funciones relacionadas con correlación
```
## Ejercicios prácticos para practicar
1. Crea un vector con los números del 1 al 10 y calcula su promedio y desviación estándar.
2. Crea un data frame con datos de 5 personas incluyendo nombre, edad y ciudad.
3. Genera un gráfico de barras que muestre la frecuencia de las diferentes ciudades.
### Solución del ejercicio 1
```{r}
# Crear vector del 1 al 10
mi_vector <- 1:10 # La notación a:b crea una secuencia de a hasta b
mi_vector
# Calcular el promedio (media)
promedio <- mean(mi_vector)
promedio
# Calcular la desviación estándar
desviacion <- sd(mi_vector)
desviacion
```
## Recursos adicionales para seguir aprendiendo
- [R for Data Science](https://r4ds.had.co.nz/) - Libro gratuito en línea
- [RStudio Cheatsheets](https://www.rstudio.com/resources/cheatsheets/) - Hojas de referencia rápida
- [R-bloggers](https://www.r-bloggers.com/) - Blog con tutoriales y noticias sobre R
- [Stack Overflow - R](https://stackoverflow.com/questions/tagged/r) - Preguntas y respuestas
- [Bioestadística Avanzada con R](https://bookdown.org/edsaul_perez/bioestadaistica_avanzada/01_intro_R.html) - Excelente recurso en español
## Próxima sesión
En la próxima sesión, exploraremos la manipulación de datos utilizando el paquete dplyr, parte del universo tidyverse.
¿Preguntas o sugerencias? Contacta al equipo de Agoralab en agoralab@saedcnt.com.