Modulo 1
ALFABETIZACIÓN EN DATOS Y PENSAMIENTO COMPUTACIONAL
- ¿Qué es R y por qué no es Excel? Entender la diferencia entre una hoja de cálculo (interfaz visual) y un lenguaje de programación (instrucciones escritas). La importancia de la reproducibilidad en la ciencia.
Fundamentos de Programación (Desde Cero):
- El concepto de Variable: La analogía de "la caja" para guardar datos (pesos, absorbancias, nombres).
- Tipos de Datos Crudos: Diferencia entre números (numeric), texto (character) y valores lógicos (TRUE/FALSE).
Estructuras de Datos: Cómo R organiza la información:
- Vectores: Una lista de un mismo tipo de dato.
- Data Frames: La "tabla de laboratorio" donde las columnas son variables y las filas son muestras.
- El Entorno RStudio: Instalación y configuración. Diferencia entre la Consola (donde R habla) y el Script (donde escribimos nuestras recetas de análisis).
Sesión de Programación I (Mi primer código):
- Operaciones matemáticas básicas como calculadora científica.
- Uso de funciones: ¿Qué es una función? (Entrada -> Proceso -> Salida).
- Cómo pedir ayuda a R y entender los mensajes de error (sin entrar en pánico).
Modulo 2
INMERSIÓN AL ECOSISTEMA R Y FUNDAMENTOS
- Importancia de R en las Ciencias: ¿Por qué R es el estándar en publicaciones científicas? (Reproducibilidad vs. Excel).
- Entorno de Trabajo: Instalación de R y RStudio. Configuración de proyectos y "Working Directory".
Fundamentos de Programación: * Tipos de objetos (Vectores, Matrices, Listas, Data Frames).
- Sintaxis básica y operadores lógicos.
- Instalación y carga de librerías (tidyverse).
- Sesión de Programación I: Carga de datos desde archivos Excel y CSV. Limpieza básica de nombres de columnas.
Modulo 3
PROGRAMACIÓN Y MANIPULACIÓN DE DATOS PARA INVESTIGACIÓN
- El paradigma Tidyverse: Uso del operador "Pipe" (%>% o |>) para escribir código legible.
Manipulación de Datos con dplyr:
- Filtrado de muestras (filter).
- Selección de variables analíticas (select).
- Creación de nuevas métricas y conversiones de unidades (mutate).
- Resúmenes estadísticos por grupos (group_by y summarise).
- Visualización Científica con ggplot2: Creación de gráficos de dispersión y boxplots para comparar grupos de estudio.
Manipulación con dplyr (Limpieza de datos):
- Seleccionar columnas de interés y filtrar muestras contaminadas o fuera de rango.
- Crear nuevas columnas (ej. calcular concentraciones a partir de absorbancias).
- Agrupar datos por categorías (ej. por tipo de tratamiento o cepa bacteriana).
Modulo 4
ESTADÍSTICA APLICADA AL CAMPO EXPERIMENTAL
- Fundamentos de Inferencia: Pruebas de normalidad (Shapiro-Wilk) y homogeneidad de varianza.
Test Estadísticos Esenciales:
- Pruebas t de Student: Comparación de medias en ensayos de recuperación o comparación de dos métodos.
- ANOVA de un factor: Evaluación de diferencias entre múltiples lotes o condiciones experimentales.
- Regresión Lineal: Evaluación de curvas de calibración y cálculo del coeficiente de correlación de Pearson.
- Interpretación de P-valores: Cómo leer e informar resultados estadísticos en un informe de investigación.
Visualización de Datos con ggplot2:
- El concepto de "Capas": Fondo + Datos + Geometría (puntos, barras, cajas).
- Creación de gráficos de calidad para publicación (Boxplots, Dispersión e Histogramas).
Estadística Útil para el Investigador:
- Comprobación de supuestos: ¿Mis datos son normales? (Test de Shapiro-Wilk).
- Comparación de grupos: Pruebas t de Student y ANOVA de un factor.
- Correlación y Regresión: Evaluación de la relación entre dos variables químicas o biológicas.