7.2 Fórmulas
En R
para especificar un modelo estadístico (realmente una familia) se suelen emplear fórmulas (también para generar gráficos).
Son de la forma:
~ modelo respuesta
modelo
especifica los “términos” mediante operadores (tienen un significado especial en este contexto):
Operador | Descripción |
---|---|
a+b |
incluye a y b (efectos principales) |
-b |
excluye b del modelo |
a:b |
interacción de a y b |
\ | b %in% a efectos de b anidados en a (a:b ) |
\ | a/b = a + b %in% a = a + a:b |
a*b = a+b+a:b |
efectos principales más interacciones |
^n |
interacciones hasta nivel n ((a+b)^2 = a+b+a:b ) |
poly(a, n) |
polinomios de a hasta grado n |
1 |
término constante |
. |
todas las variables disponibles o modelo actual en actualizaciones |
Para realizar operaciones aritméticas (que incluyan +
, -
, *
, ^
, 1
, …)
es necesario “aislar” la operación
dentro una función (e.g. log(abs(x) + 1)
).
Por ejemplo, para realizar un ajuste cuadrático se debería utilizar y ~ x + I(x^2)
, ya que y ~ x + x^2 = y ~ x
(la interacción x:x = x
).
I()
función identidad.