\[
x = \begin{bmatrix}
b_1\\
b_2
\end{bmatrix} ,
\]
\[
b = \begin{bmatrix}
x_1\\
x_2
\end{bmatrix}
\]
Resolve-se agora os valores de x (ou \(\Delta\)’s) linearmente:
\[
A * x = b
\tag{2}\]
Utilizando-se álgebra matricial, soluciona-se a Equação 2 para os valores de x:
\[
x = A^{-1} * b
\tag{3}\]
Assim, a solução matricial, largamente empregada em situações multivariadas, como como metodologia de superfície de resposta e experimento fatorial, pode ser obtida pela Equação 4 que segue.:
\[
y = b_0+b_1*x, \, ajuste\ linear
\\
y = b_0+b_1*x_1+b_2*x_2+...+b_n*x_n, \, ajuste \, multilinear
\\
y = b_0+b_1*x_1+b_2*x_2+...+b_n*x_n, \, metodologia \, de \, superfície \, de \, resposta \, linear
\\
y = b_0+b_1*x_1+b_2*x_2+b_{12}*x_1*x_2, \, planejamento \, fatorial \, 2^2
\\
y = b_0+b_1*x_1+b_2*x_2+b_3*x_3+b_{12}*x_1*x_2+,b_{13}*x_1*x_3+b_{23}*x_2*x_3+b_{123}*x_1*x_2*x3 \, experimento \, fatorial \, 2^3
\\
y = b_0+b_1*x_1+b_2*x_2+b_{11}*x_1^2+b_{22}*x_2^2+b_{12}*x_1*x_2, \, metodologia \, de \,superfície \, de \, resposta \, quadrática
\\
\tag{5}\]
Via de regra, todas as aplicações listadas em Equação 5 podem ser solucionadas com auxílio das relações matriciais das equações Equação 4 (ajustes linear, multilinear e superíficie de resposta linear) ou Equação 2 (planejamentos fatoriais). A seguir são exemplificadas duas situações dessa natureza.
Rendimento de Reação & Planejamento Fatorial 2\(^{2}\)
O experimento fatorial mais simples é o que se avalia a resposta de um experimento (rendimento, por ex) em que se variam dois fatores (temperatura e tipo de catalisador, por ex) em dois níveis cada (baixo e alto). A tabela elaborada no trecho abaixo a partir dos dados explicitados por Neto e cols [@neto2010fazer] exemplifica essa situação.
# Planejamento fatorial# Dados do experimentotemp <-c(40, 60, 40, 60)catalis <-c("A", "A", "B", "B")rendim <-c(59, 90, 54, 68)# Tabela do planejamento fatorialtab.fat <-data.frame(temp, catalis, rendim)knitr::kable(tab.fat, caption ="Dados de experimento fatorial (Neto e cols, 2010).", "pipe") # tabela
Dados de experimento fatorial (Neto e cols, 2010).
temp
catalis
rendim
40
A
59
60
A
90
40
B
54
60
B
68
Para conduzir a análise matricial dos dados é necessário converter a tabela de variáveis independentes (preditoras) em uma matriz de planejamento codificada, na qual valores altos (nível superior) são representados por +1 e valores baixos (nível inferior) por -1. Além disso, também é necessário atribuir-se +1 à 1a. coluna, e produzir uma 4a. coluna contendo o produto dos preditores codificados. Exemplificando, para temperatura a 40 (-1) e catalisador B (+1), a linha conterá o produto -1. Essa matriz final 4x4 é denominada matriz de coeficientes de contraste:
Além disso, é necessário dividir a o resultado da operação matricial por um vetor escalar específico. Resumindo: elabora-se a matrix X codificada dos preditores, a matriz Y da resposta, aplica-se a Equação 2, e divide-se o resultado por um vetor característico do planejamento fatorial 2\(^{2}\) (c(4,2,2,2)). O trecho de código abaixo soluciona o problema levantado:
# Criação da matriz de planejamento codificadaX <-matrix(c(1, -1, -1, 1, 1, 1, -1, -1, 1, -1, 1, -1, 1, 1, 1, 1), nrow =4, byrow =TRUE)# Criação da matriz de rendimentoY <-as.matrix(rendim)# Determinação dos coeficientes beta:beta <-t(X) %*% Y /c(4, 2, 2, 2)beta
[,1]
[1,] 67.75
[2,] 22.50
[3,] -13.50
[4,] -8.50
Dessa forma, interpreta-se o resultado como:
\[
\begin{pmatrix}
M \\
T \\
C \\
TC \\
\end{pmatrix} =
\begin{pmatrix}
67,75 \\
22,50 \\
-13,50 \\
-8,50 \\
\end{pmatrix}
\tag{6}\]
Onde M representa a média global da resposta, T e C os efeitos principais (temperatura e catalisador), e TC o efeito da interação. Em síntese, os resultados sugerem que 1) a temperatura favoreceu o rendimento, especialmente para o catalisador A, 2) há redução do rendimento quando se substitui o catalisador A pelo B, e c) os maiores rendimentos são obtidos com o catalisador A na temperatura mais alta. Expressando-se esses resultados na função linear múltipla:
\[
y=67,75+22,5*T-13,5*C-8,5*T*C
\tag{7}\]
Curiosamente, chega-se aos mesmos resultados se, ao invés de aplicarmos a Equação 2, utilizarmos a Equação 4, seguido de multiplicação (e não divisão) por outro vetor (c(1,2,2,2):
Esta técnica estatística multivariável também é comumente empregada na modelagem de respostas influenciadas por mais de um fator, por vezes associada ao planejamento fatorial, e com vistas à otimização de uma resposta sem a necessidade de se avaliar todas as combinações possíveis. Isso pode ser particularmente útil quando se deseja otimizar um ensaio cuja resposta depende, por exemplo, de preditores escalares, como a faixa de concentração de determinado reagente e as condições de pH.
Exemplificando para uma superfície de resposta linear[@neto2010fazer], num ensaio em que se deseja verificar o melhor rendimento (rend, %) de uma reação variando-se 3 níveis de concentração de reagente (conc, %) e três velocidades de agitação magnética (agit, rpm), pode-se como dantes elaborar a matriz de contrastes a partir das informações da tabela que segue:
# Dados para metodologia de superfície de respostaconc <-c(45, 55, 45, 55, 50, 50, 50)agit <-c(90, 90, 110, 110, 100, 100, 100)x1 <-c(-1, 1, -1, 1, 0, 0, 0)x2 <-c(-1, -1, 1, 1, 0, 0, 0)rendim <-c(69, 59, 78, 67, 68, 66, 69)tab.msr <-data.frame(conc, agit, x1, x2, rendim)knitr::kable(tab.msr, caption ="Dados de experimento de metodologia de superfície de resposta linear (Neto e cols, 2010).", "pipe") # tabela
Dados de experimento de metodologia de superfície de resposta linear (Neto e cols, 2010).
conc
agit
x1
x2
rendim
45
90
-1
-1
69
55
90
1
-1
59
45
110
-1
1
78
55
110
1
1
67
50
100
0
0
68
50
100
0
0
66
50
100
0
0
69
# Criação da matriz de coeficientes de contrasteX <-matrix(c(1, 1, 1, 1, 1, 1, 1, -1, 1, -1, 1, 0, 0, 0, -1, -1, 1, 1, 0, 0, 0), nrow =7, byrow =FALSE)# Criação da matriz de rendimentoY <-as.matrix(rendim)# Determinação dos coeficientes beta:beta <-solve(t(X) %*% X) %*%t(X) %*% Ybeta
[,1]
[1,] 68.00
[2,] -5.25
[3,] 4.25
Dessa forma, a função linear que expressa a superfície de resposta será:
\[
y=68,00-5,25*conc+4,25*agit
\tag{8}\]
Superfície Quadrática de Resposta
Por vezes o modelo linear pode não adequar-se ao planejamento experimental, o que pode ser verificado por uma Análise de Variância (ANAVA) do experimento. Nesses casos pode-se aplicar uma metodologia de superfície quadrática, e que pode ser expressa como visto na Equação 5. Nesses casos é usual uma construção denominada planejamento em estrela que acrescenta ao planejamento inicial um idêntico rotacionado 45\(^{o}\), e cujos pontos novos estão distantes \(\sqrt{2}\) unidades codificadas do ponto central. O exemplo abaixo pretende exemplificar essa metodologia.
Dados de experimento de metodologia de superfície quadrática de resposta (Neto e cols, 2010).
conc
agit
x1
x2
rendim
30
115
-1.000000
-1.000000
86
40
115
1.000000
-1.000000
85
30
135
-1.000000
1.000000
78
40
135
1.000000
1.000000
84
35
125
0.000000
0.000000
90
35
125
0.000000
0.000000
88
35
125
0.000000
0.000000
89
28
125
-1.414214
0.000000
81
35
139
0.000000
1.414214
80
42
125
1.414214
0.000000
86
35
119
0.000000
-1.414214
87
# tabela
Dessa vez a matriz de coeficentes de contrastes expande-se para seis colunas em função dos termos x\(_{1}^{2}\), x\(_{2}^{2}\), e x\(_{1}\)x\(_{2}\), tornando-se:
Pelo resultado acima é possível prever-se as condições otimizadas para o ensaio. Nesse sentido, o R permite, por exemplo, a construção de um gráfico tridimensional que represente a função obtida, e sem a necessidade de pacote adicional: tal como segue:
## Superfície quadrática de resposta (MSR)x <-seq(-1, 1, 0.1) # preditor xy <-seq(-1, 1, 0.1) # preditor ymrs <-function(x, y) {89.00+1.51* x -2.36* y -2.81* x^2-2.81* y^2+1.75* x * y} # função aplicada aos preditoresz <-outer(x, y, mrs) # saída do gráfico 3D (resposta)res <-persp(x, y, z, xlab ="x1", ylab ="x2", zlab ="z", shade =0.4, theta =30, phi =15, ticktype ="detailed") # plotagem de superfície da função z(x,y)pontos <-trans3d(x1, x2, rendim, pmat = res) # comando para adição de pontos experimentaispoints(pontos, pch =19, col =1) # adição dos pontos
Superfície quadrática descrita pela equação de MSR com superposição dos valores experimentais.
Não obstante, existem para o R alguns pacotes para representação tridimensional de dados e funções (rgl, plot3D, scatterplot3d), como também para análise de planejamento fatorial (agricolae,afex,FMC), e de metodologia de superfície de resposta (rsm`).