El analisis de la regresion lineal y su implementacion en caso practico

katyapaulamzt 6 views 64 slides Sep 09, 2025
Slide 1
Slide 1 of 64
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64

About This Presentation

Regresion lineal formulas


Slide Content

1
Marte 2004.

2
Especialistaencafésehaorientadoavalorarnuevas
variedadesdecafetospararecomendaraloscafeterosde
CostaRica.
Paracumplirlosobjetivosdelestudiodebevalorarentre
otrascosas:rendimiento,exigenciasnutricionales,
resistenciasaplagasyenfermedades,capacidadesde
reproducción.Todoestoenlasdiferenteszonascafeteras
delpaísyenalmenosdosciclosdecuatroañosyuna
poda.
Paraofrecersusrecomendacionesplanificasus
experienciasusandomodeloslinealesparaelanálisisde
resultados.

3
Deldepartamentodecomercioexteriorqueexplora
elaportedeproductosbásicoscomo:leche,huevos,
arroz,maíz,azúcar;paraobtenerestimacionesdel
ProductoInternoBrutodelospaísesdesarrolladosy
delpropioPaís.
Enelanálisisdelosdatosutilizamodeloslineales
paraconseguirprospectivasútilesquelefaciliten
estimarelindicadornacionaldelPIB.

4
Quetienequedecidirquéycuántodecadaproducto
debefabricarenlospróximosseismesesconsiderando:
elcostodelamateriaprima,elconsumode
combustibles,eltiempodeproceso,laspresentaciones,
elgastoenmanodeobra.
Considerandoelingresonetodecadaproductoylas
restriccionesoperativasdelafábricayelmercado.
Paraformarcriterioanalizaelconjuntodeecuaciones
linealesquerepresentanlaoperacióndelaempresa.

5
Quedebeentregarunestudiodemercadoparauna
nuevapresentacióndeunproductoconmucha
competencia.
Ensuestudiodefactibilidadincluyeunanálisisde
FortalezasyOportunidades,DebilidadesyAmenazas
conocidoporsussiglasFODAmodificado,enelque
incluyecalificacionesyvaloresmétricos.
Paraauxiliarseensusrecomendacionesutiliza
modeloslinealesparadeterminarlos“puntos
calientes”delestudio.

6
Quedebeprogramarlascomprasdeequipo,materialesy
medicinasparalasclínicasdelaSeguridadSocialdepaís
considerando:precios,calidades,presentacionesyotras
variablesrelacionadasconlosequipos,materialesy
medicinas.
Debeademás,considerarlospresupuestosdecomprasde
cadaunadelasclínicas,lospresupuestosdegastosy
prioridadesdeuso.
Paralasprospectivasutilizaunmodelodesimulaciónque
incluyeecuacioneslineales.

7
Quedebeestudiarelimpactoquetendríaabrirunazona
francaenunaregiónecológicamentericaparano
convertirlaenuna“zonacaliente”.
Porunapartedebeestudiarelhábitatdelasespecies
endémicas.Yporotra,losanálisisdefactibilidadquelos
especialistasendesarrollourbano,económicoeindustrial
hanconsideradoparapromoverlaaperturadeunazona
franca.
Paraelanálisisutilizaráecuacioneslineales.

8
Enlosejemplosanterioressepresentaunaconstante:
Unconjuntodevariablesquepuedeninteractuaronoensu
relaciónsobreunaovariasvariablesquereflejanelresultado
sobreelobjetivodeestudio.Endondeesposible:
Alestablecerunordenamientoespecífico:
Delladoizquierdodeunaigualdadlasvariables
consecuentes;
Delladoderecholasvariablesinfluyentesseparadaspor
unsignodesumaqueindicaquelosefectossonaditivos.
LoesencialparaunaounsistemadeEcuacionesLineales.

9
El modelo lineal toma la forma genérica:
EsevidentequeelcomportamientodelavariableYseverá
influidoentasasdeincrementoodecrementoa
iparacada
variableX.
ParaelcursointeresaquelavariableYseadenaturaleza
aleatoria,porestoseincluyeelerror
i,mientrasquelas
variablesX:
PuedenserdenaturalezaAleatoria;
PuedenserdenaturalezaFactorial:
OpuedenestarDeterminadasporlaInvestigación.i
i
ppiii
xaxaxaay  ...
22110

10
ELproblemadelosmodelolinealessecentraendeterminar
cuálocuálestasasa
isondeterminantesenelresultadodela
variableYutilizadaparavalorarelcomportamientodelSujeto
Experimentadobajolainfluenciadelacorrespondiente
variableX.
LaTeoríaEstadísticahadesarrolladounatécnicade
valoraciónprobabilísticadeHipótesisNulasestablecidas
sobreloscoeficientesa
ienunmodelomodificadocomo:       
 

n
i
i
n
i
ppi
n
i
n
i
pi
n
i
ii
XXbXXbXXbyy
1
2
11 1
2
2
22
2
2
1
2
11
2
1
2
... 
ConocidocomoIgualdaddelaSumadeCuadrados,enlaque
lapartealeatoria
2
oSumadeCuadradosdelError
proporcionaelcriterioparalasdecisiones.

11
SonlassiglasparaelAnálisisdelaVarianza,esademásel
conceptodeunatécnicaparasepararcadaunodelos
componentesdelavarianzatotalentérminosdesumasde
cuadradososea:
yvalorarlaHipótesisNuladelcoeficienteajasociadoacadauna
delasvariablesX
j.
Esevidentequelasdecisionesseránmássencillasyacertadassi
únicamenteaquellasVariablesObjetivoXquerealmentehagan
evidenteuncambioenlavariableY,usadaparamedirel
comportamientodelconjuntodesujetosexperimentadoso
explorados. 


n
i
i
yy
1
2

12
También,bajoeltítulodeANDEVAseconocealcuadroresumenque
compendialainformacióndelasfuentesdevariaciónenunformato
simpleyuniversalmostradaenuncuadrocuyaformapuedecambiarde
unaaotraTécnicadeAnálisisdelosModelosLinealesperoconelmismo
contenido:LasFuentesdevariaciónyelCriterioparavalorarla
hipótesisnula:
Ho;ELMODELONOEXPLICAELCOMPORTAMIENTO DEY.Fuente de laGrados deSumas deCuadradosCrtiterio deProbabilida
VariaciónLibertadCuadradosMediosF CalculadaFc
Del Modelo a - 1 SCR
No Explicadan - a SCE
Total n - 1 SCT

1

a
SCR
CMR

an
SCE
CME



CME
CMR
Fc  anaFcP
F
;1;

13
ElObjetivodeestacharlaesintroduciralestudianteenel
usodelosModelosLinealesen:
TécnicasdeRegresión:
TécnicasdeExperimentaciónPlanificada;
YTécnicasdeMuestreo.
Todasrelacionadasconlaincertidumbrealeatoria.
Otrasecciónmuyimportantedelaestadísticaserefiereal
usodelosModelosLinealesenlaOptimizacióndeRecursos,
áreadeestudiomásrelacionadaconlaInvestigaciónde
Operacionesqueseveenotraunidaddeestudio.

14
LaMecánicadelacharlaincorpora,enestemomento,elusodeun
LibroElectrónicoE09_ANDEVA_X01.xls,herramientaquepermitirá
mostraralosestudiantesquelateoríanoestáenlacabezadel
profesoroplasmadaenloslibros.
Semostrará,queelavancedelaciencia,enestecasolaEstadística
contodaslascomplicacionesqueseleachacan,puedetenerunuso
prácticosí,seescapaz,deaplicarrazonamientossimples
transformadoseninstruccionesparaelProgramaGestordelaHoja
Electrónica,instrumentoqueresponderáconresultadosde
operaciones,enocasionesmuycomplejasqueseresuelvenmediante
algoritmosinternos.
Severáquelaaplicaciónteóricaalosresultadosnosedesvirtúapor
loqueimplicahacercálculospasoapaso,trabajoqueseledejaala
HEquiénlosresuelvesinqueelestudianteseentere.

15Marte 2004

16
El Modelo Linealmás simple definido por: iii
xbby 
10
O por: 
iii
xxbyy 
1
Que se obtiene resolviendo las Ecuaciones Normales:xbyb
10
 

SCX
SCXY
xx
xxyy
b
n
i
i
n
i
ii








1
2
1
1
Y

17
ParainiciarladiscusióndelANDEVAesconvenienteutilizar
LaTécnicadeRegresiónSimplecuyomodelotieneunaúnica
variableinductoraXpara:
DeducirelcomportamientodeYlavariablereflectora
(dominiodelafunción)cuandoseutilizaparaexplorar
poblaciones;
Oparainduciraccionescuandoelcomportamientode
lavariableYrefleja(rangodelafunción)aacciónde
FactoresenTécnicadeexperimentaciónplanificada.
Entodoscasos,usualmenteseutilizarálainferenciaque
resultedeunamuestra.

18
La hipótesis estadística que debe valorarse en la Regresión
Simplees:
Determinar sí El Modelo Linealaproxima convenientemente
el comportamiento de la variable Y, sujeto del análisis.
Considerando la forma alternativa del modelo lineal 
iii
xxbyy 
1
La hipótesis se plantea desde el punto de vista del coeficiente
b
1. Esto es: 0;
1BHo

19
AdecuandolaEcuacióndeSumasdeCuadradosdela
Diapositiva10alcaso:     
 

n
i
n
i
ii
n
i
ii
xbbyxxbyy
1 1
2
10
1
22
1
2
OensuformaExplícita:SCESCRSCY 
Esevidentequeentremayorsear
2
másserálaaproximación
delModeloLinealalconjuntodedatos
OensuformaProporcional: )1(1
22
rr 

20
Esevidentequeentremayorsear
2
,laproporciónde
variaciónexplicadaesmayorelargumentopararechazarla
hipótesisnulaHo;b
1=0.
LaTeoríaEstadísticahadesarrollado,paraestoscasos,la
pruebadeF(deFisher).Queconsisteenubicarenla
DistribucióndeProbabilidaddeF,lacantidadde
probabilidaddesdeelpuntoquedeterminalavariable
resultantededividirdosvarianzas,hastainfinito.La
cantidaddeprobabilidadasímedidasellamanivelde
significaciónonivelyalaprobabilidadcomplementaria1
-niveldeseguridadoniveldeconfianza,quevienedesde0
hastaelpuntousadocomocriterio,ambasconrespectoala
hipótesisnula.

21
Enelmodeloderegresiónhaydosparámetros,b
0yb
1,portanto,la
varianzaderegresióntiene1gradodelibertad,estoes:SCYr
SCR
CMR 
2
1
Enlavarianzadelerrorintervienennobservacionesdelasqueserestan
losdoscoeficientesderegresiónorestriccionesparamétricas,portanto
tendrán–2gradosdelibertad.
ElcocientedeFcalculadoesportanto:2
2
1
)2(
r
rn
CME
CMR
Fc


 2
)1(
2
2





n
SCYr
n
SCE
CME

22
Todoestudioestadísticollevaimplícitoque,losresponsableshananalizado
lasconsecuenciasdeAceptaroRechazarunaHipótesisNulayconestabase
definidoelniveldeconfiabilidadqueseusaráenlaspruebasde
significación.
ElGráficoesquematizauna
pruebadeFconunnivelde
significación5%.Lareglade
decisiónessimple:Sila
funcióndelaHEindicaun
nivelinferioroiguala0,05se
rechazalahipótesis.Obien,
sielvalorcalculadodeFes
menora4,351rechaceHo.
Paraunapruebacon1y20
gradosdelibertadenel
cocientedelasvarianzas.Distribución de probabilidad de F
0,00
0,20
0,40
0,60
0,80
1,00
1,20
0,0 0,6 1,2 1,8 2,4 3,0 3,6 4,2 4,8 5,4 6,0 6,6 7,2 7,8 8,4 9,0 9,6
Valores de F Calculada
Probabilidad
Zona de Aceptación de la
hipótesis nula. O Zona de
Confianza 95%
Valor de la Fc que
delim ita las zonas de
decisión: 4,351
Zona de Rechazo de la
hipótesis nula. O zona de
significación 5%
F(Fc; 1; 20)

23
EnlaescueladeZootecniadelaUniversidaddeCostaRicase
efectuóunexperimentoplanificadoenunagranjaavícolaen
pollosderazaparacarne.Unodelosobjetivosera:
Obtenerunpromediodelibradecarneporlibrade
alimentoconsumido.
Losresultadossonpromediosde22jaulasquetenían10
polloscadauna.
Lahipótesisnuladicequeelpesodelospollosnoestá
relacionadoconelconsumodealimento,estoes:
Ho;b
1=0
Conunniveldesignificaciónde0,05o5%,paralaspruebas.

24
ParaconstruirunANDEVAdeRegresiónSimplepasoapaso
debeobtenerlossiguientesestadísticos:2,391
22
1,945...2,6031,425
1





n
y
y
n
i
i 43,666
22
47,077...43,13637,233
1





n
x
x
n
i
i
PromediodeY.
PromediodeX.
SumadeCuadradosdeY:    5,6702,391-1,945...2,391-2,6032,391-1,425
22
1
22


n
i
i
yySCY

25
SumadeCuadradosdeX.
SumadeProductosCruzadosXY.
CoeficientedelaPendienteb
1:    264,86643,666-47,077...43,666-43,13643,666-37,233
22
1
22


n
i
i
xxSCX     
27,709
2,391-1,94543,666-47,077...2,391-1,42543,666-37,233
1



n
i
ii
yyxxSCXY   
 
0,1046
264,866
27,709
1
2
1
1








SCE
SCXY
xx
yyxx
b
n
i
i
n
i
ii
El ANDEVA SCX; SCXY y Coeficiente b
1

26
UnavezqueseobtieneelmodelosepuedecalculalaSumade
CuadradosdelError:
EnelANDEVAderegresiónseacostumbraofrecerpruebas
sobreloscoeficientesderegresión.Paraestodebe
considerarseLaDesviaciónEstándardelModelo:
CoeficientedelaIntersectadab
0:-2,17743,6660,1046-2,391
10
xbyb         
2,7716
47,0770,10462,177-1,945...37,2330,10462,177--1,425
2
1
2
10



n
i
ii
xbby 0,3723
222
7716,2
2




 CME
n
SCE
S
E
En ANDEVA Coeficiente b
oCME y Desviación Estándar.

27
ElcriterioparavalorarlahipótesisseobtieneconlavariabledeF
calculada,paraestosedebeobtenerlaSumadeCuadradosdelaRegresión:  2,899866,2641046,0
1
222
1 

n
i
ixxbSCR
EstadísticoconelqueyasepuedeobtenerelcocientedeF
Calculada:20,918
0,139
2,899

CME
CMR
Fc
Yvalorarlaprobabilidadquedeterminaenladistribución
deFmediantelarutinadelaHE:


20,918
0
0,0001820) 1; ;918,20(20) 1; ;( dxfFcP
El ANDEVA SCR, F calculada y Probabilidad de F.

28
Losestimadoresdeloscoeficientesdelmodeloderegresión
tienenunadistribuciónnormalalrededordelosparámetros.
Estosignificaquesepuedenvalorarlashipótesisalcomparar
variablesestandarizadasconlaDistribuciónNormalEstándar
ousandolaDistribuciónde“t”.Paralaintersectada: 
 
2,1730-
264,866
43,666
22
1
3723,0
177,2
1
0
2
1
2
2
0
0
0
2;2;0











n
i
i
E
B
nb
xx
x
n
S
b
S
b
t
ValoradoconlarutinadelaHE:
0,04197
20
12) 20; ;173,2(
2
120
173,2
0
2
0 











dt
t
fYF
Implicarechazarlahipótesisconunaprobabilidadde4,20%.
En ANDEVA Prueba de t para la Intersectada.

29
Lavariabletparalapendienteb
1: 
4,5736
264,866
0,3723
0,10460
1
2
1
1
1
)2;2;1(








n
i
i
Eb
nb
xx
S
b
S
b
t
ValoradaconlarutinadelaHE:
EnelcasodelaRegresiónSimple,lasprobabilidadesdeF
ydetsonexactamenteiguales.Nadaextrañosiserecuerda
queladistribucióndeFesunaDistribuciónde
Probabilidaddevariablest
2
0,00018
20
12) 20; ;5736,4(
2
120
5736,4
0
2
0 











dt
t
fYF
El ANDEVA Prueba de t para la Pendiente.

30
TodosloscálculosseacomodanenelcuadrodelANDEVApara
regresióntomadocomobaseeldeladiapositiva12.ANDEVA para regresión simple
Fuente deGrados deSuma deCuadradosCocinete deProbabilidad
VariaciónLibertadCuadradosMediosF. CalculadaSignificanteP( 0,05)P(0,01)
Regresión 1 2,899 2,8988 20,91800,00018 4,3513 8,0960
Error 20 2,772 0,1386
Total 21 5,670
Promedio de Y 2,3909
Desviación Estándar 0,3723
Coeficiente de variación15,57%
Coeficiente de Correlación71,50%
Coeficiente de Determinación51,12%
Información sobre los coeficientes de regresión
CoeficienteErrorEstadísticoProbabilidadLímites 95%
VariableRegresiónTípico t CoeficienteInferiorSuperior
Intersectada-2,17731,0019-2,17300,04197-4,2673-0,0872
X 0,10460,0228735814,5736 0,00018 0,0569 0,1523
Límites Significantes

31
LaprimeraconclusiónqueindicaelANDEVAesquedeberechazarsela
HipótesisNulaconunniveldesignificaciónde0,00018o0,018%.Dicho
deotraforma,elModeloLineal:
i
x0,1046-2,1773ˆ 
i
y
Aproximalosdatosconunniveldeconfianzade99,98%.
Laintersectadaseestimaentre:
Evidentemente,nopasaporelorigen,comosededujoconanterioridad.
Lapendientepuedefluctuarentre:
Laconclusióndelaregresiónsería:Lospollospesanmásentremás
alimentoconsumen.Unkilodealimentoimplicaunaumentodepesoque
puedeirde60a150gramosconunaconfianzadel95%.
    
 %95-0,08724,2673Pr
%95Pr
0
00,05 ;200000,05 ;200




bb StbStb
    
 %950,15230,0569Pr
%95Pr
1
10,05 ;201110,05 ;201




bb StbStb

32
Yaquesehadadounrepasoalaeoríaparareafirmarconceptos,seestá
enposicióndeinterpretarelresumendelANDEVAqueofrecelarutinade
laHE.Conlosmismosvaloresqueelelaboradopasoapaso.Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple0,7150
Coeficiente de determinación R^20,5112
R^2 ajustado 0,4868
Error típico 0,3723
Observaciones 22
ANÁLISIS DE VARIANZA
Fuente de Grados deSuma deCuadradosCocinete deProbabilidad
Variación LibertadCuadradosMedios F. CalculadaSignificanteP( 0,05)P(0,01)
Regresión 1 2,8988 2,8988 20,91800,00018 4,3513 8,0960
Residuos 20 2,7716 0,1386
Total 21 5,6703
CoeficienteErrorEstadísticoProbabilidadLímites 95%
Variable RegresiónTípico t CoeficienteInferiorSuperior
Intercepción -2,17731,0019-2,1730 0,0420-4,2673-0,0872
X 0,1046 0,0229 4,5736 0,0002 0,0569 0,1523
Límites Significantes

33
Marte 2004

34
ElModeloLinealmássimplequeseutilizaenexperimentos
planificadoseseldenominadoDiseñoCompletoalAzar.En
dondeelObjetodelaexperienciaesunFactorconmásdeun
NiveldeAplicaciónoTratamientos.
Estambién,eltránsitoentreelModelodeRegresiónSimpley
elModeloExperimental,puescomodeverá,elANDEVAse
puederealizarconlarutinadeRegresióndelaHE.
AuncuandoLosModeloutilizadosenlaExperimentación
planificadasonunrefinamientodelModelodeRegresión
tienen,almenos,unaformatradicionaldeserpresentados
querequiereunpocodediscusión.

35
El Modelo Linealbásico para los experimentos se define como: ijiij ETyy ..
Seusaindicarlaobservaciónconlanotacióny
ijparahacerverquedebe
considerarsecomounarepeticiónjdentrodeltratamientoi.
LaexpresiónT
iindicaelefectodeunFactordentrodelmodelo.Peroen
este,seincluyeunaRegresiónPolinomialdegradot–1,dondetesnúmero
denivelesdelfactoroTratamientos.
YlaexpresiónE
ijindicaquelaaproximaciónquesehacemedianteel
ModeloExperimentalaunavariablealeatoria,nopodráserexacta,pues
hayfuentesdevariacióninherentesalaunidadexperimentadaijqueno
podránserexplicadasporelModelousadoenlaaproximación.
El Modelo Lineal en Experimentos Planificados.

36
Unaempresaquefabricaestructurasdeláminagalvanizada,quiere
incursionarenestructuraspreformadasparatejados.
Eldepartamentodecontroldelacalidadestáefectuandopruebasde
resistenciatratandodeubicarelpuntoóptimodecarbonoagregadoa
lacoladadelhierro.
Unodelosensayosproporcionólosresultadosmostradosenelcuadro
comounidadesderesistenciaalatensión.Repetición 0,1 0,2 0,3
1 25 40 34
2 28 31 37
3 25 27 37
4 22 40 39
5 23 43 32
6 31 35 38
Sumas T 154 216 217
Porcentaje de carbono

37
SonpocosloscálculosparallevaracabounAnálisisdela
Varianzapasoapasodelamaneratradicionaladaptadaalas
facilidadesdelaHE.Loprimeroaconsiderarson:
Lacantidaddetratamientosonivelesdelfactor:t=3
Lasvecesqueserepitecadatratamiento:r=6
LaSumadeCuadradosdelTotal:
LaSumadeCuadradosdelTratamientosodelFactor:
434,1111_
6
1.302,3333131
2





r
St
SCT
T    712,277841,89871631
2

Y
SrtSCY
El ANDEVA Suma de cuados Total y de Tratamientos.

38
ElCuadradoMediodeTratamientos:217,0556
6
3333,320.1
1
2



r
S
t
SCT
CMT
T
LaSumadeCuadradosdelErrorseobtienepordiferencia:278,1667434,1111-712,2778  SCTSCYSCE
ElCuadradoMediodelError:
ElCocientedeF.11,7046
5444,18
0556,217

CME
CMT
Fc
18,5444
318
278,1667





tn
SCE
CME
El ANDEVA Cuadrado Medio de Tratamientos, del Error; F calculada.

39
FinalmentedevaloralaFcalculadamediantelarutinadelaHE:
ConloqueseconcluyeelANDEVA.
Elresultadoindicaquelaprobabilidaddequelasdiferenciasdela
resistenciaalatensióndelasestructurasdemetalsedebanalazaresde
0,000900,09%,oniveldesignificación.
Sepuedeinterpretarconsiderandoelniveldeconfianzadiciendo:
Seconcluyequeelporcentajedecarbónagregadoalmetalproduce
estructurasdedediferentedurezaconunaconfiabilidadde99,91%


11,7046
0
0,0009;15) ,7046;2DISTR.F(11=15) 2; ;7046,11(15) 2; ;( dxfFcF

40
LaHEproporcionaunarutinaparaelcálculodel
ANDEVAparaunFactorconlasiguientesalida.Análisis de varianza de un factor
RESUMEN
Grupos Cuenta Suma PromedioVarianza
0,1 6 15425,666666711,06666667
0,2 6 216 36 37,6
0,3 6 21736,16666676,966666667
ANÁLISIS DE VARIANZA
Fuente de Suma deGrados deCuadradosCocinete deProbabilidad
Variación CuadradosLibertadMedios F. CalculadaSignificanteP( 0,05)P(0,01)
Entre grupos 434,1111 2217,0556 11,7046 0,0009 3,6823 6,3588
Dentro de los grupos278,1667 15 18,5444
Total 712,2778 17
Límites Significantes
Quedaelproblemadedecidir¿cuálniveldecarbónesel
adecuado?

41
ElModelodeladiapositiva35puedeescribirse:
YlasSumasdeCuadradoscomo:
EndondeX1=[-1;0;1]yX2=[1;-2;1],polinomios
mínimostransformadosdelosnivelesdelostratamientos
paraefectuarunanálisisqueseconocePorContrastes
Ortogonales.
  SCEXrbXrbSCTyy
t
i
r
j
t
i
i
t
i
iij 






 
 11 1
22
2
1
22
1
2
21
ijiii EXbXbyy  21..ˆ
21
Endonde:
ijiii
EXbXbT  21
21

42
LosTratamientosaplicadoson:0,10,0,20y0,30porcientodecarbono.
Paraobtenerunpolinomiomínimodebebuscarselacantidad:ttX
ii
1
TalquelasumadeX1
i=0ylasumade(X1
i)
2
seamínima.Paraesto,se
tienequeencontrarelescalarquehagamínimoalpolinomio:
Estascantidadesson:   
























 1;2;1
3
2
1;
3
2
0;
3
2
13__1_;0_;110;0;10,0
10,0
1
y
ParaX1
iyX2
irespectivamente.

43
Cuandoseaplicanlospolinomiosalospromediosdelostratamientosse
efectúanlossiguientescontrastesocomparaciones:
Enelgráficoseobservaelmodelo
deregresiónsignificativo.
Esevidentequeladurezaaumenta
amedidaqueseaumentael
contenidodecarbónenlacolada,
perohastaciertoniveluóptimo.
Ésteserádeducidomásadelante.0,0 5,0 10,015,020,025,030,035,040,0
Dureza
0,1
0,2
0,3
Niveles de Carbón
Promedios Sinificativos Suma de S.Cuadrados S.Cuadrdos Cociente Probabilidad Coeficentes
Contraste 25,6667 36,0000 36,1667 Yi * Xij X Contraste F F Regresión
T1 vs T2 -1 0 1 10,50 2 330,7500 17,8355 0,0007 5,2500
2(T2) vs T1+T2 1 -2 1 -10,17 6 103,3611 5,5737 0,0322 -1,6944
Promedios de Tratamientos

44
Paraobtenerloscoeficientesderegresióndeloscontrastessearreglanlos
datossegúnlorequiereelmodelodediapositiva41ysolicitamosenlaHEla
RegresiónparaobtenerelANDEVA:Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple0,7807
Coeficiente de determinación R^20,6095
R^2 ajustado 0,5574
Error típico 4,3063
Observaciones 18
ANÁLISIS DE VARIANZA
Fuente de Grados deSuma de CuadradosCocinete deProbabilidad
Variación LibertadCuadrados Medios F. CalculadaSignificanteP( 0,05)P(0,01)
Regresión 2 434,1111217,0556 11,7046 0,0009 3,6823 6,3588
Residuos 15 278,166718,5444
Total 17 712,2778
CoeficientesError típicoEstadístico tProbabilidadInferior 95%Superior 95%
Intercepción 32,6111 1,015032,1288 0,000030,447734,7746
X1 5,2500 1,2431 4,2232 0,0007 2,6003 7,8997
X2 -1,6944 0,7177-2,3609 0,0322-3,2242-0,1647
Límites Significantes

45
Elmodelosignificativodelosvaloressintransformaes: 
2
ii
T508,3333T255,83335,1667 
ij
y
Usandoelcriteriodelasegundaderivadaesposibleencontrarunóptimo
mediante: 
25,0
508,333-2
255,8333
2
2
1





b
b
To
Porcientodecarbonoconloqueseestimaunresistenciade: 37,4_25,0508,33330,25255,83335,1667
2

ij
y

46
Parapresentarlosresultadoses
suficienteungráfico,eneste
casoquemuestrequeYesuna
variablecontinua.Indicando
además los resultados
determinantes.Grafico Significativo
20,0
22,0
24,0
26,0
28,0
30,0
32,0
34,0
36,0
38,0
40,0
0,100,120,140,160,180,200,220,240,260,280,30
Resistencia a la tensión
% de Carbono
Resistencia
Máxim a 37,4
5,17+2,558X-508,3X²
Esimportanteusarelgráficoapropiadoaltipodevariableyanálisis.En
estecaso,sebuscaquelaresistenciaalatensiónseamáxima.Elgráfico
haceevidentequelatensiónaumentaamedidaqueseleagregacarbonoa
lacoladahastallegara0,25%dedondeempiezaadisminuir.Unposible
siguienteensayopartirádeestepuntocentralexplorandohaciaarribay
abajocantidadesmáspróximashastaqueelresultadoseconsolide.

47
Marte 2004

48
Posiblemente,elModeloLinealmásutilizadoenla
ExperimentaciónPlanificadaeselesquemaenelqueunodelos
FactoresesOperativoyelotro,obviamenteObjetodela
Experimentación.EsteesquemaseconocecomoDiseñoen
BloquesCompletamentealAzar,reminiscenciasdelpasado
agrícoladelmodelo,enelqueelbloquecorrespondíaauna
parceladetierraconcaracterísticasdiferenciadas.Ahora
podríaasociarseelnombredeBloqueconlafunciónque
desempeña:unafuentedevariaciónhomogéneaasuinteriory
heterogéneaconotrasdelamismanaturaleza,que
regularmentenointeresaanalizarperoquesinestanopodría
realizarseelensayo,además,podríaafectarelresultado.

49
ElModeloLinealparaexperimentoscondosFactoresse
definecomo:ijjiij EBTyy ..
Unaecuaciónampliadadelmodelocompletoalazarenel
factorB
jrepresentantedelosbloques.Usualmente,la
inclusióndeunfactorreducelacantidaddelosefectosno
explicadosdelerror.Estodetraduceendiseñosmás
eficientes.
Ladiferenciaconelprocesodeldiseñocompletoalazares
quelostratamientosonivelesdelFactorObjetivodeben
asignarsealazaralasrepeticionesdecadabloque.Yes
másconveniente,tenerlamismacantidadderepeticiones
porbloque.

50
Unfabricantequeseiniciaenelmercadodelasbotanasmedianteun
productoinnovadorqueincorporatubérculostropicalesdecamote,ñáme,
dosvariedadesdetiquisqueyyuca.Elproductoseofreceen4tipode
empaques,30,60,120y240gramos.
Lascantidadesqueseagregandecadaproductoessimilar,estoes1/5
paracadaproducto.
Losdueños,solicitaronalaEscueladeIngenieríaAgropecuaria
AdministrativadelInstitutoTecnológicodeCostaRica,seleshicierauna
valoracióndelacalidaddelproducto.
Laprimerapreguntaqueleshizoelestudiantefue:
Sisepuedesaber¿quéporcentajeseagregadecadaproducto?.
Larespuestafue,elmismoparacadaproducto,estoes:el20%.

51
FactorOperativo:
Lapresentación,contodoyqueseempaqueporlasmismas
máquinaspuedeconsiderasecomofactordevariaciónsinelcualno
podríallevarseacabolaexperiencia.
FactorObjetivo:
Elporcentajedecadaproductoenlosenvasescon5nivelesconun
valorde20%paracadaproducto.
ElMétododeAnálisis:
SeusarádiseñodedosFactoresenBloquesAleatorios.
NiveldeConfianza:
El95%ouncoeficientedesignificaciónde5%.
HipótesisNula:
Todoslostratamientossoniguales:Ho;T
i=0.

52
Deacuerdoalobjetivodelaexperiencia,habráuna
composiciónhomogéneadelproductosicadaenvasecontiene
un20%decadaunadelashojuelas.Enotraspalabras,se
esperaaceptarlahipótesisnula.ElModeloLinealquesevaa
usarparavalorarlaexperienciaes:ijjiij EBTyy ..
Endondei=1,2,...,5=tproductos;j=1,2,...,6=brepeticiones
porcadaproductoenlos4tipodeenvases.
Elprocesodeseleccióndelosproductosserealizóadquiriendo
10bolsasparacadaunodelos4tiposdeenvasesenseisdelos
grandessupermercadoselegidosalazarenlazona
metropolitanadelacapita,paraobtenerelpromediodecada
producto.

53
Tradicionalmenteseusauncuadrodedosentradastotalizado
porfactoresllamadoDatosdeCampocomoresumen
informativoyparaefectuarelANDEVA.
Númerodetratamientos: 5=t
NúmerodePresentaciones: 4=b
SumadeCuadradosTotal:   253,408013,33731451
2

Y
SrtSCY Presentación Camote Ñame Tiquisque 1 Tiquisque 2 Yuca Suma
30 20,5 16,8 23,6 19,1 17,9 97,9
60 22,1 18,1 14,9 13 27,7 95,8
120 18,1 15 18,5 23,7 17,7 93,0
240 22,4 24,6 18,9 16,8 19,8 102,5
Suma 83,1 74,5 75,9 72,6 83,1 389,2
P R O D U C T O S

54
SumadeCuadradosdePresentacionesBloques:
SumadeCuadradosdeProductosTratamientos:
SumadeCuadradosdelError:
ResultadosqueseresumenenelcuadrodelANDEVAenla
siguientediapositiva.
9,6280
5
16,0467141
2





t
Sb
SCB
B 
24,4280
4
24,4280151
2





b
St
SCT
T 219,352024,4280-9,6280-4080.532  SCTSCBSCYSCE

55
DeacuerdoalosresultadosdelANDEVAseconcluyequenohayevidencias
paradeclarardiferenciasentrepresentacionesoentretratamientos.
Noobstante,hayqueestarcompletamentesegurosqueenpresentacioneso
entratamientoshayalgúnefectoescondido.Paraestoseconsiderael
ModeloLinealcompleto:ijjiiijjjij
ETbTbTbTbbBbBbyy 
4
7
3
6
2
5
1
4
3
3
2
2
1
1
..ˆ
EnelqueByTsonlospolinomiosortogonalesparapresentacionesy
tratamientos.ANDEVA de Bloques Aleatorios.
Fuente de Grados de Suma de Cuadrados Cocinete de Probabilidad
Variación Libertad Cuadrados Medios F. CalculadaSignificante P( 0,05) P(0,01)
Total 19 253,4080
Presentaciones 3 9,6280 3,2093 0,1756 0,9109 3,4903 5,9525
Productos 4 24,4280 6,1070 0,3341 0,8498
Error 12 219,3520 18,2793
Límites Significantes

56
Para el Contraste lineal de Envases: 


r
i
i
Bbvs
1
22
1
1,21001000,1100240120__6030
Para el Contraste Cuadrático de Envases: 


r
i
i
Bbvs
1
22
2
6,7280200,580012060__24030
Para el Contraste Cúbico de Envases: 


r
i
i
Bbvs
1
22
3
1,69000010,130024060__12030
La suma de cuadrados de los contrastes es igual a la suma de cuadrados
de los Envases, Presentaciones o Bloques:9,62806900,17280,62100,1 
Procediendo de la misma forma para Tratamientos se llega al ANDEVA
de la siguiente diapositiva:

57ANÁLISIS DE VARIANZA
Fuente de Grados deSuma deCuadradosCocinete deProbabilidad
Variación LibertadCuadrados MediosF. CalculadaSignificanteP( 0,05)P(0,01)
Regresión 7 34,056 4,8651 0,2662 0,9559 2,9134 4,6395
Empaques 3 9,6280 3,2093 0,1756 0,9109 3,4903 5,9525
1 1,2100 4,8651 0,2662 1,9559 4,7472 9,3303
1 6,7280 6,7280 0,3681 0,5554 4,7472 9,3303
1 1,6900 4,8651 0,2662 2,9559 4,7472 9,3303
Prodictos 4 24,4280 6,1070 0,3341 0,8498 3,2592 5,4119
1 0,09025 4,8651 0,2662 3,9559 4,7472 9,3303
1 20,040220,0402 1,0963 0,3157 4,7472 9,3303
1 0,3610 4,8651 0,2662 4,9559 4,7472 9,3303
1 3,9366 3,9366 0,2154 0,6509 4,7472 9,3303
Residuos 12219,352018,2793
Total 19253,4080
CoeficientesError típicoEstadístico tProbabilidadInferior 95%Superior 95%
Intercepción 19,4600 0,956020,3553 0,000017,377021,5430
B1 0,1100 0,4275 0,2573 0,8013-0,8215 1,0415
B2 0,5800 0,9560 0,6067 0,5554-1,5030 2,6630
B3 0,1300 0,4275 0,3041 0,7663-0,8015 1,0615
T1 -0,0475 0,6760-0,0703 0,9451-1,5204 1,4254
T2 0,5982 0,5713 1,0471 0,3157-0,6466 1,8430
T3 0,0950 0,6760 0,1405 0,8906-1,3779 1,5679
T4 0,1186 0,2555 0,4641 0,6509-0,4381 0,6753
Límites Significantes

58
ENelANDEVAparaelModeloCompletonoindicódiferencias
importantesparalosfactores.Portanto,debeconcluirsequeel
porcentajedehojuelasdecadamateriaprimaenelproductoterminado
eslamisma,de20%o1/5.
Dostécnicasadicionalessepuedenutilizar:
ElANDEVAsolicitadodirectamentealaHEcomo:Herramientas/
Análisisdedatos/Análisisdelavarianzaparadosfactoresconuna
repeticiónporgrupo.Cuyoresultadoes:
Entodocaso,seaceptalahipótesisnula.ANÁLISIS DE VARIANZA
Fuente de Suma de Grados de Cuadrados Cocinete de Probabilidad
Variación Cuadrados Libertad Medios F. Calculada Significante P( 0,05) P(0,01)
Filas 9,6280 3 3,2093 0,1756 0,9109 3,4903 5,9525
Columnas 24,4280 4 6,1070 0,3341 0,8498 3,2592 5,9525
Error 219,3520 12 18,2793
Total 253,4080 19
Límites Significantes

59
LasegundatécnicaconsisteenelaborarunANDEVAconel
modelocompletosinpromediarpormuestra.Conmás
observacionesseaumentalaconfiabilidaddelas
conclusiones.ComosepuedecorroborarenlaHE.
Esconvenientemencionarqueunaalternativaapropiada
paravalorarlahipótesisesanalizarlasdiferenciadelos
porcentajesconladistribuciónbinomialmediantela
comparacióndelasfrecuenciasobservadasconlas
frecuenciasesperadas.
Tambiénesconvenienteindicaralestudiante,que
situacionesdecontroldecalidadpuedenanalizarse
mediantelascartasdecontrol.VerControldelacalidad.

60

61
El Modelo Linealpara Técnicas de Muestreopuede
esquematizarse mediante: ijiij
EGyy ..
En donde G
irebresenta un efecto del agrupamiento, sea:
En muestreos Estratificados;
En muestreos por Conglomerados;
O en muestreos de Razón y Regresión.

62
Unaempresaquevendesemendetorosmantieneunproyecto
permanentedevaloracióndelafertilidaddelproducto.Al
menosdosvecesalañoofreceaunauniversidaduntrabajo
parapasantesdeveterinariaconelobjetodequerealicenel
estudio.Esteconsisteentomarnnúmerodetorosenrfincasy
delosregistrosdevida,localizarlasvacasquesehayan
inseminadoenlosúltimosseismesescalificandolapreñezcon
lapalpaciónexitosadelproducto.
ElAnálisissehaceconunniveldeconfianzade95%.Se
espera,quenohayadiferenciasportoroyunafertilidad
superiora62%.

63
LosdatossepuedenclasificarporFincayporToro,interesael
ordenamientoportorotalcomosemuestraenelsiguiente
cuadro:Nº 1 2 3 4 5 6 7 8 9
1 42,34 39,41 74,48 28,11 74,65 28,74 31,62 63,16 83,62
2 86,49 70,80 67,68 83,61 60,84 69,43 50,76 67,73 48,92
3 70,07 74,77 62,03 30,10 66,46 54,90 60,23 86,74 30,47
4 34,72 38,35 77,48 82,88 86,55 76,57 80,38 34,50 40,23
5 53,43 62,20 76,68 50,72 90,18 69,05 62,71 28,20 87,49
6 48,07 76,05 86,21 58,64 62,78 75,74 80,84 54,21 43,76
7 83,23 38,40 33,32 32,88 36,60 87,31 41,96 47,84 58,28
8 37,47 58,88 59,18 60,73 77,09 69,92 52,99 84,41 42,34
9 80,23 31,29 75,07 62,19 75,43 89,43 69,88 40,87 44,40
10 61,15 43,19 70,37 30,86 55,71 43,47 73,88 55,84 82,86
11 33,98 46,10 53,94 45,67 49,47 42,80 56,48 88,58 81,60
12 54,75 79,03 88,91 91,42 56,01 75,79 85,84 54,28 82,48
13 63,94 48,14 81,17 59,49 35,30 78,93 50,76
14 84,71 62,05 64,14 80,82 75,57 48,31 36,18
15 76,09 46,98 44,09 82,35 65,45 58,53
16 40,01 92,55 62,25 91,92
17 46,70 44,84 62,03
18 63,48 71,04 50,59
19 94,68 45,39
20 93,99 58,37
21 65,77 97,47
22 34,88
23 61,59
24 82,45
25 40,80
T O R O S

64
Enestudiosdepoblacionespormuestreosiemprees
importantemostrarlasestadísticasdescriptivasdela
poblaciónolosgrupos,seesperenonodiferenciasentre
ellos.Semuestranlavarianzayeltotalennegrillasporel
interésquetienenenelcálculodelANDEVApasoapaso.Estadístico Toro 1 Toro 2 Toro 3 Toro 4 Toro 5 Toro 6 Toro 7 Toro 8 Toro 9
Media 58,94 60,88 67,65 58,70 64,47 65,26 62,30 59,79 60,24
Error típico 4,2608 4,2874 3,9664 5,6780 4,4940 5,4305 4,7907 3,6977 5,2791
Mediana 57,95 62,05 70,37 59,49 64,62 69,675 61,47 58,37 54,52
Moda ---- ---- ---- ---- ---- ---- ---- ---- ----
Desviación estándar 18,0770 19,6475 15,3617 21,9906 16,8150 18,8119 16,5953 18,4887 21,1164
Varianza de la muestra326,7779386,0252235,9827483,5880282,7451353,8894275,4049341,8320445,9041
Curtosis -1,3671 -1,0158 0,4070 -1,3971 -0,5807 -0,3971 -0,6329 -0,6034 -1,6459
Coeficiente de asimetría0,1607 0,3256 -0,8193 -0,0369 -0,3342 -0,6995 -0,2985 0,3366 0,2614
Rango 52,51 63,39 55,59 63,31 54,88 60,69 54,22 69,27 61,45
Mínimo 33,98 31,29 33,32 28,11 35,3 28,74 31,62 28,2 30,47
Máximo 86,49 94,68 88,91 91,42 90,18 89,43 85,84 97,47 91,92
Suma 1060,86 1278,51 1014,75 880,47 902,64 783,15 747,57 1494,87 963,84
Cuenta 18 21 15 15 14 12 12 25 16
Tags