Banesco Basico DataStage DIA 02 datastage chapter 2

ssuser6df8c1 0 views 115 slides Sep 16, 2025
Slide 1
Slide 1 of 115
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64
Slide 65
65
Slide 66
66
Slide 67
67
Slide 68
68
Slide 69
69
Slide 70
70
Slide 71
71
Slide 72
72
Slide 73
73
Slide 74
74
Slide 75
75
Slide 76
76
Slide 77
77
Slide 78
78
Slide 79
79
Slide 80
80
Slide 81
81
Slide 82
82
Slide 83
83
Slide 84
84
Slide 85
85
Slide 86
86
Slide 87
87
Slide 88
88
Slide 89
89
Slide 90
90
Slide 91
91
Slide 92
92
Slide 93
93
Slide 94
94
Slide 95
95
Slide 96
96
Slide 97
97
Slide 98
98
Slide 99
99
Slide 100
100
Slide 101
101
Slide 102
102
Slide 103
103
Slide 104
104
Slide 105
105
Slide 106
106
Slide 107
107
Slide 108
108
Slide 109
109
Slide 110
110
Slide 111
111
Slide 112
112
Slide 113
113
Slide 114
114
Slide 115
115

About This Presentation

chapter 2.1 datasgate


Slide Content

© 2019 IBM Corporation
BÁSICO DE PARALLEL JOBS
DIA 02

© 2019 IBM Corporation2
Agenda DataStageDia 02
•Selección y Filtros de Datos
•Stages: Switch, RemoveDuplicates, Filter, Modify, PivotEmpresarial.
•Clasificación
•Stage: Sort
•Funciones Dinámicas sobre Columnas
•Stage: Aggregator.
•Transformaciones
•Stage: Transformer
•Invocacion de Funciones
Parte 2

© 2019 IBM Corporation3
SELECCIÓN Y FILTRO DE DATOS
Switchstage

© 2019 IBM Corporation4
Switch Stage
•The Switch stage is a processing stage that takes a single data
set as input and assigns each input row to an output data set
based on the value of a selector field
•Single input link ; 128 Output links
•Rowsthatsatisfynoneofthecases are output ontherejectlink
•OnPropertiesTab, youcan perform:
✓User-definedMapping
✓Auto
✓Hash

© 2019 IBM Corporation5
Switch Stage

© 2019 IBM Corporation6
Propiedades

© 2019 IBM Corporation7
Salida varias con Rechazo

© 2019 IBM Corporation8
SELECCIÓN Y FILTRO DE DATOS
RemoveDuplicatestage

© 2019 IBM Corporation9
Removiendo Duplicados

© 2019 IBM Corporation10
Stage Remover Duplicados

© 2019 IBM Corporation11
Propiedades Stage Remover Duplicados

© 2019 IBM Corporation12
SELECCIÓN Y FILTRO DE DATOS
Filterstage

© 2019 IBM Corporation13
•This stage transfers, unmodified, the records of the input data set
which satisfy the specified requirements and filters out all other
records
•Single input link ; AnynumberOutput links; Onlyonereject
•OnPropertiesTab, youcan performpredicates:
✓Where(conditional)
✓Output Link
•Options:
✓Outputs reject
✓Output RowOnlyOnce
Filter Stage

© 2019 IBM Corporation14
Filtro con dos condiciones

© 2019 IBM Corporation15
Filtro con dos condiciones y un rechazo

© 2019 IBM Corporation16
Propiedades del Filtro

© 2019 IBM Corporation17
Salidas definidas con sus columnas

© 2019 IBM Corporation18
SELECCIÓN Y FILTRO DE DATOS
Modifystage

© 2019 IBM Corporation19
•The Modify stage alters the record schema of its input data set.
The modified data set is then output
•Single input link ; Single Output link
•OnPropertiesTab, youcan perform:
✓DROP columnname
✓KEEP columnname
✓Change typeofcolumnonnew column
✓Change nullcolumnwithhandle_null(column)

© 2019 IBM Corporation20
Stage Modificar

© 2019 IBM Corporation21
Indicar columnas en DROP o KEEP
DROP
COLUMN

© 2019 IBM Corporation22
En la Salida ya no ven la columna

© 2019 IBM Corporation23
SELECCIÓN Y FILTRO DE DATOS
PivotEnterprise Stage

© 2019 IBM Corporation24
Pivot Enterprise Stage
•Properties:
✓Pivot Type = Vertical
•Single input link ; Single Output link
•Verticalpivotingmapsasetofrowsintheinputdatatosingleor
multipleoutputcolumns.Thearraysizedeterminesthenumberof
rowsintheoutputdata.Theoutputdataoftheverticalpivot
actiontypicallyhasmorecolumns,butfewerrowsthantheinput
data
OR
•Properties:
•Pivot Type = Horizontal
•Single input link ; Single Output link
•Horizontalpivotingmapsasetofcolumnsinaninputrowtoa
singlecolumninmultipleoutputrows.Theoutputdataofthe
horizontalpivotactiontypicallyhasfewercolumns,butmorerows
thantheinputdata.Withverticalpivoting,youcanmapseveral
setsofinputcolumnstoseveraloutputcolumns

© 2019 IBM Corporation25
Pivot Enterprise

© 2019 IBM Corporation26
Pivote Vertical Datos de Entrada

© 2019 IBM Corporation27
Columnas Entrada Pivote Vertical
Solo de lectura

© 2019 IBM Corporation28
Columnas de la salida deseada

© 2019 IBM Corporation29
Mapping

© 2019 IBM Corporation30
Salida mostrada con Stage Peak

© 2019 IBM Corporation31
Pivote Horizontal Datos de Entrada

© 2019 IBM Corporation32
Pivote Vertical Datos de Entrada
Columnas Entrada Pivote Horizontal

© 2019 IBM Corporation33
Columnas Entrada Pivote Horizontal
Solo de lectura

© 2019 IBM Corporation34
Columnas de la salida deseada

© 2019 IBM Corporation35
Mapping

© 2019 IBM Corporation36
Salida mostrada con Stage Sequencial File

© 2019 IBM Corporation37
CLASIFICACION
Sortstage

© 2019 IBM Corporation38
Clasificando Datos

© 2019 IBM Corporation39
Alternativas Para Clasificación

© 2019 IBM Corporation40
Clasificación In-Stage

© 2019 IBM Corporation41
Ejemplo de Stable Sort

© 2019 IBM Corporation42
Stage Sort Tab Properties

© 2019 IBM Corporation43
Especificando Claves de Clasificación

© 2019 IBM Corporation44
Opciones de Clasificación

© 2019 IBM Corporation45
Crear Cambio en Columna Clave

© 2019 IBM Corporation46
Partitions Sort

© 2019 IBM Corporation47
CLASIFICACION
Aggregatorstage

© 2019 IBM Corporation48
Stage Aggregator

© 2019 IBM Corporation49
Ejemplo de Stage Aggregator

© 2019 IBM Corporation50
Tipos de Agregaciones

© 2019 IBM Corporation51
Tipo de Agrgación Conteo de Filas

© 2019 IBM Corporation52
Salida Tab Mapping

© 2019 IBM Corporation53
Salida Columns Tab

© 2019 IBM Corporation54
Tipos de Cálculo de Agregación

© 2019 IBM Corporation55
Métodos de Agrupación

© 2019 IBM Corporation56
Método = Hash

© 2019 IBM Corporation57
Método = Sort

© 2019 IBM Corporation58
TRANSFORMACIONES
Transformerstage

© 2019 IBM Corporation59
Stage Transformer

© 2019 IBM Corporation60
Ejemplo de Stage Transformer

© 2019 IBM Corporation61
Dentro del Stage Transformer

© 2019 IBM Corporation62
Elementos del Stage Transformer

© 2019 IBM Corporation63
Elementos del Stage Transformer (continuación)

© 2019 IBM Corporation64
Constraints

© 2019 IBM Corporation65
Constraints

© 2019 IBM Corporation66
Ejemplo de Constraints

© 2019 IBM Corporation67
Definiendo un constraint

© 2019 IBM Corporation68
Usando el editor de Expresiones

© 2019 IBM Corporation69
Otherwise links para integridad de data

© 2019 IBM Corporation70
Ejemplo Otherwise Link

© 2019 IBM Corporation71
Especificando el ordenamiento del link

© 2019 IBM Corporation72
Especificar el Link Otherwise

© 2019 IBM Corporation73
Agenda DataStage
•Trabajando con Datos Relacionales
•Fuentes Base de Datos
•Mejores prácticas en DataStage
•Nomenclatura de Jobs y Stages
•Nomenclatura de Links
•Volúmenes de Proceso en StagesLookupy Join
•Consideraciones de Performance
Parte 1

© 2019 IBM Corporation74
TRABAJANDO DATOS RELACIONALES
Connectores(Stages)

© 2019 IBM Corporation75
Especificar el Link Otherwise
Importar definiciones de tablas de BD

© 2019 IBM Corporation76
Importando definiciones de tablas

© 2019 IBM Corporation77
Orquestar importacion

© 2019 IBM Corporation78
ODBC Importacion

© 2019 IBM Corporation79
Especificar el Link Otherwise
Stages Connector

© 2019 IBM Corporation80
Stages Connector

© 2019 IBM Corporation81
Leyendo desde tablas de bases de datos

© 2019 IBM Corporation82
Stage Connector GUI

© 2019 IBM Corporation83
Panel Navegación

© 2019 IBM Corporation84
Propiedades Conexiones

© 2019 IBM Corporation85
Propiedades de Uso –Generar SQL

© 2019 IBM Corporation86
Propiedades de Uso -Transacciones

© 2019 IBM Corporation87
Propiedades de Uso –antes/después SQL

© 2019 IBM Corporation88
Escribiendo a tablas de bases de datos

© 2019 IBM Corporation89
DB2 Connector GUI

© 2019 IBM Corporation90
Propiedades Conector Write

© 2019 IBM Corporation91
MEJORES PRACTICAS EN DATASTAGE
Nomenclatura de Jobs y Stages

© 2019 IBM Corporation92
Estructura de Proyecto

© 2019 IBM Corporation93
Estructura de Proyecto

© 2019 IBM Corporation94
Nomenclatura de Jobs

© 2019 IBM Corporation95
Nomenclatura de Jobs, continuación

© 2019 IBM Corporation96
Nomenclatura de Stages

© 2019 IBM Corporation97
Nomenclatura de Stages, continuación

© 2019 IBM Corporation98
Nomenclatura de Stages, continuación

© 2019 IBM Corporation99
Nomenclatura de Stages, continuación

© 2019 IBM Corporation100
MEJORES PRACTICAS EN DATASTAGE
Nomenclatura de Links

© 2019 IBM Corporation101
Nomenclatura de Links

© 2019 IBM Corporation102
MEJORES PRACTICAS EN DATASTAGE
Volúmenes de Proceso en StagesLookupy Join

© 2019 IBM Corporation103
Volúmenes de Proceso en Stages Lookup y Join

© 2019 IBM Corporation104
MEJORES PRACTICAS EN DATASTAGE
Consideraciones de Performance

© 2019 IBM Corporation105
Consideraciones de Performance

© 2019 IBM Corporation106
Consideraciones de Performance

© 2019 IBM Corporation107
Consideraciones de Performance

© 2019 IBM Corporation108
Consideraciones de Performance

© 2019 IBM Corporation109
Consideraciones de Performance

© 2019 IBM Corporation110
Consideraciones de Performance

© 2019 IBM Corporation111
Consideraciones de Performance

© 2019 IBM Corporation112
Consideraciones de Performance
Por cada partición

© 2019 IBM Corporation113
MEJORES PRACTICAS
Referencias

© 2019 IBM Corporation114
Referencias
Consideren la recomendaciones sobre los stagesque se mencionan
en el siguiente RedBook:
InfoSphereDataStage Parallel Framework
Standard Practices
Bajénlode éstelink:
http://www.redbooks.ibm.com/redbooks/pdfs/sg247830.pdf

© 2019 IBM Corporation115
Gracias.
Tags