Analizador léxico

ANALIZADOR
LÉXICO
L.C.C. Yesenia Perez Reyes

Proceso de Compilación
L.C.C. Yesenia Perez Reyes

El proceso de compilación se
divide en la fase de:
1.Front_End
2.Back_End
oEstas 2 fases se divide en 6 etapas
para la compilación
L.C.C. Yesenia Perez Reyes

Proceso de Compilación
L.C.C. Yesenia Perez Reyes

Análisis léxico (scanner): es la
primera etapa de un programa
traductor.
L.C.C. Yesenia Perez Reyes

Es, por otra parte, el único que
gestiona el fichero de entrada.
L.C.C. Yesenia Perez Reyes

Es la parte del compilador que
lee la secuencia de caracteres
del programa fuente, carácter a
carácter, y los agrupa para
formar unidades con significado
propio, los componentes léxicos
(tokens en ingles) que serán
posteriormente utilizados por el
analizador sintáctico como
entradas.
L.C.C. Yesenia Perez Reyes

Existen 2 tipos de Tokens
Tiras especificas:
Palabras reservadas : if, while,
do, . . .
operadores: = * + - / == > < & !
= . . .
Tiras no especificas:
Identificadores, constantes,etc.
L.C.C. Yesenia Perez Reyes

El analizador léxico opera bajo
petición del analizador sintáctico
devolviendo un componente
léxico conforme el analizador
sintáctico lo va necesitando
para avanzar en la gramática.
L.C.C. Yesenia Perez Reyes

Para realizar esta tarea se
concentra solamente en la
estructura y no en otros
aspectos menos importantes,
como los espacios en blanco o
tabuladores, los cambios de
línea, los comentarios, etc.
L.C.C. Yesenia Perez Reyes

L.C.C. Yesenia Perez Reyes
Cuando recibe la orden obtén el
siguiente componente léxico, el
analizador léxico lee los caracteres
de entrada hasta ídenticar el
siguiente componente léxico.

El procesamiento de los
caracteres se deja en manos del
analizador léxico que entregará
a las sucesivas etapas del
compilador los componentes
léxicos (tokens) significativos.
6-2*30/7
6 - 2* 30/7
8-2*3/5
L.C.C. Yesenia Perez Reyes

representadas por el analizador
léxico como la siguiente cadena
de elementos léxicos:
<entero,6> <resta,-> <entero,2>
<por,*> <entero,30> <div,/>
<entero,7>
L.C.C. Yesenia Perez Reyes

donde cada token ha sido
representado por un par en el
que la primera componente
de cada par es el tipo de
token y la segunda
componente es el lexema (el
valor concreto de ese token).
L.C.C. Yesenia Perez Reyes

La tercera cadena del ejemplo
anterior tendría la misma
estructura que las otras dos,
pero con distintos valores de
los lexemas.
L.C.C. Yesenia Perez Reyes

el análisis léxico agrupará los
caracteres de la entrada por
categorías léxicas,
establecidas por la
especificación léxica del
lenguaje fuente como
veremos más adelante.
L.C.C. Yesenia Perez Reyes

Esta especificación también
establecerá el alfabeto con el que
se escriben los programas válidos
en el lenguaje fuente y, por tanto,
el analizador léxico también
deberá rechazar cualquier texto
en el que aparezcan caracteres
ilegales (no recogidos en ese
alfabeto) o combinaciones
ilegales (no permitidas por las
especificaciones léxicas) de
caracteres del alfabeto.
L.C.C. Yesenia Perez Reyes

Los componentes léxicos se especifican
mediante expresiones regulares que
generan lenguajes regulares, más
sencillos de reconocer que los lenguajes
independientes del contexto, y permiten
hacer un análisis más rápido.
L.C.C. Yesenia Perez Reyes

Además, una gramática que represente
la sintaxis de un lenguaje de alto nivel
carácter a carácter sería mucho más
compleja (para implementar un proceso
de traducción a partir de ella) que otra
que representase la misma sintaxis en
función de sus componentes léxicos.
L.C.C. Yesenia Perez Reyes

ERRORES LÉXICOS
Pocos son los errores característicos de
esta etapa, pues el compilador tiene
todavía una visión muy local del
programa.
L.C.C. Yesenia Perez Reyes

Por ejemplo, si el analizador léxico
encuentra y aísla la cadena “wihle”
creerá que es un identificador, cuando
posiblemente se tratara de un while mal
escrito y no será él el que informe del
error, sino que lo harán sucesivas etapas
del análisis del texto.
L.C.C. Yesenia Perez Reyes

Errores que detecta el
analizador léxico:
· Utilizar caracteres que no pertenecen al
alfabeto del lenguaje (p.ej.: ‘ñ’ o ‘±’).
· Se encuentra una cadena que no
coincide con ninguno de los patrones de
los tokens posibles (p.ej.: en un lenguaje
‘:=’ puede ser la asignación pero que no
permita ‘:’ solo).
L.C.C. Yesenia Perez Reyes

Cuando el analizador léxico encuentra un
error, lo habitual es parar su ejecución e
informar, pero hay una serie de posibles
acciones por su parte para anotar los errores,
recuperarse de ellos y seguir trabajando:
Ignorar los caracteres no válidos hasta formar
un token según los patrones dados;
Borrar los caracteres extraños;
Insertar un carácter que pudiera faltar;
Reemplazar un carácter presuntamente
incorrecto por uno correcto;
Conmutar las posiciones de dos caracteres
adyacentes.
L.C.C. Yesenia Perez Reyes

FUNCIONAMIENTO
La principal función del analizador léxico
es procesar la cadena de caracteres y
devolver pares
( token , lexema ).
L.C.C. Yesenia Perez Reyes

Operaciones
Pocos son los errores característicos de
esta etapa, pues el compilador tiene
todavía una visión muy local del
programa.
L.C.C. Yesenia Perez Reyes

· Maneja el fichero del programa fuente;
es decir: abrirlo, leer sus caracteres y
cerrarlo. También debería ser capaz de
gestionar posibles errores de lectura.
L.C.C. Yesenia Perez Reyes

· Ignora los comentarios y, en los
lenguajes de formato libre, ignora los
separadores
(espacios en blanco, tabuladores,
retornos de carro, etc.).
L.C.C. Yesenia Perez Reyes

· Cuando se produzca una situación de
error será el analizador léxico el que sitúe
el error
en el programa fuente (tal línea, tal
posición). Lleva la cuenta de las líneas
procesadas.
L.C.C. Yesenia Perez Reyes

· Preproceso de macros, definiciones,
constantes y órdenes de inclusión de
otros ficheros.
L.C.C. Yesenia Perez Reyes

Cada vez que el analizador sintáctico
llame al léxico éste debe leer caracteres
desde donde se quedó en la anterior
llamada hasta conseguir completar un
nuevo token, y en ese momento debe
devolver el par (token , lexema).
L.C.C. Yesenia Perez Reyes

Cuando el analizador léxico intenta
reconocer algunos tipos de tokens como
los identificadores o los números se
produce una circunstancia especial: el
analizador léxico debe leer caracteres
hasta que lea uno que no pertenece a la
categoría del token que está leyendo;
ese último carácter (que no tiene por qué
ser un espacio en blanco) no puede
perderse, y debe devolverse al buffer de
entrada para ser leído en primer lugar la
próxima vez que se llame al analizador
léxico.
L.C.C. Yesenia Perez Reyes

Tokens
desde el punto de vista léxico son los
elementos léxicos del lenguaje mientras que
para el resto de las fases de un compilador
son los símbolos terminales de la gramática
(por ejemplo: palabras reservadas,
identificadores, signos de puntuación,
constantes
numéricas, operadores, cadenas de
caracteres, etc.). Es posible, dependiendo
del lenguaje,
que varios signos formen un solo token (“:=”,
“==”, “+=”, “||”, etc.).
L.C.C. Yesenia Perez Reyes

Patrón
expresión regular que define el conjunto
de cadenas que puede representar a
cada uno de los tokens.
L.C.C. Yesenia Perez Reyes

Lexema:
secuencia de caracteres del código
fuente que concuerda con el patrón de
un token.
Es decir, cuando analizamos el texto
fuente y encontramos una cadena de
caracteres que representa un token
determinado diremos que esa cadena es
su lexema.
L.C.C. Yesenia Perez Reyes

Atributos:
El análisis léxico debe proporcionar
información adicional sobre los tokens
en sus atributos asociados. El número
de atributos depende de cada token.
En la práctica, se puede considerar
que los tokens tienen un único
atributo, un registro que contiene toda
la información propia de cada caso
(por ejemplo, lexema, tipo de token y
línea y columna en la que fue
encontrado). Lo normal es que toda
esa información se entregue a los
analizadores sintáctico y semántico
para que la usen como convenga.
L.C.C. Yesenia Perez Reyes

Analizador léxico

About This Presentation

Slide Content

Tags

Categories

Download

Quick Actions

Statistics

Related Slideshows

Analizador léxico

About This Presentation

Slide Content

Slide 1

Slide 2

Slide 3

Slide 4

Slide 5

Slide 6

Slide 7

Slide 8

Slide 9

Slide 10

Slide 11

Slide 12

Slide 13

Slide 14

Slide 15

Slide 16

Slide 17

Slide 18

Slide 19

Slide 20

Slide 21

Slide 22

Slide 23

Slide 24

Slide 25

Slide 26

Slide 27

Slide 28

Slide 29

Slide 30

Slide 31

Slide 32

Slide 33

Slide 34

Slide 35

Tags

Categories

Download

Quick Actions

Statistics

Related Slideshows

Pray For The Peace Of Jerusalem and You Will Prosper

Don_t_Waste_Your_Life_God.....powerpoint

VILLASUR_FACTORS_TO_CONSIDER_IN_PLATING_SALAD_10-13.pdf

Fertility awareness methods for women in the society

Chapter 5 Arithmetic Functions Computer Organisation and Architecture

syakira bhasa inggris (1) (1).pptx.......