Clase 9 - Limitaciones de las LLM y técnicas avanzadas.pdfff
BenjaminContrerasLey
0 views
56 slides
Oct 03, 2025
Slide 1 of 56
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
About This Presentation
informatica
Size: 4.4 MB
Language: es
Added: Oct 03, 2025
Slides: 56 pages
Slide Content
Limitaciones de las LLM
MSc. Ing. Gabriel Olmos.
Laboratorio de Robótica y Visión.
Pontificia Universidad Católica de Valparaíso
1
2
Resumen clase anterior
1.Modelos de lenguaje de código abierto y de código cerrado junto con la
cuantización.
LLMLLM
Texto Texto
LLM
Texto Texto
LLMLLM
Texto Texto
LLM
Texto Texto
Comprimir
3
Contenido
1.Introducción.
2.Limitaciones.
3.¿Cómo mitigamos estas limitaciones en los LLM?.
4.Técnicas que mejoran el rendimiento de los LLM.
11
Limitaciones: Información Desactualizada
ElmodelocomercialconocidocomoChatGPTnopuedenresponderaantecedentes
quenofueronpartedesuentrenamiento.
La última actualización de
ChatGPT fue el verano de 2022
13
Limitaciones: Prejuicios y Discriminación
Artículo
Sepublicóunartículodondeexaminólaspreferenciaspolíticasdelosmodelosde
lenguajes.
14
Limitaciones: Falta de Transparencia
Unadelaslimitacionesimportantesdelosmodelosdelenguajegrandes(LLM)esla
faltadetransparencia,quesemanifiestaenvariasformas:
•Complejidaddelmodelo:Estosmodelosaltenerbillonesdeparámetroses
difícilparalosusuarioydesarrolladoresentendercómoelmodelollegaauna
respuestaenespecífico.Adiferenciadesistemasmássimplesconreglasclarasy
definidas,losLLMoperanenbaseapatronescomplejosaprendidosduranteel
entrenamiento,loquecomplicalatrazabilidaddelasdecisiones.
•CajaNegra:Lasrespuestaspuedensermuyútileseimpresionante,pero
¿podemosverporquétomaciertasdecisionesalresponder?
LLM
Texto Texto
15
¿Cómo mitigamos estas limitaciones en las LLM?
ExistentécnicasquepermitenmitigarestaslimitacionesdelosLLMsyframeworksque
integranestastécnicasparamitigarestaslimitaciones,permitiendopotenciar
aplicacionesutilizandolosmodelosdelenguaje.
Prompt
Engineering
Prompt
Engineering
Fine-TuningFine-Tuning RAGRAG AgentesAgentes
1 2 3 4
Memoria
16
Prompt Engineering
17
Conceptos Previos
LLMLLM
Text Text
LLM
Text Text
Primerotenemosquerecordarloqueesunmodelodelenguaje(LLM)pre-entrenado,
conocidoscomobasemodelofoundationalmodel.
Estosmodelostienendistintosparámetrosquepermitemodificarlaaleatoriedada
lasalida,loscualesvamosaveracontinuación.
20
Temperatura
Latemperaturaesunparámetroquepermitecontrolarlaaleatoriedadoelnivelde
creatividaddeunmodelo.
Temperatura = 0 (t=0)
Elmodeloesmásdeterminista.
Temperatura = 0 (t=0)
Elmodeloesmásdeterminista.
Temperatura = 1 (t=1)
Elmodeloesmáscreativo.
Temperatura = 1 (t=1)
Elmodeloesmáscreativo.
Nota:Existenmodelosqueelparámetrovaríaentre0y2.
Enlosmodelosdelenguajeexistenmásparámetrosquepermitencontrolarla
aleatoriedadolasalidadelmodelo,peroesteeselprincipalquesemodifica.
21
Prompt Engineering
DentrodelaventanadecontextoexistenformasdeconfigurarelPrompt,mediante
instruccionesoroles.
•Instrucciones:Sonindicacionesqueseledanalmodeloparadistintospropósitos.
•Roles:Seutilizantokensespecialesparaestablecerunadistinciónclaraentrelosturnos
dediálogo.Porejemplo,seindicacuándoeselusuarioquienestárealizandouna
preguntaycuándoeselmodeloquiendeberesponder.Estemecanismoayudaa
estructurarlasinteraccionesdeformamásorganizadaycoherente.
### Humano: Hola### Humano: Hola
### Asistente: Hola, ¿qué necesitas?### Asistente: Hola, ¿qué necesitas?
### Sistema: Eres un asistente cordial### Sistema: Eres un asistente cordial
### Instrucción: Debes responder siempre
de la siguiente forma:
--Asistente--
Respuesta
--Fin--
### Instrucción: Debes responder siempre
de la siguiente forma:
--Asistente--
Respuesta
--Fin--
ventanadecontexto
22
Prompt Engineering: Zero-Shot
Estosgrandesmodeloslingüísticoshansidoentrenadosenungrancorpusdetextoy
contienenbillonesdeparámetros.Alpedirlealgunatareacomoporejemplode
clasificación,losmodeloslogranunbuenrendimientoyprecisiónalentregarla
respuesta.
Prompt:
Clasifica el texto en neutral, negativo o positivo.
Texto: Creo que las vacaciones están bien.
Sentimiento:
LLM
Respuesta:
Clasifica el texto en neutral, negativo o positivo.
Texto: Creo que las vacaciones están bien.
Sentimiento:Negativo
¿Quépodemoshacersielmodelonolograunbuenrendimientoutilizandozero-shot?
Completion
23
Prompt Engineering: One-Shot
One-shotserefiereadarleunejemploalmodelodeloquebuscamosrealizar.Estos
ejemplosserealizanenlaventanadecontextodelmodelo.
¿QuépodemoshacersielmodelonolograunbuenrendimientoutilizandoOne-Shot?
Prompt: Clasifica el texto en neutral, negativo o positivo.
Texto: Creo que las vacaciones están bien.
Sentimiento: Positivo
Texto: El helado sabe mal.
Sentimiento:
Respuesta: Positivo
Prompt: Clasifica el texto en neutral, negativo o positivo.
Texto: Creo que las vacaciones están bien.
Sentimiento: Positivo
Texto: El helado sabe mal.
Sentimiento:
Respuesta: Positivo
RespuestaIncorrecta
Unejemplo
24
Prompt Engineering: Few-Shot
EltérminoFew-shothacereferenciaaproporcionaralmodeloalgunosejemplos
dentrodelpromptparaguiarloenlatareaquesedesearealizar.Esteenfoque
aprovechalacapacidaddelmodeloparageneralizarapartirdeunospocos
ejemplos,loquepuedeserútilcuandonosecuentaconrecursosparaun
entrenamientomásprofundo.
Prompt: Clasifica el texto en neutral, negativo o positivo.
Texto: Creo que las vacaciones están bien.
Sentimiento: Positivo
Texto: El helado sabe mal.
Sentimiento: Negativo
Texto: El jugo estaba bueno.
Sentimiento
Respuesta: Positivo
Prompt: Clasifica el texto en neutral, negativo o positivo.
Texto: Creo que las vacaciones están bien.
Sentimiento: Positivo
Texto: El helado sabe mal.
Sentimiento: Negativo
Texto: El jugo estaba bueno.
Sentimiento
Respuesta: Positivo
Másejemplo
RespuestaCorrecta
26
Prompt Engineering: Instrucción
Lainstrucciónpermitealinearalmodeloalapreferenciaqueunobusca,es
importantemencionarqueenestaparteesdehartaexperimentaciónyevaluarel
rendimientodelmodelo.
### Sistema: Eres un asistente cordial### Sistema: Eres un asistente cordial
### Instrucción: Debes responder siempre de la
siguiente forma en formato markdown:
--Asistente--
# Título
* Punto 1
* Punto 2
$\frac{}{}$
--Fin--
La respuesta debes entregarla siempre en español.
### Instrucción: Debes responder siempre de la
siguiente forma en formato markdown:
--Asistente--
# Título
* Punto 1
* Punto 2
$\frac{}{}$
--Fin--
La respuesta debes entregarla siempre en español.
Recordemosque
estosiemprevaen
laventanade
contextodelLLM.
Alfinalsevan
concatenandolos
rolesenlaventana
decontexto.
36
Retrieval-Augmented Generation (RAG)
Consulta
Vectorización
Embeddings
Base de Datos Vectorizada
Distancia
Entre
Embeddings
Datos
Recuperados
•Top K (Parámetro)
LLM
Respuesta
•PromptTemplate
•Temperature
•Modelo de Lenguaje (GPT-3.5-turbo)
1
2
3
4 5
•Text-Embedding-ada-002-v2
37
Recapitulación de los LLM
EsimportanterecordarcómoelLLMrecibelosdatos.
38
Proceso de Vectorizar la Base de Datos
Esimportantetenerunaideadecómosevectorizanlosdatos.
Fuente de Información
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
Load
xxxxxxxxxxxxx
xxxxxxxxxxxxx
Transform
[2,1.0,8.12,0.01..]
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxx
[3,1.0,8.12,0.01..]
[2,1.0,8.12,0.01..]
Embeddings Store
Base de Datos
Vectorizada
(Vector Store)
1 2 3 4 5
•csv, md, pdf, txt,
docs, json…
•Metadata •ChunkSize
•ChunkOverlap
•Modelo Embedding
•Batchdel Embedding
39
Troceado de texto (Transform)
ChunkSizeChunkSize
ChunkOverlapChunkOverlap
256
20
44
Agentes
Elagenteesunaentidadoprogramaqueestádiseñadoparatomardecisionesy
realizarunaaccióndadosuentorno.¿CómofuncionaenelcontextodelosLLM?
DecisionesDecisiones
QueryQuery
Acción 1Acción 1
Acción 2Acción 2
Acción nAcción n
Proceso 1Proceso 1
Proceso 2Proceso 2
Proceso nProceso n
46
Agente OpenAI
ElagenteOpenAIsoportalallamadaafunciones(FunctionCalling)permitiendoal
LLMconectarseconherramientasexternas.
DecisionesDecisiones
QueryQuery
Acción 1Acción 1
Acción 2Acción 2
Acción nAcción n
Proceso 1Proceso 1
Proceso 2Proceso 2
Proceso nProceso n
47
Memoria
¿PorquécuandounoutilizaChatGPTrecuerdanuestronombrequeloindicamosen
otroschats?
LLM
### Sistema: Eres un asistente cordial…### Sistema: Eres un asistente cordial…
### Memoria: `Se le ingresa el historial de la conversación
anterior en la ventana de contexto del LLM u otro tipo de
información`
### Memoria: `Se le ingresa el historial de la conversación
anterior en la ventana de contexto del LLM u otro tipo de
información`
Context WindowContext Window
•Conversaciones anteriores.
•Informaciones del usuario.
•Datos importantes
•Conversaciones anteriores.
•Informaciones del usuario.
•Datos importantes
48
¿Por qué ChatGPT recuerda o sigue la
conversación?
49
¿Por qué ChatGPT recuerda o sigue la
conversación?
50
¿Por qué ChatGPT recuerda o sigue la
conversación?
¿Por qué sabe o recuerda mi nombre?
54
WebScrapping
Podemos chatear con la página web
Podemos estructurar los datos de la página web
55
Aplicaciones (RAG)
Base de Datos VectorizadaBase de Datos Vectorizada Base de Datos Vectorizada
LLM
queryquery
ResponseResponse
1. Documentos
56
Resumen de la clase
•Se presentaron las limitaciones que tienen estos modelos de lenguaje.
•Técnicas que permiten mitigar estas limitaciones.
•Se explicó lo que es el Prompt Engineering, Fine-tuning, RAG, Agentes, Memorias y
los frameworksque integran algunas de estas técnicas.