Proyecto Libreria Iztaccihuatl

HarleyAndrsHerreraCa 62 views 10 slides Jul 08, 2021
Slide 1
Slide 1 of 10
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10

About This Presentation

Proyecto - Introducción a la Ciencia de Datos y el Big Data, curso EDX


Slide Content

EDX Curso: Introducción a la Ciencia de Datos y el Big
Data (Tecnológico de Monterrey)

Proyecto individual evaluado por pares
Caso: Utilizando la Ciencia de Datos en una organización,
Librería Iztaccihuatl


Elaborado por: Harley Andrés Herrera Castillo
Colombia, julio 2021

Contenido

Introducción ............................................................................................................. 3
Problema planteado ................................................................................................ 4
Identificación de indicadores ................................................................................... 6
Tipo de análisis y justificación ................................................................................. 7
Propuesta de decisión ............................................................................................. 8
Conclusiones ......................................................................................................... 10

Introducción

A partir de los temas, conceptos y análisis propuestos a lo largo del curso
Introducción a la Ciencia de Datos y el Big Data, a continuación, se presenta un
proyecto basado en una situación, en la cual se pondrán en práctica los
conocimientos adquiridos.
De acuerdo a la situación planteada de la Librería Iztaccihuatl, se desea obtener a
partir de los datos disponibles una serie de indicadores de desempeño (KPI’s) que
permitan establecer una estrategia para la toma de decisiones organizacionales, en
este sentido, es importante comprender los datos que a priori han sido dispuestos
para facilitar la comprensión del negocio, lo que permitirá formular las acciones
recomendables para la librería.

Problema planteado

La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha
decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la
toma de decisiones.
En la carpeta denominada “datasets_books” se encuentran los siguientes archivos:
books; top_books; raitings; to_read.
Una vez analizada la información de la carpeta “datasets_books” deberás presentar
en un documento Word la respuesta a las siguientes preguntas:
¿Qué indicadores serían los más importantes a determinar de acuerdo a la
información presentada?
¿Qué tipo de análisis sería el más adecuado y por qué?
¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de
la información analizada?
El archivo “books” contiene los siguientes datos:
• Id - Identificador del registro
• Book Id - Identificador del libro
• Number Editions - Número de ediciones
• ISBN - Clave estándar internacional del libro
• ISBN13 - Clave estándar extendida internacional del libro
• Authors - Autor del libro
• Original Publication - Fecha de publicación
• Original Title - Título original del libro
• Title - Título del libro
• Language Code - Clave de idioma del libro
• Average Rating - Promedio de la clasificación del libro
• Image - Enlace a la imagen de la portada del libro
• Small Image - Enlace a la imagen en versión optimizada de la portada del
libro.
El archivo “top_books” contiene los siguientes datos:
• Position - Posición del libro en la clasificación del libro

• ISBN - Clave estándar extendida internacional del libro
• Title - Título del libro
• Author - Autor del libro
• Imprint - Editorial
• Publisher Group - Grupo Editorial
• Volume - Volumen de ventas hasta el 2010
• Value - Ventas determinadas por el volumen
• RRP - Precio recomendado para minoristas
• ASP - Precio promedio para venta
• Binding - Tipo de encuadernación
• Publ Date - Fecha de publicación
• Product Class - Clasificación del libro
• Classification - Clasificación General del libro

El archivo “ratings” contiene los siguientes datos:
• Book Id - Identificador del libro
• User Id - Identificador del cliente/usuario que clasifico un libro
• Rating - Nivel de clasificación del libro.

El archivo “to_read” contiene los siguientes datos:
• User Id - Identificador del cliente/usuario que clasifico un libro
• Book Id - Identificador del libro

El archivo “books” contiene los datos generales de cada libro existente en la librería
y además menciona el promedio de clasificación de cada libro de acuerdo a las
votaciones y compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a
una clasificación general.
El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer.

Identificación de indicadores

Para lograr identificar los indicadores de desempeño es relevante conocer todos y
cada de los datos incluidos dentro de los archivos “books”, “top_books”, “ratings” y
“to_read” que a grandes rasgos ya fueron descritos en el problema planteado.
Los siguientes son los indicadores de desempeño que se han propuesto:
1. El indicador se toma de la suma del campo “Value” de acuerdo al filtro que
se haga del campo “Classification” del archivo “top_books” y se representa
así:

??????��������� �� ������ �� ������ ��� �����������ó�=
����� �� �� �����������ó�(�������í�)
����� ����� �� ����� ��� ���������������(��������)
∗100

2. El indicador se toma de la suma del campo “Volume” de acuerdo al filtro que
se haga del campo “Product Class” del archivo “top_books” y se representa
así:

??????��������� �� ���ú����� �������� ��� ����� �� ��������=

���ú����� �������� �� �� ����� ��� ��������
���ú����� ������� �������� ��� ����� ��� ������ �� ���������
∗100


3. El indicador se toma de los distintos identificadores de libros del campo
“book_id” del archivo “to_read” y del total de libros del campo “book_id” del
archivo “books” y se representa así:

??????��������� �� ������ ������������ ���� ����=

�ú���� �� ��������� ��������������� �� ������ ������������ ���� ����
�ú���� ����� �� ������
∗100

Tipo de análisis y justificación

De acuerdo a la información disponible para la elaboración del proyecto de la
Librería Iztaccihuatl se procedió a realizar inicialmente un análisis a los datos
suministrados en los diferentes archivos y de esta manera lograr identificar campos
que pudieran indicar el alcance de los mismos, sin embargo y debido al grado de
generalidad se considera que se puede lograr realizar un análisis de tipo descriptivo
desde el cual se observa lo que ha venido sucediendo con la librería, identificando
por ejemplo las preferencias de los clientes, lo cual podría en un momento
determinado categorizarlos para proponer estrategias comerciales u otro tipo de
acciones encaminadas a vender mas libros, pero en términos generales con los
datos disponibles en los archivos es muy complejo realizar un análisis de tipo
predictivo o prescriptivo que ayuden a determinar que puede llegar a pasar o a
determinar alguna recomendación para la librería.
Es por ello que se propusieron los 3 indicadores de desempeño anteriores que a
grandes rasgos se relacionan directamente con el estado actual de la librería y
desde los cuales se pueden llegar a determinar objetivos y metas para próximas
vigencias en su desempeño.

Propuesta de decisión

Aunque en la descripción del proyecto para la Librería Iztaccihuatl no se define
específicamente un objetivo que la librería desee lograr y que este alineado con la
información disponible en los archivos, es importante establecer a donde desea
llegar en un periodo razonable de tiempo, en este sentido, el objetivo que se ha
propuesto en este proyecto para la librería es el de aumentar sus ventas ya que
con los datos que se encuentran en los archivos se lograron proponer 3 indicadores
de desempeño que se ajustan a este objetivo.
A través de los indicadores de desempeño se pueden tomar las siguientes
decisiones:
1. Porcentaje de dinero en ventas por clasificación, por medio de este indicador
el departamento comercial de la librería podrá tomar decisiones con respecto
a los libros con cierto tipo de clasificación (categorías) que están siendo muy
vendidos, con esta información se lograrán proponer acciones para fortalecer
ciertas categorías de libros o potenciar las categorías que no están siendo
tan vendidas.

2. Porcentaje de volúmenes vendidos por clase de producto, es claro que para
cualquier organización es muy importante mantener sus existencias en
rotación para no incurrir en gastos de almacenamiento, en este sentido, este
indicador sugiere dos elementos muy importantes, el primero es poder
optimizar su stock ya que de acuerdo al porcentaje de volúmenes vendidos
por clase de producto tendrá en inventario lo estrictamente necesario, y el
segundo elemento es el de poder determinar cual clase de producto es el
que más volúmenes vende y con ello encaminar acciones que fortalezcan el
volumen de ventas.

3. Porcentaje de libros recomendados para leer, a través de este indicador se
recopilan las sensaciones de los usuarios de acuerdo a sus gustos de lectura,

por ende, se hace indispensable generar acciones de valor a partir de la
interacción con los usuarios. Por lo tanto, en términos comerciales se pueden
desarrollar estrategias de venta con los libros mas recomendados para leer
ya que están categorizados de acuerdo a las preferencias de los usuarios.

Conclusiones

De acuerdo a los datos e información resultante de los archivos y del proyecto
planteado para la Librería Iztaccihuatl se ha logrado desarrollar un análisis
descriptivo que como su nombre lo indica, representa un contexto a priori de una
situación, proceso u organización en particular, no obstante, también se elaboraron
3 indicadores de desempeño que buscan cumplir con el objetivo (aumentar las
ventas) que se planteó para este proyecto.