¿Que es El Machine Learning e Inteligencia Artificial se usan a menudo?

intercambiables

(sinónimos), pero no lo son. Veamos primero cómo se relacionan entre sí.

¿Qué es la Inteligencia Artificial?

FUENTE IBES ESCOOL CLARIBA

I.A. es la ciencia de entrenar a máquinas para realizar tareas humanas. I.A

. sostiene el concepto de que una computadora puede actuar como un cerebro humano,

calculando  los pasos en el camino que nos rodea cada segundo de cada día.

La Inteligencia Artificial incluye razonamiento, procesamiento cognitivo, reconocimiento

del lenguaje natural, planificación y otros campos de investigación, además de Machine Learning

Page-6-Image-18.png

¿Qué es Machine Learning?

Machine Learning es un subconjunto específico de inteligencia artificial

que entrena a las máquinas para aprender.

Capture7.PNG

El nombre Machine Learning fue introducido por Arthur Samuel en 1959. Es un campo

de la ciencia que explora el desarrollo de algoritmos que pueden aprender y hacer

predicciones sobre los datos. La principal diferencia con otros algoritmos comunes

es la pieza de “aprendizaje”. Los algoritmos de Machine Learning no son series

de procesos ejecutados en serie para producir un resultado predefinido. En su lugar,

son una serie de procesos que buscan “aprender” patrones de eventos pasados

y construir funciones que pueden producir buenas predicciones, con un grado de confianza.

Dentro del campo del análisis de datos, Machine Learning  forma parte de una

área conocida como análisis predictivo .

Los modelos de Machine Learning buscan patrones en los datos para tratar de

esbozar conclusiones como lo harían las personas. Cuando el algoritmo es lo

suficientemente bueno como para esbozar las conclusiones correctas, aplica

este conocimiento a nuevos conjuntos de datos.

Ciclo de aplicación de Machine Learning:

Capture6.PNG

 

¿Qué necesita para funcionar bien?

  • Datos granulares
  • Grandes volúmenes de datos
  • Datos extremadamente diversos

Los cuatro tipos de Machine Learning

Capture12.PNG

MACHINE LEARNING SUPERVISADO

Está compuesto por algoritmos que intentan encontrar relaciones y dependencia

s entre un producto objetivo que queremos predecir, que va desde la rotación hasta

el fraude de seguros o el éxito potencial de una promoción de ventas en diferentes

individuos, y datos que tenemos de otros individuos del pasado, incluidas características

demográficas o datos de comportamiento previos. Utilizamos estos datos pasados

como variables de entrada para predecir el valor de salida más probable para los nuevo

s datos, en función de las relaciones aprendidas de los conjuntos de datos anteriores.

Capture9.PNG

Árboles de Decisión

Los árboles de clasificación y regresión se conocen comúnmente como CART.

El término fue introducido por Leo Breiman para referirse a los algoritmos de Árbol

de Decisión que se pueden usar para problemas de modelado predictivo de clasificación o regresión.

El algoritmo básico de CART es la base para algoritmos más avanzados como

árboles de decisión empaquetados, Random forest y árboles de decisión potenciados.

Los árboles de decisión generalmente se usan para predecir la probabilidad de lograr un

resultado para una nueva observación (individuo, cliente, …) según sus atributos (edad, demografía,)

comportamiento de compra, …), utilizando datos anteriores que tenemos de un número suficiente

de Observaciones similares o individuos. El resultado para predecir es normalmente binario

: sí / no (se agitará / no se agitará, se comprará / no se comprará, …).

Se denominan árboles porque se pueden representar como un árbol binario donde cada nodo

raíz representa una única variable de entrada (edad, ciudad, segmento …) y un punto de división

en esa variable (suponiendo que la variable es numérica).

Los nodos de hoja del árbol contienen la variable de salida (comprará, batirá, …)

que queremos predecir. Comencemos con un ejemplo simple, donde trataremos de predecir

el género en función de la altura y el peso de las personas. A continuación se muestra

un ejemplo muy simple de un árbol de decisión binario:

Capture13.PNG

El árbol se puede representar tanto como un gráfico o como un conjunto de reglas.

Por ejemplo, a continuación se muestra el árbol de decisiones anterior, que describe

un conjunto de reglas:

  1. Si Altura > 180 cm Entonces Hombres
  2. Si Altura <= 180 cm y peso  80 kg Entonces Hombre
  3. Si Altura <= 180 cm Y Peso <= 80 kg Entonces Mujer

Con la representación de árbol binario del modelo CART descrito anteriormente,

hacer predicciones es relativamente sencillo. Cada vez que evaluamos a un nuevo individuo,

podemos predecir su género según la altura y el peso, con un grado de confianza.

Los árboles de decisión son un método fácil de representar frecuencias de atributos que

sospechamos que pueden proporcionar información, ayudando a predecir un resultado.

Pueden ser muy útiles para analizar las causas probables de los buenos y malos resultados

comerciales y ayudarnos a mejorar nuestros niveles de servicio, aumentar la retención de clientes

o prevenir el fraude, entre muchas otras aplicaciones.


Regresión

Ex: Precios de Vivienda Regresión Lineal

Ex: Precios de Vivienda Regresión Lineal

  • Uso de datos etiquetados para hacer predicciones en forma continua .
  • La salida de la entrada siempre está en curso, y el gráfico es lineal .
  • La regresión es una forma de técnica de modelado predictivo que investiga la
  • relación entre una variable dependiente [Outputs] y una variable independiente [Inputs].
  • Esta técnica utilizada para pronosticar el clima, el modelado de series de tiempo, la
  • optimización de procesos.
  • Linear Regression – relationship between two variables by fitting a linear equation
  • to the observed data.
  • Ex: Predicción del precio de la vivienda, donde el precio de la vivienda se predecirá
  • a partir de las entradas, como el número de habitaciones, la localidad, la facilidad de transporte,
  • la edad de la vivienda, el área de la vivienda.
  • Cómo un aumento en el impuesto (para el alcohol) tiene una influencia para una cantidad de 
  • cigarrillos empacados consumidos por día.
  • Cómo las horas de sueño afectan nuestras calificaciones en los cursos.
  • Ver correlación de experiencia por salarios.
  • La correlación entre el piso de la casa es versus el precio de la casa.
  • La segunda aplicación es pronosticar nuevas observaciones (valores no observados).

Clasificación

  • Es el tipo de aprendizaje supervisado en el que los datos etiquetados se utilizan para
  • hacer predicciones en una forma no continua .
  • La salida de la información no siempre es continua, y el gráfico no es lineal .
  • En la técnica de clasificación, el algoritmo aprende de la entrada de datos que se le da
  • y luego utiliza este aprendizaje para clasificar observaciones nuevas.
  • Este conjunto de datos puede ser meramente bi-class, o también puede ser multi-class.
  • Ex: Uno de los ejemplos de problemas de clasificación es verificar si el correo electrónico
  • es spam o no spam entrenando el algoritmo para diferentes palabras spam o correos electrónicos.
  • (Vecinos más cercanos a K, SVM, Kernel, Naïve Bayes, Árbol de Decisiones, Bosque Aleatorio)

  • Los árboles de clasificación se utilizan para separar el conjunto de datos en clases que
  • pertenecen a la variable de respuesta. Generalmente, la variable de respuesta tiene dos clases: Sí o No (1 o 0).
  • Árboles de regresión son necesarios cuando la variable de respuesta es numérica o
  • continua. Por ejemplo, el precio previsto de un bien de consumo. Por lo tanto, los árboles
  • de regresión son aplicables para el tipo de predicción de problemas en oposición a la clasificación.
Page-20-Image-51.png

Ejemplos

Si desea predecir si una persona hará clic en un anuncio online

ml1.jpg

 

  • En el dominio de la atención médica se utiliza para identificar la combinación correcta
  • de componentes en la medicina y para analizar el historial médico de un paciente para i
  • identificar enfermedades. En el comercio electrónico, el bosque aleatorio se utiliza para
  • determinar si a un cliente realmente le gustará el producto o no.


Entendiendo por qué los clientes se van

“Cuesta mucho menos mantener un cliente existente que ganar un nuevo cliente”

El proveedor de servicios móviles debe poder observar los patrones a partir de los datos y las anomalías.

El proveedor de servicios móviles tiene la ventaja de tener acceso a grandes volúmenes de datos

entre muchos clientes diferentes. Al utilizar el algoritmo correcto, el proveedor puede crear un modelo

que mapee los tipos de ofertas y promociones que retendrán a los clientes y agregaran nuevos.

 

¿Cuánto costará retener y agregar nuevos clientes?

 

¿Los nuevos planes reducirán los ingresos significativamente?

¿El gasto justificará los esfuerzos? Estos son los tipos de predicciones que puede proporcionar

una técnica de aprendizaje automático.

¿Cuál es la diferencia entre un enfoque de BI tradicional?

¿y un enfoque de aprendizaje automático para la rotación de clientes?

Capture2.PNG

Evitar que ocurran accidentes

  • Industrias como fabricación, petróleo y gas, y servicios públicos tienen éxito o fracasan
  • en función de su capacidad para evitar accidentes. Si bien es común tener un programa
  • de mantenimiento, a menudo no es suficiente.
  • Por ejemplo, puede haber una falla en un sistema de calefacción o aire acondicionado.
  • Podría haber un cambio dramático en las condiciones climáticas que podrían afectar la maquinaria.
    • Los algoritmos de aprendizaje automático pueden aplicarse al mantenimiento
    • preventivo de varias maneras. Por ejemplo, un algoritmo de regresión se puede usar
    • como base para un modelo que puede predecir el tiempo de falla de una máquina.
    • Se pueden usar varios algoritmos de clasificación para modelar los patrones asociados
    • con las fallas de la máquina. Los datos generados por los sensores proporcionan
    • un gran volumen de datos semi estructurados que pueden modelar y comparar patrones
    • de rendimiento para que se pueda detectar una anomalía en el rendimiento normal.

MACHINE LEARNING NO SUPERVISADO

  • Los datos sin etiquetar se utilizan para entrenar el algoritmo, lo que significa
  • que se usó contra los datos que no tienen etiquetas históricas.
  • El propósito es explorar los datos y encontrar alguna estructura dentro.
Capture3.PNG
  • Ex: puede identificar segmentos de clientes con atributos similares que luego
  • pueden ser tratados de manera similar en campañas de marketing.
  • O puede encontrar los atributos principales que separan los segmentos de clientes entre sí.
  • Las técnicas populares incluyen mapas autoorganizativos, mapas de redes cercanas,
  • agrupación por k-medias y descomposición de valores singulares . Estos algoritmos
  • también se utilizan para segmentar temas de texto, recomendar elementos e identificar
  • valores atípicos de datos.

Agrupación

El análisis Clúster o agrupación en clúster es la tarea de agrupar un conjunto de objetos

de tal manera que los objetos en el mismo grupo (denominado clúster ) sean más similares

(en cierto sentido) entre sí que a los de otros grupos (agrupaciones).

Page-26-Image-61.png
  • La agrupación de clientes utiliza datos de transacciones de compra
  • para rastrear el comportamiento de compra y luego crear nuevas
  • 4 iniciativas comerciales basadas en los hallazgos.
  • El objetivo de marketing típico es enfatizar y retener a los clientes de alto riesgo, alto valor
  • y alto beneficio: este grupo “premium” que representa el 10-20 por ciento del total de
  • compradores a menudo produce el 50-80 por ciento de las ganancias de una empresa.
  • Una vez que se identifica este grupo, debe considerar las técnicas de venta cruzada y
  • venta cruzada que contribuirán aún más al potencial de rentabilidad de este grupo de
  • datos atractivo.

Los árboles de decisión a veces se utilizan para campañas de marketing.

Es posible que desee predecir el resultado de enviar

a los clientes y prospectos un cupón

de 20 por ciento.

Puede dividir a los clientes en cuatro segmentos:

! Dirigirse a persuadibles le dará el mejor retorno de la inversión

(ROI). Un árbol de decisiones

lo ayudará a identificar estos cuatro grupos de clientes y organizar prospectos y clientes

según quién reaccionará mejor a la campaña de marketing.


Reducción de dimensionalidad

  • La reducción de la dimensión ayuda a los sistemas a eliminar datos que
  • no son útiles para el análisis.
  • Este grupo de algoritmos se utiliza para eliminar datos redundantes, valores
  • atípicos y otros datos no útiles.
Page-28-Image-64.png
  • La reducción de la dimensión puede ser útil cuando se analizan datos de sensores
  • y otros casos de uso de Internet de las cosas (IoT). En los sistemas de IoT, puede haber
  • miles de puntos de datos que simplemente le indican que un sensor está encendido.
  • Almacenar y analizar los datos “en” no es útil y ocupará un espacio de almacenamiento
  • importante. Además, al eliminar estos datos redundantes , el rendimiento de un sistema
  • de aprendizaje automático mejorará.
  • Finalmente, la reducción de la dimensionalidad también ayudará a los analistas
  • a visualizar los datos .

MACHINE LEARNING POR REFUERZO

  • El aprendizaje por refuerzo se utiliza a menudo para robótica, juegos y navegación.
  • Con el aprendizaje por refuerzo, el algoritmo descubre mediante prueba y error
  • qué acciones producen las mayores recompensas.
  • Este tipo de aprendizaje tiene tres componentes principales: el agente
  • (el aprendiz o el que toma las decisiones), el entorno (todo con lo que el agente interactúa)
  • y las acciones (lo que el agente puede hacer).
Page-30-Image-70.png

Aprendizaje profundo | Redes Neuronales

  • El aprendizaje profundo – redes neuronales complejas – está diseñado para
  • emular el funcionamiento del cerebro humano, de modo que las computadoras
  • puedan recibir capacitación para lidiar con las abstracciones y los problemas
  • que están mal definidos.
  • Las redes neuronales y el aprendizaje profundo a menudo se usan en aplicaciones
  • de reconocimiento de imagen, voz y visión de computadora.
Capture5.PNG
  • Detección de Rostro
Page-33-Image-78.png
  • Reconocimiento de Voz
Page-33-Image-79.png

Resumen

Casos de ejemplo de uso de Machine Learning

  • Industria manufacturera
    • Detección de anomalías en plantas de fabricación de acero: s
    • Supervisar el proceso de producción
    • Chequeo de calidad en la industria del automóvil: monitorear el proceso de montaje
    • Gestión de inventario: estimar la condición del inventario.
  • Minoristas
    • Comprometer a los clientes rezagados: predice qué cliente es poco probable que regrese
    • Aumenta el tamaño promedio de los pedidos: haz recomendaciones más inteligentes
    • Reduzca el desperdicio de marketing: para conocer qué productos
    • reciben la mejor respuesta del consumidor y adaptar las tácticas de mercadeo.
  • Marketing y Ventas
    • Lifetime Value: predictions about most budding customers early and target
    • sales effort toward them
    • Churn: predicciones de quién se está yendo, reenfocando y personalizando el trato
    • Análisis de opiniones: análisis de NLP en los comentarios de los clientes
  • Seguridad
    • Filtrado de Spam
    • Detección de Fraude: bloqueo de clientes / transacciones de
    • dinero potencialmente fraudulentas