Diferencia entre el aprendizaje automático supervisado y no supervisado

Diferencia clave - Supervisado vs Sin supervisión Aprendizaje automático
 

El aprendizaje supervisado y el aprendizaje no supervisado son dos conceptos centrales del aprendizaje automático. Aprendizaje supervisado es una tarea de aprendizaje automático de aprender una función que mapea una entrada a una salida basada en los pares de entrada-salida de ejemplo. El aprendizaje no supervisado es la tarea de aprendizaje automático de inferir una función para describir una estructura oculta a partir de datos no marcados. los diferencia clave Aprendizaje automático supervisado y no supervisado es que el aprendizaje supervisado utiliza datos etiquetados, mientras que el aprendizaje no supervisado utiliza datos no etiquetados.

El Aprendizaje automático es un campo en Ciencias de la computación que le brinda a un sistema informático la capacidad de aprender de los datos sin ser programado explícitamente. Permite analizar los datos y predecir patrones en los mismos. Hay muchas aplicaciones de aprendizaje automático. Algunos de ellos son reconocimiento facial, reconocimiento de gestos y reconocimiento de voz. Existen varios algoritmos relacionados con el aprendizaje automático. Algunos de ellos son regresión, clasificación y agrupamiento. Los lenguajes de programación más comunes para desarrollar aplicaciones basadas en aprendizaje automático son R y Python. También se pueden utilizar otros lenguajes como Java, C ++ y Matlab..

CONTENIDO

1. Resumen y diferencia clave
2. ¿Qué es el aprendizaje supervisado?
3. ¿Qué es el aprendizaje no supervisado?
4. Similitudes entre el aprendizaje automático supervisado y no supervisado
5. Comparación lado a lado - Aprendizaje automático supervisado versus no supervisado en forma tabular
6. Resumen

¿Qué es el aprendizaje supervisado??

En sistemas basados ​​en aprendizaje automático, el modelo funciona de acuerdo con un algoritmo. En el aprendizaje supervisado, el modelo es supervisado. Primero, se requiere entrenar el modelo. Con el conocimiento adquirido, puede predecir respuestas para las instancias futuras. El modelo se entrena usando un conjunto de datos etiquetado. Cuando se le da al sistema un dato fuera de muestra, puede predecir el resultado. A continuación hay un pequeño extracto del popular conjunto de datos IRIS..

De acuerdo con la tabla anterior, la longitud de los sépalos, el ancho de los sépalos, la longitud de Patel, el ancho de Patel y las Especies se denominan atributos. Las columnas son conocidas como características. Una fila tiene datos para todos los atributos. Por lo tanto, una fila se llama observación. Los datos pueden ser numéricos o categóricos. Al modelo se le dan las observaciones con el nombre de la especie correspondiente como entrada. Cuando se da una nueva observación, el modelo debe predecir el tipo de especie al que pertenece.

En el aprendizaje supervisado, hay algoritmos de clasificación y regresión. La clasificación es el proceso de clasificación de los datos etiquetados. El modelo creó límites que separaban las categorías de datos. Cuando se proporcionan nuevos datos al modelo, se puede categorizar según el lugar donde existe el punto. El K-Nearest Neighbors (KNN) es un modelo de clasificación. Dependiendo del valor k, se decide la categoría. Por ejemplo, cuando k es 5, si un punto de datos particular está cerca de ocho puntos de datos en la categoría A y seis puntos de datos en la categoría B, el punto de datos se clasificará como A.

La regresión es el proceso de predecir la tendencia de los datos anteriores para predecir el resultado de los nuevos datos. En regresión, la salida puede consistir en una o más variables continuas. La predicción se realiza mediante una línea que cubre la mayoría de los puntos de datos. El modelo de regresión más simple es una regresión lineal. Es rápido y no requiere parámetros de ajuste, como en KNN. Si los datos muestran una tendencia parabólica, el modelo de regresión lineal no es adecuado.

Esos son algunos ejemplos de algoritmos de aprendizaje supervisado. En general, los resultados generados por los métodos de aprendizaje supervisados ​​son más precisos y confiables porque los datos de entrada son bien conocidos y están etiquetados. Por lo tanto, la máquina tiene que analizar solo los patrones ocultos..

¿Qué es el aprendizaje no supervisado??

En el aprendizaje no supervisado, el modelo no es supervisado. El modelo funciona por sí solo, para predecir los resultados. Utiliza algoritmos de aprendizaje automático para llegar a conclusiones sobre datos sin etiquetar. En general, los algoritmos de aprendizaje no supervisados ​​son más difíciles que los algoritmos de aprendizaje supervisado porque hay poca información. La agrupación es un tipo de aprendizaje no supervisado. Se puede utilizar para agrupar los datos desconocidos mediante algoritmos. El k-mean y el clustering basado en densidad son dos algoritmos de clustering..

algoritmo k-mean, Coloca k centroide al azar para cada grupo. Luego, cada punto de datos se asigna al centroide más cercano. La distancia euclidiana se utiliza para calcular la distancia desde el punto de datos hasta el centroide. Los puntos de datos se clasifican en grupos. Las posiciones para k centroides se calculan de nuevo. La nueva posición del centroide está determinada por la media de todos los puntos del grupo. De nuevo, cada punto de datos se asigna al centroide más cercano. Este proceso se repite hasta que los centroides ya no cambian. k-mean es un algoritmo de agrupación rápida, pero no hay una inicialización específica de los puntos de agrupación. Además, hay una gran variación de modelos de agrupación en clústeres basados ​​en la inicialización de puntos de agrupación.

Otro algoritmo de agrupamiento es Agrupación basada en densidad. También se conoce como aplicaciones de agrupamiento espacial basado en densidad con ruido. Funciona al definir un grupo como el conjunto máximo de puntos conectados de densidad. Son dos parámetros utilizados para la agrupación basada en densidad. Son Ɛ (épsilon) y puntos mínimos. El Ɛ es el radio máximo del barrio. Los puntos mínimos son el número mínimo de puntos en el vecindario Ɛ para definir un grupo. Esos son algunos ejemplos de agrupación en clúster que se incluyen en el aprendizaje no supervisado..

En general, los resultados generados a partir de algoritmos de aprendizaje no supervisados ​​no son muy precisos y confiables porque la máquina debe definir y etiquetar los datos de entrada antes de determinar los patrones y funciones ocultos..

¿Cuál es la similitud entre el aprendizaje automático supervisado y no supervisado??

  • Tanto el aprendizaje supervisado como el no supervisado son tipos de aprendizaje automático..

¿Cuál es la diferencia entre el aprendizaje automático supervisado y no supervisado??

Aprendizaje automático supervisado vs no supervisado

Aprendizaje supervisado es la tarea de aprendizaje automático de una función que mapea una entrada a una salida basada en pares de entrada-salida de ejemplo. El aprendizaje no supervisado es la tarea de aprendizaje automático de inferir una función para describir una estructura oculta a partir de datos no etiquetados.
 Funcionalidad principal
En el aprendizaje supervisado, el modelo predice el resultado en función de los datos de entrada etiquetados. En el aprendizaje no supervisado, el modelo predice el resultado sin datos etiquetados identificando los patrones por sí mismo.
Exactitud de los resultados
Los resultados generados por los métodos de aprendizaje supervisados ​​son más precisos y confiables.. Los resultados generados por los métodos de aprendizaje no supervisados ​​no son muy precisos y confiables.
Principales algoritmos
Existen algoritmos de regresión y clasificación en aprendizaje supervisado.. Hay algoritmos para agrupar en aprendizaje no supervisado.

Resumen - Supervisado vs Sin supervisión Aprendizaje automático

El aprendizaje supervisado y el aprendizaje no supervisado son dos tipos de aprendizaje automático. Aprendizaje supervisado es la tarea de Aprendizaje automático de aprender una función que mapea una entrada a una salida basada en pares de entrada-salida de ejemplo. El aprendizaje no supervisado es la tarea de aprendizaje automático de inferir una función para describir una estructura oculta a partir de datos no etiquetados. La diferencia entre el aprendizaje automático supervisado y el no supervisado es que el aprendizaje supervisado utiliza datos etiquetados, mientras que la inclinación no supervisada utiliza datos no etiquetados.

Referencia:

1.TheBigDataUniversity. Aprendizaje automático: aprendizaje supervisado y no supervisado, clase cognitiva, 13 de marzo de 2017. Disponible aquí 
2. “Aprendizaje no supervisado”. Wikipedia, Wikimedia Foundation, 20 de marzo de 2018. Disponible aquí 
3. “Aprendizaje supervisado”. Wikipedia, Wikimedia Foundation, 15 de marzo de 2018. Disponible aquí

Imagen de cortesía:

1.'2729781 'por GDJ (dominio público) a través de pixabay