Galería de mapas mentales Generar modelo
Una introducción más detallada al modelo GAN de red generativa, compartiendo el conocimiento del aprendizaje no supervisado, modelos generativos, clasificación de modelos y redes clásicas. Espero que este mapa cerebral le resulte útil.
Editado a las 2023-07-27 22:53:43,El cáncer de pulmón es un tumor maligno que se origina en la mucosa bronquial o las glándulas de los pulmones. Es uno de los tumores malignos con mayor morbilidad y mortalidad y mayor amenaza para la salud y la vida humana.
La diabetes es una enfermedad crónica con hiperglucemia como signo principal. Es causada principalmente por una disminución en la secreción de insulina causada por una disfunción de las células de los islotes pancreáticos, o porque el cuerpo es insensible a la acción de la insulina (es decir, resistencia a la insulina), o ambas cosas. la glucosa en la sangre es ineficaz para ser utilizada y almacenada.
El sistema digestivo es uno de los nueve sistemas principales del cuerpo humano y es el principal responsable de la ingesta, digestión, absorción y excreción de los alimentos. Consta de dos partes principales: el tracto digestivo y las glándulas digestivas.
El cáncer de pulmón es un tumor maligno que se origina en la mucosa bronquial o las glándulas de los pulmones. Es uno de los tumores malignos con mayor morbilidad y mortalidad y mayor amenaza para la salud y la vida humana.
La diabetes es una enfermedad crónica con hiperglucemia como signo principal. Es causada principalmente por una disminución en la secreción de insulina causada por una disfunción de las células de los islotes pancreáticos, o porque el cuerpo es insensible a la acción de la insulina (es decir, resistencia a la insulina), o ambas cosas. la glucosa en la sangre es ineficaz para ser utilizada y almacenada.
El sistema digestivo es uno de los nueve sistemas principales del cuerpo humano y es el principal responsable de la ingesta, digestión, absorción y excreción de los alimentos. Consta de dos partes principales: el tracto digestivo y las glándulas digestivas.
Generar modelo
aprendizaje sin supervisión
datos
sin etiqueta
Bajo coste de adquisición
Objetivo
Encuentre patrones o estructuras ocultas en los datos.
ejemplo
agrupamiento
k-significa
Reducción de dimensionalidad
Análisis de componentes principales
Aprendizaje de funciones
codificación automática
estimación de densidad
Generar modelo
Dado un conjunto de entrenamiento, genere nuevas muestras con la misma distribución que el conjunto de entrenamiento.
Problemas centrales en el aprendizaje no supervisado
estimación de densidad
Ideas típicas
Mostrar estimación de densidad
Definir y resolver para Px
Estimación de densidad implícita
Aprenda el modelo P sin definición explícita
Clasificación de modelos
PíxelRNN/CNN
Utilice el criterio de la cadena para convertir la probabilidad de generación de la imagen x en el producto de las probabilidades de generación de cada píxel
Es muy complejo, por lo que se necesita una red neuronal para modelarlo.
·
Características
ventaja
La función de probabilidad se puede calcular exactamente
El rendimiento del modelo se puede evaluar eficazmente utilizando el valor de la función de probabilidad.
defecto
La generación de secuencias es lenta.
Autocodificador variacional (VAE)
La codificación automática utiliza la reconstrucción para entrenar características de baja dimensión para representar
Codificador variacional VAE
ficticio
La entrada z es un vector y obedece a la distribución normal.
Cada dimensión de z representa un atributo
Características
ventaja
Una forma importante de generar modelos.
Se puede calcular q(z|x), y esta representación de características se puede utilizar en muchas otras tareas.
defecto
El límite inferior de la función de máxima verosimilitud funciona eficazmente, pero el modelo en sí no es tan fácil de evaluar como PixelCNN.
Produce muestras borrosas y de menor calidad en comparación con las GAN
GAN genera modelos adversarios
pregunta
Esperamos tomar muestras de nuevos datos de la distribución de la muestra de entrenamiento, pero esta distribución no solo es de alta dimensión sino también muy compleja, lo que dificulta su implementación directa.
resolver
Muestreo de una distribución simple, como la distribución uniforme; luego aprenda un mapeo para transformarla en la distribución de muestra de entrenamiento.
composición
Generar red
Se espera generar imágenes lo más realistas posible y así engañar al discriminador.
red discriminatoria
Espero poder distinguir con precisión entre imágenes reales y falsas.
Entrenamiento conjunto utilizando el método minimax.
Completar alternativamente
Discriminado
Constructor
Visualización
Deje que las pseudomuestras generadas se acerquen a la distribución de las muestras reales tanto como sea posible, de modo que el discriminador pueda estar en un estado indistinguible entre verdadero y falso.
red clásica
Red Adversaria Generativa Convolucional DCGAN
El estado es estable durante el proceso de entrenamiento, logrando efectivamente la generación de imágenes de alta calidad.
Reglas (empíricas)
Utilice convoluciones en lugar de agrupar capas
Eliminar capa completamente conectada
Usar normalización por lotes
Utilice la función de activación adecuada
La red de generación usa ReLU y la capa de salida usa Tanh.
El discriminador usa LeaklyReLU
Problema de optimización de GAN LSGAN, WGAN
pregunta
Cuando las muestras generadas y las muestras reales no se superponen, la divergencia JS siempre es log2
Función objetivo LSGAN
Cambie la función sigmod a una función de regresión lineal
WGAN
medida de distancia
Distancia de la topadora
Haz que la red entrene en la dirección deseada.
GAN condicional
pregunta
Existe un problema de etiqueta para muchos. Los resultados de salida de las redes neuronales tradicionales están lo más cerca posible de cada resultado de entrenamiento, lo que hace que las imágenes generadas sean muy borrosas e incluso indistinguibles.
Se espera que el contenido de salida sea diverso y pueda controlarse.
función objetiva
Plan de IMPLEMENTACION
cGAN
SGAN
ACGAN (uso común)
función objetiva
Lc es la pérdida de clasificación, Ls es la pérdida de discriminación verdadera y falsa
infoGAN
Controlar las variables ocultas para que tengan definiciones físicas claras.
texto a imagen
PilaGAN
imagen a imagen
iGAN
Pix2Pix
cicloGAN
StarGAN
Una red genera cinco estilos.