Galería de mapas mentales Capítulo 5, Desarrollo de productos de datos
Teoría y práctica de la ciencia de datos Capítulo 5 El desarrollo de productos de datos se refiere a productos que pueden ayudar a los usuarios a lograr un objetivo determinado a través de los datos. El desarrollo de productos de datos involucra todas las actividades del proceso del proyecto de ciencia de datos.
Editado a las 2023-10-22 15:16:23,El cáncer de pulmón es un tumor maligno que se origina en la mucosa bronquial o las glándulas de los pulmones. Es uno de los tumores malignos con mayor morbilidad y mortalidad y mayor amenaza para la salud y la vida humana.
La diabetes es una enfermedad crónica con hiperglucemia como signo principal. Es causada principalmente por una disminución en la secreción de insulina causada por una disfunción de las células de los islotes pancreáticos, o porque el cuerpo es insensible a la acción de la insulina (es decir, resistencia a la insulina), o ambas cosas. la glucosa en la sangre es ineficaz para ser utilizada y almacenada.
El sistema digestivo es uno de los nueve sistemas principales del cuerpo humano y es el principal responsable de la ingesta, digestión, absorción y excreción de los alimentos. Consta de dos partes principales: el tracto digestivo y las glándulas digestivas.
El cáncer de pulmón es un tumor maligno que se origina en la mucosa bronquial o las glándulas de los pulmones. Es uno de los tumores malignos con mayor morbilidad y mortalidad y mayor amenaza para la salud y la vida humana.
La diabetes es una enfermedad crónica con hiperglucemia como signo principal. Es causada principalmente por una disminución en la secreción de insulina causada por una disfunción de las células de los islotes pancreáticos, o porque el cuerpo es insensible a la acción de la insulina (es decir, resistencia a la insulina), o ambas cosas. la glucosa en la sangre es ineficaz para ser utilizada y almacenada.
El sistema digestivo es uno de los nueve sistemas principales del cuerpo humano y es el principal responsable de la ingesta, digestión, absorción y excreción de los alimentos. Consta de dos partes principales: el tracto digestivo y las glándulas digestivas.
Desarrollo de productos de datos
definición
Se refiere a un producto que puede ayudar a los usuarios a lograr uno de sus objetivos a través de datos.
El desarrollo de productos de datos involucra todas las actividades del proceso del proyecto de ciencia de datos.
Incluyendo no solo usuarios humanos, sino también computadoras y otros sistemas de software y hardware.
Los productos de datos existen en muchas formas.
procesamiento de datos
Conversión de latitud única
Conversión multidimensional
enlaces clave
jiu-jitsu de datos
Tecnología clave
Principales características
centrado en datos
impulsado por datos
uso intensivo de datos
paradigma de datos
Más de 70 géneros en Facebook: la diferencia entre paradigmas de datos y paradigmas de conocimiento
Diversidad
Productos de datos
Productos de información
Productos de conocimiento
Productos inteligentes
Jerarquía
Productos de contenido
Productos de aplicación
Productos de servicio
Productos para la toma de decisiones
Valor añadido
trabajar creativamente
Piensa críticamente
Pregunta con curiosidad
Encapsulación de objetos de datos
Desarrollo de sistemas de datos
Aplicaciones integradas
servicios auxiliares
Servicios derivados
actividades clave
El principio básico
Tres puntos por tecnología, siete puntos por gestión y 12 puntos por datos.
Los datos son la materia prima para el desarrollo de la industria de datos.
La sabiduría de los científicos de datos es la principal fuente de valor añadido en el desarrollo de productos de datos.
La experiencia del usuario es el principal indicador de evaluación de los productos de datos.
elementos de actividad
diseño creativo
conocimientos de datos
Visualización
descripción de la historia
Virtualización
servicios bajo demanda
Servicio personalizado
Protección de seguridad y privacidad
experiencia de usuario
análisis de políticas
jiu-jitsu de datos
El arte de convertir datos en productos
El desarrollo de productos debe tener una alta calidad artística.
Dirigirse al desarrollo de productos centrado en el usuario
DJ Patil
Introducir el pensamiento de diseño
la lista desplegable
un solo botón
recordatorio inteligente
Otras soluciones
Apoyar la colaboración hombre-máquina
Turco mecánico amazónico
La larga cola de participantes
Captar la flexibilidad laboral
pequeña tarea
Modelo pagar después
Revisión de calificación
Bajos costos de procesamiento de datos
Bueno para retener usuarios
Excelente diseño de producto
Datos, tomados de la gente, utilizados por la gente.
Evite causar náuseas de datos.
Estimar posibles subproductos o impactos negativos.
Manejar correctamente la relación entre la tasa de recuperación, la tasa de precisión y el tiempo de respuesta.
Devolver resultados en motores de búsqueda
Información publicitaria de catering en buscadores.
Información publicitaria de libros en buscadores.
La importancia de la experiencia del usuario
Preste atención a la subjetividad del comportamiento cognitivo del usuario.
Los errores y las tonterías suelen ser más propensos a ser percibidos por los usuarios objetivo y crear una percepción errónea de todo el producto de datos.
Recluta más usuarios y obtén datos efectivos
Qué información deben proporcionar los usuarios y si esta información satisface las necesidades del desarrollo de productos de datos
Cuando se solicite a los usuarios que proporcionen información personal, se debe informar claramente el alcance de la recopilación, el propósito, los métodos de utilización prometidos y los servicios futuros devueltos a los usuarios.
Anticiparse a los fallos y garantizar una buena experiencia de usuario
Capacidades de datos
Gestión de datos
Diversas formas de existencia como adquisición, almacenamiento, integración, análisis, aplicación, presentación, archivo y destrucción de datos. proceso de evolución
dato de governancia
Una colección de desempeño de actividades de control relacionadas y gestión de riesgos durante los recursos de datos y su proceso de aplicación.
procesamiento de datos
Ejecución del sistema de operaciones de datos.
estrategia de datos
La visión, el propósito, los objetivos y los principios de la organización para realizar el trabajo con datos.
arquitectura de datos
Un marco para abstracciones como estructuras e interfaces de elementos de datos y sus interrelaciones.
Ciclo de vida de los datos
Un conjunto de procesos que transforman los datos brutos en acción y conocimiento.
metadatos
Datos sobre el dato o elemento de dato
elemento de datos
Existe un conjunto de disposiciones de atributos que definen unidades de datos que identifican representaciones y valores permitidos.
datos principales
Datos de entidades comerciales centrales que deben compartirse entre sistemas y departamentos de la organización.
Principios de gestión de datos
Los datos son valiosos
Las necesidades de gestión de datos se alinean con las necesidades empresariales
La gestión de datos depende de múltiples habilidades
La gestión de datos es la gestión del ciclo de vida.
MMC
áreas de proceso clave
estrategia de datos
dato de governancia
Calidad de datos
Operaciones de datos
Plataforma y arquitectura
proceso auxiliar
nivel de madurez
Nivel ejecutado
Ya gestionado
nivel definido
Nivel medido
Nivel optimizado
Evaluación de madurez
puesta en marcha
diagnóstico
Establecer
acción
estudiar
estrategia de datos
La estrategia de datos es la gestión unificada de la visión de gestión de datos y el plan funcional de una organización.
Marco de estrategia de datos del Departamento de Defensa de EE. UU.
visible
accesible
comprensible
asociación
confiable
interoperable
Seguridad
Posicionamiento de la estrategia de datos
Una estrategia de datos no solo necesita definir los objetivos de la gestión de datos, sino que también debe proporcionar planes de acción específicos sobre cómo lograr estos objetivos de gestión, así como un mecanismo para ajustar dinámicamente los objetivos de la gestión de datos.
Objetivos de la estrategia de datos
Defina una organización basada en datos o cultive una cultura basada en datos, utilice los datos como factor impulsor para las actividades de toma de decisiones de la organización, mejore la agilidad de la organización y, por lo tanto, mejore la competitividad central de la organización.
El foco de la estrategia de datos
problema intensivo de datos
El alcance de la estrategia de datos
Porcelana
Europa
EE.UU
REINO UNIDO.
Alemania
Japón
Plan de acción para impulsar el desarrollo del Big Data
dato de governancia
Gestión de la gestión de datos.
contenido principal
Comprenda sus datos
El alcance de la gestión de datos empresariales propuesto por IBM
datos de la transacción
datos principales
metadatos
datos relacionales
Identificación y análisis de los interesados en los datos.
Establecimiento del departamento de datos.
Formulación de códigos de conducta
Determinación de políticas y objetivos de gestión de datos.
Definición de responsabilidades laborales.
Plan de emergencia y gestión de emergencias
Gestión de clasificación y protección de niveles.
Supervisión efectiva y optimización dinámica
proceso basico
plan
implementar
examinar
Mejorar
Marco de gobernanza de datos de la DGI
Definir o secuenciar activamente reglas
Proporcionar protección y servicios continuos y multifuncionales a las partes interesadas en los datos.
Responder y resolver los problemas derivados del incumplimiento de las normas
Seguridad de datos, privacidad, moralidad y ética
Seguridad de datos
recursos clave
Capacidad de restaurar la funcionalidad parcial después de un daño al sistema
recursos importantes
Capaz de descubrir importantes vulnerabilidades de seguridad e incidentes de seguridad, y poder restaurar algunas funciones dentro de un período de tiempo después de que el sistema se vea comprometido.
recursos primarios
Capaz de descubrir vulnerabilidades de seguridad e incidentes de seguridad, y poder restaurar rápidamente la mayoría de las funciones después de que el sistema se daña.
Todos los recursos
Capaz de detectar vulnerabilidades e incidentes de seguridad y restaurar rápidamente todas las funciones después de que el sistema se vea comprometido.
Modelo P^2DR
sesgo de datos
Fuentes de datos, sesgo de selección
sesgo de supervivencia
Sesgo de procesamiento y preparación de datos
La paradoja de Berkson
Sesgo de selección de algoritmos y modelos.
Pruebas A/B
Sesgo en la interpretación y presentación de resultados analíticos.
La paradoja de Simpson
discriminación algorítmica
Familiaridad con los grandes datos
ataque de datos
Ataques de datos y bombas de Google
El bombardeo de Google se refiere a la construcción artificial y maliciosa de texto de anclaje para aumentar la tasa de clics en artículos o páginas web sobre informes desfavorables de otras personas en los motores de búsqueda. Aunque estos artículos o sitios web pueden no ser relevantes para el tema de búsqueda
protección de la privacidad
Escándalo de datos de Cambridge Analytica