Galería de mapas mentales base de datos
El almacén de datos es una colección estratégica que proporciona todo tipo de soporte de datos para el proceso de toma de decisiones en todos los niveles de la empresa. Este mapa cerebral analiza el diseño del marco del sistema del almacén de datos, la tecnología de análisis multidimensional y la tecnología de preprocesamiento de datos. y los puntos clave de la construcción del almacén de datos bancario, clasifíquelos para ayudar a comprender la connotación y la importancia de la construcción del almacén de datos.
Editado a las 2024-01-19 15:42:49,Este es un mapa mental sobre una breve historia del tiempo. "Una breve historia del tiempo" es una obra de divulgación científica con una influencia de gran alcance. No sólo presenta los conceptos básicos de cosmología y relatividad, sino que también analiza los agujeros negros y la expansión. del universo. temas científicos de vanguardia como la inflación y la teoría de cuerdas.
¿Cuáles son los métodos de fijación de precios para los subcontratos de proyectos bajo el modelo de contratación general EPC? EPC (Ingeniería, Adquisiciones, Construcción) significa que el contratista general es responsable de todo el proceso de diseño, adquisición, construcción e instalación del proyecto, y es responsable de los servicios de operación de prueba.
Los puntos de conocimiento que los ingenieros de Java deben dominar en cada etapa se presentan en detalle y el conocimiento es completo, espero que pueda ser útil para todos.
Este es un mapa mental sobre una breve historia del tiempo. "Una breve historia del tiempo" es una obra de divulgación científica con una influencia de gran alcance. No sólo presenta los conceptos básicos de cosmología y relatividad, sino que también analiza los agujeros negros y la expansión. del universo. temas científicos de vanguardia como la inflación y la teoría de cuerdas.
¿Cuáles son los métodos de fijación de precios para los subcontratos de proyectos bajo el modelo de contratación general EPC? EPC (Ingeniería, Adquisiciones, Construcción) significa que el contratista general es responsable de todo el proceso de diseño, adquisición, construcción e instalación del proyecto, y es responsable de los servicios de operación de prueba.
Los puntos de conocimiento que los ingenieros de Java deben dominar en cada etapa se presentan en detalle y el conocimiento es completo, espero que pueda ser útil para todos.
base de datos
Preprocesamiento de datos
Criterios de evaluación de la calidad de los datos.
exactitud
integridad
consistencia
Oportunidad
Credibilidad
Interpretabilidad
Tecnología de preprocesamiento de datos
1. Limpieza de datos
Objetivo:
Resolver errores e inconsistencias de datos.
Estandarización de formatos, descubrimiento y procesamiento de datos anormales, corrección de errores de datos, descubrimiento y eliminación de datos duplicados.
Manejo de valores faltantes
(1) Ignorar tuplas
(2) Complete manualmente los valores faltantes
(3) Utilice un llenado uniforme y constante
(4) Rellenar utilizando el promedio de atributos
(5) Utilice el valor promedio de los atributos de muestra después de agrupar
(6) Complete con el valor más probable
Procesamiento de datos ruidoso
(1) Embalaje
(2) Agrupación
(3) Combinación de inspección manual y por computadora
(4) Retorno
2.Integración de datos
Propósito: integrar datos de múltiples fuentes de datos
3. Curación de datos
Finalidad: Obtener una expresión más precisa de los datos
Estrategia de curación de datos
(1) Agregación de cubos de datos
(2) Protocolo de dimensiones
transformada wavelet
Análisis de componentes principales
(3) Compresión de datos
compresión sin perdidas
Compresión con pérdida
(4) Compresión numérica
4. Cambios de datos
Es una operación realizada para estandarizar, discretizar y estratificar conceptualmente datos.
Método de transformación de datos
(1) Agregación: resumir y agregar datos
(2) Generalización de datos: el proceso de abstracción de un nivel conceptual relativamente bajo a un nivel conceptual superior
(3) Estandarización
(4) Construcción de atributos/derivación de características
dato de governancia
Establecer un sistema completo de gobierno de datos requiere mejorar las capacidades de gestión de la información de datos desde varios aspectos, como sistemas, estándares, monitoreo y procesos, para resolver los siguientes problemas.
estándares de datos
Es necesario estandarizar el soporte para el negocio de plataformas de datos
sistema de control de datos
Documento de especificación del proceso
Definición de elemento de información
Gestión de metadatos
Llevar a cabo análisis de impacto y contexto de datos para realizar análisis de impacto y relaciones sanguíneas en el flujo de datos y relaciones de dependencia.
Calidad de datos
Los requisitos de calidad de los datos son mensurables y la calidad de los datos de la plataforma de datos debe gestionarse de manera integral para implementar una inspección de la calidad de los datos y un análisis dimensional definibles, así como el seguimiento de problemas.
servicio de datos
Proporcionar canales de comunicación de servicios para la plataforma de datos para usuarios comerciales y desarrolladores de aplicaciones.
Tecnología de análisis multidimensional del almacén de datos.
Conceptos básicos del almacén de datos.
Definición básica: un almacén de datos es una recopilación de datos relativamente estable, integrada y orientada a un tema que refleja cambios históricos y se utiliza para respaldar la toma de decisiones en la gestión.
Características técnicas del almacén de datos.
orientado al tema
El tema se refiere a los objetivos y requisitos del análisis y la toma de decisiones. Es propuesto por quien toma las decisiones de acuerdo con las necesidades del trabajo y, en última instancia, se implementa para servir a quien toma las decisiones.
Orientado al tema se refiere a la organización requerida del tema donde se deben encontrar los datos en el almacén de datos.
Los temas aplicables a los bancos generalmente incluyen
fiesta
organización interna
producto
protocolo
evento
DIRECCIÓN
canal
marketing
finanzas
activos del cliente
integrado
La construcción de un almacén de datos suele ser el paso más complejo y crítico.
El análisis y la toma de decisiones requieren grandes cantidades de datos para su análisis, comparación e identificación.
Hay muchas duplicaciones e inconsistencias en los datos entre múltiples fuentes de datos. Sólo mediante el procesamiento y la limpieza sistemáticos se puede llevar a cabo el siguiente paso de integración.
Relativamente estable (no volátil)
Una vez que los datos ingresan al almacén, deben almacenarse de manera relativamente estable durante un tiempo prolongado, que es la condición básica para garantizar una toma de decisiones correcta.
La mayoría de las operaciones de bases de datos son consultas, con pocas modificaciones y eliminaciones.
Reflejar cambios históricos (variante de tiempo)
Los minutos del almacén de datos almacenan información de datos que refleja el estado del tiempo histórico y también deben almacenarse en etapas según ciertos pedidos de eventos.
Análisis en línea (OLAP)
1. Definición básica: se refiere a la tecnología de software que utiliza información multidimensional para acceder, analizar y verificar datos en línea para problemas específicos.
2.Conceptos básicos
(1) Dimensión
(2) Nivel de dimensión
(3) Miembros de dimensión
(4) Medición
(5) Recopilación de datos multidimensionales
(6) Unidad de datos
3.Características técnicas
(1) Rapidez
(2) Analizabilidad
(3) Multidimensionalidad
(4) Informativo
Diseño del marco del sistema de almacenamiento de datos.
Planificación y preparación del almacén de datos.
1. Análisis de las necesidades del usuario
2. Análisis de viabilidad
viabilidad técnica
viabilidad económica
viabilidad operativa
3. Coordinación de construcción y análisis de resistencia.
4. Formulación del plan de desarrollo del proyecto.
(1) "Qué hacer"
Resuelva la división de tareas de la construcción del almacén de datos.
(2) "Cómo hacerlo"
Descripción de tareas y planificación del progreso para la construcción del almacén de datos.
(3) "Lo que se necesita"
Convocatoria y disposición de recursos clave: personal, hardware, software.
Arquitectura de datos del almacén de datos
1. Dirección del flujo de datos
Capa posterior a la fuente: carga de datos del sistema fuente
Capa temática: mediante el procesamiento de datos, se almacenan datos históricos detallados, información del cliente, información de la cuenta, datos de transacciones, etc. según temas.
Capa de resumen: resuma periódicamente según la información de la cuenta y la información del cliente.
Capa de aplicación: finalmente, se forman y almacenan los datos necesarios para el análisis de la aplicación.
2.modelo de datos
Con la acumulación de la construcción del almacén de datos, es necesario formar un modelo de datos de almacén de datos maduro que cumpla con las características.
3. Estándares de datos
mapeo de datos
hacer cumplir las reglas
4. Calidad de los datos
(1) Definición y medición inicial
(2) Analizar y encontrar errores
(3) Encuentre la fuente del problema
(4) Resolver problemas de calidad
(5) Monitorear el proceso de mejora
5.Gestión y control de datos
Marco del sistema de gestión de datos unificado
6. Política y capacidad de retención de datos
necesidades de análisis de negocios
Necesidades regulatorias
La necesidad de proporcionar servicios adicionales a los clientes basados en datos históricos.
Estructura de organización de datos del almacén de datos de granularidad múltiple
Si la granularidad es razonable o no, afecta directamente la cantidad de datos almacenados en el almacén de datos y los tipos de consultas que el almacén de datos puede manejar.
La granularidad es una medida clave del grado de integración en un almacén de datos.
Cuanto mayor sea la granularidad, menor será el nivel de detalle y mayor será el grado de exhaustividad de los datos.
Cuanto menor sea la granularidad, mayor será el nivel de detalle de los datos y menor el nivel de exhaustividad.
Arquitectura del almacén de datos
Determinar la funcionalidad básica y las capacidades de expansión.
1. Ascendente y ascendente son arquitecturas.
Estructura de arriba hacia abajo:
Ventajas: centralización, unificación y estandarización.
Desventajas: debe completarse de una vez, el ciclo es largo y el costo es alto; puede existir el riesgo de que se requiera reconstrucción;
Estructura ascendente: primero cree un mercado de datos desarrollado de forma independiente y luego cree un almacén de datos basado en esta tecnología.
2. Arquitectura pura de almacén de datos
La estructura es simple: los datos obtenidos del sistema de origen de datos se convierten y se cargan en el almacén de datos, y luego se proporcionan directamente a la aplicación de datos de front-end a través del almacén de datos.
3. Arquitectura de mercado de datos pura
No existe un almacén de datos global. Las aplicaciones de procesamiento de datos necesitan conectarse a uno o más mercados de datos para llamar a los datos.
Una forma intermedia de almacén de datos.
4. Arquitectura de almacén de datos virtual
La fuente de datos unificada conectada a la aplicación de procesamiento de datos es solo una capa intermedia, que contiene las reglas y los medios para acceder e integrar los datos, y proporciona una vista del almacén de datos virtual para los usuarios del almacén de datos.
La integración de datos solo ocurre cuando un usuario solicita datos de consulta y los requisitos de implementación son altos;
Puntos clave de la construcción del almacén de datos bancario
(1) El sistema de almacenamiento de datos primero debe cumplir con los requisitos de la sede y las sucursales locales para el almacenamiento de datos, consultas, estadísticas, análisis, etc.
(2) Al construir el almacén de datos, es necesario construir una fuente de datos unificada y una arquitectura unificada.
Preste atención a la gestión y publicación unificada de metadatos.
Preste atención a la construcción de indicadores de vendedores estandarizados con estándares unificados y calibre consistente.
Establecer un mecanismo de inspección de datos, mejorar continuamente la calidad de los datos y fortalecer la gobernanza de datos en todos los aspectos.
(3) Teniendo en cuenta el crecimiento continuo del negocio, el plan de construcción del almacén de datos debe ser escalable.
(4) El negocio bancario tiene requisitos de disponibilidad extremadamente altos y el sistema de información empresarial no se puede cerrar fácilmente.