CARACTERISTICAS DE
UNA BASE DE
DATOS ORIENTADA A OBJETOS
PERSISTENCIA: Es la capacidad que tiene el programador para que sus datos se
conserven al finalizar la ejecución de un
proceso de forma que se puedan reutilizar en otros procesos.
Se entiende por persistencia (en programación) como la acción de preservar la
información de un objeto de forma permanente (guardar), pero a su vez
también se refiere a poder recuperar la información del mismo (leer) para
que pueda ser nuevamente utilizada.
En el caso de persistencia de objetos la información que persiste en la
mayoría de los casos son los valores que contienen los atributos en ese momento, no necesariamente la funcionalidad que proveen
sus métodos.
CONCURRENCIA: Se relaciona de muchos usuarios interactuando concurrentemente en
el sistema. Este debe controlar la interacción entre las transacciones
concurrentes para evitar que se destruya la consistencia de la base de datos.
RECUPERACION: Proporciona como mínimo el mismo nivel
de recuperación que los sistemas de base de datos actuales. De forma que
tanto en caso de fallo de hardware, como fallo de software, el sistema
puede retroceder hasta un estado coherente de los datos.
Base de datos multidimensionales (BDM).
Son bases de datos ideadas para desarrollar aplicaciones muy concretas, como
creación de cubos OLAP. Basicamente no se diferencian demasiado
de la base de datos relacionales (una tabla en una base de datos relacional
podría serlo también en una base de datosmultidimensional), la
diferencia esta mas bien a nivel conceptual; en las bases de datos
multidimensionales los campos o atributos de una tabla pueden ser de dos tipos,
o bien representan dimensiones de la tabla o bien representan métricas
que se desean estudiar.
Las bases de datos multidimensionales son especialmente
útiles en ventas y los usos de la comercialización que implican
serie de tiempo. Los volúmenes grandes de ventas y de datos del inventario se pueden almacenar
para ser utilizado en última instancia para la logística y el
planeamiento del
ejecutivo. Por ejemplo, los datos se pueden segregar
mas facilmente por la región de las ventas, el producto, o
el período.
Definición y concepto de las BDM
Las bases de datos multidimensionales se utilizan principalmente para crear
aplicaciones OLAP y pueden verse como base de datos de una sola tabla, su
peculiaridad es que por cada dimensión tiene un campo (o columna), y
otro campo por cada métrica o hecho, es decir estas tablas almacenan
registros cuyos campos son de la forma:
(d1, d2, d3,.., f1, f2, f3,….)
Donde los campos ¨di¨ hacen referencia a las dimensiones de la tabla, y
los campos ¨fi¨ a las métricas o hecho que se quiere almacenar,
estudiar o analizar.
Cada una de estas tablas puede asimilarse a un hipercubo o mas
concretamente si de herramientas OLAP se trata-a un cubo OLAP, donde las
dimensiones del mismo se corresponden los campos de dimensiones de la tabla
(campos ¨di…¨), y el valor almacenado en cada celdadel cubo
equivale a la métrica o métricas (campos ¨fi…¨)
almacenadas en la tabla.
Implementación
Lo mas importante a tener en cuenta para implementar esta estructura de
datos es que la tabla contiene todas las n-tuplas, con los valores de las
dimensiones, o índice del
cubo, y los valores de las métricas previamente calculados para el cruce
de valores del
índice en cuestión.
Modelos conceptuales multidimensionales
En una base de datos multidimensional, la información se representa como
matrices multidimensionales, cuadros de múltiples entradas o funciones
de varias variables sobre conjuntos finitos. Cada una de
estas matrices se denomina cubo.
El esquema de un cubo queda determinado dando a
conocer sus ejes con sus respectivas estructuras y la estructura de los datos
que se representa en cada celda de la matriz. Se asume que los datos en todas
las celdas son uniformes, es decir, todas las posiciones de la matriz tienen
datos con igual estructura. Una instancia de un cubo,
queda determinada por un conjunto de datos para cada eje y un conjunto de datos
para la matriz. A los ejes se les llama dimensiones y al dato
que se presenta en la matriz, se le llama medida. A los elementos del
producto cartesiano de los ejes (dimensiones) se les llama medida. A los elementos
del
productocartesiano de los ejes (dimensiones) se le llama coordenadas. La matriz
definida, puede ser dispersa. (Es una función
parcial).
Cubos e hipercubos de datos
Los cubos de información o cubos OLAP funcionan como los cubos de
rompecabezas en los juegos, en el juego se trata de armar los colores y en el
data warehouse se trata de organizar los datos por tablas o relaciones; los
primeros (el juego) tiene tres dimensiones, los cubos OLAP tienen un
número indefinido de dimensiones, razón por la cual
también reciben el nombre de hipercubos. Un
cubo OLAP contendra datos de una determinada variable que se desea
analizar, proporcionando una vista lógica de los datos provistos por el
sistema de información hacia el data warehouse, esta vista estara
dispuesta según unas dimensiones y podra contener
información calculada. El analisis de los datos esta
basado en las dimensiones del hipercubo por lo tanto, se
trata de un analisis multidimensional.
A la información de un cubo puede acceder el
ejecutivo mediante ¨tablas dinamicas¨ en una hoja de
calculo o atraves de programas personalizados. Las
tablas dinamicas le permiten manipular las vistas (cruces, filtrado,
organización, totales) de la información de mucha facilidad.
Las diferentes operaciones que se pueden realizar con cubos de
información se producen con mucha rapidez. Llevando estos conceptos a un data warehouse, este es una colección de datos que
esta formada por dimensiones y variables, entendiendo como dimensiones a aquellos elementosque
participan en el analisis y variables a los valores que se desean
analizar.
Operadores datos agregados multidimensionales
A pesar de los buenos resultados obtenidos con el modelo relacional en los
sistemas Operacionales, la utilización de este modelo en aplicaciones orientadas
a la toma de decisiones presenta varias carencias, Una de las principales
carencias es el bajo rendimiento de las consultas: el modelo relacional
esta orientado a transacciones que manejan pocos registros
simultaneamente, mientras que los sistemas de ayuda a la toma de
decisiones (DSS) tienden a procesar grandes volúmenes de datos.
Otra de las limitaciones es la propia estructura de la base de datos: las
consultas realizadas en los DSS son muy complejas y su definición no
esta fijada de antemano. Como
las consultas dependen de lo que necesite el usuario en cada momento, con un modelo relacional se debería generar un
índice por cada posible consulta que desee el usuario, lo que dificulta
la gestión y mantenimiento de la base de datos. Por otra parte, si lo
que se quiere es acceder a un dato individual
basico como puede ser el importe de una
operación concreta, la ventaja del
modelo multidimensional desaparece en favor del relacional. Éstos son capaces de
recuperar un dato individual con mayor eficiencia que
las multidimensionales y, dada su utilización masiva en sistemas OLTP,
estan optimizados para la inserción de registros y el control
concurrente de usuarios. En el modelo de datos multidimensional,los datos se organizan en torno a los conceptos de la
empresa y la estructura de datos manejada en este modelo son matrices
multidimensionales o hipercubos.
Un hipercubo consiste en un conjunto de celdas, de tal
manera que cada una esta identificada por la combinación de los
miembros de las diferentes dimensiones y contiene el valor de la medida
analizada para dicha combinación de dimensiones. Las variables o medidas
son aquellas características del negocio que pueden ser
cuantificadas y son seleccionadas para el analisis. Por ejemplo: ventas,
compras, costes Se corresponden con los datos
numéricos. Los valores que toman las variables son el
resultado de las diferentes combinaciones posibles de los miembros de las
dimensiones sobre las que se definen.
Consultas multidimensionales de datos
Las consultas Dbase constan de archivos que permiten realizar muchas tareas
diferentes con los datos. Se pueden utilizar las consultas
para controlar los campos de datos que se pueden ver. También se pueden
utilizar las consultas para controlar los registros que visualiza Dbase.
Las consultas pueden cambiar el orden de presentación
de datos y pueden incluso actualizarlos. Las consultas no contienen
información de la base de datos, sino tan solo las instrucciones
necesarias para seleccionar los registros y campos requeridos de una base de
datos.
Consulta de un campo para una entrada caracter
Se pueden crear consultas simples para encontrar todos los registros que
contienen una entrada decaracter específica. Se
puede utilizar la coincidencia exacta u operadores relacionales cuando se
realiza la búsqueda. Puesto que se deben encerrar las cadenas de
caracteres entre comillas, se puede buscar una coincidencia exacta colocando la
cadena de caracteres que se necesite encontrar entre comillas.
Almacenamiento y uso de consultas.
Dbase IV puede almacenar una consulta como archivo. Esto ofrece la
ventaja de reutilizar la consulta posteriormente sin reentrar en ella. Para utilizar cualquier consulta almacenada en disco
se selecciona un archivo de consultas del panel de consultas del centro de control con la apropiada base
de datos en uso. Las condiciones que también se
denominan filtros establecidas por esta consulta se ponen en vigor
automaticamente para ocultar los registros que presenta Dbase. Se puede utilizar para afectar a la visualización de los
registros sobre la pantalla o para restringir los registros presentados en los
informes que se crean.
Consulta de campos numéricos
La búsqueda de valores numéricos permite operar con todos los
registros de empleado con un código de trabajo específico o todos
los registros de un número de cliente particular. Se controlan los
registros que cumplan la consulta en base a los contenidos de un campo
numérico en lugar de un campo caracter, pero la mayor parte de las
características de las consultas utilizadas para campos numéricos
son exactamente las mismas que se utilizan para campos de caracter.
Se pueden utilizar ejemplosde coincidencia exacta para
localizar datos. Puesto que estamos trabajando con datos
numéricos, las comillas no se necesitan. También se puede
utilizar muchos de los operadores relacionales que utilizaron con los campos de
caracter.
Consulta de campo de fecha
La consulta de los campos de fecha no es diferente del acceso a otros tipos de campos. Dbase
reconoce los campos de fecha y los trata como una entrada de fecha si se
incluyen de las llaves . Se utilizan los ejemplos bajo este
tipo de campos para encontrar una coincidencia exacta o relacional. Se pueden utilizar ejemplos relacionales para localizar todos los
registros anteriores y posteriores a una fecha dada. También se
pueden encontrar registros dentro de un rango
especifico de fechas colocando en el ejemplo dos expresiones relacionadas
separadas por coma (,).
Consultas de campos lógicos
Los campos lógicos contienen indicadores de verdadero o falso.
Cuando se crea un ejemplo de un campo lógico,
se puede hacer que Dbase busque valores verdaderos o falsos colocando .T. o .F.
como un ejemplo debajo del tipo de campo. Dbase también
acepta .t., .f., ..f., .Y.,
.N., .y., y .n., como
entradas para este campo.
Las operaciones mas comunes realizadas sobre los datos
multidimensionales son: cube y roll up definidas en Cube calcula todas las
posibles agregaciones que resultan de las combinaciones de atributos incluidos
en la clausula de la consulta, generando totales y subtotales para
dichas combinaciones de los atributos.