-
第10 章 多媒体数据库技术
数据管理技术的发展可以大体归为三个阶段:人工管理文件系统数据库管理系统.
人工管理 这一阶段(20世纪50年代中期以前),计算机主要用于科学计算.外部存储器只有磁带、卡片和纸带等还没有磁盘等直接存取存储设备.软件只有汇编语言,尚无数据管理方面的软件.数据处理方式基本是批处理.这个阶段有如下几个特点: 1.计算机系统不提供对用户数据的管理功能.用户编制程序时,必须全面考虑好相关的数据,包括数据的定义、存储结构以及存取方法等.程序和数据是一个不可分割的整体.数据脱离了程序就无任何存在的价值,数据无独立性. 2.数据不能共享.不同的程序均有各自的数据,这些数据对不同的程序通常是不相同的,不可共享;即使不同的程序使用了相同的一组数据,这些数据也不能共享,程序中仍然需要各自加人这组数据,谁也不能省略.基于这种数据的不可共享性,必然导致程序与程序之间存在大量的重复数据,浪费了存储空间. 3.不单独保存数据.基于数据与程序是一个整体,数据只为本程序所使用,数据只有与相应的程序一起保存才有价值,否则就毫无用处.所以,所有程序的数据均不单独保存.
文件系统 在这一阶段(20世纪50年代后期至60年代中期)计算机不仅用于科学计算,还利用在信息管理方面.此时,外部存储器已有磁盘、磁鼓等直接存取的存储设备.软件领域出现了操作系统和高级软件.操作系统中的文件系统是专门管理外存的数据管理软件,文件是操作系统管理的重要资源之一.数据处理方式有批处理,也有联机实时处理.这个阶段有如下几个特点: 1.数据以"文件"形式可长期保存在外部存储器的磁盘上.. 2.数据的逻辑结构与物理结构有了区别,但比较简单.程序与数据之间具有"设备独立性",即程序只需用文件名就可与数据打交道,不必关心数据的物理位置.由操作系统的文件系统提供存取方法(读/写). 3.文件组织已多样化.有索引文件、链接文件和直接存取文件等.但文件之间相互独立、缺乏联系.数据之间的联系要通过程序去构造. 4.数据不再属于某个特定的程序,可以重复使用,即数据面向应用.但是文件结构的设计仍然是基于特定的用途,程序基于特定的物理结构和存取方法,因此程序与数据结构之间的依赖关系并未根本改变. 5.对数据的操作以记录为单位.这是由于文件中只存储数据,不存储文件记录的结构描述信息.文件的建立、存取、查询、插人、删除、修改等所有操作,都要用程序来实现.
随着数据管理规模的扩大,数据量急剧增加,文件系统显露出一些缺陷: a.数据冗余.由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储. b.不一致性.这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎,就可能使同样的数据在不同的文件中不一样. 数据联系弱.这是由于文件之间相互独立,缺乏联系造成的. c.文件系统阶段是数据管理技术发展中的一个重要阶段.在这一阶段中,得到充分发展的数据结构和算法丰富了计算机科学,为数据管理技术的进一步发展打下了基础,现在仍是计算机软件科学的重要基础.
数据库管理系统 这一阶段(60年代后期),数据管理技术进入数据库系统阶段.数据库系统克服了文件系统的缺陷,提供了对数据更高级、更有效的管理.这个阶段的程序和数据的联系通过数据库管理系统来实现(DBMS)
近年来,随着多媒体数据库的引入,对数据的管理方法又开始酝酿新的变革.我们知道,传统数据库的模型主要针对整数、实数、定长字符等规范数据.数据库的设计者必须把真实的世界抽象为规范数据,这要求设计者具有一定的技巧,而且在一定情况下,这项工作会特别的困难.即使抽象完成了,抽象得到的结果往往会损失部分的原始信息,甚至会出现错误.当图像、声音、动态视频等多媒体信息引入计算机之后,可以表达的信息范围大大扩展,但又带来许多新的问题.在这种情况下,如何使用数据库系统来描述这些数据呢?另一方面,传统数据库可以在用户给出查询条件之后迅速地检索到正确的信息,但那是针对使用字符数值型数据的.现在,我们面临着这样的问题:如果基本数据不再是字符数值型,而是图像、声音,甚至是视频数据,那我们将怎样检索?如何表达多媒体信息的内容?我们应该如何组织这些数据呢?查询应该如何进行?这些都是我们不得不考虑的.
多媒体数据库是数据库技术与多媒体技术结合的产物.多媒体数据库不是对现有的数据进行界面上的包装,而是从多媒体数据与信息本身的特性出发,考虑将其引入到数据库中之后而带来的有关问题.多媒体数据库从本质上来说,要解决三个难题.第一是信息媒体的多样化,不仅仅是数值数据和字符数据,要扩大到多媒体数据的存储、组织、使用和管理.第二要解决多媒体数据集成或表现集成,实现多媒体数据之间的交叉调用和融合,集成粒度越细,多媒体一体化表现才越强,应用的价值也才越大.第三是多媒体数据与人之间的交互性.没有交互性就没有多媒体,要改变传统数据库查询的被动性,能以多媒体方式主动表现.
10.1.1 多媒体数据库的数据
数据是表征事物特性的,它们可以取自于现实世界,也可以通过模拟构造产生.因此,数据可以有原始型、描述型或指示型三种数据形式存在于计算机中.
10.1多媒体数据库概述
1、原始的数据
原始的数据是根据实物采集而得到的,例如,声音或图像的采集.当对采样数据进行A/D转换后,可以得到一系列相关的二进制信号,这些二进制信号就代表着原始的,不带有任何特殊附加符号的文件格式.
2、描述性数据
描述性数据通常是带有说明特征的,可以是关键词、语句、段落,或者是语音或声音.并且数据可以采用结构化或非结构化形式.
3、指示性数据
指示性数据通常以多媒体元素的参数为内容,即为多媒体元素的特征赋予特定的语义.例如表示图像大小的高和宽、表示线条的粗或细、表示声音的强或弱等.
2、描述性数据
3、指示性数据
多媒体数据库是一种数据容器,是因某种应用的需要而建立的,目的是组织有特定联系的数据,以便对这些数据进行管理、运用和共享.多媒体数据库所组织的数据可以包括数值、字符串、文本、图形、图像、声音、和视像等.
1、数值
在数据库中,数值可以用来表征事物的大小或高低等简单属性,例如,人事档案库中的年龄、工资、身材等.也可以表示事物的类别、层次等,如性别、部门、学历等.对数值数据可以进行算术运算,可以提供有关事物的统计特征.
2、字符串
字符串即由数字、字母或其它符号连接组成的符号串,其形式近乎于事物本身的特征,并常通过各个角度对事物进行描述,例如,电话号码、地址、时间等.对字符串数据可以进行连接运算,在数据库管理中是较便于检索的一种类型.
3、文本
大量的字符串组成文本数据.文本主要以自然语言对事物进行说明性的表示,例如,简历、备注等.其内容抽象度高,计算机理解需要基于一定的技术.在管理上也增加了难度,例如,存储问题、语义归类问题、检索问题等.
4、图形
图形数据以点、线、角、圆、弧为基本单位,一个完整复杂的图形也可以分解为这些基本的元素来存储.此外,还必须保存各图形元素之间的位置与层次关系.例如,图形元素库、工程图纸库等.图形数据是基于符号的,因此存储量小,便于存取和管理,但图形的使用以显示为主,必须结合图形显示技术.
5、图像
图像数据以空间离散的点为基础,如果对这种原始数据进行存取的话,将不利于将来对数据的检索,所以通常都通过一定的格式加以组合.数据库中常用尺寸、颜色、纹理、分割等对抽象的语义来描述图像的属性.在特定范围内,图像数据库在存取和检索方面也已经有成功的应用,例如,指纹库、人像库、形体库等.
6、音频
由于音频分为声音、语音和音乐.其中声音数据的范围太大太杂,不便于存储和管理.语音数据的存取也是建立在波形文件基础上的,鉴于语言、语音以及语气的诸多因素,波形的检索还存在着较大的难度,只有对各声波段附加数值、字符串或文本数据,并以它们作为检索的依据,才能达到非声波本身属性方面的的检索.在目前的实际应用中,只有对特定声音或特定语音的存取才具有实际意义.而音乐是表示乐器的模拟声音,它以符号方式记录信号,因此容易存取、检索和管理.它类似于图形,一段完整复杂的音乐可以分解音符、音色、音调等元素来存储.此外,还必须保存时间及其它相关属性.
7、动画和影像
动画和影像类似与图像,区别与图像的是它的表现必须时间属性的变化密切配合.动画和影像数据可以分解成文字、解说、配音、场景、剪辑以及时间关系等多种元素,在空间和时间上的管理比其它数据要复杂得多,无论是对各元素的检索还是对组合元素的检索,都存在着相当的难度.但若作为一个整体,可以如声波那样附加以特定的数数据,实现非动画和影像本身属性方面的检索.
10.1.2 多媒体数据库的体系结构
多媒体数据库的组织结构
多媒体数据库的组织结构尚未建立统一的体系结构,大致有以下几种组织结构.
组合型结构集中统一型结构客户/服务型结构(网络服务器)超媒体型结构
组合型结构
这种结构是通过整合技术连接的.组合型结构中可以拥有多个独立的媒体数据库,如文本数据库、音频数据库和图像数据库,每一种媒体数据库的设计不需要考虑和其它数据库的匹配,并且都有自己独立的数据库管理系统,如图10-1所示.
实际应用时,
…… 欲阅读全文,请下载!
- 立即下载:注意:请一定升级到最新版[OFFICE]才能正常打开本站提供的文档![常见问题指南]
- 相关文档:
- →上海市居民经济状况核对中心招聘简章
- →北京市各级机关考试录用公务员招考简章
- →中央、国家机关2004年考试录用机关工作人员和国家公务员招考简章
- →第一章 老板也在为我们工作
- →沈阳航空工业学院2009年艺术类本科专业招生简章
- →中华电信诚徵菁英人员遴选简章
- →上海市2007年考试录用公务员招考简章
- →第七章 旅游规划理论与方法
- →第六章 塑造组织形象
- →第二章 市场分析
- 更多相关 GO!→
本类下载TOP10
数据载入中…