大学计算机应用基础
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第四节 多媒体技术

多媒体时代的来临,为人们勾勒出一个多姿多彩的视听世界。多媒体技术的应用是20世纪90年代计算机的时代特征,是20世纪90年代计算机的又一次革命。它不是某个设备所要进行的变革,也不是某种应用所特别需要的特殊支持,而是在信息系统范畴内的一次革命。关于信息处理的思想、方法乃至观念都会由于多媒体的引入而产生极大变化。

多媒体技术是基于计算机技术的综合技术,它包括数字信号处理技术、音频和视频技术、计算机硬件和软件技术、人工智能和模式识别技术、通信和图像技术等。它是处于发展过程中的一门跨学科的综合性高新技术。

一、多媒体技术的基本概念

(一)什么叫媒体

媒体又称媒介、介质,英文是medium(单数)和media(复数),是信息表示和传播的载体。在计算机科学中,媒体的概念非常重要,主要是指以信息为中心的媒体,包括文字、图形、图像、声音、动画等。根据国际电信联盟(ITU)下属的国际电报电话咨询委员会(CCITT)的定义,与计算机信息处理有关的媒体有以下5种:

1. 感觉媒体

感觉媒体实际上是信息的自然表示形式,它直接作用于人的感官,使人直接产生感觉。例如,人类的各种语言、音乐,自然界的各种声音、图形、静止或运动的图像,计算机系统中的文件、数据和文字等。

2. 表示媒体

表示媒体是指信息在计算机中的表示形式,通常是各种信息的编码。例如,字符的ASCII码与汉字的编码都属于表示媒体。再如,语音编码、图像编码等也都是为了加工、处理和传输媒体而人为地进行研究、构造出来的一类媒体。

3. 表现媒体

用于把感觉媒体转换成表示媒体,表示媒体转换成感觉媒体的物理设备。前者是计算机的输入设备,如鼠标、键盘、扫描仪、话筒等,后者是计算机的输出设备如显示器、打印机、绘图仪、音箱等。

4. 存储媒体

存储媒体用于存放表示媒体,即存放感觉媒体数字化后的代码。因此,存放媒体实际上是存储信息的实体,常见的存储媒体有磁带、磁盘、光盘等。

5. 传输媒体

传输媒体实际上是传输介质,它是将媒体从一处传送到另一处的物理载体,如双绞线、同轴电缆、光纤等。

多媒体技术中的媒体主要是指信息的表示形式。

(二)多媒体基本元素

多媒体的元素种类很多,表现方式也很多,将各种元素进行综合统一地组织和安排,充分发挥各元素之所长,就可以形成一个完美的多媒体节目。在一般的多媒体节目中,展示给用户的元素主要包括文本、图形、静止图像、动画、影片、音响效果、音乐、交互问答等。

(三)多媒体技术的基本特征

多媒体技术是指利用计算机技术把文本、声音、图形、图像等多种媒体综合一体化,使它们建立逻辑联系,并能进行加工处理的技术。这里所说的“加工处理”主要是指对这些媒体的录入、压缩和解压缩、存储、显示、传输等。

多媒体技术具有以下一些基本特征:

1. 综合性

多媒体技术的综合性是指将计算机、声像、通信技术合为一体,是计算机、电视机、录像机、录音机、音响、游戏机、传真机等性能的大综合,将多种媒体有机地组合在一起,共同表达一个完整的多媒体信息,使声、文、图、像一体化。

例如,通过一张光盘就可以看到唐诗、宋词、红楼梦等名著的全部文字,还配有赏心悦目的背景音乐和画面,伴随着悦耳的朗读,时而配合有人物活动的画面,甚至还可以插入一段影视片断,使人们通过感官获取知识,并得到全身心的享受。

2. 交互性

交互性是指人和计算机能“对话”,以便进行人工干预控制。交互性是多媒体技术关键特征。

例如,在上述光盘中,用户可以自选字体、颜色、阅读速度、是否要配音乐等;还可以自设“书签”,便于进行前翻后找;根据作者、年代、书名等进行检索,从而可以快速找到需要的文章。

3. 数字化

数字化是指多媒体中的各个媒体都是以数字形式存放在计算机中。

4. 实时性

多媒体技术是多种媒体集成的技术,在这些媒体中,有些媒体(如声音和图像)是与时间密切相关的,这就决定了多媒体技术必须要支持实时处理。

5. 集成性

多媒体的集成性主要体现在多媒体信息的集成和操作媒体信息的工具和设备的集成两个方面。多媒体技术可以集文字、文本、图形、图像、视频、声音等多种信息于一体,所有的这些信息媒体应按照一定的数据模型和组织结构集成。硬件的集成和软件的集成为多媒体系统的开发和实现建立了一个很好的集成环境。

(四)多媒体技术的应用

多媒体技术的应用领域非常广泛,不仅涉及到计算机的各应用领域,也涉及到电子产品、通信、传播、出版、商业广告及购物、文化娱乐等领域或行业,并进入到人们的家庭生活和娱乐中。综合起来,多媒体技术已成功应用于以下几个方面。

1. 教育与培训

多媒体技术为丰富多彩的教学方式又增添了一种新的手段。多媒体技术可以将课文、图表、声音、动画、影片和录像等组合在一起构成教育产品,这种图、文、声、像并茂的场景将大大提高学生的学习兴趣和接受能力,并可以方便地进行交互式的指导和因材施教。

2. 商业领域

多媒体技术在商业领域的应用也是十分广泛的,例如在商品广告、商品展示、商业演讲等方面的应用,使人们有一种身临其境的感觉。

3. 信息领域

利用CD-ROM大容量的存储空间,与多媒体声像功能结合,可以提供大量的信息产品,如百科全书、地图系统、旅游指南等电子工具,还有如电子出版物、多媒体电子邮件、多媒体会议、计算机对多媒体的支持、电脑购物等都是多媒体在信息领域中的应用。

4. 娱乐与服务

多媒体技术用于计算机后,使声音、图像、文字融于一体,用计算机既能听音乐,又能看影视节目,使家庭文化生活进入到一个更加美妙的境地。多媒体计算机还可以为家庭提供全方位的服务,如家庭教师、家庭医生、家庭商场等。

二、多媒体计算机系统

多媒体计算机系统是指能够综合处理文本、图形、图像、动画、音频、视频等多种媒体信息的计算机系统。

(一)多媒体计算机系统的基本组成

多媒体计算机系统主要由多媒体计算机硬件系统和多媒体计算机软件系统组成。

1. 多媒体硬件系统简述

一般作为多媒体系统的计算机,用普通计算机配上声卡、光驱、音箱就可以了,而作为多媒体制作系统的计算机则要求内存、硬盘的容量较大,对显卡和显示器的要求也比较高,并根据制作对象的不同,需要配备扫描仪、数码相机、视频采集卡及其他音频、视频采集和压缩设备。

多媒体计算机硬件系统主要包括以下几个部分:

(1)多媒体主机,如个人机、工作站、超级微机等;

(2)多媒体输入设备,如摄像机、电视机、麦克风、录像机、录音机、扫描仪、CD -ROM等;

(3)多媒体输出设备,如打印机、绘图仪、音响、电视机等;

(4)多媒体存储设备,如硬盘、光盘等;

(5)多媒体功能卡,如视频卡、声音卡、压缩卡、家电控制卡、通信卡等;

(6)操纵控制设备,如鼠标、操纵杆、键盘、触摸屏等。

2. 常用多媒体功能卡

图1-27 声 卡

(1)声 卡

声卡又称为音频卡,是多媒体计算机中必不可少的设备。我们已经知道,计算机能够处理的信息是二进制信息即数字信号,而麦克风、音箱等设备用的是模拟信号,声卡的作用就是用来实现数字信号与模拟信号之间的转换。也就是说声卡可以将多媒体中的音频信息输出到声音的输出设备,如耳机、音箱,也可以将外部的声音输入到计算机中。

(2)显 卡

显卡全称显示接口卡(Video card,Graphics card),又称为显示适配器配置卡(Video adapt-er),简称为显卡,是连接显示器和个人电脑主板的重要元件,也是“人机对话”的重要设备之一。

显卡的用途是将计算机系统所需要的显示信息进行转换驱动,并向显示器提供行扫描信号,控制显示器的正确显示,简单讲就是将主机的输出信息转换成字符、图形和颜色等信息,传送到显示器上显示。显卡作为电脑主机里的一个重要组成部分,承担输出显示图形的任务,对于从事专业图形设计的人来说显卡非常重要。

显卡分为独立显卡和集成显卡。

集成显卡是将显示芯片、显存及其相关电路都做在主板上,与主板融为一体。集成显卡的显示效果与处理性能相对较弱,不能对显卡进行硬件升级,但可以通过CMOS调节频率或刷入新BIOS文件实现软件升级来挖掘显示芯片的潜能。集成显卡的优点是功耗低、发热量小。(现在部分集成显卡的性能已经可以媲美入门级的独立显卡)

独立显卡是指将显示芯片、显存及其相关电路单独做在一块电路板上,自成一体而作为一块独立的板卡存在,它需占用主板的扩展插槽(ISA、PCI、AGP或PCI-E。独立显卡单独安装有显存,一般不占用系统内存,在技术上也较集成显卡先进得多,比集成显卡能够得到更好的显示效果和性能,容易进行显卡的硬件升级。其缺点是系统功耗有所加大,发热量也较大。

图1-28 独立显卡

2. 多媒体计算机软件系统

多媒体计算机软件的主要任务是将硬件有机地组织在一起,使用户更方便地使用多媒体信息。多媒体计算机软件也分为多媒体系统软件和多媒体应用软件。

多媒体系统软件是以操作系统为基础的,除此之外,还有多媒体数据库管理系统、多媒体压缩/解压缩软件、多媒体声像同步软件、多媒体通信软件及各种多媒体开发工具等。特别需要指出的是,多媒体系统在不同领域中的应用需要多种开发工具,而多媒体开发和创作工具多为多媒体系统提供了直接方便的创作途径,一些多媒体开发软件包提供了图形、彩色板、声音、动画、图像及各种媒体文件的转换和编辑手段,例如Flash、3 D Studio MAX、Authorware、Director等多媒体设计软件。

多媒体应用软件又称为多媒体应用系统或多媒体产品,它是由各种领域的开发人员利用多媒体编程语言或多媒体开发工具软件创作的最终多媒体产品。

三、多媒体相关知识

(一)声音的基本概念

由物体振动产生的压力波通过空气运动振动内耳的小骨头,振动转化为微小的电子脑波,就是人们所说的声音。声音的强弱体现在声波的振幅上,音调的高低体现在声波的周期或频率上。不同的声音有不同的频率范围,人类能够听到的声音的频率范围在20~20000 Hz之间。

人们把在时间和幅度上都是连续的声音信号称为模拟信号,在日常生活中我们接触到的声音都属于模拟信号。我们已经知道计算机只能处理二进制信息,因此在把声音信号输入到计算机时,我们必须要把声音信号转换成二进制信息,这个过程称为“数字化”,“数字化”的声音叫做“数字音频信号”。声音的数字化过程有三步,首先按一定的频率对声音采样,采样频率越高,声音的保真度越高;然后对每个样本进行模数转化,转换精度越高噪音越小;最后再对产生的二进制数进行编码,按照统一的格式表示。

音频文件通常分为两类:声音文件和MIDI文件。声音文件是指通过录音设备录入的原始声音,直接记录了真实声音的二进制采样数据,文件比较大。MIDI文件是一种音乐演奏指令序列,可以利用声音输出设备或与计算机相连的电子乐器进行演奏。MIDI文件不包含声音数据,所以文件比较小。

(二)常用的音频文件格式

1.WAV格式

Wave Audio File(WAV)是Windows使用的标准数字音频文件格式,由微软公司和IBM公司共同开发的PC标准声音格式。

WAV格式音效可以逼真地模拟出自然界的各种声音效果,例如风雨声、枪炮声等。但WAVE文件占用很大的存储空间,以一首使用16 bit、44.1 KHz的采样精度录制的齐秦《狼》为例,5分27秒的长度需要占用约58 MB的空间。为了节省存储空间,人们使用各种算法对WAVE文件进行压缩,时下最为流行的MP3就是一种高压缩比低失真的压缩算法,《狼》压缩为MP3文件后仅用5 MB左右。

2.MIDI

MIDI(乐器数字化接口),是一种用于计算机与电子乐器之间进行数据交换的通信标准。MIDI文件(通常以.mid为文件的扩展名)记录了合成MIDI音乐的各种控制指令,包括发声乐器、所用通道、音量大小等。由于MIDI文件本身不包含任何数字音频信号,因而所占用的存储空间比WAVE文件要小很多。

MIDI音乐在各种游戏和多媒体光盘上很常见。有些声卡采用FM合成技术来演奏MIDI,由于这是一种模拟乐器的方法,因此,音色与真实乐器有所不同。如果采用波表(wavetable)合成技术实现MIDI合成,由于它使用存储在声卡ROM中的真实乐器的数字化录音,所以能够产生更饱满、更逼真的音效。

3.AIFF格式

音频交换文件格式,是苹果计算机公司为以Macintosh操作系统为平台及应用程序所支持而开发的一种声音文件格式。

4.Audio格式

Audio文件是一种经过压缩的数字声音格式,文件的扩展名是au,是Internet中常用的声音文件。

5.MP1、MP2、MP3格式

MP1、MP2和MP3是对MPEG音频文件进行压缩后形成的文件。MPEG压缩是一种有损压缩,根据压缩质量和编码的复杂程度分为3层,分别对应MP1、MP2和MP3文件。MP3的压缩率可以达到10:1~12:1,也就是说1分钟的CD音乐未经压缩需要10 MB,压缩后只有1 MB左右,而且音质基本保持不失真。

6.WMA格式

WMA的全称是Windows Media Audio,是微软公司推的一种音频格式。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18,生成的文件大小只有相应MP3文件的一半。

(三)数字图像处理基础知识

数字图像处理又称为计算机图像处理,是指将图像信号转换成数字信号后利用计算机处理的过程。

1. 像素与分辨率

“像素”(Pixel)是由Picture(图像)和Element(元素)这两个单词的字母所组成的,是用来计算数码影像的一种单位,如同摄影的相片一样,数码影像也具有连续性的浓淡阶调,我们若把影像放大数倍,会发现这些连续色调其实是由许多色彩相近的小方点所组成,这些小方点就是构成影像的最小单位“像素”(Pixel)。

图像分辨率是指一幅图像的像素的度量,一般是每英寸的像素点,如果图像的分辨率是72 dpi,即每英寸72个像素,每平方英寸上有5184个像素。如果图像中的像素是固定的,则增加图像的尺寸就会降低图像的分辨率。

2. 图像文件的格式

图像文件有很多存储格式,在不同的环境下所使用的图像格式是不同的。下面简单介绍一些常用的图像格式。

(1)BMP格式

BMP是英文Bitmap(位图)的简写,它是Windows操作系统中的标准图像文件格式,能够被多种Windows应用程序所支持。随着Windows操作系统的流行与丰富的Windows应用程序的开发,BMP位图格式理所当然地被广泛应用。这种格式的特点是包含的图像信息较丰富,几乎不进行压缩,但由此导致了它与生俱生来的缺点---占用磁盘空间过大。

(2)JPEG格式

JPEG是Joint Photographic Experts Group(联合图像专家组)的缩写,文件扩展名为jpg或jpeg,是最常用的图像文件格式,用有损压缩方式去除冗余的图像和彩色数据,获得极高的压缩率的同时能展现十分丰富生动的图像。JPEG还是一种很灵活的格式,具有调节图像质量的功能,允许使用不同的压缩比例对这种文件压缩,比如我们最高可以把1.37 MB的BMP位图文件压缩至20.3 KB。

JPEG应用非常广泛,特别是在网络和光盘读物上,目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快,使得Web页有可能以较短的下载时间提供大量美观的图像,JPEG同时也就顺理成章地成为网络上最受欢迎的图像格式。

(3)GIF格式

GIF格式是输出图像到网页最常采用的格式。GIF采用LZW压缩,将色彩限定在256色以内,最小颜色数为2,因此更大地缩小了图像的尺寸。由于GIF格式支持动态图像和透明背景,因此在网络上比较流行。

(4)PSD格式

PSD格式是Photoshop的默认格式。PSD是一种标准的图形文件格式,是目前唯一支持全部色彩模式的图像文件,它可以很好地保存图层、通道、路径、蒙板等信息。

(5)PNG格式

PNG格式是一种新型的文件格式,采用无损压缩的方式,是专门为网络优化压缩图像而设计的。PNG格式支持动态图像和透明背景,有人预计PNG格式将会是网络图像的主要格式。

(6)TIFF格式

TIFF格式是一种非失真压缩格式,压缩比为2~3倍,这种压缩时将文件本身压缩,即把文件中某些重复信息采样一种记录方式,文件可完全复原,能保持原有图像的颜色和层次,图像的质量很好,主要用于排版印刷。

(7)DWG格式

DWG格式是一种矢量图的文件格式,是AutoCad使用的格式。

(四)视频处理技术基础知识

在多媒体应用系统中,视频以直观、生动等特点吸引众多用户,并得到广泛应用。视频与动画一样都是由一幅幅图像帧组成的,这些帧以一定速率播放时,就得到连续运动的感觉。

1. 数字视频的获取

数字视频的来源主要有以下种形式:

(1)利用计算机生成的动画,如把GIF动画格式转换为AVI等视频格式;

(2)另一种是把静态图像或图形文件组合成视频文件;

(3)还可以通过视频采集卡把模拟视频转换成数字视频,并以数字视频文件的格式保存。

2. 视频文件的格式

随信息技术的快速发展,电子产品的大众化速度也日益加快,数码相机、数码摄像机进入家庭,我们可以通过视频编辑工具软件把各种视频片段、图像进行剪辑、配音、添加字幕、制作各种特效等,做出理想的视频。数字视频均以文件的形式存储,视频文件的使用一般与标准有关。常用的视频文件有以下几种格式。

(1)AVI格式

AVI(Audio Video Interleaved),音、视频交错格式,是由微软公司开发的一种数字音频和视频文件格式,最初仅用于视窗视频操作环境,现在已被大多数计算机操作系统支持。

AVI格式允许视频和音频交错在一起同步播放。AVI格式一般用于保存电影、电视等各种影像信息,也常常放在互联网上,供用户下载并欣赏。

(2)QuickTime格式

QuickTime(MOV)文件格式是Apple公司为其生产的Macintosh计算机推出的视频文件格式,现在已发展到支持Windows平台的计算机。QuickTime格式支持25位彩色,支持RLE、JPEG等领先的压缩技术,可以提供150多种视频效果,并配有200多种MIDI兼容音响和设备的声音装置。QuickTime以其领先的多媒体技术和跨平台特性、较小的存储空间要求、技术细节的独立性以及系统的开放性得到用户的认可,目前已成为数字多媒体软件技术领域的事实上的工业标准。

(3)MPEG格式

MPEG格式是采用MPEG运动图像压缩算法的国际标准(Motion Picture Experts Group)进行压缩的全运动视频图像文件,采用有损压缩压缩方法减少运动图像中的冗余信息。MPEG格式包括MPEG-1、MPEG-2和MPEG-4。MPEG-1广泛应用与VCD制作和一些视频片段下载的网络应用中,MPEG-1压缩算法可以把120分钟长的电影压缩到1.2 GB左右。MPEG-2应用于DVD制作。MPEG-4是一种新的压缩算法,可将120分钟长的电影压缩到300 MB左右的视频,供网络用户观看。MPEG的压缩比平均为50:1,最高可达200:1,有很高的压缩效率,同时图像和音质也非常好,且在PC机上有统一标准格式,兼容性强。

(4)RM格式

RM(Real Media)格式是有由Real Networks公司开发的一种能够在低速率的网络上传输的音频视频文件,可以根据网络数据传输速率的不同而制定不同的压缩比率,从而实现在低速网上进行影像数据的实时传送和播放。

RM格式包括Real Audio、Real Video和Real Flash文件。Real Audio用来传输接近CD音质的音频文件,Real Video用来传输连续视频文件,Real Flash是Real Networks公司和微软公司合作推出的一种高压缩比的动画格式。

(5)ASF格式

ASF格式是微软公司推出的一种可以在Internet上观看视频节目的视频文件压缩格式,它的视频采用了MPEG-4的压缩算法,音频部分采用了WMA的压缩格式。