多媒体技术与应用学什么（多媒体制作专业和数字媒体技术） - 原点资讯

学习目标：

1．理解什么是多媒体和多媒体的基本特性；

2．理解声音、图像、动画、视频等媒体信息的特性及其制作技术；

3．理解多媒体教学软件的设计与开发；

4．了解多媒体技术及其应用。

计算机以高速的计算速度、海量的存储空间、丰富的色彩表现为媒体在计算机上进行处

理和应用提供了广阔的舞台。多媒体的开发与应用，使人与计算机之间的信息交流变得生动

活泼、丰富多彩。

本章介绍多媒体技术的基本概念和关键技术，常用的媒体类型和基本应用，多媒体教学

软件的基本特点和开发流程，通过学习上述内容帮助读者理解多媒体技术的内涵。

第一节多媒体概述

多媒体技术以形象丰富的声、文、图信息和方便的交互性，极大的改善了人机界面，改

变了使用计算机的方式，从而为计算机进入人类生活和生产的各个领域打开了方便之门，给

人们的工作、生活和娱乐带来深刻的变化。因此学习多媒体技术的有关原理知识，掌握流行

的多媒体的工具，是享用信息技术成果、在信息社会中发展提供必备的基础。

一、多媒体的定义

1.媒体

一般来说，媒体（Medium）是指承载或传递信息的载体。媒体可理解为承载信息的实

际载体，如纸介质、磁盘、光盘、录像带和录音带等；媒体也可以理解为表述信息的逻辑载

体，如文字、图像、语言等。日常生活中，大家熟悉的报纸、书本、杂志、广播、电影、电

视均是媒体，都以各自的媒体形式进行着信息传播。按照国际电信联盟（ITU）建议的定义，

媒体有以下 5 种：感觉媒体、表示媒体、显示媒体、存储媒体和传输媒体。感觉媒体指的是

人接触信息的感觉形式，如视觉、听觉、触觉等；表示媒体则指的是信息的表示形式，如图

形、图像、声音、视频等；显示媒体（又称表现媒体）是表现和获取信息的物理设备，如显

示器、扬声器、摄象机等；存储媒体是存储数据的物理设备，如磁盘、光盘、优盘等；传输

媒体是传输数据的物理设备，如光缆、电缆、电磁波、交换设备等。

在计算机领域中媒体有两种含义，一是指用以存储信息的实体，如磁带、磁盘、光盘和

半导体存储器；一是指信息的载体，如数字、文字、声音、图形、图像、视频和动画等。多

媒体技术中的媒体是指后者。

2．多媒体

多媒体一词译自于 20 世纪 80 年代初出现的英文单词“Multimedia”。关于多媒体的定

义或说法有多种多样，各自从自己的角度对多媒体有不同的认识。在信息领域中，多媒体是

指文本、图形、图像、声音、影像等这些“单”媒体和计算机程序融合在一起形成的信息媒体，是指运用存储与再现技术得到的计算机中的数字信息。换句话说：文本、声音、图形、

图像、动画和视频是信息的载体，其中两个或多于两个的组合构成了多媒体。

3．多媒体信息的主要元素

（1）文本：文本一般由文字、数字和符号等构成，在计算机中文本是用字符代码及字

符格式表示出来的数据。文本是一种最基本的传播媒体，也是多媒体信息系统中出现最频繁

的媒体。

（

2）图形：图形也称矢量图形，一般指用计算机绘制的画面，如直线、圆、圆弧、矩

形、任意曲线和图表等。矢量图形文件中只记录生成图的算法和图上的某些特征点，因此对

矢量图形的各个部分分别进行控制（放大、缩小、旋转、变形、扭曲、移位等）很方便。矢

量图形一般在多媒体素材（如图像和动画）的创建过程中使用，但最后需导出为图像文件供

网页编辑使用。

（

3）图像：图像是指由照相机和摄像机等数字化采集设备捕捉的实际场景画面，或用

计算机图像处理软件创建的景物。图像是由许多的像素按照其在图像中所处的位置排列所构

成的平面点阵图。

（

4）音频：音频（一般指人耳能听到的声音）包括语音、音乐和效果声。

（

5）动画：动画是运动的画面，实质是一幅幅静态图像的连续播放所形成的动态感觉。

动画一般是指人们的主观设计而非摄像机摄下的影像。动画可分为二维动画（平面）和三维

动画（立体）两类。

（

6）视频：视频一般是指用摄像机拍摄的动态影像。视频可记录和反映真实世界的实

际场景和画面。模拟视频信号需要有专用的设备转换成数字视频信号。

4．多媒体技术

多媒体技术是一种基于计算机科学的综合技术，它包括数字化信息处理技术、音频和视

频技术、计算机软件和硬件技术、人工智能和模式识别技术、通信和网络技术等。或者说，

所谓多媒体技术是以计算机为中心，把语音、图像处理技术和视频技术等集成在一起的技术。

具有这种功能的计算机称为多媒体计算机。

二、多媒体的关键特性

多媒体具有信息载体多样性、集成性和交互性。

1．多样性

信息载体多样性指的是信息媒体的多样化，有人称之为信息多维化。计算机所能处理的

信息不再局限于数值、文本。多媒体体信息的多维化不仅仅指输入，还有输出。但输入和输

出不一定都是一样的。对于应用而言，前者称为获取（capture）后者称为表现（presentation）。

如果两者一样称之为“记录”和“重放”。如果对输入进行变换、组合和加工，就可以大大

丰富信息的表现力和效果，从而使用户更全面、更准确地接受信息。

2．交互性

交互性是多媒体计算机可以与使用者作交互性沟通的特性。交互性不仅能够为使用者提

供按照自己的意愿解决问题的性能，而且可以帮助使用者通过交谈式的沟通进行学习，以达

到增进知识及解决问题的目的。可以想象，交互性被引入到使用者的活动中，将会带来多大

的作用。

3．集成性

信息媒体的集成包括信息的多通道统一获取、多媒体信息的统一存储与组织，以及多媒体信息表现合成等各方面。也就是说不再使用单一的形态对媒体进行获取、加工和理解，而

是注意保留媒体之间的关系及其所蕴涵的大量信息。

第二节多媒体的关键技术

一、数据压缩

数据压缩技术是多媒体技术的关键技术，也是多媒体技术发展的基础。

1．什么是数据压缩

数据压缩就是以最少的数码表示信源所发的信号，减少容纳给定消息集合或数据采样集

合的信号空间。定义中的“信源”可以是数据、静止图象、语音、电视或其他需要存储和传

输的信号；“信号空间”是指信号集合所占的空域、时域和频域空间。“最少”是指在保证

信源的一定质量或者说是有效的前提下的最少。数据压缩也可以简单的定义为是信源的有效

数字表示。就是说，用尽可能少的比特数来表示源信号并能将其还原。因此，数据压缩的任

务是信源信号在一个可以接受的状况的前提下把需要的比特数减到最少程度。数据压缩包括

信源的有损压缩和无损压缩，有损压缩是指经过压缩后经解码再还原的信号与原信号不能严

格一致，无损压缩是指压缩后经解码还原的信号与原信号严格一致。

2．数据压缩的必要性

多媒体数据压缩的必要性也就是说为什么要对多媒体数据进行压缩，主要原因就是多媒

体数据的海量性，多媒体数据包括文本、声音、动画、图形、图象以及视频，数据的海量性

主要表现在声音、图像和视频数据数字化方面。下面可以举几个未经压缩信源的大致比特率

的例子来说明其海量性，如表 3.1。

表 3.1 未压缩信源的大致比特率

电话（200~3400Hz）

8000 样本数/秒×12 比特/样本=96kbps

宽带语音（50~7000Hz）

16000 样本数/秒×14 比特/样本=224kbps

宽带音频（20~20000Hz）

44100 样本数/秒×2 信道×16 比特/样本=1.412Mbps

图像

512×512 像素色彩图像×24 比特/像素=6.3 兆比特/图像（幅）

视频

640×480 像素色彩图像×24 比特/像素×30 图像/秒=221 Mbps

高清晰度电视

1280×720 像素色彩图像×60 图像/秒×24 比特/像素=1.3Gbps

从以上的例子中可以看到：经过数字化处理后其数据量是非常大的，如果不进行数据压

缩处理，计算机系统就无法对它进行存储和传输。解决这一问题的办法，数据压缩技术是个

行之有效的方法。

3．数据压缩的可能性

多媒体数据压缩是必要的，那么能否对多媒体数据进行压缩呢？根据信息论，只要信源

中存在数据冗余就存在压缩的可能性。“信息量”与“数据量”之间的关系：信息量=数据

量-冗余量，通常用“

I”表示信息量；“D”表示数据量；“du”表示冗余量，即 I = D - du。

多媒体数据能不能被压缩关键是多媒体数据中存在不存在“数据冗余”？答案是肯定的。以

图像数据为例，图像数据存在着大量的空间冗余和时间冗余。

（1）空间冗余

空间冗余也称为空域相关，一幅图像是由若干个像素组成的，在相邻像素之间相关性很大，有很大的信息冗余，这就是空间冗余。自然界的许多图像都是一种连续变化的图像，其

重要的特点是相邻的像素是相关的，彼此间变化不大。

（

2）时间冗余

时间冗余也称为时域相关。在运动图像中，相邻真之间也存在着很大的相关性。比如，

课堂直播中主讲教师的讲授，电视会议中讲话人的发言，新闻联播中主持人的播音等，背景

可能没有多大变化，而对人物来说也可能只有某些部分的变化，相邻的两真图像是相关的，

它表示在时间轴上相邻的两真图像是相似的，这种冗余为时间冗余。

（

3）其它类型的冗余

① 结构冗余

② 知识冗余

③ 视觉冗余

④ 图像区域的相同性冗余

⑤ 纹理的统计冗余

4．数据压缩技术实现的可能性

从数据压缩技术的发展历程来看，目前有五个因素成就了计算机多媒体数据压缩的可能

性。第一，经典的数据压缩技术，建立在信息论的基础上，成功的研究了数据压缩的理论极

限和数据压缩的基本途径。系统的理论研究成就了今天的压缩技术。第二，信号处理能力迅

速提高，VLSI 在数字信号处理器上的应用和高速微处理器在计算机中的应用，大大提高了

计算机能力，使原来很复杂的压缩算法能够得到迅速的处理。第三，基于主观感觉的失真衡

量体系解决了多媒体应用产品的性能评价问题。多媒体的应用大多在声音、音乐和视频方面，

接受者最终是人的耳朵和眼睛，这样是有损压缩得到广泛的应用，提高了压缩比。第四，压

缩编码标准的建立，奠定了技术产业化的基础，减少了制造商和服务商的风险，他们在产品

中融入了压缩方法。第五，网络、计算机和通信技术的不断融合和进步提供了新的需要并提

供高了数据压缩实现的接受程度，使数据压缩技术得到迅速的提高。

5．数据压缩标准及应用

多媒体技术的关键技术之一是关于多媒体数据压缩（编码）和解压（解码）算法。为了

解决不同厂家产品的兼容性问题，国际标准化协会 ISO（International Standardization

Organization），国际电子学委员会 IEC（International Electronics Committee ）,国际电信协

会 ITU（International Telecommunication Union）等国际组织于 90 年代领导制定了三个重要

的多媒体国际标准：JPEG 标准；H.261 标准；MPEG 标准。

JPEG 标准全称为“多灰度静态图像的数字压缩编码”，是用于静态图像压缩的国际标

准。目前已有 MPEG-1、MPEG-2、MPEG-4 等 3 个国际标准，正在完成的有 2 个：MPEG-7

和 MPEG-21。MPEG 压缩标准用于数字卫星广播、高清晰电视、数字录象机以及网络环境

下的电视点播（VOD）、DVD 等各方面。所熟悉的 VCD 采用的是 MPEG-1 标准；DVD 采

用的 MPEG-2 标准；MPEG-4 标准主要用于网络环境中流媒体数据的压缩。MPEG-7 标准

（ISO/IEC 15938）名称叫“多媒体内容描述接口”，是一个关于表示音/视信息的信息的标

准。MPEG-21 标准（ISO/IEC 18034），正式名称叫“多媒体框架”。MPEG-21 的目标是用

于通过网络实现数字内容的电子交易。把支持分布在大范围网络和设备中的多媒体资源的技

术透明地集成起来以支持多种功能。H.261 标准主要用于视频电话和视频会议。目前还有

H.263 标准和 H.264 标准。H.263 标准是 ITU-T 于 1995 年制定的甚低比特率视频压缩编

码标准，其传输码率可以低于 64kbps。H.263 特别适用于无线网络、PSTN 和因特网等环

境下的视频传输。H. 264 标准是 ITU-T 和 ISO/ IEC 的 MPEG 共同成立的联合视频小组 JVT

于 2003 年公布的视频编码标准。其目标是为视频编码应用提供下一代的解决方案，提供显著增强的编码效率,，同时减少 H. 263 中一些混乱的可选模式。优点是更高的压缩比和更好

的信道适应性；缺点是计算复杂度的大大增加。H.264 的目标应用涵盖了目前大部分的视

频在数字视频应用产业链的快速发展中，面对视频应用不断向高清晰度、高帧率、高压缩率

方向发展的趋势，当前主流的视频压缩标准协议 H.264（AVC）的局限性不断凸显。

VC-1 基于微软 Windows Media Video 9(WMV9)格式， 2006 年成为活动图像和电视工

程师协会(SMPTE) 视频标准。主要应用于 IPTV，HD TV，HD DVD 和移动设备。

目前，最值得一提的是 AVS 标准，AVS 是我国具有自主知识产权的视音频编码标准。

2006 年 9 月，AVS 已正式成为国际电联 ITU-T 的联络组织，意味着 AVS 标准已具备选入

ITU-T 标准体系的资格,为 AVS 的国际化道路打开了大门。 2002 年，数字音视频编解码技

术标准(AVS)工作组成立。 2006 年 1 月 6 日，信息产业部批准通过 AVS 视频部分。 2006

年 2 月，《信息技术先进音视频编码第二部分：视频》国家标准 GB/T 20090.2-2006 发布。

2006 年 3 月 1 日， GB/T 20090.2-2006 正式实施。 2007 年 4 月，ISO/IEC MPEG 在新一代

标准框架 RVC 要求支持的第一个非 MPEG 视频编码标准就是 AVS。 2007 年 5 月，AVS

列入 ITU-T IPTV FG 的内容编码标准文件，成为与 H.264、VC-1 并列的选项。

同时，面向更高清晰度、更高帧率、更高压缩率视频应用的 HEVC（High Efficiency Video

Coding）协议标准应运而生。2010 年 1 月，ITU-T VCEG(Video Coding Experts Group) 和

ISO/IEC MPEG（Moving Picture Experts Group）联合成立 JCT-VC（Joint Collaborative Team

on Video Coding）了联合组织，统一制定下一代编码标准：HEVC。HEVC（H.265）标准于

2013 年 2 月发布正式版本，由于其在压缩效率、并行处理能力以及网络适应性方面的极大

改进，它的发展和应用必将把视频编解码理论和应用推向一个新的高度。

二、超文本与超媒体

1．定义

文本是我们最熟悉的信息表示方式。文章、程序、书、文件等都以文本出现，文本的最

显著特点是他在组织上是线性的和顺序的。科学研究表明，人类的记忆是一种联想式的记忆，

它构成了人类记忆的网络结构。超文本结构就类似于人类的这种联想记忆结构，它采用一种

非线性的网状结构组织块状信息，没有固定的顺序，也不要求读者必须按某个顺序来阅读。

采用这种网状结构，各信息块很容易按照信息的原始结构或人们的“联想”关系加以组织。

图 3.1 是一个完整的小型超文本结构。

图 3.1 具有 6 个结点和 9 条链的超文本结构示意图

从图中可以看到超文本是由若干内部互连的文本块（或其他信息）组成，这些信息块可

以是计算机的若干屏，也可以是若干窗口、文件或更小信息块。这样一个信息单元就称为一

个结点（node）。每个结点都有若干指向其他结点或从其他结点指向该结点的指针，这些指

针被称为链（link）。那么，超文本可以定义为由结点和表示信息结点间相关性的链构成的

一个具有一定逻辑结构和语义的网络。超文本的主要特点可以概括为超文本不是顺序的，而

是一个非线性的网状结构。

能对超文本进行管理和使用的系统叫超文本系统。超文本与超文本系统的关系和数据库

与数据库管理系统类似。一个超文本系统一般具有以下特点：

① 在用户界面中包括对超文本的网络结构的一个显示表示，即向用户展示结点和

F链的形式。

② 给用户一个网络结构的动态总貌图，使用户在每一时刻都可以得到当前结点的邻接

环境。

③ 超文本系统一般使用双向链，这种链应支持跨跃各种计算机网络，如局域网和因特

网。

④ 用户可以通过自己思想的联想及感知，根据自己的需要动态地改变网络中结点和链，

以便对网络中的信息进行快速、直观、灵活的访问，如浏览、查询、标注等。这种联想和感

知被准确地定义，并要求有良好的性能/价格比。

⑤ 尽可能不依赖它的具体特性、命令或信息结构，而更多地强调它的用户界面的“视

觉和感觉”。

随着科学技术的进步，人们不仅只是利用文本，还可以利用图形、动画、声音、视频图

像等各种媒体信息进行信息的传递。超文本的结点不再仅是文本，而可以是图形、动画、声

音、视频图像等各种媒体信息时，称之为超媒体，即超媒体=超文本多媒体。超文本系统

与多媒体技术结合起来，为强调处理多媒体信息的能力而称为超媒体（Hypermedia）系统，

即多种媒体的超文本系统。

2．结点、链和网络

结点和链是超文本与超媒体的组成要素。结点有许多种，而且分类方法也不尽相同。在

早期超文本中结点的内容一般是有形的结点，内容主要是文本、符号或数字。现在根据媒体

的种类、媒体的内容和功能的不同，结点可以是媒体结点，其中可以包含各种媒体，也可以

包含数据库、文献等；也可以是动作类结点、组织类结点、推理类结点等。

链，又称超链（hyperlink），是结点间的信息联系，它以某种形式将一个结点与其他结

点连接起来。由于超媒体没有规定链的规范与形式，所以分类方法也不尽相同。但最终达到

的效果却是一致的。即建立起结点之间的联系。链是有向的，一般结构可分为三个部分：链

源、链宿及链的属性。链源是导致浏览过程中结点迁移的原因，可以是热标、媒体对象或结

点等。链宿是链的目的所在，可以是结点，也可以是其他任何媒体内容。链的属性决定链的

类型。用于导航和信息检索的链类型有：基本链、移动链、缩放链、全景链和视图链等；用

于推理和组织的链类型有：索引链、执行链、蕴含链、Is_a 链和 Has_a 链等。

超文本是一种网络信息结构形式，按照信息在现实世界中的自然联系以及人们的逻辑思

维方式有机地组织信息，使其表达的信息更接近现实生活。超文本中由结点和链构成网络信

息获取的路径，通过交互式的浏览、查询来获取信息。

3．导航

超文本的信息网络在建立信息联系的同时，也表达出作者的思维轨迹。在浏览较大型超

文本系统时，很容易迷失方向，在超文本网络中不知道身在何处。所以超文本系统中要有强

有力的导航工具，以便查看浏览线路和判断当前结点位置。目前解决迷路问题的方法主要有：

用户界面法、结构化方法、搜寻/查询方法等。

4．超文本与超媒体的发展前景

（1）由超文本向超媒体发展

从超文本到超媒体是技术发展的进步，也是技术发展的必然性。超文本向超媒体的转变

不仅是将文本媒体扩展到其他媒体，而且还要能使系统自动地判断媒体类型，并执行对应的

操作。对图像的热区，视频的热点等都能引起类似于热字的反应，多媒体的表现及基本内容

的检索等。超文本向超媒体的转变，大大地增强了功能和性能，也增加了系统实现的难度。

（

2）由超媒体向智能超媒体发展在超媒体技术的研究中,有人提出智能超媒体或专家超媒体（Expertext）。这种超媒体

打破了常规超媒体文献内部和它们之间严格的链的限制，在超媒体的链和节点中嵌入知识或

规则,允许链进行计算和推理,使得多媒体信息的表现具有智能化。

（

3）由超媒体向协作超媒体发展

超媒体建立了信息之间的链接关系，那么也可用超媒体技术建立人与人之间的链接关系，

这就是协作超媒体技术。超媒体节点与链的概念使之成为支持协同性工作的自然工具。协同

工作使得多个用户可以同一组超媒体数据上共同进行操作。这样未来的电子邮政、公共提示

板等都可能应用到超媒体系统中。

三、虚拟现实

1．虚拟现实的概念

虚拟现实 (virtual reality，简称 VR ) 或称虚拟环境 (virtual environment)，是一种逼真

的视、听、触觉一体化的计算机生成环境，用户可以借助必要的装备以自然的方式与虚拟环

境中的物体进行交互作用、相互影响，从而获得亲临等同真实环境的感受和体验。虚拟现实

= virtual reality。虚拟现实的概念模型如图 3.2 所示。

图 3.2 虚拟现实的概念模型

虚拟现实方法是将计算科学处理对象统一看作一个计算机生成空间（虚拟空间或虚拟环

境），并将操作它的人看作是这个空间的一个组成部分(man-in-the-loop)。人与计算机空间

的对象之间的交互是通过各种先进的感知技术与显示技术（即虚拟现实技术）完成。人可以

感受到虚拟环境中的对象，虚拟环境也可以感受到人对它的各种操作（类似于人与真实世界

的交互方式）。虚拟现实的主要实现方法是借助必要的装备，实现人与虚拟环境之间的信息

转换，最终实现人与环境之间的自然交互与作用。

2．虚拟现实系统的基本组成

一个虚拟现实系统一般至少包括四个基本的组成成分：输入、仿真、输出（修饰）和数

据库。每一部分都需要实时处理，否则响应时间的延时会减弱虚拟现实的临场感。

输入过程完成向虚拟现实系统输入信息的任务，主要设备包括：键盘、鼠标、跟踪球、

游戏杆、数据手套、头部跟踪器和数据衣等。输入过程主要完成了实物虚化的任务。

一般说来虚拟环境是一个动态变化的环境，仿真的目的是根据某些理论或物理规律确定

虚拟环境在每一时刻的状态，包括物体的位置、方向、变形、分解与聚合。仿真过程一般是

一个离散的过程，它以一定的时间间隔更新虚拟环境中每个物体的状态，这种更新可以根据

真实的或假想的物理规律进行，也可以根据预先定义好的脚本进行。

输出（修饰）过程完成显示任务，这里的显示不仅仅包括图像的显示，还包括声音、触

觉乃至味觉的“显示”，即根据虚拟环境的当前状态，生成虚拟环境对用户的视觉、听觉、

触觉和味觉等多种感知，将虚拟环境“显示”给用户。这个过程是一个虚物实化的过程。

人

虚拟环境

实物虚化

虚物实化数据库则记录了虚拟环境的当前状态。

3．虚拟现实的三个特征

（1）沉浸感

沉浸感（immersion）是指参与者对虚拟现实的融入程度，即参与者全身心地沉浸于计

算机所生成的三维虚拟环境，具有很好的临场感，并产生身临其境的感觉。虚拟现实的沉浸

感来源于对虚拟世界的多感知性，常见的有视觉感知、听觉感知、力觉感知、味觉感知、嗅

觉感知和身体感觉等。从理论上来说，虚拟现实系统应具备人在现实客观世界中具有所有

感知功能。

例如：参与者在“西北利亚之旅”的虚拟现实系统中，就好像坐在旅游的汽车上，观看

窗外的情景一样，具有很好的临场效果。

（

2）交互性

交互性（interaction）是指参与者可以利用各种感官功能及人类自然技能虚拟环境进行

交互考察与操作。在虚拟现实系统中，强调人与虚拟世界之间以自然的方式进行交互，如人

的走动、头的转动、手的移动等方式与虚拟现实系统交互，并借助于虚拟现实系统中特殊的

硬件设备（如数据手套、力反馈设备），实时产生真实世界中一样的感知，甚至连参与者都

意识不到计算机的存在。

例如：参与者可以用手直接抓取虚拟世界中的物体，手可以有触摸感，可以感觉到物体

的重量，能区分所抓取的是石头还是海绵，并且被抓取的物体随手的运动而运动。

（

3）构想性

构想性（imagination）是指参与者借助虚拟现实系统给出的逼真视听触觉信号而产生的

对虚拟空间的想象。可以使人类突破时间与空间，去体验世界上早已发生或尚未发生的事件；

可以使人类进入宏观或微观世界进行研究和探索；也可以完成那些因为某些条件限制难以完

成的事情。

例如：在建设一座大楼之前，传统的方法是要画各种图纸，而虚拟现实系统可以进行设

计和仿真，反映设计者的思想。

第三节媒体数据的加工与处理

一．音频数据的处理

1．声音的物理特征

人类的耳朵感觉到的空气分子的振动即为声音。也可以说声音是机械振动在弹性介质中

传播的机械波，振动越强，声音越大。声音通常用一种连续的波形来表示，波形的最大位移

称为振幅，反映音量，波形中两个连续波峰（或波谷）之间的距离称为周期 T，周期的倒数

1/T 称为频率，频率以赫兹（Hz）为单位。周期（频率）反映了声音的音调。声音按频率可

以分为三种类型：次声、可听声、超声。人类所能听到的声音频率为 20 Hz～20 kHz；低于

20 Hz 的声音为次声；高于 20 Hz 的声音为超声。

振幅和周期不变的声音称为纯音，纯音一般都是用专用电子设备产生的。在自然界中，

大多数声音，如语音、乐音等都不是纯音，它们都是由不同的振幅和频率组成的复音。在复

音中最低频一般是个常数，称为该复音的基频，基频是决定声音音调的基本因素。复音中的

其它频率通常称为谐音。基频和谐音组合，形成不同音质和音色的声音。2．数字化音频的质量与容量

采样、量化和编码技术是音频数字化的关键技术。其中采样频率、采样精度、量化精度

和音频的声道数目是反映数字化音频质量和容量的三个重要因素。采样频率是指录制过程中，

声音每秒中被采样的次数，以赫兹为单位。每秒采样 1000 次表示为 1000Hz 或 1kHz。高一

些的采样率能够增加声音录制的质量，但是需要更多的存储空间。

每个样本的可以被存储为 8 位（广播音质）或 16 位（高保真录制音质）的数字。音乐

商店出售的音频 CD 是以 44.1kHz 的采样率录制的，而且每个样本都使用了 16 位。也就是

说每秒对声音进行 44100 次采样，每采样一次就需要一个 16 位的存储空间。要想获得立体

声效果，又必须取出两个 16 位，这样每个样本就需要 32 位的存储空间。当以 44.1kHz 的采

样率对一首CD音质的立体声音乐进行采样时，一张1.44MB的软盘仅能够存储8秒的音乐，

而 45 分钟的音乐大概需要 475MB。

为节省存储空间，一些不需要这么高质量声音的应用使用了较低的采样率。经常以

11kHz 的采样率录制声音。以这个采样率录制的声音质量会低一些，但是文件大小大约仅为

44.1kHz 录制的同样声音的四分之一。

3. 音频处理的硬件

计算机的声卡负责把存储在音频文件中的数字信号转换为音乐、音响效果或讲话。声卡

是一种包含了许多输入和输出插口的设备，还包含了音频处理电路。桌面计算机的声卡通常

是插入到系统单元中的 PCI 扩展插槽上，也有另一种情况，声卡电路也可能被集成到主板

上。笔记本电脑很少会有独立的声卡，因为生产厂商会通过把声卡电路集成到主板上来节省

空间。

声卡中包含了称为 DSP（数字信号处理器）的专门电路，它的功能是负责执行三种重

要的任务：当要播放音频文件时，负责把数字比特转换成模拟波；当录制声音时，负责把模

拟波转换成数字比特转；当需要的时候，也负责处理压缩和解压缩。

当播放数字化声音时，来自音频文件的数字比特会首先从磁盘发送到微处理器，微处理

器把它们发送到声卡中，接着声卡中的 DSP 会处理任何必要的解压缩请求，然后把数据转

换成模拟波信号。最后，这些信号会被发送到扬声器发出声音。

4. 常用音频文件格式

数字音频信息在计算机中是以文件的形式保存的，为了适应不同的需要，存储音频的文

件可以有多种不同的存储格式。可以通过查看文件的扩展名来识别文件格式。常见的音频格

式有：AAC、AIFF、MP3、RealAudio、Wave、WMA。表 3.2 中提供了上述流行的音频文

件格式的概述。

表 3.2 常用音频文件格式表

音频格式

文件

扩展名

优点

缺点

AAC（Advanced

Audio Compression

高级音频压缩）

.aac

非常好的音质；压缩

过的格式，iTunes 音乐音

乐下载站点使用了它。

文件受版权保护，并

且它的使用被限制于经

过验证的设备。

AIFF(Audio

Interchange Format

音频交换文件格式)

.aif

极好的音质；浏览器

不需要插件也可以支持

它

音频数据未经处理

就被存储，未经压缩的格

式，所以文件非常大。

MP3

.mp3

虽然文件经过压缩，

但音质不错；可在 web 上

被流化处理。

需要独立的播放器

或浏览器件。RealAudio

Ra、rx

高度压缩产生了小

文件；数据可在 web 上被

流化处理

音质达不到其他格

式的水准；需要播放器或

插件。

Wave

.wav

不错的音质；浏览器

不需要插件也可以支持

它

音频数据未经处理

就被存储，未经压缩的格

式，所以文件非常大。

WMA（Windows

Media Audio,

Windows 媒体音频）

.wma

压缩过的格式，非常

好的音质；常用于音乐下

载网站

文件可以接受版权

保护；需要 Windows

Media Play 9 或更高版

本。

5. MIDI 音乐

MIDI 是 Music Instrument Digital Interface（乐器数字接口）的缩写。由世界上主要电子

乐器制造厂商建立起来的一个通信标准，以规定计算机音乐程序、电子合成器和其它电子设

备之间交换信息与控制信号的方法。MIDI 文件包含的是一些指令，用于创建不同的音高、

音量以及音调的持续时间，以使其听起来像是不同的乐器。

MIDI 是一种音乐乐谱系统。计算机将音乐编码成 MIDI 序列，并把它存储为以.mid、.cmf

或.rol 为扩展名的文件。MIDI 序列类似于钢琴演奏者的曲谱，里面包含了敲击键盘的信息，

标明演奏的是哪个音调、音调的高低和演奏的乐器设备等。大部分计算机配备声卡是利用

MIDI 文件演奏音乐的，而且有的声卡也能够从 MIDI 乐器（合成器）中采集音乐数据。

MIDI 文件的优点是比波形文件要紧凑得多，所占存储容量少。MIDI 音乐的最大缺点

是它不是高质量的声乐作品，不能回放“真实”声音。但 MIDI 音乐仍被比较广泛的应用。

6．常用音频处理工具软件

（1）Cool Edit

Cool Edit 是美国 Syntrillium Software Corporation 公司开发的一款功能强大、效果出色

的多轨录音和音频处理软件。它可以在计算机上同时处理多达 128 轨的音频信号，具有极其

丰富的音频处理效果，并能进行实时预览和多轨音频的混缩合成。

（

2）Samplitude

这是一款非常适合个人音乐工作室选用的专业级别的多轨音频录制、编辑处理软件。该

软件支持 24Bit、96KHz 的高采样率、支持无限音轨超级缩混，更重要的是采用了精确独特

的内部算法，使其功能和品质更加卓越，在音频录制和成品混缩方面具有压倒性的优势。

（

3）Sound Forge

Sound Forge 是 Sonic Foundry 公司音频录制、处理类软件的拳头产品。它几乎成了 PC

机上单轨音频处理的代名词，功能强大。与 Cool Edit 不同的是，Sound Forge 只能针对单音

频文件进行操作、处理，无法实现多轨音频的混编。

二、图像数据的处理

1．模拟图像与数字图像

什么是图像？所谓“图（picture）”

,是指用描绘或摄影等方法得到的外在景物的相似物；

所谓“像（image）”,则是指直接或间接（如拍照）得到的人或物的视觉印象。一般地讲，

凡是能被人类视觉系统所感知的信息形式或人们心中的有形想象统称为图像。传统的绘画复

制成照片、录像带或印制成印刷品，这样的转化结果称为模拟图像（Image）。它们不能直

接用电脑进行处理，还需要进一步转化成用一系列的数据所表示的数字图像。但由于在计算

机上对图像信息的表示、处理不是唯一的，一般把它们分成不同的图像类型，如位图图像、

矢量图像、动态图像、符号等。2．位图图像

位图图像通常用于创建实际的图像，比如照片。数码相机也将照片存储为位图；扫描仪

产生的图像是位图；也可以通过使用绘图软件提供的工具创建位图图像，如卡通片、电脑游

戏和三维图像软件渲染的图像经常使用位图。什么叫位图呢？将画面中的每一点的颜色都以

二进制数字形式存储为数字矩阵中的一个元素。数字矩阵中的元素称为像素；数字化的矩阵

放在显示缓冲区中，与显示器上的点一一对应，这就是位图图像。位图图像也称为“栅格图

像”，将一幅位图图像放大到一定程度，就会发现它是由小方格（图像网格）组成，这些小

方格就是像素。

位图图像有以下几个重要的技术参数：

（1）分辨率

图像的分辨率一般用它横向和纵向所含像素数目来表示。如一幅图像的分辨率为 1200

×800，说明横向有 1200 个像素，纵向有 800 个像素，即其对应的数字矩阵为 800 行，1200

列。对于打印机和扫描仪图像的分辨率（网格密度）以点/每英寸（dpi）表示，对于显示器

则用像素/每英寸（ppi）表示。数码相机的生产商一般用图像包含的像素总数目来表示相机

的分辨率，即用百万像素或千万像素表示。

（

2）颜色深度

颜色深度是在图片中可用颜色的数量。其单位是“位（bit）”，所以颜色深度有时也

称为位深度。常用的颜色深度是 1 位、8 位、24 位和 32 位。在 1 位位图中，每个像素的值

用 1 位存储，1 位只有两个可能的数值：0 或 1，也就是每个像素的颜色只能有 1 种或 2 种，

通常是黑或白。在灰度位图图像中，每个像素的值用 8 位存储，每个像素可以显示黑、白和

不同深度的灰色共 256 种，已远远超出了人眼所能区分的程度。24 位位图也称为真彩色位

图，一个 24 位的图像包含（224）1670 万种颜色。

（

3）调色板

大多数图像软件都提供已经准备好的调色板。一般含有灰度调色板、系统调色板和 Web

调色板。大多数灰度调色板都含有 256 种灰度。系统调色板是操作系统用来显示桌面图标和

控件颜色的选择器。例如，Windows 操作系统使用的系统调色板包含 20 种固定颜色和 236

种可以根据应用程序需要而改变的颜色。Web 调色板，也称为 Web 安全调色板，包含一系

列互联网浏览器使用的标准颜色。

3．矢量图像

用位图存储图像或照片，当分辨率较高时就需要很大的存储空间。与位图图像不同的另

一种图像类型是矢量图像，其存储空间与图像的分辨率几乎没有关系，仅受输出设备性能的

限制。矢量图像是由一套可以重建图像的指令构成。矢量图像的各个部分都被创建为独立的

对象，绘图软件存储一幅图像时，其图像文件保存的不是每个像素的颜色值，而是绘图的一

组指令，这些指令描述一幅图像中的各个对象的形状、大小、位置和颜色。就好象绘画教师

给学生下达指令一样：“画一个 2 寸大小的圆，并把这个圆填充为黄色。” 矢量图像适合

画线条画、标志图、简单的插图或图表。

矢量图像与位图图像相比各有特点，用哪种方式应考虑以下几点：

（1）当图像需要改变大小时，矢量图像比位图效果更好。

当改变矢量图像的大小时，图中的各个对象会按比例改变，不论图像放大多少，图像中

的圆形物体都会显示圆滑的边缘，不会丢失细节或降低清晰度。位图图像中的圆形物体被放

大后，就会出现参差不齐的边缘。

（

2）矢量图像通常比位图需要更少的存储空间

矢量图像需要的存储空间与图象的复杂程度密切相关，每一条绘图指令都需要存储空间，图像越复杂，描绘图像所需的线条、形状和填充图形就越多，需要的存储空间也就越大。位

图图像文件的大小与图像的分辨率密切相关，而与图像的复杂程度没有关系。

（

3）在矢量图像中编辑对象比在位图图像中容易

从某些方面来看，矢量图像就像一幅有很多对象图形的拼接图，每个对象都可以放置在

显示域的任意位置，也可以放置在其它图像之上。每个对象图形都可以独立的编辑，即可以

单独地拉长、缩短、扭曲、染色、删除或移动矢量图像中的每个对象图形。

（

4）矢量图像通常不如位图图像逼真

矢量图像使用色块填充图形对象，限制了图形对象的明暗处理和纹理处理，从而不能得

到那种从照片中得到的逼真的图像。因而，大部分矢量图像具有类似卡通画的外观。

矢量图像可以转换成位图图像，转换是通过被称为光栅化的过程来完成的。光栅化是一

种通过向适量图像添加栅格来确定每个像素颜色的过程。相对的，位图图像也可以转换成矢

量图像，但要比把矢量图像转换成位图图像困难得多。位图图像转换成矢量图像一定要使用

专门的绘图软件。

4．图像文件常用格式

（1）BMP 格式

BMP 是英文 Bitmap 的缩写，格式是 Windows 系统的标准图像文件格式，能够被多种

Windows 应用程序所支持。该格式的特点是包含的图像信息较丰富，几乎不进行压缩，但

由此导致了它与生俱来的缺点是占用磁盘空间过大。

（

2）JPEG 格式

JPEG 仅仅是一种俗称而已，其扩展名为.jpg 或.jpeg，是有损图像压缩格式。具有调节

图像质量的功能，允许用户用不同的压缩比例对图像压缩。利用 JPEG 格式可以进行高倍率

的压缩图像，所以压缩后的图像文件比较小。

EG2000 是 JPEG 的升级版，其压缩率比 JPEG 高约 30%左右。JPEG2000 同时支持有损

和无损压缩，能实现渐进传输（与 GIF 的“渐显”功能类似），具有“感兴趣区域”特性，

可以任意指定影像上用户感兴趣区域的压缩质量，还可以选择指定的部分先解压。

（

3）PNG 格式

PNG 是英文 Portable Network Graphics 的缩写，是一种新兴的网络图像格式，是目前保

证最不失真的格式。它吸取了 GIF 和 JPG 二者的优点，存贮形式丰富，兼有 GIF 和 JPG 的

色彩模式；它的另一个特点能把图像文件压缩到极限以利于网络传输，但又能保留所有与图

像品质有关的信息。PNG 格式文件显示速度很快，只需下载 1/64 的图像信息就可以显示出

低分辨率的预览图像。支持透明图像制作。其缺点是不支持动画应用效果。

（

4）SVG 格式

SVG 是英文 Scalable Vector Graphics 的缩写，意思为可缩放的矢量图形（像）。该格式

基于 XML（Extensible Markup Language）

,可以用任何文字处理工具打开 SVG 图像，通过改

变部分代码来使图像具有交互功能，并可以随时插入到 HTML 中通过浏览器来观看。可以

任意放大图像，而不以牺牲图像的质量为代价，文字在 SVG 图像中保留可编辑和可搜寻的

状态，下载速度快。可以相信 SVG 的开发将会为 Web 提供新的图像标准。

5．图像处理软件

（1）绘图软件

绘图软件能够提供一组在屏幕上绘图的电子笔、笔刷和颜料等，可以生成位图图像。比

较常见的绘图软件有 JACS Pain Shop Pro、Microsoft Paint（Windows 操作系统自带软件）等。

这些软件提供了徒手绘图、形状填充、添加逼真阴影或设置油画、炭画、水彩画等效果工具。

既可以通过线条展示你的徒手绘画才能，也可以使用扫描仪或数码相机创建位图图像。（

2）画图软件

画图软件提供一组线条、图形和颜料工具，这些工具可以用来画图像、企业标志和示图，

创建是矢量图像。流行的画图软件包括 Adobe Illustrator、Micromedia Freehand 和 Corel

Designer。画图软件提供的工具创建的图像只有“平面”的卡通图像质量，但是它们很容易

修改并且缩放到任意尺寸时质量都不发生变化。画图软件有时与用来生成位图图像的绘图软

件分别进行包装，有时也会以图像软件套件的形式包含在位图软件中。

（

3）图像编辑软件

例如 Adobe Photoshop 是目前比较著名的图像编辑软件，它专门含有修改低质量图像的

特性，通过修改对比度和亮度，剪切不想要的对象和去除“红眼”等方法来提高图像的质量。

提供了很多图像编辑的工具和向导，可以简化常用的图像编辑工作。无论是平面广告设计、

室内装潢、出版印刷、网页图像处理、还是处理个人照片，Photoshop 都已经成为不可或缺

的工具。

三．视频数据的处理

1．数字视频的概念

视频实际上是一幅一幅静态的图像，以一定的频率快速变换播放，利用人眼“视觉暂留”

的特点，造成活动影像的效果。视频图像变换的频率根据电视制式的不同而有差别，我国和

大部分西欧国家采用的 PAL 制式每秒变换 25 幅图像，每一幅图像称为一帧，也就是每秒

25 帧。美国、日本等国家采用的 NTSC 制式则是每秒 30 帧。

视频信号数字化就是对模拟视频信号进行数字化处理，将其转变成数字视频信号的过程。

这个过程包括采样、量化和编码三个步骤。模拟视频的数字化过程首先需要通过采样将模拟

视频的内容进行分解，得到每个像素点的色彩组成，然后采用固定采样率进行采样，并将色

彩描述转换成 RGB 颜色模式，生成数字化视频。换句话说数字视频是基于拍摄实物而得到

的影像以比特的形式存储每个视频帧的颜色和亮度，这个过程类似于存储一系列位图图像的

数据。数字化视频和传统视频相同，由帧（Frame）的连续播放产生视频连续的效果，在大

多数数字化视频格式中，播放速度为每秒钟 24 帧（24fps）。

2．数字视频的分类

数字视频有时按其所处的平台来分类。主要指 DVD 电影、桌面视频、基于 Web 的视

频和 PDA 视频等。DVD 电影是指包含全长度影片的商用 DVD；桌面视频是指用个人计算

机创建和播放的视频；基于 Web 的视频是指被嵌入到网页中并用浏览器访问；PDA 视频是

指可在 PDA 或手机屏幕上观看的小格式视频。

3．视频文件格式

（1）AVI 格式

AVI 的英文全称为 Audio Video Interleaved，即音视频交错格式，所谓“音频视频交错”，

就是将视频和音频数据交织在一起存储。AVI 格式有着非常好的扩充性和的开放性，只要遵

循一定的标准，任何视频压缩编码方式都可以用在 AVI 文件中。AVI 是最常用的一种视频

格式，现在几乎所有运行在 PC 上的通用视频编辑系统，都是以支持 AVI 为主的。

（

2）MPEG 格式

MPEG 文件格式是运动图像压缩算法的国际标准，它的英文全称为 Moving Picture

Experts Group，即运动图像专家组，家庭常用的视频光盘 VCD、SVCD、DVD 等就是以这

种格式制作的。MPEG 格式常用的有三个压缩编码标准，分别是 MPEG-1、MPEG-2、和

MPEG-4。

（

3）RealMedia 格式RealMedia 是 RealNetworks 公司所制定的视音频压缩规范，这种格式的视频文件扩展名

包括 rm、rmvb，其中 rmvb 文件采用可变比特率编码，压缩效果优于 rm。这两种文件都可

以使用 RealPlayer 进行播放。

（

4）FLV 格式

FLV 是一种新的流媒体视频格式，称为 Flash Video，Flash MX 2004 及以后的版本对其

提供了完美的支持。将其它视频格式转换为 FLV 格式后有两个优势，一是文件容量减小，

二是可以与 SWF 动画结合直接通过嵌入在浏览器中的 FLASH 播放器播放，这样就使得在

网络环境下视频播放效果更为流畅。

4．常用视频处理软件

（1）视频播放软件（Windows Media Player）

Windows Media Player 是 Windows 操作系统自带的一种多媒体播放器，使用它可以播放

多种格式的音频、视频和动画文件。如 WMV、WMA、ASF、MP3、WAV、AVI、MPEG、

MIDI 等。Windows Media Player 不仅可以播放本地的多媒体文件，还可以播放来自 Internet

的流式媒体文件。安装插件后的 Windows Media Player 还可以播放 QuickTime 电影以及网上

流行的 RMVB 视频文件。

（

2）视频转换软件（豪杰视频通）

豪杰视频通是一款国际流行的视频转换软件，它支持直接将 DVD 光盘转换为 VCD 格

式的视频文件，支持 AVI、DAT、VOB 和 MPG 等目前常见的视频格式的相互转换；支持

把各种视频文件格式转换为 MPEG、AVI 和 GIF 动画；支持批量转换；支持播放和转换同

时进行；支持 MPG、AVI、DAT、VOB 等格式转换为 MPEG1、MPEG2、MPEG4。

（

3）视频编辑软件（Adobe premiere）

Premiere Pro 2.0 是非线性视频编辑软件，具有强大的视频、音频编辑功能。几乎所有的

视频格式，包括 DV 和未经压缩的高清视频 HD，都可以导入到 Premiere Pro 2.0 中进行编

辑, 并输出到录像带、DVD 和 WEB。Premiere Pro 2.0 提供了与其他 Adobe 应用程序如

Photoshop、After Effects 的无缝集成，可以高效地完成专业级影像作品的编辑和制作。

四、计算机动画

1．什么是动画

所谓动画就是利用人眼的“视觉暂留”特性，将多幅彼此独立的、内容相关的静止画面

连续播放所构成的动态效果，动画的连续播放既指时间上的连续，也指画面内容上的连续。

计算机动画是传统动画艺术和计算机技术相结合的产物，它采用图形图像处理技术，借助于

计算机编程、动画制作软件直接生成，或对人工绘制的图形进行处理后生成一系列连续画面，

通过连续播放或实时绘制产生动态画面的效果。

计算机动画的应用十分广泛，包括计算机游戏、电视广告、电视电影特技、模拟实验和

生产过程以及教学演示等。

2．二维动画和三维动画

计算机动画一般根据表现方式和透视效果分为二维动画和三维动画，其中二维动画中的

物体和场景都是二维的，而三维动画具有近似真实的透视、材质和光照效果。尽管制作人员

在制作二维动画时也可通过绘制明暗和透视效果来获得三维的感觉，俗称“假三维”，但软

件本身不具有三维效果自动生成功能，常见的二维动画制作软件有 Macromedia Flash、Animo

等；三维动画是通过计算机软件自动生成三维效果，所以三维动画和二维动画在制作方式上

是不同的，常见的三维动画制作软件有 3DS MAX、MAYA、Softimage 3D 等。

二维动画的画面可以使用计算机软件直接制作，也可以由美工以传统方式创作好原画后，通过摄像机或扫描仪采集输入到计算机，然后使用动画软件进行后期加工处理。

三维动画一般都需要通过动画软件完成，制作过程包括建立模型、赋予模型合适的材质

和纹理、建立灯光和摄像机以及设置物体、灯光和摄像机的运动路径等步骤。

3．帧动画和实时生成动画

计算机动画从生成机制上可分为帧动画和实时生成动画。

帧动画是指连续播放预先制作的图形图像序列，产生动态画面效果的一种动画。帧动画

的生成与播放是两个彼此独立的过程，一般生成画面序列需要一定的计算时间和较大的存储

空间，播放时只需按顺序调用每帧画面内容即可，这是产生各种动画的基本方法。

实时生成动画是指不预先生成完整的图形序列，而是在播放时由计算机实时组成完整画

面的一种动画，实时生成动画可以通过动画制作软件或编程方法实现。使用动画软件制作时，

将场景中每个活动对象分别赋予属性特征（如形状、颜色、大小），然后根据时间线分别对

这些对象进行状态设计（包括对象的位置、变形、颜色变化等），播放时由计算机实时组成

完整画面，这种方式常见的如 FLASH 制作的 SWF 动画；使用编程方法是通过计算机程序

来控制图形的显示、更新和循环，常用的如 JAVA 小程序等。

4．常见的网络动画格式

（1）SWF 格式

SWF 格式是 Macromedia Flash 动画文件格式，Flash 动画是一种实时生成的矢量动画，

这种动画允许包含动作脚本，这样极大增加了动画的交互性。数据量小、交互功能强以及

SWF 文件本身可以嵌入 WEB 页面这些特点，使得 SWF 在网络上应用日益广泛，一般所说

的网络动画多是指 Flash 动画。SWF 格式文件能将动画以及文字、图片、声音整合，甚至通

过内嵌 FLV 视频，构成多媒体信息集合，极具表现力和吸引力。

（

2）GIF 格式

GIF 是英文 Graphics Interchange Format（图形交换格式）的缩写。最初的 GIF（称为

GIF87a）只能存储单幅静止图像，以后出现的 GIF（称为 GIF89a）可以存放多幅彩色图像，

并将多幅图像按一定次序和时间逐幅显示就成为了动画。GIF 格式文件颜色数量是有限制的，

最多支持 256 色，所以将图像压缩成 GIF 后的文件数据量大大减小。由于 GIF 动画制作简

单，通用性好，在网络上得到广泛的应用。使用 Macromedia Fireworks、Macromedia Flash、

Adobe ImageReady 和 Ulead Gif Animator 等都可以制作 GIF 动画文件。

5．动画制作软件

（1）Flash 动画制作软件

Flash 是一种绘制矢量图像（形）和创作互动式多媒体动画的软件，只用少量的矢量数

据就可以描述相当复杂的对象，所生成的文件尺寸小，便于在网上传输。支持事件响应和交

互功能，让浏览者有更多的参与权。Flash 以其制作的动画表现力丰富、交互性强、容量小

等特点。

（

2）Ulead GIF Animator GIF 动画制作软件

该软件可以制作静态的 GIF 文件也可以制作 GIF 动画，提供了 20 多种 2D 或 3D 的动

态效果，使用户制作出来的 GIF 动画栩栩如生。支持多种文件格式，允许输出为 Windows AVI、

QuickTime 电影、Autodesk 动画或图像序列。可以生成适当的 HTML 代码，以便将动画嵌

入网页中；还可以将动画打包成独立的 EXE 文件，以便通过电子邮件发布和查看。第四节多媒体教学软件设计

多媒体教学软件，简单来说就是辅助教学的工具，创作人员根据自己的创意，先从总体

上对信息进行分类组织，然后把文字、图形、图象、声音、动画、影像等多种媒体素材在时

间和空间两方面进行集成，使他们融为一体并赋予它们以交互特性，从而制作出各种精彩纷

呈的多媒体教学软件产品。多媒体教学软件，具有丰富的表现力、良好的交互性和极大的共

享性。

一、多媒体教学软件的基本特性

多媒体课件应具有教育性、科学性、技术性、艺术性和使用性等五个基本特性。

教学性主要表现在课件的教学目标、内容的选择及组织表现策略上。教学目标是课件制

作的总体方向和预计的目标，也就是说教学目标的确定要符合教学大纲的要求，明确课件要

解决什么问题，达到的教学目的。内容的选择是围绕教学目标，为适应教学对象的需要选择

恰当的主题。组织表现策略是合理设计课件结构、重点突出、分散难点、深入浅出，注意启

发性、促进思维，有利于能力培养。科学性是课件评价的重要指标之一，科学性的基本要求

是不出现知识性的错误。主要表现在内容正确，逻辑严谨，层次清楚等方面。还有场景设置、

素材选取、名词术语、操作示范要符合有关规定。技术性是课件制作技术水平的反应，主要

表现在媒体制作和交互性实现两个方面。媒体制作包括图像、动画、声音及文字设计合理，

画面确保清晰，动画连续流畅，视觉效果逼真，文字醒目，配音标准，整个课件进程快慢适

度等方面。交互性实现表现在交互性设计合理，智能性好。艺术性是良好的教学效果的重要

体现。优秀的课件是高质量的内容和美的形式的统一，美的形式是艺术性体现的。艺术性使

人赏心悦目，获得美的享受，激发学习者的学习兴趣。使用性是课件的操作简便、灵活、可

靠，便于使用者控制。

二、多媒体教学软件的基本要求

多媒体教学课件的基本要求有以下 4 个方面。

1．正确表达教学内容

在多媒体教学软件中，教学内容是用多媒体信息来表示的。各种媒体信息都必须是为了

表现某一个知识的内容，为达到某一层次的教学目标而设计或选择的。各个知识电之间应建

立一定的关系和关联的形式，以形成具有科学特色的知识结构体系。

2．反映教学过程和教学策略

在多媒体教学软件中，通过多媒体信息的选择与组织、系统结构、教学程序、学习导航、

问题设置、诊断评价等方式反映教学过程和教学策略。在多媒体教学软件中一般包含知识讲

解、举例说明、媒体演示、提问诊断和反馈评介等部分。

3．具有良好的人机交互界面

交互界面是学生和教学软件进行交互的通道。在多媒体教学软件中，交互界面的形式包

括有窗口、菜单、按钮、图标和快捷键等。

4．具有评价和反馈功能

在多媒体教学软件中，通常设置一些问题供学习者思考核练习。通过统计、判断、识别

学习者回答的问题，及时了解学习者的学习情况，并做出相应的评价，使学习者加深对所学

知识的理解。

三、多媒体教学软件制作流程

多媒体教学软件本质上是一种应用软件，它的开发过程和方法应遵循软件工程的开发流程，但多媒体教学软件是面向教学的，也有其自身总结出来的开发方法和一些经典的制作步

骤。多媒体教学软件总的制作流程如图 3.3 所示。下面将介绍多媒体教学软件制作流程中的

典型步骤和方法。

图 3.3 多媒体软件开发流程

1．教学软件项目的定义

多媒体教学软件的制作是从选题开始的，选题应根据多媒体课件的必要性和可行性来确

定，以满足教学需要、发挥多媒体特长为前提。多媒体建学软件项目的定义，通常包括以下

内容：

（1）制作目的。说明所制作的多媒体教学软件的类型和用途。

（

2）使用对象。说明所制作的多媒体教学软件适合于哪类学习者使用。

（

3）重要内容。说明所制作的多媒体教学软件覆盖的主要知识点的内容。

（

4）组成部分。说明所制作的多媒体教学软件的大体结构和各主要模块。

2．教学设计

教学设计的基础是认知学习理论，它是以教育传播过程为对象，采用系统科学方法进行

的一种教学规则过程和操作程序。多媒体教学软件的教学设计，就是应用系统科学的观点和

方法，按照教学目标和教学对象的特点，合理选择和设计教学媒体信息，并在系统中教学软

件中有机的结合，形成优化的教学系统结构。教学设计过程主要包括以下几个方面：

（1）教学对象分析

教学对象分析又称学习者分析，是运用适当的方法确定学习者关于当前概念的原有认知

开始

软件定义

教学软件的定义

1．制作目的

2．软件背景

3．项目定义

软件设计

教学软件设计

1．教学设计

2．文字脚本编写

3．制作脚本编写

编码调试

教学软件编码

1．媒体制作

2．编码

3．调试

测试

教学软件测试

维护

教学软件维护

1．评价

2．反馈

3．修改结构和原有认知能力，并将它们描述出来，作为教学目标和教学策略的主要依据，以便制作

出来的多媒体教学软件对学习者有更强的针对性。学习者的特点多种多样，很难对所有学习

者的特点进行面具到的分析，主要从学习者起点能力、一般特点、学习风格等方面分析学习

者的学习能力、态度、工具技能等。

（

2）教学目标分析

教学目标是指希望通过教学过程，使学习者在认知、情感和行为上发生变化的描述。教

学目标是教学活动的导向，是学习评价的依据。

确定教学目标要考虑三个因素，即教学内容、学习者特征和社会需要。多媒体教学软件

的教学目标应由从事实践教学的教师根据教学的实际需要决定教学内容，根据教学内容，进

一步根据学科的特点，将教学内容分解成许多知识点，并考虑到学习者的特征和社会需要，

把各知识点的教学目标确定为知识、理解、应用、分析、综合和评价等不同层次。并将整个

教学软件的教学目标按认知领域、情感领域和行为领域 3 类的各层次进行目标分类和分层表

述。

（

3）教学内容分析

教学内容的分析是对教学目标规定的期望水平以及如何将学习者的实际水平转化为这

一期望水平所需要的各项知识内容的详细剖析过程。教学内容分析包含两个方面的含义：“教

什么”和“怎么教”。“教什么”确定教学内容的范围与深度；“怎么教”确定教学过程中

应采用何种教学策略。分析教学内容的目的是为了好的选择教学内容表现的方法。

（

4）教学策略设计

教学策略设计是为了实现教学目标，完成教学任务所采用的教学方法、教学步骤、教学

媒体以及教学组织形式等措施构成的综合方案。教学策略的实质是解决如何进行教、如何引

导学的问题。教学策略主要包括学生学习活动、教学信息呈现、问题提供、应答判断、反馈

与评价等的设计。

（

5）教学媒体的选择

在多媒体教学中，必须研究媒体的基本性质和教学特性，并根据教学内容、教学目标和

教学对象的要求，对媒体进行合理的选择和组合，以达到优化教学效果的目的。媒体与学习

目标的统一性、媒体与教学方法的协调性、媒体与认知水平的相容性是选择教学媒体时要考

虑的 3 个重要方面。

（

6）建立教学内容知识结构

建立教学内容知识结构首先分析教学内容的知识结构，把教学内容分解为若干个知识单

元，每个知识单元又包含若干个知识点，然后找出各个知识点、知识单元之间的关系和联系。

不同的联系方式构成了不同的教学结构，不同的教学结构体现了不同的教学策略。

3．文字脚本编写

文字脚本是按照教学过程的先后顺序，用于描述每一环节的教学内容及其呈现方式的一

种形式。一般，文字脚本由学科专业教师完成。脚本编写的方法有多种，无论采用哪一种编

写格式，都必须从多媒体技术的角度对教学对象、教学内容、教学目标、为达到教学目标应

采取的教学模式、表现媒体和相关教学策略进行描述。完整的文字脚本应包含有学习者的特

征分析、教学目标的描述、知识结构流程图、问题的编写和一些列脚本卡片等。

4．制作脚本编写

制作脚本能体现教学软件的系统结构和教学功能，并可以作为多媒体教学软件制作的直

接依据。制作脚本应包括软件系统结构说明、知识单元的分析、屏幕设计、连接关系的描述

和制作脚本卡片等。脚本制作卡片用来描述每一屏幕的内容和要求，应包括课程名称、页数、

脚本设计、完成日期、本页画面、画面文字、符号及图形出现方式、出现顺序说明、本页流程图、流程图说明等项内容。

本章内容要点

1．文本、声音、图形、图像、动画和视频是信息的载体，其中两个或多于两个的组合

构成了多媒体。多媒体具有信息载体多样性、集成性和交互性。

2．数据压缩就是以最少的数码表示信源所发的信号，减少容纳给定消息集合或数据采

样集合的信号空间。超文本可以定义为由结点和表示信息结点间相关性的链构成的一个具有

一定逻辑结构和语义的网络。虚拟现实是一种逼真的视、听、触觉一体化的计算机生成环境，

具有沉浸感、交互性、构想性等三个特征。

3．声音、图像、动画、视频等媒体信息数字化后可利用各自常用的工具软件进行加工

与处理。

4．多媒体教学软件本质上是一种应用软件，它的开发过程和方法应遵循软件工程的开

发流程，但多媒体教学软件是面向教学的，也有其自身总结出来的开发方法和一些经典的制

作步骤。

习题

一、选择题

1. 多媒体技术中媒体的含义是（）。

A．表现和获取信息的物理设备

B．用以存储信息的实体

C．信息的载体

D．传输数据的物理设备

2. 判断以下属于多媒体范畴的是（

）。

A．交互式游戏

B．立体声音乐

C．彩色画报

D．彩色电视等

3. 下列说法正确的是（

）。

A．信息量等于数据量与冗余量之和

B．信息量等于数据量与冗余量之差

C．信息量等于信息熵与数据量之差

D．信息量等于信息熵与冗余量之和

4. 图像序列中的两幅相邻图像，后一幅图像与前一幅图像之间有较大的相关，这是（

）。

A．空间冗余

B．时间冗余

C．结构冗余

D．视觉冗余

5. 超文本和超媒体是以（

）组织各种媒体信息。

A．线性形式

B．流式形式

C．网状链接形式D．字节形式

6. 人类所能听到的声音频率范围为（

）。

A． 20 Hz～20 kHz

B． 40 Hz～40 kHz

C． 60Hz～60 kHz

D． 80 Hz～80 kHz

7. 将图像每一点的颜色都以数字形式存储为数字矩阵中的一个元素是（

）。

A．符号

B．矢量图像

C．动态图像

D．位图图像

8. 其存储空间与图像的分辨率几乎没有关系，仅受输出设备性能限制的是（）。

A．位图图像

B．矢量图像

C．动态图像

D．符号

9. 在大多数数字化视频格式中，播放速度为每秒钟（）。

A．12 帧

B．24 帧

C． 25 帧

D．30 帧

10. 计算机动画从生成机制上可分为（

）和实时生成动画。

A．二维动画

B．三维动画

C．帧动画

D．电脑动画

二、简答题

1. 多媒体信息的主要元素有哪些？

2. 多媒体技术具有哪些关键特性？

3. 数据为什么能够压缩？

4. 视频图像的压缩标准都有哪些？

5. 超文本和超媒体是如何定义的？

6. 虚拟现实系统的基本组成成分有哪些？

7. 矢量图像与位图图像相比各有什么特点？

8. 多媒体课件应具有哪些基本特性？

三、分析与思考题

1. 上网收集资料，了解多媒体技术的最新发展，说说可穿戴设备的最新进展。

2. 上网收集资料，了解最新的视频、音频、动画制作小软件都有哪些？

多媒体技术与应用学什么,多媒体制作专业和数字媒体技术

栏目热文

自制桃酥的正宗做法（正宗桃酥的家庭做法）

商家版桃酥的做法（商业版桃酥怎么做好吃）

自制桃酥为啥发硬（桃酥为啥做出来是软的）

桃酥一碰就散是油太少了吗（桃酥为啥一碰就散开了）

上海中考时间表安排2022（上海中考时间2022年具体时间表）

多媒体设计专业好不好（多媒体制作专业是什么专业）

多媒体技术有哪些（多媒体技术有哪些特性）

什么是多媒体制作（制作多媒体的基本步骤）

什么是多媒体中控系统（多媒体中控系统连接电脑）

多媒体技术的应用（多媒体技术的概念与应用）

文档排行

本站推荐

安阳学院学费多少（安阳学院住宿学费多少钱）

如何打造个人的核心竞争力（怎样打造个人核心竞争力）

巴淡岛气候（印尼巴淡岛的天气和穿衣）

迪丽热巴有几部电视剧（迪丽热巴演的电视剧有哪几部）

王菲和刘德华关系好吗（刘德华跟王菲的关系好吗）

分子与原子的区别与联系（分子和原子的区别与联系列表）