1.1 数据库的基本概念
信息是人类社会发展中维持生产活动、经济活动和社会活动必不可少的重要资源,也是现代管理的宝贵财富。因此,人们为了获取有价值的信息,就需要对数据进行处理和管理。
信息系统是一个由人和计算机等组成的,能进行信息的收集、传递、存储、加工、维护、分析、计划、控制、决策和使用的系统。用计算机对数据进行处理的应用系统称为计算机信息系统,信息系统的核心是数据库。
1.1.1 数据与数据处理
计算机的出现,将数据处理带入了一个新的时代。数据处理的基本问题是数据的组织、存储、检索、维护及加工利用,这正是数据库系统所要研究解决的问题。
1.信息与数据
数据是数据库系统研究和处理的对象。数据又离不开信息,它们既有联系又有区别。
信息是现实世界各种事物(包括有生命的和无生命的、有形的和无形的)的存在方式、运行形态以及它们之间的相互联系等诸要素在人脑中的反映,通过人脑的抽象后形成的概念。这些概念不仅被人们认识和理解,而且人们可以对它进行推理、加工和传播。
数据一般是指信息的一种符号化表示方法,就是说用一定的符号表示信息,而采用什么符号完全是人为规定。例如,为了便于用计算机处理信息,就得把信息转换为计算机能够识别的符号,即采用0和1两个符号编码来表示各种各样的信息。所以数据的概念包括两个方面的含义:一是数据的内容是信息;二是数据的表现形式是符号。
信息与数据的关系既有联系又有区别。数据是承载信息的物理符号或称之为载体,而信息是数据的内涵。二者的区别是:数据可以表示信息,但不是任何数据都能表示信息,同一数据也可以有不同的解释。信息是抽象的,同一信息可以有不同的数据表示方式。例如,新闻这一信息,它可以用报纸上的文字、电台上的声音或电视上的图形等形式表示。
2.数据处理
数据处理是将数据转换成信息的过程,这一过程主要是指对所输入的数据进行加工整理,包括对数据的收集、存储、加工、检索和传播等一系列活动,其根本目的就是从大量的、已知的数据出发,根据事物之间的固有联系和运动规律,采用分析、推理、归纳等手段,提取出对人们有价值、有意义的信息,作为某种决策的依据。
我们可以用如图1.1所示的过程简单地表示出信息与数据之间的关系。
图1.1 信息与数据之间的关系
在图1.1 中,数据是输入,而信息是输出结果。人们有时说的“信息处理”,其真正含义应该是为了产生信息而处理数据。例如,学生的“出生日期”是有生以来不可改变的基本特征之一,属于原始数据,而“年龄”则是当年与出生日期相减而得到的数字,具有相对性,可视为二次数据。
在数据处理活动中,计算过程相对比较简单,很少涉及复杂的数学模型,但是却有数据量大且数据之间有着复杂的逻辑关系的特点。因此,数据处理任务的矛盾焦点不是计算,而是把数据管理好。数据管理是指数据的收集、整理、组织、存储、查询、维护和传送等各种操作,是数据处理的基本环节,是任何数据处理任务必有的共性部分。因此,对数据管理应当加以突出,集中精力开发出通用而又方便实用的软件,把数据有效地管理起来,以便最大限度地减轻计算机软件用户的负担。数据库技术正是为达到这一目标而逐渐完善起来的一门计算机软件技术。
1.1.2 数据库的概念
数据库是计算机软件的一个重要分支,是近20年来发展起来的一门新兴学科,它和计算机网络、人工智能被称为当今计算机技术界的3大热门技术。目前,虽有人对数据库的设计原则和方法进行总结和探讨,使之通用化、标准化和理论化,但总的说来,它的概念、原理和方法还处于从工程实践向理论过渡的阶段,它的概念、原理和方法还在继续变化和发展。另外,数据库是一个很复杂的系统,它的涉及面很广,很难用简练的语言准确地概括其全部特征。目前,对于什么是数据库还没有一个统一的、公认的定义。比较认可的有关数据库的定义是:数据库(DataBase,简称DB)是长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度,较高的数据独立性和易扩展性,并可为各种用户共享。