1.5 Python基础语法
1.5.1 数字运算
编程是将问题数据化的一个过程,数据离不开数字,Python的数字运算规则与我们学习的四则运算规则是一样的,即使不使用Python来编写复杂的程序,也可以将其当作一个强大的计算器。打开Python,试运行以下命令:
提示
在不同的机器上浮点运算的结果可能会不一样。
在整数除法中,除法(/)总是返回一个浮点数,如果只想得到整数的结果,就可以使用运算符//。整数除法返回浮点型,整数和浮点数混合运算的结果也是浮点型。
Python可以使用**操作来进行幂运算。
在交互模式中,最后被输出的表达式结果被赋值给变量_,这样能使后续计算更方便。例如:
>>> tax = 12.5 / 100 >>> price = 100.50 >>> price * tax 12.5625 >>> price + _ 113.0625 >>> round(_, 2) 113.06
Python数字类型转换:
int(x)将x转换为一个整数。
float(x)将x转换为一个浮点数。
complex(x)将x转换为一个复数,实数部分为x,虚数部分为0。
complex(x, y)将x和y转换为一个复数,实数部分为x,虚数部分为y。x和y是数字表达式。
常用的数学函数可参见表1-2。
表1-2 常用的数学函数
1.5.2 字符串
1. 认识简单字符串
Python中的字符串有几种表达方式,可以使用单引号、双引号或三引号(三个单引号或三个双引号)括起来。例如:
>>> 'abc' 'abc' >>> "abc" 'abc' >>> '''a\ ... b\ ... c''' #使用 反斜线(\)来续行 'abc' >>> '''abc''' 'abc'
如果想要字符串含有单引号、双引号该怎么处理呢?有两种方法:一是使用反斜杠转义引号;二是使用与字符串中单引号、双引号不同的引号来定义字符串。例如:
使用\n换行或使用三引号。例如:
如果需要避免转义,则可以使用原始字符串,即在字符串的前面加上r。例如:
>>> s = r"This is a rather long string containing\n\ ... several lines of text much as you would do in C." >>> print(s) This is a rather long string containing\n\ several lines of text much as you would do in C.
字符串可以使用+运算符连接在一起,或者使用*运算符重复字符串。例如:
>>> word = 'Help' + ' '+ 'ME' >>> print(word) Help ME >>> word="word "*5 >>> print(word) word word word word word
2. 字符串的索引
字符串可以被索引,就像C语言中的数组一样,字符串的第一个字符的索引为0,一个字符就是长度为一的字符串。与Icon编程语言类似,子字符串可以使用分切符来指定:用冒号分隔的两个索引,第一个索引默认为0,第二个索引默认为最后一个位置,s[:]表示整个字符串,s[2:3]表示从第3个字符开始,到第4个字符结束,不含第4个字符。不同于C字符串的是,Python字符串不能被改变。向一个索引位置赋值会导致错误,例如:
3. 字符串的遍历
遍历字符串有三种方式:一是使用enumerate函数,其返回字符串的索引及相应的字符;二是直接使用for循环;三是通过字符索引来遍历。例如:
有一个方法可以帮我们记住分切索引的工作方式,想象索引是指向字符之间,第一个字符左边的数字是0,接着有n个字符的字符串最后一个字符的右边是索引n。例如:
如s[1:3]代表bc,s[-2:-1]代表f。
4. 字符串的格式化
Python支持格式化字符串的输出。尽管这样可能会用到非常复杂的表达式,但最基本的用法是将一个值插入到一个有字符串格式符%s的字符串中。
>>> print ("我叫 %s 今年 %d 岁!" % ('小明', 10))#使用% 我叫 小明 今年 10 岁! >>> print ("我叫 {} 今年 {} 岁!" .format('小明', 10))#使用字符串的format方法 我叫 小明 今年 10 岁! >>> print ("我叫 {0} 今年 {1} 岁!" .format('小明', 10,20))#使用索引,整数20未用到 我叫 小明 今年 10 岁!
需要在字符中使用特殊字符时,Python用反斜杠(\)转义字符,如表1-3所示。
表1-3 转义字符
5. 字符串的内建函数
Python字符串的内建函数可参见表1-4。
表1-4 字符串的内建函数
(续表)
1.5.3 列表与元组
列表是Python常用的数据类型,也是最基本的数据结构。Python的列表是由方括号“[]”[]括起,使用“,”分隔的序列,序列中的数据类型不要求一致,序列的索引从0开始。
【示例1-1】创建一个列表,只要把逗号分隔的不同数据项使用方括号括起来即可。
>>> list1 = ['Google', 'Huawei', 1997, 2000]; >>> list2 = [1, 2, 3, 4, 5 ]; >>> list3 = ["a", "b", "c", "d"]; >>> list4=["all of them",list1,list2,list3] >>> print ("list1[0]: ", list1[0]) list1[0]: Google >>> print ("list2[1:5]: ", list2[1:5]) list2[1:5]: [2, 3, 4, 5] >>> print(list4) ['all of them', ['Google', 'Huawei', 1997, 2000], [1, 2, 3, 4, 5], ['a', 'b', 'c', 'd']] >>> print(list4[1][1]) Huawei
【示例1-2】更新一个列表,可以对列表的数据项进行修改,也可以使用append()方法添加列表项。
【示例1-3】删除列表中的某个元素。
>>> list = ['Google', 'Huawei', 1997, 2000] >>> del list[0] >>> print(list) ['Huawei', 1997, 2000]
列表还有一些其他操作,如列表对+和*的操作符与字符串相似,+号用于组合列表,*号用于重复列表。
列表的常用方法可参见表1-5。
表1-5 列表的常用方法
元组与列表类似,用“()”括起,“,”分隔的序列,不同于列表的是,元组是只读的,无法被修改,在定义时其元素必须确定下来,也可以像列表一样使用索引来访问。
【示例1-4】元组的应用。
注意,元组元素不变是指元组每个元素指向永远不变,如果元组的某个元素是一个列表,那么这个列表的元素是可以被改变的,但元组指向这个列表永远不变。
【示例1-5】元组的某个元素是列表。
如果希望元组中的每个元素无法被修改,就必须保证元组的每一个元素本身也不能变,如数字、字符串、元组等不可变数据类型。
1.5.4 字典
一提到字典,我们就会想到中华字典、英语词典等,通过给定的单词(key)查找其含义(value)。在字典里,要查找的单词(key)是唯一的,但不同的单词其含义(value)可能相同。Python里的字典就是键值对(key-value)组成的集合,且可存储任意类型对象。定义一个字典非常简单:使用一对花括号{}括起,键值对之间使用“,”分隔。例如:
字典值可以是任何的Python对象,既可以是标准对象,也可以是用户自定义的对象,但键不行。两个重要的点需要记住:
(1)不允许同一个键出现两次。创建时如果同一个键被赋值两次,后一个值就会被记住。
【示例1-6】不允许同一个键出现两次。
>>> dict = { 'hello':'你好','world':'世界','hello':'world'} #键hello的值被更新为 world >>> dict {'hello': 'world', 'world': '世界'}
(2)因为键必须不可变,所以可以用数字、字符串或元组充当,用列表则不行,即键必须为不可变数据类型。
【示例1-7】键必须为不可变数据类型。
>>> d = { 'a':1,'b':2, ['a']:'abc'} #键是列表,会报错 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: unhashable type: 'list'
【示例1-8】遍历字典。
【示例1-9】修改字典。
>>> d = { 'a':1, 'b':2, 'c':3, 'd':4, 'e':5, 'f':6 } >>> d['b']='b' >>> d {'a': 1, 'b': 'b', 'c': 3, 'd': 4, 'e': 5, 'f': 6}
【示例1-10】删除字典元素。可以删除单一的元素,也可以一次性删除所有元素,清空字典,显式地删除一个字典用del命令。
Python字典的内置方法可参见表1-6。
表1-6 字典的常用方法
1.5.5 集合
集合set是一个无序不重复元素集,基本功能包括关系测试和消除重复元素。集合对象还支持union(联合)、intersection(交)、difference(差)和sysmmetric difference(对称差集)等数学运算。
在Python中可以使用“x in set”来判断x是否在集合中,使用“len(set) ”来获取集合元素个数,使用“for x in set”来遍历集合中的元素。但由于集合不记录元素位置,因此集合不支持获取元素位置和切片等操作。
【示例1-11】集合的定义和常见用法。
【示例1-12】使用集去重元素。
>>> a = [11,22,33,44,11,22] >>> b = set(a) >>> b set([33, 11, 44, 22])
集合的基本操作可参见表1-7。
表1-7 集合的基本操作
提示
union()、intersection()、difference()和symmetric_difference()的非运算符(non-operator就是形如s.union()这样的)版本将会接受任何可迭代对象(iterable)作为参数。相反,它们的运算符版本(&^+-|)要求参数必须是集合对象。
1.5.6 函数
在中学数学中我们知道y=f(x)代表着函数,x是自变量,y是函数f(x)的值。在程序中,自变量x可以代表任意的数据类型,可以是字符串、列表、字典、对象,可以是我们认为的任何东西。
【示例1-13】以简单的数据计算函数为例,定义函数fun(a,b,h)来计算上底为a,下底为b,高为h的梯形面积。
函数的目的是封装,提高应用的模块性及代码的重复利用率。将常用的处理过程写成函数,在需要时调用它,可以屏蔽实现细节,减少代码量,增加程序可读性。
【示例1-14】假如多个梯形的面积需要计算,那么:
上例中的调用方法fun(3,4,5)并不直观,为了增加可读性,这里我们稍做调整。
在调用此函数传递参数时使用参数关键字,这样参数的位置可以任意放置而不影响运算结果,增加程序可读性。假如待计算的梯形默认高度均为5,就可以定义带默认值参数的函数。
提示
带有默认值的参数必须位于不含默认值参数的后面。
关于函数是否会改变传入变量的值有以下两种情况。
(1)对不可变数据类型的参数,函数无法改变其值,如Python标准数据类型中的字符串、数字、元组。
(2)对可变数据类型的参数,函数可以改变其值,如Python标准数据类型中的列表、字典、集合。
【示例1-15】举例说明。
1.5.7 条件控制与循环语句
1. 条件控制
Python的条件控制是通过一条或多条语句的执行结果(True或False)来决定执行的代码块。条件控制的流程如图1.26所示。
图1.26 条件控制的流程
if语句的一般形式如下:
解释:如果条件1为真,则执行语句1;如果条件1不为真,条件2为真,则执行语句2;如果条件1、条件2都不为真,则执行语句3。其中elif和else语句不是必需的。
【示例1-16】将下列代码保存为lx_if.py。
在命令窗口执行python lx_if.py后得到如下结果。
99 excellent 80 fine 70 pass 60 pass 59 bad
if语句还可以用来实现问题表达式。例如:有整数变量a、b、c,如果a<b,那么c=a,否则c=b。我们可以用一行代码实现:
2. 循环语句
Python有两种方式来实现循环:while语句和for语句。
while语句的结构如下:
当条件判断为真时执行语句1,当条件判断为假时执行语句2,其实只要不是死循环,语句2就一定会被执行。因此,while语句的结构也可以如下:
while语句的流程如图1.27所示。
图1.27 while语句的流程
【示例1-17】将下面的代码保存为lx_while.py。
在命令窗口中执行python lx_while.py,并尝试输入一些字符,结果如下。
please input something,'q' for quit.-> hello your input is hello please input something,'q' for quit.-> python your input is python please input something,'q' for quit.-> q your input is q You're out of circulation.
Python for循环可以遍历任何序列的项目,如一个列表或一个字符串。for循环的一般格式如下:
for <variable> in <sequence>: <statements> else: <statements>
【示例1-18】计算1~1000的所有整数的和。
循环中的break语句和continue语句:从英文字面意思来理解即可,break就是中断,跳出当前的循环,不再继续执行循环内的所有语句;continue就是继续,程序运行至continue处时,不再执行continue后的循环语句,立即进行下一次循环判断。下面通过一个例子来了解两者的区别。
【示例1-19】break语句和continue语句的比较(lx_break_continue.py)。
在命令行中运行python lx_break_continue.py将得到如下结果。
break-------------- aaa 0 bbb 1 aaa 1 continue-------------- aaa 0 bbb 1 aaa 1 aaa 2 bbb 3 aaa 3 bbb 4 aaa 4 bbb 5
我们看到break直接跳出了循环,而continue只是跳过了其中一步(输出bbb 2的那一步)。
1.5.8 可迭代对象、迭代器和生成器
迭代是Python最强大的功能之一,是访问集合元素的一种方式。迭代器是一个可以记住遍历位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问结束。迭代器只能往前不会后退。迭代器有两个基本的方法:iter()和next()。字符串、列表或元组对象都可用于创建迭代器。
首先来了解一下可迭代对象、迭代器和生成器的概念。
(1)可迭代对象:如果一个对象拥有__iter__方法,这个对象就是一个可迭代对象。在Python中,我们经常使用for来对某个对象进行遍历,此时被遍历的对象就是可迭代对象,常见的有列表、元组、字典。for循环开始时自动调用可迭代对象的__iter__方法获取一个迭代器,for循环时自动调用迭代器的next方法获取下一个元素,当调用可迭代器对象的next方法引发StopIteration异常时,结束for循环。
(2)迭代器:如果一个对象拥有__iter__方法和__next__方法,这个对象就是一个迭代器。
(3)生成器:生成器是一类特殊的迭代器,就是在需要时才产生结果,而不是立即产生结果。这样可以同时节省CPU和内存。有两种方法可以实现生成器:
生成器函数。使用def定义函数,使用yield而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间挂起函数的状态,以便下次从它离开的地方继续执行。
生成器表达式。类似于列表推导,只不过是把一对大括号[]变换为一对小括号()。但是生成器表达式是按需产生一个生成器结果对象,要想拿到每一个元素,就需要循环遍历。
三者之间的关系如图1.28所示。
图1.28 可迭代对象、迭代器和生成器的关系
可迭代对象包含迭代器、序列、字典;生成器是一种特殊的迭代器,下面分别举例说明。
【示例1-20】创建一个迭代器对象(lx_iterator.py)。
因为类MyListIterator实现了__iter__方法和__next__方法,所以它是一个迭代器对象。由于__iter__方法本返的是迭代器(本身),因此它也是可迭代对象。迭代器必然是一个可迭代对象。
下面使用三种方法遍历迭代器MyListIterator。
输出结果如下:
使用for循环来遍历迭代器 0 1 2 3 4 使用next来遍历迭代器 0 1 2 3 4 同时使用next和for来遍历迭代器 先使用两次next 0 1 再使用for,会从第三个元素2开始输出 2 3 4
从结果可以看出,for循环实际上就是调用了迭代器的__next__方法,当捕捉到MyListIterator异常时自动结束for循环。
【示例1-21】创建一个可迭代对象。
因为对象MyList实现了__iter__方法返回了迭代器类的实例,所以它是一个可迭代对象。遍历操作可使用for循环,不可使用next()。for循环实质上还是调用MyListIterator的__next__方法。
输出结果如下:
使用for循环来遍历可迭代对象my_list 0 1 2 3 4 使用next来遍历可迭代对象my_list print(next(my_list)) TypeError: 'MyList' object is not an iterator
从运行结果知道,可迭代对象如果没有__next__方法,则无法通过next()进行遍历。
【示例1-22】创建一个生成器,像定义一般函数一样,只不过使用yield返回中间结果。生成器是一种特殊的迭代器,自动实现了迭代器协议,即__iter__方法和next方法,不需要再手动实现两个方法。创建生成器:
遍历生成器:
运行结果如下:
for 循环遍历生成器myList 0 1 2 3 4 next遍历生成器myList 0 1 2 3 4
具有yield关键字的函数都是生成器,yield可以理解为return,返回后面的值给调用者。不同的是return返回后,函数会释放,而生成器则不会。在直接调用next方法或用for语句进行下一次迭代时,生成器会从yield下一句开始执行,直至遇到下一个yield。
1.5.9 对象赋值、浅复制、深复制
Python中对象的赋值,复制(深/浅复制)之间是有差异的,如果使用时不注意,就可能导致程序崩溃或严重bug。下面就通过简单的例子来介绍这些概念之间的差别。
【示例1-23】对象赋值操作(testFuzhi.py)。
输出结果如图1.29所示。
图1.29 对象赋值操作
下面来分析代码:首先第3行创建了一个名为object1的变量,这个变量指向一个list对象,第5行将object1赋给object2,然后打印它们及它们指向的对象在内存中的地址(通过id函数)。第18和19行修改object1,然后分别打印object1与object2在内存中的地址。从运行结果来看,无论是object1还是object2,它们都向同一个内存地址,即指向的都是同一个对象,也就是说“object1 is object2 and object1[i] is object2[i] ”,对object1的操作同样会反应到object2上,打印object1和object2的结果始终是显示一致的。
【示例1-24】浅复制操作(testCopy.py)。
运行结果如图1.30所示。
图1.30 浅复制操作
代码说明:与testFuzhi.py不同的是,第2行导入copy模块,第5行调用copy模块的copy函数来为object2进行赋值,也就是浅复制操作。从运行结果来看,object1与object2指向内存中的不同位置,它们属于两个不同的对象,但列表内部仍指向同一个位置。修改了object1[0]= "Wilber"后,object1对象的第一个元素指向了新的字符串常量"Wilber",而object2仍指向"Will"。执行object1[2].append("CSS")时object1[2]的地址并未改变,object1与object2的第三个元素仍指向此子列表。
总结一下浅复制:通过copy模块中的浅复制函数copy()对object1指向的对象进行浅复制,然后浅复制生成的新对象赋值给object2变量。浅复制会创建一个新的对象,这个例子中"object1 is not object2",但是对于对象中的元素,浅复制就只会使用原始元素的引用(内存地址),也就是说,"wilber[i] is will[i]"。当对object1进行修改时由于list的第一个元素是不可变类型,因此object1对应的list的第一个元素会使用一个新的对象,但是list的第三个元素是一个可变类型,修改操作不会产生新的对象,object1的修改结果会就相应地反应到object2上。
【示例1-25】深复制操作(testDeepCopy.py)。
运行结果如图1.31所示。
图1.31 深复制操作
从运行结果来看,这个非常容易理解,就是创建了一个与之前对象完全独立的对象。通过copy模块中的深复制函数deepcopy()对object1指向的对象进行深复制,然后深复制生成的新对象赋值给object2变量。与浅复制类似,深复制也会创建一个新的对象,这个例子中"object1 is not object2",但是对于对象中的元素,深复制都会重新生成一份(有特殊情况,下面会说明),而不是简单地使用原始元素的引用(内存地址)。也就是说," object1[i] is not object2[i]"。
复制有一些特殊情况:
对于原子数据类型(如数字、字符串、只含不可变数据类型的元组)没有复制一说,赋值操作相当于产生一个新的对象,对原对象的修改不影响新对象。简言之,赋值操作与浅复制和深复制的效果是一样的。
如果元组变量只包含原子类型对象,深复制就不会重新生成对象,这其实是Python解释器内部的一种优化机制,对于只包含原子类型对象的元组,如果它们的值相等,就在内存中保留一份,类似的还有小整数从-5~256。在内存中只保留一份,可节省内存,提高访问速度,如图1.32所示。
图1.32 元组的深复制