003_python的str切片,str常用操作方法,for循环,集合,深浅copy

基础数据类型

基础数据类型，有7种类型，存在即合理。

1.int 整数

主要是做运算的。比如加减乘除，幂，取余 + - * / ** %...

2.bool布尔值

判断真假以及作为条件变量

3.str 字符串

存储少量的数据。‘太白’,'password'... 操作简单，便于传输。

4.list 列表

[1,2,'alex',{name:'zhang'}] 存放大量的数据，大量的数据放到列表中便于操作

5.tuple 元组

也叫只读列表。(1,2,'alex',{name:'zhang'}) 一些重要的数据或者不想被更改的数据，使用元组

6.dict 字典

{‘name_list’:'[zhang,lisi]'},存储关系型的数据,查询速度非常快，二分查找。

7.set 集合

交集，并集，差集...

分别举例

int整型



i = 4

#转化成二进制的最小位数

print(i.bit_length())

'''

1   0000 0001

1   0000 0010

3   0000 0011

4   0000 0100

'''

执行输出： 3

数据类型转换：int --> str：n = str(1)

执行输出： 1

int --> bool：n = bool(1)

执行输出： True

str --> bool：n = bool('')

执行输出： False

空字符串是False，其他都是True

str 字符串索引与切片

先讲索引

字符串是有序的,有索引的,索引从0开始,默认取值是从左至右



s = 'python是最好的语言'

#取第一个字符

s1 = s[0]

#取索引值为2的元素

s2 = s[2]

#最后一个

s3 = s[-1]

print(s1)

print(s2)

print(s3)

执行输出：

言

切片

语法：

[起始索引：截止索引：步长]

步长默认为1，表示从头开始取

切片，也就是取连续的多个值

切片原则，顾头不顾尾

什么意思？举例说明



s = 'python是最好的语言'

s1 = s[0:2]

print(s1)

执行输出：

全取



s = 'python是最好的语言'

s1 = s[:]

print(s1)

执行输出：

python是最好的语言

切片会产生新的变量，在内存中，原字符串和切片后的字符串，是2个变量s4 = s[:] 虽然结果是一样的，但它是2个变量

对字符串操作，都会产生新的变量，除了赋值以外。

取最后5个字符串



s = 'python是最好的语言'

s1 = s[-5:]

print(s1)

执行输出：

最好的语言

步长

默认步长为1

隔一个取1个，步长为2

反向取值，也就是从后向前取，步长为-1

隔1个，取一个

s = 'python是最好的语言'

s1 = s[::2]

print(s1)

执行输出：

pto是好语

反向取5个



s = 'python是最好的语言'

s1 = s[:-5:-1]

print(s1)

执行输出：

言语的好

反向全取



s = 'python是最好的语言'

s1 = s[::-1]

print(s1)

执行输出：

言语的好最是nohtyp

字符串常用操作方法

capitalize() 首字母大写，其他字母小写



s = 'laoshi'

s1 = s.capitalize()

print(s1)

执行输出：

Laoshi

upper() 全部大写、lower() 全部小写



s = 'laoshi'

s1 = s.upper()

s2 = s.lower()

print(s1)

print(s2)

执行输出：

LAOSHI

laoshi

比如验证码判断功能



code = 'aeQu'

your_code = input('请输入验证码：')

if your_code == 'aequ' or your_code == 'Aequ'...

如果不使用字符串内置方法，这需要写16个if，代码质量非常low

下面使用字符串内置方法



code = 'aeQu'

your_code = input('请输入验证码：')

if your_code.upper() == code.upper():

    print('验证码验证成功')

执行输出：

代码优化一下



code = 'aeQu'.upper()

your_code = input('请输入验证码：').upper()

if your_code == code:

    print('验证码验证成功')

center() 居中



s = 'laoshi'

#总宽度为30,并且字符串居中,不足30，默认用空格填充

s1 = s.center(30)

#使用*填充

s2 = s.center(30,'*')

print(s1)

print(s2)

执行输出：

如果宽度小于字符串，按照原来的字符串显示



s = 'laoshi'

s1 = s.center(3)

print(s1)

执行输出：

laoshi

swapcase() 大小写反转



s = 'LaoShi'

s1 = s.swapcase()

print(s1)

执行输出：

lAOsHI

title() 每个单词的首字母大写(非字母隔开)



s = 'xiao wusir*nanhai21shui'

s1 = s.title()

print(s1)

执行输出：Xiao Wusir*Nanhai21Shui

startswith() 判断以什么为开头，endswith() 以什么为结尾

startswith 的start和end参数是切片如果想取到最后，end参数，不需要指定。



s = 'xiao wusir*nanhai21shui'

s1 = s.startswith('a')

s2 = s.endswith('i')

#切片,取索引访问1~4,再判断是否以i开头

s3 = s.startswith('i',1,4)

#切片,取索引范围5~结束,结束位置参数没给，默认一直取到尾

s4 = s.startswith('w',5)

print(s1)

print(s2)

print(s3)

print(s4)

执行输出：

False

True

strip() 去除首尾的空格,换行符(\n),tab键(4个空格用\t表示)



s = '\nlaoshi\t '

s1 = s.strip()

print(s1)

执行输出： laoshi

在input程序中，会经常使用



name = input('请输入用户名：')

if name == 'xiao':

    print('ok')

如果用户输入的，不小心包含了空格，会导致验证失败

下面加入strip()

即使输入有空格，也可以验证通过



name = input('请输入用户名：').strip()

if name == 'xiao':

    print('ok')

执行输出：

后续操作文件读取一行内容的时候，也会带有换行符，虽然你看不见，使用strip()，就可以去除了类似功能的2个的方法

lstrip() 去除左边的空格、换行符、tab键

rstrip() 去除右边的空格、换行符、tab键

strip()还可以去除指定的字符串



s = 'laoshijintianzalill'

#去除字符串l

s1 = s.strip('l')

print(s1)

执行输出：aoshijintianzali

解释一下执行过程 ☻→ string ← ☻

strip()相当于 ☻，就像吃豆游戏一样。

strip()会同时向左右2边，挨个挨个字符寻找字符串l 如果发现了l，就去除，如果没有发现，终止寻找，最后输入结果比如头部的lao 找到了字符串l，开始删除。再继续找下一个字符a，发现不匹配，终止寻找同时，尾部的lill，找到l，开始删除。继续找下一个，找到l,删除。再继续下一个，发现字符串i，不匹配，终止寻找最终输出： aoshijintianzali

find() 通过元素找索引

还有一个函数index()，也是同样的功能不同的是，index()找不到，直接报错find()找不到时，会返回-1



s = 'xiaoxx'

s1 = s.find('a')

s2 = s.index('a')

print(s1)

print(s2)

执行输出： 2

count() 寻找元素出现的个数，可切片



s = 'xiaomingtongxue'

s1 = s.count('x')

#从第5个索引一直到最后，寻找字符串o出现的次数

s2 = s.count('o',5)

print(s1)

print(s2)

执行输出：

replace() 替换



s = '我的老家在东北，东北有很多人'

#默认是全文替换

s1 = s.replace('东北','黑龙江')

#替换一次

s2 = s.replace('东北','黑龙江',1)

print(s1)

print(s2)

执行输出：

我的老家在黑龙江，黑龙江有很多人

我的老家在黑龙江，东北有很多人

替换，是从左至右的

如果想要替换中间某部分，需要用到正则表达式

split() 分割，将字符串转换为列表，默认按照空格分隔：



s = 'wo zai tai bei'

s1 = s.split()

print(s1)

执行输出：['wo', 'zai', 'tai', 'bei']

指定分割符



s = 'wo,zai,tai,bei'

s1 = s.split()

print(s1)

执行输出，效果同上

指定字符串a



s = 'awozaiataiabei'

s1 = s.split('a')

print(s1)

执行输出：

['', 'woz', 'i', 't', 'i', 'bei']

注意：如果关键字左边没有字符串，那么结果为[]，也就是空字符串

结果不包含关键字，被剔除了

比如面试题：

有下面一段日志，包含了IP地址和时间...需要切割日志

216.244.66.227,[20/Mar/2018:17:03:52 +0800],"Mozilla/5.0"

114.215.45.101,[20/Mar/2018:17:16:30 +0800],"BUbiNG"

106.11.152.107,[20/Mar/2018:17:22:40

+0800],"YisouSpider"

可以用正则表达式,但是比较麻烦，有没有更简单的办法呢？用split()，指定逗号分割，就可以实现

format() 格式化输出这个很牛逼，一定要重点掌握！有三种用法：

第一种用法：



s = '我叫{},今年{},爱好{}'.format('MT',18,'打怪')

print(s)

执行输出：

我叫MT,今年18,爱好打怪

{}表示一个占位符

isalnum() 字符串由字母或数字组成

isalpha() 字符串只能由字母组成

isdigit() 字符串只能由数字组成



name = 'jingsan123'

s1 = name.isalnum()

s2 = name.isalpha()

s3 = name.isdigit()

print(s1)

print(s2)

print(s3)

执行输出：

True

False

isdigit()比较常用，比如判断用户输入的，是否是数字。

或者将字符串转换为数字类型时，要判断字符串是否由纯数字组成，否则报错。



name = '123a'

if name.isdigit():

    name = int(name)

else:

    print('您输入的含有非数字元素')

执行输出：

您输入的含有非数字元素

len() 查看数据的长度



name = 'zhangsan'

print(len(name))

执行输出： 8

for循环

先来使用while循环，打印每一个字符串



s = 'abcdef'

count = 0

while count < len(s):

    print(s[count])

    count += 1

执行输出：

使用for循环完成上面的功能

s = 'abcdef'

for i in s:

    print(i)

执行程序，效果同上

for循环和while循环的区别在于

for 循环是有限循环

while 循环是无限循环

有些情况，在不需要终止条件的情况下，使用for循环

有终止条件的，使用while循环

for循环会自动停止使用for循环实现九九乘法表：



for i in range(1, 10):

    for j in range(1, i + 1):

        print('{}x{}={}\t'.format(j, i, i * j), end='')

    print('\n')

执行输出：



1x1=1  

 

1x2=2   2x2=4  

 

1x3=3   2x3=6   3x3=9  

 

1x4=4   2x4=8   3x4=12  4x4=16 

 

1x5=5   2x5=10  3x5=15  4x5=20  5x5=25 

 

1x6=6   2x6=12  3x6=18  4x6=24  5x6=30  6x6=36 

 

1x7=7   2x7=14  3x7=21  4x7=28  5x7=35  6x7=42  7x7=49 

 

1x8=8   2x8=16  3x8=24  4x8=32  5x8=40  6x8=48  7x8=56  8x8=64 

 

1x9=9   2x9=18  3x9=27  4x9=36  5x9=45  6x9=54  7x9=63  8x9=72  9x9=81

作业

有变量name = "aleX leNb" 完成如下操作：

1) 移除name变量对应的值两边的空格,并输出处理结果

2) 移除name变量左边的'al'并输出处理结果

3) 移除name变量右面的'Nb',并输出处理结果

4) 移除name变量开头的a'与最后的'b',并输出处理结果



name = "aleX leNb"

s1 = name.strip()

s2 = name.lstrip('al')

s3 = name.rstrip('Nb')

s4 = name.lstrip('a').rstrip('b')

print(s1)

print(s2)

print(s3)

print(s4)

5) 判断 name 变量是否以 "al" 开头,并输出结果

6) 判断name变量是否以"Nb"结尾,并输出结果



s5 = name.startswith('al')

s6 = name.endswith('Nb')

print(s5)

print(s6)

7) 将name变量对应的值中的所有的"l" 替换为 "p",并输出结果

8) 将name变量对应的值中的第一个'l'替换成'p',并输出结果



s7 = name.replace('l','p')

s8 = name.replace('1','p',1)

print(s7)

print(s8)

9) 将 name 变量对应的值根据所有的"l" 分割,并输出结果。

10) 将name变量对应的值根据第一个'l'分割,并输出结果。



s9 = name.split('l')

s10 = name.split('l',1)

print(s9)

print(s10)



s11 = name.upper()

s12 = name.lower()

print(s11)

print(s12)



s13 = name.capitalize()

s14 = name.count('l')

s15 = name.count('l',4)

print(s13)

print(s14)

print(s15)



s16 = name.index('N')

s17 = name.find('N')

s18 = name.find('X le')

print(s16)

print(s17)

print(s18)



s19 = name[2]

s20 = name[:3]

s21 = name[-2:]

s22 = name.find('e')

s23 = name[:-1:]

print(s19)

print(s20)

print(s21)

print(s22)

23)获取子序列,去掉最后一个字符。如: oldboy 则获取 oldbo。



name = "oldboay"

#使用split对最后一个字符分割,并取第一个元素

s3 = name.split(name[-1])[0]

print(s3)

有字符串s = '123a4b5c'

1)通过对li列表的切片形成新的字符串s1,s1 = '123'

2)通过对li列表的切片形成新的字符串s2,s2 = 'a4b'

3)通过对li列表的切片形成新的字符串s3,s3 = '1345'

4)通过对li列表的切片形成字符串s4,s4 = '2ab'

5)通过对li列表的切片形成字符串s5,s5 = 'c'

6)通过对li列表的切片形成字符串s6,s6 = 'ba2'



s = '123a4b5c'

s1 = s[0:3]

s2 = s[3:6]

s3 = s[0]+s[2]+s[4]+s[6]

s4 = s[1]+s[3]+s[5]

s5 = s[-1]

s6 = s[5]+s[3]+s[1]

print(s1)

print(s2)

print(s3)

print(s4)

print(s5)

print(s6)

使用while和for循环分别打印字符串s='asdfer'中每个元素。



s = 'asdfer'

count = 0

while count < len(s):

    print(s[count])

    count += 1

实现一个整数加法计算器(两个数相加)：

如：content = input('请输入内容:') # 如用户输入：5+9或5+ 9或5 + 9，然后进行分割再进行计算。

content = input('请输入内容：')

num = content.split('+')

sum = 0

for i in num:

    sum += int(i)

print(sum)

计算用户输入的内容中有几个整数(以个位数为单位)。

如：content = input('请输入内容：') # 如fhdal234slfh98769fjdla

count = 0

content = input('请输入内容：')

for i in content:

    if i.isdigit():

        count += 1

print(count)

集合

集合是无序的，不重复的数据集合，它里面的元素是可哈希的(不可变类型)，但是集合本身是不可哈希(所以集合做不了字典的键)的。以下是集合最重要的两点：

去重，把一个列表变成集合，就自动去重了。

关系测试，测试两组数据之前的交集、差集、并集等关系。

1.集合的创建



set1 = set({1,2,'barry'})

set2 = {1,2,'barry'}

print(set1,set2)

执行输出

{1, 2, 'barry'} {1, 2, 'barry'}

2.集合的增



set1 = {'alex','wusir','ritian','egon','barry'}

set1.add('景女神')

print(set1)

 

#update：迭代着增加

set1.update('A')

print(set1)

set1.update('老师')

print(set1)

set1.update([1,2,3])

print(set1)

执行输出：

{'wusir', 'egon', 'alex', 'ritian', 'barry', '景女神'}

{'wusir', 'A', 'egon', 'alex', 'ritian', 'barry', '景女神'}

{'老', 'wusir', 'A', 'egon', 'alex', 'ritian', 'barry', '师', '景女神'}

{'老', 'wusir', 1, 2, 3, 'A', 'egon', 'alex', 'ritian', 'barry', '师', '景女神'}

3.集合的删



set1 = {'alex','wusir','ritian','egon','barry'}

 

set1.remove('alex') # 删除一个元素

print(set1)

 

set1.pop() # 随机删除一个元素

print(set1)

 

 

set1.clear() # 清空集合

print(set1)

 

del set1 # 删除集合

执行输出

{'ritian', 'wusir', 'egon', 'barry'}

{'wusir', 'egon', 'barry'}

set()

4.集合的其他操作：

交集。(& 或者 intersection)



set1 = {1,2,3,4,5}

set2 = {4,5,6,7,8}

print(set1 & set2)

print(set1.intersection(set2))

执行输出：

{4, 5}

并集。(| 或者 union)



set1 = {1,2,3,4,5}

set2 = {4,5,6,7,8}

print(set1 | set2)

print(set2.union(set1))

执行输出

{1, 2, 3, 4, 5, 6, 7, 8}

差集。(- 或者 difference)

set1 = {1,2,3,4,5}

set2 = {4,5,6,7,8}

print(set1 - set2)

print(set1.difference(set2))

执行输出

{1, 2, 3}

反交集。 (^ 或者 symmetric_difference)



set1 = {1,2,3,4,5}

set2 = {4,5,6,7,8}

print(set1 ^ set2)

print(set1.symmetric_difference(set2))

执行输出

{1, 2, 3, 6, 7, 8}

子集与超集



set1 = {1,2,3}

set2 = {1,2,3,4,5,6}

 

print(set1 < set2)

print(set1.issubset(set2)) # 这两个相同，都是说明set1是set2子集。

 

print(set2 > set1)

print(set2.issuperset(set1)) # 这两个相同，都是说明set2是set1超集。

frozenset不可变集合，让集合变成不可变类型。



s = frozenset('barry')

print(s,type(s))

执行输出

frozenset({'b', 'a', 'r', 'y'}) <class 'frozenset'>

深浅copy

1.先看赋值运算



l1 = [1,2,3,['barry','alex']]

l2 = l1

 

l1[0] = 111

print(l1)

print(l2)

 

l1[3][0] = 'wusir'

print(l1)

print(l2)

执行输出：

[111, 2, 3, ['barry', 'alex']]

[111, 2, 3, ['wusir', 'alex']]

对于赋值运算来说，l1与l2指向的是同一个内存地址，所以他们是完全一样的。

2.浅拷贝copy



l1 = [1,2,3,['barry','alex']]

 

l2 = l1.copy()

print(l1,id(l1))

print(l2,id(l2))

l1[1] = 222

print(l1,id(l1))

print(l2,id(l2))

 

l1[3][0] = 'wusir'

print(l1,id(l1[3]))

print(l2,id(l2[3]))

执行输出

[1, 2, 3, ['barry', 'alex']] 2200143751176

[1, 2, 3, ['barry', 'alex']] 2200143750920

[1, 222, 3, ['barry', 'alex']] 2200143751176

[1, 2, 3, ['barry', 'alex']] 2200143750920

[1, 222, 3, ['wusir', 'alex']] 2200143749768

[1, 2, 3, ['wusir', 'alex']] 2200143749768

对于浅copy来说，第一层创建的是新的内存地址，而从第二层开始，指向的都是同一个内存地址，所以，对于第二层以及更深的层数来说，保持一致性。

3.深拷贝deepcopy



import copy

l1 = [1,2,3,['barry','alex']]

l2 = copy.deepcopy(l1)

 

print(l1,id(l1))

print(l2,id(l2))

 

l1[1] = 222

print(l1,id(l1))

print(l2,id(l2))

 

l1[3][0] = 'wusir'

print(l1,id(l1[3]))

print(l2,id(l2[3]))

执行输出

[1, 2, 3, ['barry', 'alex']] 1722671719688

[1, 2, 3, ['barry', 'alex']] 1722671719816

[1, 222, 3, ['barry', 'alex']] 1722671719688

[1, 2, 3, ['barry', 'alex']] 1722671719816

[1, 222, 3, ['wusir', 'alex']] 1722671720456

[1, 2, 3, ['barry', 'alex']] 1722671720200

对于深copy来说，两个是完全独立的，改变任意一个的任何元素(无论多少层)，另一个绝对不改变。

003_python的str切片,str常用操作方法,for循环,集合,深浅copy

基础数据类型

for循环

作业

集合

1.集合的创建

2.集合的增

3.集合的删

4.集合的其他操作：

深浅copy

1.先看赋值运算

2.浅拷贝copy

3.深拷贝deepcopy