欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python的基本数据类型2

程序员文章站 2023-08-14 09:12:37
1、str(字符串) 1、切片 2、字符串相关方法 3、字符串查找的方法 4、字符串条件判断 2、字符串的编码以及常量池 1、is和==的区别 2、编码 2.1、字符串串在传输时转化成bytes=> encode(字符集)来完成 2.2、那么在对方接收的时候. 也是接收的bytes类型的数据. 我们 ......

1、str(字符串)

  1、切片

str = "你好,我是python"

s = str[0:4]    #用法[start:end:step],指定开始下标和结束下标,step是步长,默认是1,可以不指定
#包括开头的下标,但是不包括结尾的下标,所以结果是:你好,我

  2、字符串相关方法

str = "ok,你好,我是python,我包括123456789,还包括abcdefghijklmnopqrstuvwxyz"

str.capitalize()    #首字母大写,其他都小写
str.upper()        #字母全部转大写
str.lower()        #全部字母转小写
str.swapcase()    #大小写转换
str.title()        #被字符隔开的首字母大写
str.center(90,"*")    #将str居中,字符串拉长到90,其他字符补*
str.strip()        #去左右两端空格
str.lstrip()    #去左边的空格
str.rstrip()    #去右边的空格
str.strip("abc")    #去左右两端的abc
str.replace("123","哈哈")    #替换字符串,还可以指定替换的个数用法:replace("","",2)
str.split(",")    #以逗号分割字符串

  3、字符串查找的方法

str = "ok,你好,我是python,我包括123456789,还包括abcdefghijklmnopqrstuvwxyz"

str.startswith("o")    #查询是否以o开头,返回true或false
str.endswith("z")    #查询是否以z结尾,返回true或false
str.count("o")    #查询o出现的次数
str.find("n")    #查询n第一次出现的位置,没有返回-1
str.find("n",8,12)    #切片查询n第一次出现的位置,没有返回-1
str.index("n")    #查询n的索引位置,和find用法结果相同,但是找不到会报错

  4、字符串条件判断

str = "ok,你好,我是python,我包括123456789,还包括abcdefghijklmnopqrstuvwxyz"

str.isalnum()    #是否有字母和数字组成,只要含字母就为true
str.isalpha()    #是否有字母组成,只要含字母就为true
str.isdigit()    #是否有数字构成,不含小数点

len(str)    #计算字符串的长度

2、字符串的编码以及常量池

  1、is和==的区别

s = 'alex'
print(id(s)) # 4326667072
s1 = "alex"
print(id(s1)) # 4326667072
print(s == s1)    #true

lst = [1, 2, 4]
print(id(lst)) # 4326685768
lst1 = [1, 2, 4]
print(id(lst1)) # 4326684360
print(lst == lst1)    #true

#首先id是比较内存地址,==比较的是值
#其次str和int都是在常量池中,所以他的内存地址都相同,但是list不在常量池中,所以他的内存地址不相同

  2、编码

1. ascii : 最早的编码. ⾥里里⾯面有英⽂文⼤大写字⺟母, ⼩小写字⺟母, 数字, ⼀一些特殊字符. 没有中⽂文,
8个01代码, 8个bit, 1个byte
2. gbk: 中⽂文国标码, ⾥里里⾯面包含了了ascii编码和中⽂文常⽤用编码. 16个bit, 2个byte
3. unicode: 万国码, ⾥里里⾯面包含了了全世界所有国家⽂文字的编码. 32个bit, 4个byte, 包含了了
ascii
4. utf-8: 可变⻓长度的万国码. 是unicode的⼀一种实现. 最⼩小字符占8位

    2.1、字符串串在传输时转化成bytes=> encode(字符集)来完成

s = "alex"
print(s.encode("utf-8")) # 将字符串串编码成utf-8
print(s.encode("gbk")) # 将字符串串编码成gbk
结果:
b'alex'
b'alex'

s = "中"
print(s.encode("utf-8")) # 中⽂文编码成utf-8
print(s.encode("gbk")) # 中⽂文编码成gbk
结果:
b'\xe4\xb8\xad'
b'\xd6\xd0'

#英文编码之后的结果和源字符串一致. 中文编码之后的结果根据编码的不同.

    2.2、那么在对方接收的时候. 也是接收的bytes类型的数据. 我们可以使用decode()来进行解码操作. 把bytes类型的数据还原回我们熟悉的字符串:

s = bs.decode("gbk") # 解码
# 然后需要进⾏行行重新编码成utf-8
bss = s.encode("utf-8") # 重新编码

3、深拷贝和浅拷贝

  1、浅拷贝

lst1 = ["何炅", "杜海涛","周渝民"]
lst2 = lst1.copy()
lst1.append("李嘉诚")
print(lst1)
print(lst2)
print(id(lst1), id(lst2))
结果:
两个lst完全不一样. 内存地址和内容也不一样. 发现实现了内存的拷贝

lst1 = ["何炅", "杜海涛","周渝民", ["麻花藤", "马芸", "周笔畅"]]
lst2 = lst1.copy()
lst1[3].append("无敌是多磨寂寞")
print(lst1)
print(lst2)
print(id(lst1[3]), id(lst2[3]))
结果:
['何炅', '杜海涛', '周渝民', ['麻花藤', '马芸', '周笔畅', '无敌是多磨寂寞']]
['何炅', '杜海涛', '周渝民', ['麻花藤', '马芸', '周笔畅', '无敌是多磨寂寞']]
4417248328 4417248328

#经过上面的方法,我们可以看出,浅拷贝只能拷贝最外一层的,如果拷贝深层的,就是直接指定内存地址了,不再是拷贝内容了

  2、深拷贝

import copy
lst1 = ["何炅", "杜海涛","周渝民", ["麻花藤", "马芸", "周笔畅"]]
lst2 = copy.deepcopy(lst1)
lst1[3].append("无敌是多磨寂寞")
print(lst1)
print(lst2)
print(id(lst1[3]), id(lst2[3]))
结果:
['何炅', '杜海涛', '周渝民', ['麻花藤', '马芸', '周笔畅', '无敌是多磨寂寞']]
['何炅', '杜海涛', '周渝民', ['麻花藤', '马芸', '周笔畅']]
4447221448 4447233800

#都不一样了. 深度拷贝. 把元素内部的元素完全进行拷贝复制. 不会产生一个改变另一个跟着改变的问题