python3 字符串知识点学习笔记

2023-08-01 22:21:03 393

python字符串

字符串是Python中最常用的数据类型。我们可以使用引号('或")来创建字符串。

创建字符串很简单，只要为变量分配一个值即可。例如：

var1='HelloWorld!'
var2="jb51.net"

上面单引号'或双引号"都可以使用

Python访问字符串中的值

Python不支持单字符类型，单字符在Python中也是作为一个字符串使用。

Python访问子字符串，可以使用方括号来截取字符串，如下实例：

#!/usr/bin/python3

var1='HelloWorld!'
var2="jb51.net"

print("var1[0]:",var1[0])
print("var2[1:5]:",var2[1:5])

以上实例执行结果：

var1[0]:H
var2[1:5]:b51.

具体的查看这篇文章

https://www.nhooo.com/article/165463.htm

Python字符串更新

你可以截取字符串的一部分并与其他字段拼接，如下实例：

#!/usr/bin/python3
var1='HelloWorld!'
print("已更新字符串:",var1[:6]+'jb51.net')

var1[:6]就是截取var1从开始到第六个字符包括空格正好是"Hello"

以上实例执行结果

已更新字符串:Hellojb51.net

Python转义字符

在需要在字符中使用特殊字符时，python用反斜杠(\)转义字符。如下表：

转义字符	描述
\(在行尾时)	续行符
\\	反斜杠符号
\'	单引号
\"	双引号
\a	响铃
\b	退格(Backspace)
\000	空
\n	换行
\v	纵向制表符
\t	横向制表符
\r	回车
\f	换页
\oyy	八进制数，yy 代表的字符，例如：\o12 代表换行，其中o是字母，不是数字0。
\xyy	十六进制数，yy代表的字符，例如：\x0a代表换行
\other	其它的字符以普通格式输出

Python字符串运算符

下表实例变量a值为字符串"Hello"，b变量值为"Python"：

操作符	描述	实例
+	字符串连接	a+b输出结果：HelloPython
*	重复输出字符串	a*2输出结果：HelloHello
[]	通过索引获取字符串中字符	a[1]输出结果 e
[:]	截取字符串中的一部分，遵循左闭右开原则，str[0,2]是不包含第3个字符的。	a[1:4]输出结果 ell
in	成员运算符-如果字符串中包含给定的字符返回True	'H'ina 输出结果True
notin	成员运算符-如果字符串中不包含给定的字符返回True	'M'notina 输出结果True
r/R	原始字符串-原始字符串：所有的字符串都是直接按照字面的意思来使用，没有转义特殊或不能打印的字符。原始字符串除在字符串的第一个引号前加上字母 r（可以大小写）以外，与普通字符串有着几乎完全相同的语法。	print(r'\n') print(R'\n')
%	格式字符串	请看下一节内容。

#!/usr/bin/python3

a="Hello"
b="Python"

print("a+b输出结果：",a+b)
print("a*2输出结果：",a*2)
print("a[1]输出结果：",a[1])
print("a[1:4]输出结果：",a[1:4])

if("H"ina):
print("H在变量a中")
else:
print("H不在变量a中")

if("M"notina):
print("M不在变量a中")
else:
print("M在变量a中")

print(r'\n')
print(R'\n')

以上实例输出结果为：

a+b输出结果：HelloPython
a*2输出结果：HelloHello
a[1]输出结果：e
a[1:4]输出结果：ell
H在变量a中
M不在变量a中
\n
\n

Python字符串格式化

Python支持格式化字符串的输出。尽管这样可能会用到非常复杂的表达式，但最基本的用法是将一个值插入到一个有字符串格式符%s的字符串中。

在Python中，字符串格式化使用与C中sprintf函数一样的语法。

#!/usr/bin/python3

print("我叫%s今年%d岁!"%('毛票票',13))

以上实例输出结果：

我叫毛票票今年13岁!

python字符串格式化符号:

符号	描述
%c	格式化字符及其ASCII码
%s	格式化字符串
%d	格式化整数
%u	格式化无符号整型
%o	格式化无符号八进制数
%x	格式化无符号十六进制数
%X	格式化无符号十六进制数（大写）
%f	格式化浮点数字，可指定小数点后的精度
%e	用科学计数法格式化浮点数
%E	作用同%e，用科学计数法格式化浮点数
%g	%f和%e的简写
%G	%f和%E的简写
%p	用十六进制数格式化变量的地址

格式化操作符辅助指令:

符号	功能
*	定义宽度或者小数点精度
-	用做左对齐
+	在正数前面显示加号(+)
	在正数前面显示空格
#	在八进制数前面显示零('0')，在十六进制前面显示'0x'或者'0X'(取决于用的是'x'还是'X')
0	显示的数字前面填充'0'而不是默认的空格
%	'%%'输出一个单一的'%'
(var)	映射变量(字典参数)
m.n.	m是显示的最小总宽度,n是小数点后的位数(如果可用的话)

Python2.6开始，新增了一种格式化字符串的函数 str.format()，它增强了字符串格式化的功能。

Python三引号

python三引号允许一个字符串跨多行，字符串中可以包含换行符、制表符以及其他特殊字符。实例如下

#!/usr/bin/python3

para_str="""这是一个多行字符串的实例
多行字符串可以使用制表符
TAB(\t)。
也可以使用换行符[\n]。
"""
print(para_str)

以上实例执行结果为：

这是一个多行字符串的实例
多行字符串可以使用制表符
TAB( )。
也可以使用换行符[
]。

三引号让程序员从引号和特殊字符串的泥潭里面解脱出来，自始至终保持一小块字符串的格式是所谓的WYSIWYG（所见即所得）格式的。

一个典型的用例是，当你需要一块HTML或者SQL时，这时用字符串组合，特殊字符串转义将会非常的繁琐。

errHTML='''
<br/> FriendsCGIDemo

ERROR

%s

ONCLICK="window.history.back()">

'''
cursor.execute('''
CREATETABLEusers(
loginVARCHAR(8),
uidINTEGER,
pridINTEGER)
''')

f-string

f-string是python3.6之后版本添加的，称之为字面量格式化字符串，是新的格式化字符串的语法。

之前我们习惯用百分号(%):

>>>name='Jb51.net'
>>>'Hello%s'%name
'HelloJb51.net'

f-string格式话字符串以f开头，后面跟着字符串，字符串中的表达式用大括号{}包起来，它会将变量或表达式计算后的值替换进去，实例如下：

>>>name='Jb51.net'
>>>f'Hello{name}'#替换变量
Hellojb51.net
>>>f'{1+2}'#使用表达式
'3'

>>>w={'name':'Jb51','url':'www.Jb51.net'}
>>>f'{w["name"]}:{w["url"]}'
'Jb51:www.Jb51.net

用了这种方式明显更简单了，不用再去判断使用%s，还是%d。

在Python3.8的版本中可以使用=符号来拼接运算表达式与结果：

实例

>>>x=1
>>>print(f'{x+1}')#Python3.6
2

>>>x=1
>>>print(f'{x+1=}')#Python3.8
'x+1=2'

Unicode字符串

在Python2中，普通字符串是以8位ASCII码进行存储的，而Unicode字符串则存储为16位unicode字符串，这样能够表示更多的字符集。使用的语法是在字符串前面加上前缀u。

在Python3中，所有的字符串都是Unicode字符串。

Python的字符串内建函数

Python的字符串常用内建函数如下：

序号	方法及描述
1	capitalize() 将字符串的第一个字符转换为大写
2	center(width,fillchar) 返回一个指定的宽度width居中的字符串，fillchar为填充的字符，默认为空格。
3	count(str,beg=0,end=len(string)) 返回str在string里面出现的次数，如果beg或者end指定则返回指定范围内str出现的次数
4	bytes.decode(encoding="utf-8",errors="strict") Python3中没有decode方法，但我们可以使用bytes对象的decode()方法来解码给定的bytes对象，这个bytes对象可以由str.encode()来编码返回。
5	encode(encoding='UTF-8',errors='strict') 以encoding指定的编码格式编码字符串，如果出错默认报一个ValueError的异常，除非errors指定的是'ignore'或者'replace'
6	endswith(suffix,beg=0,end=len(string)) 检查字符串是否以obj结束，如果beg或者end指定则检查指定的范围内是否以obj结束，如果是，返回True,否则返回False.
7	expandtabs(tabsize=8) 把字符串string中的tab符号转为空格，tab符号默认的空格数是8。
8	find(str,beg=0,end=len(string)) 检测str是否包含在字符串中，如果指定范围beg和end，则检查是否包含在指定范围内，如果包含返回开始的索引值，否则返回-1
9	index(str,beg=0,end=len(string)) 跟find()方法一样，只不过如果str不在字符串中会报一个异常.
10	isalnum() 如果字符串至少有一个字符并且所有字符都是字母或数字则返回True,否则返回False
11	isalpha() 如果字符串至少有一个字符并且所有字符都是字母则返回True,否则返回False
12	isdigit() 如果字符串只包含数字则返回True否则返回False..
13	islower() 如果字符串中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是小写，则返回True，否则返回False
14	isnumeric() 如果字符串中只包含数字字符，则返回True，否则返回False
15	isspace() 如果字符串中只包含空白，则返回True，否则返回False.
16	istitle() 如果字符串是标题化的(见title())则返回True，否则返回False
17	isupper() 如果字符串中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是大写，则返回True，否则返回False
18	join(seq) 以指定字符串作为分隔符，将seq中所有的元素(的字符串表示)合并为一个新的字符串
19	len(string) 返回字符串长度
20	ljust(width[,fillchar]) 返回一个原字符串左对齐,并使用fillchar填充至长度width的新字符串，fillchar默认为空格。
21	lower() 转换字符串中所有大写字符为小写.
22	lstrip() 截掉字符串左边的空格或指定字符。
23	maketrans() 创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标。
24	max(str) 返回字符串str中最大的字母。
25	min(str) 返回字符串str中最小的字母。
26	replace(old,new[,max]) 把将字符串中的str1替换成str2,如果max指定，则替换不超过max次。
27	rfind(str,beg=0,end=len(string)) 类似于find()函数，不过是从右边开始查找.
28	rindex(str,beg=0,end=len(string)) 类似于index()，不过是从右边开始.
29	rjust(width,[,fillchar]) 返回一个原字符串右对齐,并使用fillchar(默认空格）填充至长度width的新字符串
30	rstrip() 删除字符串字符串末尾的空格.
31	split(str="",num=string.count(str)) num=string.count(str))以str为分隔符截取字符串，如果num有指定值，则仅截取num+1个子字符串
32	splitlines([keepends]) 按照行('\r','\r\n',\n')分隔，返回一个包含各行作为元素的列表，如果参数keepends为False，不包含换行符，如果为True，则保留换行符。
33	startswith(substr,beg=0,end=len(string)) 检查字符串是否是以指定子字符串substr开头，是则返回True，否则返回False。如果beg和end指定值，则在指定范围内检查。
34	strip([chars]) 在字符串上执行lstrip()和rstrip()
35	swapcase() 将字符串中大写转换为小写，小写转换为大写
36	title() 返回"标题化"的字符串,就是说所有单词都是以大写开始，其余字母均为小写(见istitle())
37	translate(table,deletechars="") 根据str给出的表(包含256个字符)转换string的字符,要过滤掉的字符放到deletechars参数中
38	upper() 转换字符串中的小写字母为大写
39	zfill(width) 返回长度为width的字符串，原字符串右对齐，前面填充0
40	isdecimal() 检查字符串是否只包含十进制字符，如果是返回true，否则返回false。

下面是不一些实例

建议大家手工打出来，这样才能理解，一个字符的差别都会导致出错

字符串截取字符补充：

#0、a,b为参数。从字符串指针为a的地方开始截取字符，到b的前一个位置（因为不包含b）
var1="helloworld";
print(var1[a:b]);

#1、如果a,b均不填写，默认取全部字符。即，下面这两个打印结果是一样的
print(var1[:]);#helloworld
print(var1);#helloworld

#2、如果a填写，b不填写（或填写的值大于指针下标），默认从a开始截取，至字符串最后一个位置
print(var1[3:]);#loworld

#3、如果a不填写，b填写，默认从0位置开始截取，至b的前一个位置
print(var1[:8]);#hellowo

#4、如果a为负数，默认从尾部某一位置，开始向后截取
print(var1[-2:]);#ld

#5、如果a>=b,默认输出为空。
print(var1[3:3]);
print(var1[3:2]);

python字符串格式化符号%f可指定小数点后的精度。

>>>num=18.7254
>>>print("thepriceis%.2f"%num)
thepriceis18.73
>>>

python字符串格式化符号:

%g是%f和%e的简写是什么意思？到底是%f还是%e？

对此我用代码测试了一下：

>>>a=100000
>>>print("%g"%(a))
100000
>>>a=10000000
>>>print("%g"%(a))
1e+07
>>>a=1000000
>>>print("%g"%(a))
1e+06

可以发现，%g是自动选择输出格式的，在六位数的情况下就会以科学计数法方式输出，文章中说%g是%f和%e的简写，但是我发现上述不是科学计数法方式输出的时候输出的是一个整数，于是又进行了如下测试：

>>>a=100000.0
>>>print("%g"%(a))
100000
>>>print("%f"%(a))
100000.000000
>>>

发现%g在不是用%e输出的情况下和%f还是有区别的

对此我又做了如下测试：

>>>a=100000.1
>>>print("%g"%(a))
100000
>>>a=1.0
>>>print("%g"%(a))
1
>>>a=1.1
>>>print("%g"%(a))
1.1

发现在a=100000.1的时候输出的数并没有小数点后面的1，对此我对比了C语言%g的格式输出，猜想python中应该如同C语言一样，%g用于打印数据时，会去掉多余的零，至多保留六位有效数字。

使用格式化符号进行进制转换

>>>num=10
>>>print('十六进制：%#x'%num)#使用%x将十进制num格式化为十六进制
十六进制：0xa
>>>print('二进制:',bin(num))#使用bin将十进制num格式化为二进制
二进制:0b1010
>>>print('八进制：%#o'%num)#使用%o将十进制num格式化为八进制
八进制：0o12

上面使用格式化符号进行进制转换中，多加入了一个#号，目的是在转换结果头部显示当前进制类型，如不需要，可将#号去除，如下

>>>print('八进制：%o'%num)
八进制：12
>>>print('十六进制：%x'%num)
十六进制：a

字符串截取字符继续补充:

[::2]表示的是从头到尾，步长为2。第一个冒号两侧的数字是指截取字符串的范围,第二个冒号后面是指截取的步长。

>>>L=['a','b','c','d','e','f','g']
>>>print(L[::2])
['a','c','e','g']

可以使用负数从字符串右边末尾向左边反向索引，最右侧索引值是-1:

>>>str="jb51.net"
>>>str[-4]
'.'
>>>

字符串的分割还有partition()这种方式。

partition(sep) -->(head,sep,tail)

从左向右遇到分隔符把字符串分割成两部分，返回头、分割符、尾三部分的三元组。如果没有找到分割符，就返回头、尾两个空元素的三元组。

s1="I'magoodsutdent."
#以'good'为分割符，返回头、分割符、尾三部分。
s2=s1.partition('good')
#没有找到分割符'abc'，返回头、尾两个空元素的元组。
s3=s1.partition('abc')

print(s1)
print(s2)
print(s3)

结果如下：

I'magoodsutdent.
("I'ma",'good','sutdent.')
("I'magoodsutdent.",'','')

字符串等倒序小测：

ch="毛票票欢迎您"
ls=[0,1,2,3,4]
st=(0,1,2,3,4)
print(ch[::-1])
print(ls[::-1])
print(st[::-1])

输出:

您迎欢家之本脚
[4,3,2,1,0]
(4,3,2,1,0)

这篇文章就介绍到这了。

声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：czq8825#qq.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

python3 字符串知识点学习笔记

ERROR

热门推荐

随机推荐