Python中str.format()详解
1.str.format的引入
在Python中,我们可以使用+来连接字符串,在简单情况下这种方式能够很好的工作。但是当我们需要进行复杂的字符串连接时,如果依然使用+来完成,不仅会使代码变得晦涩难懂,还会让代码变得难以维护,此时这种方式就显得力不从心了。
例如,我们想打印这样一条记录:
User:JohnhascompletedAction:paymentatTime:13:30:00
如果使用加号实现,会是下面这种形式:
print"User:"+user_name+"hascompletedAction:"+\ action_name+"atTime:"+current_time
如果以后回过头来阅读这段代码,我们很难直观看出它的输出格式,且修改起来也相对麻烦。
我们可以换用%来实现:
print"User:%shascompletedAction:%satTime:%s"%\ (user_name,action_name,current_time)
这回代码变得清晰简洁多了。
不过,Python为我们提供了另一种简洁优雅的实现方式,也是官方更加推荐的方式:使用str.format()来实现字符串的格式化:
print"User:{}hascompletedAction:{}atTime:{}".format( user_name,action_name,current_time)
str.format既能够用于简单的场景,也能够胜任复杂的字符串替换,而无需繁琐的字符串连接操作。Python的内置类型str和unicode均支持使用str.format()来格式化字符串。
我们接下来就详细地讨论str.format()的具体用法。
2.str.format基本语法
格式化字符串使用花括号{}来包围替换字段,也就是待替换的字符串。而未被花括号包围的字符会原封不动地出现在结果中。
2.1.使用位置索引
以下两种写法是等价的:
"Hello,{}and{}!".format("John","Mary")
"Hello,{0}and{1}!".format("John","Mary")
花括号内部可以写上目标字符串的索引,也可以省略。如果省略,则按format括号里的目标字符串顺序依次替换。
2.2.使用关键字索引
除了通过位置来指定目标字符串,我们还可以通过关键字来指定它。
例如:
"Hello,{boy}and{girl}!".format(boy="John",girl="Mary")
使用关键字索引的好处是,我们无需关心参数的位置,且字符串的最终结果能够一目了然。在以后的代码维护中,我们能够快速地修改对应的参数,而不用对照字符串挨个去寻找相应的参数。
注意:如果字符串本身含有花括号,则需要将其重复两次来转义。例如,字符串本身含有{,为了让Python知道这是一个普通字符,而不是用于包围替换字段的花括号,我们只需将它改写成{{即可。
3.str.format高级语法
str.format非常强大,足以完成日常工作中遇到的格式化输出。熟练掌握该方法,能够为以后的字符串处理打好基础,还能节省不少时间。
3.1.访问参数的属性或元素
在使用str.format来格式化字符串时,我们通常将目标字符串作为参数传递给format方法。实际上,我们还可以在格式化字符串中访问参数的某个属性或某个元素:
"Mycaris{0.color}.".format(black_car)
"Thefirststudentis{student[0]}.".format(student=stu_list)
"Johnis{d[john]}yearsold.".format(d=age_dict)
3.2.参数输出转换
参数的字符串输出,默认是由其自身的__format__方法来实现的。也就是说,Python使用参数的__format__输出来取代替换字段。如果我们想调用str()或repr()来转换参数,可以通过添加转换标志来实现:
#callstr()onargument "It'sa{0!s}." #callrepr()onargument "Wecangetinfofrom{name!r}."
4.str.format一般形式
格式化字符串的一般形式如下:
"...{field_name!conversion:format_spec}..."
从上面的代码可以看到,格式化字符串可分为field_name、conversion、format_spec三部分,分别对应替换字段名称(索引)、转换标志、格式描述。其中,字段名称是必选的,而后两者是可选的。转换标志紧跟在英文感叹号后面,而格式描述紧跟在英文冒号后面。
前面已经提到过,字段名称既可是位置索引,也可是关键字索引。字段名称后面可以通过点来访问属性,或通过方括号来访问元素。
在这里,我们重点看一下格式描述(format_spec)这一项。
格式描述中含有6个选项,分别是fill、align、sign、width、precision、type。它们的位置关系如下:
[[fill]align][sign][#][0][width][,][.precision][type]
fill
可以是任意字符,默认为空格。
align
仅当指定最小宽度时有效。
<左对齐(默认选项)
>右对齐
=仅对数字有效;将填充字符放到符号与数字间,例如+0001234
^居中对齐
sign
仅对数字有效
+所有数字均带有符号
-仅负数带有符号(默认选项)
即空格;正数前面带空格,负数前面带符号
'#'
只对整数有效
自动在二进制、八进制、十六进制数值前添加对应的0b、0o、0x。
','
自动在每三个数字之间添加,分隔符。
width
十进制数字,定义最小宽度。如果未指定,则由内容的宽度来决定。
如果没有指定对齐方式(align),那么可以在width前面添加一个0来实现自动填充0,等价于fill设为0并且align设为=。
precision
用于确定浮点数的精度,或字符串的最大长度。不可用于整型数值。
type
确定参数类型,默认为s,即字符串。
整数输出类型:
b:以二进制格式输出
c:将整数转换成对应的unicode字符
d:以十进制输出(默认选项)
o:以八进制输出
x:以十六进制小写输出
X:以十六进制大写输出
n:与d相同,但使用当前环境的分隔符来分隔每3位数字
十进制浮点数输出类型:
e:指数标记;使用科学计数法输出,用e来表示指数部分,默认precision为6
E:与e相同,但使用大写E来表示指数部分
f:以定点形式输出数值,默认precision为6
F:与f相同
g:通用格式;对于给定的precisionp>=1,取数值的p位有效数字,并以定点或科学计数法输出(默认选项)
G:通用格式;与g相同,当数值过大时使用E来表示指数部分
n:与g相同,但使用当前环境的分隔符来分隔每3位数字
%:百分比标记;使用百分比的形式输出数值,同时设定f标记