Lua中的string库(字符串函数库)总结
Lua解释器对字符串的支持很有限。一个程序可以创建字符串并连接字符串,但不能截取子串,检查字符串的大小,检测字符串的内容。在Lua中操纵字符串的功能基本来自于string库。
字符串库中的一些函数是非常简单的:
string.len(s) 返回字符串s的长度;
string.rep(s,n) 返回重复n次字符串s的串;你使用string.rep("a",2^20)可以创建一个1Mbytes的字符串(比如,为了测试需要);
string.lower(s) 将s中的大写字母转换成小写(string.upper将小写转换成大写)。如果你想不关心大小写对一个数组进行排序的话,你可以这样:
table.sort(a,function(a,b)returnstring.lower(a)<string.lower(b)end)
string.upper(s) 将s中的小写字母转换成大写
string.upper和string.lower都依赖于本地环境变量。所以,如果你在EuropeanLatin-1环境下,表达式:
string.upper("a??o") -->"A??O"
string.sub(s,i,j) 函数截取字符串s的从第i个字符到第j个字符之间的串。Lua中,字符串的第一个字符索引从1开始。你也可以使用负索引,负索引从字符串的结尾向前计数:-1指向最后一个字符,-2指向倒数第二个,以此类推。所以,string.sub(s,1,j)返回字符串s的长度为j的前缀;string.sub(s,j,-1)返回从第j个字符开始的后缀。如果不提供第3个参数,默认为-1,因此我们将最后一个调用写为string.sub(s,j);string.sub(s,2,-2)返回去除第一个和最后一个字符后的子串。
s="[inbrackets]" print(string.sub(s,2,-2))-->inbrackets
记住:Lua中的字符串是恒定不变的。string.sub函数以及Lua中其他的字符串操作函数都不会改变字符串的值,而是返回一个新的字符串。一个常见的错误是:
string.sub(s,2,-2)
认为上面的这个函数会改变字符串s的值。如果你想修改一个字符串变量的值,你必须将变量赋给一个新的字符串:
s=string.sub(s,2,-2)
string.char函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数,将每一个数字转换成字符,然后返回一个所有这些字符连接起来的字符串。string.byte(s,i)将字符串s的第i个字符的转换成整数;第二个参数是可选的,缺省情况下i=1。下面的例子中,我们假定字符用ASCII表示:
print(string.char(97))-->a i=99;print(string.char(i,i+1,i+2))-->cde print(string.byte("abc"))-->97 print(string.byte("abc",2))-->98 print(string.byte("abc",-1))-->99
上面最后一行,我们使用负数索引访问字符串的最后一个字符。
Lua提供了string.format()函数来生成具有特定格式的字符串,函数的第一个参数是格式(formatstring),之后是对应格式中每个代号的各种数据.由于格式字符串的存在,使得产生的长字符串可读性大大提高了.这个函数的格式很像C语言中的printf().函数string.format在用来对字符串进行格式化的时候,特别是字符串输出,是功能强大的工具。这个函数有两个参数,你完全可以照C语言的printf来使用这个函数。第一个参数为格式化串:由指示符和控制格式的字符组成。指示符后的控制格式的字符可以为:十进制'd';十六进制'x';八进制'o';浮点数'f';字符串's'。在指示符'%'和控制格式字符之间还可以有其他的选项:用来控制更详细的格式,比如一个浮点数的小数的位数:
格式字符串可能包含以下的转义码:
%c-接受一个数字,并将其转化为ASCII码表中对应的字符 %d,%i-接受一个数字并将其转化为有符号的整数格式 %o-接受一个数字并将其转化为八进制数格式 %u-接受一个数字并将其转化为无符号整数格式 %x-接受一个数字并将其转化为十六进制数格式,使用小写字母 %X-接受一个数字并将其转化为十六进制数格式,使用大写字母 %e-接受一个数字并将其转化为科学记数法格式,使用小写字母e %E-接受一个数字并将其转化为科学记数法格式,使用大写字母E %f-接受一个数字并将其转化为浮点数格式 %g(%G)-接受一个数字并将其转化为%e(%E,对应%G)及%f中较短的一种格式 %q-接受一个字符串并将其转化为可安全被Lua编译器读入的格式 %s-接受一个字符串并按照给定的参数格式化该字符串
为进一步细化格式,可以在%号后添加参数.参数将以如下的顺序读入:
(1)符号:一个+号表示其后的数字转义符将让正数显示正号.默认情况下只有负数显示符号.
(2)占位符:一个0,在后面指定了字串宽度时占位用.不填时的默认占位符是空格.
(3)对齐标识:在指定了字串宽度时,默认为右对齐,增加-号可以改为左对齐.
(4)宽度数值
(5)小数位数/字串裁切:在宽度数值后增加的小数部分n,若后接f(浮点数转义符,如%6.3f)则设定该浮点数的小数只保留n位,若后接s(字符串转义符,如%5.3s)则设定该字符串只显示前n位.
在这些参数的后面则是上述所列的转义码类型(c,d,i,f,...).
print(string.format("pi=%.4f",PI)) -->pi=3.1416 d=5;m=11;y=1990 print(string.format("%02d/%02d/%04d",d,m,y)) -->05/11/1990 tag,title="h1","atitle" print(string.format("<%s>%s</%s>",tag,title,tag)) --><h1>atitle</h1>
第一个例子,%.4f代表小数点后面有4位小数的浮点数。第二个例子%02d代表以固定的两位显示十进制数,不足的前面补0。而%2d前面没有指定0,不足两位时会以空白补足。对于格式串部分指示符得详细描述清参考lua手册,或者参考C手册,因为Lua调用标准C的printf函数来实现最终的功能。
以下是一些例子:
string.format("%%c:%c",83) 输出S string.format("%+d",17.0) 输出+17 string.format("%05d",17) 输出00017 string.format("%o",17) 输出21 string.format("%u",3.14) 输出3 string.format("%x",13) 输出d string.format("%X",13) 输出D string.format("%e",1000) 输出1.000000e+03 string.format("%E",1000) 输出1.000000E+03 string.format("%6.3f",13) 输出13.000 string.format("%q","One\nTwo") 输出"One\ Two" string.format("%s","monkey") 输出monkey string.format("%10s","monkey") 输出 monkey string.format("%5.3s","monkey") 输出 mon