Python 功能和特点(新手必学)
Python是一门简单而文字简约的语言。阅读好的Python程序感觉就像阅读英语,尽管是非常严格的英语。Python的这种伪代码特性是其最大强项之一,它可让你专注于解决问题的办法而不是语言本身。
在使用Python多年以后,我偶然发现了一些我们过去不知道的功能和特性。一些可以说是非常有用,但却没有充分利用。考虑到这一点,我编辑了一些的你应该了解的Pyghon功能特色。
带任意数量参数的函数
你可能已经知道了Python允许你定义可选参数。但还有一个方法,可以定义函数任意数量的参数。
首先,看下面是一个只定义可选参数的例子
deffunction(arg1="",arg2=""):
print"arg1:{0}".format(arg1)
print"arg2:{0}".format(arg2)
function("Hello","World")
#printsargs1:Hello
#printsargs2:World
function()
#printsargs1:
#printsargs2:
现在,让我们看看怎么定义一个可以接受任意参数的函数。我们利用元组来实现。
deffoo(*args):#justuse"*"tocollectallremainingargumentsintoatuple
numargs=len(args)
print"Numberofarguments:{0}".format(numargs)
fori,xinenumerate(args):
print"Argument{0}is:{1}".format(i,x)
foo()
#Numberofarguments:0
foo("hello")
#Numberofarguments:1
#Argument0is:hello
foo("hello","World","Again")
#Numberofarguments:3
#Argument0is:hello
#Argument1is:World
#Argument2is:Again
使用Glob()查找文件
大多Python函数有着长且具有描述性的名字。但是命名为glob()的函数你可能不知道它是干什么的除非你从别处已经熟悉它了。
它像是一个更强大版本的listdir()函数。它可以让你通过使用模式匹配来搜索文件。
importglob
#getallpyfiles
files=glob.glob('*.py')
printfiles
#Output
#['arg.py','g.py','shut.py','test.py']
你可以像下面这样查找多个文件类型:
importitertoolsasit,glob
defmultiple_file_types(*patterns):
returnit.chain.from_iterable(glob.glob(pattern)forpatterninpatterns)
forfilenameinmultiple_file_types("*.txt","*.py"):#addasmanyfiletypearguements
printfilename
#output
#=========#
#test.txt
#arg.py
#g.py
#shut.py
#test.py
如果你想得到每个文件的绝对路径,你可以在返回值上调用realpath()函数:
importitertoolsasit,glob,os
defmultiple_file_types(*patterns):
returnit.chain.from_iterable(glob.glob(pattern)forpatterninpatterns)
forfilenameinmultiple_file_types("*.txt","*.py"):#addasmanyfiletypearguements
realpath=os.path.realpath(filename)
printrealpath
#output
#=========#
#C:\xxx\pyfunc\test.txt
#C:\xxx\pyfunc\arg.py
#C:\xxx\pyfunc\g.py
#C:\xxx\pyfunc\shut.py
#C:\xxx\pyfunc\test.py
调试
下面的例子使用inspect模块。该模块用于调试目的时是非常有用的,它的功能远比这里描述的要多。
这篇文章不会覆盖这个模块的每个细节,但会展示给你一些用例。
importlogging,inspect
logging.basicConfig(level=logging.INFO,
format='%(asctime)s%(levelname)-8s%(filename)s:%(lineno)-4d:%(message)s',
datefmt='%m-%d%H:%M',
)
logging.debug('Adebugmessage')
logging.info('Someinformation')
logging.warning('Ashotacrossthebow')
deftest():
frame,filename,line_number,function_name,lines,index=\
inspect.getouterframes(inspect.currentframe())[1]
print(frame,filename,line_number,function_name,lines,index)
test()
#Shouldprintthefollowing(withcurrentdate/timeofcourse)
#10-1919:57INFOtest.py:9:Someinformation
#10-1919:57WARNINGtest.py:10:Ashotacrossthebow
#(,'C:/xxx/pyfunc/magic.py',16,'',['test()\n'],0)
生成唯一ID
在有些情况下你需要生成一个唯一的字符串。我看到很多人使用md5()函数来达到此目的,但它确实不是以此为目的。
其实有一个名为uuid()的Python函数是用于这个目的的。
importuuid result=uuid.uuid1() printresult #output=>variousattempts #9e177ec0-65b6-11e3-b2d0-e4d53dfcf61b #be57b880-65b6-11e3-a04d-e4d53dfcf61b #c3b2b90f-65b6-11e3-8c86-e4d53dfcf61b
你可能会注意到,即使字符串是唯一的,但它们后边的几个字符看起来很相似。这是因为生成的字符串与电脑的MAC地址是相联系的。
为了减少重复的情况,你可以使用这两个函数。
importhmac,hashlib
key='1'
data='a'
printhmac.new(key,data,hashlib.sha256).hexdigest()
m=hashlib.sha1()
m.update("Thequickbrownfoxjumpsoverthelazydog")
printm.hexdigest()
#c6e693d0b35805080632bc2469e1154a8d1072a86557778c27a01329630f8917
#2fd4e1c67a2d28fced849ee1bb76e7391b93eb12
序列化
你曾经需要将一个复杂的变量存储在数据库或文本文件中吧?你不需要想一个奇特的方法将数组或对象格转化为式化字符串,因为Python已经提供了此功能。
importpickle
variable=['hello',42,[1,'two'],'apple']
#serializecontent
file=open('serial.txt','w')
serialized_obj=pickle.dumps(variable)
file.write(serialized_obj)
file.close()
#unserializetoproduceoriginalcontent
target=open('serial.txt','r')
myObj=pickle.load(target)
printserialized_obj
printmyObj
#output
#(lp0
#S'hello'
#p1
#aI42
#a(lp2
#I1
#aS'two'
#p3
#aaS'apple'
#p4
#a.
#['hello',42,[1,'two'],'apple']
这是一个原生的Python序列化方法。然而近几年来JSON变得流行起来,Python添加了对它的支持。现在你可以使用JSON来编解码。
importjson
variable=['hello',42,[1,'two'],'apple']
print"Original{0}-{1}".format(variable,type(variable))
#encoding
encode=json.dumps(variable)
print"Encoded{0}-{1}".format(encode,type(encode))
#deccoding
decoded=json.loads(encode)
print"Decoded{0}-{1}".format(decoded,type(decoded))
#output
#Original['hello',42,[1,'two'],'apple']-<type'list'="">
#Encoded["hello",42,[1,"two"],"apple"]-<type'str'="">
#Decoded[u'hello',42,[1,u'two'],u'apple']-<type'list'="">
这样更紧凑,而且最重要的是这样与JavaScript和许多其他语言兼容。然而对于复杂的对象,其中的一些信息可能丢失。
压缩字符
当谈起压缩时我们通常想到文件,比如ZIP结构。在Python中可以压缩长字符,不涉及任何档案文件。
importzlib
string="""Loremipsumdolorsitamet,consectetur
adipiscingelit.Nuncutelitidmiultricies
adipiscing.Nullafacilisi.Praesentpulvinar,
sapienvelfeugiatvestibulum,nulladuipretiumorci,
nonultricieselitlacusquisante.Loremipsumdolor
sitamet,consecteturadipiscingelit.Aliquam
pretiumullamcorperurnaquisiaculis.Etiamacmassa
sedturpistemporluctus.Curabitursednibheuelit
molliscongue.Praesentipsumdiam,consecteturvitae
ornarea,aliquamanunc.Inidmagnapellentesque
tellusposuereadipiscing.Sednonmimetus,atlacinia
augue.Sedmagnanisi,ornareinmollisin,mollis
sednunc.Etiamatjustoinleoconguemollis.
Nullaminnequeegetmetushendreritscelerisque
eunonenim.Utmalesuadalacuseunullabibendum
ideuismodurnasodales."""
print"OriginalSize:{0}".format(len(string))
compressed=zlib.compress(string)
print"CompressedSize:{0}".format(len(compressed))
decompressed=zlib.decompress(compressed)
print"DecompressedSize:{0}".format(len(decompressed))
#output
#OriginalSize:1022
#CompressedSize:423
#DecompressedSize:1022
注册Shutdown函数
有可模块叫atexit,它可以让你在脚本运行完后立马执行一些代码。
假如你想在脚本执行结束时测量一些基准数据,比如运行了多长时间:
打眼看来很简单。只需要将代码添加到脚本的最底层,它将在脚本结束前运行。但如果脚本中有一个致命错误或者脚本被用户终止,它可能就不运行了。
当你使用atexit.register()时,你的代码都将执行,不论脚本因为什么原因停止运行。
结论
你是否意识到那些不是广为人知Python特性很有用?请在评论处与我们分享。谢谢你的阅读!