Python 功能和特点(新手必学)

2024-03-23 13:47:03 437

Python是一门简单而文字简约的语言。阅读好的Python程序感觉就像阅读英语，尽管是非常严格的英语。Python的这种伪代码特性是其最大强项之一，它可让你专注于解决问题的办法而不是语言本身。

在使用Python多年以后，我偶然发现了一些我们过去不知道的功能和特性。一些可以说是非常有用，但却没有充分利用。考虑到这一点，我编辑了一些的你应该了解的Pyghon功能特色。

带任意数量参数的函数

你可能已经知道了Python允许你定义可选参数。但还有一个方法，可以定义函数任意数量的参数。

首先，看下面是一个只定义可选参数的例子

deffunction(arg1="",arg2=""):
print"arg1:{0}".format(arg1)
print"arg2:{0}".format(arg2)
function("Hello","World")
#printsargs1:Hello
#printsargs2:World
function()
#printsargs1:
#printsargs2:

现在，让我们看看怎么定义一个可以接受任意参数的函数。我们利用元组来实现。

deffoo(*args):#justuse"*"tocollectallremainingargumentsintoatuple
numargs=len(args)
print"Numberofarguments:{0}".format(numargs)
fori,xinenumerate(args):
print"Argument{0}is:{1}".format(i,x)
foo()
#Numberofarguments:0
foo("hello")
#Numberofarguments:1
#Argument0is:hello
foo("hello","World","Again")
#Numberofarguments:3
#Argument0is:hello
#Argument1is:World
#Argument2is:Again

使用Glob()查找文件

大多Python函数有着长且具有描述性的名字。但是命名为glob()的函数你可能不知道它是干什么的除非你从别处已经熟悉它了。

它像是一个更强大版本的listdir()函数。它可以让你通过使用模式匹配来搜索文件。

importglob
#getallpyfiles
files=glob.glob('*.py')
printfiles
#Output
#['arg.py','g.py','shut.py','test.py']

你可以像下面这样查找多个文件类型：

importitertoolsasit,glob
defmultiple_file_types(*patterns):
returnit.chain.from_iterable(glob.glob(pattern)forpatterninpatterns)
forfilenameinmultiple_file_types("*.txt","*.py"):#addasmanyfiletypearguements
printfilename
#output
#=========#
#test.txt
#arg.py
#g.py
#shut.py
#test.py

如果你想得到每个文件的绝对路径，你可以在返回值上调用realpath()函数：

importitertoolsasit,glob,os
defmultiple_file_types(*patterns):
returnit.chain.from_iterable(glob.glob(pattern)forpatterninpatterns)
forfilenameinmultiple_file_types("*.txt","*.py"):#addasmanyfiletypearguements
realpath=os.path.realpath(filename)
printrealpath
#output
#=========#
#C:\xxx\pyfunc\test.txt
#C:\xxx\pyfunc\arg.py
#C:\xxx\pyfunc\g.py
#C:\xxx\pyfunc\shut.py
#C:\xxx\pyfunc\test.py

调试

下面的例子使用inspect模块。该模块用于调试目的时是非常有用的，它的功能远比这里描述的要多。

这篇文章不会覆盖这个模块的每个细节，但会展示给你一些用例。

importlogging,inspect
logging.basicConfig(level=logging.INFO,
format='%(asctime)s%(levelname)-8s%(filename)s:%(lineno)-4d:%(message)s',
datefmt='%m-%d%H:%M',
)
logging.debug('Adebugmessage')
logging.info('Someinformation')
logging.warning('Ashotacrossthebow')
deftest():
frame,filename,line_number,function_name,lines,index=\
inspect.getouterframes(inspect.currentframe())[1]
print(frame,filename,line_number,function_name,lines,index)
test()
#Shouldprintthefollowing(withcurrentdate/timeofcourse)
#10-1919:57INFOtest.py:9:Someinformation
#10-1919:57WARNINGtest.py:10:Ashotacrossthebow
#(,'C:/xxx/pyfunc/magic.py',16,'',['test()\n'],0)

生成唯一ID

在有些情况下你需要生成一个唯一的字符串。我看到很多人使用md5()函数来达到此目的，但它确实不是以此为目的。

其实有一个名为uuid()的Python函数是用于这个目的的。

importuuid
result=uuid.uuid1()
printresult
#output=>variousattempts
#9e177ec0-65b6-11e3-b2d0-e4d53dfcf61b
#be57b880-65b6-11e3-a04d-e4d53dfcf61b
#c3b2b90f-65b6-11e3-8c86-e4d53dfcf61b

你可能会注意到，即使字符串是唯一的，但它们后边的几个字符看起来很相似。这是因为生成的字符串与电脑的MAC地址是相联系的。

为了减少重复的情况，你可以使用这两个函数。

importhmac,hashlib
key='1'
data='a'
printhmac.new(key,data,hashlib.sha256).hexdigest()
m=hashlib.sha1()
m.update("Thequickbrownfoxjumpsoverthelazydog")
printm.hexdigest()
#c6e693d0b35805080632bc2469e1154a8d1072a86557778c27a01329630f8917
#2fd4e1c67a2d28fced849ee1bb76e7391b93eb12

序列化

你曾经需要将一个复杂的变量存储在数据库或文本文件中吧？你不需要想一个奇特的方法将数组或对象格转化为式化字符串，因为Python已经提供了此功能。

importpickle
variable=['hello',42,[1,'two'],'apple']
#serializecontent
file=open('serial.txt','w')
serialized_obj=pickle.dumps(variable)
file.write(serialized_obj)
file.close()
#unserializetoproduceoriginalcontent
target=open('serial.txt','r')
myObj=pickle.load(target)
printserialized_obj
printmyObj
#output
#(lp0
#S'hello'
#p1
#aI42
#a(lp2
#I1
#aS'two'
#p3
#aaS'apple'
#p4
#a.
#['hello',42,[1,'two'],'apple']

这是一个原生的Python序列化方法。然而近几年来JSON变得流行起来，Python添加了对它的支持。现在你可以使用JSON来编解码。

importjson
variable=['hello',42,[1,'two'],'apple']
print"Original{0}-{1}".format(variable,type(variable))
#encoding
encode=json.dumps(variable)
print"Encoded{0}-{1}".format(encode,type(encode))
#deccoding
decoded=json.loads(encode)
print"Decoded{0}-{1}".format(decoded,type(decoded))
#output
#Original['hello',42,[1,'two'],'apple']-<type'list'="">
#Encoded["hello",42,[1,"two"],"apple"]-<type'str'="">
#Decoded[u'hello',42,[1,u'two'],u'apple']-<type'list'="">

这样更紧凑，而且最重要的是这样与JavaScript和许多其他语言兼容。然而对于复杂的对象，其中的一些信息可能丢失。

压缩字符

当谈起压缩时我们通常想到文件，比如ZIP结构。在Python中可以压缩长字符，不涉及任何档案文件。

importzlib
string="""Loremipsumdolorsitamet,consectetur
adipiscingelit.Nuncutelitidmiultricies
adipiscing.Nullafacilisi.Praesentpulvinar,
sapienvelfeugiatvestibulum,nulladuipretiumorci,
nonultricieselitlacusquisante.Loremipsumdolor
sitamet,consecteturadipiscingelit.Aliquam
pretiumullamcorperurnaquisiaculis.Etiamacmassa
sedturpistemporluctus.Curabitursednibheuelit
molliscongue.Praesentipsumdiam,consecteturvitae
ornarea,aliquamanunc.Inidmagnapellentesque
tellusposuereadipiscing.Sednonmimetus,atlacinia
augue.Sedmagnanisi,ornareinmollisin,mollis
sednunc.Etiamatjustoinleoconguemollis.
Nullaminnequeegetmetushendreritscelerisque
eunonenim.Utmalesuadalacuseunullabibendum
ideuismodurnasodales."""
print"OriginalSize:{0}".format(len(string))
compressed=zlib.compress(string)
print"CompressedSize:{0}".format(len(compressed))
decompressed=zlib.decompress(compressed)
print"DecompressedSize:{0}".format(len(decompressed))
#output
#OriginalSize:1022
#CompressedSize:423
#DecompressedSize:1022

注册Shutdown函数

有可模块叫atexit，它可以让你在脚本运行完后立马执行一些代码。

假如你想在脚本执行结束时测量一些基准数据，比如运行了多长时间：

打眼看来很简单。只需要将代码添加到脚本的最底层，它将在脚本结束前运行。但如果脚本中有一个致命错误或者脚本被用户终止，它可能就不运行了。

当你使用atexit.register()时，你的代码都将执行，不论脚本因为什么原因停止运行。

结论

你是否意识到那些不是广为人知Python特性很有用？请在评论处与我们分享。谢谢你的阅读！

Python 功能和特点(新手必学)

热门推荐

随机推荐