Python 功能和特点(新手必学)
Python是一门简单而文字简约的语言。阅读好的Python程序感觉就像阅读英语,尽管是非常严格的英语。Python的这种伪代码特性是其最大强项之一,它可让你专注于解决问题的办法而不是语言本身。
在使用Python多年以后,我偶然发现了一些我们过去不知道的功能和特性。一些可以说是非常有用,但却没有充分利用。考虑到这一点,我编辑了一些的你应该了解的Pyghon功能特色。
带任意数量参数的函数
你可能已经知道了Python允许你定义可选参数。但还有一个方法,可以定义函数任意数量的参数。
首先,看下面是一个只定义可选参数的例子
deffunction(arg1="",arg2=""): print"arg1:{0}".format(arg1) print"arg2:{0}".format(arg2) function("Hello","World") #printsargs1:Hello #printsargs2:World function() #printsargs1: #printsargs2:
现在,让我们看看怎么定义一个可以接受任意参数的函数。我们利用元组来实现。
deffoo(*args):#justuse"*"tocollectallremainingargumentsintoatuple numargs=len(args) print"Numberofarguments:{0}".format(numargs) fori,xinenumerate(args): print"Argument{0}is:{1}".format(i,x) foo() #Numberofarguments:0 foo("hello") #Numberofarguments:1 #Argument0is:hello foo("hello","World","Again") #Numberofarguments:3 #Argument0is:hello #Argument1is:World #Argument2is:Again
使用Glob()查找文件
大多Python函数有着长且具有描述性的名字。但是命名为glob()的函数你可能不知道它是干什么的除非你从别处已经熟悉它了。
它像是一个更强大版本的listdir()函数。它可以让你通过使用模式匹配来搜索文件。
importglob #getallpyfiles files=glob.glob('*.py') printfiles #Output #['arg.py','g.py','shut.py','test.py']
你可以像下面这样查找多个文件类型:
importitertoolsasit,glob defmultiple_file_types(*patterns): returnit.chain.from_iterable(glob.glob(pattern)forpatterninpatterns) forfilenameinmultiple_file_types("*.txt","*.py"):#addasmanyfiletypearguements printfilename #output #=========# #test.txt #arg.py #g.py #shut.py #test.py
如果你想得到每个文件的绝对路径,你可以在返回值上调用realpath()函数:
importitertoolsasit,glob,os defmultiple_file_types(*patterns): returnit.chain.from_iterable(glob.glob(pattern)forpatterninpatterns) forfilenameinmultiple_file_types("*.txt","*.py"):#addasmanyfiletypearguements realpath=os.path.realpath(filename) printrealpath #output #=========# #C:\xxx\pyfunc\test.txt #C:\xxx\pyfunc\arg.py #C:\xxx\pyfunc\g.py #C:\xxx\pyfunc\shut.py #C:\xxx\pyfunc\test.py
调试
下面的例子使用inspect模块。该模块用于调试目的时是非常有用的,它的功能远比这里描述的要多。
这篇文章不会覆盖这个模块的每个细节,但会展示给你一些用例。
importlogging,inspect logging.basicConfig(level=logging.INFO, format='%(asctime)s%(levelname)-8s%(filename)s:%(lineno)-4d:%(message)s', datefmt='%m-%d%H:%M', ) logging.debug('Adebugmessage') logging.info('Someinformation') logging.warning('Ashotacrossthebow') deftest(): frame,filename,line_number,function_name,lines,index=\ inspect.getouterframes(inspect.currentframe())[1] print(frame,filename,line_number,function_name,lines,index) test() #Shouldprintthefollowing(withcurrentdate/timeofcourse) #10-1919:57INFOtest.py:9:Someinformation #10-1919:57WARNINGtest.py:10:Ashotacrossthebow #(,'C:/xxx/pyfunc/magic.py',16,'',['test()\n'],0)
生成唯一ID
在有些情况下你需要生成一个唯一的字符串。我看到很多人使用md5()函数来达到此目的,但它确实不是以此为目的。
其实有一个名为uuid()的Python函数是用于这个目的的。
importuuid result=uuid.uuid1() printresult #output=>variousattempts #9e177ec0-65b6-11e3-b2d0-e4d53dfcf61b #be57b880-65b6-11e3-a04d-e4d53dfcf61b #c3b2b90f-65b6-11e3-8c86-e4d53dfcf61b
你可能会注意到,即使字符串是唯一的,但它们后边的几个字符看起来很相似。这是因为生成的字符串与电脑的MAC地址是相联系的。
为了减少重复的情况,你可以使用这两个函数。
importhmac,hashlib key='1' data='a' printhmac.new(key,data,hashlib.sha256).hexdigest() m=hashlib.sha1() m.update("Thequickbrownfoxjumpsoverthelazydog") printm.hexdigest() #c6e693d0b35805080632bc2469e1154a8d1072a86557778c27a01329630f8917 #2fd4e1c67a2d28fced849ee1bb76e7391b93eb12
序列化
你曾经需要将一个复杂的变量存储在数据库或文本文件中吧?你不需要想一个奇特的方法将数组或对象格转化为式化字符串,因为Python已经提供了此功能。
importpickle variable=['hello',42,[1,'two'],'apple'] #serializecontent file=open('serial.txt','w') serialized_obj=pickle.dumps(variable) file.write(serialized_obj) file.close() #unserializetoproduceoriginalcontent target=open('serial.txt','r') myObj=pickle.load(target) printserialized_obj printmyObj #output #(lp0 #S'hello' #p1 #aI42 #a(lp2 #I1 #aS'two' #p3 #aaS'apple' #p4 #a. #['hello',42,[1,'two'],'apple']
这是一个原生的Python序列化方法。然而近几年来JSON变得流行起来,Python添加了对它的支持。现在你可以使用JSON来编解码。
importjson variable=['hello',42,[1,'two'],'apple'] print"Original{0}-{1}".format(variable,type(variable)) #encoding encode=json.dumps(variable) print"Encoded{0}-{1}".format(encode,type(encode)) #deccoding decoded=json.loads(encode) print"Decoded{0}-{1}".format(decoded,type(decoded)) #output #Original['hello',42,[1,'two'],'apple']-<type'list'=""> #Encoded["hello",42,[1,"two"],"apple"]-<type'str'=""> #Decoded[u'hello',42,[1,u'two'],u'apple']-<type'list'="">
这样更紧凑,而且最重要的是这样与JavaScript和许多其他语言兼容。然而对于复杂的对象,其中的一些信息可能丢失。
压缩字符
当谈起压缩时我们通常想到文件,比如ZIP结构。在Python中可以压缩长字符,不涉及任何档案文件。
importzlib string="""Loremipsumdolorsitamet,consectetur adipiscingelit.Nuncutelitidmiultricies adipiscing.Nullafacilisi.Praesentpulvinar, sapienvelfeugiatvestibulum,nulladuipretiumorci, nonultricieselitlacusquisante.Loremipsumdolor sitamet,consecteturadipiscingelit.Aliquam pretiumullamcorperurnaquisiaculis.Etiamacmassa sedturpistemporluctus.Curabitursednibheuelit molliscongue.Praesentipsumdiam,consecteturvitae ornarea,aliquamanunc.Inidmagnapellentesque tellusposuereadipiscing.Sednonmimetus,atlacinia augue.Sedmagnanisi,ornareinmollisin,mollis sednunc.Etiamatjustoinleoconguemollis. Nullaminnequeegetmetushendreritscelerisque eunonenim.Utmalesuadalacuseunullabibendum ideuismodurnasodales.""" print"OriginalSize:{0}".format(len(string)) compressed=zlib.compress(string) print"CompressedSize:{0}".format(len(compressed)) decompressed=zlib.decompress(compressed) print"DecompressedSize:{0}".format(len(decompressed)) #output #OriginalSize:1022 #CompressedSize:423 #DecompressedSize:1022
注册Shutdown函数
有可模块叫atexit,它可以让你在脚本运行完后立马执行一些代码。
假如你想在脚本执行结束时测量一些基准数据,比如运行了多长时间:
打眼看来很简单。只需要将代码添加到脚本的最底层,它将在脚本结束前运行。但如果脚本中有一个致命错误或者脚本被用户终止,它可能就不运行了。
当你使用atexit.register()时,你的代码都将执行,不论脚本因为什么原因停止运行。
结论
你是否意识到那些不是广为人知Python特性很有用?请在评论处与我们分享。谢谢你的阅读!