Python实现判断一行代码是否为注释的方法
目前的编辑器大都可以自动检测某一行代码是否为代码行或注释行,但并不太提供代码行/注释行行数的统计,对于大量代码文件的代码行/注释行统计,就更少见一些。本篇文章试用一段Python脚本来实现这一目标,并希望可以兼容统计不同语言编写的代码。
注释符号的研究
我们先来关注常见语言的注释符号构成。一般来讲注释符号分为单行注释符和多行注释符,以Python为例,则分别为#和'''(或""")。由于多行注释符会影响后续行的判断,所以在遍历各行时必须存在一个标志位multiCmtFlagIdx,来记录是否已经开始多行注释,以及多行注释的符号为哪一种。有了该判断之后,才可以继续对后续的字符进行分析。
1.在多行注释中
这种情况后面的分析较为简单,由于已知多行注释符的类型,我们可以判断后续的字符中最早出现对应的多行注释结束符的位置为:
如果可以搜索到,则将multiCmtFlagIdx赋值为-1,表示多行注释已经结束。如果没有搜索到,则说明本行后续字符仍在多行注释中,可以直接开始下一行的解析。
2.不在多行注释中
对于这种情况,如果后续字符中除了空格和制表符,首先出现的是单行注释符,则注释符后面的字符都在注释中,所以可以直接结束本行的解析,开始下一行。否则,我们需要继续搜索多行注释开始符出现的位置。
找到多行注释开始符后,并不意味着后面就是注释内容,还需要做两点检查:
1)该注释符是否在引号对中,因为此时在引号中的注释符是不起作用的;
2)该注释符是否是最早出现的多行注释开始符类型,由于同一种语言的多行注释符可能有多种,而只有最早出现的多行注释开始符才起作用。
1)针对第一点,我们可以在搜索的起点到该注释符的区间内计算引号的数量,如果引号为偶数,则说明不在引号对中,否则在引号对中。
引号数量奇偶性判断,需要逐对来判断,这是因为引号对中的引号是不起作用的。有一种特例是,多行注释符同时也是引号的组合,例如Python。此时计算数量的引号,需要与搜索到的多行注释符不同,如多行注释符为''',则应该计算"的数量。
2)针对第二点,我们可以遍历各个多行注释开始符,并取位置最靠前的开始符,然后查找对应的结束符。
代码实现
\#encoding:utf-8 importre ''' isCmt 功能:判断一行字符串是否为注释 输入: line:字符串行 isInMultiCmt:前面一行是否在多行注释中 qttnFlagList:引号列表 输出: isCmt:当前行是否为注释 isInMultiCmt:当前行是否在多行注释中 ''' defisCmt(line,multiCmtFlagIdx,cmtFlagObj): singleCmtFlag=cmtFlagObj["singleCmtFlag"]#单行注释符号 multiCmtFlagList=cmtFlagObj["multiCmtFlagList"] qttnFlagList=cmtFlagObj["qttnFlagList"]#引号列表 startPos=0#搜索多行注释符的开始位置 isCmtRet=True #print'line:'+line.strip() whilestartPos以上这篇Python实现判断一行代码是否为注释的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。