文档章节

Java正则表达式(三)、代码量统计工具(统计java源文件中注释、代码、空白行数量)

yangxin0917
 yangxin0917
发布于 2014/12/18 19:33
字数 928
阅读 131
收藏 0

       比如想统计一个Java程序员一天写代码的工作量(如:有效代码多少行、空行多少、注释多少行等),这个小工具也许能做为一个参考的依据。

    思路:因为每个java源文件的内容基本包括java语句、空白行、注释三部份组成(不包括注解),所以要统计某个文件这三部份的内容各占多少时,只需写三个匹配这几部份内容的正则表达式即可。然后通过IO流读取文件中的每一行,并根据正则匹配的结果,累加每部份匹配的数量即可。

    注释行:单行注释(//)、多行注释、文档注释。正则:((//)|(/\\*+)|((^\\s)*\\*)|((^\\s)*\\*+/))+

    空白行:一行内只有空格、\t、\n等非可视字符表示空白行。正则:^\\s*$

    代码行:以分号“;“结束为一行有效的代码。正则:(?!import|package).+;\\s*(((//)|(/\\*+)).*)*

    实现方式:

        1、用户在控制台输入要统计的java文件路径或目录

        2、根据路径创建一个File对象,判断文件是否有效,并给出提示。最后将文件和IO流绑定

        3、循环读取文件中的某一行,并根据正则匹配的结果累记每部份匹配的数量


完整代码如下:
package regex;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileFilter;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.Scanner;
import java.util.regex.Pattern;

/**
 * 代码统计工具
 * 统计某个java源文件或某个目录中所有java源文件中注释、空白行、代码行各占多少行
 * 注释:包括单行注释(//)、多行注释、文档注释
 * 空白行:一行内没有任何内容的表示空白行
 * 代码行:以分号“;”结束的一条语句,可以统计为一行有效代码
 */
public class CodeStatDemo {
	
	// 记录注释行数
	static long annotationLine = 0;
	
	// 记录空白行数
	static long blankLine = 0;
	
	// 记录有效代码的行数
	static long codeLine = 0;
	
	// 代码总行数
	static long totalLine = 0;
	
	// 文件总数
	static long fileCount = 0;

	public static void main(String[] args) throws FileNotFoundException  {
		System.out.println("请输入要统计代码量的java文件或java目录:");
		Scanner in = new Scanner(System.in);
		String filePath = in.nextLine();
		
		File file = new File(filePath);
		// 根据用户输入的文件名和目录执行代码量统计
		codeStat(file);
		
		System.out.println("----------统计结果---------");
		System.out.println("文件数量:" + fileCount + "个");
		System.out.println(file + "文件/目录总行数:" + totalLine);
		System.out.println("代码行数:" + codeLine);
		System.out.println("注释行数:" + annotationLine);
		System.out.println("空白行数:" + blankLine);
		long otherLine = totalLine - (codeLine + annotationLine + blankLine);
		System.out.println("其它行数:" + otherLine);
		
	}

	private static void codeStat(File file) throws FileNotFoundException {
		if (file == null || !file.exists()) 
			throw new FileNotFoundException(file + ",文件不存在!");
		
		fileCount ++;	// 文件数累加
		
		if (file.isDirectory()) {
			File[] files = file.listFiles(new FileFilter() {
				
				@Override
				public boolean accept(File pathname) {
					return pathname.getName().endsWith(".java") || pathname.isDirectory();
				}
			});
			
			for (File target : files) {
				codeStat(target);
			}
		} else {
			BufferedReader bufr = null;
			try {
				// 将指定路径的文件与字符流绑定
				bufr = new BufferedReader(new InputStreamReader(new FileInputStream(file)));
			} catch (FileNotFoundException e) {
				throw new FileNotFoundException(file + ",文件不存在!" + e);
			}
			
			// 定义匹配每一行的正则匹配器
			Pattern annotationLinePattern = Pattern.compile("((//)|(/\\*+)|((^\\s)*\\*)|((^\\s)*\\*+/))+", 
					Pattern.MULTILINE + Pattern.DOTALL);	// 注释匹配器(匹配单行、多行、文档注释)
			
			Pattern blankLinePattern = Pattern.compile("^\\s*$");	// 空白行匹配器(匹配回车、tab键、空格)
			
			Pattern codeLinePattern = Pattern.compile("(?!import|package).+;\\s*(((//)|(/\\*+)).*)*",
					Pattern.MULTILINE + Pattern.DOTALL); // 代码行匹配器(以分号结束为一行有效语句,但不包括import和package语句)
			
			// 遍历文件中的每一行,并根据正则匹配的结果记录每一行匹配的结果
			String line = null;
			try {
				while((line = bufr.readLine()) != null) {
					if (annotationLinePattern.matcher(line).find()) {
						annotationLine ++;
					}
					
					if (blankLinePattern.matcher(line).find()) {
						blankLine ++;
					}
					
					if (codeLinePattern.matcher(line).matches()) {
						codeLine ++;
					} 
					
					totalLine ++;
				}
				
			} catch (IOException e) {
				throw new RuntimeException("读取文件失败!" + e);
			} finally {
				try {
					bufr.close();	// 关闭文件输入流并释放系统资源
				} catch (IOException e) {
					throw new RuntimeException("关闭文件输入流失败!");
				}
			}
		}
	}
}
测试结果:


本文转载自:http://blog.csdn.net/xyang81/article/details/7714994

yangxin0917
粉丝 3
博文 76
码字总数 31277
作品 0
昌平
高级程序员
私信 提问
Java 正则表达式功能及应用

正则表达式,就是用某种模式去匹配一类字符串的一个公式,正则表达式由一些普通字符和一些元字符(metacharacters)组成。普通字符包括大小写的字母和数字,而元字符则具有特殊的含义,不管是...

浮躁的码农
2015/07/29
0
0
关于java中split的使用

之前在http://shukuiyan.iteye.com/blog/507915文中已经叙述过这个问题,但是最近一次笔试中居然有碰到了这个知识点,而且还做错了,囧!学艺不精啊。题目大概是这样的: Java代码 String s...

墨梅
2014/04/28
183
0
Java编码规范,在您进行编码之前应该阅读的规范

本文转载于:http://www.web3d.com.cn/new/teach/java3d/2006/11/13/363276161.html Java编码规范 说明 1.1 为什么要有编码规范 编码规范对于程序员而言尤为重要,有以下几个原因: 一个软件...

陈彦志
2011/09/19
189
0
扩展 JDT 实现自动代码注释与格式化

简介: 本文介绍了一个为 Eclipse 工作空间中的 Java 代码自动添加统一注释并格式化排版的工具及其具体实现。该工具扩展 Eclipse Java Development Tool(JDT)API,操作 Java 代码。通过本文...

红薯
2010/07/30
1K
1
下面这段代码怎么改成使用对象的方式?怎么实现递归分析文件夹下的每个文件(求助,最好能给出代码和注释)

/*读一个文件名称, 如果是.java文件,就分析出 代码行数、空行数、注释行数。 如果是文件夹,就递归分析出该文件夹下的每个java文件的代码行数、空行数、注释行数。 统计注释率、空行率、有...

sxyok
2014/03/20
166
0

没有更多内容

加载失败,请刷新页面

加载更多

自定义ApiBoot Logging链路以及单元ID生成策略

ApiBoot Logging会为每一个请求都对应创建链路编号(TraceID)以及单元编号(SpanID),用于归类每一次请求日志,通过一个链路下日志单元的Parent SpanID可以进行上下级关系的梳理。 前文回顾...

恒宇少年
20分钟前
8
0
浅谈 Application 和 activity

对于 在 Application初始化一些变量,为什么不可以放在activity 或者其他的组件里呢? 这里就根据个人的理解来讲述一下,欢迎补充指正。 首先 activity 是以栈的形式出现,一个app应用会有多...

MrLins
20分钟前
8
0
Allegro的脚本文件内容里都有哪些

小伙伴们在使用Allegro的时候是否经常用到脚本文件夹呢?scr的用法其实可真不简单。。。 首先脚本文件的运行模式就存在很多种,比如不提示错误信息,不弹出确认对画框(这样很有利于我们执行...

demyar
22分钟前
16
0
微信升级外链管理规范,「砍一刀帮我加速」要被禁止了

原创: 蒋鸿昌 首发:「知晓程序」公众号 - 最好的微信新商业媒体 几天前,知名互联网评论人阑夕模仿皮尤研究中心(Pew Research Center)在美国做的互联网通识调查问卷,做了一份中文版问卷...

知晓云
23分钟前
14
0
CentOS 7接投影仪

我将一台安装着CentOS 7图形界面的惠普笔记本电脑当桌面使用。最近,想要连接投影仪时却遇到了问题。笔记本有一个HDMI接口。我买了一个HDMI---->VGA的转接线,连上笔记本电脑后,屏幕一直在闪...

大别阿郎
26分钟前
8
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部