25行代码实现一个简单的编译器

原创
2017/11/06 14:40
阅读数 686

起因


25行JavaScript语句实现一个简单的编译器》实现的是一个简单到不能再简单的玩具的玩具,他的魔法是函数式编程简化了js代码。java 8提供了函数式编程的支持,昨晚脑子抽风突然兴趣java也可以实现一个如此简单的编译器!

java和js语言差异
    

    java相对js这类胶水语言来说还是相对啰嗦的,一些动态语言的特性在java里并不具备。《25行JavaScript语句实现一个简单的编译器》的作者是个js高手js用得溜溜的,下面说说他用到js里有而java没有的功能。

  1. js 字符串模板
    他在Transpiler中使用ES2015新增的模板字符串功能。

     `(${ast.expr.map(transpileNode).join(' ' + opMap[ast.val] + ' ')})`;

     

  2. js内置 map和简单的赋值语法

    const node = { val: consume(), type: Op, expr: [] };

    其他胶水语言的话对应的是tuple,java要实现的话还真啰嗦不少。
     

  3. 模式匹配(实际这是js的map啊啊啊)

      const opAcMap = {
        'sum': args => args.reduce((a, b) => a + b, 0),
        'sub': args => args.reduce((a, b) => a - b),
        'div': args => args.reduce((a, b) => a / b),
        'mul': args => args.reduce((a, b) => a * b, 1)
      };

    java还木有模式匹配。
    没有这几个js功能,但我们还是可以通过各种方法绕一下的。怎么绕?请看下文!

 

java实现

废话不啰嗦上代码,代码风格学他的也紧促点凑合着看吧!

	static final int OP = 0, NUM = 1;
	private static List<String> lexer(String input){return  Stream.of(input.split(" ")).map(String::trim).filter(s -> s.length() > 0).collect(Collectors.toList());}
	private static class Parser {
		Iterator<String> lex;
		String next=null;
		public Parser(List<String> lex) { this.lex=lex.iterator();  }
		private Node parseOp(String str) {
			Node n = new Node(str, OP);
			while (lex.hasNext())	n.addLast(parse());
			return n;
		}
		public Node parse() { return (next=lex.next()).matches("\\d+") ? new Node(Integer.parseInt(next), NUM) : parseOp(next); }
	}
	final static Map<String, String> opMap = new HashMap<String, String>(4) {{ put("sum", "+"); put("sub", "-"); put("div", "/"); put("mul", "*");}};
	private static String codeGenerator (Node ast) { return ast.type == NUM ? String.valueOf(ast.val) : genOp(ast); }
	private static String genOp(Node node) { return "(" + node.stream().map(n -> codeGenerator(n)) .collect(Collectors.joining(" " + opMap.get(node.val) + " ")) + ")"; }
	private static class Node  extends ArrayDeque<Node>{
		Object val; 
		int type;
		public Node(Object val, int type) {
			super();
			this.val = val;
			this.type = type;
		}
	}
	private static int eval(Node ast) { return (int) (ast.type == NUM ? ast.val : ast.stream().reduce(evalOps.get(ast.val)).get().val); }
	final static Map<String,BinaryOperator<Node>> evalOps=new HashMap<String,BinaryOperator<Node>>(4) {{
		put("sum", (a, b) -> new Node(eval(a) + eval(b), NUM)); put("sub", (a, b) -> new Node(eval(a) - eval(b), NUM));
		put("div", (a, b) -> new Node(eval(a) / eval(b), NUM)); put("mul", (a, b) -> new Node(eval(a) * eval(b), NUM));}};

js实现lex和transpile用了23行代码。没有tuple java实现node多花了9行代码,加起来用了25行。不过他加eval功能的代码行(33行)比我这(29行)可是多的。代码行数多少是其次,函数式编程写代码还真精简不少,写的爽看得也不累。

写在后

最后还是想说这个玩具的玩具。之所以说这个是玩具呢。
首先,他定的语法规则是非常简单的。
其次,表面是一个乘除加减语言,但是没有算术优先级。
最后,这跟什么编译器没啥多大的关联(词法分析器用空格直接分割也只能是玩泥沙),如果想写个简单解析器之类的可以参考我的《练手写了个SQLite解析器》和《一个android sqlite CRUD代码生成小工具
本文源码下载移步github《tiny-compiler-java

展开阅读全文
打赏
1
2 收藏
分享
加载中
更多评论
打赏
0 评论
2 收藏
1
分享
返回顶部
顶部