| 
 本项大作业将设计并实现一个Mini Java语言的编译器 
Mini Java是Java语言的子集。作为一种很好的编译课程教学语言,它与Java相比做了如下精简: 
(1)不允许重载(overloading) 
(2)一个文件中可以申明若干个类,但必须有且只能有一个的主类,辅类可以有多个,类不能申明为public;主类中只能有一个主方法,该方法的签名必须为“public static void main(String[])”,主方法中只能有一条输出语句:System.out.println( int ),该语句只能输出整型变量 
(3)只有类,没有接口,有继承关系(单继承) 
(4)类中只能申明变量和方法 
(5)只有四种变量类型:整型(integer)、布尔型(boolean)、数组(array)、对象;只有一类数组:整型数组(int[]);变量必须申明为(auto)型 
(6)方法必须为public,必须有返回值,返回值类型受(5)限制;可以有参数,可以没有,参数数量没有限制,类型受(5)限制 
(7)一共有6中语句(statement):代码块(block)、简单赋值语句(assignment statement)、数组赋值语句(array assignment statement)、打印语句(print statement)、if语句、while语句 
(8)一共有9种表达式(expression):与(and)、比较(compare)、加(plus)、减(minus)、乘(times)、数组定位(array lookup)、数组长度(array length)、消息传递(message sending,即参数传递)、主表达式(primary expression);与表达式为“短路与”(&&);比较只能作小于比较 
(9)主表达式一共有9种:整数(Integer)、“真”(true)、“假”(false)、对象、this、初始化(allocation)、数组初始化(array allocation)、非(not)、括号(bracket) 
(10)初始化时只能使用空参数,所以没有“构造器(constructor)”概念 
(11)对标识符(IDENTIFIER)没有作明确定义,在这里规定只能是字母、数字的集合,但必须以字母开头,区分大小写 
(12)对整数(INTEGER_LITERAL)没有作明确定义,在这里规定为无符号整数,32位(0~4294967295) 
(13)不允许注释 
(14)类变量声明时不能初始化,初始化必须在方法中完成 
  
| 
 保留字  | 
 列别编码  | 
 记忆符  | 
 值  |  
| 
 <EOF>  | 
 0  | 
 EOF  | 
 -  |  
| 
 boolean  | 
 1  | 
 BOOLEAN  | 
 -  |  
| 
 class  | 
 2  | 
 CLASS  | 
 -  |  
| 
 else  | 
 3  | 
 ELSE  | 
 -  |  
| 
 extends  | 
 4  | 
 EXTENDS  | 
 -  |  
| 
 if  | 
 5  | 
 IF  | 
 -  |  
| 
 int  | 
 6  | 
 INT  | 
 -  |  
| 
 length  | 
 7  | 
 LENGTH  | 
 -  |  
| 
 main  | 
 8  | 
 MAIN  | 
 -  |  
| 
 new  | 
 9  | 
 NEW  | 
 -  |  
| 
 public  | 
 10  | 
 PUBLIC  | 
 -  |  
| 
 return  | 
 11  | 
 RETURN  | 
 -  |  
| 
 static  | 
 12  | 
 STATIC  | 
 -  |  
| 
 this  | 
 13  | 
 THIS  | 
 -  |  
| 
 void  | 
 14  | 
 VOID  | 
 -  |  
| 
 while  | 
 15  | 
 WHILE  | 
 -  |  
| 
 String  | 
 16  | 
 STRING  | 
 -  |  
| 
 System.out.println  | 
 17  | 
 PRINTLN  | 
 -  |  
| 
 =  | 
 18  | 
 EQUAL  | 
 -  |  
| 
 !  | 
 19  | 
 NOT  | 
 -  |  
| 
 &&  | 
 20  | 
 AND  | 
 -  |  
| 
 +  | 
 21  | 
 PLUS  | 
 -  |  
| 
 -  | 
 22  | 
 MINUS  | 
 -  |  
| 
 *  | 
 23  | 
 TIMES  | 
 -  |  
| 
 <   | 
 24  | 
 COMPARE  | 
 -  |  
| 
 .  | 
 25  | 
 DOT  | 
 -  |  
| 
 ;  | 
 26  | 
 SEMICOLON  | 
 -  |  
| 
 ,  | 
 27  | 
 COMMA  | 
 -  |  
| 
 [  | 
 28  | 
 LEFT_SQUARE  | 
 -  |  
| 
 ]  | 
 29  | 
 RIGHT_SQUARE  | 
 -  |  
| 
 (  | 
 30  | 
 LEFT_BRACKET  | 
 -  |  
| 
 )  | 
 31  | 
 RIGHT_BRACKET  | 
 -  |  
| 
 {  | 
 32  | 
 LEFT_BLOCK  | 
 -  |  
| 
 }  | 
 33  | 
 RIGHT_BLOCK  | 
 -  |  
| 
 标识符  | 
 34  | 
 ID_STRING  | 
 内部字符串  |  
| 
 无符号整数  | 
 35  | 
 ID_INTEGER  | 
 整数值  |   
  
(1)语法分析程序用递归子程序法,但表达式分析用算符优先分析法 
(2)对源文件进行三遍处理:第一遍词法分析 
(2)使用编译时静态分配存储空间 
(3)整型数据类型32位,占4个字节;布尔型数据类型8位,占1个字节
 
  (待续)  
 
  |