本项大作业将设计并实现一个Mini Java语言的编译器
Mini Java是Java语言的子集。作为一种很好的编译课程教学语言,它与Java相比做了如下精简:
(1)不允许重载(overloading)
(2)一个文件中可以申明若干个类,但必须有且只能有一个的主类,辅类可以有多个,类不能申明为public;主类中只能有一个主方法,该方法的签名必须为“public static void main(String[])”,主方法中只能有一条输出语句:System.out.println( int ),该语句只能输出整型变量
(3)只有类,没有接口,有继承关系(单继承)
(4)类中只能申明变量和方法
(5)只有四种变量类型:整型(integer)、布尔型(boolean)、数组(array)、对象;只有一类数组:整型数组(int[]);变量必须申明为(auto)型
(6)方法必须为public,必须有返回值,返回值类型受(5)限制;可以有参数,可以没有,参数数量没有限制,类型受(5)限制
(7)一共有6中语句(statement):代码块(block)、简单赋值语句(assignment statement)、数组赋值语句(array assignment statement)、打印语句(print statement)、if语句、while语句
(8)一共有9种表达式(expression):与(and)、比较(compare)、加(plus)、减(minus)、乘(times)、数组定位(array lookup)、数组长度(array length)、消息传递(message sending,即参数传递)、主表达式(primary expression);与表达式为“短路与”(&&);比较只能作小于比较
(9)主表达式一共有9种:整数(Integer)、“真”(true)、“假”(false)、对象、this、初始化(allocation)、数组初始化(array allocation)、非(not)、括号(bracket)
(10)初始化时只能使用空参数,所以没有“构造器(constructor)”概念
(11)对标识符(IDENTIFIER)没有作明确定义,在这里规定只能是字母、数字的集合,但必须以字母开头,区分大小写
(12)对整数(INTEGER_LITERAL)没有作明确定义,在这里规定为无符号整数,32位(0~4294967295)
(13)不允许注释
(14)类变量声明时不能初始化,初始化必须在方法中完成
保留字 |
列别编码 |
记忆符 |
值 |
<EOF> |
0 |
EOF |
- |
boolean |
1 |
BOOLEAN |
- |
class |
2 |
CLASS |
- |
else |
3 |
ELSE |
- |
extends |
4 |
EXTENDS |
- |
if |
5 |
IF |
- |
int |
6 |
INT |
- |
length |
7 |
LENGTH |
- |
main |
8 |
MAIN |
- |
new |
9 |
NEW |
- |
public |
10 |
PUBLIC |
- |
return |
11 |
RETURN |
- |
static |
12 |
STATIC |
- |
this |
13 |
THIS |
- |
void |
14 |
VOID |
- |
while |
15 |
WHILE |
- |
String |
16 |
STRING |
- |
System.out.println |
17 |
PRINTLN |
- |
= |
18 |
EQUAL |
- |
! |
19 |
NOT |
- |
&& |
20 |
AND |
- |
+ |
21 |
PLUS |
- |
- |
22 |
MINUS |
- |
* |
23 |
TIMES |
- |
< |
24 |
COMPARE |
- |
. |
25 |
DOT |
- |
; |
26 |
SEMICOLON |
- |
, |
27 |
COMMA |
- |
[ |
28 |
LEFT_SQUARE |
- |
] |
29 |
RIGHT_SQUARE |
- |
( |
30 |
LEFT_BRACKET |
- |
) |
31 |
RIGHT_BRACKET |
- |
{ |
32 |
LEFT_BLOCK |
- |
} |
33 |
RIGHT_BLOCK |
- |
标识符 |
34 |
ID_STRING |
内部字符串 |
无符号整数 |
35 |
ID_INTEGER |
整数值 |
(1)语法分析程序用递归子程序法,但表达式分析用算符优先分析法
(2)对源文件进行三遍处理:第一遍词法分析
(2)使用编译时静态分配存储空间
(3)整型数据类型32位,占4个字节;布尔型数据类型8位,占1个字节
(待续) 
|