实验1-3 《编译原理》S语言词法分析程序设计方案
一、实验目的
了解词法分析程序的两种设计方法之一:根据状态转换图直接编程的方式;
二、实验内容
    1.根据状态转换图直接编程
编写一个词法分析程序,它从左到右逐个字符的对源程序进行扫描,产生一个个的单词的二元式,形成二元式(记号)流文件输出。在此,词法分析程序作为单独的一遍,如下图所示。
具体任务有:
(1)组织源程序的输入
(2)拼出单词并查其类别编号,形成二元式输出,得到单词流文件
(3)删除注释、空格和无用符号
(4)发现并定位词法错误,需要输出错误的位置在源程序中的第几行。将错误信息输出到屏幕上。
(5)对于普通标识符和常量,分别建立标识符表和常量表(使用线性表存储),当遇到一个标识符或常量时,查标识符表或常量表,若存在,则返回位置,否则返回0并且填写符号表或常量表。
标识符表结构:变量名,类型(整型、实型、字符型),分配的数据区地址
注:词法分析阶段只填写变量名,其它部分在语法分析、语义分析、代码生成等阶段逐步填入。
常量表结构:常量名,常量值
三、实验要求
1.能对任何S语言源程序进行分析
    在运行词法分析程序时,应该用问答形式输入要被分析的S源语言程序的文件名,然后对该程序完成词法分析任务。
2.能检查并处理某些词法分析错误
词法分析程序能给出的错误信息包括:总的出错个数,每个错误所在的行号,错误的编号及错误信息。
    本实验要求处理以下两种错误(编号分别为1,2):
    1:非法字符:单词表中不存在的字符处理为非法字符,处理方式是删除该字符,给出错误信息,“某某字符非法”。
    2:源程序文件结束而注释未结束。注释格式为:/* …… */
四、保留字和特殊符号表
单词代码
1
2
3
4
5
6
7
8
9
单词
int
char
float
void
const
for
if
else
then
单词助记符
int
char
float
void
const
for
if
else
then
内码值
-
-
-
-
-
-
-
-
-
单词代码
10
11
12
13
14
15
16
17
18
单词
while
switch
break
begin
end
标识符
数字(包括整数和实数)
单词助记符
while
switch
break
begin
end
id
num
内码值
-
-
-
-
-
在符号表中的位置
在常数表中的位置
单词代码
19
20
21
22
23
24
25
26
27
单词
+
-
*
/
%
(
)
[
]
单词助记符
+
-
*
/
%
(
)
[
]
内码值
-
-
-
-
-
-
-
-
-
单词代码
28
28
29
30
单词
!=
<
>
<=
>=
==
{
}
单词助记符
rlop
{
}
内码值
!=
<
>
<=
>=
==
-
-
单词代码
37
38
39
40
41
42
43
44
45
单词
/=
+=
-=
*=
%=
||
&&
!
=
单词助记符
/=
+=
-=
*=
%=
or
and
not
=
内码值
-
-
-
-
-
-
-
-
-
单词的构词规则:
isnumber函数的使用方法及实例
字母=[A-Za-z]
数字=[0-9]
标识符=(字母|_)(字母|数字)*
数字=数字(数字)*(.数字+|?)
四、S语言表达式和语句说明
    1.算术表达式:+、-、*、/、%
    2.关系运算符:>、>=、<、<=、==、!=
    3.赋值运算符:=,+=、-=、*=、/=、%=
    4.变量说明:类型标识符  变量名表;
    5.类型标识符:int  char    float
    6.If语句:if  表达式then  语句  [else  语句]
    7.For语句:for(表达式1;表达式2;表达式3) 语句
    8.While语句:while 表达式  do  语句
    9.S语言程序:由函数构成,函数不能嵌套定义。
函数格式为:
返回值  函数名(参数)
{
  数据说明
    语句
}
五、程序参考结构说明
    1.Initscanner函数:程序初始化:输入并打开源程序文件和目标程序文件,初始化保留字表
    2.Scanner函数:若文件未结束,反复调用lexscan函数识别单词。
3.Lexscan函数:根据读入的单词的第一个字符确定调用不同的单词识别函数
4.Isalpha函数:识别保留字和标识符
5.Isnumber函数:识别整数,如有精力,可加入识别实数部分工功能
6.Isanotation函数:处理除号/和注释
7.Isother函数识别其他特殊字符
8.Output函数:输出单词的二元式到目标文件,输出格式(单词助记符,单词内码值),如(int,-)(rlop,>)……
9.Error函数:输出错误信息到屏幕
10.除此之外,还可以设置查符号表,填写符号表等函数,学生可自行设计。
实验中,可以将某些类型的单词识别过程利用DFA算法实现,DFA算法参考如下:
DFAS=S0,MOVE[][],F[],ALPHABET[]ALLS[]
/*S为状态,初值为DFA的初态,MOVE[][]为状态转换矩阵,F[] 为终态集,ALPHABET[] 为字母表,其中的字母顺序与MOVE[][] 中列标题的字母顺序一致。ALLS[]为状态集*/
{
Char  Wordbuffer[10]=“”
完成人:班级、学号、姓名
一、实验名称:简化S语言词法分析器
二、实验目的:通过手工编写简化C语言词法分析器,熟悉并深入理解编译程序词法分析器的工作原理。
三、实验内容:
1.根据保留字和特殊符号表能区分出源文件中的保留字、普通标识符和特殊符号,并能进行简单的错误处理。
…………
eySign,out);
    fputs(",",out);
    if(m==-1)
        fputs(Key[n].keyValue,out);
    else
        fputs(lownum[m],out);eyWord)==0)
        {
            Output(i,-1);
            return 0;
        }
    }
    eyWord)==0)
        {
            Output(i,-1);
            break;
        }
    }
    if(i==45)
    {
        num++;
        printf("\n第(%d)行 : 字符错误 : %s字符非法\n",n,token);
    }
}
void Scanner()
{
    char ch;
    int i;
    ch=getc(in);
    while(!feof(in))
    {
        while(ch==' '||ch=='\t'||ch=='\n') //先统计行数
        {
            if(ch=='\n')
                ++n;
            ch=getc(in);
        }
        if(((ch>='a')&&(ch<='z'))||(ch=='_'))//标识符    isalpha(ch)单词
        {
            i=1;
            token[0]=ch;
            ch=getc(in);
            while(((ch>='a')&&(ch<='z'))||((ch>='0')&&(ch<='9')))//word number
            {
                token[i++]=ch;
                ch=getc(in);
            }
            token[i]='\0';
            Isalpha();
        }
        else if((ch>='0')&&(ch<='9'))//整数
        {
            i=1;
            token[0]=ch;
            ch=getc(in);
            while(isdigit(ch))
            {
                token[i++]=ch;
                ch=getc(in);
            }
            token[i]='\0';
            Isnumber();
        }
        else if(ch=='/')//区分 "/" , "/=" , "/*"
        {
            token[0]=ch;
            Isanotation();
            ch=getc(in);
        }
        else              //特殊字符
        {
            token[0]=ch;
            Isother();
            ch=getc(in);
        }
    }
}
void show()
{   
    int i;
    char ch;
    printf("\n二元式:\n");
    rewind(out);
    while(!feof(out))
    {
        printf("%c",getc(out));
    }
    printf("\n标志符表\n");
    for(i=0;i<NUM;i++)
    {
        if(Word[i][0]!=NULL)
        printf("%d,%s\n",i,Word[i]);
    }
    printf("\n常数表\n");
    for(i=0;i<NUM;i++)
    {
        if(consts[i][0]!=NULL)
        printf("%d,%s\n",i,consts[i]);
    }
}
void main()
{
    Initscanner();
    Scanner();
    printf("\n共有%d个错误\n",num);
    show();
    fclose(in);
    fclose(out);
}
、实验结果
输入文件