编译原理大作业

完成的功能：

生成文法的FIRST、FOLLOW、SELECT集

判断是否是LL(1)型文法

构造预测分析表

待完善的功能：

消除左递归

消除左公共因子

语法的匹配过程

错误处理
代码

#ifndef GRAMMAR_H
#define GRAMMAR_H
#include <bits/stdc++.h>
#include <string>
#include <cstring>
#include <iostream>
#include <vector>
#include <set>
#include <iomanip>
#include <algorithm>
using namespace std;
const int maxn = 110;

//产生式结构体 
struct EXP{
    char left;      //左部
    string right;   //右部
};

class Grammar {
    public:
        Grammar();               //构造函数
        bool isNotTer(char x);   //判断是否是终结符
        int  getTer(char x);     //获取终结符下标
        int  getNonTer(char x);  //获取非终结符下标
        void getFirst(char x);   //获取某个非终结符的First集
        void getFollow(char x);  //获取某个非终结符的Follow集
        void getSelect();        //获取产生式的Select集
        bool isLL1();            //判断是否是LL(1)型文法
        void getTable();         //得到预测分析表
        bool getEmpty(char x);   //判断非终结符能否推出空字符
        void input(int n);       //输入文法
        bool scanExp();          //扫描输入的产生式，检测是否有左递归和左公因子 
        void remove();           //消除左递归 
        void solve();            //处理文法，获得所有First集，Follow集以及Select集
        void display();          //打印First集,Follow集,Select集
        void debug();            //用于debug的函数 
        ~Grammar();              //析构函数 
    protected:
        int cnt;                 //产生式数目
        EXP exp[maxn];           //产生式集合
        set<char> First[maxn];   //First集
        set<char> Follow[maxn];  //Follow集
        set<char> Select[maxn];  //select集
        vector<char> ter_copy;   //去掉$的终结符
        vector<char> ter;        //终结符
        vector<char> not_ter;    //非终结符
        int table[maxn][maxn];
};
#endif
Grammar::Grammar(){}
Grammar::~Grammar(){}
bool Grammar::isNotTer(char x){return (x>='A' && x<='Z');}
bool Grammar::getEmpty(char x){
	bool f = 0;
	for(int i=0; i<cnt; i++){
		if(exp[i].left == x){
			int len = exp[i].right.length(); f = 0;
			// 右方有非空终结符，当前关系一定推不出空，直接看下一个关系
			for(int j=0; j<len; j++) if(!isNotTer(exp[i].right[j]) && exp[i].right[j]!='$') {f=1; break;}
			if(f) continue;
			f = 1;
			for(int j=0; j<len; j++) { // 右方没有非空终结符
				if(exp[i].right[j] == '$') continue;
				// cout << exp[i].right[j] << endl;
				f = (f && getEmpty(exp[i].right[j]));
				if(f == 0) return false; // 只要有一个推不出空整体就推不出
			}
			return true;
		}
	}
	return false;
}
int  Grammar::getTer(char x){ // 获取终结符下标
	int len = ter.size();
	for(int i=0; i<len; i++)
		if(ter[i] == x) return i;
	return -1;
}
int  Grammar::getNonTer(char x){ // 获取非终结符下标
	int len = not_ter.size();
	for(int i=0; i<len; i++)
		if(not_ter[i] == x) return i;
	return -1;
}
void Grammar::getFirst(char x){ // 求出非终结符的First集 
    bool flag = 0;  //记录非终结符的First集是否有空串 
    int tot = 0;    //记录一个非终结符产生式含有空串的产生式
    for(int i=0;i<cnt;i++){
        if(exp[i].left==x){
            //如果右部的第一个字符是终结符
            if(!isNotTer(exp[i].right[0])) First[getNonTer(x)].insert(exp[i].right[0]);
            else{ //如果是非终结符
                for(int j=0;j<(int)exp[i].right.length();j++){ //从左到右遍历右部 
                    if(!isNotTer(exp[i].right[j])){ //如果遇到终结符，结束
                        First[getNonTer(x)].insert(exp[i].right[j]);
                        break;
                    }
                    //不是终结符，求该非终结符的First集
                    getFirst(exp[i].right[j]);
                    set<char>::iterator it;
                    int ind = getNonTer(exp[i].right[j]); 
                    for(it=First[ind].begin();it!=First[ind].end();it++){
                        if(*it=='$'){
                            flag = 1;
                        }else{
                            First[getNonTer(x)].insert(*it);
                        }
                    }
                    //没有空串就不必再找下去了
                    if(flag==0) break; 
                    else flag = 0, tot++;
                }
                //如果右部所有符号的First集都有空串,则符号x的First集也有空串 
                if(tot==(int)exp[i].right.length()) First[getNonTer(x)].insert('$');
            }
        }
    }
}
void Grammar::getFollow(char x){ // 求出非终结符的Follow集 
	Follow[getNonTer(x)].insert('#');
    //找到非终结符x出现的位置
    for(int i=0;i<cnt;i++){
        int index = -1;
        int len = exp[i].right.length();
        for(int j=0;j<len;j++){
            if(exp[i].right[j]==x){
                index = j;
                break;
            }
        }
        //如果找到了x,并且它不是最后一个字符 
        if(index!=-1&&index<len-1){
            //如果下一个字符是终结符，添加进x的Follow集 
            char next = exp[i].right[index+1];
            if(!isNotTer(next)){
                Follow[getNonTer(x)].insert(next);
            }else{
            //如果下一个字符是非终结符 
                bool flag = 0;
                set<char>::iterator it;
                //遍历下一个字符的First集
                for(it = First[getNonTer(next)].begin();it!=First[getNonTer(next)].end();it++){
                    if(*it=='$'){
                        flag = 1;
                    }else{
                        Follow[getNonTer(x)].insert(*it);
                    }
                }
                //如果有空串并且左部不是它本身(防止陷入死循环),当前非终结符的Follow集是x的Follow集
                char tmp = exp[i].left; 
                if(flag&&tmp!=x){
                    getFollow(tmp);
                    set<char>::iterator it;
                    for(it = Follow[getNonTer(tmp)].begin();it!=Follow[getNonTer(tmp)].end();it++){
                        Follow[getNonTer(x)].insert(*it);
                    }
                }
            }
        }else if(index!=-1&&index==len-1&&x!=exp[i].left){
            //如果x在产生式的末尾，则产生式左部的Follow集应该添加到x的Follow集里 
            char tmp = exp[i].left; 
            getFollow(tmp);
            set<char>::iterator it;
            for(it = Follow[getNonTer(tmp)].begin();it!=Follow[getNonTer(tmp)].end();it++){
                Follow[getNonTer(x)].insert(*it);
            }
        }
    }
}
void Grammar::getSelect(){ // 求出产生式的Select集
	for(int i=0; i<cnt; i++){
		if(exp[i].right.length() == 1 && exp[i].right[0] == '$') { // Select(A->a) = Follow(A)
			for(auto it : Follow[getNonTer(exp[i].left)])
				Select[i].insert(it);
		}else { // Select(A->a) = First(a) + Follow(A)
			int len = exp[i].right.length();
			for(int j=0; j<len; j++){ // Fisrt(a)
				if(isNotTer(exp[i].right[j])){
					for(auto it : First[getNonTer(exp[i].right[j])])
						if(it != '$')
							Select[i].insert(it);
					if(!getEmpty(exp[i].right[j])) break;
				}else if(exp[i].right[j] != '$'){
					Select[i].insert(exp[i].right[j]);
					break;
				}
			}

			bool f = 1;
			for(int j=0; j<len; j++){
				if(isNotTer(exp[i].right[j])) f &= getEmpty(exp[i].right[j]);
				else f &= (exp[i].right[j] == '$');
			}
			if(f) {
				for(auto it : Follow[getNonTer(exp[i].left)])
					Select[i].insert(it);
			}
		}
	}
}
bool Grammar::isLL1(){
	for(auto it : not_ter)
		for(int i=0; i<cnt; i++) if(exp[i].left == it){
			for(int j=i+1; j<cnt; j++) if(exp[j].left == it)
				for(auto it1 : Select[i]) for(auto it2 : Select[j])
					if(it1 == it2) return false;
		}
	return true;
}
void Grammar::getTable(){
	memset(table, -1, sizeof table);
	for(int i=0; i<cnt; i++)
		for(auto it : Select[i])
			table[getNonTer(exp[i].left)][getTer(it)] = i;
}
void Grammar::input(int n){ // 输入文法
	cnt = n; string str;
	for(int i=0; i<cnt; i++){
		cin >> str;
		exp[i].left = str[0];
		exp[i].right.clear();
		for(int j=3; j<(int)str.length(); j++) exp[i].right += str[j];
	}
	for(int i=0; i<cnt; i++){ // 保存所有终结符和非终结符
		if(getNonTer(exp[i].left) == -1) not_ter.push_back(exp[i].left);
		for(int j=0; j<(int)exp[i].right.length(); j++) {
			if(isNotTer(exp[i].right[j])) {
				if(getNonTer(exp[i].right[j]) == -1) 
					not_ter.push_back(exp[i].right[j]);
			}else {
				if(getTer(exp[i].right[j]) == -1)
					ter.push_back(exp[i].right[j]);
			}
		}
	}
}
void Grammar::solve(){ // 获得FIRST、FOLLOW、SELECT集
	for(int i=0; i<(int)not_ter.size(); i++) getFirst(not_ter[i]);
	for(int i=0; i<(int)not_ter.size(); i++) getFollow(not_ter[i]);
	getSelect();
}
void Grammar::display(){
	cout << "--------------------------------------------------------------------------" << endl;
	cout << "First集：" << endl;
	int len = not_ter.size();
	for(int i=0; i<len; i++){
		cout << not_ter[i] << "： ";
		for(auto it : First[getNonTer(not_ter[i])])
			cout << it << " ";
		cout << endl;
	}
	cout << "--------------------------------------------------------------------------" << endl;
	cout << "Follow集" << endl;
	for(int i=0; i<len; i++){
		cout << not_ter[i] << "： ";
		for(auto it : Follow[getNonTer(not_ter[i])])
			cout << it << " ";
		cout << endl;
	}
	cout << "--------------------------------------------------------------------------" << endl;
	cout << "Select集" << endl;
	for(int i=0; i<cnt; i++){
		cout << exp[i].left << "->" << exp[i].right << "： " << setw(10);
		for(auto it : Select[i])
			cout << it << " ";
		cout << endl;
	}
	cout << "--------------------------------------------------------------------------" << endl;
	if(isLL1()) cout << "是LL(1)型文法" << endl;
	else {cout << "不是LL(1)型文法" << endl; return ;}
	cout << "--------------------------------------------------------------------------" << endl;
	ter.push_back('#'); getTable();
	cout << "  ";
	for(auto it : ter) cout << setw(10) << it; cout << endl;
	for(auto it : not_ter) {
		cout << it << ": ";
		for(auto it1 : ter){
			int x = table[getNonTer(it)][getTer(it1)];
			if(x == -1) cout << setw(10) << "null";
			else cout << setw(10) << exp[x].right;
		}
		cout << endl;
	}
	ter.pop_back();
}
/*#ifndef ANALYZTABLE_H
#define ANALYZTABLE_H
class AnalyzTable:public Grammar {
    public:
        AnalyzTable();
        void getTable();          //得到分析表
        void judge();             //判断是否是LL(1)文法 
        void analyExp(string s);  //分析输入串 
        void displayTable();      //打印表
        void inputString();       //输入符号串 
        ~AnalyzTable();
    protected:
        string s;                 //符号串
        vector<char> stack;       //分析栈
        vector<char> left;        //剩余输入串
        int detect[maxn][maxn];   //检测表
        int table[maxn][maxn];    //预测分析表
};
#endif

void AnalyzTable::getTable(){ // 获得预测分析表
    for(int i=0;i<cnt;i++){
        char tmp = exp[i].right[0];
        //如果产生式右部的第一个字符是终结符
        if(!isNotTer(tmp)){
            //该终结符不是空串，更新table
            if(tmp!='$'){
                detect[getNonTer(exp[i].left)][getTer(tmp)]++;
                table[getNonTer(exp[i].left)][getTer(tmp)] = i;
            }
            if(tmp=='$'){
                //该终结符是空串，遍历左部的Follow集，更新table
                set<char>::iterator it;
                for(it = Follow[getNonTer(exp[i].left)].begin();it!=Follow[getNonTer(exp[i].left)].end();it++){
                    table[getNonTer(exp[i].left)][getTer(*it)] = i;
                    detect[getNonTer(exp[i].left)][getTer(*it)]++;
                }
            }
        }else{
            //如果产生式右部的第一个字符是非终结符，遍历它的First集，更新table
            set<char>::iterator it;
            for(it = First[getNonTer(tmp)].begin();it!=First[getNonTer(tmp)].end();it++){
                table[getNonTer(exp[i].left)][getTer(*it)] = i;
                detect[getNonTer(exp[i].left)][getTer(*it)]++;
            }
            //如果有空串，遍历左部的Follow集，更新table  
            if(First[getNonTer(tmp)].count('$')!=0){
                set<char>::iterator it;
                for(it = Follow[getNonTer(exp[i].left)].begin();it!=Follow[getNonTer(exp[i].left)].end();it++){
                    table[getNonTer(exp[i].left)][getTer(*it)] = i;
                    detect[getNonTer(exp[i].left)][getTer(*it)]++;
                }                
            }
        }
    }
}
void AnalyzTable::analyExp(string s){ // 分析符号串
    cout<<setw(15)<<"分析栈"<<setw(15)<<"剩余输入串"<<setw(20)<<"推导式"<<endl;
    //把整个串倒序push进剩余符号vector
    left.push_back('#');
    for(int i=s.length()-1;i>=0;i--){
        left.push_back(s[i]);
    }
    //把#和开始符push进分析栈
    stack.push_back('#');
    stack.push_back(not_ter[0]);
    //如果剩余输入串长度不为0，就一直循环
    while(left.size()>0){
        //输出分析栈内容
        string outputs = "";
        for(int i=0;i<stack.size();i++){
            outputs+=stack[i];
        }
        cout<<setw(15)<<outputs;
        outputs = "";
        //输出剩余输入串内容
        for(int i=left.size()-1;i>=0;i--){
            outputs+=left[i];
        }
        cout<<setw(15)<<outputs;
        char f1 = stack[stack.size()-1];
        char f2 = left[left.size()-1];
        //如果可以匹配，并且都为# 
        if(f1==f2&&f1=='#'){
            cout<<setw(21)<<"Accept!"<<endl;
            return;
        }
        //如果可以匹配，并且都为终结符 
        if(f1==f2){
            stack.pop_back();
            left.pop_back();
            cout<<setw(15)<<f1<<" 匹配"<<endl;
        }else if(table[getNonTer(f1)][getTer(f2)]!=-1){
            //如果在预测分析表中有值
            int index = table[getNonTer(f1)][getTer(f2)];
            stack.pop_back();
            if(exp[index].right!="$"){
                for(int i=exp[index].right.length()-1;i>=0;i--){
                    stack.push_back(exp[index].right[i]);
                }
            }
            cout<<setw(15)<<exp[index].left<<"->"<<exp[index].right<<endl;
        }else{
            cout<<setw(15)<<"error"<<endl;
            return;
        }
    }
}*/

int main(){
	Grammar g;
	int n; cin >> n;
	g.input(n); 
	g.solve();
	g.display();
	// g.debug();
}
/*
8
E->TK
K->+TK
K->$
T->FM
M->*FM
M->$
F->i
F->(E)
*/
参考

https://www.cnblogs.com/jiaqizhang/p/9879777.html