编译原理 LL(1)分析法 C++实现 First集合Follow集合Select集合预测分析表分析过程实验报告

编程入门行业动态更新时间:2024-10-12 01:29:13

编译原理 LL(1)<a href=https://www.elefans.com/category/jswz/34/1758245.html style= 分析法 C++实现 First集合Follow集合Select集合预测分析表分析过程实验报告"/>

编译原理 LL(1)分析法 C++实现 First集合Follow集合Select集合预测分析表分析过程实验报告

编译原理 LL（1）分析实验报告 C++实现

一、实验目的
二、实验要求
三、理论依据
- 3.1 自顶向下分析与LL(1)分析法
- 3.2 开始符号集First
- 3.3 后跟符号集Follow
- 3.4 可选符号集Select
- 3.5 预测分析表
四、实验步骤
- 4.1 求解开始符号集First
- 4.2 求解后跟符号集Follow
- 4.3 求解可选符号集Select
- 4.4 求解预测分析表
- 4.5 求解分析输入串
- 4.6 运行结果
五、实验代码

写在前面：
只需要代码的童鞋滑到最后便是；
需要借鉴思路的童鞋看第四部分便是；
想搞清几个概念的童鞋看第三部分便是。

一、实验目的

根据某一文法编制调试LL（1）分析程序，以便对任意输入的符号串进行分析。本次实验的目的主要是加深对预测分析LL（1）分析法的理解。

二、实验要求

手动输入文法（从文件读取）
显示文法的非终结符的First集
显示文法的非终结符的Follow集
显示规则的Select集合
构造预测分析表
对任意输入的符号串进行分析

三、理论依据

3.1 自顶向下分析与LL(1)分析法

自顶向下分析：从文法的开始符号出发，根据当前的输入串，确定下一步选择什么样的产生式替换对应的非终结符以向下推导。（如何从根节点出发根据当前输入串如何构造一棵语法树）

上图就是从开始符号S开始，根据输入串W使用自顶向下分析推导的语法树

LL（1）分析法是一种自顶向下语法分析方法，它的含义是：
第一个L：从左向右扫描输入串；
第二个L：分析过程中使用最左推导；
括号中的1：只需要向右看一个字符就可以确定如何推导。

3.2 开始符号集First

定义： First(β)是β的所有可能推导的开头终结符或可能的є

First(β)=｛a︱β -> ay,a∈Vt,y∈V* }

意义：若关于同一非终结符有多条产生式，可以根据输入符号是属于哪一产生式右部的first集来唯一确定。（first集合不相交）

3.3 后跟符号集Follow

定义：Follow(U)为所有含有U的句型中紧跟在U之后的终结符号或＃组成的集合。

FOLLOW(A)＝{ a | S… Aa …，a∈VT }

意义：若关于同一非终结符有多条产生式，如果右部为空，也可以根据输入符号是属于哪一产生式左部的follow集合来唯一确定。（follow集合不相交）

3.4 可选符号集Select

定义：可以选用该产生式进行推导的输入符号的集合。

Select（A→β）= 
（1）First（β），当β不为空符号串
（2）Follow（A），当β为空符号串

意义：比如上面式子表示，First（β）或者Follow（A）集合中的元素，可以使用A→β这条产生式进行推导。

用于判定：必须唯一确定产生式才能成功地推导下去，所以同一个非终结符开始的产生式的select集合不能有交集。

3.5 预测分析表

定义：根据分析栈栈顶元素，以及当前输入串字符，可以唯一确定一条产生式。把所有可能的情况总结成为一张表，就是预测分析表。
不能推导的格子写成ERR。分析输入串的时候就只需要查询这张表。前面求的几个非终结符集合都是构建起这个表的基础。

四、实验步骤

4.1 求解开始符号集First

总体思路：

1、如果X∈Vt，FIrst（X）=X；
2、如果X∈Vn，X→a…，FIrst（X）=a；
3、如果X∈Vn，X→ε，则ε∈FIrst（X）
4、如果X∈Vn，X→ Y 1 Y_1 Y1 Y 2 Y_2 Y2 Y 3 Y_3 Y3，

如果 Y 1 Y_1 Y1， Y 2 Y_2 Y2→ε，则FIrst（ Y 1 Y_1 Y1）∪FIrst（ Y 2 Y_2 Y2）-{ε}∈FIrst（X）

如果 Y 1 Y_1 Y1， Y 2 Y_2 Y2， Y 3 Y_3 Y3→ε，则FIrst（ Y 1 Y_1 Y1）∪FIrst（ Y 2 Y_2 Y2）∪FIrst（ Y 3 Y_3 Y3）∪{ε}∈FIrst（X）

Y更多就以此类推

5、重复上述步骤直到First集合不再增大

求解思路：以vn为例

遍历文法的非终结符集合，逐个求解，将结果插入到FIRST集合。

结果使用一个set<char>进行存储。
FIRST集合使用一个unordered_map哈希表存储，键为非终结符，值为所求得的结果。

逐个求解：
1、获取vn的所有右部，进行分析
2、遍历右部，一个个右部分析，各自求解first集加入到results

2.1 遍历当前右部（一个个字符分析）

如果第一个字符是终结符，加入first集合并且跳出循环；（这里会添加多余的空符）

如果是非终结符，则递归处理；

如果非终结符可以推空还需要循环处理该右部的下一字符(如果有)

3、遍历结束，最后如果该字符不能推空，就要删除results中的空符；返回result

流程图：大体如下，详细实现见代码。

4.2 求解后跟符号集Follow

总体思路：

1、如果X是开始符号，#∈Follow(X)；
2、如果A→αXβ，则First(β) - {ε} ∈ Follow(X)；如果β可以推空，Follow(A)∈Follow(X)
3、重复上述步骤直到Follow集合不再增大

求解思路：

遍历文法的非终结符集合，逐个求解，将结果插入到FOLLOW集合。然后完善follow集合直到follow集合不再增大。

结果使用一个set进行存储。
FOLLOW集合也使用一个unordered_map哈希表存储，键为非终结符，值为所求得的结果。

逐个求解：
1、对于开始符号，把#加到results
2、遍历当前文法所有的右侧表达式，

遍历当前右部进行分析，如果发现了vn，则可进行下一步骤以获取results元素

如果当前字符vn是最后一个字符，说明位于句尾，则把#加入，否则遍历vn后的字符

如果遇到终结符，直接加入到results，并break退出循环

否则就是非终结符，那么求其first集合，去掉空后加入到results；此时还要考虑是继续循环还是跳出循环：
如果当前字符可以推空，而且不是最后一个字符，说明还要继续分析下一个字符
如果可以推空但是是最后一个字符，那么把#加入results
如果不可以推空，直接跳出循环即可（可以推空，后面字符的first集合才有可能作为vn的follow集合）

3、遍历完成，返回results；
4、完善follow集合：对于所有非终结符，若遇到后面没有字符，或者是一个可推空的字符，还要把左部的follow集合加入结果集。
5、往复第4步直到follow集不再变大。(这个地方使用递归求解时会由于文法的右递归陷入死循环，所以就先求一遍不考虑思路2中β推空的情况，求解第一遍follow，然后在完善follow集合的过程中考虑进去)

流程图

完善Follow集合流程图

4.3 求解可选符号集Select

总体思路

对一条产生式：A→β

如果β不可以推空，select(A→β) = first(β)
如果β可以推空，select(A→β) = （first(β)-{ε}）∪follow(A)

求解思路

得到产生式的left和right
遍历右部产生式，首先分析右部第一个字符:right[0]
2.1 如果是终结符：（如果为空符，则把follow(left)加入results，否则直接把该符号加入到results）,然后break
2.2 如果是非终结符：把first(right[0])-’~'加入到results；如果还可以推空，则要继续往后看（continue）。如果是最后一个字符，则把follow(left)加入results

流程图

4.4 求解预测分析表

总体思路

Select（A→BC）={a，b，c}表示：
栈顶元素为A的时候，如果输入串当前字符是a或b或c，就可以确定选用A→BC进行推导。
预测分析表就是遍历所有select将所有情况一一存储得到的。

求解思路

遍历select集合
获取left和->right;以及对应的终结符集合chars
遍历chars，获取单个字符ch：
把left和ch配对作为TABLE的键，而->right作为值

流程图

4.5 求解分析输入串

总体思路

首先把#和开始符S放入分析栈，设输入串的字符ch，进入分析，过程中：
对于栈顶元素X进行分析，如果是和ch一样的终结符说明匹配成功，否则要看能否推导（查预测分析表是否有东西）。如果能推导，产生式逆序进栈，否则文法不能接受该字符串，分析完成。
最后如果分析栈和输入串都只剩下#，就说明匹配成功，当前文法接受该字符串。

求解思路

构建先进后出栈，将#、S进栈
遍历句子，一个个符号送a;和栈顶送X，进入分析

2.1 如果X是终结符
如果和a相等，说明匹配成功：X出栈，并读取下一个字符;
否则是无法匹配：失败退出
2.2 如果X是末尾符
a也是末尾符，接受分析字符串：成功退出
a不是末尾符，不接受分析字符串，失败退出
2.3 否则X就是非终结符
查找预测分析表，看是否有表达式
如果没有，分析出错，失败退出
如果有，X元素出栈，表达式逆序进栈，继续循环句子且要重复分析a

遍历完成，程序结束

流程图

4.6 运行结果

文法 grammar.txt：

E->TG
G->+TG
G->~
T->FS
S->*FS
S->~
F->(E)
F->i

输入串：

i*(i+i)

结果图：

五、实验代码

#include <iostream>
#include <iomanip>
#include <stdio.h>
#include <fstream> // 文件流
#include <string> // 字符串
#include <algorithm> // 字符串处理
#include <unordered_map>  // 哈希表
#include <map>   // 图
#include <stack> // 栈
#include <set>   // 集
#include <vector> //向量
using namespace std;// 主要的全局变量定义
unordered_map<string,string> grammar;// 文法集合哈希表
string S; // 开始符
set<string> Vn; // 非终结符集
set<string> Vt; // 终结符集
set<string> formulas; // 产生式集。求解select时方便遍历
unordered_map<string, set<char>> FIRST;// FIRST集合
unordered_map<string, set<char>> FOLLOW;// FOLLOW集合
unordered_map<string, set<char>> SELECT;// Select集合
map<pair<char,char>, string> TABLE;// 预测分析表//							函数预定义
//					功能函数
void readFile();	 // 读取文件
void pretreatment(); // 预处理，简化、符号分类等set<char> findFirstBV(string vn); // 某个非终结符的First集合（递归求解）
void findFirst();				  // 使用哈希表存储set<char> findFollowBV(string vn); // 某个非终结符的Follow集合（递归求解）
void findFollow();                 // 使用哈希表存储set<char> findSelectBF(string formula);  // 某个产生式的Select集合（递归求解）
void findSelect();                       // 使用哈希表存储void isLL1();      // 判断是否为LL(1)分析void makeTable();  // 构造预测分析表void LL1Analyse(); // 分析字符串//					工具函数 
// 根据左部获取产生式的右部（集合）
vector<string> getRights(string left);
// 判断是终结符还是非终结符
bool isVn(char v);
bool isVt(char v);
// 判断某个非终结符能否推出空
bool canToEmpty(char v);
//判断两个字符set的交集是否为空
bool isIntersect(set<char> a, set<char> b);
// 输出分析表
void printTable();
// 得到逆序字符串
string getStackRemain(stack<char> stack_remain);
// 显示输出一个char集
void printSet(set<char> sets);
// 求FOLLOW集合中的元素个数（用于判断：直到follow集合不再增大）
int getFS();// =====================================主函数===================================
int main() {cout <<setw(75)<<right<<setfill('=')<< "LL(1)分析器====================" << endl << endl;// =====================================进入核心代码：LL(1)分析==================================// =====================================1、读取文法并且简单处理==================================readFile();// =====================================2、找First集=============================================findFirst();// =====================================3、找Follow集============================================findFollow();// =====================================4、找Select集============================================findSelect();// =====================================5、判断是否是LL1文法=====================================isLL1();// =====================================6、构建分析表============================================makeTable();// =====================================7、分析字符串============================================LL1Analyse();return 0;
}// =====================================功能函数===================================
// 读取文件
void readFile() {// 输入文件名cout << endl << "请输入文件名：";char file[100];cin >> file;// 首先展示文件所有内容cout << endl << setw(75) << right << setfill('=') << "文法读取====================" << endl;// ifstream文件流打开文件ifstream fin(file);if (!fin.is_open()){cout << "打开文件失败";exit(-1); // 直接退出}string line;bool isGet = false;while (getline(fin, line)) // 逐行读取{if (!isGet){// 得到开始符S = line[0];isGet = true;}formulas.insert(line); // 得到所有表达式cout << line << endl;  // 输出// 如果哈希表中已经存在该键,加在后面for (auto iter = grammar.begin(); iter != grammar.end(); ++iter) {if (iter->first == string(1, line[0])){iter->second = iter->second + "|" + line.substr(3);break;}}// 往存储文法的哈希表中插入键值对grammar.insert(pair<string, string>(string(1, line[0]), line.substr(3)));}cout << "请注意~表示空" << endl;fin.close(); // 关闭文件流pretreatment();
}
// 简单处理：符号分类、输出显示
void pretreatment() {cout << endl << setw(75) << right << setfill('=') << "文法简化====================" << endl;// 遍历文法哈希表for (auto iter = grammar.begin(); iter != grammar.end(); ++iter) {// 输出cout << iter->first << "→" << iter->second << endl;// ========================================符号分类==================================Vn.insert(iter->first); // 非终结符集// 终结符集合string str = iter->second;for (size_t i = 0; i < str.length(); i++){if (str[i] != '|' && (str[i] < 'A' || str[i] > 'Z')){Vt.insert(string(1, str[i]));}}}cout << endl << setw(75) << right << setfill('=') << "符号分类====================" << endl;// 输出终结符和非终结符集合cout << "开始符号：" << S << endl;cout << "非终结符集Vn = " << "{";for (auto iter = Vn.begin(); iter != Vn.end(); ) {cout << *iter;if ((++iter) != Vn.end()){cout << ",";}}cout << "}" << endl;cout << "终结符集Vt = " << "{";for (auto iter = Vt.begin(); iter != Vt.end(); ) {cout << *iter;if ((++iter) != Vt.end()){cout << ",";}}cout << "}" << endl;
}//  求某一个非终结符的First集合
set<char> findFirstBV(string vn) {// 求解思路//1、获取vn的右部，进行分析//2、遍历右部，一个个右部分析，各自求解first集加入到results//2.1 遍历当前右部（一个个字符分析）//如果第一个字符是终结符，加入first集合并且跳出；（这里会添加多余的空符）//如果是非终结符，则递归处理；//如果非终结符可以推空还需要循环处理该右部的下一字符(如果有)//3、遍历结束，最后如果该字符不能推空，就要删除results中的空符；返回结果set<char> results; // first集存储vector<string> rights = getRights(vn); // 获取右部if (!rights.empty()) // 如果右部不为空{// 遍历右部集合（每一个右部分别求解first，加入到该非终结符的first集合中）for (auto iter = rights.begin(); iter != rights.end();++iter) {string right = *iter;// 遍历当前右部： //如果第一个字符是终结符，加入first集合并且跳出循环；//如果是非终结符，则递归处理；//如果非终结符可以推空还需要循环处理该右部的下一字符(如果有)for (auto ch = right.begin(); ch != right.end(); ++ch) {if (isVn(*ch)) // 如果是非终结符，就要递归处理{//先查first集合。如果已经有了就不需要重复求解if (FIRST.find(string(1, *ch)) == FIRST.end()) // fisrt集合中不存在{// 递归调用自身！！！set<char> chars = findFirstBV(string(1, *ch));// 将结果存入结果results.insert(chars.begin(),chars.end());FIRST.insert(pair<string,set<char>>(string(1,*ch),chars));}else { // 存在就把该集合全部加到firsts（提高效率）set<char> chars = FIRST[string(1, *ch)];results.insert(chars.begin(), chars.end());}// 如果这个字符可以推空，且后面还有字符，那么还需要处理下一个字符if (canToEmpty(*ch) && (iter + 1) != rights.end()){continue;}elsebreak; // 否则直接退出遍历当前右部的循环}else { // 如果不是非终结符，直接把这个字符加入first集合，并且跳出// 这一步会把前面的空也加进去（后面会删除）results.insert(*ch);break;}}}}// 最后，如果该终结符不能推空，就删除空if (!canToEmpty(vn[0])){results.erase('~');}return results;
}
// 求解First集，使用哈希表存储
void findFirst() {// 遍历非终结符集合，构建哈希表，便于后续查询for (auto iter = Vn.begin(); iter != Vn.end(); ++iter) {string vn = *iter; // 获取非终结符set<char> firsts = findFirstBV(vn); // 存放一个Vn的first集FIRST.insert(pair<string, set<char>>(vn, firsts));}// 显示输出cout << endl << setw(75) << right << setfill('=') << "FISRT集分析====================" << endl;for (auto iter = FIRST.begin(); iter != FIRST.end();++iter) {cout <<"FIRST("<< iter->first<<")" << "= ";set<char> sets = iter->second;printSet(sets);}
}// 单个非终结符符求解其Follow集合
set<char> findFollowBV(string vn) {//求解思路：//1、对于开始符号，把#加到results//2、遍历当前文法所有的右侧表达式，//2.1 遍历当前右部进行分析，如果发现了vn，则可进行下一步骤以获取results元素//如果当前字符vn是最后一个字符，说明位于句尾，则把#加入//否则遍历vn后的字符// 如果再次遇到vn，回退并退出循环进入外部循环// 如果遇到终结符，直接加入到results，并break退出循环// 否则就是非终结符，那么求其first集合，去掉空后加入到results// 此时还要考虑是继续循环还是跳出循环：//如果当前字符可以推空，而且不是最后一个字符，说明还要继续分析下一个字符//如果可以推空但是是最后一个字符，那么把#加入results//如果不可以推空，直接跳出循环即可（可以推空，后面字符的first集合才有可能作为vn的follow集合）//3、遍历完成，返回results；具体代码如下：set<char> results; // 存储求解结果if (vn == S) // 如果是开始符号{results.insert('#'); // 把结束符加进去，因为有语句#S#}// 遍历文法所有的右部集合for (auto iter = formulas.begin(); iter != formulas.end(); ++iter){string right = (*iter).substr(3); // 获取当前右部// 遍历当前右部，看是否含有当前符号for (auto i_ch = right.begin(); i_ch != right.end();){if (*i_ch == vn[0]) { // 如果vn出现在了当前右部if ((i_ch+1)==right.end()) // vn是当前右部最后一个字符{results.insert('#'); // 加入结束符break;}else { // vn后面还有字符,遍历他们（除非又遇到vn：i_ch回退一个并且进入跳出循环）while (i_ch != right.end()){++i_ch;// 指针后移if (*i_ch == vn[0]){--i_ch;break;}if (isVn(*i_ch)) // 如果该字符是非终结符，把first集中的非空元素加进去{set<char> tmp_f = FIRST[string(1, *i_ch)];tmp_f.erase('~'); // 除去空results.insert(tmp_f.begin(), tmp_f.end());// 还要该字符可否推空，需要考虑是否继续循环if (canToEmpty(*i_ch)){if ((i_ch + 1) == right.end()) // 如果是最后一个字符，加入#{results.insert('#');break;// 跳出循环}// 继续循环}else // 否则跳出循环break;}else {  // 如果该字符是终结符results.insert(*(i_ch));  // 加入该字符break;  // 跳出循环}}}}else {++i_ch;}}}return results;
}
// 完善Follow集合
void completeFollow(string vn) {// 遍历文法所有的右部集合for (auto iter = formulas.begin(); iter != formulas.end(); ++iter){string right = (*iter).substr(3); // 获取当前右部// 遍历当前右部，看是否含有当前符号for (auto i_ch = right.begin(); i_ch != right.end();){char vn_tmp = *i_ch;if (vn_tmp == vn[0]) { // 如果vn出现在了当前右部if ((i_ch + 1) == right.end()) // vn是当前右部最后一个字符{char left = (*iter)[0];set<char> tmp_fo = FOLLOW[string(1,left)]; // 获取左部的follow集合set<char> follows = FOLLOW[string(1,vn_tmp)]; // 获取自己的原来的follow集合follows.insert(tmp_fo.begin(),tmp_fo.end());FOLLOW[vn] = follows; // 修改break;}else { // 不是最后一个字符，就要遍历之后的字符看是否可以推空while (i_ch != right.end()){++i_ch; // 注意指针后移了！！！if (canToEmpty(*i_ch)){if ((i_ch+1)!=right.end()) // 不是最后一个元素，就要继续看后面有没有可以推空的{continue;}else { // 最后一个也能推空,则把左部加进去char left = (*iter)[0];set<char> tmp_fo = FOLLOW[string(1, left)]; // 左部的follow集合set<char> follows = FOLLOW[string(1, vn_tmp)]; // 当前符号的follow集合follows.insert(tmp_fo.begin(), tmp_fo.end());FOLLOW[vn] = follows; // 修改原值break;}}else  // 如果不能推空，就退出循环break;}}}++i_ch; // 遍历寻找vn是否出现}}
}
// 求解Follow集，使用哈希表存储
void findFollow() {// 遍历所有非终结符，依次求解follow集合for (auto iter = Vn.begin(); iter != Vn.end(); ++iter) {string vn = *iter; // 获取非终结符set<char> follows = findFollowBV(vn); // 求解一个Vn的follow集FOLLOW.insert(pair<string, set<char>>(vn, follows)); // 存储到哈希表，提高查询效率}// 完善follow集合直到follow不再增大int old_count = getFS();int new_count = -1;while (old_count != new_count) // 终结符在变化，反复这个过程直到follow集合不再增大{old_count = getFS();// 再次遍历非终结符，如果出现在右部最末端的，把左部的follow集加进来for (auto iter = Vn.begin(); iter != Vn.end(); ++iter) {string vn = *iter; // 获取非终结符completeFollow(vn);}new_count = getFS();}// 显示输出cout << endl << setw(75) << right << setfill('=') << "FOLLOW集分析====================" << endl;for (auto iter = FOLLOW.begin(); iter != FOLLOW.end(); ++iter) {cout << "FOLLOW(" << iter->first << ")" << "= ";set<char> sets = iter->second;printSet(sets);}
}// 单个表达式求解Select集合
set<char> findSelectBF(string formula) {// 求解思路// 1、得到产生式的left和right// 2、遍历右部产生式，首先分析右部第一个字符:right[0]// 如果是终结符：（如果为空符，则把follow(left)加入results，否则直接把该符号加入到results）,然后break// 如果是非终结符：把first(right[0])-'~'加入到results；如果还可以推空，则要继续往后看（continue）set<char> results; // 存储结果// 1、得到产生式的left和rightchar left = formula[0]; // 左部string right = formula.substr(3); // 右部//cout << "Select集合分析" << left << "->" << right << endl;// 调试用// 2、遍历右部产生式，首先分析右部第一个字符:right[0]for (auto iter = right.begin(); iter != right.end(); ++iter){//cout << "遍历右部" << *iter << endl; // 调试用// 如果是非终结符：把first(right[0])-'~'加入到results；如果还可以推空，则要继续往后看（continue）if (isVn(*iter)){set<char> chs = FIRST.find(string(1, *iter))->second; // 得到该符号的first、chs.erase('~'); // 去除空符results.insert(chs.begin(), chs.end()); // 加入selectif (canToEmpty(*iter)) // 如果可以推空，继续处理下一个字符加入到select集合{if ((iter+1)==right.end()) // 当前是最后一个字符，则把follow(left)加入results,然后break{set<char> chs = FOLLOW.find(string(1, left))->second; // 得到左部的followresults.insert(chs.begin(), chs.end()); // 加入select}else { // 继续处理下一字符continue;}}elsebreak; // 该字符不可以推空，退出循环}else {// 如果是终结符：（如果为空符，则把follow(left)加入results，否则直接把该符号加入到results）,然后breakif (*iter == '~') // 如果是空{set<char> chs = FOLLOW.find(string(1, left))->second; // 得到左部的followresults.insert(chs.begin(), chs.end()); // 加入select}elseresults.insert(*iter); // 直接加入selectbreak; // 退出循环}}return results;
}
// 求解Select集，使用哈希表存储
void findSelect() {// 遍历表达式集合for (auto iter = formulas.begin(); iter != formulas.end(); ++iter) {string formula = *iter; // 获取表达式set<char> selects = findSelectBF(formula); // 存放一个Vn的first集SELECT.insert(pair<string, set<char>>(formula, selects));  // 插入到哈希表，提高查询效率}// 显示输出cout << endl << setw(75) << right << setfill('=') << "SELECT集分析====================" << endl;for (auto iter = SELECT.begin(); iter != SELECT.end(); ++iter) {cout << "SELECT(" << iter->first << ")" << "= ";set<char> sets = iter->second;printSet(sets);}
}// 判断是否为LL(1)分析
void isLL1() {// 求解思路：通过嵌套循环SELECT集合，判断不同的表达式但左部相同时的SELECT集合之间相交是否有交集// 如果有交集说明不是LL1，否则是LL1分析for (auto i1 = SELECT.begin(); i1 != SELECT.end(); ++i1){for (auto i2 = SELECT.begin(); i2 != SELECT.end(); ++i2){char left1 = (i1->first)[0]; // 获取左部2char left2 = (i2->first)[0]; // 获取左部2if (left1 == left2) // 左部相等{if (i1->first != i2->first) //表达式不一样{if (isIntersect(i1->second, i2->second)) { // 如果select集合有交集// 不是LL1文法cout << "经过分析，您输入的文法不符合LL(1)文法，请修改后重试" << endl;exit(0); // 直接退出}}}}}// 是LL（1）文法cout << setw(75) << right << setfill('=') << "进入分析器====================" << endl << endl;cout << "经过分析，您输入的文法符合LL(1)文法..." << endl;
}// 构造预测分析表
void makeTable() {cout << "正在为您构造分析表..." << endl;// 求解思路：// 1、遍历select集合，对于键：分为left和->right;对于值，遍历后单个字符ch：// 把left和ch配对作为TABLE的键，而->right作为值// map键值对的形式，空间更多，查询效率高点char left_ch;string right;set<char> chars;for (auto iter = SELECT.begin(); iter != SELECT.end(); ++iter) // 遍历select集合{left_ch = iter->first[0]; // 获取左部right = iter->first.substr(1); // 获取->右部chars = iter->second;// 遍历chars.一个个放入for (char ch : chars) { // 遍历终结符TABLE.insert(pair<pair<char, char>,string>(pair<char, char>(left_ch, ch),right));}}/*cout << "分析表调试：" << TABLE.find(pair<char, char>('E', 'i'))->second;*/// 输出分析表printTable();
}
// 输出预测分析表
void printTable() {// 输出分析表cout << setw(75) << right << setfill('=') << "预测分析表====================" << endl;cout << setw(9) << left << setfill(' ') << "VN/VT";set<string> vts = Vt;vts.erase("~");vts.insert("#");for (string str : vts) // 遍历终结符{cout << setw(12) << left << setfill(' ') << str;}cout << endl << endl;for (string vn : Vn){cout << setw(7) << left << setfill(' ') << vn;for (string vt : vts) // 遍历终结符{if (TABLE.find(pair<char, char>(vn[0], vt[0])) == TABLE.end()) //如果找不到{cout << setw(12) << left << "ERR" << " ";}else {cout << setw(12) << left << TABLE.find(pair<char, char>(vn[0], vt[0]))->second << " ";}}cout << endl;}cout << setw(75) << setfill('=') << " " << endl;
}// 分析字符串
void LL1Analyse() {// 求解思路：//1、构建先进后出栈，将#、S进栈//2、遍历句子，一个个符号送a;和栈顶送X，进入分析// 2.1 如果X是终结符// 如果和a相等，说明匹配成功：X出栈，并读取下一个字符// 否则是无法匹配：失败退出// 2.2 如果X是末尾符// a也是末尾符，接受分析字符串：成功退出// a不是末尾符，不接受分析字符串，失败退出// 2.3 否则X就是非终结符// 查找预测分析表，看是否有表达式// 如果没有，分析出错，失败退出// 如果有，X元素出栈，表达式逆序进栈，继续循环句子且要重复分析a//3、遍历完成，程序结束cout << "构造完成，请输入您要分析的字符串..." << endl;string str; // 输入串cin >> str; str.push_back('#'); // 末尾加入结束符cout << "正在分析..." << endl;cout << endl << setw(75) << right << setfill('=') << "分析过程====================" << endl;cout << setw(16) << left << setfill(' ') << "步骤";cout << setw(16) << left << setfill(' ') << "分析栈";cout << setw(16) << left << setfill(' ') << "剩余输入串";cout << setw(16) << left << setfill(' ') << "分析情况" << endl;stack<char> stack_a; // 分析栈stack_a.push('#'); // 末尾符进栈stack_a.push(S[0]); // 开始符号进栈// 初始化显示数据int step = 1; // 步骤数stack<char> stack_remain = stack_a; // 剩余分析栈string str_remain = str; // 剩余分析串string str_situation = "待分析"; // 分析情况// 初始数据显示cout << setw(16) << left << setfill(' ') << step;cout << setw(16) << left << setfill(' ') << getStackRemain(stack_remain);cout << setw(16) << left << setfill(' ') << str_remain << endl;// 遍历所输入的句子，一个个字符分析for (auto iter = str.begin(); iter != str.end();) {char a = *iter; // 当前终结符送achar X = stack_a.top(); // 栈顶元素送Xif (isVt(X)) // 如果X是Vt终结符，栈顶元素出栈，然后读取下一个字符{if (X == a) // 和输入字符匹配{stack_a.pop(); // 移除栈顶元素// 从剩余分析串中移除本元素for (auto i_r = str_remain.begin(); i_r != str_remain.end(); i_r++){if (*i_r == a) {str_remain.erase(i_r);break; // 只删除第一个,}}// 重新组装提示字符串string msg = "“" + string(1, a) + "”匹配";str_situation = msg;// 读取下一个字符++iter; }else { // 无法匹配，分析出错cout << "分析出错:" <<X<<"和" <<a<< "不匹配" << endl;exit(-1); // 出错退出}}else if (X == '#') // 文法分析结束{if (a == '#') // 当前符号也是最后一个符号 ， 接受分析结果{cout << "分析结束，当前文法接受您输入的字符串" << endl;exit(0); // 成功退出}else {cout << "分析出错，文法结束输入串未结束" << endl;exit(-1);}}else { // X 就是非终结符了// 查看TABLE（X，a）是否有结果if (TABLE.find(pair<char, char>(X, a)) == TABLE.end()) //如果找不到{if (!canToEmpty(X)) // 也不能推空{cout << "分析出错,找不到表达式" << endl;exit(-1); // 失败退出}else {  // 可以推空，stack_a.pop(); // 移除栈顶元素	// 重新组装字符串str_situation.clear();str_situation.push_back(X);str_situation = str_situation + "->";str_situation = str_situation + "~";}} else {stack_a.pop();// 先将当前符号出栈string str = TABLE.find(pair<char, char>(X, a))->second.substr(2); // 获取表达式并且逆序进栈(除去->)// 重新组装字符串str_situation.clear();str_situation.push_back(X);str_situation = str_situation + "->";str_situation = str_situation +str;reverse(str.begin(),str.end());for (auto iiter = str.begin(); iiter != str.end(); ++iiter){if (*iiter != '~'){stack_a.push(*iiter);}}// （要继续识别该字符）}}// 重置显示数据++step; // 步骤数加1stack_remain = stack_a; // 置剩余栈为当前栈// 每次循环显示一次cout << setw(16) << left << setfill(' ') << step;cout << setw(16) << left << setfill(' ') << getStackRemain(stack_remain);cout << setw(16) << left << setfill(' ') << str_remain;cout << setw(16) << left << setfill(' ') << str_situation << endl;}
}// =====================================工具函数===================================
// 根据左部返回某一产生式的右部集合
vector<string> getRights(string left)
{vector<string> rights;if (grammar.find(left)== grammar.end()) // 语法中没有这一项，直接返回空{return rights;}else {string str = grammar.find(left)->second;str = str + '|';   // 末尾再加一个分隔符以便截取最后一段数据size_t pos = str.find('|');//find函数的返回值，若找到分隔符返回分隔符第一次出现的位置，//否则返回npos//此处用size_t类型是为了返回位置while (pos != string::npos){string x = str.substr(0, pos);//substr函数，获得子字符串rights.push_back(x);          // 存入right容器str = str.substr(pos + 1);     // 更新字符串pos = str.find('|');         // 更新分隔符位置}return rights;}
}// 判断是终结符还是非终结符
bool isVn(char v) {if (v >= 'A' && v <= 'Z') { // 大写字母就是非终结符return true;}else {return false;}
}bool isVt(char v) {if (isVn(v) || v == '#' || v == '|') // 如果是非终结符、末尾符号、分隔符,都不是终结符{return false;}return true;
}// 判断某个非终结符能否推出空
bool canToEmpty(char vn) {vector<string> rights = getRights(string(1,vn)); // vn可能推出的右部集for (auto i = rights.begin();i!=rights.end();++i) // 遍历右部集合（如果前面的右部可以推空可提前跳出,不然就要看到最后）{string right = *i; // 此为一个右部// 遍历这个右部for (auto ch = right.begin(); ch != right.end(); ++ch) {if ((*ch)=='~')// 如果ch为空，说明可以推空（因为不可能存在右部是"εb"这样的情况，不需要看是否是最后一个字符）{return true;}else if (isVn(*ch)) { // 如果是vn则需要递归if (canToEmpty(*ch))// 如果可以推空{// 而且是最后一个字符，则返回true//这里可能存在"AD"A->εD不能推空的情况，所以需要看是否最后一个字符if ((ch + 1) == right.end()){return true;}continue; // 当前字符可以推空，但不是最后一个字符，无法确定能否推空，还需要看右部的下一个字符}else  // 如果不可以推空，说明当前右部不可以推空，需要看下一个右部break;}else // 如果是非空vt说明目前右部不能推空，需要看下一个右部break;}}return false;
}// 判断两个字符set的交集是否为空
bool isIntersect(set<char> as, set<char> bs) {for (char a : as) {for (char b : bs) {if (a == b){return true;}}}return false;
}// 得到逆序字符串
string getStackRemain(stack<char> stack_remain) {string str;// 剩余分析栈串while (!stack_remain.empty()){str.push_back(stack_remain.top());stack_remain.pop();// 出栈}reverse(str.begin(),str.end());return str;
}// 显示输出一个char集
void printSet(set<char> sets) {cout << "{ ";for (auto i = sets.begin(); i != sets.end();) {cout << *i;if (++i != sets.end()){cout << " ,";}}cout << " }" << endl;
}// 求FOLLOW集合中的元素个数
int getFS() {int count = 0;for (auto iter = FOLLOW.begin(); iter != FOLLOW.end(); ++iter) {count = count + iter->second.size();}return count;
}