c语言实现词法分析器

article/2025/11/1 10:34:42

词法分析器的功能:输入源程序,输出单词字符。单词字符一般可以分为下面五种。
(1)关键字 是由程序语言定义的具有固定意义的标识符。有时称这些标识符为保留字或者基本字。例如c语言中的int,char,define,strcut,double,if,else.等等
(2)标识符 用来表示各种名字,如变量名,数组名,过程名。
(3)常数 常数的类型一般有整形,实型,布尔型等
(4)运算符 如+,-,*,/。
(5)界符 如逗号,分号,括号,%,//,等。
词法分析器的目标就是把程序分成一个一个单词。并给出单词符号的种类,以及种类值。
代码实现:
代码是贴的别人的,我在上面改善了一些实现的功能。自己发了三四个小时看明白了。自己完完全全写的确好多东西要学一下。比如一些文件的操作还不是特别的熟悉。等等呀!代码中还用到了结构体,我之前也做过一篇文章分析了,这里用结构体来实现关键字表,应该不是很难的。
普通标识符的种类编码1
无符号整数的种类编码2
“int”,的种类编码3
“char”,的种类编码4
“float”,的种类编码5
“main”,的种类编码6
“double”,的种类编码7
“case”, 的种类编码8
“for”,的种类编码9
“if”,的种类编码10
“auto”,的种类编码11
“else”,的种类编码12
“do”,的种类编码13
“while”,的种类编码14
“void”,的种类编码15
“static”, 的种类编码16
“return”,的种类编码17
“break”,的种类编码18
“struct”,的种类编码19
“const”,的种类编码20
“union”,的种类编码21
“switch”,的种类编码22
“typedef”,的种类编码23
"enum"的种类编码24
( 的种类编码25
)的种类编码26
[ 的种类编码27
] 的种类编码28
; 的种类编码29
. 的种类编码30
, 的种类编码31
: 的种类编码32
{的种类编码33
} 的种类编码34
% 的种类编码35
" 的种类编码36
\ 的种类编码37
# 的种类编码38
/ 的种类编码39
++的种类编码41
+=的种类编码42
+的种类编码43
–的种类编码44
-=的种类编码45
-的种类编码46
*的种类编码47
=的种类编码48
>= 的种类编码49
> 的种类编码50

那个模块不是很清楚的话可以评论哈!!!

/*附录源程序清单:*/#include<string.h>
#include<stdio.h>
#define   MAX 22             /*分析}表的最大容量*/
#define   RES_MAX   10        /*关键字的最大长度*/
#define   MAXBUF 255         /*缓冲区的大小*/char   ch =' ';             /*存放读入当前的输入字符*/
int Line_NO;                /*纪录行号*/struct keywords    /*关键字*/
{
char lexptr[MAXBUF];
int token;
};
struct keywords symtable[MAX];
char str[MAX][10]={"int","char","float","main","double","case", "for","if","auto","else","do","while","void","static", "return","break","struct","const","union","switch","typedef","enum"};/*对关键字表进行初始化,div,mod,and,or也作为关键字处理*/
/*最小的token是program:3,最大的token是or:24*/
void init() 
{           int j;for(j=0; j<MAX; j++){strcpy(symtable[j].lexptr,str[j]);symtable[j].token=j+3;   }
}/***************对关键字进行搜索**************/
int Iskeyword(char * is_res){int i;for(i=0;i<MAX;i++){if((strcmp(symtable[i].lexptr,is_res))==0) break;}if(i<MAX) return   symtable[i].token;else return 0;
}/*****************判断是否为字母*****************/
int IsLetter(char c)
{if(((c<='z')&&(c>='a'))||((c<='Z')&&(c>='A'))) return 1;else return 0;
}/*************判断是否为数字**************/
int IsDigit(char c){if(c>='0'&&c<='9') return 1;else return 0;
}/***************分析程序**************/
void analyse(FILE *fpin,FILE *fpout){/* 输入缓冲区,存放一个单词符号 */char arr[MAXBUF];	int j=0;while((ch=fgetc(fpin))!=EOF){/*碰到空格、tab则跳过*/if(ch==' '||ch=='\t'){}else if(ch=='\n'){Line_NO++;}
/*********************字符串的处理*************************/else if(IsLetter(ch)){while(IsLetter(ch)|IsDigit(ch)|ch=='_'){if((ch<='Z')&&(ch>='A'))     ch=ch+32;   /*忽略大小写*/arr[j]=ch;j++;ch=fgetc(fpin);}/*输入指针回退一个字符*/fseek(fpin,-1L,SEEK_CUR);arr[j]='\0';j=0;if (Iskeyword(arr)){   /*如果是关键字*/fprintf(fpout,"%s\t\t%d\t\t关键字\n",arr,Iskeyword(arr));}else   fprintf(fpout,"%s\t\t%d\t\t标识符\n",arr,1); /*普通标识符*/
/*************************数字的处理****************************/      }else if(IsDigit(ch)){int s=0;while(IsDigit(ch)|IsLetter(ch)){if(IsLetter(ch)){arr[j]=ch;j++;ch=fgetc(fpin);s=1;}else if(IsDigit(ch)){arr[j]=ch;j++;ch=fgetc(fpin);}		  }fseek(fpin,-1L,SEEK_CUR);arr[j]='\0';j=0;if(s==0)fprintf(fpout,"%s\t\t%d\t\t无符号整数\n",arr,2) ; else if(s==1)fprintf(fpout,"%s\t\t%d\t\t错误\n",arr,3) ; }else switch(ch){           case'+' :ch=fgetc(fpin);if(ch=='+'){fprintf(fpout,"%s\t\t%d\t\t自加运算符\n","++",41);break;}else if(ch=='='){fprintf(fpout,"%s\t\t%d\t\t运算符\n","+=",42);break;}elsefseek(fpin,-1L,SEEK_CUR);fprintf(fpout,"%s\t\t%d\t\t运算符\n","+",43);break;case'-' :ch=fgetc(fpin);if(ch=='-'){fprintf(fpout,"%s\t\t%d\t\t自减运算符\n","--",44);break;}else if(ch=='='){fprintf(fpout,"%s\t\t%d\t\t运算符\n","-=",45);break;}elsefseek(fpin,-1L,SEEK_CUR);fprintf(fpout,"%s\t\t%d\t\t运算符\n","-",46);break;case'*' :fprintf(fpout,"%s\t\t%d\t\t运算符\n","*",47);break;case'(' :fprintf(fpout,"%s\t\t%d\t\t分界符\n","(",25);break;case')' :fprintf(fpout,"%s\t\t%d\t\t分界符\n",")",26);break;case'[' :fprintf(fpout,"%s\t\t%d\t\t分界符\n","[",27);break;case']' :fprintf(fpout,"%s\t\t%d\t\t分界符\n","]",28);break;                      case';' :fprintf(fpout,"%s\t\t%d\t\t分界符\n",";",29);break;case'=' :fprintf(fpout,"%s\t\t%d\t\t运算符\n","=",48);break;case'.' :fprintf(fpout,"%s\t\t%d\t\t分界符\n",".",30);break;case',' :fprintf(fpout,"%s\t\t%d\t\t分界符\n",",",31);break;case':' :fprintf(fpout,"%s\t\t%d\t\t分界符\n",":",32);break; case'{' :fprintf(fpout,"%s\t\t%d\t\t分界符\n","{",33);break;case'}' :fprintf(fpout,"%s\t\t%d\t\t分界符\n","}",34);break; case'%' :fprintf(fpout,"%s\t\t%d\t\t分界符\n","%",35);break;case'\"' :fprintf(fpout,"%s\t\t%d\t\t分界符\n","\"",36);break;case'\\' :fprintf(fpout,"%s\t\t%d\t\t分界符\n","\\",37);break;  case'#' :fprintf(fpout,"%s\t\t%d\t\t分界符\n","#",38);break;case'>' :{ch=fgetc(fpin);if(ch=='=') fprintf(fpout,"%s\t\t%d\t\t运算符\n",">=",49);else {fprintf(fpout,"%s\t\t%d\t\t运算符\n",">",50);fseek(fpin,-1L,SEEK_CUR);}}break;case'<' :{ch=fgetc(fpin);if(ch=='=') fprintf(fpout,"%s\t\t%d\t\t运算符\n","<=",51);else if(ch=='>') fprintf(fpout,"%s\t\t%d\n","<>",52);else{fprintf(fpout,"%s\t\t%d\t\t运算符\n","<",53);fseek(fpin,-1L,SEEK_CUR);}}break;/***************出现在/  /之间的全部作为注释部分处理*******************/  case'/' :{ch=fgetc(fpin);if(ch=='/'){while(ch!='\n'){ch=fgetc(fpin);}}else if(ch=='*'){while(ch!='/'&&ch!=EOF){ch=fgetc(fpin);}if(ch==EOF) fprintf(fpout,"缺少一个'/'");}else {fprintf(fpout,"%s\t\t%d\t\t运算符\n","/",39);fseek(fpin,-1L,SEEK_CUR);}break;}/***************非法字符*******************/                         default :fprintf(fpout,"在第%d行无法识别的字符\t%c\n",Line_NO,ch);}}
}
/**********主程序中完成对输入输出文件的读写***********/
int main(){char in_fn[25],out_fn[25];FILE * fpin,* fpout;  printf("<<<<<<<<<<<<<<<<<<WELCOME>>>>>>>>>>>>>>>>>>>>>>>>>>>\n");printf("..............词法分析程序实验......................\n");printf("\n");printf(".....目前共有词法程序范例:   1个   \n");printf(".....程序范例1:data.txt \n");printf(".....输入一个已有的程序:\n");scanf("%s",in_fn);printf(".....输入你想要保存分析的目标文件名:\n");scanf("%s",out_fn);fpin=fopen(in_fn,"r");fpout=fopen(out_fn,"w");fprintf(fpout,"单词符\t\t种类编码\t\t种类\n");init();analyse(fpin,fpout);fclose(fpin);fclose(fpout);printf(".....程序已分析完成分析并保存至目标文件\n");printf("........<谢谢使用>......\n");return 0;
}

在这里插入图片描述
在这里插入图片描述
我用这个代码本身做的测试!汉字不能够分析,还有一些字符也没有加进去
如&,|。等有兴趣的小伙伴可以试试!
给大家看看结果!!!
在这里插入图片描述
因为加种类编码,所以可能有些混乱!看懂原理就行了!结构不是很复杂,希望对大家有所帮助。


http://chatgpt.dhexx.cn/article/Nyi2uhFi.shtml

相关文章

词法分析器(分析C语言)

问题描述&#xff1a; 用C或C语言编写一个简单的词法分析程序&#xff0c;扫描C语言小子集的源程序&#xff0c;根据给定的词法规则&#xff0c;识别单词&#xff0c;填写相应的表。如果产生词法错误&#xff0c;则显示错误信息、位置&#xff0c;并试图从错误中恢复。简单的恢…

词法分析器(c++)

前景提示&#xff1a; 个人觉得单纯是用来完成实验报告的话还行&#xff0c;但仅做参考&#xff0c;因为本人的编程水平有限&#xff0c;怕误人子弟。 本次代码支持以下操作&#xff1a; 单行注释 多行注释 文件形式输入 种别码可以在文件中自由修改 单词字符串识别支持…

词法分析——词法分析器的作用

目录 综述 正文 1 词法分析与语法分析 2 词法单元、模式和词素 3 词法单元的属性 4 词法错误 综述 词法分析是编译的第一阶段。词法分析器的主要作用是读入源程序的输入字符、将它们组成词素&#xff0c;生成并输出一个词法单元序列&#xff0c;每个词法单元对应一个词素。…

词法分析器

词法分析&#xff08;Lexical Analysis&#xff09; 词法分析器在英文中一般叫做 Tokenizer。 有一个计算模型&#xff0c;叫做有限自动机&#xff08;Finite-state Automaton&#xff0c;FSA&#xff09;&#xff0c;或者叫做有限状态自动机&#xff08;Finite-state Machin…

编译原理——词法分析器

1 概述 设计、编制并调试一个简单的C语言词法分析程序&#xff0c;掌握利用状态转换图设计词法分析器的基本方法&#xff0c;利用该词法分析器完成对源程序字符串的词法分析。通过对该词法分析器的设计&#xff0c;加深对词法分析原理、状态转换图等编译原理知识的理解。 2 使…

编译原理词法分析器(C/C++)

前言&思路 词法分析器不用多说&#xff0c;一开始我还不知道是什么样的&#xff0c;看了下别人的博客&#xff0c;再看看书&#xff0c;原来是输出二元组&#xff0c;这不就是字符串操作嘛。然后细看几篇博客&#xff0c;发现大都是用暴力判断来写的。我对代码重复性比较高…

【编译原理】词法分析(C/C++源代码+实验报告)

文章目录 1 实验目的和内容1.1实验目的1.2实验内容 2 设计思想2.1单词种类及其正规式2.2 根据正规式构造NFA2.3根据NFA构造DFA2.3.1根据替换规则构造未化简的DFA2.3.2最小化DFA 3算法流程4源程序5调试数据5.1 测试样例一5.2 测试样例二5.3 测试样例三 6实验调试情况及体会6.1 实…

session 每次请求都会产生新的sessionID

问题描述&#xff1a; 最近在写一个项目时&#xff0c;在运行项目后每刷新一次都会产生一个新的Session ID&#xff0c;导致无法取值。 原因分析&#xff1a; 搞了很久发现是URL路径的问题&#xff0c;把http://localhost:8080//的双斜杠该为单斜杠就行了 解决方案&#xf…

JavaWeb - Cookie、Session、SessionId 详解

一、概述 会话&#xff08;Session&#xff09;跟踪是Web程序中常用的技术&#xff0c;用来跟踪用户的整个会话。常用的会话跟踪技术是Cookie与Session。Cookie通过在客户端记录信息确定用户身份&#xff0c;Session通过在服务器端记录信息确定用户身份。 本章将系统地讲述Co…

JSESSIONID和sessionid的区别

要保持登陆状态&#xff0c;但是sessionid 和 JSESSIONID的值不一致&#xff0c; 情况一&#xff1a;部署到测试机上&#xff0c;利用本机登陆网页&#xff0c;sessionid和jsessionid不一样。 情况二&#xff1a;部署在本机&#xff0c;本机登陆页面&#xff0c;sessionid和js…

关于两次访问接口的sessionid不一致问题

在测试验证邮箱、注册逻辑时&#xff0c;出现验证码错误的问题。验证码是存放在session内的&#xff0c;在排除了逻辑代码的问题后&#xff0c;检查出这两次访问接口的sessionid并不一致&#xff0c;而在swagger测试接口时是一致的。因此我比较了swagger与ajax请求/响应头的区别…

cookie、session、sessionid 与jsessionid

cookie、session、sessionid 与jsessionid&#xff0c;要想明白他们之间的关系&#xff0c;下面来看个有趣的场景来帮你理解。 我们都知道银行&#xff0c;银行的收柜台每天要接待客户存款/取款业务&#xff0c;可以有几种方案&#xff1a; 凭借柜台职员的记忆&#xff0c;由收…

如何根据sessionID获取session解决方案

点个赞&#xff0c;看一看&#xff0c;好习惯&#xff01;本文 GitHub https://github.com/OUYANGSIHAI/JavaInterview 已收录&#xff0c;这是我花了3个月总结的一线大厂Java面试总结&#xff0c;本人已拿腾讯等大厂offer。 另外&#xff0c;原创文章首发在我的个人博客&#…

sessionId的生成过程和过期时间

支持作者 最便宜的卫生纸 浏览器第一次请求服务器时&#xff0c;服务器会生成一个sessionId&#xff0c;并返回给浏览器&#xff0c;这个sessionId会被保存在浏览器的会话cookie中。如下图 在浏览器不关闭的情况下&#xff0c;之后的每次请求请求头都会携带这个sessionId到服务…

session,sessionid,cookie之间的关系解析

session&#xff0c;sessionid&#xff0c;cookie之间的关系解析 文章目录 session&#xff0c;sessionid&#xff0c;cookie之间的关系解析1.简介2.session和cookie定义&#xff0c;创建&#xff0c;周期和联系2.1cookie2.2session 3.如果禁用cookie后&#xff0c;如何解决账号…

dubbox拦截器配置

dubbo是一个被国内很多互联网公司广泛使用的开源分布式服务框架&#xff0c;即使从国际视野来看应该也是一个非常全面的SOA基础框架。作为一个重要的技术研究课题&#xff0c;在当当网我们根据自身的需求&#xff0c;为Dubbo实现了一些新的功能&#xff0c;并将其命名为Dubbox&…

Springboot+Dubbox 提供Rest服务实践

背景 在开发过程中&#xff0c;dubbo接口自测时&#xff0c;通过控制台的invoke方式调用dubbo服务不方便&#xff0c;主要体现在入参设置和入参保存上&#xff08;invoke方式调用dubbo服务请参考&#xff1a;命令行中调用dubbo服务及入参写法_Ypc_victor的专栏-CSDN博客&#…

Dubbo2

一、基础知识 1、分布式基础理论 1.1&#xff09;、什么是分布式系统&#xff1f; 《分布式系统原理与范型》定义&#xff1a; “分布式系统是若干独立计算机的集合&#xff0c;这些计算机对于用户来说就像单个相关系统” 分布式系统&#xff08;distributed system&#…

Dubbox 是什么?

1. Dubbo是什么&#xff1f; Dubbo是一个分布式服务框架&#xff0c;致力于提供高性能和透明化的RPC远程服务调用方案&#xff0c;以及SOA服务治理方案。简单的说&#xff0c;dubbo就是个服务框架&#xff0c;如果没有分布式的需求&#xff0c;其实是不需要用的&#xff0c;只…

分布式服务框架 dubbo/dubbox 入门示例

http://www.cnblogs.com/Javame/p/3632473.html 1. Dubbo是什么&#xff1f; Dubbo是一个分布式服务框架&#xff0c;致力于提供高性能和透明化的RPC远程服务调用方案&#xff0c;以及SOA服务治理方案。简单的说&#xff0c;dubbo就是个服务框架&#xff0c;如果没有分布式的…