java实现词法分析器

article/2025/11/1 10:15:37

实现词法分析器

实验内容要求

一、实验目的 加深对词法分析器的工作过程的理解;加强对词法分析方法的掌握;能够采用一种编程 语言实现简单的词法分析程序;能够使用自己编写的分析程序对简单的程序段进行词法分 析。

二、实验内容 自定义一种程序设计语言,或者选择已有的一种高级语言,编制它的词法分析程序。词 法分析程序的实现可以采用任何一种编程语言和编程工具。 从输入的源程序中,识别出各个具有独立意义的单词,即关键字、标识符、常数、运算 符、界符。并依次输出各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”, 然后跳过错误部分继续显示)

三、实验要求: 1. 对单词的构词规则有明确的定义; 2. 编写的分析程序能够正确识别源程序中的单词符号; 3. 识别出的单词以<种别码,值>的形式保存在符号表中,正确设计和维护符号表; 4. 对于源程序中的词法错误,能够做出简单的错误处理,给出简单的错误提示,保 证顺利完成整个源程序的词法分析;

四、实验步骤 1. 定义目标语言的可用符号表和构词规则; 2. 依次读入源程序符号,对源程序进行单词切分和识别,直到源程序结束; 3. 对正确的单词,按照它的种别以<种别码,值>的形式保存在符号表中; 4. 对不正确的单词,做出错误处理。

实验方法

根据对应的状态转换图完成编码就可以了,内容我不详细多说,下面的图可以作为参照,实际上还需要自己去思考更多,我的代码还是存在一点小问题的,仅供大家参考。

状态转换图

import java.io.File;
import java.io.FileNotFoundException;
import java.util.*;public class LexicalAnalyzer {/** 1表示关键字* 2表示标识符* 3表示常数* 4表示运算符* 5表示界符* 6表示字符串* *///关键字static String []keyWord={"private","protected","public","abstract","class","extends","final","implements","interface","native","new","static","strictfp","break","continue","return","do","while","if","else","for","instanceof","switch","case","default","boolean","byte","char","double","float","int","long","short","String","null","true","false","void","this","goto"};//运算符static String []operation={"+","-","*","/","%","++","--","-=","*=","/=","&","|","^","~","<<",">>",">>>","==","!=",">","<","=",">=","<=","&&","||","!","."};//界符static String []symbol={",",";",":","(",")","{","}"};static ArrayList<String> keyWords=null;static ArrayList<String> operations=null;static ArrayList<String> symbols=null;//指向当前所读到字符串的位置的指针static int p,lines;public static void main(String []args) throws FileNotFoundException {init();File file=new File("E:\\code\\bytest\\test11\\test2.txt");lines=1;try(Scanner input=new Scanner(file)) {while (input.hasNextLine()){String str=input.nextLine();analyze(str);lines++;}}}//初始化把数组转换为ArrayListpublic static void init(){keyWords=new ArrayList<>();operations=new ArrayList<>();symbols=new ArrayList<>();Collections.addAll(keyWords, keyWord);Collections.addAll(operations, operation);Collections.addAll(symbols, symbol);}public static void analyze(String str){p=0;char ch;str=str.trim();for (;p<str.length();p++){ch=str.charAt(p);if (Character.isDigit(ch)){digitCheck(str);}else if (Character.isLetter(ch)||ch=='_'){letterCheck(str);}else if (ch=='"'){stringCheck(str);}else if (ch==' '){continue;}else {symbolCheck(str);}}}/*数字的识别* 1、识别退出:*   1.1、遇到空格符*   1.2、遇到运算符或者界符* 2、错误情况:*   2.1、两个及以上小数点*   2.2、掺杂字母* */public static void digitCheck(String str){String token= String.valueOf(str.charAt(p++));//判断数字的小数点是否有且是否大于1int flag=0;boolean err=false;char ch;for (;p<str.length();p++) {ch = str.charAt(p);if (ch==' '||(!Character.isLetterOrDigit(ch)&&ch!='.')) {break;}else if (err){token+=ch;}else {token+=ch;if (ch == '.') {if (flag == 1) {err = true;} else {flag++;}}else if (Character.isLetter(ch)){err=true;}}}if (token.charAt(token.length()-1)=='.'){err=true;}if (err){System.out.println(lines+"line"+": "+token+" is wrong");}else {System.out.println("("+3+","+token+")");}if (p!=str.length()-1||(p==str.length()-1&&!Character.isDigit(str.charAt(p)))){p--;}}//标识符,关键字的识别public static void letterCheck(String str){String token= String.valueOf(str.charAt(p++));char ch;for (;p<str.length();p++){ch=str.charAt(p);if (!Character.isLetterOrDigit(ch)&&ch!='_'){break;}else{token+=ch;}}if (keyWords.contains(token)){System.out.println("("+1+","+token+")");}else {System.out.println("("+2+","+token+")");}if (p!=str.length()-1||(p==str.length()-1&&(!Character.isLetterOrDigit(str.charAt(p))&&str.charAt(p)!='_'))){p--;}}//符号的识别public static void symbolCheck(String str){String token= String.valueOf(str.charAt(p++));char ch;if (symbols.contains(token)){System.out.println("("+5+","+token+")");p--;}else {if (operations.contains(token)){if (p<str.length()){ch=str.charAt(p);if (operations.contains(token+ch)){token+=ch;p++;if (p<str.length()){ch=str.charAt(p);if (operations.contains(token+ch)){token+=ch;System.out.println("("+4+","+token+")");}else{p--;System.out.println("("+4+","+token+")");}}else{System.out.println("("+4+","+token+")");}}else {p--;System.out.println("("+4+","+token+")");}}}else {p--;System.out.println(lines+"line"+": "+token+" is wrong");}}}//字符串检查public static void stringCheck(String str){String token= String.valueOf(str.charAt(p++));char ch;for (;p<str.length();p++){ch=str.charAt(p);token+=ch;if (ch=='"'){break;}}if (token.charAt(token.length()-1)!='"'){System.out.println(lines+"line"+": "+token+" is wrong");}else {System.out.println("("+6+","+token+")");}}
}

实验结果

1、对于正确的输入:

    public static void test(){int a=10;double b=20.2;double c=a+b;}

测试一结果
2、有不正确的输入:

public static double test(){double a=20.3.2.1;int 1111bbbb=10;System.out.println(a+b);String str="helloWorld";double c=124.、a++;return a+b+c;}

在这里插入图片描述
在这里插入图片描述


http://chatgpt.dhexx.cn/article/9358peaW.shtml

相关文章

python实现词法分析器

基于python3 实现一个简单的词法分析器。 主要使用的库&#xff1a;正则表达式、tkinter 识别关键字&#xff0c;标识符&#xff0c;运算符&#xff0c;分界符&#xff0c;数字&#xff08;整数和浮点数&#xff09; 当以数字开头时报错&#xff0c;标识符超过8个字符长度时报…

词法分析器设计与实现

开篇 编译&#xff0c;简单的说&#xff0c;就是把源程序转换为可执行程序。从hello world 说程序运行机制 里面简单的说明了程序运行的过程&#xff0c;以及一个程序是如何一步步变成可执行文件的。在这个过程中&#xff0c;编译器做了很多重要的工作。对底层该兴趣的我&…

[编译原理]词法分析器的分析与实现

词法分析概述&#xff1a; 编译程序要对高级语言编写的源程序进行分析和合成&#xff0c;生成目标程序。词法分析是对源程序进行的首次分析&#xff0c;实现词法分析的程序成为词法分析程序(或词法分析器)&#xff0c;也称扫描器。像用自然语言书写的文章一样&#xff0c;源程…

词法分析器【编译原理】

实验内容&#xff1a; 基于TEST语言设计相应的词法输入器并且输出二元组 实验目的&#xff1a; 1、理解词法分析器的基本功能 2、理解简单的词法规则的描述方法 3、理解状态转化图及其实现 4、能够编写简单的词法分析器 实验原理&#xff1a; 根据DFA构造词法分析程序 1、…

词法分析器的实现

原文地址为&#xff1a; 词法分析器的实现 开篇 编译&#xff0c;简单的说&#xff0c;就是把源程序转换为可执行程序。从hello world 说程序运行机制 里面简单的说明了程序运行的过程&#xff0c;以及一个程序是如何一步步变成可执行文件的。在这个过程中&#xff0c;编译器…

词法分析器原理简介

词法分析器原理简介 词法分析器读取有字符串组成的输入流&#xff0c;并产生包含单词的输出流&#xff0c;每个单词都标记了其语法范畴&#xff08;syntactic category&#xff09;或类型&#xff0c;等效于英文单词的词类。为了完成这种聚集和分类操作&#xff0c;词法分析器…

编译原理——词法分析器 C++实现

词法分析器 实验目的单词分类表单词结构描述单词状态转换图算法描述程序结构源代码实验结果 实验目的 对C语言的一个子集设计并实现一个简单的词法分析器&#xff0c;掌握利用状态转换图设计词法分析器的基本方法。利用该词法分析器完成对源程序字符串的词法分析。培养团队合作…

词法分析器(纯c语言)

一、原文章&#xff1a;词法分析器&#xff08;分析C语言&#xff09; 二、该词法分析器种别码表 三、词法分析器实现思路描述&#xff1a; 1.首先用一个数组来存储txt文本中非空白字符&#xff0c;并将存储字符的个数记录下来。 2.用scan()函数扫描数组中的字符&#xff0c…

编译原理--词法分析器(python语言实现)

词法分析器 最近在学习编译原理。由于实验要求有词法分析器&#xff0c;这里我就先记录一下词法分析器实现过程以及具体思路。 目标语言 此处我选择的目标语言是c语言的子集来进行词法分析。 实现语言 此处我选用的语言是python&#xff0c;主要还是考虑到python的数据结构…

词法分析器--C实现

实验目的&#xff1a; 编制一个读单词过程&#xff0c;从输入的源程序中&#xff0c;识别出各个具有独立意义的单词&#xff0c;即基本保留字、标识符、常数、运算符、分隔符五大类(可自主添加类别)。并依次输出各个单词的内部编码及单词符号自身值。 程序及其子程序&#xff1…

c语言实现词法分析器

词法分析器的功能:输入源程序&#xff0c;输出单词字符。单词字符一般可以分为下面五种。 &#xff08;1&#xff09;关键字 是由程序语言定义的具有固定意义的标识符。有时称这些标识符为保留字或者基本字。例如c语言中的int,char,define,strcut,double,if,else.等等 &#xf…

词法分析器(分析C语言)

问题描述&#xff1a; 用C或C语言编写一个简单的词法分析程序&#xff0c;扫描C语言小子集的源程序&#xff0c;根据给定的词法规则&#xff0c;识别单词&#xff0c;填写相应的表。如果产生词法错误&#xff0c;则显示错误信息、位置&#xff0c;并试图从错误中恢复。简单的恢…

词法分析器(c++)

前景提示&#xff1a; 个人觉得单纯是用来完成实验报告的话还行&#xff0c;但仅做参考&#xff0c;因为本人的编程水平有限&#xff0c;怕误人子弟。 本次代码支持以下操作&#xff1a; 单行注释 多行注释 文件形式输入 种别码可以在文件中自由修改 单词字符串识别支持…

词法分析——词法分析器的作用

目录 综述 正文 1 词法分析与语法分析 2 词法单元、模式和词素 3 词法单元的属性 4 词法错误 综述 词法分析是编译的第一阶段。词法分析器的主要作用是读入源程序的输入字符、将它们组成词素&#xff0c;生成并输出一个词法单元序列&#xff0c;每个词法单元对应一个词素。…

词法分析器

词法分析&#xff08;Lexical Analysis&#xff09; 词法分析器在英文中一般叫做 Tokenizer。 有一个计算模型&#xff0c;叫做有限自动机&#xff08;Finite-state Automaton&#xff0c;FSA&#xff09;&#xff0c;或者叫做有限状态自动机&#xff08;Finite-state Machin…

编译原理——词法分析器

1 概述 设计、编制并调试一个简单的C语言词法分析程序&#xff0c;掌握利用状态转换图设计词法分析器的基本方法&#xff0c;利用该词法分析器完成对源程序字符串的词法分析。通过对该词法分析器的设计&#xff0c;加深对词法分析原理、状态转换图等编译原理知识的理解。 2 使…

编译原理词法分析器(C/C++)

前言&思路 词法分析器不用多说&#xff0c;一开始我还不知道是什么样的&#xff0c;看了下别人的博客&#xff0c;再看看书&#xff0c;原来是输出二元组&#xff0c;这不就是字符串操作嘛。然后细看几篇博客&#xff0c;发现大都是用暴力判断来写的。我对代码重复性比较高…

【编译原理】词法分析(C/C++源代码+实验报告)

文章目录 1 实验目的和内容1.1实验目的1.2实验内容 2 设计思想2.1单词种类及其正规式2.2 根据正规式构造NFA2.3根据NFA构造DFA2.3.1根据替换规则构造未化简的DFA2.3.2最小化DFA 3算法流程4源程序5调试数据5.1 测试样例一5.2 测试样例二5.3 测试样例三 6实验调试情况及体会6.1 实…

session 每次请求都会产生新的sessionID

问题描述&#xff1a; 最近在写一个项目时&#xff0c;在运行项目后每刷新一次都会产生一个新的Session ID&#xff0c;导致无法取值。 原因分析&#xff1a; 搞了很久发现是URL路径的问题&#xff0c;把http://localhost:8080//的双斜杠该为单斜杠就行了 解决方案&#xf…

JavaWeb - Cookie、Session、SessionId 详解

一、概述 会话&#xff08;Session&#xff09;跟踪是Web程序中常用的技术&#xff0c;用来跟踪用户的整个会话。常用的会话跟踪技术是Cookie与Session。Cookie通过在客户端记录信息确定用户身份&#xff0c;Session通过在服务器端记录信息确定用户身份。 本章将系统地讲述Co…