机器学习 数据预处理之数据打标签

article/2025/8/22 15:56:33

工作内容:

1.读取pdf文档内容

2.分页显示

3.每个数据后设置下拉框供手动打标签

4.数据录入txt文档

代码:

import math
import os
import tkinter as tk
from tkinter import *
import tkinter.ttk as ttk
from tkinter.messagebox import *
import time
import pdfplumber as pp# request:pip install pdfplumberclass GUI(object):def __init__(self):print('begin time:', time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(time.time())))self.resume_kinds = ('基础资料', '教育经历', '校园经历', '项目经历', '工作经历', '专业技能', '自我评价', '求职意向', '其他')self.file_list = [i for i in os.listdir(r'D:\hk\微信资料\OA测试简历\OA测试简历') if i.endswith('.pdf')]self.content, self.page_num = [], 0self.lb_text, self.cmb = [], []# 主窗口self.root = Tk()self.root.title('简历打标签')self.root.geometry("680x620")# 分页栏self.tab_main = ttk.Notebook()self.tab_main.place(relx=0.05, rely=0.1, relwidth=0.9, relheight=0.8)# 文件下拉框self.cmb_files = ttk.Combobox(self.root, state='readonly')self.cmb_files['value'] = self.file_listself.cmb_files.current(0)self.cmb_files.place(relx=0.3, rely=0, relwidth=0.3, relheight=0.05)# 文件选择提取按钮self.extract_butt = Button(self.root, text='提取', command=lambda: extract_file(self.cmb_files.get()))self.extract_butt.place(relx=0.61, rely=0, relwidth=0.05, relheight=0.05)# 数据录入按钮self.writein_butt = Button(self.root, text='录入', command=lambda: write_in())self.writein_butt.place(relx=0.5, rely=0.91, relwidth=0.05, relheight=0.05)# 文件选择提取按钮响应函数def extract_file(file):if file.endswith('.pdf'):self.content, self.page_num = [], 0self.lb_text, self.cmb = [], []# 获取文本内容path = 'D:\\hk\\微信资料\\OA测试简历\\OA测试简历\\' + fileprint('path:', path)pdf = pp.open(path)pdf.metadatapages = pdf.pagesfor i in pages:text = i.extract_text()lines = text.splitlines()self.content += linesprint(len(self.content))self.page_num = math.ceil(len(self.content) / 21)print('page_num:', self.page_num)self.tab_main.destroy()self.tab_main = ttk.Notebook()self.tab_main.place(relx=0.05, rely=0.05, relwidth=0.9, relheight=0.85)for i in range(self.page_num):tab = Frame(self.tab_main)tab.pack()labels_area = Frame(tab)cmbs_area = Frame(tab)labels_area.place(relx=0, rely=0, relwidth=0.9, relheight=1)cmbs_area.place(relx=0.9, rely=0, relwidth=0.1, relheight=1)self.tab_main.add(tab, text='%i' % (i + 1))for j in range(21):if i * 21 + j < len(self.content):lb = Label(labels_area, text=self.content[i * 21 + j])# lb.place(relx=0,rely=j/25,relwidth=1,relheight=1/25)lb.pack(anchor=E)self.lb_text.append(self.content[i * 21 + j].replace(' ',''))self.cmb.append(ttk.Combobox(cmbs_area, state='readonly'))self.cmb[-1]['value'] = self.resume_kindsself.cmb[-1].current(0)self.cmb[-1].pack()# 数据录入按钮响应函数def write_in():confirm = askyesno('提示框', '是否录入数据?(此操作会影响文本录入信息)')if confirm:with open('data.txt', 'a', encoding='utf-8') as f:for i in range(len(self.lb_text)):f.write(self.cmb[i].get() + '     ' + self.lb_text[i] + '\n')print('录入成功')print('finish time:', time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(time.time())))self.root.mainloop()if __name__ == '__main__':gui = GUI()

界面展示:

 


http://chatgpt.dhexx.cn/article/IvZO0wAR.shtml

相关文章

Excel中批量生成标签,批量打印标签。按指定模板批量打印标签

&#xff11;.问题概述 工作中经常需要将产品明细表转换成标签&#xff0c;贴在送货单上&#xff0c;或者将学生成绩转换成标签打印出来发送给学生。 例如在下图中有若干产品的送货信息&#xff0c;要求按图2的模板批量打印。 图1 送货信息 图2 标签模板 要实现此类需求&…

SVN打标签方法及在此过程中的问题处理

所谓的“打标签”&#xff0c;我个人的理解是&#xff1a;项目取得了阶段性成果&#xff0c;需要保存在标签&#xff08;tags文件夹&#xff09;中&#xff0c;以备不时之需。我采用的打标签的方法是&#xff1a; 1、在SVN客户端打标签。前提是本地项目与SVN Server上的项目无…

图片打标签labelimg

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、Windows安装二、使用步骤1.在cmd命令行中创建一个新的环境2.对图片打标签3.保存打标签的图片4.如何打开已经安装的labelimg 总结 前言 对图片打标签是数据…

使用Labelimg打标签

1.下载Labelimg &#xff08;1&#xff09;打开cmd命令行 用Windowr打开命令行&#xff0c;输入cmd命令。 &#xff08;2&#xff09;输入命令 pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple -i的后半部分是清华镜像源地址。 &#xff08;3&#xff…

使用BarTender连接Excel打印标签

一、准备Excel内容 比如我这里设计的是产品信息表内容如下: 二、设计标签样式 详细的设计标签样式操作请参考:获取BarTender10.1和新建一个BarTender模板 三、连接Excel数据库 3.1、选中任意需要填充数据的组件,打开属性面板 3.2、选择属性面板中数据源下的组件名称,点…

使用labelme打标签,详细教程

做图像语义分割&#xff0c;打标签时需要用到labelme这个工具&#xff0c;我总结了它的详细使用教程。 目录 一、安装labelme工具二、文件位置关系三、labelme工具四、labelme工具的快捷键五、代码&#xff08;将标签文件转为统一固定格式&#xff09;六、总结 一、安装labelm…

深度学习中常见的打标签工具和数据集资源

深度学习中常见的打标签工具和数据集资源 一、打标签工具1. labelimg/labelme1.1 搭建图片标注环境&#xff08;win10)(1) 安装anaconda3(2) 在anaconda环境python3下搭建labelImg环境 1.2 打标签1.2 搭建图片标注环境&#xff08;ubuntu18.04)1.3 快捷键 一、打标签工具 1. l…

自训练数据集打标签注意事项及使用工具推荐

盘点自训练数据集如何打标签&#xff01; 一、打标签规则 二、推荐工具 使用心得 前言 分享我在训练自己的数据集前期所碰到的一些问题&#xff0c;希望大家能及时避雷&#xff01; 一、打标签规则 由于我使用YOLOv5模型&#xff0c;查询官方建议以及网上各路大神总结的经…

深度学习中常见的打标签工具和数据集集合

集大家之所长汇集于此&#xff0c;希望对有需要的你能有所帮助。 一、打标签工具 &#xff08;1&#xff09;labelimg/labelme 这两款工具简便易行&#xff0c;前者主要用于对目标进行大致的标定&#xff0c;用于常见的框选标定&#xff0c;后者主要用于较为细致的轮廓标定&…

C 语言开发环境

一.环境介绍 1.Mac 平台直接下载苹果商店Xcode,该集成开发工具使用的是clang 开源编译器 2.Windows 可以使用Code Blocks&#xff0c;当初笔者上学时使用的还是非常老旧的VC6.0,尤其是对于变量的定义是非常痛苦的一件事。code blocks 是一个集成开发环境&#xff0c;在安装过…

C语言开发环境,请查收

C语言开发环境的选择&#xff0c; 貌似是告诉我们&#xff0c;工欲善其事&#xff0c;必先利其器。 01、Visual Studio Visual Studio&#xff08;简称 VS&#xff09;&#xff0c;它是 Windows 下的标准 IDE&#xff0c;VS系列为IDE&#xff08;集成开发环境&#xff09;&am…

vs配置C语言环境

vs配置C语言环境 仅仅粗略地记录我在配置过程中踩的坑 首先我是参考这篇博文配置的&#xff01;VSCode配置C语言环境&#xff08;完整版&#xff09;VSCode配置C语言环境&#xff08;完整版&#xff09; 但是按照这个配置完毕后&#xff0c;按F5运行时&#xff0c;生成的echo …

Linux下C语言开发环境的搭建

版权声明&#xff1a;本文为博主原创文章&#xff0c;遵循 CC 4.0 BY-SA 版权协议&#xff0c;转载请附上原文出处链接和本声明。 本文链接&#xff1a; https://blog.csdn.net/liubing8609/article/details/82695528 GCC编译器简明教程&#xff08;Linux下C语言开发环境的搭…

1-C语言开发环境的搭建

C语言开发环境的搭建 如果您想要进行C语言的开发学习&#xff0c;首要的是先在你的电脑上搭建一个C语言的开发环境。C语言的开发环境主要包括两个部分&#xff1a; 文本编辑器C编译器 文本编辑器 文本编辑器我们有很多选择&#xff0c;最常见的有Windows Notepad&#xff0…

C语言常用开发环境IDE

C语言常用开发环境IDE WindowsMACLinux跨平台Visual Studio CodeCodeBlocksQt 在windows,Mac,Linux等平台分别展开&#xff0c;C语言常用的开发环境IDE&#xff0c;在Windows中有Visual Studio&#xff1b;在Mac中有xcode&#xff1b;在Linux上&#xff0c;有vi,vim等等&#x…

c语言程序运行环境

目录 程序运行环境 翻译环境和执行环境 从源代码到可执行程序的几个阶段 翻译环境的执行中的编译和链接 预编译 编译 汇编 链接 运行环境 程序运行环境 在学习c语言中我们是否有这样的困惑&#xff0c;我们平常写代码&#xff0c;但是我们一开始就会很好奇&#xff0c;…

C语言开发环境搭建过程

标题C语言开发环境搭建过程 前言&#xff1a;C语言是目前嵌入式软件开发的主要语言&#xff0c;学习C语言可以直接面向产品做定制化开发&#xff0c;长远来看&#xff0c;优秀的嵌入式开发人员需要同时具备C开发和python测试的能力&#xff0c;C是一门经久不衰&#xff0c;值得…

VS2019搭建C语言开发环境(图文教程)

来源&#xff1a;微信公众号「编程学习基地」 文章目录 VS2019搭建C语言开发环境环境测试代码 VS2019搭建C语言开发环境 双击VS2019&#xff0c;选择创建新项目 选择项目类型为空项目 搜索框输入空项目进行搜索 或者选择C Windows 控制台找到空项目 输入项目名称&#xff0…

第1章 Window下VSCode的C语言开发环境搭建 (一)

文章目录 文档视频讲解链接地址第01章 开发环境搭建1.1 C语言开发环境搭建1. 常用的C语言开发环境介绍VC 6.0VS 2019ClionDevCvim编辑VSCode 2. Window下VSCode安装和配置C/C环境Visual Studio Code(VSCode)的介绍下载VSCode安装VSCode安装中文插件安装Mingw64 的gcc编译器安装…

c++开发环境安装

目录 1、下载软件 2 安装软件 3、创建项目 4、创建文件 5、编写代码 1、下载软件 1、Visual Studio: 面向软件开发人员和 Teams 的 IDE 和代码编辑器 2、进入Visual Studio 官网后&#xff0c;选择 下载Windows版&#xff0c;并选择Community 2022 社区版本进行下载 3、…