百度内容审查做敏感词库筛选

article/2025/9/19 13:00:52

最近在做项目的敏感词库筛选更新。笔者最终的目标是通过百度API将现有的敏感词库筛选更新成。

一、准备工作

读者需在百度智能云登陆账号,然后开通百度内容审核功能,然后根据API Key和Secret Key可以获得调用接口所需的access_token。

二、代码调用API进行筛选

获得API后就是写代码进行筛选了,笔者Python代码如下:

import requests
import json#获取审核结果
def get_result(data_str):params = {'text': data_str}request_url = 'https://aip.baidubce.com/rest/2.0/solution/v1/text_censor/v2/user_defined?access_token=【此处写你自己的token】'result = requests.post(request_url, headers={'Content-Type': 'application/x-www-form-urlencoded'}, data=params).textpredict_res = json.loads(result)print(predict_res)return predict_res['conclusion']#读取待测文本
def get_txt():with open('./待筛选文本/po/drug.txt', 'r', encoding='utf-8') as f:with open('./筛选结果/drug_检测失效.txt', 'a', encoding='utf-8') as f_err:with open('./筛选结果/po/drug.txt', 'a', encoding='utf-8') as f_result:for line in f:#             print(line.replace('\n',''))result = get_result(line.replace('\n',''))if result == "疑似":f_result.write(line)elif result == "不合规":f_result.write(line)elif result == "合规":print(line.replace('\n','')+"检测结果为合规")else:print(line.replace('\n','')+"检测失效")f_err.write(line)
#主函数
if __name__ == '__main__':get_txt()print("筛选结束")

三、筛选结果

敏感词筛选分为两个部分:中文敏感词和藏文敏感词。中文部分的敏感词除了分为六个大类外,还将敏感词分为正向敏感词和负向敏感词。藏文敏感词则只是将敏感词分为六个大类,未分正负向:

筛选前后的敏感词库已经上传到CSDN,需要的读者可自行下载:https://download.csdn.net/download/m0_37872090/12274456

该词库仅用于技术测试,严禁用于违法活动!


http://chatgpt.dhexx.cn/article/8YtrIgNo.shtml

相关文章

敏感词过滤之——自定义构建查询词库与快速查询实现

关于敏感词过滤的一点思考与实践 业务场景思考与研究逻辑分析代码实现(php)构建敏感词树分割字符串敏感词树长分支的递归实现读取敏感词库 敏感词树的查询查询实现调用 测试、分析与总结 业务场景 最近在公司维护的小程序上,遇到一个需要用到敏感词过滤功能的业务模…

计算机网络网络协议与网络结构

协议三要素 语法syntax:数据与控制信息的结构与格式,信号与电平 语义semantics:发出何种信息,做出何种响应,差错控制 时序timing:事件顺序 网络边缘 客户/服务器应用模型client/server:如we…

互联网网络协议 网络三种连接方式描述

学习笔记 目录 网络三种连接方式描述 子网掩码 网络三种连接方式描述 桥接模式: 使用外部统一网段,虚拟机可以和外部系统通讯,但是容易照成IP冲突 NAT模式: 网络地址转换模式,虚拟系统可以和外部系统通讯,不造成IP冲突,外部地址不能访问内部虚拟系统应为虚拟系统是通过代理…

计算机网络 协议三要素

1. 语法:数据与控制信息的结构或特点 2.语义:需要发出何种控制信息,完成何种动作以及做出何种响应 3.同步:事件实现顺序的详细说明 例题:

网络协议 -- 最全的网络协议图

转载自:http://www.52im.net 图片较大,建议单击放大或者下载后查看

计算机术语mls指什么意思,了解计算机网络协议的原则与要素两者

计算机网络协议是有关计算机网络通信的一整套规则,或者说是为了进行数据交换而制订的规则、约定和标准。网络协议由语法、语义和时序三大要素组成。现在就跟着小编共同来学习一下:了解计算机网络协议的原则与要素两者。 想必不需要小编多说,大…

网络协议介绍

一、什么是协议 协议,就是大家共同遵守的一些约定,协议是一种约定,是指通信双方共同指定的一个标准约定 举两个例子: 例子1:一个宿舍的人来自五湖四海,开学来到宿舍后,如果大家都说自己家乡的…

计算机网络协议层次

计算机网络学习的核心内容就是网络协议的学习。网络协议是为计算机网络中进行数据交换而建立的规则、标准或者说是约定的集合。计算机网络协议同我们的语言一样,多种多样。 为了给网络协议的设计提供一个结构,网络设计者以分层的方式组织协议。 一个协…

网络协议是什么 网络协议三要素是什么

本文向大家详细介绍网络协议是什么以及网络协议三要素是什么的基础知识,不懂的朋友可以通过本文了解学习 网络协议是什么 网络协议的定义:为计算机网络中进行数据交换而建立的规则、标准或约定的集合。 一个网络协议至少包括三要素: 语法:用来…

常见网络协议

一、网络协议 二、TCP(Transmission Control Protocol,传输控制协议) TCP头格式 TCP协议中的三次握手和四次挥手 TCP报文抓取工具三、HTTP(HyperText Transfer Protocol,超文本传输协议) 请求报…

网络通信的三要素

一、要素一:IP地址 设备在网络中的地址,是唯一的标识。 IP地址: IP(Internet Protocol):全称”互联网协议地址”,是分配给上网设备的唯一标志。 常见的IP分类为:IPv4和IPv6 I…

计算机中的网络协议包括哪些,网络协议三要素有什么关系

网络协议三要素有什么关系?为进行计算机网络中的数据交换而建立的规则、标准或约定的集合,协议总是指某一层的协议。准确地说,它是对同等层实体之间的通信制定的有关通信规则或约定的结合。佰佰安全网看看吧。 一个网络协议至少包括三要素: 语法&#x…

网络协议概述(一)

目录 一、协议三要素 二、常用的网络协议 2.1 由url确定目标ip地址(DNS协议) 2.2 打包需要发送的信息(http/https协议) 2.3 有应用层到传输层(TCP协议保证应用层包一定送达) 2.4 有传输层到达网络层&…

推荐:大视频免费压缩成指定大小的小视频的解决方法

给大家推荐一款好用的视频压缩软件MOO0视频压缩器,免费压缩,可选压缩画质,小巧便捷,这款软件不像某捷、某云这些软件,不花钱的话你是没办法压缩大文件的 云盘下载: 链接: https://pan.baidu.com/s/1ZUOi7…

如何下载网页中的小视频

想要下载页面中的视频,但是页面中却没有下载选项?教你一招 具体步骤: 一、打开开发者工具。 二、打开网络窗口。 三、刷新页面。 四、右键链接在新标签页中打开。 五、在右下角找到下载选项。 一、开发者工具是用于审查网页元素和查看网页源代…

视频观看小站

[在此处输入文章标题] 这种网站,永远不嫌多~ 视频小站,一次性满足所有观影需求! 低端影视:https://ddrk.me/ 优点:1080P全高清均可观看,无广告,支持站内搜索,观影体验不错。 http:/…

如何压缩视频?教你几个简单的视频压缩方法

怎么将视频给压缩一下呢?通过压缩视频,可以减小视频的大小,从而减少需要存储的视频体积,节省存储空间。虽然视频压缩可能会降低视频的清晰度,但是如果压缩比例得当,仍然可以保持较好的视频观看质量&#xf…

爬取福利吧论坛所有的福利汇总文(视频标题链接、图片)

目录 items.py flhz.py pipelines.py 目标:爬取 福利吧论坛 里的 福利汇总 文,将所有 福利汇总 文里的热门视频标题、链接以json格式保存,所有 福利汇总 文里面的图片按目录(目录名为当前图片所在页url中的7位数字&#xff0…

iPhone上5款视频压缩工具推荐,学会轻松压缩视频

随着技术的不断进步,现在移动端设备已经能够轻松地拍摄高清视频,然而这也带来了存储压力的增大。苹果手机更新换代频繁,但内存空间却没有跟着变大,因此如何压缩视频成为了一个重要的问题。 苹果手机怎么压缩视频?有什…