腾讯敏感词汇大全_腾讯数平精准推荐 | OCR技术之识别篇

article/2025/8/22 15:55:32

腾讯数平精准推荐(Tencent-DPPR)团队一直致力于实时精准推荐、海量大数据挖掘等领域的技术研发与落地。

在社交广告推荐领域,团队自研的深度在线点击率预估算法及全流程实时推荐系统,持续多年提升社交广告点击率。图像作为当前社交广告最重要的展示形式,文字识别、物体识别等图像理解技术能够有效加深对广告特征、广告主题、广告信息、用户偏好等方面的理解,令广告推荐业务更加精准。

作为理解广告图像的基石技术,OCR原意指光学字符识别(Optical Character Recognition),现泛指图像文字识别,即从图像视频中自动识别文字内容,属于AI计算机视觉的一个重要分支。移动互联网的爆炸式增长以及深度学习技术的普及,分别从业务需求与技术支撑两方面,进一步推动OCR领域发展。OCR技术可深入服务于广告推荐系统的图像内容提取、广告素材审核、广告图像创意、用户理解,等等。除广告业务外,OCR亦可应用于UGC图片视频过滤、医学影像识别、证件识别、文档识别、街景路牌识别,等等。

腾讯数平精准推荐团队在OCR领域深耕细作多年,自研的基于深度学习方法的文本检测与识别技术多次在国际权威ICDAR竞赛数据集上刷新世界纪录,特别是在2017年举办的第14届ICDAR官方竞赛中,斩获了“COCO-TEXT”和“医学文献图像”等极具挑战任务的4项冠军,再次证明了Tencent-DPPR团队在OCR领域的技术研发能力。业内主流OCR技术,通常分为文字检测与文字识别2个模块:通过检测算法定位到文本行,后通过识别算法阅读出文本行内容。本文将介绍Tencent-DPPR团队的文字识别算法。

一.相关工作

OCR识别模块属于多分类问题,对识别效果影响大的因素包括:复杂背景、艺术字体、低分辨率、非均匀光照、图像退化、字符形变、多语言混合、文本行复杂版式、检测框字符残缺,等等。对比英文识别,中文OCR具备更强挑战。例如英文数字可建模为62分类问题,若要识别中文10000个汉字,则需建模为10000分类问题。此外,中文的笔画复杂度、形近字数量、简繁体数量、版式排列、词语组合数量,都比纯英文识别挑战更大。

社交广告图片的部分挑战场景如图1所示:

72764ef0d662e9ced875b31b0bc84e5e.png

(图1)

社交广告图片中有挑战的文本行如图2所示:

b105b0f4d1e8dc96664151859740b914.png <

http://chatgpt.dhexx.cn/article/UQmirV8p.shtml

相关文章

小程序中关于敏感词汇检测

小程序审核增加敏感词汇校验&#xff0c;避免违法违规而被停用服务或者投诉。 本文例子引用的百度AI开发者提供的API&#xff1a; 链接位置&#xff1a;https://console.bce.baidu.com/ai/#/ai/ocr/overview/index 创建应用后生成应用对应的id和key 应用到小程序中,&#xff…

Python 如何检测敏感词汇

设计思路&#xff1a;根据敏感词库文件筛选&#xff0c;查看输入的文本中是否包含敏感词汇。从而过滤出相关的敏感词。 【阅读全文】 导入应用相关的模块。 import os import logging import sys导入UI界面相关的模块。 from PyQt5.QtWidgets import QApplication,QWidget,…

敏感词汇工具类sensitive word的使用及详解

简述&#xff1a; 1.平时工作中&#xff0c;只要涉及到用户可以自由发言&#xff08;博客、文档、论坛&#xff09;&#xff0c;就要考虑内容的敏感性处理,sensitive word工具是一个快速的敏感词过滤工具,基于 DFA 算法实现的高性能敏感词工具&#xff08;mirrors / houbb / s…

Python敏感词汇检测

只要思想不滑坡&#xff0c;办法总比困难多 昨天在写练习题的时候写到这点特别迷&#xff0c;一直绕不过这个弯&#xff0c;最后也算是成功实现吧&#xff0c;记录一下&#xff0c;防止下次再绕的出不来。 之前访问的的Github镜像站一直触发滥用检测机制&#xff0c;着实很烦…

敏感词汇检测

1、今天做测试的时候抓到一个数据包&#xff0c;发现一个txt文件&#xff08;CensorWords.b7e4bfb.txt&#xff09;&#xff0c;第一眼反应以为是系统被入侵了&#xff0c;被入侵者传了个txt到服务器上面&#xff0c;后面发现不对啊&#xff0c;攻击的话也不应该上传这种txt&am…

利用Python做简单的数据可视化

import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from pylab import mpl # 正常显示中文标签 mpl.rcParams[font.sans-serif] [KaiTi] # 正常显示负号 mpl.rcParams[axes.unicode_minus] Falseimport warnings warnings.filt…

Python做风险控制|找出形成环状投资的公司

大家好&#xff0c;我是小小明。 今天我将带大家利用python找到关系数据的环。先说下需求和背景&#xff1a; 需求描述 某投资机构需要考虑各公司的投资风险&#xff0c;手上一份各公司投资方向的数据&#xff0c;主要字段是投资者和被投资者。 而有部分公司并不是真的投资…

如何用Python做好友管理系统

--------------------------------------------------------总代码在最下面----------------------------------------------------------- &#xff08;1&#xff09;好友管理系统中不仅需要保存好友名称&#xff0c;还需要保存分组以及分组中的好友&#xff0c;因此&#xf…

怎么用python做网站?

python做网站方法步骤&#xff1a; 1、导入django包 可直接在pycharm下载&#xff0c;或者pip/easy_install Django是一个开放源代码的Web应用框架&#xff0c;由Python写成。采用了MTV的框架模式&#xff0c;即模型M&#xff0c;视图V和模版T。它最初是被开发来用于管理劳伦…

用python做一个简单GUI小软件

用python做一个简单软件 前言 这是一个课设&#xff0c;用python做一个扫描王软件 我主要做的GUI部分&#xff0c;记录分享一下。也是第一次用python做小软件&#xff0c;python的方便果然是名不虚传 遇到问题 1.python版本 下载了python3.7的编译器 由于最终软件要在wi…

手把手教你使用Python做数据分析

一、数据分析是什么 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析&#xff0c;将它们加以汇总和理解并消化&#xff0c;以求最大化地开发数据的功能&#xff0c;发挥数据的作用&#xff0c;使得数据的价值最大化 二、数据分析是做什么的 数据分析是为了提取…

你究竟能用Python做什么?

中英文模式阅读 中文模式阅读 英文模式阅读 What exactly can you do with Python? Here are Pythons 3 main applications. 你究竟能用Python做什么&#xff1f;这是Python的3个主要应用。 If youre thinking of learning Python --- or if you recently started learnin…

用Python做图像处理

用Python做图像处理 最近在做一件比较 evil 的事情——验证码识别&#xff0c;以此来学习一些新的技能。因为我是初学&#xff0c;对图像处理方面就不太了解了&#xff0c;欲要利吾事&#xff0c;必先利吾器&#xff0c;既然只是做一下实验&#xff0c;那用 Python 来作原型开发…

python都能做什么

前言 一、python&#xff1a; Python具有丰富和强大的库。它常被昵称为胶水语言&#xff0c;能够把用其他语言制作的各种模块&#xff08;尤其是C/C&#xff09;很轻松地联结在一起。常见的一种应用情形是&#xff0c;使用Python快速生成程序的原型&#xff08;有时甚至是程序…

你都用 Python 来做什么?

你们都用python做些什么呢&#xff1f; 在开发中 python 这一个语言就像是小叮当&#xff0c;而 python 的第三方库则是“百宝箱”&#xff0c;你只要想着对某一个方向进行开发&#xff0c;那么这个“百宝箱”就会给你想要的东西。 由于我是在开发多年后接触到的 python&#…

怎样利用python做一个软件,python可以自己做软件吗

python能做什么软件&#xff1f; 主要可以做小程序&#xff0c;爬虫程序&#xff0c;用于系统编程等等还是很广泛的。Python 的应用领域分为下面几类。下文将介绍一些Python 具体能帮我们做的事情。 但我们不会对各个工具进行深入探讨&#xff0c;如果你对这些话题感兴趣&…

python可以做什么工作-python都能干什么用

一、Python可以做什么&#xff1f; 1、数据库&#xff1a;Python在数据库方面很优秀&#xff0c;可以和多种数据库进行连接&#xff0c;进行数据处理&#xff0c;从商业型的数据库到开放源码的数据库都提供支持。例如&#xff1a;Oracle, My SQL Server等等。有多种接口可以与…

学了python能干啥举例-Python主要用来做什么?

Python主要用来做什么&#xff1f;Python可以做web应用开发、网络爬虫、AI人工智能与机器学习、处理数据用来分析、数据科学&#xff1a;包括机器学习、数据分析和数据可视化、脚本等方面开发。 Python用来开发的有&#xff1a; 1、做Web应用开发 在国内豆瓣一开始就使用Pyth…

python怎么算列表的平方_总算明了python如何求平方

总算明了python如何求平方 日期:2019-08-25 12:22:17 浏览:341 核心提示:打开电脑上的计算器一看,居然没法求平方,是不是就没办法了呢?用python就可以啦,那么python如何求平方呢?一起来了解下吧: python如何求平方 1.计算乘方 pow(4,3) #结果64 2.计算平方 import…

Python 计算平方根

Python 计算平方根 文章目录 Python 计算平方根平方根封装为函数相关博客 平方根 平方根&#xff0c;又叫二次方根&#xff0c;表示为〔√&#xffe3;〕&#xff0c;一个正数有两个实平方根&#xff0c;它们互为相反数&#xff0c;负数没有平方根&#xff0c;0的平方根是0 …