用户评论观点抽取

article/2025/10/13 15:32:10

1.目的:从用户的订单评论里,抽取观点,进行标签化,此标签可以用来作一些辅助决策或者填充到用户画像体系里。

其实评论挖掘的主要有两个部分,观点抽取和情感判断,主要的作用还是间接或直接引导用户购买意向,像淘宝,京东类似的智能展示。而评论的主语都是商家,但如果平台即是商家的话,展示评论观点就会显得比较鸡肋,因为不可能展示对自身不好的评论。因此在这种情况下,评论挖掘的意义更在于知道用户对商家的反馈,建模统计用户对商家的关注点是什么,例如是对商家的服务、价格还是app应用的反馈问题,知道这些,可以更好的对产品进行更好的决策和更改。

参考书籍:https://pan.baidu.com/s/1aHP7q8ktJWSVhTBRiziECw,美团机器学习实践。

2.例子:

             输入:车子价格优惠,车况良好,服务态度很好,很周到。

             输出:价格优惠、车况不错、服务好

3.方案:

a.刚开时我做的时候,是先调用了百度AI平台的观点抽取,发现不怎么好用,可能是我所在行业所导致的,有很多大量的专有词汇。

b.评论标签化,可以看成noun+adj,也就是名词和描述性词汇的结合。有一个大众的做法,就是通过依存句法分析来进行匹配,然后word2vec向量化+dbscan聚类,就可以做到类似淘宝那种评论观点显示,例子:

输入:服务很到位   

依存句法分析输出后:主谓关系:服务,状中结构:很,核心关系:到位

可以看出最终的结合是主谓关系+核心关系,就可以将评论观点抽取出来。不过这种方法问题还是很大,实际运用时,不能单单只靠依存句法分析来处理,会出现很多问题的。

c.首先得建立独有的词表(跟自己行业有关),比如名词词表,像我的行业里,独有的有车况,取车,还车,手续之类独有的,描述性词表同理(这个手动去挑选比较好,如果词典比较大,再用代码去挑选)。注意:有些词汇出现的频率非常高,但是其不是名词,也不是形容词的话,这种情况要单独挑选出来处理,以免纰漏。

两个词表建立完以后,可以通过word2vec去将相似的词汇进行聚类统一(实际运用时还不如直接人工简单粗暴的好用)。这两个词表在去结合依存句法分析来进行提取,就会比较准确。

d.评论最后都抽取完以后,就可以进行统计分析了,或者出于业务角度来进行应用。

          


http://chatgpt.dhexx.cn/article/K7Zpo8FL.shtml

相关文章

京东API分享:获取京东商品评论接口

接口名称:item_review-获得JD商品评论 接口背景介绍: 京东是一家中国知名的综合性电商平台,成立于1998年。作为中国最大的B2C在线零售商之一,京东提供了包括电子产品、家居用品、服装配饰、食品饮料等在内的广泛商品选择。为了…

京东用户行为分析

京东用户行为分析 项目背景 京东作为传统电商巨头,京东商城与京东物流的发展相得益彰,然而各种新兴的电商模式,带来了千人千面的购物方式和电商平台更加激烈的竞争,电商平台发展初期的粗放式经营也转向了利用大数据和算法&#…

京东商城评论爬虫

一、前言 基于评论信息做情感分析模型第一步,收集数据。这里准备抓取京东商城的物品评论,大致可以分为两步。 1、获取商品id 2、获取商品评论 二、实战 接下来的代码都基于scrapy框架编写,请确保已经了解scrapy基础知识。 1、获取商品i…

京东商品及评论 数据采集

好吧,下面的爬虫是同步的,其实可以用协程来写,效率会增加很多! 对京东的商品基本信息,产品参数,商品评论进行采集 使用BeautifulSoup解析 注意:由于每个产品的评论只能采集100页,为…

爬虫京东评论+可视化

前期工作 选取一个网站,最好是教育网站,因为教育网站很少有反爬虫机制。 在网站内打开开发者工具,不同的浏览器开发者工具也不同,但都大同小异(这里使用的是谷歌)。 在开发者工具中确定你要爬虫的部分,找到我们爬取数…

京东手机评论的爬取

开篇 做论文的时候,最多接触的就是标准的数据集,几乎不需要太多的结构化处理,下载下来就是可以直接加载使用的数据,课题是有关评论分析的,但是论文针对的都是英文数据,而国内电商平台其实积累了大量的评论…

京东也做社交电商了

不知道大家有没有注意到,这两天朋友圈好像被京东商品给刷屏了, 身边不少大佬朋友都通过【芬香】在朋友圈带货。 我作为一个IT技术男,对于新出现的事物,自然也去研究了一番。下面就把我了解的信息分享给大家。 1、什么是「芬香」&a…

主存与内存

计算器内存条采用的是DRAM(动态随机存储器),即计算机的主存。我们通常所说的内存容量即指内存条DRAM的大小。 但是,严格地说,内存是包括主存与高速缓存(Cache,基于SRAM)的。可能是由于Cache相较内存条容量很小,毕竟内…

CPU/内存分析

一、概念理解 程序运作原理:一个请求发送到服务器,首先经过网卡,然后通知cpu有待处理任务,CPU去运行操作系统指令,根据请求的端口号,找到对应的应用程序代码,安排线程去处理;由于程…

linux服务器查看cpu和内存

一、服务器CPU情况 1 查看物理CPU个数 cat /proc/cpuinfo | grep "physical id" | sort | uniq | wc -l 2 查看服务器CPU内核个数 cat /proc/cpuinfo | grep "cpu cores" | uniq 3 查看虚拟机查看核数 grep processor /proc/cpuinfo|wc -l 4 查看cpu内核频…

计算机中CPU是如何与内存交互的

这篇文章主要整理了一下计算机中的内存结构,以及 CPU 是如何读写内存中的数据的,如何维护 CPU 缓存中的数据一致性。什么是虚拟内存,以及它存在的必要性。如有不对请多多指教。 概述 目前在计算机中,主要有两大存储器 SRAM 和 D…

CPU访问内存

首先我们需要一个引子,引子如下: 作为一个计算机领域的工程师,这里有一个问题:有一个10米深的水池需要测量其水深,并在计算机(或者微机)上显示测量结果,保留小数点后一位。请概要的设…

计算机cpu、寄存器、内存区别

1、寄存器是中央处理器内的组成部分。它跟CPU有关。寄存器是有限存贮容量的高速存贮部件,它们可用来暂存指令、数据和位址。在中央处理器的控制部件中,包含的寄存器有指令寄存器(IR)和程序计数器(PC)。在中央处理器的算术及逻辑部件中,包含的…

CPU、内存、磁盘性能监控

CPU监控 网络由设备、服务器、路由器、交换机和其他网络组件组成。CPU 是网络中所有硬件设备的组成部分。它负责设备的稳定性和性能。企业严重依赖网络,企业硬件的处理能力决定了网络的容量。随着 CPU 功能和硬件的快速发展,组织必须规划其容量并监控其…

内存、CPU、硬盘

目录 内存虚拟内存 硬盘扩充内存和硬盘CPUCPU 频率CPU 高速缓存CPU三级缓存缓存行 CPU-内存的工作原理 内存 内存是外存与CPU进⾏沟通的桥梁,计算机中所有程序的运⾏都在内存中进行。 内存(Memory)也称内存储器和主存储器,它用于暂时存放CPU中的运算数据…

内存、CPU、显存、GPU

底盘中经常会出现资源、算力等词语,对于里面的CPU、内存、GPU、显存,究竟是什么,这里主要对此进行一个基础认识。 一、内存 内存(Memory)也被称为内存储器,主要用来暂时存放CPU中的运算数据及与硬盘等外部存储器交换的数据。只要…

CPU 与 内存

CPU 与 内存 CPU控制器控制单元指令译码器指令寄存器 运算器ALU算数运算器逻辑运算器 寄存器L1,L2数据寄存器,程序计数器,段寄存器,通用寄存器,标志寄存器 内存 CPU 控制器 控制单元 时序控制,指令控制 …

cpu与内存的工作原理

计算机最核心的俩大部分:cpu和内存。哪它们之间有什么联系呢? 程序是在内存里运行的,程序要运行语句需要cpu发出指令给程序,程序收到指令后就会找到main方法,把执行语句的指令和需要的数据分别给cpu里的pc和registers…

cpu和内存

CPU ( Central Processing Unit )是一块超大规模的集成电路板,是计算机的核心部件,承载着计算机的主要运算和控制功能,是计算机指令的最终解释模块和执行模块。硬件包括基板、核心、针脚,基板用来固定核心和针脚&#…

CPU、内存、缓存的关系

术语解释 (1)CPU(Central Processing Unit) 中央处理器 (2)内存 内存用于暂时存放CPU中的运算数据,以及与硬盘等外部存储器交换的数据。它是外存与CPU进行沟通的桥梁,内存的运行决定…