如何去做词频统计和关键词共现分析

article/2025/3/14 20:28:35

1 对关键词的词频进行统计

下面展示一些 内联代码片

# encoding=utf-8
import openpyxl
wb = openpyxl.Workbook()
wb = openpyxl.load_workbook('copy1.xlsx')       # Excel名
sh = wb['all']                              # sheet名
'''
换一种写法
row=sh.max_row                             # 得到行数
'''
cons=[]  # 将所有数据append成一个list
for cases in list(sh.rows)[1:9240]: # 行数,也可以通过代码来带入 即rowcase_D = cases[2].value         # 关键词所在的列cons.append(case_D)   result_new = []
res2 = []
for con in cons:fenci = con.strip().split('; ') # 假定关键词是以分号+空格分开的result_new.append(fenci)
new = sum(result_new,[])
res2.append(new)
#print(res2)  # res2的形式是   [['aaa','bbb','abc']]import collections
dic = collections.Counter(res2[0])from openpyxl import Workbook
workbook = Workbook()
i=2                          # 默认sheet
sh = workbook.active
sh.title = "count"           #sheet名     
for key in dic:sh.cell(row=1, column=1, value='关键词')sh.cell(row=1, column=2, value='频次')    sh.cell(row=i, column=1, value=str(key))sh.cell(row=i, column=2, value=dic[key])i+=1
workbook.save(r'name.xlsx')

2 统计词共现的全部代码

注意,'一行作者.txt’这个文件必须是每篇文献的作者之间通过//连接成一行,合作作者通过分号+空格连接。

import pandas as pd
import numpy as np
from openpyxl import Workbookdef authors_stat(co_authors_list):au_dict = {}  # 单个作者频次统计au_group = {}  # 两两作者合作for authors in co_authors_list:authors = authors.split('; ')  # 按照逗号分开每个作者authors_co = authors  # 合作者同样构建一个样本for au in authors:     # 统计单个作者出现的频次if au not in au_dict:au_dict[au] = 1else:au_dict[au] += 1# 统计合作的频次authors_co = authors_co[1:]  # 去掉当前作者for au_c in authors_co:A, B = au, au_c  # 不能用本来的名字,否则会改变au自身if A > B:A, B = B, A  # 保持两个作者名字顺序一致co_au = A+'; '+B  # 将两个作者合并起来,依然以逗号隔开if co_au not in au_group:au_group[co_au] = 1else:au_group[co_au] += 1return au_group, au_dictif __name__ == '__main__':f1 = open('一行作者.txt','r',encoding = 'utf-8')cons = f1.read()co_authors = consco_authors_list = co_authors.split('//')au_group, au_dict = authors_stat(co_authors_list)workbook = Workbook()i=2   # 默认sheetsh = workbook.activesh.title = "count"for (k,v) in  au_group.items(): sh.cell(row=1, column=1, value='合作作者')sh.cell(row=1, column=2, value='频次') sh.cell(row=i, column=1, value=str(k))sh.cell(row=i, column=2, value=v)i+=1workbook.save(r'co_author.xlsx')

在这里插入图片描述
下次教画图。

接下来就是愉快的分析啦。
over is Over——Lee


http://chatgpt.dhexx.cn/article/VZtmxw60.shtml

相关文章

python3---情感分析(基于词典中文)

写在前面: 现有的情感分析比较常用的有两种,分别是基于词典的和机器学习,前者也属于非监督学习,后者自然一般属于监督学习。 刚开始学情感分析,下面先从**【基于词典的情感分析】**开始进行: 词典&#xf…

如何利用情感词典做中文文本的情感分析?

如何利用情感词典做中文文本的情感分析? 这是本学期在大数据哲学与社会科学实验室做的第四次分享了。 第一次分享的是:如何利用“wordcloudjieba”制作中文词云? 第二次分享的是:如何爬取知乎中问题的回答以及评论的数据&#…

基于情感词典的文本情感分析(一个最简单的举例能直接运行)

1. 使用情感词典进行情感分析的思路为 1) 将Web文本进行分句,使其以句子为单位进行处理;2) 从分句中抽取连词和否定词,并标记相应连词与否定词位置;3) 访问情感词汇本体,确定词汇极性…

Python利用情感词典做情感分析

情感分析是大数据时代常见的一种分析方法,多用于对产品评论的情感挖掘,以探究顾客的满意度程度。在做情感分析时,有两种途径:一种是基于情感词典的分析方法,一种是基于机器学习的方法,两者各有利弊。 在此&…

共现分析

一、共现分析概念 “共现”指文献的特征项描述的信息共同出现的现象,这里的特征项包括文献的外部和内部特征,如题名、作者、关键词、机构等。 而“共现分析”是对共现现象的定量研究, 以揭示信息的内容关联和特征项所隐含的知识。 二、共…

python基于情感词典的情感分析

今天给大家分享的是通过情感词典来对文本进行情感分析最后计算出情感得分 通过情感得分来判断正负调性 主要步骤: 数据准备 本次情感词典采用的是BosonNLP的情感词典,来源于社交媒体文本,所以词典适用于处理社交媒体的情感分析 本次分析准备的…

python 热词分析_Python笔记:热词分析2020-01-01

热词分析在公众趋势分析、舆情分析有很宽广的应用,我们来看看怎么从一个TXT文件中分析出文章的热词出来,我们采用流行的第三方“结巴”包来实现。 首先安装第三方包(matplotlib,jieba,wordcloud,numpy)mmatplotlib主要…

【共词聚类分析】基于CNKI和WOS的小样本稳健性检验

很久之前的一篇文章,最近终于收到了Reviewers的回复(一把心酸…其中有一个Comments如下,意思是我们原先的文章没法证明共词聚类方法的结论是合理的…于是打算新增加一个稳健型检验(robust analysis),由于上…

python共词矩阵分析结果一步到位

import os import re import pandas as pd from PyPDF2 import PdfFileReader import string import yakeif __name__ __main__:# 运行第一部分代码pdf_files_path C:/Users/win10/Documents/美国智库/pdf_files# 定义一个函数,用于读取PDF文件并将其转化成文本de…

共词分析

一、共现分析概念及主要类型 “共现”指文献的特征项描述的信息共同出现的现象,这里的特征项包括文献的外部和内部特征,如题名、作者、关键词、机构等。而“共现分析”是对共现现象的定量研究,以揭示信息的内容关联和特征项所隐含的知识。常…

AD09由英文改中文菜单步骤

1:打开AD09,点击DXP,选择Preferences 2:在对话框的左边一竖列选择General 3:选择左边竖列后,在右边找到Localization选项 4:点击应用,再点击OK。 5:然后关闭AD09&#xf…

AD软件的常用基本设置

AD软件的基本设置 前言 工欲善其事,必先利其器;最近学弟一直在忙着画板子,但是效率非常低,在看过他的软件基本设置,以及对软件快捷键掌握程度后(新手小白),我决定将常AD的常用基本…

STM32定时器做时钟源输出基于CubeMx

目录 前言 CubeMX配置 开始函数 改变频率 改占空比 结论 前言 调试使用的评估板:https://item.taobao.com/item.htm?spma230r.1.14.17.432b1562F8z658&id612002664117&ns1&abbucket14#detail 作者再调试AD5933过程中,需要输出100Hz…

Evaluation Board User Guide UG-364 文档 BUG

最近作者使用这个芯片;在进行硬件性能对比测试中发现ADI文档中的一个小问题; 相位角计算的过程中,就是下图 结合下面的代码,验证了上面文档应该是手误导致的。

2019年全国大学生电子设计竞赛D题简易电路特性测试仪试题

题目要求部分 我负责的部分就是测量阻抗的部分,这一次我使用的是AD5933 AD5933介绍 我这一篇主要是讲使用5933计算那个待测电路的阻抗值,首先就是在概括处已经说明是我们读取的数据其实是一个实部和一个虚部。 然后我们要记住的是向寄存器0x94&#xf…

电赛专题 |国一作品_线路负载及故障检测装置

有幸邀请到了在2019大学生电子设计大赛的获奖优秀队员为本公众号投稿,将分几次推文为大家介绍几只优秀队伍的作品。 本次推文为大家分享西安电子科技大学微电子学院的团队的作品,团队成员为:蒋昊宇 冯郑 张岳琦(排名不分先后&…

智能电导率系统电路设计详解

电导率是一个衡量水溶液导电能力的电学物理量, 电阻率的倒数为电导率,用希腊字母κ表示,κ1/ρ。一般意义上,电导率的测量温度是标准温度(25℃)。在液体中,水的电导率是衡量水质的一个重要指标。…

AD5934阻抗变换模块实验电路板

■ 前言 本文讨论了基于AD5934构建阻抗变换模块。并对于它测试相应的阻抗进行实验。 01电路设计 1.原理图设计1 ▲ 实验电路板 原理图 2.PCB版图 ▲ 实验电路板PCB 电路板输出接口从右到左,前四个的功能定义如下表。后面四个是用于调试使用。 管脚(从右到左)符号功…

使用AD5933测量元器件的谐振特性

■ 前言 元器件的谐振特性 使用 使用AD5933测量电子器件复阻抗 测量元器件的谐振特性。这里记录了一些相应的的电子实验的数据。以备之后进行复习和参考。 01测量电路 在 使用AD5933测量电子器件复阻抗 中给出了直接测量一些元器件(电阻、电容)的结果。…

AD5933测量容性负载时的神秘振荡信号

■ 问题简介 在博文 使用AD5933测量电子器件复阻抗 中,对于电容负载进行测量的时候,发现测量的结果与理论值严重不符。 除了出现了增大的测量输出值(与前面电阻相对比),还有一些非常不规则的输出结果。 计时在小信号…