python处理数据的一些代码

article/2025/3/17 18:54:24

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 一、如何读取txt文件,将其转化为DataFrame格式
  • 二、给DataFrame添加列名
  • 三、删除指定行
  • 四、读取csv文件,不让第一行成为列名
  • 五、读取DataFrame的第几行第几列
  • 六、读取数据时,删除含有空值的行或列
  • 七、将dict数据存储到txt中
  • 八、DataFrame 按照条件删选数据
    • 九、使用SVM训练鸢尾花数据集中的一些函数用法


一、如何读取txt文件,将其转化为DataFrame格式

f = open("G:\\prediction\\BIOGRID-ORGANISM-Homo_sapiens-4.4.204.tab3.txt","r",encoding='utf-8')   #设置文件对象
result=[]
for line in f.readlines():#readlines以列表输出文件内容line=line.strip().split("\t")result.append(line)
f.close()   #将文件关闭
result=pd.DataFrame(result).dropna(axis=0)

二、给DataFrame添加列名

usedata.columns=["Official Symbol Interactor A","Official Symbol Interactor B"]
usedata

在这里插入图片描述

三、删除指定行

usedata=usedata.drop([0])
#[]里面是行号

四、读取csv文件,不让第一行成为列名

# 读取数据
import pandas as pd
score = pd.read_csv(r"C:\Users\zyy\Desktop\source_code\out_dbis\dbis.cac.w5.l10_other.csv",header=None).dropna(axis=1)
score
# 主要是header=None,如果不加,第一行就成为了列名

在这里插入图片描述

五、读取DataFrame的第几行第几列

score.loc[2]
# loc[i] 读取第i行
score.iloc[2]
# iloc[i] 读取第i列

六、读取数据时,删除含有空值的行或列

dropna()方法,可以找到DataFrame类型数据的空值,将空值所在的行/列删除后,将新的DataFrame作为返回值返回。

函数形式:dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

参数:

axis:轴。0或’index’,表示按行删除;1或’columns’,表示按列删除。

how:筛选方式。‘any’,表示该行/列只要有一个以上的空值,就删除该行/列;‘all’,表示该行/列全部都为空值,就删除该行/列。

thresh:非空元素最低数量。int型,默认为None。如果该行/列中,非空元素数量小于这个值,就删除该行/列。

subset:子集。列表,元素为行或者列的索引。如果axis=0或者‘index’,subset中元素为列的索引;如果axis=1或者‘column’,subset中元素为行的索引。由subset限制的子区域,是判断是否删除该行/列的条件判断区域。

inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None。

使用dropna()删除后

七、将dict数据存储到txt中

在这里插入图片描述
在这里插入图片描述

八、DataFrame 按照条件删选数据

需求就是 我有个DataFrame里面存储了许多数据,包括name ,以及其他的信息。我这里也有一个list里面包含了我所需要的数据的name. 就是按照list里面的name筛选数据
使用方法:

isin函数:df[df[“column_name”].isin(li)] (# li = [20, 25, 27] 或 li = np.arange(20, 30))
根据从isin函数传入的列表(li),筛选出与列表中包含的数值或字符串相同的数据记录, 用法有点类似sql中的"in"

下面这个是原始数据:
在这里插入图片描述
这个是筛选之后的数据:
在这里插入图片描述

九、使用SVM训练鸢尾花数据集中的一些函数用法

  1. np.loadtxt()加载数据
  2. numpy.split()函数 分割数据
  3. sklearn的train_test_split()各函数参数含义解释(非常全)

http://chatgpt.dhexx.cn/article/Gv00wPvM.shtml

相关文章

BioGRID:蛋白质相互作用数据库

欢迎关注微信公众号《生信修炼手册》! BioGRID数据库是一个老牌经典的蛋白质相互作用数据库,在今年9月份刚刚分布了最新版本3.5.165,该版本从66,164篇文献中整理出了1,607,037个蛋白质相互作用,28,093个嵌合体信息以及726,378个转录后修饰PTM…

(NCRE网络技术)中小型网络系统总体规划与设计方法-知识点

欢迎您阅读此系列文章,文章参考自《全国计算机等级考试三级教程.网络技术》。内容为NCRE三级网络技术主要知识点以及常考点,此知识点总结参照《三级网络技术考试大纲(2018年版)》。阅读此系列文章可以帮助您快速、轻松考取相应证书!祝您阅读愉…

Linux系统如何查看服务器带宽及网络使用情况

文章目录 前言  linux查看服务器带宽具体方法  一、使用speedtest-cli命令查看下载和上传最大流量值  二、查看网卡、网络的详情   1.查看服务器网络端口   2.ethtool命令查看宽带大小 三、nload命令实时统计网卡带宽使用率  四、dstat -n命令实时监测网络的状态…

计算机网络的组成及其逻辑结构

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 目录 前言 一、计算机网络的组成 计算机系统: 数据通信系统 网络软件及网络协议 二、计算机网络的逻辑结构 资源子网 通信子网 总结 前言 计算机网络是在20世纪6…

Linux中centos修改系统时间并写到硬件,Linux中centos设置定时自动同步网络时间

文章目录 前言一、centos修改系统时间并写到硬件1.1查看当前的系统时间1.2修改系统时间1.3查看硬件时间1.4同步系统时间和硬件时间1.5本地时间写入硬件时间 二、centos设置定时自动同步网络时间2.1安装ntpdate工具2.2CentOS安装/操纵crontab2.3启动crontab并查看状态2.4写一个c…

计算机网络的发展简史

目录 前言一、互联网发展历史1. 第一阶段:ARPANET2. 第二阶段:三级结构互联网3. 第三阶段:多层次ISP互联网 二、中国互联网的发展简史1. 发展阶段2. 公共网络 总结 前言 时间是2022年的6月,当真正的注意到现在的时间时不禁感叹时…

浅谈网络舆情监测系统中爬虫的设计及系统架构

前言 说到网络舆情监测想必很多人都不陌生。可以跟大家这么说吧。爬虫所能带来的商业价值适用并深存于所有小-中-大企业中,尤其做网络舆情的大数据公司所有的业务基本都必须依托于爬虫来开展它的战略布局,毕竟有了米才能做饭嘛~ 不信的话我简单的来采访一下做舆情项目的相关…

基于java的网络在线考试管理系统的设计与实现--毕业开题报告

基于java的网络在线考试管理系 统的设计与实现开题报告–毕业设计 最近grace刚完成毕业设计 通过了赶紧来给宝贝们分享我的成果哈哈 设计题目:基于java的网络在线考试管理系统的设计与实现 一、选题依据: 1.国内外有关的研究动态 在线考试系统在国内…

校园网系统集成方案设计

校园网系统集成方案设计 第一篇的文章献给我的网络系统集成大作业,这篇文章是关于校园网系统集成方案的设计,文章有很多不足仅限于我目前的水平。 第一章 前言 随着经济的发展,信息起着越来越重要的作用。计算机、网络和多媒体等信息技术的…

VM虚拟机上的网络设置

1. 前言 一般Linux编程时,经常都会使用虚拟机跑Linux系统,VMware Workstation Pro 虚拟机里的系统不管是Linux、还是windows、还是其他系统想要上网就必须配置好虚拟网络连接方式。VMware Workstation 支持共享、桥接,选择网卡的方法自定义上网方式。 如果虚拟机里的系统想…

Cisco Packet Tracer 网络系统工程实训大作业【附网络拓扑图】

文章目录 前言网络拓扑图资源项目基本要求项目一项目二项目三 实验原理静态路由基本原理VLAN基本原理OSPF的基本原理 项目的实现项目一的设计与实现网络拓扑图接口信息配置流程连通性测试 项目二的设计与实现网络拓扑图接口信息配置流程连通性测试 项目三的设计与实现网络拓扑图…

零信任网络

“前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。” 前言 - 床长人工智能教程 零信任: 零信任概念是由网络去边界化发展改进而来。之前网络的建设理念中,将网络分…

Linux系统中网络管理命令和查看网络配置的命令

前言 这是我听老师讲课做的笔记,考试要看的。 这是视频地址 作者:RodmaChen 关注我的csdn博客,更多Linux笔记知识还在更新 说明:本人只在csdn写博客,如果在其他网站上看到,请不要信 网络管理命令和查看网络配置的命令 …

基于卷积神经网络的电影推荐系统

基于卷积神经网络的电影推荐系统 前言1.实现效果1.1 算法运行结果1.2 系统主要界面 2.主要代码实现2.1 网络模型代码2.2 django代码 前言 如今协同过滤等传统推荐算法被广泛用于推荐,但也存在冷启动、矩阵稀疏等问题,本项目用深度学习来实现电影推荐&am…

炸鸡网络验证系统

文章目录 前言一、炸鸡网络验证系统二、程序演示与下载1.程序演示2.程序下载 前言 今天介绍的是一款才了解到的系统,网络验证系统。具体介绍如下 一、炸鸡网络验证系统 炸鸡网络验证系统基于PhpMySql数据库架构的网络验证系统,安全稳定、性能强悍、承…

Linux系统的网络设置

前言 linux上设置网络需要设置 IP、子网掩码、网关、DNS等。设置正确才可访问网络,否则会出现无法联网的问题。下面会写出如何设置IP等信息,如何处理路由表等操作。 一. 查看网络配置 1.1 查看所有活动网接口的信息 执行ifconfig 命令 ens33&#…

1.网络安全之windows系统知识

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、Windows 常见分类二、Windows 常用操作1.Windows常用快捷键2.Windows常用控制台 三、Windows 网络配置1.IP地址2.子网掩码3.默认网关4.Windows Cmd 介绍及使…

python中split()方法的使用

split()方法是用来拆分字符串的,返回的数据类型是列表,当传入参数时,必须指定分割符。当不传递参数时,此时将整个字符串作为列表的一个元素返回。 使用方法: 1.空格作为分隔符 2.按点号.分割 当字符串中没有指定分割符时,会将整个字符串作为列表的一个元素返回。 3.包含…

java split 顺序_Java的split方法说明

相信大家都经常使用String 的split方法,但是大家有没有遇到下面的这种情况: 大家想想下面的代码执行结果是什么 public static voidmain(String[] args) {//TODO Auto-generated method stub String str1= "a,b,c,,,a"; String str2= "a,b,c,,,"; String…

String类中split()方法的使用

String类中split方法的使用 查看api会发现,split方法有方法重载 一个是split(String regex)一个是split(String regex,int limit) 先讲解split(String regex,int limit) …