工作需要爬一个网站的数据,可是找的真的好累,不想重复劳作了,想起来原来学过的r语言有网站数据查找,就试一试。
library(XML)
url<-"https://www.izaiwen.cn/"
tbls<-readHTMLTable(url)
sapply(tbls,nrow)
library(XML)
url<-"https://www.izaiwen.cn/"
tbls<-readHTMLTable(url)
sapply(tbls,nrow)
但是只能用于网站数据类型是表格(table)的情况。至少这个网站的数据是不行的,会报错。
再看看Python,欢迎指导!