网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
06月07日漏签0天
python吧 关注:483,466贴子:1,987,633
  • 看贴

  • 图片

  • 吧主推荐

  • 视频

  • 游戏

  • 11回复贴,共1页
<<返回python吧
>0< 加载中...

python爬虫求助拜托了拜托了🙏

  • 只看楼主
  • 收藏

  • 回复
  • Barry
  • 童生
    2
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
如图,这个代码它运行完了输出的是一个空的列表啊啊啊啊啊我要疯了😭
求助大佬帮帮忙,指点迷津啊啊啊啊😭
附上代码:
import requestsimport bs4def get_html(url): headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36'} response = requests.get(url, headers = headers) return 网页链接 def get_datas(text): soup = bs4.BeautifulSoup(text, "html.parser") data = [] x = soup.find_all("li", class_= "bangumi-item") for y in x : title = y.find('a','bangumi-title').string link = y.find('li','bangumi-item').a['href'] updata = y.find('p', 'pub-info').string chaser = y.find('div','shadow').text vtype= y.find('span','corner-tag badge_0').text data.append([title,updata,chaser,vtype,link]) return datadef Slicing(iterable, n): return zip(*[iter(iterable)] * n) def main(): url = "https://www.bilibili.com/anime/index/?from_spmid=666.4.index.0#st=1&order=3&season_version=-1&spoken_language_type=-1&area=-1&is_finish=-1&copyright=-1&season_status=-1&season_month=-1&year=-1&style_id=-1&sort=0&page=1" text = get_html(url) datas = get_datas(text) print(datas) #with open('Bilibili番剧.txt', 'a', encoding = "utf-8") as file: #for title,updata,chaser,vtype,link in Slicing(datas, 5): #file.write(''.join([': '' 标题: ',title,' 集数: ',updata,' 追番数: ', chaser, ' 番剧属型: ', vtype, ' 链接 :',link, '\n'])) if __name__ == "__main__": main()


  • Barry
  • 童生
    2
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
爬下来的不是想要的网页代码,要哭了,怎么整啊😭


2026-06-07 18:49:20
广告
不感兴趣
开通SVIP免广告
  • 贴吧用户_Ga8KyCU
  • 进士
    9
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
那肯定遇到反爬了呀


  • 久睡_成瘾day
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
url错了,帮你改了下,我也是新手,可能改的不好,勿喷。。
import requests
import re
def get_html(url):
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36'
}
response = requests.get(url, headers = headers)
return response.text
def get_datas(text):
x = re.finditer(r'text\":\"(?P<vtype>.*?)\".*?index_show\":\"(?P<updata>.*?)\".*?link\":\"(?P<link>.*?)\".*?order\":\"(?P<chaser>.*?)\".*?title\":\"(?P<title>.*?)\"',text,re.S)
for y in x:
title=y.group('title')
link=y.group('link')
updata=y.group('updata')
chaser=y.group('chaser')
vtype=y.group('vtype')
with open('Bilibili番剧.txt', 'a', encoding="utf-8") as file:
file.write(''.join([ '标题: ',title,' 集数: ',updata,' 追番数: ', chaser, ' 番剧属型: ', vtype, ' 链接 :',link, '\n']))
#
# # def Slicing(iterable, n):
# # return zip(*[iter(iterable)] * n)
#
def main():
page = int(input("请输入你要爬取前几页的内容:"))
for r in range(1,page+1):
url = f"https://api.bilibili.com/pgc/season/index/result?st=1&order=3&season_version=-1&spoken_language_type=-1&area=-1&is_finish=-1&copyright=-1&season_status=-1&season_month=-1&year=-1&style_id=-1&sort=0&page={r}&season_type=1&pagesize=20&type=1"
text = get_html(url)
get_datas(text)
print(f"第{r}页内容下载")
#with open('Bilibili番剧.txt', 'a', encoding = "utf-8") as file:
# #for title,updata,chaser,vtype,link in Slicing(datas, 5):
# #file.write(''.join([': '' 标题: ',title,' 集数: ',updata,' 追番数: ', chaser, ' 番剧属型: ', vtype, ' 链接 :',link, '\n']))
if __name__ == "__main__":
main()


  • 南曦
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
我刚学,能不能解释一下,这是什么东西啊?


  • FuturePython10
  • 进士
    8
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
可以一起自学python,自学qq群:379060946
FuturePython为原创义务免费视频,包括python基础、python爬虫、mysql系列、django系列等,不存在任何经济利益,课程地址:https://space.bilibili.com/1663262478,喜欢的同学可以关注一下。官方论坛:https://futurepy.com
课程制作者QQ:3480689255,可以提供指导


  • 金铲铲职业bro
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
666


  • 就在一瞬间
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
你好,这个问题可以加我扣扣982502621,可以先做解决问题看到效果后在交易也可以的哈,就挣个饭钱奶茶钱哈哈哈哈哈哈


2026-06-07 18:43:20
广告
不感兴趣
开通SVIP免广告
  • 就在一瞬间
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
你好,这个问题可以加我扣扣982502621,可以先做解决问题看到效果后在交易也可以的哈,就挣个饭钱奶茶钱哈哈哈哈哈哈


  • 就在一瞬间
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
你好,这个问题可以加我扣扣982502621,可以先做解决问题看到效果后在交易也可以的哈,就挣个饭钱奶茶钱哈哈哈哈哈哈


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 11回复贴,共1页
<<返回python吧
分享到:
©2026 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示