快手视频批量采集php,【原创开源】快手爬虫,根据eid批量爬取用户的所有...--688IT编程网

快⼿视频批量采集php,【原创开源】快⼿爬⾍，根据eid批量爬取⽤户的所有图集和视频【已失。。。

[Python] 纯⽂本查看复制代码# -*-coding:utf-8 -*-

import requests

import time

import os

import json

import threading

import re

cookies = ""

def downVideo(video,d_url,v_name):

if not ists(video):

r = (d_url)

r.raise_for_status()

with open(video, "wb") as f:

f.t)

print(" 视频 " + v_name + " 下载成功 √")

# else:

# print(" 视频 " + v_name + " 已存在 √")

def downPic(j,pic,d_url,p_name):

if not ists(pic):

r = (d_url)

r.raise_for_status()

with open(pic, "wb") as f:

f.t)

print(" " + str(j + 1) + "/ 图⽚ " + p_name + " 下载成功 √")

# else:

# print(" " + str(j + 1) + "/ 图⽚ " + p_name + " 已存在 √")

def getCookies():

# url = 'c.m.chenzhongtech/rest/lapi/getcoo?_='+str(int(round(time.time() * 1000)))

url = 'live.kuaishou/u/3xnvh7hzw7ib9ec/3xqbgg5rrpui69c'

headers_web = {

'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',

'Accept-Encoding': 'gzip, deflate, br',

'Accept-Language': 'en-US,en;q=0.9,zh-CN;q=0.8,zh;q=0.7',图片爬虫app

'Connection': 'keep-alive',

'Host': 'live.kuaishou',

# 'Origin': 'v.kuaishou',

# 'Referer': 'v.kuaishou/fw/photo/3xqbgg5rrpui69c',

'Sec-Fetch-Dest': 'document',

'Sec-Fetch-Mode': 'navigate',

'Sec-Fetch-Site': 'none',

'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36',

# 'Cookie':'did=web_c78c7a3f39befb6076e5891268254f0f'

}

rs = (url=url, headers=headers_web, allow_redirects=False)

# resJson = json.t.decode(encoding='utf-8'))

global cookies

# cookies = resJson['cookies'][0].split(';')[0]

cookies = 'did='+rs.cookies._cookies['.kuaishou']['/']['did'].value

def getVideo(data):

url = 'v.kuaishou/rest/kd/feed/profile'

headers_web = {

'accept': '*/*',

'Accept-Encoding': 'gzip, deflate, br',

'Accept-Language': 'en-US,en;q=0.9,zh-CN;q=0.8,zh;q=0.7',

'Connection': 'keep-alive',

'Content-Type': 'application/json',

'Host': 'v.kuaishou',

'Origin': 'v.kuaishou',

'Sec-Fetch-Mode': 'cors',

'Sec-Fetch-Site': 'same-origin',

'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36',

#Cookie 根据⾃⼰的电脑修改

#'Cookie': 'did=web_6ab2aa48ebfa49c18e497b1efb80429f'

}

headers_web["Cookie"] = cookies

rs = requests.post(url=url, headers=headers_web, json=data)

v_json = json.t.decode(encoding='utf-8'))

if (str(v_json["result"])=="2"):

print("服务器返回操作太快，可能触发反爬机制")

return

feeds = v_json["feeds"]

for i in range(len(feeds)):

feed = feeds[i]

caption = str(feed["caption"]).replace("\n","").replace("\u200b","").replace("\"","").replace("\\","")[0:100] f_time = time.strftime('%Y-%m-%d %H%M%S', time.localtime(feed['timestamp'] / 1000))

name = re.sub(r'[\\/:*?"<>|\r\n]+', "", feed['userName'])

dir = "data/" + name + "(" + feed['userEid'] + ")/"

if not ists(dir):

os.makedirs(dir)

if(str(feed['singlePicture']) == "False"):

d_url = feed['mainMvUrls'][0]['url']

v_name = f_time + "_" + caption + ".mp4"

video = dir + v_name

t_downVideo = threading.Thread(target=downVideo, args=(video,d_url,v_name,))

t_downVideo.start()

else:

try:

imgList = feed['ext_params']['atlas']['list']

cdn = feed['ext_params']['atlas']['cdn'][0]

except:

imgList = []

imgList.append(str(feed['coverUrls'][0]['url']).replace("",""))

cdn = ""

for j in range(len(imgList)):

p_name = f_time + "_" + caption + "_" + str(j + 1) + ".jpg"

pic = dir + p_name

d_url = "" + cdn + imgList[j].replace("webp","jpg")

t_downPic = threading.Thread(target=downPic, args=(j,pic,d_url,p_name,))

t_downPic.start()

pcursor = v_json["pcursor"]

if(str(pcursor) != "no_more"):

data = {"eid":v_json['feeds'][0]['userEid'],"count":30,"pcursor":pcursor} getVideo(data)

if not ists("/data"):

os.makedirs("/data")

getCookies()

eidList = ["3xnvh7hzw7ib9ec","3xi4m53fqfftq94"]

for eid in eidList:

data = {"eid":eid,"count":30,"pcursor":"0"}

getVideo(data)

print("收⼯")

688IT编程网

快手视频批量采集php,【原创开源】快手爬虫,根据eid批量爬取用户的所有...

发表评论

推荐文章

Linux怎么直接执行PHP脚本文件

php文件写入或追加数据

php中实现文件上传的函数

php文件上传类程序代码

413 request entity too large 解决方法 -回复

热门文章

php中用来导入其他文件的语句

php获取文件后缀名的方法

创建php文件方法

国家电网公司电子商务平台常见问题

【2018-2019】别克英朗说明书-实用word文档 (12页)

诺基亚E71常见问题以及解决方法

HXD3型电力机车故障应急处理

卫星电视中星9号解密方法及节目参数,长期可用

硬盘U盘等启动奶瓶beini详细步骤教程

BT3使用教程

破解网通铁通电信封路由器的几种方法

手把手教你WPA2加密无线网络

教你如何破解搜索到的无线网络

Get清风OD入门系列图文详细教程、破解做辅助起步

java rar破解原理

同余方程在密码学中的应用与破解

无限网络解码

winrar破解方法

macOS终端中的文件加密和解密技巧

rar加密原理

最新文章

php中实现文件上传的函数

413 request entity too large 解决方法 -回复

php实现编辑和保存文件的方法

php 配置文件的用法 -回复

突破php网站上传文件大小限制

php(实现url重写)

标签列表