99er久久国产精品在线,999国产精品久久久,2011久久精品国产,曰韩欧美群交P片内射,亚洲三区在线观看无套内射,欧美性猛交xxxx乱大交

×

教你用 Python+Fiddler 爬取并下載抖音小姐姐視頻

分類:互聯(lián)網熱點 編輯:互聯(lián)網觀察 瀏覽量:1
2020-07-10 11:21:32

準備工作:

(1)手機(安卓、ios 都可以)/ 安卓模擬器,今天主要以安卓模擬器為主,操作過程一致。

( 2 ) 抓包工具:Fiddel 下載地址:

https://www.telerik.com/download/fiddler

(3)編程工具:pycharm

一、fiddler 配置

在 tools 中的 options 中,按照圖中勾選后點擊 Actions

選擇允許監(jiān)控遠程鏈接,端口可以隨意設置,只要別重復就行,默認 8888

二、安卓模擬器 / 手機配置

首先查看本機的 IP:在 cmd 中輸入 ipconfig,記住這個 IP

手機配置:配置已連接的 WiFi,代理選擇手動,然后輸入上圖 ip 端口號為 8888

模擬器配置:設置中長按已連接 wifi,代理選擇手動,然后輸入上圖 ip 端口號為 8888

證書名稱隨便設,可能還需要設置一個鎖屏密碼。

三、抖音抓包

打開抖音,然后觀察 fiddler 中所有的包

1、視頻數(shù)量,每個包中只有這么幾個視頻,那如何抓取更多呢?

這時候需要借助模擬器的模擬鼠標翻頁,讓模擬器一直翻頁,這樣就不斷會出現(xiàn) json 包了。

一種方法可以手動復制粘貼,但是這樣很 low。

所以我們使用 fidder 自帶的腳本,在里面添加規(guī)則,當視頻 json 包刷出來后自動保存 json 包。

自定義規(guī)則包:

鏈接:https://pan.baidu.com/s/1wmtUUMChzuSDZFYGSyUhCg

提取碼:7z0l

點擊規(guī)則腳本,然后將自定義規(guī)則放在如圖所示位置:

(1)第一行的網址:

這個是從視頻包的 url 中摘出來的,抖音會時不時更新這個 url,所以不能用了也要去更新:

比如現(xiàn)在的已經和昨天不同了,記著修改。

接下來在 pycharm 中寫腳本獲取 json 包里的視頻鏈接:

導包:

import os,json,requests

偽裝頭:

headers = { ‘ User-Agent ’ : ‘ Mozilla/5.0 ( Windows NT 10.0; Win64; x64 ) AppleWebKit/537.36 ( KHTML, like Gecko ) Chrome/72.0.3626.119 Safari/537.36 ’ }

邏輯代碼:

videos_list = os.listdir ( 'C:/Users/HEXU/Desktop/ 抖音數(shù)據(jù)爬取 / 抖音爬取資料 /raw_data/' ) # 獲取文件夾內所有 json 包名

count = 1 # 計數(shù),用來作為視頻名字

for videos in videos_list: # 循環(huán) json 列表,對每個 json 包進行操作 a = open ( './ 抖音爬取資料 /raw_data/{}'.format ( videos ) ,encoding='utf-8' ) # 打開 json 包 content = json.load ( a ) [ 'aweme_list' ] # 取出 json 包中所有視頻

for video in content: # 循環(huán)視頻列表,選取每個視頻 video_url = video [ 'video' ] [ 'play_addr' ] [ 'url_list' ] [ 4 ] # 獲取視頻 url,每個視頻有 6 個 url,我選的第 5 個 videoMp4 = requests.request ( 'get',video_url,headers=headers ) .content # 獲取視頻二進制代碼 with open ( './ 抖音爬取資料 /VIDEO/{}.mp4'.format ( count ) ,'wb' ) as f: # 以二進制方式寫入路徑,記住要先創(chuàng)建路徑 f.write ( videoMp4 ) # 寫入 print ( ' 視頻 {} 下載完成 '.format ( count ) ) # 下載提示 count += 1 # 計數(shù) +1

本文來自精品專欄《爬蟲案例合集》


聲明:免責聲明:本文內容由互聯(lián)網用戶自發(fā)貢獻自行上傳,本網站不擁有所有權,也不承認相關法律責任。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內容,請發(fā)

送郵件至:operations@xinnet.com進行舉報,并提供相關證據(jù),一經查實,本站將立刻刪除涉嫌侵權內容。本站原創(chuàng)內容未經允許不得轉載,或轉載時

需注明出處:新網idc知識百科

免費咨詢獲取折扣

Loading