欧美亚洲综合图区在线|天天射天天干国产成卜|99久久免费国产精精品|国产的欧美一区二区三区|日韩中文字幕无码不卡专区|亚麻成人aV极品一区二区|国产成人AV区一区二区三|成人免费一区二区三区视频网站

當前位置:首頁 > 軟件開放 > 正文內容

網(wǎng)站源碼爬取(獲取網(wǎng)站源碼)

軟件開放2年前 (2023-01-12)2124

今天給各位分享網(wǎng)站源碼爬取的知識,其中也會對獲取網(wǎng)站源碼進行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關注本站,現(xiàn)在開始吧!

本文目錄一覽:

用requests庫爬取網(wǎng)站源碼問題

這個網(wǎng)頁是JavaScript異步加載的,直接用requests爬不到你想要的網(wǎng)頁源碼。

為什么別人網(wǎng)站源碼中只有少量內容,其他通過js實現(xiàn)

最有可能的原因就是網(wǎng)頁數(shù)據(jù)是動態(tài)加載的,存儲在一個json文件中,直接獲取源碼是提取不到任何信息的,需要抓包分析才行,下面我簡單介紹一下操作過程,以某某貸上的數(shù)據(jù)為例(動態(tài)加載):

1.首先,打開原網(wǎng)頁,如下,這里假設我們要爬取的數(shù)據(jù)包含年利率、借款標題、期限、金額和進度5個字段:

2.接著右鍵打開網(wǎng)頁源碼,按Ctrl+F搜索其中關鍵字,如“10.20%”,可以看到,任何信息都匹配不到,說明數(shù)據(jù)是動態(tài)加載的,而非直接嵌套在網(wǎng)頁源碼中:

3.按F12調出瀏覽器開發(fā)者工具,開始抓包分析,依次點擊“Network”-“XHR”,F(xiàn)5刷新頁面,可以看到,數(shù)據(jù)是動態(tài)加載的,存儲在一個json文件中,而非html網(wǎng)頁源碼,只有解析這個json文件,才能提取出我們需要的數(shù)據(jù):

4.接著就是根據(jù)抓包結果解析json文件,已經(jīng)獲取到url地址,所以直接get請求即可,然后用python自帶的json包解析就行,測試代碼如下,非常簡單,依次根據(jù)屬性提取字段信息即可:

5.最后點擊運行程序,截圖如下,已經(jīng)成功提取到我們需要的數(shù)據(jù):

至此,我們就完成了網(wǎng)頁動態(tài)數(shù)據(jù)的爬取??偟膩碚f,整個過程非常簡單,最主要的還是抓包分析,獲取到真實存儲數(shù)據(jù)的文件,然后再解析就行,只要你有一定的python基礎,熟悉一下上面的過程,很快就能掌握的,當然,如果數(shù)據(jù)或鏈接進行了加密處理,這個就非常復雜了,需要自己好好琢磨一下,網(wǎng)上也有相關資料和教程,感興趣的話,可以搜一下,希望以上分享的內容能對你有所幫助吧,也歡迎大家評論、留言進行補充。

python怎么爬取網(wǎng)頁源代碼

#!/usr/bin/env python3

#-*- coding=utf-8 -*-

import urllib3

if __name__ == '__main__':

http=urllib3.PoolManager()

r=http.request('GET','IP')

print(r.data.decode("gbk"))

可以正常抓取。需要安裝urllib3,py版本3.43

網(wǎng)站源碼爬取的介紹就聊到這里吧,感謝你花時間閱讀本站內容,更多關于獲取網(wǎng)站源碼、網(wǎng)站源碼爬取的信息別忘了在本站進行查找喔。

掃描二維碼推送至手機訪問。

版權聲明:本文由飛速云SEO網(wǎng)絡優(yōu)化推廣發(fā)布,如需轉載請注明出處。

本文鏈接:http://www.landcheck.net/post/3578.html

分享給朋友:

“網(wǎng)站源碼爬?。ǐ@取網(wǎng)站源碼)” 的相關文章

制作app平臺需要多少錢(制作軟件app需要多少錢)

制作app平臺需要多少錢(制作軟件app需要多少錢)

今天給各位分享制作app平臺需要多少錢的知識,其中也會對制作軟件app需要多少錢進行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關注本站,現(xiàn)在開始吧!本文目錄一覽: 1、開發(fā)一個手機APP要多少錢 2、開發(fā)一個APP需要多少錢 3、做一個app要多少錢? 4、做個app軟件大約多少錢?...

軟件開發(fā)項目管理辦法(軟件項目管理規(guī)范)

軟件開發(fā)項目管理辦法(軟件項目管理規(guī)范)

今天給各位分享軟件開發(fā)項目管理辦法的知識,其中也會對軟件項目管理規(guī)范進行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關注本站,現(xiàn)在開始吧!本文目錄一覽: 1、軟件開發(fā)的項目,如何進行范圍管理 2、軟件項目風險管理控制措施 3、軟件項目的管理思路? 軟件開發(fā)的項目,如何進行范圍管理 在項目一...

中央4在線直播觀看高清臺(中央4電視直播在線觀看)

中央4在線直播觀看高清臺(中央4電視直播在線觀看)

今天給各位分享中央4在線直播觀看高清臺的知識,其中也會對中央4電視直播在線觀看進行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關注本站,現(xiàn)在開始吧!本文目錄一覽: 1、中央4臺節(jié)目表回看在哪里看? 2、中央4臺在線直播今日關注 3、中央4套節(jié)目表 中央4臺節(jié)目表回看在哪里看? 央視網(wǎng)-節(jié)目...

免費的h5游戲制作平臺(h5制作平臺免費)

免費的h5游戲制作平臺(h5制作平臺免費)

今天給各位分享免費的h5游戲制作平臺的知識,其中也會對h5制作平臺免費進行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關注本站,現(xiàn)在開始吧!本文目錄一覽: 1、微信H5頁面免費制作工具有哪些,求各位大神解答 2、H5制作平臺哪個比較好用? 3、H5制作平臺有哪些 4、像云來一樣,免費好用...

發(fā)行數(shù)字藏品需要什么手續(xù)(數(shù)字藏品能升值嗎)

發(fā)行數(shù)字藏品需要什么手續(xù)(數(shù)字藏品能升值嗎)

本篇文章給大家談談發(fā)行數(shù)字藏品需要什么手續(xù),以及數(shù)字藏品能升值嗎對應的知識點,希望對各位有所幫助,不要忘了收藏本站喔。 本文目錄一覽: 1、數(shù)字藏品怎么制作 2、朋友支招怎么做數(shù)字藏品? 3、數(shù)字藏品銀行申請流程 4、用稀臺元宇宙saas經(jīng)營數(shù)字藏品需要具備什么資質? 5、國家支持數(shù)...

autojs源碼(autojs源碼提取器)

autojs源碼(autojs源碼提取器)

今天給各位分享autojs源碼的知識,其中也會對autojs源碼提取器進行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關注本站,現(xiàn)在開始吧!本文目錄一覽: 1、手機autojs 怎樣host跳過活著屏蔽廣告源碼 2、大量autojs常用代碼介紹以及示例 3、Autojs微信自動操作免root...

辉县市| 漾濞| 内黄县| 武鸣县| 黔南| 普洱| 万州区| 宁安市| 商南县| 溧阳市| 永兴县| 抚远县| 鹿邑县| 威宁| 肃宁县| 临猗县| 德阳市| 庄河市| 谢通门县| 岱山县| 潞城市| 伊金霍洛旗| 安新县| 历史| 山东省| 庆阳市| 邹平县| 石柱| 两当县| 德惠市| 岗巴县| 墨竹工卡县| 汝阳县| 吉木萨尔县| 将乐县| 临邑县| 浮山县| 广东省| 高陵县| 洪湖市| 确山县|