利用七牛鏡像扒網(wǎng)站的源代碼,操作視頻講解。
首先這是一個(gè)很easy 的功能,平常我們都是Ctrl + S 保存頁(yè)面即可。但是往往保存下來(lái)的頁(yè)面多多少少有點(diǎn)問(wèn)題。并且目錄,命名要么不是和原來(lái)的一樣,要么是目錄結(jié)構(gòu)不一致。
那么今天利用七牛云存儲(chǔ)的一個(gè)功能來(lái)解決這個(gè)問(wèn)題。比如看上了某個(gè)頁(yè)面的特效,或者看上了某個(gè)網(wǎng)站的排版,我們可以利用這個(gè)功能來(lái)實(shí)現(xiàn)我們想要的。
局限性:
1.但是這個(gè)功能也有局限性,首先頁(yè)面( HTML )拔下來(lái),這個(gè)是100%的沒(méi)問(wèn)題,另外網(wǎng)站的 CSS 、 Javascript 、Image 如果是相對(duì)路徑,那么就好說(shuō)了,一次性全解決,如果不是相對(duì)路徑,那么操作就要繁瑣一點(diǎn)。
2.這個(gè)功能只是拔取頁(yè)面的靜態(tài)內(nèi)容,如果是采用異步做處理的的功能,比如 Ajax 訪問(wèn)后拼接的頁(yè)面,那么這個(gè)是爬取不到的,因?yàn)樯婕暗?個(gè)問(wèn)題,
一、當(dāng)前域名下請(qǐng)求對(duì)方的鏈接,這是跨域的。
二、相對(duì)路徑是請(qǐng)求不到的,因?yàn)楫?dāng)前系統(tǒng)下沒(méi)有這個(gè)路徑,除非是 jsonp 的。
....看視頻吧。
版權(quán)所屬:SO JSON在線解析
原文地址:http://suancuo.cn/blog/161.html
轉(zhuǎn)載時(shí)必須以鏈接形式注明原始出處及本聲明。
如果本文對(duì)你有幫助,那么請(qǐng)你贊助我,讓我更有激情的寫下去,幫助更多的人。
