WebScraper是一款強(qiáng)大的網(wǎng)站內(nèi)容信息提取工具,WebScraper能夠快速提取與某個(gè)網(wǎng)頁(yè)相關(guān)的信息,支持從網(wǎng)頁(yè)提取的信息類(lèi)型分別為URL,標(biāo)題,描述,與其他類(lèi)或ID關(guān)聯(lián)的內(nèi)容,標(biāo)題,各種格式(純文本,HTML或Markdown)。
WebScraper 是一款Mac系統(tǒng)平臺(tái)的網(wǎng)站內(nèi)容采集工具,可以幫助我們采集網(wǎng)站內(nèi)容,指定好采集地址以及內(nèi)容采集規(guī)則,就可以將網(wǎng)頁(yè)內(nèi)容全部采集下來(lái),并且導(dǎo)出為容易處理的CSV或是JSON文件。
使用Web Scraper,您可以構(gòu)建將導(dǎo)航站點(diǎn)并提取數(shù)據(jù)的站點(diǎn)地圖。使用不同的類(lèi)型選擇器,Web Scraper將導(dǎo)航站點(diǎn)并提取多種類(lèi)型的數(shù)據(jù) - 文本,表格,圖像,鏈接等。
與其他僅從HTML Web提取數(shù)據(jù)的抓取工具不同,Scraper還可以提取使用Javascript動(dòng)態(tài)加載或生成的數(shù)據(jù)。
Web Scrapper是一個(gè)獨(dú)立的chrome擴(kuò)展。站點(diǎn)地圖構(gòu)建,數(shù)據(jù)提取和導(dǎo)出都在瀏覽器中完成。在抓取您的網(wǎng)站后,您可以下載CSV格式的數(shù)據(jù)。對(duì)于高級(jí)用例,您可能希望嘗試將數(shù)據(jù)保存到CouchDB中。