
一鍵采集器
一鍵采集工具,旨在幫助用戶輕松地從源站獲取內(nèi)容。用戶可以自定義采集規(guī)則、目標(biāo)網(wǎng)址、超時(shí)時(shí)間和User Agent,只需點(diǎn)擊一鍵采集按鈕即可完成操作。QueryList的優(yōu)勢(shì)在于其簡(jiǎn)潔的前端語(yǔ)言,使得即使不懂復(fù)雜的編程技術(shù)的用戶也能輕松編寫采集規(guī)則。此外,該頁(yè)面還提供了采集規(guī)則和源站信息的提交功能,將它們存儲(chǔ)在數(shù)據(jù)庫(kù)中,并生成一個(gè)共享的采集規(guī)則列表,以便其他用戶也可以從中受益,提升各自的技術(shù)水平。
示例:王超=李超,張三=李四(等號(hào)前為替換前關(guān)鍵詞,等號(hào)后為替換后關(guān)鍵詞。多個(gè)請(qǐng)用,隔開)
補(bǔ)充糾錯(cuò)
規(guī)則共享提交規(guī)則
一鍵采集器 說明
{
"title": ["h1", "text"],
"content": ["#viewContent", "html", "-div a"]
}
"title": 用于定義字段名,表示頁(yè)面的標(biāo)題內(nèi)容。
"content": 用于定義字段名,表示頁(yè)面的主要內(nèi)容。
"h1": 指定抓取目標(biāo)頁(yè)面的 H1 標(biāo)簽,也可以使用類名或 ID,遵循 jQuery 選擇器的語(yǔ)法。
"text": 抓取純文本,不包括任何 HTML 標(biāo)簽。
"html": 抓取帶有 HTML 的文本內(nèi)容,包含所有的 HTML 標(biāo)簽。
"-div": 過濾規(guī)則,表示在抓取時(shí)排除 div 標(biāo)簽及其內(nèi)部?jī)?nèi)容(多個(gè)過濾規(guī)則可用空格分隔)。
"a": 過濾 a 標(biāo)簽的鏈接,但保留其內(nèi)部?jī)?nèi)容(多個(gè)過濾規(guī)則可用空格分隔)。
有關(guān)詳細(xì)的采集和過濾規(guī)則規(guī)范,請(qǐng)參考 QueryList
分享鏈接
你可能感興趣的工具
- IP子網(wǎng)掩碼計(jì)算器
- 網(wǎng)頁(yè)常用色彩
- UserAgent生成器
- 占位圖片生成器
- MD4算法加密工具
- JWT密匙生成器
- 屏幕PPI計(jì)算工具
- 英文字母大小寫轉(zhuǎn)工具
- Photoshop快捷鍵大全
- Exce快捷鍵
- CSS代碼壓縮工具
- 卡密生成器
- 文本間隔生成工具
- IP檢測(cè)工具
- 雪花算法ID生成器
- MAC地址生成器
- 圖片裁剪工具
- HSV/CMYK互轉(zhuǎn)工具
- 網(wǎng)址鏈接批量生產(chǎn)器
- JSON轉(zhuǎn)Excel/Csv工具
- PEM文件生成器
- URL編碼解碼工具
- Java代碼格式化
- RC4加密解密工具
- 隨機(jī)IP地址生成器
- 下劃線/駝峰互轉(zhuǎn)
- PHP函數(shù)大全
- 百度推送工具
- JS代碼壓縮工具
- 一鍵采集器
- MQTT代碼生成工具
- UUID生成器
- 文字豎排工具
- 隨機(jī)數(shù)生成器
- WEB安全色
- XML代碼壓縮工具