Teoma是一個(gè)曾經(jīng)存在的網(wǎng)絡(luò)搜索引擎,后來(lái)被Ask Jeeves(現(xiàn)在的Ask.com)收購(gòu)。Teoma搜索引擎使用了一種叫做“主題目錄”(Subject-Specific Popularity)的算法,該算法通過(guò)分析網(wǎng)頁(yè)之間的相關(guān)性來(lái)提供搜索結(jié)果。
Teoma的網(wǎng)絡(luò)爬蟲(chóng)程序會(huì)抓取互聯(lián)網(wǎng)上的網(wǎng)頁(yè)內(nèi)容,并根據(jù)其主題和相關(guān)性進(jìn)行索引。這種算法的特點(diǎn)是更加注重網(wǎng)頁(yè)的內(nèi)容和主題之間的關(guān)聯(lián)性,而不僅僅是頁(yè)面的鏈接結(jié)構(gòu)。
不過(guò)對(duì)于國(guó)內(nèi)網(wǎng)站來(lái)說(shuō)不會(huì)帶來(lái)什么流量,可以選擇robots.txt協(xié)議禁止。
User-agent: Teoma
Disallow: /
如果還是禁止不了,可以選擇nginx規(guī)則禁止訪問(wèn),如下:
if ($http_user_agent ~* "Teoma") {
return 403;
}