- 相關(guān)推薦
360搜索上線“后羿算法”保護原創(chuàng)
引導語:近日,360搜索發(fā)布站長公告,宣布上線后羿算法,對低劣的采集站點加以控制,對原創(chuàng)和稀缺性網(wǎng)頁進行保護和提權(quán),與站長共同建設(shè)良好的互聯(lián)網(wǎng)生態(tài)環(huán)境。下面我們一起來看一下具體內(nèi)容。
互聯(lián)網(wǎng)冗余信息已達百億 嚴重挫傷原創(chuàng)積極性
“原創(chuàng)+轉(zhuǎn)載+信息分類聚合”已經(jīng)成為互聯(lián)網(wǎng)新聞網(wǎng)站的最常見內(nèi)容產(chǎn)出模式,比如新浪、搜狐、網(wǎng)易這些傳統(tǒng)門戶,和今日頭條等移動APP。原創(chuàng)內(nèi)容保證了網(wǎng)站的獨特性,而轉(zhuǎn)載內(nèi)容保證網(wǎng)站信息的足夠全面,大量的分類聚合工作,讓互聯(lián)網(wǎng)信息條理清楚類目分明。
網(wǎng)站之間常規(guī)的轉(zhuǎn)載,要求轉(zhuǎn)載網(wǎng)站在醒目位置列出文章出處和原創(chuàng)頁面入口,用戶可以直接跳轉(zhuǎn)到原創(chuàng)頁面。但采集站,往往隱瞞或者篡改文章出處,且不分條理的盲目抓取互聯(lián)網(wǎng)信息。為了獲得流量收益,采集站會在頁面中夾雜大量的廣告和彈窗信息,不僅浪費了搜索引擎的收錄資源,侵害了原創(chuàng)作者的版權(quán),用戶搜索體驗也大打折扣。
據(jù)估計,用戶喜歡的高質(zhì)量原創(chuàng)內(nèi)容,互聯(lián)網(wǎng)每天會誕生數(shù)十萬個頁面,與之成鮮明對比的是,采集網(wǎng)站帶來互聯(lián)網(wǎng)上的冗余信息則高達上百億個頁面,與冗余信息相比,原創(chuàng)內(nèi)容可謂九牛一毛。
采集站的內(nèi)容分布領(lǐng)域非常廣泛,常見的領(lǐng)域有普通問答類,商品購物類,娛樂新聞類,企業(yè)商情類,成人色情類,賭博詐騙類,私服外掛類,違法違禁類等,涵蓋了互聯(lián)網(wǎng)內(nèi)容的各大領(lǐng)域。與此同時,移動互聯(lián)網(wǎng)的采集和垃圾網(wǎng)頁,雖然其數(shù)量級要比PC端要低,但在行為模式方面與PC端區(qū)別不大。
“后羿算法”倡導原創(chuàng),控制惡意采集
12月26日,360搜索發(fā)布站長公告,宣布上線抑制采集保護原創(chuàng)的高級算法“悟空算法”,該算法將對低劣的采集站點加以控制,對原創(chuàng)和稀缺性網(wǎng)頁進行保護和提權(quán)。360搜索表示,愿與無數(shù)專心做好站的站長共同建設(shè)良好的互聯(lián)網(wǎng)生態(tài)環(huán)境
“后羿算法”上線后,對于內(nèi)容豐富的優(yōu)質(zhì)網(wǎng)頁(如原創(chuàng)、稀缺資源、精心編輯的內(nèi)容頁等),會增加其在用戶面前展現(xiàn)的機會;對于濫用采集手段的行為(如整站大規(guī)模采集,頁面內(nèi)容拼湊、含有大量廣告干擾用戶閱讀、惡劣彈窗跳轉(zhuǎn)、大量堆砌無關(guān)熱詞、站內(nèi)搜索結(jié)果頁等),會顯著降低其展現(xiàn)機會和網(wǎng)頁收錄量;對于新聞網(wǎng)站正常的轉(zhuǎn)載行為,采取了合理引導和規(guī)范控制,而不是一棒子打死。
據(jù)悉,后羿算法采取了業(yè)界領(lǐng)先的大規(guī)模并行機器學習算法,通過億萬維度特征的刻畫,結(jié)合對搜索領(lǐng)域問題的不斷探索和實踐,對海量文本數(shù)據(jù)進行主題和內(nèi)容傾向性分析,對用戶喜好程度進行全面建模和應(yīng)用,能夠?qū)υ瓌?chuàng)信息進行快速而精準的鑒別,能夠?qū)Σ杉袨楹屠W(wǎng)頁進行定向的約束和管控。
360搜索一直以來都掌握著采集類站點的完整索引量和歷史行為模式,并對之進行長期的密切的關(guān)注和監(jiān)控,一旦發(fā)現(xiàn)有惡劣作弊傾向就會進行嚴肅處理,用“后羿“命名該算法,就是為了秉承了英雄后羿的“去除冗余,除暴安良”精神。
原創(chuàng)收錄異議 可求助站長平臺
公告中,360搜索表示將矢志不移地與無數(shù)專心做好站的站長共同建設(shè)良好的互聯(lián)網(wǎng)生態(tài)環(huán)境。360搜索建議那些存有惡意采集行為的站長,能夠從長遠發(fā)展考慮,積極完善網(wǎng)站建設(shè),提供更多時效性高、內(nèi)容豐富的原創(chuàng)內(nèi)容,引擎將隨著網(wǎng)站完善,不斷提升收錄量。
360搜索同時也歡迎原創(chuàng)網(wǎng)頁的作者,通過360站長平臺主動提報收錄缺失的信息。對于原創(chuàng)網(wǎng)站和作者,如發(fā)現(xiàn)自己的內(nèi)容被惡意采集,對采集判定結(jié)果及收錄狀況存在異議時,360搜索建議通過站長平臺的反饋中心及360搜索論壇版主進行反饋:
●站長平臺反饋中心:http://info.so.com/feedback.html?product=zhanzhang
●360搜索論壇: http://bbs.#/forum-137-1.html
●站長平臺注冊地址:http://zhanzhang.so.com/
●站長平臺使用說明請見:http://www.so.com/help/help_3_3.html
【360搜索上線“后羿算法”保護原創(chuàng)】相關(guān)文章:
線上線下創(chuàng)業(yè)項目05-02
搜狗向左 360向右 不是冤家不聚首06-12
大學生賣原創(chuàng)明信片 兩小時掙了600元05-08
360CEO周鴻祎:創(chuàng)業(yè),要少功利多學習05-29
原創(chuàng)桌游:三名80后大學生的“三國殺”傳奇09-02
公司章程對股東權(quán)利的保護05-16