【全國(guó)】 集團(tuán)簡(jiǎn)介 關(guān)注我們
幫學(xué)院 商標(biāo)分類表-2024尼斯分類 知識(shí)產(chǎn)權(quán)交易

快幫集團(tuán)

集群網(wǎng)站建設(shè)—搜索引擎如何區(qū)分原創(chuàng)內(nèi)容?

2019-07-25
網(wǎng)站原創(chuàng)內(nèi)容在搜索引擎排名中占有重要地位,但做原創(chuàng)內(nèi)容不容易,偽原創(chuàng)又怕不被當(dāng)成原創(chuàng),白做。很多站長(zhǎng)都想利用原創(chuàng)內(nèi)容來(lái)提高自己網(wǎng)站的收錄與排名,但是做原創(chuàng)內(nèi)容并不是一件容易的事,偶爾一兩篇應(yīng)該還行,要是一天一兩篇,很多多人也是受不了,因?yàn)榇蠖鄶?shù)站長(zhǎng)都不是作家那樣行如流水。比如要寫(xiě)一篇成都租車的原創(chuàng)文章,若是自己本身都還不太了解汽車,那肯定是半天都都憋不出一個(gè)字來(lái)。所以,如何利用別人的文章來(lái)改成偽原創(chuàng),讓搜索引擎以為是原創(chuàng)內(nèi)容,這是很多站長(zhǎng)都追求的效果。

1、對(duì)文章的內(nèi)容進(jìn)行分析比較

首先從搜索引擎角度去考慮:

用戶在做偽原創(chuàng)的時(shí)候,會(huì)經(jīng)常用到的方法有:

(1)刪除部分內(nèi)容

(2)添加部分內(nèi)容。在復(fù)制過(guò)來(lái)的文章里添加上兩句,或是把多篇文章合在一起。

(3)調(diào)換內(nèi)容順序。把原文1.A,2.B,3.C,4.D,5.E 改成 1.C,2.B,3.E,4.A,5. D

用分詞技術(shù)后對(duì)相關(guān)的內(nèi)容進(jìn)行比較,分析項(xiàng)目有:

(1)字?jǐn)?shù)大小

(2)幾個(gè)關(guān)鍵字出現(xiàn)頻率

(3)文中任幾句話

(4)鏈接

程序分析過(guò)程:

如果 (字?jǐn)?shù)大小一樣)并且(幾個(gè)關(guān)鍵字出現(xiàn)頻率一樣)并且(文中任幾句話一樣)并且(鏈接指向與本文有90%以上的相似度的文章)

或者 文中任5句(長(zhǎng)短不一,可能是5-30個(gè)字)以上的話是一致的

那么 判定為抄襲或偽原創(chuàng)。

由上面的程序分析過(guò)程中,可以看出:簡(jiǎn)單的刪除內(nèi)容、添加合并部分內(nèi)容、調(diào)換內(nèi)容順序、段落順序并不能讓搜索引擎當(dāng)做原創(chuàng)。為什么?因?yàn)橛萌缟虾?jiǎn)單的的方法就可以看出大概了。字?jǐn)?shù)大小、幾個(gè)關(guān)鍵字出現(xiàn)頻率、鏈接這都好辦,文中任幾句話對(duì)比這就不好辦了。

2、標(biāo)題

如果是一樣的,那很有可能是復(fù)制,但要是改了一下標(biāo)題呢,如把《成都租車常識(shí)》改成《教您怎樣在成都租車》,意思沒(méi)變,文字變了。所以,不能僅靠標(biāo)題來(lái)判斷是不是原創(chuàng)。但可以做以下分析:

因?yàn)樗阉饕娴臄?shù)據(jù)量實(shí)在太大,不可能對(duì)所有的內(nèi)容進(jìn)行遂一的結(jié)比,而是同樣是使用“分詞“技術(shù):

(1)如果搜索引擎蛛蛛訪問(wèn)的頁(yè)面是一個(gè)新的頁(yè)面,那么,它將先把這個(gè)頁(yè)面內(nèi)容收集起來(lái),放入一個(gè)數(shù)據(jù)庫(kù)(或是其它),等其它程序如專門(mén)對(duì)比內(nèi)容是不是原創(chuàng)、是不是有價(jià)值的程序進(jìn)行處理。這時(shí)候,這個(gè)內(nèi)容將不會(huì)被搜索出來(lái)。

(2)分析內(nèi)容。也是利用了分詞技術(shù),對(duì)標(biāo)題、內(nèi)容等進(jìn)行分析。得出了這個(gè)頁(yè)面的主要內(nèi)容。如《周杰倫2010年專輯》這樣的篇文章時(shí),它將與包括”周杰倫“、”2010“、”專輯“這樣的關(guān)鍵詞的文章進(jìn)行比較,而不用與所有的網(wǎng)頁(yè)進(jìn)行比較。如果結(jié)果是原創(chuàng)、比較有價(jià)值,則進(jìn)行收錄,給比較高的權(quán)重。如果被認(rèn)為是復(fù)制或抄襲,則不進(jìn)行收錄,或是給的權(quán)重很低。順便要說(shuō)的是,對(duì)于這個(gè)頁(yè)面的權(quán)重,不僅僅是跟其本身的內(nèi)容、本身的內(nèi)容有關(guān),能不能有好的排名,還要跟整個(gè)站點(diǎn)的權(quán)重有關(guān)。打個(gè)比方,如果這個(gè)頁(yè)面的權(quán)重是3,網(wǎng)站的權(quán)重是3,那加起來(lái)是6。要是別的網(wǎng)站轉(zhuǎn)載了這個(gè)文章,文章的權(quán)重是1,但他的網(wǎng)站的權(quán)重是7,那加起來(lái)就是8。6<8所以轉(zhuǎn)載的文章還是會(huì)排在原創(chuàng)文章的前面。

信息來(lái)源快幫云:集群網(wǎng)站建設(shè)

文章內(nèi)容來(lái)源于網(wǎng)絡(luò),侵刪

常見(jiàn)問(wèn)題

京公網(wǎng)安備 11010802036823號(hào)

   

京ICP備16051929號(hào)

   

增值電信業(yè)務(wù)許可證編號(hào):京B2-20190686

   

專利代理機(jī)構(gòu)代碼:16087

   

人力資源服務(wù)許可證編號(hào):1101082019043

   

代理記賬許可證書(shū)編號(hào):DLJZ11010820210015

0