Top Ad unit 728 × 90

Breaking News

軟體下載

搜尋引擎如何判斷原創文章?

搜尋引擎如何判斷原創文章?

站長都知道搜索引擎喜歡收錄原創的文章,但是我們很多人卻有這樣的疑問:那就是蜘蛛怎麼判斷這些東西是不是原創的呢?  

一般來講有以下幾個方面的因素決定: 

 

  1. 蜘蛛抓取日期  
  2. 快照的日期  
  3. 文章修改的程度  
  4. 頁面外鏈的多少  

舉個例子,如果在自己的網站更新了一篇文章新聞,引擎來到網站並抓取到了這篇文章,放到數據庫,並且在收錄數據庫中沒有發現類似內容,就會被認為是原創,在這點上有以下細節需要注意:  

一、文章被轉載


如果剛發表的一篇文章被其它轉載了,那麼誰是原創呢? 那要看誰更先被搜索引擎抓取到,也就是更新周期的問題了。如果先抓取到前者站,那麼歸前者,如果先抓取後者站,那麼原創就歸後者站了,所以不是說你先發表了,原創就是你的,這個得看搜索引擎什麼時間收錄了你的內容。  

二、文章收錄 


文章必須被收錄,如果沒有被收錄,肯定是在搜索數據庫中找不到的,引擎根本就找不到這篇文章,更談不上什麼原創了。  

那如果蜘蛛先訪問了後者站呢? 權重就會給後者站,正常的情況下都是這樣的!  

如果後者站轉載的文章帶了前者站的原文章頁面鏈接呢? 這就很明白了,剛收錄的時候,兩條結果一起出現,有可能還是後者的排名好一點。當然,文章轉載次數多了以後,前者的鏈接越多,對前者的文章越有好處,排名會慢慢變成前者在前面。  

如果另外轉載的文章帶的是B 站頁面的鏈接呢? 如果判斷不好,就變成了一個鏈接流行度的比賽了。不過,如果都有很多外鏈,並且相差不大,那麼判斷的規則就會回到原點,誰先收錄誰就是原創。  

三、偽原創 


偽原創會被認為是原創嗎? 大多時候是這樣的,引擎蜘蛛不能明確分別這些東西,因為它太程式化。如果你的標題改過,文章的段落改過,那麼蜘蛛將很難確定文章是否有過收錄,也許它可以確定有部分內容是重複的,但它也不能因為這些而將這篇文章確認為是轉載! 當然,隨著引擎程式設計的提高,應該會有一個相似度的東西出來,比如內容相似度超過百分之幾就會被認為是轉載。  

分析下來,相信大家應該了解了。只是殘簫自己的看法,希望大家吸收自己想要的東西,不認同的也來提下自己的意見!  

另提幾個建議:  

  1. 如果你是新站,權重不高,如何讓蜘蛛首頁找到你的頁面並放入數據庫? 其實很簡單,用交換鏈接平台的這些工具增加外鏈,讓蜘蛛更快的找到你的頁面!  
  2. 前輩們已經有過建議,就是加上自己的版權及內容頁面的地址,別人採集的時候你就爽了,收錄雖然不會快,但鏈接多了,你依然是原創內容。  
  3. 發表文章等到自己收錄以後再去其它的站點進行發表,同時加上自己的原文地址,這種辦法很有保障!  

四、快照日期


快照日期顯示時間最早的,一般就是原創了吧? 其實不一定,這個說法要在一個更新周期之內,比如說文章發表後一周內,快照時間越早的地址將越有被認為是原創的可能。但如果文章都發表了幾個月了,說不定引擎已經重新獲取過快照了,快照的日期就變了!   

除此之外還有其它的可能,一般比如百度收錄,他可能有一個收錄的數據庫,經過過濾後,收錄的內容才會放到搜索結果裡來,在這個期間就有一些問題,比如前站首次發表,後者轉載,蜘蛛先訪問前者再訪問後者,而後可能先把後者站的結果放出來了,而前者還在數據庫裡。所以說引擎沒有收錄並不表示引擎蜘蛛沒有訪問過這些內容,也許在引擎的庫存裡已經有了記錄,只是你查的時間沒有放出來而已,就像25 號才放出來的內容,但是快照是20 號的,這就是搜索引擎的庫存內容,同時這也是檢驗原創的核心時間點。  

這種情況一般出現在新站與老站之間,前者發表,後者轉載,但前站在搜索引擎的信任度並不高的時候,不過只要是前者先被訪問到的,原創權還是前者的,這是最難分出來的情況,因為我們不知道蜘蛛先訪問哪個站,除非你知道兩個站的網站空間日誌內容,能看到搜索引擎對兩個頁面的訪問時間。

有SEO方面需求的朋友們可以到巫普斯SEO關鍵字優化公司的網站,裡面有很詳細的SEO教學文章,同時巫普斯SEO關鍵字優化公司也有非常豐富的SEO優化經驗,幫助過許多中小企業與上市企業的網站進行SEO優化提升網站排名,有需求的朋友們可以前往http://seo.techroomage.com進一步的了解或委託SEO優化的服務

搜尋引擎如何判斷原創文章? Reviewed by Whoops SEO on 5:00 下午 Rating: 5

沒有留言:

All Rights Reserved by TechRoomage | 科技空間 © 2014 - 2015
Designed by TechRoomage

聯絡表單

名稱

以電子郵件傳送 *

訊息 *

技術提供:Blogger.