SEO常見知識點

zhushican2年前谷歌SEO1003

SEO常見知識點

蜘蛛陷阱(Spider trap)

「蜘蛛陷阱」是阻止蜘蛛程序爬行網站的障礙物,通常是那些顯示網頁的技術方法,目前很多瀏覽器在設計的時候考慮過這些因素,所以可能網頁界面看起來非常正常,但這些蜘蛛陷阱會對蜘蛛程序造成障礙,如果消除這些蜘蛛陷阱,可以使蜘蛛程序收錄更多的網頁。

抓取頻次

抓取頻次是搜索引擎在單位時間內(天級)對網站服務器抓取的總次數,如果搜索引擎站點的抓取頻次過高,很有可能造成服務器不穩定,Baiduspider會根據網站內容更新頻率和服務器壓力等因素自動調整抓取頻次。

站點索引量

站點中有多少頁面可以作為搜索候選結果,就是一個網站的索引量。

站點內容頁面需要經過搜索引擎的抓取和層層篩選後,方可在搜索結果中展現給用戶。頁面通過系統篩選,並被作為搜索候選結果的過程,即為建立索引。

目前site語法的數值是索引量估算值,比較不準。推薦站長們使用我們的新工具,同時我們也正在努力改進site語法。

無效收錄

關於無效收錄百度站長@hanbelt是這麽說的:首先是字面意思,所謂「無效」,就是跟沒有是一樣的,不會帶來任何搜索流量。舉個例子,關於「小孩發燒怎麽辦」的內容百度索引庫裏已經有50W個頁面了,而這個主題短時間內也不可能有啥新鮮內容,除非科技突然大突破,百度認為,這個索引量的頁面已經足夠解決用戶需求了,再多索引也是浪費資源,新索引進來的頁面沒必要再放入這個索引庫裏,轉而放到底層庫了。

自然排名

與付費和廣告無關,只是依靠頁面本身相關性、重要性而出現在搜索引擎結果頁面的排名,在一個搜索引擎結果頁面上,廣告或付費排名通常都有企業推廣、贊助商鏈接之類的名稱,自然排名則沒有這些標記。

網頁快照

搜索引擎在收錄網頁時,對網頁進行備份,存在自己的服務器緩存裏,當用戶在搜索引擎中點擊「網頁快照」鏈接時,搜索引擎將Spider系統當時所抓取並保存的網頁內容展現出來,稱為「網頁快照」。

*百度快照更新是什麽意思?

網站權重(Page Strength)

網站權重是指搜索引擎給網站(包括網頁)賦予一定的權威值,對網站(含網頁)權威的評估評價。一個網站權重越高,在搜索引擎所占的份量越大,在搜索引擎排名就越好。其中有幾點需要註意:1、權重不等於排名 2、權重對排名有著非常大的影響 3、整站權重的提高有利於內頁的排名。

*誤區:例如人們經常討論的百度權重其實並不是百度官方給出的概念,而是愛站、站長工具等網站推出的針對網站關鍵詞排名預計給網站帶來流量,劃分等級0-10第三方網站歡迎度評估數據。

網站降權(Right down)

利用搜索引擎策略缺陷,以惡意手段獲取與網頁質量不符排名,而引發搜索結果和用戶體驗下降的行為都會被搜索引擎視為作弊行為,作弊按照「輕者輕罰,重者重罰」原則:對用戶體驗及搜索結果質量影響不大的,去除作弊部分所獲權值,對用戶體驗及搜索結果質量影響嚴重的,去除作弊部分所獲權值並降低網站權重,直至徹底清理出搜索結果。

K站

俗稱「拔毛」。所謂百度K站便是封殺了你的網站,你的收錄會是0,從百度搜刮引擎上基礎就找不到你的網站影蹤,痕跡。K站可以說是給百度凍結了,通常要恢復會需要很長的時間。

Alexa排名

它是指網站的世界排名,主要分為綜合排名和分類排名,Alexa提供了包括綜合排名、到訪量排名、頁面訪問量排名等多個評價指標信息,大多數人把它當作當前較為權威的網站訪問量評價指標。

網站PR值(Page Rank)

Page Rank,網頁排名,又稱網頁級別、Google左側排名或佩奇排名,是一種由搜索引擎根據網頁之間相互的超鏈接計算的技術(級別從1到10),而作為網頁排名的要素之一,以Google公司創辦人拉裏·佩奇(Larry Page)之姓來命名。

*2014谷歌官方宣布放棄PR

robots.txt

Robots協議(也稱為爬蟲協議、機器人協議等)的全稱是「網絡爬蟲排除標準」(Robots Exclusion Protocol),網站通過Robots協議告訴搜索引擎哪些頁面可以抓取,哪些頁面不能抓取。

網站地圖(sitemap)

網站地圖,又稱站點地圖。一般有兩種常用的格式,一種是xml格式的,一種是html格式。其中html多為靜態頁面,用於給用戶展示,幫助用戶更好地在網站搜索需要的內容。而xml格式多用於提交給搜索引擎,供搜索引擎抓取網頁頁面。

沙盒效應(Sandbox )

由最主要的搜索引擎Google所決定的搜索引擎結果頁面(搜索結果)中,新發布的網站排名越來越低。這一現象被稱為「沙盒效應」。它們會對那些鏈接流行度迅速攀升的網站進行冷處理以防止SEOer過度優化。網頁可以展現它要的內容,但會被放在「沙箱」裏面,而對任何搜索請求都不會得到最高排名其後來的流行度經過一段時間還保持不變,或者逐漸上升,那麽搜索引擎就開始取消冷處理並且給鏈接流行度更高的權重,使得搜索排名上升。

SEO常見知識點-Google SEO

互聯網數據中心(IDC:Internet Data Center)

數據中心不僅是一個網絡概念,還是一個服務概念,它構成了網絡基礎資源的一部分,提供了一種高端的數據傳輸服務和高速接入服務。數據中心提供給用戶綜合全面的解決方案,為政府上網、企業上網、企業IT管理提供專業服務,使得企業和個人能夠迅速借助網絡開展業務,把精力集中在其核心業務策劃和網站建設上,而減少IT方面的後顧之憂。

互聯網服務提供商(ISP:Internet Service Provider)

互聯網服務提供商,即向廣大用戶綜合提供互聯網接入業務、信息業務、和增值業務的電信運營商。如中國電信、中國聯通等互聯網運營單位及其在各地的分支機構和下屬的組建局域網的專線單位。目前中國電信(China Telecom)和中國網通(China Net Com)是中國最大的ISP。CT以中國南方為主要的業務地區,而CNC則以中國北方為主要的業務區域,所以習慣上我們會稱「南電信,北網通」。除此對互聯網資源有所掌控的還有:中國移動(China Mobile)、中國聯通(China Unicom)、中國鐵通等,這些運營商掌握著少量的互聯網資源。

電信與信息服務業務經營許可證(ICP:Internet Content Provider)

網絡內容服務商英文為 Internet Content Provider 簡寫為ICP,這個理解起來比較容易,就是只要網站放在國內主機空間上的網站都需要在工信部那裏申請一個ICP號,也就是我們平時經常說的「網站備案」,網站所有者自己在工信部官方網站上申請或者通過主機空間商申請都可以。普通的ICP備案就是獲取一個ICP號,這樣國家就認可你的網站是合法的了,否則就是不合法的。ICP證由通信管理局核發。

網站備案

網站備案是指向主管機關報告事由存案以備查考。行政法角度看備案,實踐中主要是《立法法》和《法規規章備案條例》的規定。網站備案的目的就是為了防止在網上從事非法的網站經營活動,打擊不良互聯網信息的傳播,如果網站不備案的話,很有可能被查處以後關停。

*其實網站備案、ICP備案、域名備案本質上沒有區別,都是需要給網站申請ICP備案號。網站的備案是根據空間IP來的,域名要訪問空間必須要求能夠解析一個IP地址。網站備案指的就是空間備案,域名備案就是對能夠解析這個空間的所有域名進行備案。

*域名備案審核時間一般是20個工作日左右,若是在空間域名網絡購買虛擬主機,一般七天左右即可協助域名備案完成。審核成功後即可正常訪問。

雲服務器(ECS:Elastic Compute Service)

是一種簡單高效、處理能力可彈性伸縮的計算服務,其管理方式比物理服務器更簡單高效。用戶無需提前購買硬件,即可迅速創建或釋放任意多臺雲服務器。

虛擬專用服務器(VPS:Virtual private server)

VPS是虛擬服務器,每個VPS都可分配獨立公網IP地址、獨立操作系統、獨立超大空間、獨立內存、獨立CPU資源、獨立執行程序和獨立系統配置等。

*雲服務器簡單一點說,就是由超級計算機上劃分出的虛擬機。本質上和傳統VPS主機一樣,都屬於虛擬機,不同點在於,雲主機是以超級計算機為物理支持,而VPS主機則是單臺服務器為物理支持。所以雲服務器可以彈性計算,隨時升級,而VPS有獨立的內存和硬盤,也有獨立的帶寬和IP。

內容分發網絡(CDN:Content Delivery Network)

CDN的全稱是Content Delivery Network,即內容分發網絡。其基本思路是盡可能避開互聯網上有可能影響數據傳輸速度和穩定性的瓶頸和環節,其目的是使用戶可就近取得所需內容,解決Internet網絡擁擠的狀況,提高用戶訪問網站的響應速度。

*幾乎所有的大型網站都在用CDN,看看他們在搜索引擎中的表現就可以知道不會任何的負面影響了。但我們建議站長盡量選擇技術成熟的CDN服務商,某些CDN服務商會導致網站在某些地區訪問不穩定,可能會影響Baiduspider的抓取。

Whois

簡單說,whois就是一個用來查詢域名是否已經被註冊,以及註冊域名的詳細信息的數據庫(如域名所有人、域名註冊商)。

域名(Domain Name)

域名是由一串用點分隔的名字組成的Internet上某一臺計算機或計算機組的名稱,用於在數據傳輸時標識計算機的電子方位(有時也指地理位置,地理上的域名,指代有行政自主權的一個地方區域)。域名是一個IP地址上有「面具」。

*搜索引擎對.cn .org .com沒有偏好。

首選域

首選域是您希望搜索引擎用來將您的網頁編入索引的域(有時也指規範域),就是網站首選的域名。比如:一個站點有兩個域名:www.***.com.,***.com。那麽搜索引擎默認以為,這兩個域名是指向同一個網站的。在搜索引擎收錄和展示穩定下來後,它會選擇其中一個域名來展示給用戶,那麽這個域名就叫做首選域(基本等同主域名)。

頂級域名

域名由兩個或兩個以上的詞構成,中間由點號分隔開,最右邊的那個詞稱為頂級域名。

*一般來說,可以粗暴的認為域名中沒有「.」,為頂級域名,有幾個「.」代表為幾級域名。

DNS解析(DNS analysis )

人們習慣記憶域名,但機器間互相只認IP地址,域名與IP地址之間是多對一的關系,一個ip地址不一定只對應一個域名,且一個域名只可以對應一個ip地址,它們之間的轉換工作稱為域名解析,域名解析需要由專門的域名解析服務器來完成,整個過程是自動進行的。

域名解析(Domain name resolution)

域名解析是把域名指向網站空間IP,讓人們通過註冊的域名可以方便地訪問到網站的一種服務。IP地址是網絡上標識站點的數字地址,為了方便記憶,采用域名來代替IP地址標識站點地址。域名解析就是域名到IP地址的轉換過程。域名的解析工作由DNS服務器完成。

*舉例,你進一個高級小區訪問一個朋友, 在門口你問保安我的朋友小明在哪兒。保安告訴你,在C座,這就叫「DNS解析」。當然,你的朋友小明早就告訴C座的看門大爺,如果有找小明的就讓他來908室。這就叫「域名解析」。

A記錄

將域名指向一個IPv4地址(例如:10.10.10.10),需要增加A記錄。如百度IP地址為123.125.114.144,這是需要網民輸入http://baidu.com就能訪問到IP地址,則需要增加A記錄。

CNAME記錄(別名記錄)

如果將域名指向一個域名,實現與被指向域名相同的訪問效果,需要增加CNAME記錄。如需要達到瀏覽器輸入http://baidu.com和www.baidu.com相同效果,則需要CNAME記錄。

泛解析(泛域名解析)

泛解析即所有子域名均被解析到統一地址,如http://zhidao.baidu.com和http://news.baidu.com全部指向www.baidu.com,則使用泛解析。

網絡地址(URL)

統一資源定位符是對可以從互聯網上得到的資源的位置和訪問方法的一種簡潔的表示,是互聯網上標準資源的地址。互聯網上的每個文件都有一個唯一的URL,它包含的信息指出文件的位置以及瀏覽器應該怎麽處理它。

*你可以說「百度的域名是baidu.com」,不能說「百度知道的域名是zhidao.baidu.com」,應該說「百度知道的網址(URL)是zhidao.baidu.com」

超文本傳輸協議(HTTP:HyperText Transfer Protocol)

HTTP是一個客戶端和服務器端請求和應答的標準(TCP)。客戶端是終端用戶,服務器端是網站。通過使用Web瀏覽器、網絡爬蟲或者其它的工具,客戶端發起一個到服務器上指定端口(默認端口為80)的HTTP請求。(我們稱這個客戶端)叫用戶代理(user agent)。應答的服務器上存儲著(一些)資源,比如HTML文件和圖像。

HTTPS(HTTPS:Hypertext Transfer Protocol over Secure Socket Layer)

它是一個安全通信通道,它基於HTTP開發,用於在客戶計算機和服務器之間交換信息。它使用安全套接字層(SSL)進行信息交換,簡單來說它是HTTP的安全版。

HTTP狀態碼

HTTP狀態碼(HTTP Status Code)是用以表示網頁服務器HTTP響應狀態的3位數字代碼。

*HTTP狀態碼只是網頁服務器的響應狀態,而不代指某個網頁。一般來說可以認為2**(請求成功);3** (重定向);4** (網頁請求錯誤);5**(服務器錯誤)。其中,常見狀態碼為:200:正常訪問;301:永久轉向;302:暫時轉向;404:文件不存在;502:服務器錯誤。

SSL證書

SSL證書是數字證書的一種,類似於駕駛證、護照和營業執照的電子副本。因為配置在服務器上,也稱為SSL服務器證書。

SSL 證書就是遵守 SSL協議,由受信任的數字證書頒發機構CA,在驗證服務器身份後頒發,具有服務器身份驗證和數據傳輸加密功能。如果您的網站使用 SSL 證書 (SSL Certificates),並顯示了簽章(Secured Seal),您的客戶就知道他們的交易安全可靠,並且充分信賴您的網站。

內容管理系統(CMS:Content Management System)

指的是用來創建和管理網站軟件,目前大部分網站都是CMS系統管理、數據庫驅動的動態頁面。

WordPress

WordPress是一種使用PHP語言開發的博客平臺,用戶可以在支持PHP和MySQL數據庫的服務器上架設屬於自己的網站。也可以把 WordPress當作一個內容管理系統(CMS)來使用。

鏡像網站(克隆網站)

指一個或多個域名不同,但內容完全相同的網站。大多情況下,站長出於正優化,如負載均衡,以及某些被墻網站在國內能正常訪問的手法稱為鏡像網站;為了負作弊,如黑帽SEO復製多個網站,意圖獲取更多排名等手段為克隆網站。

超文本標記語言(HTML:HyperText Markup Language)

「超文本」就是指頁面內可以包含圖片、鏈接,甚至音樂、程序等非文字元素。超文本標記語言的結構包括「頭」部分(英語:Head)、和「主體」部分(英語:Body),其中「頭」部提供關於網頁的信息,「主體」部分提供網頁的具體內容。

網站日誌(web log)

網站日誌是記錄web服務器接收處理請求以及運行時錯誤等各種原始信息的以log結尾的文件,確切的講,應該是服務器日誌,網站日誌最大的意義是記錄網站運營中比如空間的運營情況,被訪問請求的記錄,通過網站日誌可以清楚的得知用戶在什麽IP、什麽時間、用什麽操作系統、什麽瀏覽器、什麽分辨率顯示器的情況下訪問了你網站的哪個頁面,是否訪問成功。

相关文章

SEO學習必備12個知識點有哪些?

SEO學習必備12個知識點有哪些?

在做SEO工作的過程中,我們每天都會面臨各種問題,特別是新手小白,剛開始入門SEO,很多時候,我們經常性摸不著重點。畢竟,SEO課程的知識點,相對繁雜,沒有大量的實戰經驗,在SEO學習的時候,經常會混...