把網站加入到 Yahoo 及 Google 的方法 (二)
當你依照《把網站加入到 Yahoo 及 Google 的方法 (一)》一文將網站登錄在各大搜尋引擎時,會發現他們只要求你提交網站首頁的連結,不鼓勵你把每一頁都填上。原因是搜尋器的 bot 可根據網頁上的連結訪問網站上其餘網頁。
上述的運作方式,對網站而言最怕是重要的網頁未能登錄,對搜尋引擎來說亦要花多點時間檢查網站的結構,所以自 2005 年起 Google 引入了 Sitemaps Protocol 解決以上問題,而 2006 年底開始 Yahoo 和 Microsoft Live Search 亦一同支持 Sitemaps 的方法。
什麼是 Sitemaps?
Sitemaps 並不是很多網站也有的導航網頁,雖然兩者的性質有些相似。Sitemaps 其實是一個 XML 文件,遵從指定的格式寫成。有關 Sitemaps 的詳細資料,可參考 sitemaps.org。大家未必懂得 XML 手動製作 Sitemaps,我們可利用一些網上服務免費幫你的網站製作 Sitemaps。
我抽其中一個不需要註冊的服務 XML Sitemaps.com Sitemap Generator 示範。
使用網站服務免費製作 Sitemaps
在製作 Sitemaps 時必須填寫的資料如下:
Starting URL (網站首頁) :例如 http://www.jsolutions.biz
Change frequency (網頁更新頻率):由 always 到 never
Last modification (網頁上次更新日期):可指定一個日期或以伺服器的日期為準
Priority (網頁的優先次聚):由 0 到 1 (1為最優先,製作時不可更改,只可手動更改)
當按「Start」之後,就會開始訪問你的網站以製作 Sitemaps,這需要一點時間,請耐心等候。
檢查和修改 Sitemaps
完成後你可下載 sitemap.xml 檔案及其他版本,我建議大家先用一個文字編輯器例如 notepad 開啟這檔案。首先你要檢查是否所有網頁也包括在 sitemap.xml 內,如果有遺漏,可以自行依照同樣的格式加上,例如我要增加一網頁資料,便需要加入以下編碼:
-
<url>
-
<loc>http://www.jsolutions.biz/new-mission.html</loc>
-
<priority>1.00</priority>
-
<lastmod>2008-07-07T09:23:12+00:00</lastmod>
-
<changefreq>weekly</changefreq>
-
</url>
你可以自行修改每一網頁的 priority 和 changefreq ,不過個人認為這兩項資料只屬參考性質,搜尋引擎未必依從,不修改也可以。編輯完成後,請把 sitemap.xml 上傳到網站的根目錄,例如
http://www.jsolutions.biz/sitemap.xml。
驗證修改過的 Sitemaps
為免修改時刪除或加入了不合規格的資料,我們可以先對其驗證,可用同一網站提供的驗證服務。當一切正確無誤,下一步就是通知搜尋引擎,這有 2 個方法,今次先講一個,另一個方法留待下一篇再談。
用 robots.txt 通知搜尋引擎 Sitemaps 位置
不知大家有沒有聽過 robots.txt 檔案?這一檔案也是放在網站的根目錄,其功用是告訴搜尋引擎那些網頁不要收錄,當其訪問你的網站時,必先讀取這檔案的內容。現在亦可用來通知搜尋引擎 Sitemaps 的位置,只需要在 robots.txt 內加上
「Sitemap: http://www.yoururl.com/sitemap.xml 」
就可以。
首先你要找找你的網站有沒有 robots.txt 這檔案,如果沒有就用 notepad 創建一個,加入以上句子後再上傳到網站根目錄便完成所有程序,性急的朋友可以留意你的網站訪問數據,看看 Google 和 Yahoo 有沒有訪問你的網站,及讀取過那一些網頁。
可以自動製作 Sitemaps 嗎?
若果網站時常會增加網頁,難道每一次都要修改 sitemap.xml 嗎?這要視乎你的網站是如何製作。知名的內容管理系統 CMS 如 Joomla、Drupal、Wordpress、甚至購物車如 osCommerce、Zencart 等都有自動製作 Sitemaps 功能,甚為方便。