如何利用Google Search Appliance服務器做SEO

張貼日期:Jan 03, 2010 1:18:8 PM

如何利用Google Search Appliance服務器做SEO

昨天,Stephen留在中國的Google Search Appliance服務器到了。 這次Google Search Appliance(簡稱GSA)和去年用的那個google mini不一樣,這個GSA基本上可以看做是google mini的升級版本吧。

Google推出GSA的目的是讓那些信息量暴增的企業和機構能用它建立自己的搜索引擎。 它支持的格式有220多種,你可以用它來抓取和收錄自己的博客、網站、數據庫和網絡文件夾等等。 它是機器和軟件全部打包在一起的。

Google官方網站介紹:http://www.google.com/enterprise/search/gsa.html

Google Search Appliance正面

下面直接上圖,機器頂部:

GSA機箱上印有大大的LOGO

機箱非常的重,可能有40多公斤。

為了保護裡面的數據和硬件,機箱要用專用的螺絲刀才能打開。 Google在服務器硬件上有很多專利的。

GSA正面

Google Search Appliance背面1

背面和一般的服務器沒太大差別,但是注意它有一進一出兩個網線口。 設置它的時候需要用另一台電腦輔助。

主要特點有以下這些,隨意看看就好:

-有一個連接器管理工具,可以讓你收錄和那些非WEB格式的文檔。 如:word,pdf,flash等等

-如果使用Feed API和元數據搜索功能,可以為自己的論壇建立搜索功能。

-還提供了強大的Onebox編程接口,可以讓你在搜索結果中展現一些定制的信息。

-強大的安全搜索功能支持多種身份認證方式,使用戶在搜索結果中只見到自己有權限訪問的文檔。

-為小規模文檔設計了專門的網頁排序算法。

-用戶可以定制搜索結果界面,甚至以XML格式的形式,來整合到您自己的應用中去。

這個對SEO也是非常有用的。 為什麼這麼說呢?

你可以把這個GSA看做是google的微縮版,它有爬蟲,有索引庫,有排序算法。 它的的硬件和軟件都是現在google.com這個網站正在用的東西。 所以兩者之間相似程度非常的高。 我在過去操作google mini的時候已經證實:至少它的抓取機制和現在的google.com幾乎是一摸一樣的。

它的排序算法,我覺得也會有很大的相似度。 當然不會一摸一樣的,因為現有的GSA好像是依據06年的搜索技術改變而來,而以google每年450次的算法調整頻率,到現在也相差比較多了。 但是至少和現在的排序算法會有相當大的相似度。

還有一些有意思的東西,大家看上面提到的兩個特點:“Onebox編程接口”和“在搜索結果中只見到自己有權限訪問的文檔”。 這其實就是現在google的一些應用。

Onebox在搜索引擎現有的排序算法中享有優先級,它的數據來源就是Google Base或其他google產品。 這次GSA也提供了這種Onebox的編程接口,現在自己親手給自己的GSA添加Onebox,一定會對你如何利用Onebox拿到更多流量有幫助的。

“在搜索結果中只見到自己有權限訪問的文檔”,這個就類似igoogle 。 還有google其他一些產品,在搜索結果頁面,你登陸了gmail看到的和不登陸看到的是不一樣的。

還有更多的細節,會在以後詳細講述,會把GSA後台的操作也講述一下。 到時候你會對google webmaster tool這個工具有更深一層的理解。

Google Search Appliance背面2

來一張google機櫃裡的圖:

機櫃

google mini (只有GSA一半大小)

利用GSA服務器做SEO測試,可以做出完美的SEO網頁。

gsa側面