內容
1,前言
2,摘要
3,如何使用本文
4,GOOGLE簡介
5,搜索入門
6,初階搜索
6.1,搜索結果要求包含兩個及兩個以上關鍵字
6.2,搜索結果要求不包含某些特定信息
6.3,搜索結果至少包含多個關鍵字中的任意一個
6.4,「+」、「-」和「OR」的混合查詢
6.5,用「+」和「-」減少冗余信息
7,輔助搜索
7.1,通配符問題
7.2,關鍵字的字母大小寫
7.3,搜索整個句子
7.4,搜索引擎忽略的字符和詞彙
7.5,強制搜索
8,進階搜索
8.1,對搜索的網站進行限制
8.2,查詢某一類文件(往往帶有同一擴展名)
8.3,搜索的關鍵字包含在URL鏈接中
8.4,搜索的關鍵字包含在網頁標題中
9,其他罕用語法
9.1,搜索所有鏈接到某個URL地址的網頁
9.2,查找與某個頁面結構內容相似的頁面
9.3,從GOOGLE服務器上緩存頁面中查詢信息
9.4,info
10,圖片搜索
11,目錄內搜索
12,新聞組(USENET)搜索
13,GOOGLE的其他傑出功能
13.1,集成化的工具條
13.2,單詞英文解釋
13.3,網頁翻譯
13.4,搜索結果過濾
14,搜索技巧之關鍵詞選擇初探
15,常用搜索個案
15.1,找人
15.2,找軟件
15.3,找圖片
15.4,找MP3
15.5,找書
16,GOOGLE搜索FAQ
17,後記
——————————————————————————————————
1,前言
我是在2000年上半年知道GOOGLE的。在這之前,我搜索英文信息通常用AltaVista,而搜索中文信息則常用Sina。
但自使用了GOOGLE之後,它便成為我的Favorite Searchengine 了。這也得感謝新浪網友曹溪,因為當初正是因為他的大力推介,才使我識得了GOOGLE。
記得1996年夏季的時候,當我第一次接觸Internet,便被撲面而來的魔力征服了。
那種天涯咫尺的感覺,真是妙不可言。在經歷了瘋狂的WWW衝浪和如癡如醉的BBS沉迷之後,我意識到Internet對我影響至深的還是在於學習方式的變遷。
如何來描述這種變遷呢?以前的學習,一般需要預先在肚子裡存儲下足夠的知識,必要時,就從海量的信息中提取所需的部分。
這種學習方式造就了很多「才高八斗,學富五車」的大才子。但是,到了信息領域大大超出「四書五經」的新時期,預先無目的的吞下海量信息的學習方式就有些不合時宜了。
比方說,我們到了大型的圖書城,往往有一種不知所措的感覺。
舊有的學習方式需要變更以適應這個信息爆炸的年代。目的明確的去學習,即先知道要學什麼,然後有目的的去尋找答案,這種方式看上去更加有效率。
我不妨把這稱為「即學式」,相應的,舊有的稱為「預學式」。
不過,「即學式」的實施是有前提的。首先,要求學習者擁有一個包羅萬象的信息庫,以供隨時抽取各種目的信息;其次,是需要一個強勁的信息檢索工具,以便高效率的從信息庫中提取信息。
很明顯,Internet可以充當那個海量的信息庫,而搜索引擎,則正是尋找光明之火的絕好工具。
「公欲善其事,必先利其器」。
Internet只有一個,而搜索引擎則有N多個。
有搜索高手說,所謂搜索,就是「在正確的地方使用正確的工具和正確的方法尋找正確的內容」。
但是,對於普通人而言,掌握諸多搜索引擎的可能性似乎不大。用一兩個相對強勁的具代表性的工具達到絕大多數搜索目的更為人們所迫切希望。不同的時期,湧現出不同的強者。
就目前而言,我們非常幸運的有了:
*****GOOGLE*****
2,摘要
本文簡要的介紹了GOOGLE的歷史和特點,GOOGLE的基本搜索語法和高級搜索語法,GOOGLE的特色功能,包括圖片搜索、新聞組搜索和集成工具條等,還簡單的介紹了一些常用搜索技巧和實用個案。
儘管本文名為「GOOGLE搜索從入門到精通」,但事實上,筆者對運用GOOGLE進行搜索也尚處於「入門」階段。
3,如何使用本文
閱讀本文最好具備一些最基本的布爾代數基礎,如「與」、「或」、「非」等。
不過,即 便你沒有這方面的知識,也不必在意。對那些實例進行練習,你的疑惑就會迎刃而解。
對於剛剛接觸網絡搜索的讀者而言,也許你應該從頭到尾的閱讀本文;但對於那些有一定搜索基礎的讀者而言,只需要跳躍著尋找自己所需要的信息就可以了。
當然,如果你有一定的英文基礎,也可以把本文與GOOGLE大全(
http://www.google.com/about.html)參照閱讀,那樣效果會更好。
4,GOOGLE簡介
Google(
www.google.com)是一個搜索引擎,由兩個斯坦福大學博士生Larry Page與Sergey Brin於1998年9月發明,Google Inc. 於1999年創立。
2000年7月份,Google替代Inktomi成為Yahoo公司的搜索引擎,同年9月份,Google成為中國網易公司的搜索引擎。
98年至今,GOOGLE已經獲得30多項業界大獎。
GOOGLE的成功得益於其強大的功能和獨到的特點:
GOOGLE支持多達132種語言,包括簡體中文和繁體中文;
GOOGLE網站只提供搜索引擎功能,沒有花裡胡哨的累贅;
GOOGLE速度極快,據說有10000多台服務器,200多條T3級寬帶;
GOOGLE的專利網頁級別技術PageRank能夠提供高命中率的搜索結果;
GOOGLE的搜索結果摘錄查詢網頁的含有關鍵字的內容,而不僅僅是網站簡介;
GOOGLE智能化的「手氣不錯」功能,提供可能最符合要求的網站;
GOOGLE的「網頁快照」功能,能從GOOGLE服務器裡直接取出緩存的網頁。
5,搜索入門
要用GOOGLE做搜索,當然首先要進GOOGLE網站--
www.google.com;不過,163.com和yahoo.com.cn使用的實際上也是GOOGLE搜索引擎,只是對搜索結果進行了編排,但無法提供一些特色功能,如圖片搜索等。
第一次進入GOOGLE,它會根據你的操作系統,確定語言界面。
需要提醒的是,GOOGLE是通過cookie來存儲頁面設定的,所以,如果你的系統禁用cookie,就無法對GOOGLE界面進行個人設定了。
GOOGLE的首頁很清爽,LOGO下面,排列了四大功能模塊:網站、圖像、新聞組和目錄服務。
默認是網站搜索。現在進行第一次搜索實踐,要查找所有關於「易筋經」的中文網站和網頁。
在搜索框內輸入一個關鍵字「易筋經」,然後點擊下面的「google搜索」按鈕(或者直接回車),結果就出來了。
搜索:「易筋經」
結果:已搜索有關易筋經的中文(簡體)網頁。 共約有5,930項查詢結果,這是第1-10項。 搜索用時0.12秒。
6,初階搜索
在上例子中,你已經知道了最基本的搜索,即查詢包含單個關鍵字的信息。現在,進一步探討多個關鍵字以及關鍵字間不同邏輯關係的查詢。
6.1,搜索結果要求包含兩個及兩個以上關鍵字
一般搜索引擎需要在多個關鍵字之間加上「+」,而GOOGLE無需用明文的「+」來表示邏輯「與」操作,只要空格就可以了。
示例:搜索所有包含關鍵詞「易筋經」和「吸星大法」的中文網頁
搜索:「易筋經 吸星大法」
結果:已搜索有關易筋經 吸星大法的中文(簡體)網頁。 共約有774項查詢結果,這是第1-10項 。 搜索用時0.24秒。
注意:文章中搜索語法外面的引號僅起引用作用,不能帶入搜索欄內。
6.2,搜索結果要求不包含某些特定信息
GOOGLE用減號「-」表示邏輯「非」操作。
示例:搜索所有包含「易筋經」而不含「吸星大法」的中文網頁
搜索:「易筋經 -吸星大法」
結果:已搜索有關易筋經 -吸星大法的中文(簡體)網頁。 共約有5,150項查詢結果,這是第1-10項 。 搜索用時0.40秒。
注意:這裡的「+」和「-」號,是英文字符,而不是中文字符的「+」和「-」。此外,操作符與作用的關鍵字之間,不能有空格。
比如「易筋經 - 吸星大法」,搜索引擎將視為關鍵字為易筋經和吸星大法的邏輯「與」操作,中間的「-」被忽略。
6.3,搜索結果至少包含多個關鍵字中的任意一個GOOGLE用大寫的「OR」表示邏輯「或」操作。
假定你是布蘭妮和批頭士的歌迷,現在要查找所有關於布蘭妮和批頭士的中文網頁。
示例:搜索包含布蘭妮「Britney」或者披頭士「Beatles」、或者兩者均有的中文網頁。
搜索:「Britney OR Beatles OR 布蘭妮 OR 批頭士」
結果:已搜索有關Britney OR Beatles OR 布蘭妮 OR 批頭士的中文(簡體)網頁。 共約有31,300項查詢結果,這是第1-10項 。
注意:小寫的「or」,在查詢的時候將被忽略;這樣上述的操作實際上變成了一次「與」查詢。
6.4,「+」、「-」和「OR」的混合查詢
混合查詢涉及到邏輯操作符的順序問題。一般而言,搜索引擎按照從左往右的順序讀取操作符號。
如果只涉及「與」操作和「非」操作,則不會產生順序問題,搜索結果數量和關鍵字順序無關,不過,具體搜索的結果順序會視關鍵字的順序而定。
單純的「或」操作也同樣道理。但是,如果「或」查詢和其他兩種查詢混合在一起,問題就複雜了。現在我們做這樣的查詢:「所有關於Britney或者Beatles、但是沒有Madonna相關信息的中文網頁」。
搜索:「Britney OR Beatles -Madonna」
結果:已搜索有關Britney OR Beatles -Madonna的中文(簡體)網頁。 共約有16,200項查詢結果,這是第1-10項 。 搜索用時0.23秒。
搜索:「-Madonna Britney OR Beatles」
結果:已搜索有關-Madonna Britney OR Beatles的中文(簡體)網頁。 共約有16,200項查詢結果,這是第1-10項 。 搜索用時0.13秒。
搜索:「Britney -Madonna OR Beatles」
結果:找不到和您的查詢-Britney -Madonna OR Beatles-相符的網頁
搜索:「Britney OR -Madonna Beatles」
結果:找不到和您的查詢-Britney OR -Madonna Beatles -相符的網頁可見,「或」操作的前後兩個關鍵字必須是默認的「與」查詢,否則,搜索引擎將無法完成搜索。
6.5,用「+」和「-」減少冗余信息
通常情況下,用一個關鍵字查詢,會得到很多和查詢目的不相關的冗余信息。我們總是希望,搜索結果的第一個條目中就包含所需要的信息。
「+」和「-」很多時候就起到縮小搜索結果的範圍,以提高查詢結果命中率。
例:查閱天龍八部具體是哪八部。
分析:如果光用「天龍八部」做關鍵字,搜索結果有20,300項,而且排前列的主要與金庸的小說《天龍八部》相關,很難找到所需要的資訊。可以用兩個方法減少無關結果。
1,如果你知道八部中的某一部,比如阿修羅,增加「阿修羅」關鍵字。
「天龍八部 阿修羅」的搜索結果就只有1,050項,可以很快找到全部八部。
2,如果你不知道八部中的任何一部,但知道這與佛教相關,可以排除與金庸小說相關的記錄。
「天龍八部 佛教 -金庸」的查詢結果為1,120項,可以迅速找到需要的資料。
7,輔助搜索
7.1,通配符問題
很多搜索引擎支持通配符號,如「*」代表一連串字符,「?」代表單個字符等。GOOGLE不支持通配符,只能做精確查詢,關鍵字中的「*」或者「?」會被忽略掉。
7.2,關鍵字的字母大小寫
GOOGLE對英文字符大小寫不敏感,「GOD」和「god」搜索的結果是一樣的。
7.3,搜索整個句子
GOOGLE的關鍵字可以是詞組(中間沒有空格),也可以是句子(中間有空格),但是,用句子做關鍵字,必須加英文引號。
示例:搜索包含「long, long ago」字串的頁面。
搜索:「"long long ago"」
結果:已搜索有關long long ago的中文(簡體)網頁。 共約有16,500項查詢結果,這是第1-10項 。 搜索用時0.06秒。 。
7.4,搜索引擎忽略的字符和詞彙
GOOGLE對一些網路上出現頻率極高的英文單詞,如「i」、「com」、「www」等,以及一些符號如「*」、「.」等,作忽略處理。
示例:搜索關於第一次世界大戰的信息
搜索:「"worldwar i"」
結果:"i"使用過於頻繁,沒有被列入搜索範圍。已向英特網搜索"worldwar i". 共約有7,370項查詢結果,這是第1-10項 。 搜索用時0.17秒。
7.5,強制搜索
如果要對忽略的關鍵字進行強制搜索,則需要在該關鍵字前加上明文的「+」號。
示例:搜索包含「Who am I ?」的網頁。如果用「"who am i ?"」,「Who」、「I」、「?」會被省略掉,搜索將只用「am」作關鍵字,所以應該用強制搜索。
搜索:「"+who +am +i"」
結果:已向英特網搜索"+who +am +i". 共約有332,000項查詢結果,這是第1-10項 。
搜
索用時3.68秒。
注意:大部分常用英文符號(如問號,句號,逗號等)無法成為搜索關鍵字,加強制也不行。
8,進階搜索
上面已經探討了GOOGLE的一些最基礎搜索語法。通常而言,這些簡單的搜索語法已經能解決絕大部分問題了。
不過,如果想更迅速更貼切找到需要的信息,你還需要瞭解更多的東西。
8.1,對搜索的網站進行限制
「site」表示搜索結果局限於某個具體網站或者網站頻道,如「sina.com.cn」、「edu.sina.com.cn」,或者是某個域名,如「com.cn」、「com」等等。如果是要排除某網站或者域名範圍內的頁面,只需用「-網站/域名」。
示例:搜索中文教育科研網站(edu.cn)上所有包含「金庸」的頁面。
搜索:「金庸 site:edu.cn」
結果:已搜索有關金庸 site:edu.cn的中文(簡體)網頁。 共約有1,730項查詢結果,這是第1-10項 。 搜索用時0.23秒。
示例:搜索包含「金庸」和「古龍」的中文新浪網站頁面,搜索:「金庸 古龍 site:sina.com.cn」
結果:已在sina.com.cn搜索有關金庸 古龍 的中文(簡體)網頁。 共約有734項查詢結果,這是第1-10項 。 搜索用時0.12秒。
示例:搜索新浪文教頻道中關於魯迅的信息。
搜索:「魯迅 site:edu.sina.com.cn」
結果:已在edu.sina.com.cn搜索有關 魯迅的中文(簡體)網頁。 共約有672項查詢結果,這是第1-10項 。 搜索用時0.24秒。
注意:site後的冒號為英文字符,而且,冒號後不能有空格,否則,「site:」將被作為一個搜索的關鍵字。
此外,網站域名不能有「http」以及「www」前綴,也不能有任何「/」的目錄後綴;網站頻道則只局限於「頻道名.域名」方式,而不能是「域名/頻道名」方式。
諸如「金庸 site:edu.sina.com.cn/1/」的語法是錯誤的。
8.2,查詢某一類文件(往往帶有同一擴展名)
「filetype:」,這是個尚在測試階段的GOOGLE特色查詢,不過功能已經非常強大,可以做很多意想不到的事情哦。
最重要的文檔搜索是PDF搜索。
PDF是ADOBE公司開發的電子文檔格式,現在已經成為互聯網的電子化出版標準。
目前GOOGLE檢索的PDF文檔大約有2500萬左右。PDF文檔通常是一些圖文並茂的綜合性文檔,提供的資訊一般比較集中全面。
示例:搜索關於電子商務(ECOMMERCE)的PDF文檔。
搜索:「ecommerce filetype:pdf」
結果:已向英特網搜索ecommerce filetype:pdf. 共約有25,500項查詢結果,這是第91-100項 。 搜索用時0.44秒。
下面是某項搜索結果:
[PDF]
www.ecommerce.gov/apec
文檔類型: PDF/Adobe Acrobat - 一般文字檔
Page 1. A Partnership of the Business Community With APEC Economies
E-COMMERCE
READINESS ASSESSMENT GUIDE
www.ecommerce.gov/apec Page 2. ...
www.ecommerce.gov/apec/docs/readiness_gu...ess_guide_5.pdf - 類似網頁
可以看到,GOOGLE在PDF檔前加上了[PDF]的標記,而且,GOOGLE把PDF文件轉換成了文字檔,點擊「一般文字檔」,可以粗略的查看該PDF文檔的大致內容。當然,PDF原有的圖片以及格式是沒有了。
搜索PDF文檔還可以用「inurl:」語法。比如上例,也可以用「inurl:pdf ecommerce」。
搜索結果數量大致相同,不過查詢結果順序則略有很大差別。
注意,上述查詢均是對PDF內文的檢索,「ecommerce」這個關鍵字是包含在PDF文檔中的。
「filetype」的另一個強大用處則在圖片搜索。下文將對GOOGLE的圖片搜索功能作詳細說明,此處只是略提一下。
進入「
http://images.google.com/」,查找關於本拉登的JPG圖片。
搜索:「Bin Laden filetype:jpg」
結果:搜索有關 Bin Laden filetype:jpg 的圖片()。(試驗版) 共約有1,630項查詢
結果,這是第1-20項 。 搜索用時0.14秒。
除此之外,我尚未發現其他的filetype用法。如果有誰知道,請給我發郵件。預先感謝。
8.3,搜索的關鍵字包含在URL鏈接中
「inurl」語法返回的網頁鏈接中包含第一個關鍵字,後面的關鍵字則出現在鏈接中或者網頁文檔中。
有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如「MP3」、「GALLARY」等,於是,就可以用INURL語法找到這些相關資源鏈接,然後,用第二個關鍵詞確定是否有某項具體資料。
INURL語法和基本搜索語法的最大區別在於,前者通常能提供非常精確的專題資料。
示例:查找MIDI曲「滄海一聲笑」。
搜索:「inurl:midi 滄海一聲笑」
結果:已搜索有關inurl:midi 滄海一聲笑的中文(簡體)網頁。 共約有16項查詢結果,這是第1-10項 。 搜索用時0.16秒。
示例:查找微軟網站上關於windows2000的安全課題資料。
搜索:「inurl:security windows2000 site:microsoft.com」
結果:已在microsoft.com內搜索有關inurl:security windows2000 的網頁。 共約有188項查詢結果,這是第1-10項 。 搜索用時0.27秒。
注意:「inurl:」後面不能有空格,GOOGLE也不對URL符號如「/」進行搜索。例如,GOOGLE會把「cgi-bin/phf」中的「/」當成空格處理。
「allinurl」語法返回的網頁的鏈接中包含所有作用關鍵字。這個查詢的關鍵字只集中於網頁的鏈接字符串。
示例:查找可能具有PHF安全漏洞的公司網站。通常這些網站的CGI-BIN目錄中含有PHF腳本程序(這個腳本是不安全的),表現在鏈接中就是「域名/cgi-bin/phf」。
語法:「allinurl:"cgi-bin" phf +com」
搜索:已向英特網搜索allinurl:"cgi-bin" phf +com. 共約有37項查詢結果,這是第1-10項 。 搜索用時0.36秒。
8.4,搜索的關鍵字包含在網頁標題中
「intitle」和「allintitle」的用法類似於上面的inurl和allinurl,只是後者對URL進行查詢,而前者對網頁的標題欄進行查詢。
網頁標題,就是HTML標記語言title中之間的部分。
網頁設計的一個原則就是要把主頁的關鍵內容用簡潔的語言表示在網頁標題中。
因此,只查詢標題欄,通常也可以找到高相關率的專題頁面。
示例:查找日本明星籐原紀香的照片集。
搜索:「intitle:籐原紀香 寫真」
結果:已搜索有關intitle:籐原紀香 寫真的中文(簡體)網頁。 共約有465項查詢結果,這是第1-10項 。 搜索用時0.16秒。
9,其他罕用語法
9.1,搜索所有鏈接到某個URL地址的網頁
如果你擁有一個個人網站,估計很想知道有多少人對你的網站作了鏈接。
而「link」語法就能讓你迅速達到這個目的。
示例:搜索所有含指向華軍軟件園「
www.newhua.com」鏈接的網頁。
搜索:「link:
www.newhua.com」
結果:搜索有鏈接到
www.newhua.com的網頁 。 共約有856項查詢結果,這是第1-10 。
搜索用時0.17秒。
注意:「link」不能與其他語法相混合操作,所以「link:」後面即使有空格,也將被GOOGLE忽略。
9.2,查找與某個頁面結構內容相似的頁面
「related」用來搜索結構內容方面相似的網頁。例:搜索所有與中文新浪網主頁相似的頁面(如網易首頁,搜狐首頁,中華網首頁等),「related:wwwsina.com.cn/index.shtml」。
9.3,從GOOGLE服務器上緩存頁面中查詢信息「cache」用來搜索GOOGLE服務器上某頁面的緩存,通常用於查找某些已經被刪除的死鏈接網頁,相當於使用普通搜索結果頁面中的「網頁快照」功能。
示例:查找GOOGLE緩存的中文yahoo首頁
搜索:「cache:
www.yahoo.com.cn」
結果:這是 G o o g l e 內
http://cn.yahoo.com/ 的頁庫快照。
G o o g l e 已先預覽各網站,拍下網頁的快照存檔。
這網頁可能有更新的版本,請按此查看新版。
Google 和網頁作者無關,不對網頁的內容負責。
..
9.4,info
info用來顯示與某鏈接相關的一系列搜索,提供cache、link、related和完全包含該鏈接的網頁的功能。
示例:查找和新浪首頁相關的一些資訊。
搜索:「info:
www.sina.com.cn」
結果:有關
www.sina.com.cn的網頁信息。
新浪首頁
北京站 上海站 廣東站. ... 首頁, |, 新聞, |, 體育, |, 財經, |,科技, |, 娛樂, |, 遊戲, |, 軍事, |, 健康, |, 教育, |, 汽車, |,
女性, |, 個人家園. ...
簡介: 位於北京的新聞中心,包括新聞與評論。
類別: World > Chinese Simplified > 新聞
Google 提供這個網址的信息:
查看Google網頁快照裡
www.sina.com.cn的存檔
尋找和
www.sina.com.cn類似的網頁
尋找網頁有鏈接到
www.sina.com.cn
尋找網頁包含有"www.sina.com.cn"
10,圖片搜索
我不得不承認,GOOGLE的圖片搜索功能真是個偉大的發明!!GOOGLE自稱可以檢索320,000,000張圖片,並稱自己為「互聯網上最好用的圖像搜索工具」。儘管目前該功能尚在B測試階段,但的確已經非常好用!
GOOGLE首頁點擊「圖像」鏈接就進入了GOOGLE的圖像搜索界面「images.google.com」。
你可以在關鍵字欄位內輸入描述圖像內容的關鍵字,如「britney spears」,就會搜索到大量的小甜甜布蘭妮的圖片。
我目前尚不是很清楚圖片的排列標準,不過以觀察來看,似乎圖片文件名完全符合關鍵字的結果排列比較考前,然後才按照普通的頁面搜索時的標準排列。
GOOGLE給出的搜索結果具有一個直觀的縮略圖(THUMBNAIL),以及對該縮略圖的簡單描述,如圖像文件名稱,以及大小等。
點擊縮略圖,頁面分成兩禎,上禎是圖像之縮略圖,以及頁面鏈接,而下禎,則是該圖像所處的頁面。
屏幕右上角有一個「Remove Frame」的按鈕,可以把框架頁面迅速切換到單禎的結果頁面,非常方便。
GOOGLE圖像搜索目前支持的語法包括「+」,「-」,「OR」,「site」和「filetype」。
示例:查找美國教育網上的宇宙大爆炸jpg圖片
搜索:「BIG BANG filetype:jpg site:edu」
結果:搜索有關 BIG BANG filetype:jpg site:edu 的圖片()。(試驗版) 共約有337項查詢結果,這是第1-20項 。 搜索用時1.99秒。
11,目錄內搜索
如果不想搜索廣泛的網頁,而是想尋找某些專題網站,可以訪問GOOGLE的分類目錄「
http://directory.google.com/」,中文目錄是「
http://directory.google.com/Top/World/Chinese_Simplified/」。
目前GOOGLE使用的分類目錄採用了ODP的內容。「Open Directory Project」是網景公司所主持的一項大型公共網頁目錄。
由全世界各地的義務編輯人員來審核挑選網頁,並依照網頁的性質及內容來分門別類。
因此,在某一目錄門類中進行搜索往往能有更高的命中率。
另外,GOOGLE根據其專業的「網頁級別」(PageRank)技術對目錄中登錄的網站進行了排序,可以讓一般的檢索更具高效率。
示例:查找一下關於癌症治療以及護理方面的中文資料
搜索:先進入中文簡體分類目錄,再進入「健康」子目錄,確定選中「只在健康中搜索」單選項目。在搜索欄內填入「癌症」進行搜索。
結果:在分類健康項中搜索癌症。 共約有370項查詢結果,這是第1-10項 。 搜索用時0.05秒。
可以看到,上述查詢結果比普通的檢索更有效,因為在分類健康項中進行搜索剔除了很多不相關的諸如新聞之類的無效信息。
不過,對於中文用戶而言,現在最大的問題是志願的中文目錄編輯太少,導致收錄站點太少,因此搜索結果範圍顯得過於狹隘。
但願這個問題能隨著GOOGLE以及ODP項目在國內名聲的響亮而能得到改觀。
12,新聞組(USENET)搜索
新聞組有詳盡的分類主題,某些主題還有專人管理和編輯,具有大量的有價值信息。由於新聞組包含的信息實在是海量,因此不利用工具進行檢索是不大可能的。DEJA一直是新聞組搜索引擎中的佼佼者。
2001年2月份,GOOGLE將DEJA收購併提供了所有DEJA的功能。現在,除了搜索之外,GOOGLE還支持新聞組的WEB方式瀏覽和張貼功能。
進入GOOGLE新聞組「
http://groups.google.com/」,你有兩種信息查找方式。
一種是一層層的點擊進入特定主題討論組,另一種則是直接搜索。現在,我們進行一個最簡單的搜索試驗,查找一下新聞組中關於山頂洞人的討論信息。
搜索:「山頂洞人」
結果:在各群組內搜索 山頂洞人 共約有18項查詢結果,這是第1-10項 。 搜索用時0.29秒。
搜索結果默認按照「留言內容」排列,但是你也可以點擊「依照日期」按鈕,讓帖子按照發佈日期排列。
因為新聞組中的帖子實在是多,而且又涉及一些普通搜索所沒有的語法,所以建議使用「高級群組搜尋」進入高級搜索界面。新聞組高級搜索提供留言內容、分類主題、標題、留言者、留言代碼、語言和發佈日期作為條件進行搜索。其中作者項指作者發帖所用的唯一識別號電子信箱。
13,GOOGLE的其他傑出功能
13.1,集成化的工具條
為了方便搜索者,GOOGLE提供了工具條,集成於瀏覽器中,用戶無需打開GOOGLE主頁就可以在工具條內輸入關鍵字進行搜索。此外,工具條還提供了其他許多功能,如顯示頁面PageRank等。
最方便的一點在於用戶可以快捷的在GOOGLE主頁、目錄服務、新聞組搜索、高級搜索和搜索設定之間切換。
欲安裝GOOGLE的工具條,可以訪問「
http://toolbar.google.com/」,按頁面提示可以自動下載並安裝。
不過,GOOGLE工具條目前只支持IE5.0以上版本。
對於經常進行網絡搜索者而言,GOOGLE工具條實在是必備的東西!!
13.2,單詞英文解釋
寫英文文章的時候,最頭疼的事情就是對某個英文單詞的用法不確定。現在有了GOOGLE,一切就迎刃而解了!無論你是想查找某個生詞的意思還是想瞭解某個單詞的用法,均可使用在線詞典。
進入英文GOOGLE,輸入你要查的單詞。舉個例子,我想查一下suggest的用法。結果如下:「Searched the web for suggest. Results 1 - 10 of about 8,000,000. Search
took 0.08 seconds. 」注意看上面句子中,單詞suggest下出現了一個橫線,點擊這個鏈接,就跳轉到另外一個網站「
http://www.dictionary.com/」,GOOGLE已經把單詞提交給該網站的查詢腳本。
看看這個網站所提供的詳盡解釋吧。
13.3,網頁翻譯
你懂英文,但是你不見得就懂德文、法文、拉丁文。如果搜索出來的頁面是這些語言怎麼辦?呵呵,GOOGLE提供了網頁翻譯功能!!雖然目前只支持有限的拉丁語、法語、西班牙語、德語和葡萄牙文,但是我不得不承認,這是個傑出功能。
試著做以下搜索:「big bang site:fr」。這個表示查找關於宇宙大爆炸的法文網頁。看第一條結果:
The Big Bang Website - [ Translate this page ]
.. A propos de Big Bang. Le dernier numero en date. Les anciens numeros.
Autres
activites. Concerts progressifs en France. Emissions de radio. Liens.
perso.club-internet.fr/calyx/bigbang/ - 3k - Cached - Similar pages
有點暈。沒關係,點擊「Translate this page」按鈕。再看結果,嗯,大致能看明白,
這原來是個叫「big bang」的樂隊的網站,與大爆炸無關...
機器翻譯是一個很前沿的人工智能課題,想指望翻譯出來的結果跟專門用英語撰寫的內容是不可能的。
但西文間的互相轉譯比中英文機譯強得多得多了。至少能看明白。
13.4,搜索結果過濾
網絡上的成人內容浩如煙海,而且很多站點具有欺騙或者其他不良企圖,瀏覽者很容易掉入其中的陷阱。
為此,GOOGLE新設立了成人內容過濾功能,見GOOGLE的設置頁面,
http://www.google.com/preferences,最底下有一個選項SafeSearch Filtering。不過,中文狀態下的GOOGLE尚沒有這個功能。
14,搜索技巧之關鍵詞選擇初探
關鍵詞的選擇在搜索中起到決定性的作用,所有搜索技巧中,關鍵詞選擇是最基本也是最有效的。
例一:查找《鏡花緣》一書中淑士國酒保的酸話原文。
分析:如果按照一般的思路,找某部小說中的具體段落,就需要用搜索引擎先找到這本書,然後再翻到該段落。
這樣做當然可以,但是效率很低。如果瞭解目標信息的構成,用一些目標信息所特有的字詞,可以非常迅速的查到所需要的資料。
也就是說,高效率的搜索關鍵字不一定就是目標信息的主題。
在上面的例子中,酒保談到酒的濃淡與貴賤的關係時,之乎者也橫飛。因此,可以用特定的詞語一下子找到目標資料。
搜索:「酒 貴 賤 之」,OK,找到的第一條信息就是鏡花緣的這一段落:「先生聽者:今以酒醋論之,酒價賤之,醋價貴之。因何賤之?為甚貴之?真所分之,在其味之。酒昧淡之,故而賤之;醋味厚之,所以貴之。...」以上的關鍵字選擇技巧可以謂之「特定詞法」。
例二:「黃花閨女」一詞中「黃花」是什麼意思。
分析:「黃花閨女」是一個約定的俗語,如果只用「黃花閨女 黃花」做關鍵詞,搜索結果將浩如煙海,沒什麼價值,因此必須要加更多的關鍵詞,約束搜索結果。
選擇什麼關鍵詞好呢?備選的有「意思」、「含義」、「來歷」、「由來」、「典故」、「出典」、「淵源」等,可以猜到的是,類似的資料,應該包含在一些民俗介紹性的文字裡,所以用諸如「來歷」、「由來」、「出典」等詞彙的概率更高一些。
搜索:「黃花閨女 黃花
由來」,查到「黃花」原來出典於《太平御覽》,與南朝的壽陽公主相關。如果想獲得第一手資料,那就可以用「太平御覽 壽陽公主」做搜索了。
以上的關鍵字選擇技巧可以謂之「近義詞法」。
例三:劉德華同志的胸圍是多少。
分析:首先聲明,這是某個MM要我做的搜索,我把它作為搜索案例而已,沒其他的意思。
非常直接的搜索是,「劉德華 胸圍」,但事實上,這麼搜索出來的結果,儘是一些諸如「劉德華取笑莫文蔚胸圍太小」之類的八卦新聞,無法快速得到所需要的資料。可以想到的是,需要的資料應該包含在劉德華的全面介紹性文字中,除了胸圍,應該還包括他的身高,體重,生日等一系列相關信息。
OK,這樣就可以進一步的增加其他約束性關鍵詞以縮小搜索範圍。
搜索:「劉德華 胸圍 身高」,沒有料到的情況發生了,網上炙手可熱的痞子蔡《第一次親密接觸》裡居然含有這樣關鍵字,阿泰「改編自劉德華《忘情水》的變態歪歌」、「用身高體重三圍和生日來加以編號」。好辦,把這部小說去掉,「劉德華 胸圍 身高 -阿泰」,OK,結果出來了,華仔胸圍84cm。
說明一下,為什麼用「阿泰」而不用「第一次親密接觸」呢?這是因為小說的名字被轉載的時候可能有變動,但裡面角色的名字是不會變的。
以上的關鍵字選擇技巧可以謂之「相關詞法」。
15,常用搜索個案
15.1,找人
分析:一個人在網上揭示的資料通常有:姓名,網名,性別,年齡,畢業學校,工作單位,外號,住址,電話,信箱,BP,手機號碼,ICQ號,OICQ號等等。所以,如果你要瞭解一下你多年沒見過的同學,那不妨用上述信息做關鍵字進行查詢,也許會有大的收穫。
15.2,找軟件
分析一:最簡單的搜索當然就是直接以軟件名稱以及版本號為關鍵字查詢。但是,僅僅有軟件名稱和目標網站,顯然還不行,因為搜索到的可能是軟件的相關新聞。應該再增加一個關鍵字。
考慮到下載頁面上常有「點擊此處下載」或者「download」的提示語,因此,可以增加「下載」或者「download」為關鍵字。
搜索:「winzip 8.0 下載」
結果:已搜索有關winzip 8.0
下載的中文(簡體)網頁。共約有6,670項查詢結果,這是第1-10項。搜索用時0.22秒。
分析二:很多網站設有專門的下載目錄,而且就命名為「download」,因此,可以用INURL語法直接搜索這些下載目錄。
搜索:「winzip 8.0 inurl:download」
結果:已搜索有關winzip 8.0
inurl:download的中文(簡體)網頁。共約有358項查詢結果,這是第1-10項。搜索用時0.44秒。
在互聯網上隨意的下載軟件是不安全的,因為供下載的軟件有可能帶有病毒或者捆綁了木馬,所以,對下載網站作一個限定,是一個穩妥的思路。可以用SITE語法達到這個目的。
共享軟件下載完之後,使用的時候,軟件總跳出警示框,或者軟件的功能受到一定限制。
由於中國的網民多是窮棒子,所以應該再找一個註冊碼。找註冊碼,除了軟件的名稱和版本號外,還需要有諸如「serial number」、「sn」、「序列號」等關鍵字。現在,來搜索一下winzip8.0的註冊碼。
搜索:「winzip 8.0 sn」
結果:已向英特網搜索winzip 8.0 sn. 共約有777項查詢結果,這是第1-10項。搜索用時0.30秒。
15.3,找圖片
除了GOOGLE提供的專門圖片搜索功能,還可以組合使用一些搜索語法,達到圖片搜索之目的。
分析一:專門的圖片集合,提供圖片的網站通常會把圖片放在某個專門目錄下,如「gallary」、「album」、「photo」、「image」等。這樣就可以使用INURL語法迅速找到這類目錄。現在,試著找找小甜甜布蘭妮的照片集。
搜索:「"britney spears" inurl:photo」
結果:已向英特網搜索"britney spears" inurl:photo. 共約有2,720項查詢結果,這是第1-10項。搜索用時0.23秒。
分析二:提供圖片集合的網頁,在標題欄內通常會註明,這是誰誰的圖片集合。於是就可以用INTITLE語法找到這類網頁。
搜索:「intitle:"britney spears" picture」
結果:已向英特網搜索intitle:"britney spears" picture. 共約有317項查詢結果,這是第1-10項。搜索用時0.40秒。
分析三:明星的FANS通常會申請免費個人主頁來存放他們偶像的靚照。於是用SITE語法指定某免費主頁提供站點,是個迅速找到圖片的好辦法。
搜索:「"britney spears" site:geocities.com」結果:已在geocities.com內搜索有關"britney spears"的網頁。共約有5,020項查詢結果,這是第1-10項。搜索用時0.47秒。
15.4,找MP3
分析一:提供MP3的網站,通常會建立一個叫做MP3的目錄,目錄底下分門別類的存放各種MP3樂曲。
所以,可以用INURL語法迅速找到這類目錄。現在用這個辦法找找老歌「say you say me」。
搜索:「"say you say me" inurl:mp3」
結果:已向英特網搜索inurl:mp3 "say you say me". 共約有155項查詢結果,這是第1-10項。搜索用時0.17秒。
分析二:也可以通過網頁標題,找到這類提供MP3的網頁。
搜索:「"say you say me" intitle:mp3」
結果:已向英特網搜索"say you say me" intitle:mp3. 共約有178項查詢結果,這是第1-10項。搜索用時0.73秒。
當然,如果你知道某個網站的下載速度快,而且樂曲全,就可以用SITE語法先到該網站上看看有沒有目標樂曲。
15.5,找書
分析一:對我而言,常訪問的電子圖書館類網站就那麼幾個,比如文藝類的「
www.shuku.net」。於是可以用SITE語法很簡單的找到某本書(如果該網站上有的話)。
比如,「舊唐書 site:shuku.net」,就可以馬上找到該書。如果沒有,通常別的網站上也很難找到。因此,找書的關鍵,是你瞭解一大批著名的圖書館網站。
分析二:我上面介紹的第一項關鍵字選擇技巧特定詞法,對於迅速找到某書或者文章也是極其有用的,當然,這得建立在你已經讀過該書,對書的內容有印象的基礎上。比如如果瞭解堂吉訶德一書戰風車的大致內容,就可以用「吉訶德 風車 桑喬」迅速找到該書。
16,GOOGLE搜索FAQ
Q:如何全面的瞭解google.com?
A:查看網站相關頁面「
http://www.google.com/about.html」。
Q:如何切換google.com的初始語言界面?
A:點擊搜索欄右邊的「使用偏好」(Preferences),選擇「界面語言」(Interface Language)中你期望的語言,點擊最下面的「設定使用偏好」(Save Preferences)按鈕。
需要提醒的是,GOOGLE用cookie記錄這個偏好,所以如果你把瀏覽器的cookie功能關掉
,就無法進行設定。
Q:如何設定每頁搜索結果顯示數量?
A:同上,進入使用偏好,在該頁的「查看結果」(Number of Results)選擇顯示結果數,數目越大,顯示結果需要的時間越長,默認是10項。
Q:搜索到的鏈接無法打開怎麼辦?
A:鏈接無法打開的原因很多,比如網站當機,或者頁面已經死掉等等,可以點擊GOOGLE的「網頁快照」查看在GOOGLE服務器上的網頁緩存。不過,如果該頁面是被當地ISP過濾的話,服務器緩存還是無法打開。唯一的辦法在於利用代理服務器,然後在URL欄內輸入
鏈接的IP地址。
Q:打開搜索結果的鏈接,可是該頁面太大,很難找到一下子找到目的資料怎麼辦?
A:直接打開「網頁快照」,GOOGLE會把關鍵詞用不同顏色標記出來,很容易找到。
Q:點擊每個查詢結果的時候,我想單獨彈出窗口,這該怎麼辦?
A:進入「使用偏好」界面,注意底部有個「結果視窗」項目,選中「開啟新視窗以顯示查詢結果」復選框然後存儲設置就可以了。
17,後記
這個小文章的3.0版本終於更新完成,我終於可以吁口氣了。寫這個搜索普及文章的初衷 和動力在於我以及我的朋友因為使用Internet搜索引擎而使得工作和學習變得更加輕鬆有趣,我想應該有更多的人來分享這種愉悅。需要提及的是,這個小文章的繼續和更新,多虧了新浪網友「搜索引擎9238」的大力幫助和鼓勵。如果沒有他的熱忱意見,我想此文會遜色的多了。其他提供過幫助和意見的網友就一併謝過了。希望你們能繼續給出意見。