一個搜索引擎,還有比這更bāng的東西么?
凱瑟琳未來自己經常登陸的網站,大多都是通過“”而知道的。凱瑟琳覺得,自己很有必要弄出一個搜索引擎來……
如果要追溯的話,搜索引擎的“歷史”比WorldWideWeb還要長。早在Web出現之前,互聯網上就已經存在許多旨在讓人們共享的信息資源了。這些資源當時主要存在于各種允許匿名訪問的FTP站點。
就目前而言,大多數網站都是大學的門戶網,其他的網站實在是太少了,于是搜索引擎的存在意義就被淡化了。
但是未來肯定不會如此。
且不說自己想要將這網上這些蛋疼的人分開,從另一方面而言,因為和《洛杉磯時報》的合作也快要開始了,綜合類型的網站總是會出現的,于是搜索引擎就會變得必要起來。
“也許這是一個不錯的注意……”凱瑟琳撐著下巴,然后在思考著。
而艾爾莎看看時間,已經快到下午…了,于是就去泡紅茶了。
“什么主意?”
艾爾莎一邊在拿著茶餅,一邊問著。
“一個搜索引擎,一個能夠讓我們知道各種網站的一個好東西。”
“我們可以將自己想要的網頁搜索出來?”
“對,就是這樣。”
“這能辦得到嗎?”
“當然……”
雖然是肯定的回答,但是凱瑟琳最后的語氣卻變得有些奇怪。
搜索引擎依靠的是網絡蜘蛛,即WebSpider。
這是一個很形象的比喻,就如同網絡被人稱為“Net”一樣(Net就是“網”的意思)。
準確一點來說,網絡蜘蛛就是通過網頁的鏈接地址來尋找網頁,從網站首頁開始讀取網頁的內容,找到在網頁中的其它鏈接地址,然后通過這些鏈接地址尋找下一個網頁,這樣一直循環下去,直到把這個網站所有的網頁都抓取完為止。如果把整個互聯網當成一個網站,那么網絡蜘蛛就可以用這個原理把互聯網上所有的網頁都抓取下來。簡而言之,網絡蜘蛛就是一個爬行程序,一個抓取網頁的程序。
未來的“百度”、“谷歌”等等網站,都是建立在這樣的一個基礎之上的。
可是凱瑟琳突然想到自己似乎根本就沒有了解過“網絡蜘蛛”這個東西,雖然知道原理,但是想要弄出來……似乎還有些麻煩。
“看來還給成立一個工作組才行。”
開始了抱著雙手站了起來。
“我覺得我們公司的人才已經夠緊張的了。”艾爾莎將紅茶和茶餅放在了凱瑟琳的桌上。
“沒關系,到了五月份,這種情況就能得到緩解。”Intel與斯坦福大學的合作培養的第一批學生已經快要畢業了,有了他們的加入,公司的人才緊缺的問題必然能夠得到一定程度的緩解。
“至少在未來十年內,我們公司的人才都有可能是供不應求,這是一個急速擴張的產業,和那些傳統行業是不一樣的。”
——直到21世紀,這些行業對于人才的渴求依然是強烈的。
當然,中國除外——因為那里的人實在是太多了,乃至于都有了“IT民工”的說法。
凱瑟琳坐了下來,然后喝了一口紅茶。
她一邊喝著茶,一邊在思考著應該如何寫一個網絡蜘蛛的程序出來。
評價一個網絡蜘蛛的好壞,有三個方式,一個是覆蓋率,網絡蜘蛛的首要目標是抓取互聯網上所需的信息。因此,有價值的信息是否都收錄,收錄的比例是網絡蜘蛛的基本評價指標;第二個則是時效性,即事件發生并在互聯網上傳播后(以新聞、論壇、博客等各種形式),用戶需要通過搜索引擎盡快能檢索到相應內容。而索引的前提是收錄,因此需要網絡蜘蛛盡快的抓取互聯網上最新出現的資源;最后則是重復率,互聯網上重復的內容很多,如何盡早的發現頁面重復并消除之,是網絡蜘蛛需要解決的問題。除轉載導致的重復外,重復總能體現為各種不同的模式,站點級重復,目錄級重復,CGI級重復,參數級重復等等,及早發現這些模式并進行處理,能節省系統的存儲、抓取、建庫和展現資源。
第一個問題最好解決,因為美國電信的根服務器就在諾亞。網頁的覆蓋率永遠都是100。
需要解決的是第二和第三個問題。
事實上這也不是個大問題,原理很容易解決,最重要的一環在于需要一個高效率的程序。
光憑自己一個人的話,可能需要不少的時間。凱瑟琳一直夢想的是當一個甩手掌柜,這事怎么能夠發生呢?——于是,找人就是必須的。
最后,凱瑟琳決定從微軟的PhoenixStargate開發組抽調了三個人出來,幫助開發這個網絡蜘蛛程序。
反正星門系統的開發已經差不多了,這個時候自己抽調一些人出來開發網絡蜘蛛完全不是問題。
網絡蜘蛛是搜索引擎的一個最核心的部分。有了這個程序之后,搜索引擎的建立就會非常簡單了。
那……自己的這個網站應該叫什么名字呢?
百度?
她首先就想到了這個名字。
凱瑟琳搖了搖頭,與其叫百度,還沒有谷歌來得更有味道。畢竟,后者可是全球性的搜索引擎,而前者只能局限在中國大陸地區嘛……而且更重要的一員原因是,凱瑟琳對于百度的某些功能非常的有怨念,而且還不能翻墻。
在這上面,谷歌的搜索就方便多了——前提是用國外版,好孩子片什么的,很容易就可以找到。雖然這是上輩子的情感,但是凱瑟琳覺得還是谷歌稍微要好那么一點點。
最后,凱瑟琳決定將自己的這個網站命名為Google,也就是谷歌。
不過凱瑟琳并不打算如同歷史上的那個谷歌公司一樣去涉及各種的產業,什么手機、辦公都一網打盡。
自己已經有了專門的手機部門,微軟也是自己的,谷歌公司所要做的事情,就是扮演好一個搜索引擎自己的角色。
這方面凱瑟琳覺得還是去參考一下百度,還是一個不錯的選擇。
貼吧、知道、百科,這些都是必須的。
“谷歌貼吧……谷歌知道……谷歌百科……”凱瑟琳在筆記本上將關鍵詞一一寫下。
“唔……維基百科似乎也不錯……算了,還是谷歌吧。”
凱瑟琳決定不去占用“維基”的名字,看著阿桑奇如何將這些政fǔ的丑態全部挖出來,似乎tǐng有趣的。
但是如果自己占用了“維基”的名字,萬一以后阿桑奇做出了些什么事情,那城門失火,殃及池魚,自己可就糟了。
“谷歌?那是什么?”
艾爾莎將茶具收走。
“搜索網站的名字。”
“哦。”
有了搜索網站,大家就能夠找到和自己臭味相投的網站了,而那個時候,網絡上面的火藥味大概也就不會這么濃烈了。
凱瑟琳在筆記本上寫下了谷歌的幾個字母。
“這就是你說的那個谷歌?”
“是的,不僅僅只有一個搜索引擎而已,這應該是一個綜合性的網站……當然,這個網站的大部分內容以搜索為主。”
貼吧、知道、百科,這些都是必不可少的。
“我的這個谷歌,在除去了搜索功能之外,還應該擁有替人們解決問題的功能。例如,大家有問題了,他們就可以到我們的谷歌網站來,然后就可以找到他們的問題的解決方法。”
“聽著可真不錯……是為了用戶的依賴度嗎?”
艾爾莎似乎看出了些什么。
“對,對。用戶的粘性很重要。”凱瑟琳擺出了一副“孺子可教”的表情。
“我們可以在谷歌知道讓用戶提問,他們遇到了難以解決的問題,就可以在這邊尋求解決方案……當然,我們公司自身并不提供解決方案的辦法,而是讓網友們自己來,從而形成一種互動。而我們的谷歌百科,則是類似于百科全書的存在,大家想要找什么知識,只要到我們的谷歌百科來就好了。”
“那……貼吧又是什么呢?”艾爾莎注意到凱瑟琳似乎好像沒有提及貼吧的功能。
“貼吧應該是和論壇差不多的功能,但是性質有些不太一樣。谷歌將會成為我們未來很重要的一個產品”
貼吧和論壇是存在很大不同的,但是凱瑟琳不知道怎么和艾爾莎說明。
“谷歌……這名字越聽越覺得順耳,真不錯。”艾爾莎摸著下巴想了想。
“這是必須的。”
除了谷歌,Face波ok也是一個不錯的東西,但是開設一個Face波ok的網站……這根本不可能。現在的計算機根本不可能將人臉給完美的呃弄成圖片,圖像會有巨大的損失。更重要的是,現在根本沒有網絡攝像頭。
“凱特,你似乎很重視谷歌?”
“谷歌一下,你就知道。”