一般電腦系統的檔案搜尋,只能夠根據檔名與檔案內的純文字內容去搜尋
Google搜尋不僅有上述功能,還具備把PDF、影音、圖片中的資訊轉成文本,使其能搜尋
還有其演算法,能從上億筆的資訊,在0.5~1秒內,就能找出結果
Google搜尋的運作原理是:
Crawling, Indexing, and Ranking
即:
1)先用爬蟲把網路上所有檔案抓下來
2)把所有檔案與其內容作索引
3)根據內容的優劣、標題、引用次數等因子,算出分數
之後等使用者輸入關鍵字後,Google再根據關鍵字去對之前所作的index去查找資料,並根據事先算好的分數來依序顯示資料