四月 用戶需求永遠第一 4月8日 給用戶完整的數據資源

我們的新聞完全是自動產生的。在類似的話題中,一條新聞被報道的次數越多,排名就靠前。這就是自動聚合功能的服務。從2003年開始,到現在已積累了5年的數據,其實這對於做研究非常管用。比如你要想查某一段時間,比如2003年10月1日到10月30日有哪些活動的報道,到別處去查的話,資料就不是那麼齊全,而在百度新聞里就有非常完整的數據,它的作用非常獨特。

——2008年5月29日,成思危訪探訪百度時的對話

背景分析

2003年、2004年中國電信寬頻網擴容後,上網資費大幅下調,老百姓上網開始成為家常便飯,網民數量呈爆炸式增長。面對如此龐大的市場,互聯網巨頭們各施其謀,搶灘中國。作為第一中文搜索引擎的百度自然也不甘落後,2003年7月,百度連續推出了新聞搜索和圖片搜索兩個技術化搜索引擎,其中百度圖片搜索一經推出就成為互聯網上最大的中文圖片庫。

百度新聞搜索實則是對網頁搜索的一種細分,它是一種24小時的自動新聞服務系統,與其他新聞服務不同,百度新聞每天抓取近10萬條新聞,其新聞來源於500多個新聞站點,其中包括政府機構、各類媒體網站及專業新聞網站。百度新聞搜索能夠在後台自動計算某條新聞被這些新聞站點轉載或引用的次數,當一條新聞被轉載或引用的次數達到一定數量時,新聞就會自動標記為紅色,表示為熱點新聞。

在百度新聞頻道搜索欄的下邊,有「新聞全文檢索」、「新聞標題檢索」兩個功能選項,特殊符號查詢、多關鍵詞查詢等技術一樣可以在新聞搜索中得到實現。此外,百度新聞搜索還採用了一種叫相關度識別的特殊技術,只要兩篇新聞中相似的內容達到一定的程度,就會被自動合成為一篇文章,從而節省了網民的瀏覽時間。而諸如「自動統計」、「相似度識別」等都只是百度新聞最基本的技術保證。作為面向媒體從業人員、公司高管、營銷專家、行業分析人員等高端專業用戶的服務,百度新聞始終沒有停下自我提升的腳步。

行動指南

給用戶所需的,更要給用戶意想不到的。

上一章目錄+書簽下一章