百度是全球最大的中文搜索引擎、最大的中文網(wǎng)站,擁有全球最大的中文網(wǎng)頁庫,收錄中文網(wǎng)頁已超過20億,這些網(wǎng)頁的數(shù)量每天正以千萬級的速度在增長;同時(shí),百度在中國各地分布的服務(wù)器,能直接從最近的服務(wù)器上,把所搜索信息返回給當(dāng)?shù)赜脩?,使用戶享受極快的搜索傳輸速度。
百度每天處理來自超過138個(gè)國家超過數(shù)億次的搜索請求,每天有超過7萬用戶將百度設(shè)為首頁,用戶通過百度搜索引擎可以搜到世界上最新最全的中文信息。
方案介紹
曙光存儲(chǔ)服務(wù)器在百度的應(yīng)用主要是搜索排序和查詢!搜索排序,將網(wǎng)絡(luò)爬蟲抓回的網(wǎng)頁按照關(guān)鍵字的匹配程度進(jìn)行排序,生成索引,建立相關(guān)數(shù)據(jù)庫;查詢應(yīng)用根據(jù)用戶的請求,將對應(yīng)內(nèi)容進(jìn)行呈現(xiàn)。系統(tǒng)的拓?fù)浣Y(jié)構(gòu)如下:
搜索排序要求硬件平臺(tái)具有較高的處理能力,并且具有較大容量的本地存儲(chǔ)空間,曙光公司切合用戶的應(yīng)用需求,采用曙光12盤位的存儲(chǔ)服務(wù)器作為百度的搜索排序硬件平臺(tái),滿足搜索排序應(yīng)用對處理能力和存儲(chǔ)能力的要求。
曙光存儲(chǔ)服務(wù)器基于通用X86處理器平臺(tái),采用2U機(jī)架式設(shè)計(jì),最大支持12個(gè)3.5寸熱插拔硬盤倉位,可以提供高達(dá)24TB的本地高性能存儲(chǔ)容量,有效提高搜索排序應(yīng)用的相應(yīng)速度。與傳統(tǒng)的采用服務(wù)器和磁盤陣列的方案相比,曙光提供的存儲(chǔ)服務(wù)器方案具有節(jié)省用戶成本、占地面積小、管理簡單、節(jié)能環(huán)保等諸多優(yōu)勢。
項(xiàng)目總結(jié)
曙光與百度的合作始于2009年。依靠穩(wěn)定的產(chǎn)品質(zhì)量,及時(shí)的供貨以及完善的售后服務(wù),曙光在百度關(guān)鍵應(yīng)用領(lǐng)域的占有率不斷上升,同時(shí)也為日后業(yè)務(wù)的騰飛插上了翅膀。