期刊在線咨詢服務(wù),立即咨詢
時(shí)間:2022-03-15 03:46:51
導(dǎo)言:作為寫(xiě)作愛(ài)好者,不可錯(cuò)過(guò)為您精心挑選的10篇企業(yè)數(shù)據(jù)存儲(chǔ)方案,它們將為您的寫(xiě)作提供全新的視角,我們衷心期待您的閱讀,并希望這些內(nèi)容能為您提供靈感和參考。
1 引言
在電力行業(yè),堅(jiān)強(qiáng)智能電網(wǎng)的迅速發(fā)展使信息通信技術(shù)正以前所未有的廣度、深度與電網(wǎng)生產(chǎn)、企業(yè)管理快速融合,信息通信系統(tǒng)已經(jīng)成為智能電網(wǎng)的“中樞神經(jīng)”,支撐新一代電網(wǎng)生產(chǎn)和管理發(fā)展。目前,電網(wǎng)公司已初步建成了國(guó)內(nèi)領(lǐng)先、國(guó)際一流的信息集成平臺(tái)。隨著各地集中式數(shù)據(jù)中心的陸續(xù)投運(yùn),一級(jí)部署業(yè)務(wù)應(yīng)用范圍的拓展,結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中心的上線運(yùn)行,電網(wǎng)業(yè)務(wù)數(shù)據(jù)從總量和種類(lèi)上都已初具規(guī)模。隨著后續(xù)智能電表的逐步普及,電網(wǎng)業(yè)務(wù)數(shù)據(jù)將從時(shí)效性層面進(jìn)一步豐富和拓展。電網(wǎng)業(yè)務(wù)數(shù)據(jù)將跨入海量數(shù)據(jù)時(shí)代,如何處理這些海量數(shù)據(jù)已成為電力企業(yè)信息管理首要解決的問(wèn)題。而在海量數(shù)據(jù)的處理中,如何有效地保存和恢復(fù)數(shù)據(jù)就成了這些問(wèn)題當(dāng)中的首要問(wèn)題。
2 海量數(shù)據(jù)特征
海量數(shù)據(jù)按照數(shù)據(jù)結(jié)構(gòu)來(lái)進(jìn)行劃分,可以劃分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)兩大類(lèi)。
(1)結(jié)構(gòu)化數(shù)據(jù):簡(jiǎn)單來(lái)說(shuō)就是數(shù)據(jù)庫(kù), 即行數(shù)據(jù),存儲(chǔ)在數(shù)據(jù)庫(kù)里,可以用二維表結(jié)構(gòu)來(lái)邏輯表達(dá)實(shí)現(xiàn)的數(shù)據(jù)。結(jié)合到典型場(chǎng)景中更容易理解,比如企業(yè)ERP、財(cái)務(wù)系統(tǒng);醫(yī)療HIS數(shù)據(jù)庫(kù);教育一卡通;政府行政審批;其他核心數(shù)據(jù)庫(kù)等
(2)非結(jié)構(gòu)化數(shù)據(jù):相對(duì)于結(jié)構(gòu)化數(shù)據(jù)而言,不方便用數(shù)據(jù)庫(kù)二維邏輯表來(lái)表現(xiàn)的數(shù)據(jù)即稱(chēng)為非結(jié)構(gòu)化數(shù)據(jù),包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類(lèi)報(bào)表、圖像和音頻/視頻信息等等。 非結(jié)構(gòu)化數(shù)據(jù)庫(kù)是指其字段長(zhǎng)度可變,并且每個(gè)字段的記錄又可以由可重復(fù)或不可重復(fù)的子字段構(gòu)成的數(shù)據(jù)庫(kù),用它不僅可以處理結(jié)構(gòu)化數(shù)據(jù)(如數(shù)字、符號(hào)等信息)而且更適合處理非結(jié)構(gòu)化數(shù)據(jù)(全文文本、圖象、聲音、影視、超媒體等信息)
按照數(shù)據(jù)的時(shí)效性而言,海量數(shù)據(jù)又可劃分為實(shí)時(shí)數(shù)據(jù)和離線數(shù)據(jù)兩類(lèi)。
實(shí)時(shí)數(shù)據(jù):實(shí)時(shí)數(shù)據(jù)一般用于金融、移動(dòng)和互聯(lián)網(wǎng)B2C等產(chǎn)品,往往要求在數(shù)秒內(nèi)返回上億行數(shù)據(jù)的分析,從而達(dá)到不影響用戶體驗(yàn)的目的。要滿足這樣的需求,可以采用精心設(shè)計(jì)的傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)組成并行處理集群,或者采用一些內(nèi)存計(jì)算平臺(tái),或者采用HDD的架構(gòu),這些無(wú)疑都需要比較高的軟硬件成本。目前比較新的海量數(shù)據(jù)實(shí)時(shí)分析工具有EMC的Greenplum、SAP的HANA等。
離線數(shù)據(jù):對(duì)于大多數(shù)反饋時(shí)間要求不是那么嚴(yán)苛的應(yīng)用,比如離線統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)、搜索引擎的反向索引計(jì)算、推薦引擎的計(jì)算等,應(yīng)采用離線分析的方式,通過(guò)數(shù)據(jù)采集工具將日志數(shù)據(jù)導(dǎo)入專(zhuān)用的分析平臺(tái)。但面對(duì)海量數(shù)據(jù),傳統(tǒng)的ETL工具往往徹底失效,主要原因是數(shù)據(jù)格式轉(zhuǎn)換的開(kāi)銷(xiāo)太大,在性能上無(wú)法滿足海量數(shù)據(jù)的采集需求?;ヂ?lián)網(wǎng)企業(yè)的海量數(shù)據(jù)采集工具,有Facebook開(kāi)源的Scribe、LinkedIn開(kāi)源的Kafka、淘寶開(kāi)源的Timetunnel、Hadoop的Chukwa等,均可以滿足每秒數(shù)百M(fèi)B的日志數(shù)據(jù)采集和傳輸需求,并將這些數(shù)據(jù)上載到Hadoop中央系統(tǒng)上。
3 企業(yè)海量數(shù)據(jù)存儲(chǔ)現(xiàn)狀
3.1 海量數(shù)據(jù)導(dǎo)致存儲(chǔ)成本、維護(hù)管理成本不斷增加
大型企業(yè)都面臨著業(yè)務(wù)和IT投入的壓力,與以往相比,系統(tǒng)的性能/價(jià)格比更加受關(guān)注。GIGA研究表明,ROI(投資回報(bào)率)越來(lái)越受到重視。海量數(shù)據(jù)使得企業(yè)因?yàn)楸4娲罅吭诰€數(shù)據(jù)以及數(shù)據(jù)膨脹而需要在存儲(chǔ)硬件上大量投資,雖然存儲(chǔ)設(shè)備的成本在下降,但存儲(chǔ)的總體成本卻在不斷增加,并且正在成為最大的一筆IT開(kāi)支之一。另一方面,海量數(shù)據(jù)使DBA陷入持續(xù)的數(shù)據(jù)庫(kù)管理維護(hù)工作當(dāng)中。
3.2 海量數(shù)據(jù)缺乏快速備份與災(zāi)難恢復(fù)機(jī)制
傳統(tǒng)的數(shù)據(jù)庫(kù)備份技術(shù),如通常采用的磁帶備份方式,不能運(yùn)用于海量數(shù)據(jù),因?yàn)榇艓浞輰⑹箓浞輹r(shí)間增加,需要幾小時(shí)-幾天,不僅影響了生產(chǎn),而且增加了備份的難度,使得備份/恢復(fù)變得緩慢而且不可靠,幾乎無(wú)法在固定的時(shí)間窗口完成備份工作。另外,第三方備份軟件隱含的成本代價(jià)如成本開(kāi)銷(xiāo)、復(fù)雜度、昂貴的實(shí)施等也是企業(yè)需要考慮的。因此海量數(shù)據(jù)安全顯得異常重要,只有通過(guò)引入有效的備份、方便高效的備份恢復(fù)技術(shù),才能滿足海量數(shù)據(jù)安全的需要。
4 存儲(chǔ)解決方案概述
在海量數(shù)據(jù)存儲(chǔ)中我們主要考慮的是大數(shù)據(jù)的存儲(chǔ),雖然現(xiàn)行的商業(yè)平臺(tái)也能滿足非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ),但問(wèn)題主要出在系統(tǒng)可擴(kuò)展性和建設(shè)費(fèi)用上。對(duì)于龐大的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)產(chǎn)生的I/O瓶頸問(wèn)題和昂貴的服務(wù)器價(jià)格不得不使我們另謀出路。
Hadoop的分布式文件系統(tǒng)HDFS出現(xiàn)恰好解決了商業(yè)平臺(tái)中的I/O瓶頸和服務(wù)器價(jià)格昂貴問(wèn)題。Hadoop的優(yōu)勢(shì)體現(xiàn)在以下幾個(gè)方面:
(1)Hadoop依賴于低端服務(wù)器甚至是普通計(jì)算機(jī),相對(duì)于商業(yè)平臺(tái)的高昂成本,它的成本要低得多,幾乎可以說(shuō)任何人都可以使用它,哪怕是信息化成本預(yù)算較少的小微企業(yè);
(2)HDFS與Map/Reduce緊密集成是Hadoop分布式計(jì)算的存儲(chǔ)基石。它有自己明確的設(shè)計(jì)目標(biāo)那就是支持大的數(shù)據(jù)文件大至T級(jí),并且這些文件以順序讀取為主,以文件存/讀的高吞吐量為目標(biāo)。在使用HDFS分布式文件系統(tǒng)存儲(chǔ)非結(jié)構(gòu)化文件后,將提高我們系統(tǒng)的存儲(chǔ)文件速度;
(3)HDFS的數(shù)據(jù)恢復(fù)能力也保證了系統(tǒng)的安全可靠性,可靠性體現(xiàn)在它假設(shè)計(jì)算元素和存儲(chǔ)會(huì)失敗,因此它維護(hù)多個(gè)工作數(shù)據(jù)副本,確保能夠針對(duì)失敗的節(jié)點(diǎn)重新分布處理。
(4)同時(shí)支持存儲(chǔ)節(jié)點(diǎn)的熱插拔和可以在普通PC機(jī)上存儲(chǔ)非結(jié)構(gòu)化文件,這不但提高了系統(tǒng)的擴(kuò)展靈活性,還大大降低了企業(yè)在硬件方面的投入
5 應(yīng)用架構(gòu)
在本存儲(chǔ)解決方案中,我們選擇了Hadoop作為數(shù)據(jù)文件存儲(chǔ)機(jī)制,Hadoop中的HDFS存儲(chǔ)數(shù)據(jù)可以選擇普通的PC機(jī)器作為數(shù)據(jù)節(jié)點(diǎn),這大大的降低了存儲(chǔ)數(shù)據(jù)所需要昂貴存儲(chǔ)設(shè)備價(jià)格,并且在數(shù)據(jù)存儲(chǔ)過(guò)程中,HDFS擁有很好的數(shù)據(jù)容災(zāi)機(jī)制。
6 HDFS
Hadoop的存儲(chǔ)主要使用HDFS來(lái)進(jìn)行管理,HDFS是一個(gè)分布式文件存儲(chǔ)系統(tǒng)。HDFS起源于Apache Nutch Web 搜索引擎項(xiàng)目。
對(duì)于HDFS分布式文件系統(tǒng)中的塊進(jìn)行抽象會(huì)帶來(lái)很多好處:
(1)文件的大小可以大于網(wǎng)絡(luò)中任意一個(gè)磁盤(pán)的容量,文件的所有塊不需要存儲(chǔ)在同一個(gè)磁盤(pán)上,因此他們可以利用集群上的任意一個(gè)磁盤(pán)進(jìn)行存儲(chǔ)。
(2)使用塊抽象而非整個(gè)文件作為存儲(chǔ)單元,大大的簡(jiǎn)化了存儲(chǔ)系統(tǒng)的設(shè)計(jì)。簡(jiǎn)化是所有系統(tǒng)的目標(biāo),但對(duì)于故障種類(lèi)繁多的分布式系統(tǒng)來(lái)說(shuō)尤為重要。
(3)塊非常適合用于數(shù)據(jù)備份,進(jìn)而提高數(shù)據(jù)容錯(cuò)能力和可用性。
6.1 HDFS架構(gòu)
6.2 HDFS文件存儲(chǔ)方式使用大塊的原因
HDFS的塊比磁盤(pán)大,其目的是為了最小化尋址的開(kāi)銷(xiāo)。如果塊設(shè)置的足夠大,從磁盤(pán)傳輸數(shù)據(jù)的時(shí)間可以明顯的大于定位這個(gè)塊開(kāi)始位置所需的時(shí)間。這樣,傳輸一個(gè)由多個(gè)塊組成的文件的時(shí)間取決于磁盤(pán)的傳輸速率,由此可見(jiàn)適當(dāng)?shù)脑O(shè)置磁盤(pán)塊空間大小可以加快數(shù)據(jù)讀寫(xiě)效率。
6.3 HDFS的集群管理模式
HDFS集群有兩類(lèi)節(jié)點(diǎn),并以管理者――工作者模式運(yùn)行,即一個(gè)namenode(管理者)和多個(gè)datanode(工作者)。管理者管理文件系統(tǒng)的命名空間,它維護(hù)著文件系統(tǒng)樹(shù)及整棵樹(shù)內(nèi)所有的文件和目錄。這些信息以兩個(gè)文件形式永久保存在本地磁盤(pán)上:命名空間鏡像和編輯文件日志。工作者也記錄著每個(gè)文件中各個(gè)塊所有在的數(shù)據(jù)節(jié)點(diǎn)信息,但它不永久保存塊的位置信息,因?yàn)檫@些信息會(huì)在系統(tǒng)啟動(dòng)時(shí)由數(shù)據(jù)節(jié)點(diǎn)重建。
6.4 HDFS文件寫(xiě)入方式
客戶端通過(guò)調(diào)用HDFS類(lèi)DistributedFileSystem對(duì)象調(diào)用create()函數(shù)來(lái)創(chuàng)建文件,在此時(shí)文件系統(tǒng)的命名空間中創(chuàng)建了一個(gè)新文件,但該文件還沒(méi)有相應(yīng)的數(shù)據(jù)塊。管理者(namenode)執(zhí)行各種不同的檢查確保當(dāng)前創(chuàng)建的文件不存在,并且客戶端有創(chuàng)建該文件的權(quán)限,如果檢查通過(guò)則創(chuàng)建新文件記錄;否則,文件創(chuàng)建失敗并拋出異常。在客戶端寫(xiě)入數(shù)據(jù)時(shí),數(shù)據(jù)被分成一個(gè)個(gè)的數(shù)據(jù)包,并寫(xiě)入內(nèi)部隊(duì)列,HDFS的DataStreamer處理數(shù)據(jù)隊(duì)列,它的責(zé)任是根據(jù)工作者(datanode)的隊(duì)列列表要求管理者(namenode)分配適合的新塊來(lái)存儲(chǔ)數(shù)據(jù)備份。如下圖
7 實(shí)現(xiàn)功能
海量數(shù)據(jù)存儲(chǔ)部分主要包含了三部分的功能:數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)與備份、數(shù)據(jù)分析,如圖所示:
7.1 數(shù)據(jù)采集
海量數(shù)據(jù)存儲(chǔ)采用開(kāi)放上傳接口的方式進(jìn)行被動(dòng)數(shù)據(jù)采集,各業(yè)務(wù)平臺(tái)通過(guò)向上傳接口傳遞業(yè)務(wù)平臺(tái)標(biāo)識(shí)、文件信息標(biāo)識(shí)和文件信息的二進(jìn)制流的方式將文件打包傳送到非結(jié)構(gòu)化數(shù)據(jù)管理平臺(tái),非結(jié)構(gòu)化數(shù)據(jù)管理平臺(tái)通過(guò)業(yè)務(wù)平臺(tái)標(biāo)識(shí)對(duì)傳輸過(guò)來(lái)的文件進(jìn)行分類(lèi)解碼存儲(chǔ)。
7.2 數(shù)據(jù)存儲(chǔ)與備份
海量數(shù)據(jù)管理在接收到各業(yè)務(wù)平臺(tái)發(fā)送過(guò)來(lái)的文件后,根據(jù)業(yè)務(wù)平臺(tái)標(biāo)識(shí)在HBASE中生成文件信息數(shù)據(jù),同時(shí)將文件存儲(chǔ)至HBase中。
7.3 數(shù)據(jù)分析
基于已存儲(chǔ)的數(shù)據(jù),可以分析各業(yè)務(wù)平臺(tái)的數(shù)據(jù)量,數(shù)據(jù)高峰的周期,從而適時(shí)調(diào)整數(shù)據(jù)存儲(chǔ)策略,為不同的業(yè)務(wù)應(yīng)用制定不同的存儲(chǔ)計(jì)劃,充分體現(xiàn)系統(tǒng)存儲(chǔ)的靈活性,提升海量數(shù)據(jù)的存儲(chǔ)效率。
大數(shù)據(jù)的核心價(jià)值是如何把數(shù)據(jù)變成商業(yè)價(jià)值。
大數(shù)據(jù)存儲(chǔ),可以認(rèn)為是存儲(chǔ)廠商基于現(xiàn)有大數(shù)據(jù)應(yīng)用的特點(diǎn)進(jìn)行優(yōu)化的解決方案。
記者不久前去香港出差,剛下飛機(jī)就收到招商銀行發(fā)來(lái)的一條短信,內(nèi)容是告之香港有哪些商場(chǎng)在舉辦促銷(xiāo)活動(dòng)。不知道這是巧合,還是招商銀行利用大數(shù)據(jù)的新成果,但是可以肯定,利用大數(shù)據(jù)分析可以為客戶提供定制化的服務(wù),實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)。大數(shù)據(jù)正在改變企業(yè)業(yè)務(wù)模式,也讓人們的生活變得更加便利和豐富多彩。
存儲(chǔ)必須整合
大數(shù)據(jù)存儲(chǔ)是一類(lèi)單獨(dú)的產(chǎn)品嗎?賽迪顧問(wèn)高級(jí)分析師陳靚并不這么認(rèn)為:“把大數(shù)據(jù)軟件與存儲(chǔ)進(jìn)行整合,就稱(chēng)為大數(shù)據(jù)存儲(chǔ),未免有些牽強(qiáng)。如果非要說(shuō)出大數(shù)據(jù)存儲(chǔ)的特征,那么我認(rèn)為它至少應(yīng)該能讓大數(shù)據(jù)的‘4V’發(fā)揮出應(yīng)有的效果,滿足大數(shù)據(jù)對(duì)性能和擴(kuò)展性的要求?!?/p>
“與其說(shuō)大數(shù)據(jù)存儲(chǔ)是一類(lèi)產(chǎn)品,不如說(shuō)它是下一代的存儲(chǔ)架構(gòu)。這種架構(gòu)可以將傳統(tǒng)的DAS、SAN和NAS有效地整合起來(lái),以滿足上層計(jì)算平臺(tái)的要求?!盕orrester Research首席咨詢分析師戴昆表示,“大數(shù)據(jù)存儲(chǔ)本身的性能與傳統(tǒng)企業(yè)級(jí)存儲(chǔ)并沒(méi)有顯著差異,它主要依賴于上層計(jì)算平臺(tái)的分布式并行處理能力,但其擴(kuò)展性一定要強(qiáng)?!?/p>
“在中國(guó)市場(chǎng)上,大數(shù)據(jù)應(yīng)用還沒(méi)有真正落地,許多用戶談的還是BI(商業(yè)智能)。而從國(guó)外的實(shí)踐看,BI只是大數(shù)據(jù)的一部分,屬于大數(shù)據(jù)的起步階段,真正的大數(shù)據(jù)應(yīng)用是近實(shí)時(shí)或?qū)崟r(shí)的數(shù)據(jù)分析?!敝袠蛘{(diào)研咨詢首席分析師王叢告訴記者,“計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等都與大數(shù)據(jù)的價(jià)值有關(guān)。大數(shù)據(jù)存儲(chǔ)并不是一類(lèi)單獨(dú)的產(chǎn)品,它也可以通過(guò)類(lèi)似公有云或私有云的方式提供給用戶。應(yīng)用和數(shù)據(jù)量的增加,對(duì)數(shù)據(jù)的存取提出了更高要求。因此,并行存儲(chǔ)能力的增強(qiáng)對(duì)大數(shù)據(jù)存儲(chǔ)來(lái)說(shuō)非常重要?!?/p>
EMC Isilon存儲(chǔ)事業(yè)部總經(jīng)理?xiàng)钐m江表示,大數(shù)據(jù)存儲(chǔ)有很多實(shí)現(xiàn)方式,不過(guò)它應(yīng)具備以下特性:海量數(shù)據(jù)存儲(chǔ)能力、全局命名空間、支持標(biāo)準(zhǔn)接口、讀寫(xiě)性能優(yōu)異、易于管理維護(hù)、基于開(kāi)放架構(gòu)、多級(jí)數(shù)據(jù)冗余、多級(jí)存儲(chǔ)備份等。
“存儲(chǔ)產(chǎn)品并不像網(wǎng)絡(luò)產(chǎn)品那樣有嚴(yán)格的界線,因此很難將大數(shù)據(jù)存儲(chǔ)單獨(dú)劃分出來(lái)。其實(shí),大數(shù)據(jù)存儲(chǔ)并不是只有分布式存儲(chǔ)這一種方式,傳統(tǒng)的存儲(chǔ)也可以成為大數(shù)據(jù)存儲(chǔ)解決方案的一部分?!比A為存儲(chǔ)產(chǎn)品線市場(chǎng)總監(jiān)經(jīng)寧解釋說(shuō),“華為將大數(shù)據(jù)存儲(chǔ)當(dāng)成相對(duì)獨(dú)立的一類(lèi)產(chǎn)品,主要是從產(chǎn)品的主定位角度考慮的。華為有針對(duì)企業(yè)級(jí)應(yīng)用的高端存儲(chǔ),也有針對(duì)中小型用戶的通用存儲(chǔ),當(dāng)然還有專(zhuān)門(mén)為大數(shù)據(jù)優(yōu)化的分布式、可橫向擴(kuò)展的大數(shù)據(jù)存儲(chǔ)。”
目前,業(yè)內(nèi)并沒(méi)有關(guān)于大數(shù)據(jù)存儲(chǔ)產(chǎn)品的通用定義,但是綜合考慮廠商的產(chǎn)品以及用戶的需求,可以簡(jiǎn)單概括出大數(shù)據(jù)存儲(chǔ)的特征:首先,大數(shù)據(jù)存儲(chǔ)必須能夠支持全類(lèi)型數(shù)據(jù),包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)統(tǒng)一數(shù)據(jù)支持;其次,在保證可靠性的基礎(chǔ)之上,大數(shù)據(jù)存儲(chǔ)必須具備線性擴(kuò)展能力,同時(shí)還要具有很強(qiáng)的批處理和實(shí)時(shí)處理能力;最后,在系統(tǒng)達(dá)到一定規(guī)模后,大數(shù)據(jù)存儲(chǔ)平臺(tái)的易用性和可管理性也是不可或缺的。
在大數(shù)據(jù)處理過(guò)程中,用戶發(fā)現(xiàn)性能的瓶頸并不在計(jì)算層面,而在于海量數(shù)據(jù)的上傳和下載。因此,極高的數(shù)據(jù)加載速率是大數(shù)據(jù)存儲(chǔ)必須具備的特性。大數(shù)據(jù)解決方案通常包含數(shù)據(jù)存儲(chǔ)、計(jì)算及分析,存儲(chǔ)是大數(shù)據(jù)基礎(chǔ)架構(gòu)中的一部分。
凸顯高性能、可擴(kuò)展
對(duì)中國(guó)用戶來(lái)說(shuō),大數(shù)據(jù)應(yīng)用落地的關(guān)鍵是如何更好地讓企業(yè)的IT決策者和架構(gòu)師理解業(yè)務(wù)需求,建立適合企業(yè)業(yè)務(wù)特點(diǎn)的數(shù)據(jù)應(yīng)用場(chǎng)景和數(shù)據(jù)管理架構(gòu),更好地利用企業(yè)現(xiàn)有的數(shù)據(jù)資產(chǎn),而非盲目地進(jìn)行所謂的大數(shù)據(jù)投資?!坝脩羰紫纫紤]的是什么樣的大數(shù)據(jù)應(yīng)用才能為企業(yè)帶來(lái)合理產(chǎn)出,其次再考慮大數(shù)據(jù)平臺(tái)和存儲(chǔ),切勿本末倒置?!贝骼ケ硎?。
賽迪顧問(wèn)的研究發(fā)現(xiàn),中國(guó)使用大數(shù)據(jù)存儲(chǔ)比較多的行業(yè)是電信、互聯(lián)網(wǎng)、金融等,其他行業(yè)大多還在觀望及測(cè)試中。中國(guó)用戶對(duì)于大數(shù)據(jù)存儲(chǔ)的需求首先是可靠和穩(wěn)定,金融行業(yè)的用戶非常重視這一點(diǎn);互聯(lián)網(wǎng)用戶則要求大數(shù)據(jù)存儲(chǔ)具有很高的I/O吞吐能力;電信行業(yè)的客戶更青睞高性價(jià)比的大數(shù)據(jù)存儲(chǔ)設(shè)備。
中國(guó)惠普有限公司企業(yè)集團(tuán)存儲(chǔ)產(chǎn)品部存儲(chǔ)架構(gòu)師張楠表示,很多中國(guó)用戶會(huì)追求大容量和高性能,忽略了大數(shù)據(jù)存儲(chǔ)本身應(yīng)該具有的其他屬性,這讓用戶在實(shí)際應(yīng)用中很容易遇到一些障礙,比如無(wú)法將存儲(chǔ)與大數(shù)據(jù)平臺(tái)進(jìn)行對(duì)接,無(wú)法在業(yè)務(wù)中充分發(fā)揮大數(shù)據(jù)存儲(chǔ)的價(jià)值等。究其原因,主要障礙在于有些大數(shù)據(jù)存儲(chǔ)產(chǎn)品沒(méi)有開(kāi)放的接口協(xié)議, 沒(méi)有針對(duì)用戶的大數(shù)據(jù)應(yīng)用場(chǎng)景進(jìn)行特別優(yōu)化, 沒(méi)有提供用戶容易接受的易用管理方式等。
存儲(chǔ)的高可擴(kuò)展性、高可用性和并行處理能力是企業(yè)評(píng)估大數(shù)據(jù)存儲(chǔ)最重要的三個(gè)因素。高可擴(kuò)展性可以確保企業(yè)的IT能夠隨著數(shù)據(jù)量的增長(zhǎng)和性能需求的提高進(jìn)行擴(kuò)展;高可用性能夠保證大數(shù)據(jù)分析過(guò)程的平穩(wěn)和無(wú)間斷運(yùn)行;高并行處理能力則能夠確保在大數(shù)據(jù)處理過(guò)程中同時(shí)進(jìn)行更多數(shù)據(jù)的處理,高效地完成數(shù)據(jù)分析,同時(shí)縮短產(chǎn)品或技術(shù)的上市周期。低延遲、自動(dòng)分層存儲(chǔ)以及對(duì)10GbE網(wǎng)絡(luò)的支持等也是用戶評(píng)估大數(shù)據(jù)存儲(chǔ)的重要考核因素。
“如何管理好大數(shù)據(jù)真的是一個(gè)大問(wèn)題。從IT的角度看,我們還缺乏能夠展現(xiàn)數(shù)據(jù)價(jià)值的行之有效的手段。數(shù)據(jù)作為一種資產(chǎn),如何被長(zhǎng)期、高效、經(jīng)濟(jì)地保存也是一個(gè)問(wèn)題?!比A為海量存儲(chǔ)產(chǎn)品線總經(jīng)理袁遠(yuǎn)表示,“大數(shù)據(jù)提出了一個(gè)新的方法論——以數(shù)據(jù)為中心,而不是以應(yīng)用為中心。以數(shù)據(jù)為中心,就要考慮數(shù)據(jù)的來(lái)源,如何以更低的成本存儲(chǔ)和管理數(shù)據(jù),誰(shuí)有權(quán)利獲得哪些數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行分析前必須進(jìn)行模型化的抽象等。大數(shù)據(jù)需要新的工具、新的管理思路和方法,同時(shí)還要對(duì)技術(shù)架構(gòu)進(jìn)行創(chuàng)新?!?/p>
歐洲核子研究中心(CERN)創(chuàng)建的OpenLAB旨在通過(guò)部署全球領(lǐng)先的IT系統(tǒng)和解決方案,將全球大型強(qiáng)子對(duì)撞機(jī)(LHC)行業(yè)的資源、研究成果匯集在一起。持續(xù)快速增長(zhǎng)的海量科研數(shù)據(jù)對(duì)CERN的存儲(chǔ)系統(tǒng)在可擴(kuò)展性、可靠性等方面提出了嚴(yán)峻挑戰(zhàn),這也促使CERN開(kāi)始評(píng)估新的存儲(chǔ)技術(shù)。最終,CERN選擇了華為UDS云存儲(chǔ)系統(tǒng),并在三個(gè)月內(nèi)完成了安裝調(diào)測(cè)和基準(zhǔn)性能的評(píng)估。測(cè)試結(jié)果顯示,UDS創(chuàng)新的軟硬件和系統(tǒng)非常適合海量數(shù)據(jù)存儲(chǔ)的業(yè)務(wù)要求,這讓CERN可以在未來(lái)輕松應(yīng)對(duì)EB級(jí)數(shù)據(jù)量的挑戰(zhàn)。
談到華為大數(shù)據(jù)存儲(chǔ)解決方案的特色,經(jīng)寧概括說(shuō):“我們能更好地把握大數(shù)據(jù)的本質(zhì)需求,并依靠自主研發(fā)能力,在IT架構(gòu)上實(shí)現(xiàn)創(chuàng)新,將計(jì)算與存儲(chǔ)進(jìn)行有機(jī)結(jié)合。我們還基于自己的大數(shù)據(jù)存儲(chǔ)平臺(tái),提供了多種類(lèi)型的接口,便于與應(yīng)用銜接?!睆漠a(chǎn)品研發(fā)的角度看,華為將重點(diǎn)放在了軟件方面,硬件則采用了開(kāi)放的標(biāo)準(zhǔn)化的存儲(chǔ)服務(wù)器架構(gòu)。在2013年華為云計(jì)算大會(huì)上,華為與中央電視臺(tái)正式簽署合作協(xié)議,在大數(shù)據(jù)存儲(chǔ)領(lǐng)域建立戰(zhàn)略合作關(guān)系,為媒資行業(yè)提供領(lǐng)先的技術(shù)和應(yīng)用模式。雙方計(jì)劃聯(lián)合開(kāi)發(fā)自適應(yīng)、深度節(jié)能的高密度、大容量的媒資存儲(chǔ)系統(tǒng)。
面對(duì)大數(shù)據(jù)的需求,存儲(chǔ)永遠(yuǎn)不變的是對(duì)數(shù)據(jù)可靠性、性能、可擴(kuò)展性和效率的追求,而有可能發(fā)生改變的是為了提高效率、節(jié)省消耗,存儲(chǔ)可以變得更加靈活,也可以考慮與計(jì)算進(jìn)行融合等。不管存儲(chǔ)如何變化,用戶對(duì)高性價(jià)比的需求始終不變。
數(shù)據(jù)收集和存儲(chǔ)是大數(shù)據(jù)分析的第一個(gè)環(huán)節(jié)。在大數(shù)據(jù)時(shí)代,應(yīng)用數(shù)量、數(shù)據(jù)量和使用者數(shù)量的增長(zhǎng),對(duì)存儲(chǔ)IOPS以及OLTP和OLAP的要求越來(lái)越高,具體表現(xiàn)在現(xiàn)有的存儲(chǔ)已不能滿足業(yè)務(wù)關(guān)鍵型應(yīng)用的需求。中橋調(diào)研咨詢針對(duì)中國(guó)用戶的調(diào)研數(shù)據(jù)顯示,F(xiàn)C SAN仍是企業(yè)級(jí)用戶(42.1%)和中型企業(yè)(34.0%)的首選,遠(yuǎn)高于其他存儲(chǔ)類(lèi)型的占比。這是因?yàn)镕C SAN對(duì)OLTP和OLAP的性能穩(wěn)定性優(yōu)于其他存儲(chǔ)技術(shù)。這一調(diào)查結(jié)果也顯示,目前中國(guó)用戶大多處于大數(shù)據(jù)分析的第一階段,其工作以存儲(chǔ)和IT架構(gòu)的整合和優(yōu)化為主。王叢分析說(shuō),隨著Hadoop和MapReduce的不斷普及,中國(guó)用戶將逐步進(jìn)入近實(shí)時(shí)和實(shí)時(shí)分析階段,節(jié)點(diǎn)式存儲(chǔ)的占比會(huì)隨之增加。
打通行業(yè)價(jià)值鏈
華為的金字塔型“4V”理論具體來(lái)說(shuō),第一步,要建立一個(gè)高效的存儲(chǔ)架構(gòu)平臺(tái),它既能處理大量的小文件,也能處理單體較大的文件。第二步,這個(gè)存儲(chǔ)平臺(tái)要具備極高的處理性能。第三步,這個(gè)存儲(chǔ)平臺(tái)要能處理多樣化的數(shù)據(jù),包括結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。只有通過(guò)前面三步打下的基礎(chǔ),企業(yè)用戶才能進(jìn)入最后一步,在一個(gè)高效的專(zhuān)門(mén)為大數(shù)據(jù)構(gòu)建和優(yōu)化的平臺(tái)上進(jìn)行數(shù)據(jù)分析和挖掘,并最終獲得所需的價(jià)值。
經(jīng)寧表示:“如果仔細(xì)甄別,大數(shù)據(jù)與海量數(shù)據(jù)還是有差別的,畢竟大數(shù)據(jù)不僅僅是指數(shù)據(jù)量大,還包括處理、分析和挖掘等過(guò)程。從表面上看,大數(shù)據(jù)的‘4V’特征是并列的關(guān)系,但實(shí)際上這些因素之間還是有層次性的。我們提出的大數(shù)據(jù)金字塔模型,可以更好展現(xiàn)大數(shù)據(jù)價(jià)值的實(shí)現(xiàn)過(guò)程。”
華為倡導(dǎo)構(gòu)建高效的大數(shù)據(jù)存儲(chǔ)平臺(tái),而其中的高效又是如何來(lái)衡量的呢?高效的第一個(gè)衡量指標(biāo)就是性能。性能是大數(shù)據(jù)存儲(chǔ)平臺(tái)的基石之一,沒(méi)有性能的保證,大數(shù)據(jù)系統(tǒng)無(wú)異于空中樓閣。其次,大數(shù)據(jù)強(qiáng)調(diào)的是簡(jiǎn)化使用,提高效率。最后,高效的大數(shù)據(jù)存儲(chǔ)平臺(tái)應(yīng)該采用融合的技術(shù)架構(gòu)。以華為OceanStor 9000大數(shù)據(jù)存儲(chǔ)系統(tǒng)為例,它采用華為首創(chuàng)的全融合創(chuàng)新架構(gòu),可以實(shí)現(xiàn)存儲(chǔ)、分析和歸檔的融合,同時(shí)具有很強(qiáng)的橫向擴(kuò)展能力,最大可擴(kuò)展至288節(jié)點(diǎn),單一文件系統(tǒng)可支持40PB容量。分析功能是指OceanStor 9000中內(nèi)置了分布式數(shù)據(jù)庫(kù),能完成數(shù)據(jù)的快速檢索和查詢,以支持上層應(yīng)用。
華為一直堅(jiān)持“被集成”的策略,這在大數(shù)據(jù)領(lǐng)域同樣適用。華為的大數(shù)據(jù)存儲(chǔ)平臺(tái)可以提供開(kāi)放的接口,方便與BI軟件和應(yīng)用軟件連接,進(jìn)一步提高查詢效率。在OceanStor 9000這樣的融合平臺(tái)之上,用戶還可以根據(jù)業(yè)務(wù)的情況靈活添加相關(guān)的功能模塊?!霸诖髷?shù)據(jù)方面,我們主要從垂直行業(yè)切入,與行業(yè)ISV緊密合作,為金融、電信運(yùn)營(yíng)商、媒體、智慧城市、石油勘探等領(lǐng)域的用戶提供端到端的大數(shù)據(jù)存儲(chǔ)解決方案。”經(jīng)寧說(shuō),“雖然我們已在大數(shù)據(jù)存儲(chǔ)市場(chǎng)上取得了豐碩的成果,但是我們更看好大數(shù)據(jù)存儲(chǔ)市場(chǎng)未來(lái)的潛力,因?yàn)槠湓鲩L(zhǎng)速度遠(yuǎn)高于傳統(tǒng)存儲(chǔ)市場(chǎng)?!?/p>
產(chǎn)生這一變革需求的原因除了市場(chǎng)需求因素之外,陸續(xù)出現(xiàn)的一些困擾數(shù)據(jù)存儲(chǔ)行業(yè)發(fā)展的因素也是重要原因。在過(guò)去,由于用戶對(duì)存儲(chǔ)應(yīng)用需求的復(fù)雜性和個(gè)性化,具備整體解決方案能力的廠商占據(jù)了明顯的市場(chǎng)優(yōu)勢(shì),打造整體解決方案能力也就成為存儲(chǔ)業(yè)界競(jìng)爭(zhēng)的焦點(diǎn)。但在網(wǎng)絡(luò)信息化的新尋求之下,過(guò)去那些具備獨(dú)特優(yōu)勢(shì)的廠商很難在“存儲(chǔ)設(shè)備+網(wǎng)絡(luò)服務(wù)器+軟件+服務(wù)支持”的整體解決方案框架下提出整體解決方案。其中,高額的成本是最重要的原因。對(duì)于很多具有突出專(zhuān)業(yè)優(yōu)勢(shì)的企業(yè)來(lái)講,通過(guò)尋求合作降低成本似乎成為惟一的途徑。
中國(guó)存儲(chǔ)市場(chǎng)很長(zhǎng)時(shí)期以來(lái)是電信、金融行業(yè)的重點(diǎn)服務(wù)對(duì)象,其采購(gòu)量占據(jù)了2/3以上。但自2002年開(kāi)始,更多的行業(yè)涉足存儲(chǔ)應(yīng)用,而且從應(yīng)用的范圍看,不僅僅限于傳統(tǒng)的備份和容災(zāi),在廣度和深度上有更多延伸,如廣電的媒體多級(jí)存儲(chǔ),監(jiān)控的視頻圖像存儲(chǔ),氣象、石油和航天的海量數(shù)據(jù)存儲(chǔ)等。而且,隨著各企業(yè)單位對(duì)業(yè)務(wù)數(shù)據(jù)保護(hù)意識(shí)的加強(qiáng),中小數(shù)據(jù)規(guī)模的用戶,如政府、軍隊(duì)、教育、商業(yè)、制造業(yè)和中小企業(yè)等也開(kāi)始加大了在存儲(chǔ)方面的投入。據(jù)CCID預(yù)測(cè),從2004年開(kāi)始,五年內(nèi)中國(guó)存儲(chǔ)市場(chǎng)會(huì)以10%一20%的年增長(zhǎng)率遞增。2004~2008年中國(guó)外部磁盤(pán)存儲(chǔ)系統(tǒng)市場(chǎng)銷(xiāo)售量將以64,4%的年復(fù)合增長(zhǎng)率快速增長(zhǎng)。到2008年,外部磁盤(pán)存儲(chǔ)系統(tǒng)銷(xiāo)售額及銷(xiāo)售量分別達(dá)到103.3億元人民幣和82436.4TB,存儲(chǔ)軟件2007年的銷(xiāo)售額將接近25億元。
雖然市場(chǎng)的細(xì)分帶來(lái)了更多的機(jī)會(huì),但同樣也使得競(jìng)爭(zhēng)變得更加激烈。事實(shí)上,在數(shù)據(jù)存儲(chǔ)“存儲(chǔ)設(shè)備+網(wǎng)絡(luò)服務(wù)器+軟件+服務(wù)支持”這條產(chǎn)業(yè)鏈上,并不都是很容易切人的。
云存儲(chǔ)可以充分利用現(xiàn)有硬件的存儲(chǔ)能力,分布計(jì)算,提高存儲(chǔ)能力,云存儲(chǔ)分為公有云存儲(chǔ)和私有云存儲(chǔ),對(duì)企業(yè)客戶來(lái)說(shuō),使用公有云存儲(chǔ)最大的顧慮是數(shù)據(jù)安全,但是私有云存儲(chǔ)就能很好的解決這個(gè)問(wèn)題。
實(shí)體存儲(chǔ)是存儲(chǔ)行業(yè)的大趨勢(shì),主要原因是非結(jié)構(gòu)化數(shù)據(jù)的飛速增長(zhǎng)或傳統(tǒng)數(shù)據(jù)存儲(chǔ)的局限性。在選擇私有云儲(chǔ)存時(shí)要考慮云存儲(chǔ)的技術(shù)實(shí)現(xiàn),選擇基于實(shí)體存儲(chǔ)解決方案的產(chǎn)品。這里以企業(yè)云盤(pán)為例,介紹企業(yè)在文檔和數(shù)據(jù)存儲(chǔ)方面的管理。
在技術(shù)解決方案上,企業(yè)云盤(pán)一般分三層,最底層是硬件資源和云管理平臺(tái),充分利用公司現(xiàn)有的存儲(chǔ)硬件。中間一層是云存儲(chǔ)核心部分,實(shí)現(xiàn)云存儲(chǔ)的數(shù)據(jù)管理,基于實(shí)體存儲(chǔ)的設(shè)計(jì)思路,突破操作系統(tǒng)對(duì)文件管理的局限性。商務(wù)邏輯為企業(yè)用戶定制,含企業(yè)特有的模塊和功能。最上面的一層是應(yīng)用層,榮之聯(lián)提供不同終端的軟件供用戶安裝,終端軟件和云存儲(chǔ)對(duì)接,做數(shù)據(jù)交換。對(duì)員工而言,終端軟件就是企業(yè)云盤(pán)。
那站在企業(yè)的角度來(lái)看,運(yùn)用企業(yè)云盤(pán)這種私有云存儲(chǔ)能給企業(yè)帶來(lái)怎樣的好處了呢?
1.數(shù)據(jù)更加安全高效:私有云存儲(chǔ)是部署在公司的防火墻內(nèi),受公司的安全機(jī)制管制,還能輕松管理每個(gè)員工的讀寫(xiě)權(quán)限。同時(shí)文件分享可以讓員工在無(wú)VPN的情況下讀寫(xiě)文檔,公司內(nèi)部無(wú)需安裝文件服務(wù)器,而且企業(yè)云盤(pán)擁有去重的功能,對(duì)硬件資源的利用更充分,大大減少硬件資源的浪費(fèi)。還能支持各移動(dòng)終端進(jìn)行移動(dòng)辦公,無(wú)須擔(dān)心數(shù)據(jù)同步問(wèn)題。
2.文檔分享、搜索更快捷:群組概念提供更靈活的分享途徑。員工可以創(chuàng)建項(xiàng)目組、興趣組、部門(mén)組、公司組。群組的概念讓文件分享更加有針對(duì)性。企業(yè)文檔被集中管理,員工可以在創(chuàng)建的不同層面上做搜索。
3.更優(yōu)的用戶體驗(yàn):企業(yè)云盤(pán)和用戶的電腦無(wú)縫集成。用戶無(wú)需改變使用習(xí)慣就可以充分享受云存儲(chǔ)的好處。備份,同步自動(dòng)在后臺(tái)進(jìn)行,優(yōu)化的算法也充分利用網(wǎng)絡(luò)帶寬。用戶也可自設(shè)上傳下載的速率。同時(shí)榮之聯(lián)創(chuàng)新的分布式部署極大降低對(duì)帶寬的要求。用戶的數(shù)據(jù)首先是存放到最近的服務(wù)器,讀寫(xiě)更快捷。
4.審計(jì)和版本管理:云盤(pán)自帶審計(jì)和版本管理功能,可以輕松地恢復(fù)到以前的版本。
5.API 支持:企業(yè)云盤(pán)可以部署為云存儲(chǔ)。企業(yè)內(nèi)部的應(yīng)用可以直接調(diào)用云存儲(chǔ)的API來(lái)讀寫(xiě)數(shù)據(jù)。是真正意義上的企業(yè)私有實(shí)體存儲(chǔ)(Object Storage) 。
現(xiàn)階段我國(guó)常見(jiàn)的XBRI數(shù)據(jù)存儲(chǔ)方式主要包括:文件系統(tǒng)存儲(chǔ)、關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)、原生數(shù)據(jù)庫(kù)存儲(chǔ)。目前運(yùn)用最為廣泛的XBRL數(shù)據(jù)存儲(chǔ)方式是以關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)XBRL文檔,可以分為CLOB字段存入關(guān)系數(shù)據(jù)庫(kù)和拆分方式存入關(guān)系數(shù)據(jù)庫(kù),其中以拆分方式存入關(guān)系數(shù)據(jù)庫(kù)最為常見(jiàn)。以拆分方式存入即將XBRL文檔分解映射到關(guān)系數(shù)據(jù)庫(kù)的多張關(guān)系型表中。采用該種方式保證了數(shù)據(jù)的安全性和完整性,且易于數(shù)據(jù)查詢、挖掘和數(shù)據(jù)的深加工,是目前廣泛應(yīng)用的XBRL數(shù)據(jù)存儲(chǔ)方案。但此種方式也存在弊端:一是難以映射復(fù)雜的XBRL實(shí)例文檔,且其維護(hù)極其復(fù)雜。二是對(duì)于XBRL文檔完整性的體現(xiàn)蕩然無(wú)存。三是這種分解的方式會(huì)耗費(fèi)數(shù)據(jù)庫(kù)服務(wù)器的大量CPU和內(nèi)存資源。四是這種方式破壞XBRL文檔內(nèi)部的關(guān)聯(lián)關(guān)系,容易造成XBRL數(shù)據(jù)失真。盡管以關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)技術(shù)進(jìn)行XBRL數(shù)據(jù)存儲(chǔ)的存儲(chǔ)方案,在目前市場(chǎng)上有著堅(jiān)實(shí)的地位和強(qiáng)大的軟件支持,然而因信息管理技術(shù)不斷進(jìn)步而涌現(xiàn)的諸多問(wèn)題,將會(huì)是關(guān)系型數(shù)據(jù)庫(kù)所不能承受的生命之重。
二、新一代XBRL數(shù)據(jù)存儲(chǔ)方式――混合數(shù)據(jù)庫(kù)存儲(chǔ)
在關(guān)系型數(shù)據(jù)庫(kù)所主宰的堅(jiān)固世界正在逼近變革的臨界點(diǎn)上,根據(jù)“螺旋式”上升的法則,混合型數(shù)據(jù)庫(kù)孕育而生。本文擬將基于混合數(shù)據(jù)庫(kù),就一個(gè)商品銷(xiāo)售信息的存儲(chǔ)為例,從下述方面來(lái)探討混合數(shù)據(jù)庫(kù)存儲(chǔ)技術(shù)所具備的優(yōu)質(zhì)功能特性。(1)邏輯存儲(chǔ)。創(chuàng)建同時(shí)包含傳統(tǒng)SQL數(shù)據(jù)類(lèi)型列和新的XBRL數(shù)據(jù)類(lèi)型列的表。列表沒(méi)有制定XML數(shù)據(jù)的內(nèi)部結(jié)構(gòu),原因是XBRL文檔是自我描述的,混合型數(shù)據(jù)庫(kù)對(duì)XBRL數(shù)據(jù)存儲(chǔ)時(shí),只需驗(yàn)證其是否符合XBRL分類(lèi)標(biāo)準(zhǔn)及規(guī)范。這種寬松的方式給用戶提供了很強(qiáng)的靈活性,更容易存儲(chǔ)包含不同屬性和內(nèi)部結(jié)構(gòu)的XBRL文檔集合,從而保證了XBRL數(shù)據(jù)的完整性與準(zhǔn)確性。(2)物理存儲(chǔ)。以樹(shù)和節(jié)點(diǎn)作為模型來(lái)存儲(chǔ)和處理XBRL數(shù)據(jù),采用經(jīng)過(guò)解析的格式來(lái)反映原始XBRL文檔的層次結(jié)構(gòu),混合型數(shù)據(jù)庫(kù)將用模式類(lèi)型信息對(duì)XML層次結(jié)構(gòu)中的所有節(jié)點(diǎn)進(jìn)行標(biāo)注,從而保證了XBRL數(shù)據(jù)的內(nèi)部網(wǎng)狀關(guān)聯(lián)以及XBRL數(shù)據(jù)的層次性、多維度性。(3)索引。采用的是SQL DDL語(yǔ)句創(chuàng)建XBRL索引。該索引方式顯著提高了數(shù)據(jù)庫(kù)查詢和應(yīng)用程序的性能,減少為返回查詢結(jié)果集而必須讀取的數(shù)據(jù)量,同時(shí)具有標(biāo)示性,可以確保數(shù)據(jù)的準(zhǔn)確性。(4)查詢語(yǔ)言。程序員可以使用SQL或XQuery搜索數(shù)據(jù),應(yīng)用程序可以自由地使用這兩種語(yǔ)言的語(yǔ)句,而且一個(gè)查詢語(yǔ)句可以結(jié)合使用SQL和XQuery。此外,混合型數(shù)據(jù)庫(kù)有兩個(gè)查詢語(yǔ)言分析器:一個(gè)用于XQuery,另一個(gè)用于SQL。這兩種語(yǔ)言編寫(xiě)的查詢都能高效地重寫(xiě)查詢操作符以及選擇低成本的數(shù)據(jù)訪問(wèn)計(jì)劃。
混合數(shù)據(jù)庫(kù)的核心價(jià)值體現(xiàn)在,能將關(guān)系性數(shù)據(jù)庫(kù)引擎和XML數(shù)據(jù)庫(kù)引擎連接起來(lái),采用“雙核”引擎機(jī)制,除了支持表數(shù)據(jù)模型之外,還支持XML文檔的層次化數(shù)據(jù)模型,使用戶能夠同時(shí)管理好兩部分的數(shù)據(jù)內(nèi)容。同時(shí),使用SQL和XQuery來(lái)查詢和處理這兩種形式的數(shù)據(jù),既保留了關(guān)系型數(shù)據(jù)庫(kù)的優(yōu)勢(shì),又融入了XML對(duì)復(fù)雜數(shù)據(jù)管理的層次性、靈活性。因此,可以得出結(jié)論,采用混合數(shù)據(jù)庫(kù)技術(shù)進(jìn)行XBRL數(shù)據(jù)存儲(chǔ),是一種最為理想的XBRL數(shù)據(jù)存儲(chǔ)方案,將成為企業(yè)XBRL財(cái)務(wù)信息集成管理體系運(yùn)用的核心關(guān)鍵技術(shù)。
三、企業(yè)級(jí)XBRL財(cái)務(wù)信息管理體系架構(gòu)
該企業(yè)有2個(gè)廠區(qū),其間通過(guò)光纖直連,廠區(qū)間直線距離3km。東廠區(qū)機(jī)房提供核心網(wǎng)絡(luò)支撐,運(yùn)行核心ERP系統(tǒng)和PLM全生命周期管理(設(shè)計(jì)圖紙管理)系統(tǒng),采用存儲(chǔ)陣列提供數(shù)據(jù)存儲(chǔ),其他業(yè)務(wù)系統(tǒng)有CAPP等,采用服務(wù)器自帶的存儲(chǔ)空間存儲(chǔ)數(shù)據(jù);目前,西廠區(qū)機(jī)房運(yùn)行視頻監(jiān)控、辦公自動(dòng)化和黨建系統(tǒng)等非核心業(yè)務(wù)系統(tǒng),現(xiàn)有設(shè)備使用時(shí)間較久。
1.2需求分析
目前,該企業(yè)業(yè)務(wù)系統(tǒng)管理方式較為簡(jiǎn)單,需要通過(guò)存儲(chǔ)備份技術(shù)提供整理的數(shù)據(jù)管理提升數(shù)據(jù)的可靠性、可用性,實(shí)現(xiàn)存儲(chǔ)資源的容量增加和性能擴(kuò)展,同時(shí),通過(guò)備份系統(tǒng)實(shí)現(xiàn)對(duì)現(xiàn)有存儲(chǔ)環(huán)境數(shù)據(jù)的備份管理,確保數(shù)據(jù)的安全和可恢復(fù)。具體目標(biāo)包括以下5點(diǎn):①滿足業(yè)務(wù)系統(tǒng)增長(zhǎng)的數(shù)據(jù)存儲(chǔ)要求;②解決數(shù)據(jù)無(wú)法統(tǒng)一規(guī)劃、分配、管理和性能調(diào)優(yōu),且存儲(chǔ)性能相對(duì)較低的問(wèn)題;③集中的統(tǒng)一存儲(chǔ)系統(tǒng),可使成本降至最低;④解決數(shù)據(jù)分散存儲(chǔ)問(wèn)題,這樣會(huì)增加管理成本;⑤對(duì)個(gè)人電腦上的重要數(shù)據(jù)進(jìn)行集中存儲(chǔ)管理。
1.3建設(shè)目標(biāo)
通過(guò)整體建設(shè)考慮,主要建設(shè)目標(biāo)可分為2步實(shí)現(xiàn):①數(shù)據(jù)存儲(chǔ)建設(shè)。建設(shè)基于存儲(chǔ)備份平臺(tái)的存儲(chǔ)系統(tǒng),將分散、獨(dú)立的各個(gè)平臺(tái)業(yè)務(wù)系統(tǒng)組成一個(gè)高速存儲(chǔ)的SAN網(wǎng)絡(luò),集中管理降低了存儲(chǔ)資源管理的復(fù)雜性。同時(shí),為個(gè)人重要數(shù)據(jù)提供了集中數(shù)據(jù)存儲(chǔ)業(yè)務(wù),避免了因電腦損壞或因其他原因?qū)е碌臄?shù)據(jù)丟失。②備份系統(tǒng)建設(shè)。通過(guò)帶有重復(fù)數(shù)據(jù)刪除技術(shù)的虛擬帶庫(kù)結(jié)合備份軟件進(jìn)行備份系統(tǒng)建設(shè),可確保ERP、PLM等核心業(yè)務(wù)數(shù)據(jù)的安全、可靠,同時(shí),可長(zhǎng)期保存該數(shù)據(jù),且數(shù)據(jù)可恢復(fù)。
2存儲(chǔ)備份系統(tǒng)的設(shè)計(jì)方案
2.1數(shù)據(jù)平臺(tái)基礎(chǔ)的架構(gòu)設(shè)計(jì)
根據(jù)數(shù)據(jù)存儲(chǔ)備份的需求分析進(jìn)行數(shù)據(jù)存儲(chǔ)系統(tǒng)的架構(gòu)設(shè)計(jì)。從目前業(yè)務(wù)系統(tǒng)的實(shí)際情況和未來(lái)業(yè)務(wù)系統(tǒng)的建設(shè)規(guī)劃看,整個(gè)核心業(yè)務(wù)系統(tǒng)中數(shù)據(jù)訪問(wèn)模式以數(shù)據(jù)塊訪問(wèn)為主?;诖饲闆r,存儲(chǔ)備份系統(tǒng)的基本架構(gòu)應(yīng)為SAN架構(gòu)。
2.1.1SAN架構(gòu)
存儲(chǔ)區(qū)域網(wǎng)絡(luò)(StorageAreaNetwork)是高性能的網(wǎng)絡(luò),其主要目的是使存儲(chǔ)設(shè)備與計(jì)算機(jī)系統(tǒng)連接并通信。在進(jìn)行SAN架構(gòu)設(shè)計(jì)時(shí),應(yīng)從以下幾方面考慮。
2.1.2性能
作為整個(gè)信息基礎(chǔ)架構(gòu)的核心基礎(chǔ)架構(gòu),SAN架構(gòu)應(yīng)能滿足多業(yè)務(wù)、大并發(fā)時(shí)的性能需求,因此,在設(shè)計(jì)SAN架構(gòu)時(shí)應(yīng)考慮具備高性能,同時(shí),能支撐多業(yè)務(wù)并訪問(wèn)的存儲(chǔ)系統(tǒng)。
2.1.3可靠性
可靠性是存儲(chǔ)系統(tǒng)的必須具備的條件,應(yīng)提供“99.999%”的可靠性,所有關(guān)鍵的部件都應(yīng)是冗余配置。從數(shù)據(jù)保護(hù)的角度看,不同的RAID保護(hù)機(jī)制應(yīng)可混合使用,以為不同的業(yè)務(wù)系統(tǒng)提供相應(yīng)的數(shù)據(jù)保護(hù)機(jī)制。SAN網(wǎng)絡(luò)系統(tǒng)至少應(yīng)配置2臺(tái)光纖交換機(jī),以保證數(shù)據(jù)訪問(wèn)鏈路是冗余的。
2.1.4可擴(kuò)展性
好的信息基礎(chǔ)架構(gòu)必須能提供足夠的擴(kuò)展能力,其中,包括性能的擴(kuò)展、功能的擴(kuò)展和規(guī)模的擴(kuò)展等。NAS架構(gòu)是指網(wǎng)絡(luò)附加存儲(chǔ)(NetworkAttachedStorage),是連接到網(wǎng)絡(luò)并提供文件訪問(wèn)服務(wù)的存儲(chǔ)系統(tǒng)。
2.2數(shù)據(jù)存儲(chǔ)方案和邏輯架構(gòu)
在該企業(yè)的業(yè)務(wù)系統(tǒng)中,考慮建立以SAN+NAS為核心的存儲(chǔ)系統(tǒng)??紤]未來(lái)可能會(huì)有新的業(yè)務(wù)系統(tǒng)增加到現(xiàn)有環(huán)境中,因此,需要構(gòu)建穩(wěn)定、靈活的存儲(chǔ)體系。系統(tǒng)具體包括以下6部分:①光纖交換機(jī)。作為核心鏈接節(jié)點(diǎn)存在,東、西區(qū)機(jī)房都要求有2臺(tái)冗余配置。②光纖。實(shí)現(xiàn)容災(zāi)端的連接,連接備份設(shè)備,光纖要求有2條冗余設(shè)計(jì)。③核心存儲(chǔ)陣列。作為集中存儲(chǔ)、管理的中心存在,滿足數(shù)據(jù)增長(zhǎng)的需要。④其他存儲(chǔ)陣列。其性能較差、容量較小,作為二級(jí)存儲(chǔ)設(shè)備存儲(chǔ)存在。⑤備份服務(wù)器。安裝備份軟件,配置備份策略。⑥備份設(shè)備。支持消重技術(shù),保障數(shù)據(jù)的長(zhǎng)期儲(chǔ)存。
2.2.1方案描述
SAN存儲(chǔ)空間通過(guò)2臺(tái)FCSAN交換機(jī)提供冗余互聯(lián)。SAN存儲(chǔ)空間供原有業(yè)務(wù)系統(tǒng)數(shù)據(jù)存儲(chǔ),比如將EPR、PLM系統(tǒng)數(shù)據(jù)遷移到新購(gòu)的存儲(chǔ)設(shè)備上,通過(guò)新存儲(chǔ)優(yōu)秀的性能,可提高原有業(yè)務(wù)系統(tǒng)的性能和存儲(chǔ)空間;NAS存儲(chǔ)空間主要用于個(gè)人PC數(shù)據(jù)資料的統(tǒng)一集中管理,確保數(shù)據(jù)不因個(gè)人電腦故障而丟失。
2.2.2磁盤(pán)規(guī)劃
在本次配置中,考慮根據(jù)需求選用SAS磁盤(pán),配置40塊10000轉(zhuǎn)的600GBSAS磁盤(pán)提供數(shù)據(jù)存儲(chǔ)能力,這樣既能保證關(guān)鍵業(yè)務(wù)的快速響應(yīng),也能確保最優(yōu)的性價(jià)比。
2.3數(shù)據(jù)備份方案
硬件采用虛擬磁帶庫(kù)設(shè)備接入SAN網(wǎng)絡(luò)作為備份設(shè)備。此外,采用備份軟件可實(shí)現(xiàn)對(duì)所有備份主機(jī)系統(tǒng)的備份管理。以下針對(duì)不同的業(yè)務(wù)類(lèi)型展開(kāi)備份策略設(shè)計(jì)。
2.3.1數(shù)據(jù)庫(kù)類(lèi)數(shù)據(jù)備份每周1次全備份,本周內(nèi)其他時(shí)間每天進(jìn)行1次增量備份,備份數(shù)據(jù)保留6個(gè)月。
2.3.2應(yīng)用程序類(lèi)數(shù)據(jù)備份每月進(jìn)行1次全備份,備份數(shù)據(jù)保存3個(gè)月。
2.3.3配置文件類(lèi)數(shù)據(jù)備份每月進(jìn)行1次全備份,備份數(shù)據(jù)保存3個(gè)月。
當(dāng)前,供電企業(yè)個(gè)人或部門(mén)的數(shù)據(jù),例如文本、圖片、歸檔數(shù)據(jù)、各種格式的文件等等,數(shù)據(jù)量呈現(xiàn)海量的增長(zhǎng),面臨如下問(wèn)題:
1、個(gè)人存儲(chǔ)空間不足。供電企業(yè)個(gè)人PC設(shè)備,使用年限一般為5-7年,部分機(jī)型較老較舊,配置較低。主要的存儲(chǔ)設(shè)備為硬盤(pán),空間在多年的存儲(chǔ)使用下已出現(xiàn)嚴(yán)重不足,普遍無(wú)法適應(yīng)新增數(shù)據(jù)存儲(chǔ)的需求。
2、數(shù)據(jù)交互共享難。當(dāng)前,個(gè)人用戶之間,部門(mén)之間,需要及時(shí)共享的數(shù)據(jù)容量越來(lái)越大,通過(guò)傳統(tǒng)的使用U盤(pán)、移動(dòng)硬盤(pán)、FTP來(lái)中轉(zhuǎn)拷貝數(shù)據(jù)的方式,已越來(lái)越不適應(yīng)當(dāng)前的需要,存在著病毒感染、丟失等安全隱患。
針對(duì)以上兩種情況,本文通過(guò)架設(shè)私有云存儲(chǔ)服務(wù)器的方式來(lái)解決數(shù)據(jù)存儲(chǔ)和共享方面的問(wèn)題,為供電企業(yè)數(shù)據(jù)存儲(chǔ)提供新的思路和解決方案。
一、項(xiàng)目實(shí)現(xiàn)功能
從應(yīng)用場(chǎng)景上,我們的方案包括如下主要內(nèi)容:1、文件存儲(chǔ)(為每個(gè)用戶提供10G以上的存儲(chǔ)空間);2、數(shù)據(jù)同步(通過(guò)云存儲(chǔ)提供的數(shù)據(jù)同步功能,實(shí)現(xiàn)員工數(shù)據(jù)的多終端同步);3、桌面數(shù)據(jù)備份(通過(guò)云存儲(chǔ)提供的數(shù)據(jù)備份功能,實(shí)現(xiàn)電腦中的數(shù)據(jù)的自動(dòng)備份,支持文件級(jí)差異化備份機(jī)制);4、文檔內(nèi)容(通過(guò)云存儲(chǔ)提供的數(shù)據(jù)自動(dòng)分發(fā)功能,可將企業(yè)內(nèi)部公告、通訊錄等文檔或電子表格快速地分發(fā)給指定的員工或部門(mén),或通過(guò)外鏈地址(U RL)嵌入到郵件等);5、文檔快速匯總(通過(guò)云存儲(chǔ)提供的數(shù)據(jù)自動(dòng)匯總功能,可以實(shí)現(xiàn)快速將員工本地文件自動(dòng)匯總到云存儲(chǔ)的指定位置中);6、群組或部門(mén)工作區(qū)(可按需要建立群組或部門(mén)工作區(qū),用于團(tuán)隊(duì)協(xié)作,協(xié)同辦公,并支持文件多版本及文件鎖機(jī)制,提升多人協(xié)同辦公的效率)。
二、項(xiàng)目實(shí)施方案
2.1系統(tǒng)架構(gòu)設(shè)計(jì)圖
如圖1。
2.2主要功能模塊
1、負(fù)載均衡模塊(LVS):負(fù)載均衡模塊建立在所有應(yīng)用結(jié)構(gòu)之上,它提供了一種有效透明的方法擴(kuò)展網(wǎng)絡(luò)設(shè)備和服務(wù)器的帶寬、增加吞吐量、加強(qiáng)網(wǎng)絡(luò)數(shù)據(jù)處理能力、提高網(wǎng)絡(luò)的靈活性和可用性。
2、應(yīng)用服務(wù)模塊(APP Server):提供了一套完整的企業(yè)數(shù)據(jù)應(yīng)用、管理、監(jiān)控的應(yīng)用系統(tǒng)。私有云存儲(chǔ)作為企業(yè)數(shù)據(jù)應(yīng)用系統(tǒng),為企業(yè)員工提供個(gè)人數(shù)據(jù)存儲(chǔ)、分享服務(wù),保護(hù)數(shù)據(jù)安全;也可以按照企業(yè)組織架構(gòu)組建企業(yè)級(jí)、部門(mén)級(jí)、項(xiàng)目級(jí)的協(xié)同工作服務(wù),提高數(shù)據(jù)處理效率。此外,靈活的空間管理、集中的賬戶配置、實(shí)時(shí)的日志審計(jì)方便系統(tǒng)管理者實(shí)現(xiàn)全方位的管理和監(jiān)控。其中包括功能模塊如下。
應(yīng)用服務(wù)(Web Service):為整套系統(tǒng)前端應(yīng)用和web端訪問(wèn)提供支持。
傳輸服務(wù)(TP Service):為用戶提供數(shù)據(jù)傳輸?shù)闹С帧?/p>
3、文件存儲(chǔ)模塊(Storage Server):是一套分布式文件存儲(chǔ)系統(tǒng),為應(yīng)用服務(wù)模塊提供底層數(shù)據(jù)存儲(chǔ)及管理服務(wù)。可以作為標(biāo)準(zhǔn)的存儲(chǔ)系統(tǒng)為企業(yè)應(yīng)用系統(tǒng)提供標(biāo)準(zhǔn)的數(shù)據(jù)存儲(chǔ)。
4、數(shù)據(jù)庫(kù)模塊(DB Server):其中包括功能模塊如下。
主數(shù)據(jù)庫(kù):為應(yīng)用服務(wù)模塊提供結(jié)構(gòu)化數(shù)據(jù)服務(wù)。
從數(shù)據(jù)庫(kù):為主數(shù)據(jù)庫(kù)提供備份服務(wù)。
2.3部署方式
在內(nèi)網(wǎng)服務(wù)器上安裝私有云存儲(chǔ)軟件,并配置存儲(chǔ)服務(wù)器與之互聯(lián)。保持私有云存儲(chǔ)系統(tǒng)的網(wǎng)絡(luò)連通,在IE中輸入默認(rèn)的管理地址進(jìn)行管理訪問(wèn)。
希捷市場(chǎng)營(yíng)銷(xiāo)副總裁Jeff Fochtman表示:“作為希捷7月份的10TB Guardian守護(hù)者系列存儲(chǔ)解決方案的最新產(chǎn)品,IronWolf Pro為企業(yè)提供了更高的可靠性和靈活性,用于其大規(guī)模和多用戶操作NAS環(huán)境的最繁重工作負(fù)載。同時(shí),新的IronWolf Pro增加了希捷數(shù)據(jù)恢復(fù)服務(wù),企業(yè)可以更加安心地存儲(chǔ)數(shù)據(jù),充分保證數(shù)據(jù)安全?!?/p>
IronWolf硬盤(pán)針對(duì)各種NAS業(yè)務(wù)設(shè)計(jì),IronWolf Pro配備優(yōu)化NAS應(yīng)用的AgileArray?,幫助企業(yè)提升共享和備份文件的性能,改進(jìn)私有云環(huán)境。AgileArray通過(guò)雙面平衡技術(shù)和RV傳感器保持硬盤(pán)平衡,進(jìn)一步優(yōu)化了RAID,提供先進(jìn)的能耗管理,提升了整體性能。
中圖分類(lèi)號(hào):TP39文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào)1006-0278(2015)12-151-01
存儲(chǔ)即服務(wù)的概念不斷深入人心,云存儲(chǔ)作為云計(jì)算概念的發(fā)展和延伸得到了快速的發(fā)展。云存儲(chǔ)是一種全新的存儲(chǔ)服務(wù)模式,有效地整合了大規(guī)模的存儲(chǔ)資源并把存儲(chǔ)以服務(wù)的形式提供給用戶。云存儲(chǔ)實(shí)現(xiàn)了合理的數(shù)據(jù)存儲(chǔ)和高效的數(shù)據(jù)管理,有效地減輕了用戶對(duì)數(shù)據(jù)存儲(chǔ)和管理的負(fù)擔(dān),同時(shí)也降低了用戶的開(kāi)銷(xiāo)。隨著云存儲(chǔ)服務(wù)和研究的不斷深入,政府部門(mén)和企業(yè)數(shù)據(jù)外包服務(wù)等應(yīng)用成為云存儲(chǔ)應(yīng)用的重要部分。
隨著云存儲(chǔ)技術(shù)的快速發(fā)展,數(shù)據(jù)安全問(wèn)題得到了產(chǎn)業(yè)界和學(xué)術(shù)界的廣泛關(guān)注。絕大部分用戶希望在不損害數(shù)據(jù)原有安全性的前提下使用云存儲(chǔ)服務(wù)。針對(duì)云存儲(chǔ)中數(shù)據(jù)保護(hù)需求,研究者開(kāi)始采用密文訪問(wèn)控制機(jī)制來(lái)保護(hù)數(shù)據(jù)在存儲(chǔ)和共享過(guò)程中的安全。然而,在云存儲(chǔ)中采用密文訪問(wèn)控制機(jī)制會(huì)較為明顯地增加用戶使用開(kāi)銷(xiāo),降低用戶訪問(wèn)云存儲(chǔ)的效率。特別是當(dāng)數(shù)據(jù)共享規(guī)模大、用戶屬性較少、訪問(wèn)權(quán)限變更頻繁、數(shù)據(jù)訪問(wèn)集中時(shí),采用密文訪問(wèn)控制機(jī)制會(huì)明顯增加用戶訪問(wèn)云存儲(chǔ)的延時(shí)。如何有效應(yīng)對(duì)密鑰分發(fā)復(fù)雜、權(quán)限撤銷(xiāo)開(kāi)銷(xiāo)大、用戶資源受限等挑戰(zhàn),降低采用密文訪問(wèn)控制機(jī)制的額外開(kāi)銷(xiāo),是云存儲(chǔ)數(shù)據(jù)安全保護(hù)研究中亟待解決的關(guān)鍵問(wèn)題。
一、密文訪問(wèn)控制的基本應(yīng)用場(chǎng)景
數(shù)據(jù)所有者主要負(fù)責(zé)數(shù)據(jù)加密和密文分發(fā)操作,數(shù)據(jù)一般采用對(duì)稱(chēng)算法加密后托管到云端,然后通過(guò)安全信道或其他可靠手段將密鑰分發(fā)給授權(quán)的數(shù)據(jù)使用者。數(shù)據(jù)使用者從云存儲(chǔ)中取回?cái)?shù)據(jù)后解密使用,采用不同密文訪問(wèn)控制技術(shù)時(shí)的解密密鑰獲取過(guò)程不盡相同。云存儲(chǔ)服務(wù)提供商只需要提供相應(yīng)的數(shù)據(jù)存儲(chǔ)能力,響應(yīng)數(shù)據(jù)讀寫(xiě)請(qǐng)求即可。系統(tǒng)管理員負(fù)責(zé)配置云存儲(chǔ)服務(wù),完成密文訪問(wèn)控制機(jī)制初始化,管理維護(hù)系統(tǒng)用戶的身份證書(shū)。
二、簡(jiǎn)單個(gè)人用戶密文訪問(wèn)控制實(shí)現(xiàn)方案
用戶將數(shù)據(jù)加密后存放到云存儲(chǔ)中,使用時(shí)取回?cái)?shù)據(jù)并解密。簡(jiǎn)單個(gè)人用戶很少需要共享數(shù)據(jù),因此可以簡(jiǎn)化密文訪問(wèn)控制過(guò)程,降低用戶開(kāi)銷(xiāo),簡(jiǎn)單個(gè)人用戶密文訪問(wèn)控制實(shí)現(xiàn)方案的基本流程,如圖1所示。
三、總結(jié)
本文在深入分析云存儲(chǔ)中數(shù)據(jù)安全防護(hù)需求的基礎(chǔ)上,綜合現(xiàn)有密文訪問(wèn)控制技術(shù)和新型密碼技術(shù),提出了云存儲(chǔ)中密文訪問(wèn)控制模型的數(shù)學(xué)描述,并分析了影響模型性能的主要因素。然后分別針對(duì)簡(jiǎn)單個(gè)人用戶、社區(qū)個(gè)人用戶和企業(yè)用戶,給出了模型的多種不同實(shí)現(xiàn)方案。其中,基本密文訪問(wèn)控制方案能夠?yàn)楹?jiǎn)單個(gè)人用戶的數(shù)據(jù)云端存儲(chǔ)和共享過(guò)程提供簡(jiǎn)潔、有效的保護(hù)。基于本地的云存儲(chǔ)訪問(wèn)效率優(yōu)化技術(shù)。企業(yè)用戶使用云存儲(chǔ)時(shí)具有數(shù)據(jù)量大、共享頻繁、訪問(wèn)相對(duì)集中等特征,如果簡(jiǎn)單地采用密文訪問(wèn)控制機(jī)制來(lái)保護(hù)數(shù)據(jù)存儲(chǔ)和共享安全,則會(huì)降低云存儲(chǔ)的訪問(wèn)效率?;诒镜氐脑拼鎯?chǔ)訪問(wèn)效率優(yōu)化技術(shù),能夠在企業(yè)已有計(jì)算、存儲(chǔ)資源上部署本地,然后通過(guò)本地來(lái)代替員工完成密文訪問(wèn)控制相關(guān)操作、并緩存頻繁訪問(wèn)的數(shù)據(jù),最終有效地降低采用密文訪問(wèn)控制機(jī)制對(duì)企業(yè)用戶的影響。以上研究成果針對(duì)云存儲(chǔ)數(shù)據(jù)安全需求,在保證數(shù)據(jù)安全的前提下提升了密文訪問(wèn)控制機(jī)制的效率,促進(jìn)了密文訪問(wèn)控制技術(shù)在云存儲(chǔ)數(shù)據(jù)安全保護(hù)中的進(jìn)一步應(yīng)用,具有一定的理論意義和實(shí)際應(yīng)用價(jià)值。
參考文獻(xiàn):
[1]李家治.云存儲(chǔ)中基于屬性的密文檢索與訪問(wèn)控制[D].華東師范大學(xué),2015.
9月8日,紫光西部數(shù)據(jù)有限公司(以下簡(jiǎn)稱(chēng)紫光西部數(shù)據(jù))成立典禮在南京舉行,這是中國(guó)大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新發(fā)展的又一重要里程碑。秉承“自主創(chuàng)新+國(guó)際合作”的發(fā)展理念,紫光西部數(shù)據(jù)致力于為各行業(yè)客戶提供基于全產(chǎn)業(yè)鏈的大數(shù)據(jù)服務(wù),成為中國(guó)大數(shù)據(jù)產(chǎn)業(yè)戰(zhàn)略合伙人,這是為逐步實(shí)現(xiàn)紫光集團(tuán)大戰(zhàn)略而設(shè)定的一個(gè)“小目標(biāo)”。紫光西部數(shù)據(jù)從現(xiàn)在開(kāi)始起步。
構(gòu)建從“芯”到“云”的大生態(tài)
眾所周知,紫光集團(tuán)是中國(guó)IT界的一艘新航母。在國(guó)家集成電路產(chǎn)業(yè)推進(jìn)戰(zhàn)略的引導(dǎo)下,紫光集團(tuán)以“自主創(chuàng)新+國(guó)際合作”雙輪驅(qū)動(dòng),確立了以集成電路產(chǎn)業(yè)為主導(dǎo),向泛IT、移動(dòng)互聯(lián)、云計(jì)算與云服務(wù)等信息產(chǎn)業(yè)核心領(lǐng)域集中發(fā)展的戰(zhàn)略。
從2013年以來(lái),紫光集團(tuán)通過(guò)一系列的戰(zhàn)略并購(gòu),不斷完善自己的戰(zhàn)略布局,豐富產(chǎn)品線。紫光集團(tuán)先后投資超過(guò)1500億元,收購(gòu)了全球移動(dòng)通信芯片公司展訊通信和銳迪科,控股H3C和惠普中國(guó)企業(yè)業(yè)務(wù),分別成立紫光展銳和新華三集團(tuán)。清華系旗下最重要的IT產(chǎn)業(yè)平臺(tái)已具雛形,全面構(gòu)筑從“芯”到“云”的信息產(chǎn)業(yè)生態(tài)系統(tǒng)并非妄言。
IDC預(yù)測(cè),到2020年,全球的數(shù)據(jù)總量將達(dá)到44ZB。數(shù)據(jù)規(guī)模的持續(xù)增加,用戶對(duì)數(shù)據(jù)處理的速度,以及系統(tǒng)的可用性、可擴(kuò)展、靈活性等的要求不斷提升,這些都是大數(shù)據(jù)存儲(chǔ)迫切需要解決的問(wèn)題,也是大數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)面臨的新機(jī)遇。
毫無(wú)疑問(wèn),大數(shù)據(jù)存儲(chǔ)業(yè)務(wù)是紫光集團(tuán)這艘航母前進(jìn)的主要?jiǎng)恿χ?,而紫光集團(tuán)的戰(zhàn)略布局也早為大數(shù)據(jù)存儲(chǔ)業(yè)務(wù)的快速發(fā)展埋下伏筆。2016年7月,紫光集團(tuán)收購(gòu)武漢新芯多數(shù)股權(quán)后,長(zhǎng)江存儲(chǔ)科技有限責(zé)任公司正式成立。紫光集團(tuán)持有長(zhǎng)江存儲(chǔ)科技有限公司超過(guò)50%的股份。紫光集團(tuán)董事長(zhǎng)趙偉國(guó)出任長(zhǎng)江存儲(chǔ)公司董事長(zhǎng)。這是紫光集團(tuán)的大戰(zhàn)略從“芯”開(kāi)始的一個(gè)具體體現(xiàn)。
在今年舉行的第二屆中國(guó)大數(shù)據(jù)產(chǎn)業(yè)峰會(huì)暨中國(guó)電子商務(wù)創(chuàng)新發(fā)展峰會(huì)上,趙偉國(guó)曾表示,從2016年開(kāi)始,紫光集團(tuán)計(jì)劃投資300億美元用于存儲(chǔ)器芯片制造,這大概是中國(guó)有史以來(lái)最大的存儲(chǔ)項(xiàng)目。大數(shù)據(jù)的發(fā)展需要海量存儲(chǔ),而中國(guó)以前在這方面是空白,這便是紫光集團(tuán)選擇的發(fā)力點(diǎn)。芯片是產(chǎn)生和存儲(chǔ)數(shù)據(jù)的基本單位,也是發(fā)展大數(shù)據(jù)存儲(chǔ)的基礎(chǔ)。只有在芯片上掌握主動(dòng),才能在發(fā)展大數(shù)據(jù)存儲(chǔ)時(shí)做到有的放矢。
在紫光集團(tuán)著力打造的從“芯”到“云”的產(chǎn)業(yè)鏈中,“芯”是指芯片,那么“云”當(dāng)然是指大數(shù)據(jù)、大互聯(lián)、大安全和云計(jì)算。紫光集團(tuán)控股的新華三集團(tuán)在云和大數(shù)據(jù)方面提供了完整的解決方案,包括服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)設(shè)備,以及云操作系統(tǒng)、大數(shù)據(jù)安全系統(tǒng)等,在除運(yùn)營(yíng)商以外的企業(yè)網(wǎng)絡(luò)領(lǐng)域,紫光排名第一,在全球僅次于思科。
在大數(shù)據(jù)存儲(chǔ)的產(chǎn)業(yè)鏈條上,有了武漢新芯的存儲(chǔ)芯片,又有了新華三的存儲(chǔ)解決方案,這中間是不是還少了一個(gè)能夠?qū)⑺鼈兇?lián)和徹底打通的環(huán)節(jié)?紫光西部數(shù)據(jù)應(yīng)運(yùn)而生。
自主創(chuàng)新也少不了國(guó)際合作
紫光西部數(shù)據(jù)于2016年3月28日注冊(cè)成立,總部位于南京市秦淮高新技術(shù)園區(qū)內(nèi),市場(chǎng)和銷(xiāo)售總部則位于北京。紫光集團(tuán)旗下紫光股份持股比例為51%,而西部數(shù)據(jù)持股比例為49%。
紫光西部數(shù)據(jù)首席執(zhí)行官繆剛表示,新公司的愿景可以概括為一句話:以數(shù)據(jù)成就未來(lái),做中國(guó)大數(shù)據(jù)產(chǎn)業(yè)戰(zhàn)略合伙人。
具體來(lái)看,這一愿景又可以細(xì)分為以下四個(gè)層面:第一,扎根中國(guó),放眼全球,新公司將以中國(guó)為起點(diǎn),憑借全球領(lǐng)先的技術(shù)研發(fā)、設(shè)計(jì)生產(chǎn)、市場(chǎng)推廣等方面的優(yōu)勢(shì),提供符合中國(guó)市場(chǎng)需求的全方位大數(shù)據(jù)解決方案,并在此基礎(chǔ)上,進(jìn)軍全球市場(chǎng);第二,自主創(chuàng)新,安全可控,通過(guò)自主研發(fā),實(shí)現(xiàn)自主、安全和可控,在保護(hù)數(shù)據(jù)可靠的基礎(chǔ)上,保障多種核心應(yīng)用的安全、穩(wěn)定運(yùn)行;第三,行業(yè)優(yōu)化,扁平融合,針對(duì)具體的行業(yè)需求,開(kāi)發(fā)符合行業(yè)特性的全方位數(shù)據(jù)服務(wù),通過(guò)實(shí)現(xiàn)應(yīng)用層扁平化,實(shí)現(xiàn)大數(shù)據(jù)整體發(fā)展;第四,開(kāi)放合作,攜手共贏,全面打造開(kāi)放創(chuàng)新的平臺(tái),攜手各界合作伙伴,建立合作共贏的生態(tài)體系,合力推動(dòng)大數(shù)據(jù)產(chǎn)業(yè)的創(chuàng)新發(fā)展。
為了實(shí)現(xiàn)上述宏偉目標(biāo),紫光西部數(shù)據(jù)需要在堅(jiān)持自主創(chuàng)新的基礎(chǔ)上,以開(kāi)放的胸懷,采取積極的合作策略,而西部數(shù)據(jù)無(wú)疑是一個(gè)理想的合作伙伴。
西部數(shù)據(jù)是全球領(lǐng)先的數(shù)據(jù)存儲(chǔ)解決方案提供商,在全球硬盤(pán)市場(chǎng)的占有率排名第一。與紫光集團(tuán)類(lèi)似,西部數(shù)據(jù)近幾年也通過(guò)一系列的收購(gòu)不斷完善產(chǎn)品的布局。2012年,西部數(shù)據(jù)收購(gòu)昱科環(huán)球存儲(chǔ)科技咨詢有限公司(HGST),目的在于為企業(yè)級(jí)市場(chǎng)的客戶提供高價(jià)值的存儲(chǔ)解決方案。2016年5月,西部數(shù)據(jù)又以190億美元的大手筆完成了對(duì)閃迪(SanDisk)公司的收購(gòu),快速轉(zhuǎn)型,成了閃存市場(chǎng)的佼佼者。
美國(guó)西部數(shù)據(jù)公司全球高級(jí)副總裁、數(shù)據(jù)中心系統(tǒng)事業(yè)部總經(jīng)理唐戴夫表示:“我們之所以選擇紫光集團(tuán)作為合作對(duì)象,一方面是因?yàn)樽瞎饧瘓F(tuán)具有本地研發(fā)、設(shè)計(jì)、生產(chǎn)、營(yíng)銷(xiāo)的能力,可以提供針對(duì)本土用戶需求的定制化的解決方案;另一方面,紫光集團(tuán)擁有寬泛的產(chǎn)品線和業(yè)務(wù),紫光旗下的新華三、紫光互聯(lián)等,都可以成為西部數(shù)據(jù)的合作伙伴,形成解決方案和業(yè)務(wù)上的互補(bǔ)。西部數(shù)據(jù)與紫光集團(tuán)的全方位合作,讓我們感覺(jué)未來(lái)在技術(shù)和業(yè)務(wù)的創(chuàng)新大有可為?!?/p>
繆剛進(jìn)一步介紹說(shuō):“合資公司將在核心存儲(chǔ)技術(shù)、企業(yè)級(jí)存儲(chǔ)解決方案,以及大數(shù)據(jù)全產(chǎn)業(yè)鏈服務(wù)等領(lǐng)域形成關(guān)鍵戰(zhàn)略合作,推動(dòng)紫光集團(tuán)從‘芯’到‘云’的信息產(chǎn)業(yè)生態(tài)系統(tǒng)的構(gòu)建,同時(shí)幫助西部數(shù)據(jù)實(shí)現(xiàn)業(yè)務(wù)拓展,為智慧城市、金融服務(wù)、媒體娛樂(lè)、天文氣象、電信、基因科學(xué)、醫(yī)療衛(wèi)生、新興互聯(lián)網(wǎng)等各行業(yè)客戶提供符合其需求的數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)服務(wù)解決方案?!?/p>
打造系統(tǒng)級(jí)的存儲(chǔ)產(chǎn)品
紫光西部數(shù)據(jù)為何落戶南京?首先,紫光西部數(shù)據(jù)在南京現(xiàn)有一支70多人的研發(fā)團(tuán)隊(duì),未來(lái)還要進(jìn)一步擴(kuò)張,這也是讓紫光西部數(shù)據(jù)引以為豪的實(shí)現(xiàn)自主可控的基本保證。其次,紫光西部數(shù)據(jù)接下來(lái)要與南京當(dāng)?shù)氐恼?、企事業(yè)單位加強(qiáng)合作,紫光西部數(shù)據(jù)與南京市有關(guān)部門(mén)聯(lián)合成立的大數(shù)據(jù)研發(fā)中心正在醞釀之中。
正如繆剛所說(shuō),紫光西部數(shù)據(jù)要首先扎根中國(guó),為中國(guó)用戶提供滿足其需求的定制化的大數(shù)據(jù)存儲(chǔ)解決方案。紫光西部數(shù)據(jù)9月8日舉行成立慶典之后將全面展開(kāi)營(yíng)銷(xiāo)活動(dòng),而最先推出的產(chǎn)品就是西部數(shù)據(jù)特有的動(dòng)態(tài)歸檔(Active Archive)系統(tǒng)。這一動(dòng)態(tài)歸檔系統(tǒng)是一個(gè)獨(dú)立自主的對(duì)象存儲(chǔ)系統(tǒng),可以方便地?cái)U(kuò)展存儲(chǔ)容量,最高可達(dá)數(shù)PB,且具有更高的可靠性和更好的成本效益,能夠同時(shí)滿足傳統(tǒng)應(yīng)用需求和新型應(yīng)用需求。
時(shí)至今日,西部數(shù)據(jù)已經(jīng)不再是那個(gè)擁有單一硬盤(pán)產(chǎn)品的廠商,其產(chǎn)品線涵蓋存儲(chǔ)介質(zhì)、存儲(chǔ)平臺(tái)、系統(tǒng)軟件和系統(tǒng)構(gòu)件,其中存儲(chǔ)系統(tǒng)成了最主要的抓手,動(dòng)態(tài)歸檔系統(tǒng)就是代表,而這正是紫光集團(tuán)與西部數(shù)據(jù)合作最重要的一類(lèi)產(chǎn)品。