正所謂長江后浪推前浪,分布式存儲快速增長是不可否認的,這從各大廠商的業(yè)績報告和分析師報告就能看出來,但想要把企業(yè)外置存儲這個前浪拍死在沙灘上還是步子邁太大,不現(xiàn)實。企業(yè)外置存儲在相當長的一段時間內(nèi),仍然是主流。它主要面向企業(yè)傳統(tǒng)應(yīng)用如ERP/CRM/HIS等,數(shù)據(jù)量不大但對可靠性、性能有極zhi要求,如銀行Core-Banking,從可靠性、生態(tài)層面,分布式存儲都不是比較好選擇。分布式存儲主要面向海量數(shù)據(jù)、新興業(yè)務(wù)場景,如HPC/EDA、大數(shù)據(jù),這類場景以二進制文件、視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)為主,數(shù)據(jù)量極大。所以從場景來看,二者場景是有明確區(qū)隔的,按場景并存是比較好的選擇。 五大主流分布式...
自誕生以來,分布式存儲就被視為存儲的未來,被萬眾期待。然而分布式存儲起步于寒門,早應(yīng)用于互聯(lián)網(wǎng)日志、企業(yè)備份歸檔、開發(fā)測試等場景,追求極zhi成本,性能和可靠性卻不敢恭維。但它還算爭氣,憑借多年的打怪練級,越來越多地開始承載自動駕駛研發(fā)、超高清編輯、運營商5G網(wǎng)絡(luò)云等企業(yè)的關(guān)鍵業(yè)務(wù),走上變成高富帥、贏取白富美的道路。正所謂人紅是非多,存儲領(lǐng)域也是一樣,坊間一直流傳著關(guān)于分布式存儲的各種流言蜚語。好事的筆者現(xiàn)今就來探尋一番,揭開謊言背后的真相。 分布式存儲還能夠容忍服務(wù)器故障,存儲系統(tǒng)依然穩(wěn)定可用,可靠性更優(yōu)。舟山集中式分布式存儲系統(tǒng)原理 面對海量數(shù)據(jù)的存儲需求,分布式存儲顯然在架構(gòu)上有著...
分布式存儲早期主要用于互聯(lián)網(wǎng)日志、企業(yè)備份歸檔、開發(fā)測試等場景,這些場景無疑是低價值場景,成本是第yi訴求甚至訴求。然此一時彼一時,士別三日也當刮目相看。首先是分布式存儲產(chǎn)品能力已今非昔比,逐漸具備了承載企業(yè)高價值業(yè)務(wù)的關(guān)鍵能力,例如毫秒級時延、TB/s級帶寬、雙活/3DC業(yè)務(wù)級容災(zāi)、端到端DIF等,無論是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù)的承載,功能完備性的比較大短板早已補齊。其次,分布式存儲已走入眾多高價值關(guān)鍵業(yè)務(wù),如運營商BOM業(yè)務(wù)、金融渠道類業(yè)務(wù)以及超算、油藏探測HPC等高價值業(yè)務(wù),通過大規(guī)模應(yīng)用實踐來檢驗成色。(小道消息,某些高價值場景全閃出貨價達到1000美金/TB以上啦)看完...
如何保證分布式存儲的高性能與高可用?大家可能想到的是,除了傳統(tǒng)架構(gòu)里面的備份、HotStandby、雙活、多活這種架構(gòu)之外,對于保證分布式存儲系統(tǒng)的高可靠和高可用,數(shù)據(jù)在系統(tǒng)中一般存儲多個副本。當某個存儲節(jié)點出故障時,系統(tǒng)能夠自動將服務(wù)切換到其他的副本,從而實現(xiàn)自動容錯。分布式存儲系統(tǒng)通過復(fù)制協(xié)議將數(shù)據(jù)同步到多個存儲節(jié)點,并確保多個副本之間的數(shù)據(jù)一致性。同一份數(shù)據(jù)有多個副本,只有一個為主副本Primary,其他的副本為備份副本Backup,數(shù)據(jù)從主副本復(fù)制到備份副本,采用終一致性來保證數(shù)據(jù)和事物的完整。 分布式存儲系統(tǒng),是將數(shù)據(jù)分散存儲在多臺單獨的設(shè)備上。蘇州魏晉元興分布式存儲數(shù)據(jù)庫 隨...
在分布式存儲系統(tǒng)(包括OceanBase這樣的分布式數(shù)據(jù)庫)的使用中,我們經(jīng)常會提到“一致性”這個詞,但是這個術(shù)語在不同的系統(tǒng)、不同人的心目中有不同的內(nèi)涵,很容易造成混淆。想象一個簡單的存儲系統(tǒng),只有一個客戶端(單進程)和一個服務(wù)端(單進程服務(wù))??蛻舳隧樞虬l(fā)起讀寫操作,服務(wù)端也順序處理每個請求,那么無論從服務(wù)器視角還是從客戶端視角,后一個操作都可以看到前一個操作的結(jié)果。然后,系統(tǒng)變的復(fù)雜一些,系統(tǒng)還是單個服務(wù)進程(單副本),但是有多個客戶端并發(fā)進行操作。這個模型下,多個客戶端的操作會互相影響,比如一個客戶端會讀到不是自己寫的數(shù)據(jù)(另一個客戶端寫入的)。一般單機并發(fā)程序就是這樣的模...
分布式存儲早期主要用于互聯(lián)網(wǎng)日志、企業(yè)備份歸檔、開發(fā)測試等場景,這些場景無疑是低價值場景,成本是第yi訴求甚至訴求。然此一時彼一時,士別三日也當刮目相看。首先是分布式存儲產(chǎn)品能力已今非昔比,逐漸具備了承載企業(yè)高價值業(yè)務(wù)的關(guān)鍵能力,例如毫秒級時延、TB/s級帶寬、雙活/3DC業(yè)務(wù)級容災(zāi)、端到端DIF等,無論是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù)的承載,功能完備性的比較大短板早已補齊。其次,分布式存儲已走入眾多高價值關(guān)鍵業(yè)務(wù),如運營商BOM業(yè)務(wù)、金融渠道類業(yè)務(wù)以及超算、油藏探測HPC等高價值業(yè)務(wù),通過大規(guī)模應(yīng)用實踐來檢驗成色。(小道消息,某些高價值場景全閃出貨價達到1000美金/TB以上啦)看完...
那么現(xiàn)在問題來了,如果我們要選擇分布式存儲,選擇哪種好呢?其實它們各有各的優(yōu)勢和使用場景,具體要看需求。(1)HDFS:主要用于大數(shù)據(jù)的存儲場景,是Hadoop大數(shù)據(jù)架構(gòu)中的存儲組件。HDFS在開始設(shè)計的時候,就已經(jīng)明確的它的應(yīng)用場景,就是大數(shù)據(jù)服務(wù)。(2)Ceph:目前應(yīng)用廣的開源分布式存儲系統(tǒng),已得到眾多廠商的支持,許多超融合系統(tǒng)的分布式存儲都是基于Ceph深度定制。而且Ceph已經(jīng)成為LINUX系統(tǒng)和OpenStack的“標配”,用于支持各自的存儲系統(tǒng)。Ceph可以提供對象存儲、塊設(shè)備存儲和文件系統(tǒng)存儲服務(wù)。同時支持三種不同類型的存儲服務(wù)的特性,在分布式存儲系統(tǒng)中,是很少見的...
分布式存儲包含的種類繁多,除了傳統(tǒng)意義上的分布式文件系統(tǒng)、分布式塊存儲和分布式對象存儲外,還包括分布式數(shù)據(jù)庫和分布式緩存等,但其中架構(gòu)無外乎于三種;以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點??蛻舳耸峭ㄟ^一個設(shè)備映射關(guān)系計算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲節(jié)點通信,從而避免中心節(jié)點的性能瓶頸。以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點??蛻舳耸峭ㄟ^一個設(shè)備映射關(guān)系計算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲節(jié)點通信,從而避免中心節(jié)點的性能瓶頸。 分...
說起分布式存儲,大家可能都會覺得這是一個老生常談的問題,雖然分布式存儲并不是一個年輕的技術(shù),許多開發(fā)者也對分布式存儲耳熟能詳,但分布式存儲卻并不是像想象中的那種簡單的技術(shù),它是一個涉及到文件系統(tǒng)、存儲系統(tǒng)、網(wǎng)絡(luò)、算法、管理等多方面技術(shù)的匯聚,因此,要想真正的掌握分布式存儲技術(shù),絕不是一件輕松的事。但對于開發(fā)者來說,如果不了解分布式存儲技術(shù),實際上對他們的開發(fā)工作還是會有很大的影響,特別是現(xiàn)在基于互聯(lián)網(wǎng)的開發(fā)更是離不開對分布式存儲技術(shù)的深入了解。 分布式存儲是未來數(shù)字產(chǎn)業(yè)生態(tài)系統(tǒng)構(gòu)建與新基建的重要引擎。泰州集中式分布式存儲架構(gòu)實戰(zhàn) 分布式存儲的重要性:從單機單用戶到單機多用戶,再到...
很多人可能對分布式存儲耳熟能詳,但是,大多數(shù)人對其概念或者知識點卻了解得都過于分散,看了很多卻“只見樹木,不見森林”,學(xué)了很多往往只能“知其然,卻不能知其所以然”。因此,有必要對分布式存儲的概念、問題和矛盾進行一下分析和解讀。實際上,如果可能,應(yīng)該是盡量不使用分布式的,因為這會增加系統(tǒng)的復(fù)雜度和管理難度,然而,雖然是這樣,但這些終歸是可以通過其他技術(shù)來解決,而如果不使用分布式,系統(tǒng)的可用性、穩(wěn)定性都無法保證,更談不上系統(tǒng)的高性能了。因此,說分布式是被迫使用的,一點也不夸張。 小編帶你了解分布式存儲的好處。臺州魏晉元興分布式存儲的一般架構(gòu) 目測分布式存儲領(lǐng)域有兩個派系,一派是SDS(軟件定...
分布式存儲系統(tǒng)具有如下特性:數(shù)據(jù)分為多個分片存儲在多臺服務(wù)節(jié)點上。每個分片有多個副本,存儲在不同的服務(wù)節(jié)點上。許多客戶端并發(fā)訪問系統(tǒng),執(zhí)行讀寫操作,每個讀寫操作在系統(tǒng)中需要花費不等的時間。除非下文中特別注明和討論,讀寫操作是原子的。與數(shù)據(jù)庫事務(wù)一致性的區(qū)別:數(shù)據(jù)庫事務(wù)的ACID的中也有一個一致性(consistency),但彼一致性非此一致性。ACID中的一致性是指,數(shù)據(jù)庫的事務(wù)的執(zhí)行,或者說事務(wù)觀察到的數(shù)據(jù),總是要滿足某些全局的一致性約束條件,如性約束,外鍵約束等。這個概念和數(shù)據(jù)庫的數(shù)據(jù)是否多副本沒關(guān)系。而本文的一致性在多副本的語境下才有意義。所以,數(shù)據(jù)庫事務(wù)的一致性,是指數(shù)據(jù)項...
如何保證分布式存儲的高性能與高可用?大家可能想到的是,除了傳統(tǒng)架構(gòu)里面的備份、HotStandby、雙活、多活這種架構(gòu)之外,對于保證分布式存儲系統(tǒng)的高可靠和高可用,數(shù)據(jù)在系統(tǒng)中一般存儲多個副本。當某個存儲節(jié)點出故障時,系統(tǒng)能夠自動將服務(wù)切換到其他的副本,從而實現(xiàn)自動容錯。分布式存儲系統(tǒng)通過復(fù)制協(xié)議將數(shù)據(jù)同步到多個存儲節(jié)點,并確保多個副本之間的數(shù)據(jù)一致性。同一份數(shù)據(jù)有多個副本,只有一個為主副本Primary,其他的副本為備份副本Backup,數(shù)據(jù)從主副本復(fù)制到備份副本,采用終一致性來保證數(shù)據(jù)和事物的完整。 關(guān)于分布式存儲,你需要知道的真相。徐州集中式分布式存儲 分布式存儲的種類和比較:分布...
由于異常的存在,分布式存儲系統(tǒng)設(shè)計時往往會將數(shù)據(jù)冗余存儲多份,每一份稱為一個副本)。這樣,當某一個節(jié)點出現(xiàn)故障時,可以從其他副本上讀到數(shù)據(jù)??梢赃@么認為,副本是分布式存儲系統(tǒng)容錯技術(shù)的手段。由于多個副本的存在,如何保證副本之間的一致性是整個分布式系統(tǒng)的理論核xin。數(shù)據(jù)一致性這個單詞在平常開發(fā)中,或者各種文章中都能經(jīng)??匆姡覀兂3B犚娛裁礀|西數(shù)據(jù)不一致了,造成了一定的損失,趕快修復(fù)一下。那有幾種一致性呢?a、時間一致性:要求所有數(shù)據(jù)組件的數(shù)據(jù)在任意時刻都是完全一致的;b、事物一致性:事務(wù)一致性只能存在在事務(wù)開始前的和事務(wù)完成之后,在事務(wù)過程中數(shù)據(jù)有可能不一致,比如A轉(zhuǎn)100元給B...
隨著企業(yè)數(shù)字化轉(zhuǎn)型的深入,分布式存儲由初的開發(fā)測試、桌面云等非關(guān)鍵應(yīng)用,逐步走向生產(chǎn)應(yīng)用。生產(chǎn)應(yīng)用除了上述可靠性SLA要求之外,對分布式存儲的性能,尤其是數(shù)據(jù)訪問的穩(wěn)定低時延提出了更嚴苛的要求。軟硬件解耦的分布式存儲在性能設(shè)計上存在兩大天然缺陷:標準服務(wù)器不具備機房突然斷電時保護內(nèi)存數(shù)據(jù)的電池(BBU),所以只能用SSD卡/盤來做數(shù)據(jù)緩存。SSD的時延遠高于內(nèi)存,導(dǎo)致業(yè)界絕大多數(shù)的軟硬解耦的分布式存儲時延無法和生產(chǎn)存儲媲美。單獨采購的分布式存儲軟件無法和第三方服務(wù)器的SSD盤緊密配合,從而無法像業(yè)界先進的全閃存存儲一樣實現(xiàn)全局垃圾回收,控制數(shù)量眾多的SSD盤各自的垃圾回收導(dǎo)致的生產(chǎn)應(yīng)用時延...
分布式存儲通過將熱點區(qū)域內(nèi)數(shù)據(jù)映射到高速存儲中,來提高系統(tǒng)響應(yīng)速度。一旦這些區(qū)域不再是熱點,那么存儲系統(tǒng)會將它們移出高速存儲。而寫緩存技術(shù)則可使配合高速存儲來明顯改變整體存儲的性能,按照一定的策略,先將數(shù)據(jù)寫入高速存儲,再在適當?shù)臅r間進行同步落盤。由于通過網(wǎng)絡(luò)進行松耦合鏈接,分布式存儲允許高速存儲和低速存儲分開部署,或者任意比例混布。在不可預(yù)測的業(yè)務(wù)環(huán)境或者敏捷應(yīng)用情況下,分層存儲的優(yōu)勢可以發(fā)揮到比較好。解決了目前緩存分層存儲比較大的問題是當性能池讀不命中后,從冷池提取數(shù)據(jù)的粒度太大,導(dǎo)致延遲高,從而給造成整體的性能的抖動的問題。 分布式存儲系統(tǒng)通過復(fù)制協(xié)議將數(shù)據(jù)同步到多個存儲節(jié)點,并確保...
分布式存儲架構(gòu)由三個部分組成:客戶端、元數(shù)據(jù)服務(wù)器和數(shù)據(jù)服務(wù)器??蛻舳素撠煱l(fā)送讀寫請求,緩存文件元數(shù)據(jù)和文件數(shù)據(jù)。元數(shù)據(jù)服務(wù)器負責管理元數(shù)據(jù)和處理客戶端的請求,是整個系統(tǒng)的核xin組件。數(shù)據(jù)服務(wù)器負責存放文件數(shù)據(jù),保證數(shù)據(jù)的可用性和完整性。該架構(gòu)的好處是性能和容量能夠同時拓展,系統(tǒng)規(guī)模具有很強的伸縮性。分布式存儲分為文件存儲、對象存儲和塊存儲,但它們?nèi)N存儲方式的基本架構(gòu)都是大同小異的。即客戶端或應(yīng)用端、元數(shù)據(jù)(MDS)服務(wù)器和數(shù)據(jù)節(jié)點服務(wù)器??蛻舳撕驮獢?shù)據(jù)服務(wù)器之間交互是“信令交互”,而客戶端到數(shù)據(jù)節(jié)點是“媒體交互”。元數(shù)據(jù)服務(wù)器或通過數(shù)據(jù)節(jié)點服務(wù)器獲取各節(jié)點服務(wù)器的基本配置情況和狀態(tài)信...
從技術(shù)的角度,分布式存儲的發(fā)力點在大規(guī)模的擴展性,基于此逐步優(yōu)化性能、可靠性,讓海量數(shù)據(jù)存得下、用得起;集中式存儲的技術(shù)方向在于保持穩(wěn)定性的基礎(chǔ)上,利用更快的介質(zhì)、更低時延的網(wǎng)絡(luò)為核xin業(yè)務(wù)提供加速,讓業(yè)務(wù)更穩(wěn)、效率更高。因此,從技術(shù)方向上來看,二者也是各有側(cè)重的。云和分布式存儲一樣,這些年正在大行其道、炙手可熱。CloudFirst、AllinCloud、CloudNative等概念風(fēng)靡業(yè)界,CIO見面不提云貌似都不好意思打招呼。早期人們也習(xí)慣把分布式存儲叫做“云存儲”,那么分布式存儲和云是什么關(guān)系?筆者認為,分布式存儲是一種技術(shù)架構(gòu),而云是一種商業(yè)模式。分布式存儲可以被用作各...
那么現(xiàn)在問題來了,如果我們要選擇分布式存儲,選擇哪種好呢?其實它們各有各的優(yōu)勢和使用場景,具體要看需求。(1)HDFS:主要用于大數(shù)據(jù)的存儲場景,是Hadoop大數(shù)據(jù)架構(gòu)中的存儲組件。HDFS在開始設(shè)計的時候,就已經(jīng)明確的它的應(yīng)用場景,就是大數(shù)據(jù)服務(wù)。(2)Ceph:目前應(yīng)用廣的開源分布式存儲系統(tǒng),已得到眾多廠商的支持,許多超融合系統(tǒng)的分布式存儲都是基于Ceph深度定制。而且Ceph已經(jīng)成為LINUX系統(tǒng)和OpenStack的“標配”,用于支持各自的存儲系統(tǒng)。Ceph可以提供對象存儲、塊設(shè)備存儲和文件系統(tǒng)存儲服務(wù)。同時支持三種不同類型的存儲服務(wù)的特性,在分布式存儲系統(tǒng)中,是很少見的...
分布式存儲系統(tǒng)中的多臺服務(wù)器通過網(wǎng)絡(luò)進行連接。但是我們無法保證網(wǎng)絡(luò)是一直通暢的,分布式系統(tǒng)需要具有一定的容錯性來處理網(wǎng)絡(luò)故障帶來的問題。一個令人滿意的情況是,當一個網(wǎng)絡(luò)因為故障而分解為多個部分的時候,分布式存儲系統(tǒng)仍然能夠工作。分布式存儲系統(tǒng)需要使用多臺服務(wù)器共同存儲數(shù)據(jù),而隨著服務(wù)器數(shù)量的增加,服務(wù)器出現(xiàn)故障的概率也在不斷增加。為了保證在有服務(wù)器出現(xiàn)故障的情況下系統(tǒng)仍然可用。一般做法是把一個數(shù)據(jù)分成多份存儲在不同的服務(wù)器中。但是由于故障和并行存儲等情況的存在,同一個數(shù)據(jù)的多個副本之間可能存在不一致的情況。這里稱保證多個副本的數(shù)據(jù)完全一致的性質(zhì)為一致性。 分布式存儲是一種數(shù)據(jù)存儲技術(shù),通過...
分布式存儲系統(tǒng)中還可能使用基于寫多個存儲節(jié)點的復(fù)制協(xié)議(Replicated-writeprotocol)。比如Dynamo系統(tǒng)中的NWR復(fù)制協(xié)議,其中,N為副本數(shù)量,W為寫操作的副本數(shù),R為讀操作的副本數(shù)。NWR協(xié)議中多個副本不再區(qū)分主和備,客戶端根據(jù)一定的策略往其中的W個副本寫入數(shù)據(jù),讀取其中的R個副本。只要W+R>N,可以保證讀到的副本中至少有一個包含了的更新。然而,這種協(xié)議的問題在于不同副本的操作順序可能不一致,從多個副本讀取時可能出現(xiàn)。這種方式在實際系統(tǒng)中比較少見,不建議使用。 分布式存儲系統(tǒng)需要多臺服務(wù)器同時工作。宿遷數(shù)據(jù)分布式存儲系統(tǒng)原理解析 分布式存儲采用分布式的...
在分布式存儲的容災(zāi)中,一個重要的手段就是多時間點快照技術(shù),使得用戶生產(chǎn)系統(tǒng)能夠?qū)崿F(xiàn)一定時間間隔下的各版本數(shù)據(jù)的保存。特別值得一提的是,多時間點快照技術(shù)支持同時提取多個時間點樣本同時恢復(fù),這對于很多邏輯錯誤的災(zāi)難定位十分有用,如果用戶有多臺服務(wù)器或虛擬機可以用作系統(tǒng)恢復(fù),通過比照和分析,可以快速找到哪個時間點才是需要回復(fù)的時間點,降低了故障定位的難度,縮短了定位時間。這個功能還非常有利于進行故障重現(xiàn),從而進行分析和研究,避免災(zāi)難在未來再次發(fā)生。多副本技術(shù),數(shù)據(jù)條帶化放置,多時間點快照和周期增量復(fù)制等技術(shù)為分布式存儲的高可靠性提供了保障。 布式存儲可實現(xiàn)集群的健康監(jiān)測,在故障潛伏期即可實現(xiàn)故障...
說到分布式存儲,我們先來看一下傳統(tǒng)的存儲是怎么個樣子。傳統(tǒng)的存儲也稱為集中式存儲,從概念上可以看出來是具有集中性的,也就是整個存儲是集中在一個系統(tǒng)中的,但集中式存儲并不是一個單獨的設(shè)備,是集中在一套系統(tǒng)當中的多個設(shè)備,比如下圖中的EMC存儲就需要幾個機柜來存放。在這個存儲系統(tǒng)中包含很多組件,除了核xin的機頭(控制器)、磁盤陣列和交換機等設(shè)備外,還有管理設(shè)備等輔助設(shè)備。結(jié)構(gòu)中包含一個機頭,這個是存儲系統(tǒng)中為核xin的部件。通常在機頭中有包含兩個控制器,互為備用,避免硬件故障導(dǎo)致整個存儲系統(tǒng)的不可用。 常見的幾種分布式存儲以及應(yīng)用場景。鎮(zhèn)江大規(guī)模分布式存儲系統(tǒng)原理 Ceph:目前應(yīng)...
分布式存儲構(gòu)建存儲系統(tǒng)時.需要基于成本和性能來考慮,因此存儲系統(tǒng)通常采用多層不同性價比的存儲器件組成存儲層次結(jié)構(gòu)。大數(shù)據(jù)的規(guī)模大,因此構(gòu)建高效合理的存儲層次結(jié)構(gòu),可以在保證系統(tǒng)性能的前提下,降低系統(tǒng)能耗和構(gòu)建成本,利用數(shù)據(jù)訪問局部性原理.可以從兩個方面對存儲層次結(jié)構(gòu)進行優(yōu)化。從提高性能的角度,可以通過分析應(yīng)用特征,識別熱點數(shù)據(jù)并對其進行緩存或預(yù)取,通過高效的緩存預(yù)取算法和合理的緩存容量配比,以提高訪問性能。從降低成本的角度,采用信息生命周期管理方法,將訪問頻率低的冷數(shù)據(jù)遷移到低速廉價存儲設(shè)備上,可以在小幅犧sheng系統(tǒng)整體性能的基礎(chǔ)上,大幅降低系統(tǒng)的構(gòu)建成本和能耗。 分布式存儲系統(tǒng),分布...
分布式存儲的興起與互聯(lián)網(wǎng)的發(fā)展密不可分,互聯(lián)網(wǎng)公司由于其數(shù)據(jù)量大而資本積累少,而通常都使用大規(guī)模分布式存儲系統(tǒng)。與傳統(tǒng)的高duan服務(wù)器、高duan存儲器和高duan處理器不同的是,互聯(lián)網(wǎng)公司的分布式存儲系統(tǒng)由數(shù)量眾多的、低成本和高性價比的普通PC服務(wù)器通過網(wǎng)絡(luò)連接而成。其主要原因有以下三點(1)互聯(lián)網(wǎng)的業(yè)務(wù)發(fā)展很快,而且注意成本消耗,這就使得存儲系統(tǒng)不能依靠傳統(tǒng)的縱向擴展的方式,即先買小型機,不夠時再買中型機,甚至大型機?;ヂ?lián)網(wǎng)后端的分布式系統(tǒng)要求支持橫向擴展,即通過增加普通PC服務(wù)器來提高系統(tǒng)的整體處理能力。(2)普通PC服務(wù)器性價比高,故障率也高,需要在軟件層面實現(xiàn)自動容錯,...
分布式存儲分為文件存儲、對象存儲和塊存儲,但它們?nèi)N存儲方式的基本架構(gòu)都是大同小異的。即客戶端或應(yīng)用端、元數(shù)據(jù)(MDS)服務(wù)器和數(shù)據(jù)節(jié)點服務(wù)器??蛻舳撕驮獢?shù)據(jù)服務(wù)器之間交互是“信令交互”,而客戶端到數(shù)據(jù)節(jié)點是“媒體交互”。元數(shù)據(jù)服務(wù)器或通過數(shù)據(jù)節(jié)點服務(wù)器獲取各節(jié)點服務(wù)器的基本配置情況和狀態(tài)信息。比如,客戶端需要讀取某一個文件的信息,客戶端會將相應(yīng)的要求發(fā)給元數(shù)據(jù)服務(wù)器:“喂!我需要XXX,存在哪里了”,元數(shù)據(jù)服務(wù)器查詢后回答“你到xxx服務(wù)器的xxx地址+xxx服務(wù)器的xxx地址取”。客戶端拿到這個指示后,向這2臺服務(wù)器發(fā)出指令,數(shù)據(jù)節(jié)點獲得指令后,將相應(yīng)的數(shù)據(jù)返回給客戶端。 五大主流分布...
分布式存儲傳統(tǒng)數(shù)據(jù)存儲模型需要支持盡可能多的應(yīng)用,因此需要具備較好的通用性。大數(shù)據(jù)具有大規(guī)模、高動態(tài)及快速處理等特性,通用的數(shù)據(jù)存儲模型通常并不是能提高應(yīng)用性能的模型.而大數(shù)據(jù)存儲系統(tǒng)對上層應(yīng)用性能的關(guān)注遠遠超過對通用性的追求。針對應(yīng)用和負載來優(yōu)化存儲,就是將數(shù)據(jù)存儲與應(yīng)用耦合。簡化或擴展分布式文件系統(tǒng)的功能,根據(jù)特定應(yīng)用、特定負載、特定的計算模型對文件系統(tǒng)進行定制和深度優(yōu)化,使應(yīng)用達到比較好性能。這類優(yōu)化技術(shù)在谷歌、Facebook等互聯(lián)網(wǎng)公司的內(nèi)部存儲系統(tǒng)上,管理超過千萬億字節(jié)級別的大數(shù)據(jù),能夠達到非常高的性能。 分布式存儲系統(tǒng)需要多臺服務(wù)器同時工作。南通分布式存儲架構(gòu)實戰(zhàn) ...
在分布式存儲的容災(zāi)中,一個重要的手段就是多時間點快照技術(shù),使得用戶生產(chǎn)系統(tǒng)能夠?qū)崿F(xiàn)一定時間間隔下的各版本數(shù)據(jù)的保存。特別值得一提的是,多時間點快照技術(shù)支持同時提取多個時間點樣本同時恢復(fù),這對于很多邏輯錯誤的災(zāi)難定位十分有用,如果用戶有多臺服務(wù)器或虛擬機可以用作系統(tǒng)恢復(fù),通過比照和分析,可以快速找到哪個時間點才是需要回復(fù)的時間點,降低了故障定位的難度,縮短了定位時間。這個功能還非常有利于進行故障重現(xiàn),從而進行分析和研究,避免災(zāi)難在未來再次發(fā)生。多副本技術(shù),數(shù)據(jù)條帶化放置,多時間點快照和周期增量復(fù)制等技術(shù)為分布式存儲的高可靠性提供了保障。 分布式存儲提供豐富的API,根據(jù)業(yè)務(wù)應(yīng)用要求,自動按需...
分布式存儲分為文件存儲、對象存儲和塊存儲,但它們?nèi)N存儲方式的基本架構(gòu)都是大同小異的。即客戶端或應(yīng)用端、元數(shù)據(jù)(MDS)服務(wù)器和數(shù)據(jù)節(jié)點服務(wù)器??蛻舳撕驮獢?shù)據(jù)服務(wù)器之間交互是“信令交互”,而客戶端到數(shù)據(jù)節(jié)點是“媒體交互”。元數(shù)據(jù)服務(wù)器或通過數(shù)據(jù)節(jié)點服務(wù)器獲取各節(jié)點服務(wù)器的基本配置情況和狀態(tài)信息。比如,客戶端需要讀取某一個文件的信息,客戶端會將相應(yīng)的要求發(fā)給元數(shù)據(jù)服務(wù)器:“喂!我需要XXX,存在哪里了”,元數(shù)據(jù)服務(wù)器查詢后回答“你到xxx服務(wù)器的xxx地址+xxx服務(wù)器的xxx地址取”。客戶端拿到這個指示后,向這2臺服務(wù)器發(fā)出指令,數(shù)據(jù)節(jié)點獲得指令后,將相應(yīng)的數(shù)據(jù)返回給客戶端。 分布式存儲是...
分布式存儲的重要性:云存儲和大數(shù)據(jù)是構(gòu)建在分布式存儲之上的應(yīng)用。移動終端的計算能力和存儲空間有限,而且有在多個設(shè)備之間共享資源的強烈的需求,這就使得網(wǎng)盤、相冊等云存儲應(yīng)用很快流行起來。然而,萬變不離其宗,云存儲的核xin還是后端的大規(guī)模分布式存儲系統(tǒng)。大數(shù)據(jù)則更近一步,不僅需要存儲海量數(shù)據(jù),還需要通過合適的計算框架或者工具對這些數(shù)據(jù)進行分析,抽取其中有價值的部分。如果沒有分布式存儲,便談不上對大數(shù)據(jù)進行分析。仔細分析還會發(fā)現(xiàn),分布式存儲技術(shù)是互聯(lián)網(wǎng)后端架構(gòu)的神器,掌握了這項技能,以后理解其他技術(shù)的本質(zhì)會變得非常容易。 分布式存儲不得不要了解的幾大特點。連云港魏晉元興分布式存儲哪家好 ...
無論如何波折,分布式存儲未來可期:正所謂不管白貓、黑貓,抓到老鼠的就是好貓。我們相信在較長一段時間內(nèi),分布式存儲軟硬件一體和軟硬件解耦會長期共存??傮w而言,筆者認為隨著數(shù)據(jù)價值的增高,場景對數(shù)據(jù)可靠性的要求隨之會越來越嚴苛,市場的天平就會更多偏向軟硬件一體;與此相反,場景對數(shù)據(jù)可靠性的敏感度越低、短期成本敏感度越高,市場的天平就會更多的偏向軟硬件解耦。分布式存儲的發(fā)展歷程無論如何波折,我們更愿意相信它終會是部正劇,在整個存儲市場中占據(jù)海量數(shù)據(jù)承載的主力軍位置,鏗鏘而立,并給人以無窮回味!分布式存儲“避坑”指南。徐州魏晉元興分布式存儲有哪些 分布式存儲系統(tǒng)中的多臺服務(wù)器通過網(wǎng)絡(luò)進行連接。但是我...