3月12日,Back You Up 鼎甲線上公開(kāi)課準時開(kāi)講,産品總監汪潼重磅發布了最新版本的鼎甲智能歸檔平台InfoArchiver。它能将客戶曆史數據智能歸檔,超越一(yī)般歸檔産品的局限性,使系統能真正地伴随數據成長,滿足客戶不同階段的、複雜(zá)的非結構化數據歸檔需求, 讓用戶可在有限的存儲空間内存放(fàng)無限的數據。
此外(wài),使用InfoArchiver,一(yī)方面能使本地昂貴的磁盤空間釋放(fàng),提高空間利用率,降低存儲開(kāi)銷 。另一(yī)方面,它能将客戶重要的數據,永久地保存起來,滿足相關法規要求 ,讓有價值的數據得到保護和統一(yī)管理。
鼎甲每年都會推出一(yī)些新的産品,去(qù)年除我(wǒ)們的旗艦産品DBackup外(wài),我(wǒ)們還主推了雲遷移還有應急接管這兩個産品,并取得了不錯的成績。那麽今年我(wǒ)們推出的一(yī)個重磅産品,就是鼎甲智能歸檔平台 InfoArchiver。
在坐各位應該對災備比較了解,但對歸檔可能不是那麽的清楚,後面我(wǒ)會詳細解釋一(yī)下(xià)歸檔是拿來做什麽用的。我(wǒ)們可能理解的歸檔就是把我(wǒ)們的文件放(fàng)到另外(wài)一(yī)個地方做長期的保留,這就是歸檔,但這隻是說了一(yī)部分(fēn),沒有說的很全面,在我(wǒ)講之前,先給各位舉一(yī)個比較淺顯易懂的例子吧。
比如說,領導問IT管理員(yuán) 拿一(yī)份某一(yī)離(lí)職員(yuán)工(gōng)的郵件數據,領導需要管理員(yuán)找出去(qù)年7月1号這個員(yuán)工(gōng)的郵件。我(wǒ)們都知(zhī)道,企業的郵件都是有備份的,那我(wǒ)們就可以從備份機裏面把它恢複出來,找到這封郵件是件十分(fēn)容易的事。可是當另外(wài)一(yī)個需求出現時,這個領導需要IT管理員(yuán)找出這個離(lí)職員(yuán)工(gōng),從去(qù)年7月1号到今年7月1号的所有郵件,這個時候我(wǒ)們如果從備份系統裏面去(qù)找,就非常非常的困難,需花費(fèi)大(dà)量的時間。這個時候假如我(wǒ)們有歸檔系統,那麽我(wǒ)們隻要把這個時間段往裏面一(yī)輸,就可以把這個人一(yī)年的郵件,瞬間給他翻出來。
所以我(wǒ)們發現,備份的目的是爲了做數據的恢複,歸檔的目的最終是爲了做電(diàn)子發現,就是做搜索和查詢,所以它們對數據管理的層面,是兩個不同的層面,也是兩個不同的方向,我(wǒ)們說備份是要生(shēng)成多個數據副本,也就是說我(wǒ)的數據要保留在不同的地點,不同的介質上,它才足夠的安全。但是歸檔恰恰相反,歸檔是要減少你的數據副本,甚至于我(wǒ)要把你生(shēng)産、存儲上的數據搬移到另外(wài)一(yī)個地方去(qù),它隻有一(yī)個副本,所以我(wǒ)們經常會通過備份、歸檔這兩類技術來共同管理我(wǒ)們的海量數據,接下(xià)來我(wǒ)們現在就正式開(kāi)始今天的内容。
全球歸檔的市場空間是22億美金,國外(wài)的産商(shāng)占主導,國内的情況目前是鼎甲已經進來了,還有一(yī)些少數廠商(shāng)他們也有在做歸檔,但是總體(tǐ)來說國内做歸檔的産商(shāng)還是非常之少,可以說是鳳毛菱角。
我(wǒ)們知(zhī)道歸檔分(fēn)兩大(dà)類,一(yī)類是專門針對郵件系統的,主要目的是能迅速的找到客戶所需的郵件,并且可做審計。也就是說我(wǒ)這個企業每一(yī)封進來和出去(qù)的郵件都可被我(wǒ)歸檔下(xià)來,将來用做法規遵從,或者對外(wài)的審計,起這麽一(yī)個作用。那目前電(diàn)子郵件是可作爲電(diàn)子證據存在的。還而另一(yī)大(dà)類主要就是針對文件系統這一(yī)塊的。我(wǒ)們發現,但凡做存儲或者數據相關的,他們都會有自己的歸檔系統。
随着公有雲的發展,存儲成本在降低,雲上的數據歸檔顯得沒有以前那麽剛性了,那現在的歸檔已經逐步的往雲上走,成爲一(yī)種歸檔服務,因爲我(wǒ)們發現雲存儲作爲歸檔介質是一(yī)個非常不錯的選擇,一(yī)它很便宜,二它不容易被篡改,比較的安全。
關于歸檔的需求,第一(yī)是存儲的優化,我(wǒ)們發現大(dà)量不活躍的數據被存在昂貴的存儲上,大(dà)量的重複文件也占用了較多的存儲空間。此外(wài),存儲的性能也會随着數據量的激增而下(xià)降,需要減少存儲的壓力,這個壓力是針對一(yī)個企業的IT管理員(yuán)而言的。
在法律遵從上,《企業内部管理規範》明确規定了不同行業數據的保留時間,大(dà)部分(fēn)爲長期保留,要做長期保留的話(huà),就要求存儲成本足夠的低廉,功耗足夠的少,就會面臨着我(wǒ)們要把數據存放(fàng)到一(yī)些冷存儲(磁帶、藍(lán)光等)上去(qù)。
最後一(yī)點就是法律訴訟。海量非結構化數據的查閱和搜索非常困難,當企業要去(qù)打官司的話(huà),這種搜索成本非常之高,搜索成本是以時間來計費(fèi)的,律師費(fèi)用非常昂貴,對企業将會是巨大(dà)的支出。而歸檔系統能夠很好的将數據進行長期保留并快速檢索需要的數據,從海量文件中(zhōng)迅速找到所需的文件。這個就是三個大(dà)的需求領域對歸檔這套系統的剛性需求。
那麽是什麽催生(shēng)了大(dà)量的非結構化數據的高速增長,以下(xià)就是數據高速增長的新型行業,是這些新型行業的飛速發展催生(shēng)了我(wǒ)們更大(dà)量的海量數據的出現。
而數字化轉型将生(shēng)成數十億的文件和數據,這也是迫切需要一(yī)個很好的歸檔平台的一(yī)種剛性需求。
接下(xià)來我(wǒ)們再看看非機構化數據的增長情況,據IDC預計,到2020年,數字宇宙将增長到 44ZB,約79%将是非結構化數據。
既然我(wǒ)們将會面臨海量數據的爆發增長,那它對數據的現狀及需求又(yòu)是什麽呢?這裏可以從下(xià)圖的這三個方面來說。
而鼎甲推出的InfoArchiver就可幫助用戶解決上述三大(dà)方向上的問題。InfoArchiver可分(fēn)爲三大(dà)部分(fēn),一(yī)個部分(fēn)是我(wǒ)們要影響的生(shēng)産端,因爲這個是數據的來源,也就是在我(wǒ)們的業務系統,我(wǒ)們業務系統所産生(shēng)的數據會放(fàng)到生(shēng)産存儲上去(qù)。首先第一(yī)個,它需要在我(wǒ)們的業務系統下(xià)面部署一(yī)個歸檔的代理,通過這個代理,我(wǒ)們來俘獲所有生(shēng)産數據的屬性,就是它被訪問的頻(pín)率,被讀寫的次數,通過接口來獲取到文件的最後訪問時間,并以此爲依據來設定歸檔策略 。
在我(wǒ)們的文件從生(shēng)産存儲把它歸檔走了後,我(wǒ)們會發現這個文件的實體(tǐ)已經不在我(wǒ)們的生(shēng)産存儲裏了,但它會在原位置上,由一(yī)個存根或者是叫做一(yī)個唯一(yī)的标識,也可稱之爲一(yī)個鏈接。那麽既然有這個鏈接在,實際上它對業務系統而言是透明的一(yī)個過程,業務系統會認爲你的文件還在原始位置,但實際上它已經到了雲端或者藍(lán)光、磁帶裏面。那麽用戶訪問的時候,他可以直接點擊這個鏈接直接訪問到曆史文件,這個曆史文件會從存儲裏以隻讀的方式打開(kāi)。業務系統可以獲取到這個唯一(yī)的标識直接跳轉到“文檔利用服務”來訪問曆史文件,假如業務系統如果停機,用戶亦可通過“文檔利用服務”直接訪問曆史文件。
在整體(tǐ)方案架構上,首先我(wǒ)們在自動歸檔服務器的部署上面支持集群的部署 ,也就是說當你的數據源特别龐大(dà)時,InfoArchiver 可通過多節點的方式去(qù)同時并發歸檔文件數據,來解決歸檔的速度問題 。在“文檔利用服務”這塊,InfoArchiver可 在Web界面裏面實現類百度的檢索,就相當于你在百度裏面搜的東西一(yī)樣,隻不過搜索範圍是在我(wǒ)整個企業的内部,并可實現多分(fēn)辨率縮略圖、動态水印、在線浏覽,以及權限控制、安全審計 。
接下(xià)來就是自動歸檔和利用功能全景圖,第一(yī)個就是歸檔策略的設定,支持多代理機部署,支持文件二進制歸檔校驗,支持跨域、跨互聯網部署,支持閃傳、斷點續傳 。閃傳的意思就是說我(wǒ)可能有多個數據源要同時歸檔到一(yī)個歸檔服務器裏去(qù),但是這裏面可能存在許多重複的文件,這些重複文件在我(wǒ)歸檔存儲裏面裏它隻會存一(yī)份,其他全部通過鏈接的方式來指向,這就是閃傳。
存儲這塊我(wǒ)們支持任意的存儲設備,在文檔利用服務這塊,提供曆史歸檔文件直接訪問平台,無需依賴原有業務系統,并提供嚴格的訪問授權控制,支持客戶AD域集成驗證,手機、CA證書(shū)二次驗證 。基本上可以支持任意的業務系統,對應用來講,你的數據不在本地了,對它來講是透明的,它可以訪問的到。此外(wài),我(wǒ)們還提供了一(yī)些供用戶自行選配的增值組件。
從物(wù)理部署架構來看,我(wǒ)們支持内部直連歸檔,亦可支持雲歸檔、支持虛拟機部署和集群部署 。
InfoArchiver還通過三權分(fēn)立,解決了權力過度集中(zhōng)問題 。原來是單一(yī)的超級管理員(yuán),現在是三級管理員(yuán)統一(yī)管理。
接下(xià)來就是InfoArchiver的一(yī)些功能演示。首先指定文件源歸檔遠端服務,就是說我(wǒ)要歸檔哪些東西,就要把目錄指定出來。要歸檔到哪裏去(qù),就要先定好這個目标。
歸檔後,我(wǒ)們可以利用文件存儲和利用服務對歸檔後的文件進行文件的标簽管理,做這些設置是爲了讓我(wǒ)們在搜索過程中(zhōng)減少我(wǒ)們的搜索範圍 ,讓我(wǒ)們能夠更快速的找到所需的文件。
這是日志(zhì)管理以及全操作的留痕,這裏除了提交成熟API供業務系統快速集成 外(wài),我(wǒ)們還可提供詳細的日志(zhì)管理,小(xiǎo)圖是具體(tǐ)歸檔的過程。
全文檢索則是一(yī)個類百度的搜索,在搜索過程中(zhōng)我(wǒ)們可按照更新的時間、文件格式和文件類别,把搜索範圍盡可能的縮小(xiǎo),來提高搜索速度 。
文檔訪問權限體(tǐ)系則支持細顆粒度的權限設置 ,可滿足企業具體(tǐ)業務需求、合規管理需求以及高效運作需求等。
在對版權問題上,InfoArchiver可打上安全水印,來區分(fēn)這份文件或者圖片的版權所有者的問題。預覽或下(xià)載指定的文件時,可觸發水印策略。嵌入的水印信息隐藏于宿主文件中(zhōng),既保持原文件的可觀性和完整性,又(yòu)增加了文件使用的可追溯性 。
在日志(zhì)管理,全操作留痕功能中(zhōng),哪些用戶對文件做了什麽的操作,什麽時間做的,操作的類型是什麽,在一(yī)段時間内,我(wǒ)們可以全部導出到Excel當中(zhōng),然後來進行合規審計。
此外(wài),在增值屬性裏,可對歸檔後的圖片文件進行縮略圖的快速浏覽,CAD、3D圖紙(zhǐ)的在線浏覽 ,方便用戶迅速找到所需圖片。
最後就是InfoArchiver産品的技術參數。支持集群和分(fēn)布式部署,千萬級文件量搜索響應時間1~3秒 ,支持中(zhōng)文分(fēn)詞、多語種同義詞檢索、多維度組合篩選,提供細粒度授權機制,支持也業務系統授權同步,同時提供詳細的文檔訪問和安全審計日志(zhì)。
綜上,我(wǒ)們可知(zhī)通過InfoArchiver能較好地優化我(wǒ)們的備份恢複系統,無論數據是在雲端還是藍(lán)光,歸檔後的數據均可在本機生(shēng)成存根,用戶可直接訪問。同時,它還具備強大(dà)的平台擴展能力和業務場景适應能力,如應用集成、應用快速構建、業務流程設計整合、智能化大(dà)數據管理等。
在演講結束後的答疑環節,汪潼還耐心解答了參會夥伴關于InfoArchiver的相關問題,線上互動反響熱烈,參會夥伴受益匪淺。