首頁 > 優(yōu)秀范文 > 大數(shù)據(jù)解決方案
時間:2023-03-14 15:20:31
序論:速發(fā)表網(wǎng)結(jié)合其深厚的文秘經(jīng)驗,特別為您篩選了11篇大數(shù)據(jù)解決方案范文。如果您需要更多原創(chuàng)資料,歡迎隨時與我們的客服老師聯(lián)系,希望您能從中汲取靈感和知識!
中圖分類號:TP309 文獻標識碼:A 文章編號:1009-3044(2013)27-6217-03
1 認識大數(shù)據(jù)
相信大家都還記得2013年5月10日淘寶十周年晚會上,阿里巴巴集團董事局主席馬云在其卸任集團CEO職位的演講中說到:“大家還沒搞清PC時代的時候,移動互聯(lián)網(wǎng)來了,還沒搞清移動互聯(lián)網(wǎng)的時候,大數(shù)據(jù)時代來了?!?/p>
什么是大數(shù)據(jù)?
早在1980年,當(dāng)時著名的未來學(xué)家阿爾文·托夫勒便在其著作《第三次浪潮》中熱情洋溢地將大數(shù)據(jù)贊頌為“第三次浪潮的華彩樂章”。不過直到時光抵達2009年,“大數(shù)據(jù)”才開始成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。
環(huán)顧四周,我們都已經(jīng)切身感受到了當(dāng)今的信息量正在以前所未有的速度膨脹。當(dāng)我們的普通民眾在上世紀90年代剛剛接觸個人計算機的時候,1MB的磁盤,1GB的硬盤已經(jīng)是不錯的配置。然而現(xiàn)在呢?GB、TB都已經(jīng)無法滿足我們丈量數(shù)據(jù)大小的需要,PB、EB、ZB已經(jīng)義無反顧地承擔(dān)起了丈量數(shù)據(jù)的大任。
隨著互聯(lián)網(wǎng)自媒體的普及,每天都有數(shù)以億計的人在發(fā)微博、寫微信、更新個人主頁、使用社交網(wǎng)站、發(fā)表個人評論……全球互聯(lián)網(wǎng)上每天會有220萬TB的新數(shù)據(jù)產(chǎn)生,90%的數(shù)據(jù)都是在過去的24個月內(nèi)創(chuàng)造出來的,如今,這個比例還在不斷上升。
在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》中,他們對大數(shù)據(jù)的表述是:大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。他們對大數(shù)據(jù)的特性進行了歸納,提出了4V特點,即Volume(數(shù)據(jù)量大)、Velocity(要求實時性強)、Variety(數(shù)據(jù)的種類多樣)、Value(數(shù)據(jù)是有價值的)。
而《互聯(lián)網(wǎng)周刊》則認為“大數(shù)據(jù)”的概念遠不止大量的數(shù)據(jù)和處理大量數(shù)據(jù)的技術(shù),或者所謂的“4V特點”之類的簡單概念。大數(shù)據(jù)是涵蓋了人們在大規(guī)模數(shù)據(jù)的基礎(chǔ)上所能做到的事務(wù),而這些事務(wù)在小規(guī)模數(shù)據(jù)的基礎(chǔ)上是無法實現(xiàn)的。換句話說,大數(shù)據(jù)讓我們能夠以一種前所未有的方式,通過對海量數(shù)據(jù)進行分析,獲得具有巨大價值的產(chǎn)品和服務(wù),或者深刻的洞見,進而最終形成變革世界的力量。
2 大數(shù)據(jù)應(yīng)用的現(xiàn)狀分析
最早提出世界已經(jīng)迎來“大數(shù)據(jù)”時代的機構(gòu)則是全球知名的咨詢公司——麥肯錫。麥肯錫在其研究報告中指出:數(shù)據(jù)已經(jīng)滲透到每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)因素;而人們對于海量數(shù)據(jù)的運用將預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來。
大家都或多或少地意識到應(yīng)該能從這些海量的數(shù)據(jù)中獲取些什么,然而究竟我們能獲取到什么呢?
一個被廣為傳播的典型案例是:在2012年初美國的一家Target超市,一位憤怒的父親突然闖進來對店鋪經(jīng)理咆哮道:“你們竟然給我17歲的女兒發(fā)嬰兒尿片和童車的優(yōu)惠券,她才17歲啊!”經(jīng)理下意識地認為是店里出了問題,也許是誤發(fā)了優(yōu)惠券,于是立即向這位父親道歉。然而經(jīng)理卻沒有意識到,其實這是公司正在運行的一套大數(shù)據(jù)系統(tǒng)得出的分析結(jié)論。
Target會從其會員的購買記錄中去了解該顧客的性格、類別等一些列業(yè)務(wù)活動。上面的例子正是Target為適齡女性創(chuàng)建的一套懷孕期變化分析模型,如果相關(guān)客戶第一次購買了嬰兒用品,系統(tǒng)將會在接下去的幾年中根據(jù)嬰兒的生長周期向顧客推薦相關(guān)的產(chǎn)品,從而培養(yǎng)和提高客戶的忠誠度。
果然,一個月后,該名憤怒的父親打電話給商鋪道歉,因為Target發(fā)來的嬰兒用品優(yōu)惠券不是誤會,他的女兒確實懷孕了。
利用數(shù)據(jù)挖掘用戶的行為習(xí)慣和喜好,在凌亂紛繁的數(shù)據(jù)背后發(fā)掘出更符合用戶興趣和習(xí)慣的信息、產(chǎn)品和服務(wù),并對這些目標化的信息、產(chǎn)品和服務(wù)進行針對性地調(diào)整和優(yōu)化,這便是大數(shù)據(jù)能帶給商家最誘人的價值之一。
隨著社交網(wǎng)絡(luò)在人們生產(chǎn)生活中地位的快速提升,大量UGC(User Generated Content用戶自生成的內(nèi)容)進入互聯(lián)網(wǎng),上述價值的實現(xiàn)也變得越來越明顯。
事實上,全球IT業(yè)巨頭都已經(jīng)意識到數(shù)據(jù)的重要意義和“大數(shù)據(jù)”時代的到來。包括IBM、EMC、惠普、微軟在內(nèi)的全球知名跨國公司都陸續(xù)通過收購與“大數(shù)據(jù)”相關(guān)的廠商來實現(xiàn)技術(shù)整合。
目前典型的大數(shù)據(jù)應(yīng)用領(lǐng)域有:
商業(yè)智能。例如:用戶行為分析,即結(jié)合用戶資料、產(chǎn)品、服務(wù)、計費、財務(wù)等信息進行綜合分析,得出細致、精確的結(jié)果,實現(xiàn)對用戶個性化的策略控制,這在營銷網(wǎng)絡(luò)的流量經(jīng)營分析中占有越來越舉足輕重的地位。個性化推薦,即在各類增值業(yè)務(wù)中,根據(jù)用戶喜好推薦各類業(yè)務(wù)或應(yīng)用,這已成為運營商和門戶提供商服務(wù)用戶的一個最有效方式之一,比如應(yīng)用商店的軟件推薦、IPTV視頻節(jié)目的點播推薦、購物或旅游網(wǎng)站的猜你喜歡等。
公共服務(wù)。一方面,公共機構(gòu)可以利用大數(shù)據(jù)技術(shù)把積累的海量歷史數(shù)據(jù)進行挖掘利用,從而提供更為廣泛和深度的公共服務(wù),如實時路況和交通引導(dǎo);另一方面,公共機構(gòu)也可以通過對某些領(lǐng)域的大數(shù)據(jù)實時分析,提高危機的預(yù)判能力,如疾病預(yù)防、環(huán)境保護等,為實現(xiàn)更好、更科學(xué)的危機響應(yīng)提供技術(shù)基礎(chǔ)。
政府決策。通過對數(shù)據(jù)的挖掘,從而有效提高政府決策的科學(xué)性和時效性。例如:日本大地震發(fā)生后僅僅9分鐘,美國國家海洋和大氣管理局(NOAA)就了詳細的海嘯預(yù)警。并且隨即NOAA通過對海洋傳感器獲得的實時數(shù)據(jù)進行了計算機模擬,制定出詳細的應(yīng)急方案,并將制作的海嘯影響模型實時在了YouTube等網(wǎng)站上。
3 大數(shù)據(jù)解決方案的現(xiàn)狀分析
以往談及大的數(shù)據(jù)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)。如今把“大數(shù)據(jù)”作為一個專有名詞提及,通常指的是解決問題的一種方法,即通過收集和整理生產(chǎn)生活中方方面面的數(shù)據(jù),然后對其進行整理、挖掘、分析、處理,進而從中獲得有用的價值信息。這種衍化出的新的商業(yè)模式即為通常意義上的大數(shù)據(jù)解決方案。
雖然通常意義上的大數(shù)據(jù)解決方案描述了一種通常的行為,但要實現(xiàn)這種通常的行為,往往會遇到諸多技術(shù)和硬件上的問題。一個顯而易見的問題就是:大數(shù)據(jù)包絡(luò)萬象,而且像音頻、文本信息、視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)正以突飛猛進的速度增長,加上移動互聯(lián)網(wǎng)的普及所帶來的如位置、生活信息等富含價值的數(shù)據(jù),現(xiàn)有的,或者傳統(tǒng)的對數(shù)據(jù)的處理手段和硬件配置已越來越跟不上數(shù)據(jù)發(fā)展的步伐。
于是革命爆發(fā)了!
哈佛大學(xué)社會學(xué)教授加里·金就說道:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領(lǐng)域開始了量化進程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進程?!?/p>
數(shù)據(jù)需要存儲,存儲需要設(shè)備,存儲設(shè)備的容量和可擴展性以及讀取的速度成為了一大問題(容量問題);大數(shù)據(jù)不是一日而成的,往往都需要一定周期的積累,在數(shù)據(jù)的積累過程中,以前的數(shù)據(jù)和現(xiàn)在的數(shù)據(jù)在存儲上應(yīng)該是能保持一致的,無論設(shè)備升級與否,而且這些數(shù)據(jù)要長期有效,這是一個持久的問題(積累問題);與持久相對應(yīng)的,互聯(lián)網(wǎng)是變化的、經(jīng)濟活動是變化的、整個世界都是變化的,針對某些實時問題,如交易、金融等,用已經(jīng)過去的數(shù)據(jù)顯然是不合適的,這也是一大問題(延遲問題);大數(shù)據(jù)包絡(luò)萬象,有些是可以隨意獲得、和消除的,有些,如金融數(shù)據(jù)、醫(yī)療信息、政府情報等,則是需要按不同級別進行保護和加密的,特別是在需要交叉數(shù)據(jù)參考的應(yīng)用中,不同部分的數(shù)據(jù)有著不同的安全需要,這又是一大問題(安全問題);為了滿足上述問題,我們顯然可以通過不斷加大投入,購買更多的存儲設(shè)備、雇傭跟多的工作人員、建設(shè)更多的數(shù)據(jù)中心和分析中心,但這一切都是由成本的,特別是對于以盈利為目的的商業(yè)機構(gòu)而言,成本和收益永遠都是最優(yōu)先考慮的問題之一(成本問題);當(dāng)然還有很多其他的問題,這里就不一一羅列了。
驅(qū)動商業(yè)機構(gòu)解決上述問題的動力肯定是商業(yè)利益。以全球知名的IT制造與服務(wù)和咨詢提供商IBM為例,其全球CEO調(diào)研顯示,唯有在數(shù)據(jù)獲取、將數(shù)據(jù)轉(zhuǎn)換為洞察力、再將洞察力轉(zhuǎn)化為行動力等方面表現(xiàn)優(yōu)秀的企業(yè),才能有持續(xù)的績效表現(xiàn)。績效突出者從海量數(shù)據(jù)中挖掘出有價信息的能力是績效不佳者的2倍。
IBM認為由于當(dāng)今企業(yè)、市場、社會、政府之間的聯(lián)系變得越來越緊密,傳統(tǒng)的數(shù)據(jù)分析正日益呈現(xiàn)出“大數(shù)據(jù)”時代的新特點,即容量要求更高、速度要求更快、數(shù)據(jù)類型多樣和數(shù)據(jù)來源復(fù)雜4個方面。結(jié)合多家領(lǐng)先市場咨詢機構(gòu)的調(diào)研數(shù)據(jù)顯示:
2010-2015年,“大數(shù)據(jù)”市場年均符合增長率為39.4%,將是整個信息與通信技術(shù)市場增速的7倍;管理及維護數(shù)據(jù)的成本將是購買存儲設(shè)備所需成本的4倍;全球數(shù)據(jù)量的年均復(fù)合增長速度為59%;未來需要分析的信息源中,混合類型數(shù)據(jù)所占比重將高達85%;數(shù)據(jù)分析直接受到服務(wù)器性能制約的數(shù)據(jù)量將占到總體的87%;僅2012年一年,服務(wù)器在整體“大數(shù)據(jù)”市場投資中就將占去14%的比重。
這就意味著傳統(tǒng)計算的低效正在為企業(yè)發(fā)展帶來阻礙,企業(yè)感到當(dāng)前的IT系統(tǒng)變得更加復(fù)雜且難以管理。數(shù)據(jù)顯示:企業(yè)用于運營和維護IT系統(tǒng)的費用已經(jīng)超過整體預(yù)算的70%,并且這一比例仍在持續(xù)增長;企業(yè)有三分之二的IT項目及解決方案部署超出了原定計劃;IT架構(gòu)的復(fù)雜度將以當(dāng)前速度每兩年就增加一倍。
于是出乎絕大多數(shù)人意料的事情發(fā)生了:IT部門,這個曾經(jīng)作為企業(yè)現(xiàn)代化和創(chuàng)新化能力標志的部門,正越來越成為企業(yè)新創(chuàng)新的阻力而非動力。
怎么辦?
很多人立即想到了另外一個熱詞:“云計算”。
IBM全球高級副總裁Rod Adkins認為,當(dāng)前全球IT領(lǐng)域有了令人振奮的發(fā)展趨勢和挑戰(zhàn),現(xiàn)在每天有大量數(shù)據(jù)和信息生成,這為大數(shù)據(jù)分析提供了機會;數(shù)據(jù)中心的挑戰(zhàn)也為IT提供了新機會,比如云計算,能降低數(shù)據(jù)中心成本。
EMC資深產(chǎn)品經(jīng)理李君鵬認為,大數(shù)據(jù)本身就是一個問題集,云技術(shù)是目前解決大數(shù)據(jù)問題集最重要有效的手段。云計算提供了基礎(chǔ)架構(gòu)平臺,大數(shù)據(jù)應(yīng)用在這個平臺上運行。目前公認處理大數(shù)據(jù)集最有效手段的分布式處理,也是云計算思想的一種具體體現(xiàn)。Teradata技術(shù)總監(jiān)Stephen Brobst則表示,公有云架構(gòu)對數(shù)據(jù)倉庫沒有影響,因為企業(yè)的CIO不會無緣無故把財務(wù)數(shù)據(jù)或者客戶數(shù)據(jù)放到云上,那樣很危險。然而,是私有云架構(gòu)確實有影響:第一,通過私有云,可以鞏固數(shù)據(jù)集市,減少利用率不足的問題;第二,可以通過靈敏的方式將數(shù)據(jù)集成,實現(xiàn)業(yè)務(wù)價值。
于是有人就此理解為:大數(shù)據(jù)的最佳解決方案是采用云計算和分布式處理,利用互聯(lián)網(wǎng)將運算能力、存儲能力都做分布式的處理,認為這樣做就可以最大程度上地降低成本、增加擴展性和靈活性。
然而事實真的如此嗎?
讓我們來分析一下最近IBM公司在國內(nèi)針對百萬人口的城市級信息中心制定的解決方案:
面對數(shù)量龐大且增長迅速的各類交通信息:120萬輛機動車電子卡、4萬輛機動車的實時GPS定位、200萬筆公交IC卡數(shù)據(jù)、518個高清卡口的113億張圖片等,該市信息中心的領(lǐng)導(dǎo)意識到,當(dāng)前多個項目能源消耗大、占地要求非常高、并且原有的網(wǎng)絡(luò)設(shè)備難以滿足新增的需求,網(wǎng)絡(luò)設(shè)備經(jīng)常更換,并且這些相互獨立的數(shù)據(jù)庫、服務(wù)器和存儲,以及不同的訪問權(quán)限和沒有統(tǒng)一的管理界面,讓本就壓力巨大的數(shù)據(jù)中心的效率大打折扣,同時也極大浪費了寶貴的人力、能源和其他各種資源。
IBM給出的解決方案是:
首先,在基礎(chǔ)平臺上摒棄了分布式的服務(wù)器架構(gòu),而是采用大型服務(wù)器在基礎(chǔ)架構(gòu)上對處理能力、I/O吞吐和主存儲進行了整合,這樣做的最大亮點是,將原有成百計的分布式服務(wù)器整合到了個位數(shù),極大地節(jié)省了空間和能源,做到綠色環(huán)保;因為不用考慮各分布式服務(wù)器之間的互通互聯(lián)和各服務(wù)器之間的狀態(tài)及負載均衡與調(diào)配,節(jié)省了相當(dāng)數(shù)量的管理人員;另外大型服務(wù)器自身端到端的管理功能和適用于異構(gòu)工作負載且基于策略的框架,有效幫助信息中心實現(xiàn)中心控制,實現(xiàn)極高的性能。
其次,在整合的基礎(chǔ)平臺之上,采用“云計算”框架虛擬化設(shè)計,實現(xiàn)了智能交通和政務(wù)網(wǎng)站的整合。這一方案讓用戶在使用上可以享受與分布式架構(gòu)相同甚至更加優(yōu)越的性能。由基礎(chǔ)平臺通過虛擬化形成的任意數(shù)量的虛機,在統(tǒng)一云管理軟件URM的配置下,能夠提供統(tǒng)一的管理視圖和管理機制,簡化在多套異構(gòu)業(yè)務(wù)系統(tǒng)環(huán)境下系統(tǒng)的運營和維護工作。
而在本方案中的存儲部分則采用了運行穩(wěn)定、性能領(lǐng)先、技術(shù)成熟的SAN網(wǎng)絡(luò)架構(gòu),具有很好的穩(wěn)定性,能為前端各應(yīng)用提供可靠的數(shù)據(jù)存儲平臺,并且整個SAN網(wǎng)絡(luò)中的部件都配置了雙冗余組件,保證任一部件的損壞不會影響整個系統(tǒng)的運行,而關(guān)鍵數(shù)據(jù)庫的數(shù)據(jù)都通過合理的備份策略,定期備份在了物理磁帶上,保證關(guān)鍵數(shù)據(jù)的絕對安全。
總結(jié)下來,整合的基礎(chǔ)平臺,“云計算”框架的虛擬化設(shè)計,和定制化的高速存儲,打造出了最穩(wěn)定、最可靠、最安全、最綠色的運行環(huán)境,讓政府的大數(shù)據(jù)應(yīng)用完美落地。
可見,大數(shù)據(jù)的解決方案不同于純粹云計算的解決方案,雖然云計算帶來了看上去更便宜的處理能力和存儲能力,但對于往往都有相當(dāng)數(shù)量級規(guī)模的大數(shù)據(jù)應(yīng)用而言,在基礎(chǔ)架構(gòu)上巧妙地整合和部分的集中,反而能更好地解決安全性、可靠性、穩(wěn)定性和綠色環(huán)保的需要。
4 結(jié)束語
大數(shù)據(jù)為云計算大規(guī)模與分布式的計算能力提供了應(yīng)用的空間,解決了傳統(tǒng)計算機無法解決的問題,海量的數(shù)據(jù)需要足夠存儲來容納它,快速、低廉、綠色的數(shù)據(jù)中心將成為這一切的關(guān)鍵。
然而大數(shù)據(jù)并不意味著整合的、集中式的服務(wù)器架構(gòu)已走向了末路,相反,大數(shù)據(jù)所帶來的規(guī)模效應(yīng),使得我們越來越需要更加高效可靠的大型整合的混合負載服務(wù)器,巧妙地整合和適當(dāng)?shù)募?,將成為大?shù)據(jù)解決方案里重要的一種思想和方向,特別是針對關(guān)鍵行業(yè)的核心數(shù)據(jù),高安全、高可靠、高穩(wěn)定將始終是使用者的首要考慮。
參考文獻:
在技術(shù)方面,內(nèi)存計算技術(shù)的成熟,使得企業(yè)實時分析海量數(shù)據(jù)成為可能。Hadoop技術(shù)的完善,為非結(jié)構(gòu)化數(shù)據(jù)分析提供了可能。
在大數(shù)據(jù)解決方案方面,不能不提軟硬件一體機。這兩年,具有簡化IT、降低IT運維成本優(yōu)勢的軟硬件一體機越來越受到供應(yīng)商和用戶的青睞。值得一提的是,當(dāng)前的軟硬件一體機中,很多都是大數(shù)據(jù)解決方案:最早推出軟硬件一體機的甲骨文公司的第一款軟硬件一體機產(chǎn)品Exadata數(shù)據(jù)庫一體機就與大數(shù)據(jù)相關(guān),甲骨文后來推出的Exalytics商業(yè)智能一體機和大數(shù)據(jù)一體機都是用于數(shù)據(jù)分析的;被SAP視為革命性的產(chǎn)品SAP HANA屬于內(nèi)存計算一體機,其最大的優(yōu)勢在于可實現(xiàn)海量數(shù)據(jù)的實時分析;IBM今年推出的PureSystem系列一體機中,就有PureData;微軟與惠普聯(lián)合推出的BI一體機,也是用于數(shù)據(jù)分析的……
盡管市場已經(jīng)非?;馃?,但是當(dāng)前大數(shù)據(jù)市場應(yīng)該尚屬于啟動階段,因為大部分用戶對大數(shù)據(jù)僅僅有想法而沒有真正的行動,而他們對于大數(shù)據(jù)分析的需求是顯而易見的。相關(guān)的解決方案也有待完善,特別是針對非結(jié)構(gòu)化數(shù)據(jù)分析的解決方案。
IBM PureData
作為IBM PureSystems專家集成系統(tǒng)家族的新成員,PureData能夠幫助企業(yè)在幾分鐘內(nèi)完成對PB數(shù)量級大數(shù)據(jù)的管理和分析,高效獲取洞察力,從而實現(xiàn)企業(yè)市場、銷售等各部門業(yè)務(wù)目標的快速推進,并幫助各行各業(yè)的企業(yè)解決幾大難題:如何利用更簡便、經(jīng)濟的方式分析業(yè)務(wù)數(shù)據(jù),了解客戶購買行為,減少客戶流失,開展需要大量數(shù)據(jù)支持的市場推廣活動以及實時發(fā)現(xiàn)欺詐行為。
不同于其他數(shù)據(jù)系統(tǒng),PureData能夠?qū)⑾到y(tǒng)安裝和配置的時間從24天減至24小時,將復(fù)雜的分析時間從數(shù)小時驟降至數(shù)分鐘,并實現(xiàn)在單個系統(tǒng)上管理100多個數(shù)據(jù)庫的卓越性能。通過PureData系統(tǒng),企業(yè)得以在傳統(tǒng)IT環(huán)境或云環(huán)境中為業(yè)務(wù)用戶提供高性能的數(shù)據(jù)服務(wù),在不到10天的時間里完成Web應(yīng)用的部署,而同樣的任務(wù)過去至少需要6個月才能完成。
針對特定工作負載,PureData共有三個型號,分別是PureData System for Transactions(PureData事務(wù)系統(tǒng)或PureData交易系統(tǒng))、PureData System for Analytics(PureData分析系統(tǒng))和PureData System for Operational Analytics(PureData運營分析系統(tǒng))。
目前,60多家ISV(獨立軟件供應(yīng)商)已經(jīng)表示將全力支持PureData。PureData將為這種開放的合作模式提供新的平臺,激勵更多合作伙伴開發(fā)適用于PureData的解決方案。同時,IBM還將在這些解決方案和應(yīng)用的基礎(chǔ)上推出數(shù)種新模式,涵蓋社交業(yè)務(wù)、資產(chǎn)管理和業(yè)務(wù)流程管理,全面簡化軟硬件資源的配置和管理,為20多個行業(yè)應(yīng)用領(lǐng)域提供支持。
IBM大數(shù)據(jù)平臺
IBM充分發(fā)揮其整合的優(yōu)勢,結(jié)合信息管理、業(yè)務(wù)分析等領(lǐng)先的軟件提出了“大數(shù)據(jù)平臺”架構(gòu),為各行業(yè)企業(yè)選擇和構(gòu)建大數(shù)據(jù)解決方案提供了全面的技術(shù)支持。IBM大數(shù)據(jù)平臺突破了傳統(tǒng)數(shù)據(jù)倉庫和數(shù)據(jù)管理理念,能夠為企業(yè)組織提供實時分析信息流和因特網(wǎng)范圍信息源的能力,讓這些企業(yè)實現(xiàn)更為經(jīng)濟、高效的大數(shù)據(jù)管理,并為在此之上的業(yè)務(wù)分析奠定堅實的基礎(chǔ)。
IBM大數(shù)據(jù)平臺的四大核心能力包括Hadoop系統(tǒng)、流計算、數(shù)據(jù)倉庫和信息整合與治理:
·IBM在Hadoop系統(tǒng)領(lǐng)域的代表產(chǎn)品是InfoSphere BigInsights。IBM將其在數(shù)據(jù)管理上的豐富經(jīng)驗與Hadoop開源平臺高效整合,使得BigInsights相比普通的Hadoop開源工具的可用性、可管理性、安全性得以大大提高,成為最主要的靜態(tài)大數(shù)據(jù)分析工具和平臺;
·IBM在流計算領(lǐng)域的代表產(chǎn)品是InfoSphere Streams,它是目前業(yè)界獨有的流數(shù)據(jù)處理技術(shù)。InfoSphere Streams能夠在諸如氣象信息、通信信息、金融交易數(shù)據(jù)的管理中動態(tài)捕捉信息,進行實時分析,為靜態(tài)數(shù)據(jù)的處理提供有效補充。
·IBM在數(shù)據(jù)倉庫領(lǐng)域的代表產(chǎn)品是在線交易型數(shù)據(jù)倉庫InfoSphere Warehouse和分析型數(shù)據(jù)倉庫Netezza。Netezza可將大量數(shù)據(jù)整合到統(tǒng)一平臺上,計算能力高達TB級。
·信息整合與治理是IBM在業(yè)界獨有的方法論和技術(shù),其代表產(chǎn)品是Optim和Guardium。近期推出的Guardium 9能夠?qū)⑷鏒B2這樣的傳統(tǒng)關(guān)系型數(shù)據(jù)倉庫和基于Hadoop的分布式存儲系統(tǒng)進行統(tǒng)一管理,并提供完整的數(shù)據(jù)生命周期管控。
微軟SQL Server 2012
微軟SQL Server 在市場上有著良好的口碑,是全球使用較為廣泛的數(shù)據(jù)庫與商業(yè)智能產(chǎn)品。微軟SQL Server提供了對混合IT環(huán)境的支持,全面支持私有云和公有云,并可實現(xiàn)平滑遷移,滿足企業(yè)實現(xiàn)數(shù)據(jù)庫以及應(yīng)用擴展的需要。
作為云就緒信息平臺,SQL Server能夠滿足企業(yè)關(guān)鍵業(yè)務(wù)應(yīng)用環(huán)境所提出的高穩(wěn)定性、高性能、高安全和易管理等需求,同時提供全面的商業(yè)智能及數(shù)據(jù)倉庫解決方案,幫助企業(yè)更好地挖掘數(shù)據(jù)背后的知識,提供強大的工具實現(xiàn)并展現(xiàn)數(shù)據(jù)分析結(jié)果,且能根據(jù)企業(yè)需要實施個性化的云以及大數(shù)據(jù)解決方案。
作為微軟的信息平臺產(chǎn)品,SQL Server在數(shù)據(jù)處理與分析市場一直處于領(lǐng)導(dǎo)地位。SQL Server是全面的數(shù)據(jù)庫、數(shù)據(jù)倉庫、商業(yè)智能解決方案。它不僅提供全面的滿足OLTP處理的功能,而且提供多種組件以滿足不同規(guī)??蛻舻亩喾N需求。它是第一個帶有商業(yè)智能全套組件的數(shù)據(jù)庫產(chǎn)品,在數(shù)據(jù)分析,特別是OLAP領(lǐng)域有著極好的口碑。
針對大數(shù)據(jù),SQL Server具有自己本地以及云端解決方案,與微軟強大的商業(yè)智能組件以及前端展現(xiàn)方式相結(jié)合。
國泰君安證券股份有限公司已經(jīng)借助微軟SQL Server 2012提升了數(shù)據(jù)分析能力,實現(xiàn)了對用戶的精準服務(wù)與趨勢跟蹤。國泰君安是目前國內(nèi)規(guī)模最大、營業(yè)范圍最寬、機構(gòu)分布最廣的證券公司之一?;谝酝褂?SQL Server 產(chǎn)品的良好經(jīng)驗,以及客戶數(shù)據(jù)建模、多維分析與鉆取、動態(tài)報表分析與展現(xiàn)等領(lǐng)域的應(yīng)用需求,國泰君安選用微軟 SQL Server 2012來搭建新一代的零售客戶BI分析系統(tǒng)。國泰君安充分利用新一代 SQL Server提供的對大數(shù)據(jù)量的數(shù)據(jù)分析及計算能力,結(jié)合Power View及PowerPivot 的易用性,更高效、更自主地發(fā)現(xiàn)業(yè)務(wù)數(shù)據(jù)的變化及趨勢,提高針對零售客戶的業(yè)務(wù)洞察力,優(yōu)化以客戶為中心的證券服務(wù)。
SAP實時數(shù)據(jù)平臺
SAP實時數(shù)據(jù)平臺是一套緊密集成并優(yōu)化,專為應(yīng)對當(dāng)今企業(yè)數(shù)據(jù)管理的最新挑戰(zhàn)的領(lǐng)先技術(shù)平臺。
憑借革命性的創(chuàng)新產(chǎn)品SAP HANA與業(yè)界領(lǐng)先的Sybase數(shù)據(jù)管理產(chǎn)品,SAP實時數(shù)據(jù)平臺這套全方位集成、實時處理的平臺,在包括數(shù)據(jù)交易、遷移、存儲、處理和分析等在內(nèi)的信息生命周期的不同階段,不僅能夠幫助企業(yè)用戶管理海量數(shù)據(jù)存儲,即時處理高速流量數(shù)據(jù),實現(xiàn)智能數(shù)據(jù)流動,數(shù)據(jù)可視化消費,而且還可以幫助用戶大大降低基礎(chǔ)架構(gòu)的復(fù)雜性,在滿足應(yīng)用基本的設(shè)計和藍圖管理需求的同時,為下一代大數(shù)據(jù)應(yīng)用和分析提供卓越性能,持續(xù)保證對云計算和移動應(yīng)用的平臺支持,從而有效降低成本。
值得一提的是,所有這些平臺功能的交付,都將在盡可能不影響客戶現(xiàn)有應(yīng)用的前提下進行。
作為SAP實時數(shù)據(jù)平臺的核心,SAP HANA獨具創(chuàng)新性,并已得到市場的充分驗證。SAP HANA不僅能幫助客戶以快10萬倍的速度獲取和傳遞信息,還將為企業(yè)信息系統(tǒng)提供強勁動力,通過技術(shù)創(chuàng)新促進業(yè)務(wù)發(fā)展,最終幫助企業(yè)以全新的思路拓展業(yè)務(wù),達成卓越績效。
Teradata Aster大數(shù)據(jù)綜合分析平臺
Teradata Aster大數(shù)據(jù)綜合分析平臺是業(yè)內(nèi)首款集成Teradata Aster以及Apache Hadoop的大數(shù)據(jù)解決方案,整合了MapReduce和Hadoop的技術(shù)優(yōu)勢。
作為卓越的企業(yè)級平臺,Teradata Aster大數(shù)據(jù)綜合分析平臺使用了業(yè)內(nèi)獨有的SQL-MapReduce接口語言,以及全面的MapReduce 分析功能庫。該分析庫內(nèi)嵌50多項預(yù)建的MapReduce功能,提供開箱即用的圖形、文本、行為、營銷分析,以及更多分析功能。
作為一個真正采用混合架構(gòu)的平臺,Teradata Aster大數(shù)據(jù)綜合分析平臺包含Aster Database、Aster SQL-MapReduce和Apache Hadoop。由于深度集成了Aster與Apache Hadoop平臺,用戶無需接受復(fù)雜的培訓(xùn)即可通過SQL-H連接器和SQL-MapReduce使用標準SQL訪問Aster和Hadoop數(shù)據(jù)進行分析平臺。
與市場上其他典型平臺相比,該平臺的數(shù)據(jù)吞吐量及分析速度可分別提高19倍及35倍。
Oracle Exadata X3 Database In-Memory Machine
Oracle Exadata X3 Database In-Memory Machine是Oracle Exadata數(shù)據(jù)庫云服務(wù)器的最新升級產(chǎn)品。
Oracle Exadata X3 Database In-Memory Machine是甲骨文云平臺的關(guān)鍵組件。Oracle Exadata X3-2和X3-8 Database In-Memory Machine均可在閃存和隨機存儲器(RAM)中存儲多達數(shù)百TB的壓縮用戶數(shù)據(jù),幾乎可以消除由磁盤驅(qū)動器減速而產(chǎn)生的讀\寫功能運維費用,從而使Exadata X3系統(tǒng)成為應(yīng)對云計算中不同類型和不斷變化的工作負載的理想數(shù)據(jù)庫平臺。
行業(yè)概述
近年來互聯(lián)網(wǎng)發(fā)生了巨大的變化,移動互聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、電子商務(wù)大大擴展了互聯(lián)網(wǎng)的疆界和應(yīng)用領(lǐng)域。互聯(lián)網(wǎng)行業(yè)在大數(shù)據(jù)技術(shù)浪潮中的異軍突起,也將為整個信息技術(shù)產(chǎn)業(yè)帶來新的機遇。一方面,大數(shù)據(jù)會催生對IT產(chǎn)品與解決方案更多的需求,將涵蓋從硬件、軟件到信息服務(wù)等多個層面;另一方面,越來越多的互聯(lián)網(wǎng)公司正在通過云交付的模式,將自身對于大數(shù)據(jù)集的存儲、計算與分析能力開放給第三方,使得數(shù)據(jù)即服務(wù)(Data as a Service)成為影響產(chǎn)業(yè)格局的新一代業(yè)務(wù)模式?!?/p>
方案架構(gòu)
曙光互聯(lián)網(wǎng)大數(shù)據(jù)平臺解決方案從邏輯上分為硬件層、存儲層、計算層和其上支持的各種業(yè)務(wù)模型。其中硬件平臺統(tǒng)一為整合計算和存儲能力的存儲服務(wù)器,服務(wù)器之間通過以太網(wǎng)互相連接。這種不再需要門類繁多的存儲設(shè)備和服務(wù)器類型的設(shè)計可以大大簡化管理和建設(shè)的復(fù)雜程度。存儲層存儲上層業(yè)務(wù)中的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)保存在關(guān)系數(shù)據(jù)庫中,網(wǎng)頁信息等非結(jié)構(gòu)化數(shù)據(jù)已Key-Value的形式保存在NoSql存儲系統(tǒng)中。計算層負責(zé)將存儲層中管理的數(shù)據(jù)轉(zhuǎn)化為上層應(yīng)用所需要的數(shù)據(jù)集,包括數(shù)據(jù)存儲、關(guān)鍵字快速檢索等。業(yè)務(wù)層則可以利用大數(shù)據(jù)平臺提供的存儲和計算資源,這些資源都可以以資源池的方式呈現(xiàn),以多租戶的形式提供給上層的應(yīng)用。
曙光互聯(lián)網(wǎng)大數(shù)據(jù)平臺邏輯結(jié)構(gòu)示意圖如下所示:
首先,科學(xué)出現(xiàn)了新的形態(tài)?,F(xiàn)代科學(xué)之父伽利略是個里程碑式的人物,正是伽利略明確地將實物實驗和數(shù)學(xué)推理方法引入到了科學(xué)研究之中,科學(xué)才得以系統(tǒng)而迅速地發(fā)展。從那時起,科學(xué)家們開始以實物實驗和數(shù)學(xué)推理的方式認識自然世界,科學(xué)因此形成了兩種形態(tài),其一是實物實驗形態(tài),其二是數(shù)學(xué)推理形態(tài)。隨著科學(xué)發(fā)展到今天的大數(shù)據(jù)時代,一些科學(xué)家和工程師離不開借助計算機手段研究事物,科學(xué)出現(xiàn)了基于計算機的第三種形態(tài)——計算形態(tài)。各個學(xué)科的邊界變得模糊,科學(xué)研究的范式有了新的變化。以前學(xué)科分化越來越精細,但是科學(xué)發(fā)展到今天,信息科學(xué)、納米技術(shù)、生物科學(xué)和生命科學(xué)、認知和神經(jīng)科學(xué)被公認為最具革命性的學(xué)科領(lǐng)域,這四種科技的整合,將對人類社會產(chǎn)生深刻的影響,并可能再次改變我們?nèi)祟惖奈锓N。學(xué)科在高度分化的基礎(chǔ)之上開始走向?qū)W科之間的滲透和融合,特別是開始走向自然與人的融合?;谟嬎銠C的整合是當(dāng)今科學(xué)發(fā)展與突破的必由之路。但是如何整合卻是仁者見仁智者見智之事。
其次,技術(shù)的高速發(fā)展帶來了日益嚴重的社會問題。比如生命科學(xué)中的克隆技術(shù)直接挑戰(zhàn)人類社會傳統(tǒng)的倫理問題;對于自然界的無節(jié)制索取,帶來了日益嚴重的能源危機和生態(tài)環(huán)境惡化危機等。此外,物質(zhì)生活的豐富與網(wǎng)絡(luò)的言論自由帶來了日益高漲的民主與平等的社會訴求。這些問題可能直接源自高速發(fā)展的科技,以致于我們的精神與理解出現(xiàn)相對滯后。諸多危機與問題要得到根治,除了需要加快人類智慧文明發(fā)展,還需要科技與科學(xué)教育的進一步高度發(fā)展,此所謂解鈴還須系鈴人。科學(xué)史上,科學(xué)家們?yōu)槿祟惙e累了豐富的化解人類危機的智慧與知識。
最后,一方面“科教興國”得到普遍共識,人們開始懂得在科學(xué)教育之信息化方面投入大量的人力和物力;另一方面人們對技術(shù)的發(fā)展給生存環(huán)境構(gòu)成影響認識不足,主要表現(xiàn)在看不到現(xiàn)代教育技術(shù)的革命性影響潛力,或者在現(xiàn)代教育技術(shù)面前感到茫然。這種狀況除了造成設(shè)備因為閑置而帶來的嚴重浪費現(xiàn)象之外,還限制了我們破解當(dāng)今科技與科學(xué)教育難題的思考與方法。
為了解決諸多危機與沖突,需要探討各種可行而有效的解決方案。通過分析大數(shù)據(jù)時代的科學(xué)教育的現(xiàn)狀不難發(fā)現(xiàn),如果只是從局部進行個別改動,問題難以有效地得到解決,當(dāng)今的科學(xué)教育問題要想從根本上得以解決,必須運用系統(tǒng)觀念,從整體上改變或者構(gòu)建科學(xué)教育體系,換句話講,需要從整合的角度才能提出可行的解決方案。
數(shù)字科學(xué)家計劃
針對大數(shù)據(jù)時代人類面臨的諸多危機,人們提出了一些對策與良方,其中影響最大的是國際21世紀教育委員會在向聯(lián)合國教科文組織(UNIESCO)提出的21世紀教育的四大支柱策略:(1)學(xué)會認知(Learning to know):培養(yǎng)學(xué)生學(xué)會運用認知工具求知,學(xué)會發(fā)現(xiàn)問題,學(xué)會探究知識,學(xué)會構(gòu)建知識。即培養(yǎng)學(xué)生認知方法,引導(dǎo)學(xué)生通過發(fā)現(xiàn)、探究和意義構(gòu)建的途徑獲取知識,培養(yǎng)學(xué)生的繼續(xù)學(xué)習(xí)能力。(2)學(xué)會做事(Learning to do) :既要學(xué)會實踐,也要學(xué)會創(chuàng)造。重視建造可供學(xué)生參與的環(huán)境,激發(fā)學(xué)生興趣,使學(xué)習(xí)者通過環(huán)境的交互作用,通過實踐,通過做事獲得知識和能力。(3)學(xué)會合作(Learning to together) :要培養(yǎng)學(xué)生學(xué)會與他人共同生活,就要學(xué)會合作生活,合作學(xué)習(xí),從過去的集中教學(xué)方式到個別學(xué)習(xí)方式,到現(xiàn)在提倡的協(xié)作學(xué)習(xí)。(4)學(xué)會生存(Learning to be) :學(xué)會生活、學(xué)會做人、學(xué)會自身的發(fā)展。既要傳授知識,還要注重能力和高尚情操的培養(yǎng)。
在科學(xué)教育領(lǐng)域之中形成了一種強調(diào)親自動手學(xué)習(xí)科學(xué)的潮流。在美國、法國、英國、加拿大等國的國家科學(xué)課程改革方案中,科學(xué)探究被列為課程目標和課程體系的關(guān)鍵而基本的要素?!皩W(xué)習(xí)必須是主動的”已成為國際上基本的教育理念。其中影響較大的有“做中學(xué)”、“Hands-on”(動手做)、“Minds-on”(動腦做)、“STEM”(科學(xué)、技術(shù)、工程、數(shù)學(xué))等科學(xué)教育實踐。這些科學(xué)教育實踐旨在使學(xué)生以科學(xué)的方法學(xué)習(xí)知識,強調(diào)學(xué)習(xí)方法、思維方法、學(xué)習(xí)態(tài)度的培養(yǎng)。
這些先進的科學(xué)教育理念與實踐推動了科學(xué)教育的創(chuàng)新與實踐。但是實踐表明,一個好的理念要想轉(zhuǎn)化為教學(xué)行為,往往需要一個較長時期的培訓(xùn)與轉(zhuǎn)化過程,這個過程是艱難的,特別是對于教師和學(xué)生需要具有一定的專業(yè)理解能力。能否綜合上述先進的科學(xué)教育理念,提出一種直觀、易懂而且有效的科學(xué)教育模式的推廣方案呢?數(shù)字科學(xué)家計劃(E-Scientist Project, ESP)給出了一種大數(shù)據(jù)時代下科學(xué)教育模式的推廣方案。
所謂數(shù)字科學(xué)家計劃,就是一種大數(shù)據(jù)環(huán)境下以提高每一位學(xué)生科學(xué)素養(yǎng)水平為宗旨,以探究式教學(xué)為鮮明特征,以科學(xué)思想、科學(xué)方法和數(shù)據(jù)挖掘方法為核心,播種未來科學(xué)家種子的教學(xué)模式的推廣方案。
數(shù)字科學(xué)家計劃主要有兩方面特征,其一,數(shù)字科學(xué)家是一種科學(xué)教育模式符號,以“科學(xué)家”符號將抽象的科學(xué)教育理念人物化和直觀化,即準確地表述了現(xiàn)代的科學(xué)教育理念,也便于師生理解與實施。榜樣的力量是無窮的,雖然科學(xué)不能解決人類所有的問題,但是科學(xué)家們?yōu)槲覀兎e累的知識、思想、方法、科學(xué)精神在過去和將來都是破解社會難題的重要途徑;其二,強調(diào)發(fā)揮大數(shù)據(jù)環(huán)境下第三種科學(xué)形態(tài)的育人功能,這是當(dāng)今科技與科學(xué)教育創(chuàng)新的重要切入點。
數(shù)字科學(xué)家的教學(xué)模式是在WebQuest(基于網(wǎng)絡(luò)的主題探究)模式的基礎(chǔ)上改造而成的。主要有以下五個模塊:(1)核心問題:WebQuest的核心是設(shè)置一個開放性的問題。這個問題設(shè)定了WebQuest的清晰目標,鼓勵學(xué)生回顧原先掌握的知識,激發(fā)學(xué)習(xí)者進一步探索的動機。(2)任務(wù)指南:提供一個“腳手架”,引導(dǎo)學(xué)生設(shè)計、經(jīng)歷和體驗專家的思維過程?!澳_手架”將令人望而生畏的探究項目打碎成若干個片段,引導(dǎo)學(xué)生研究較為復(fù)雜的科學(xué)問題。(3)海量資源:創(chuàng)建一些到其他互聯(lián)網(wǎng)站點的鏈接來共享網(wǎng)絡(luò)資源。通過運用多樣化的互聯(lián)網(wǎng)資源,可以為不同學(xué)習(xí)水平或不同學(xué)習(xí)方式的學(xué)生提供信息資源。(4)實施“做中學(xué)”:要提供高層次的思維指南,體現(xiàn)“做中學(xué)”的教學(xué)理念,保證動腦和動手的教學(xué)方式落到實處。(5)交流與評價:WebQuest一般用量規(guī)提供了自我評估的標準,提示學(xué)生已經(jīng)學(xué)到了什么,并鼓勵把這種探究的經(jīng)驗擴展到其他領(lǐng)域。評價人員可以是教師,也可以是家長和同學(xué)。
數(shù)字科學(xué)家計劃產(chǎn)生于筆者主持的北京市教育科學(xué)“十一五”規(guī)劃課題《數(shù)字科學(xué)家計劃:基于數(shù)據(jù)探究理論的物理選修課程建設(shè)與研究》(2010年立項),已經(jīng)在北京景山學(xué)校、北京一零一中學(xué)、北京師范大學(xué)亞太實驗學(xué)校等學(xué)校展開實驗。該項目在課題階段探討了校本特色選修課程的建設(shè),但是隨著課題研究的深入開展,數(shù)字科學(xué)家計劃已經(jīng)不再局限于校本選修課程,開始運用到正規(guī)的物理課堂教學(xué);也不僅局限在物理學(xué)科教學(xué),已經(jīng)開始運用到小學(xué)高年級的科學(xué)課程與教學(xué);還不僅局限在學(xué)??茖W(xué)教學(xué),已經(jīng)開始運用于北京市東城區(qū)青少年科技館的科普性質(zhì)科學(xué)課程,并配合教學(xué),于2013年11月成功地舉辦了北京市東城區(qū)“數(shù)碼探科學(xué)”大賽。大賽令人耳目一新,引起了學(xué)者和教師的廣泛關(guān)注。著名教育家顧明遠先生在頒獎會上講到,這次大賽讓人們看到了大數(shù)據(jù)環(huán)境下的教學(xué)實踐,學(xué)生們在數(shù)碼探究中有模有樣,學(xué)到了科學(xué)思想、科學(xué)方法,體驗到了數(shù)碼探究的樂趣。
經(jīng)過三年的探索與實踐,數(shù)字科學(xué)家計劃已經(jīng)從課題研究轉(zhuǎn)向項目推廣的初期階段。初步建設(shè)了數(shù)字科學(xué)家網(wǎng)站,形成了一種大數(shù)據(jù)環(huán)境下的科學(xué)教育模式,也形成數(shù)字科學(xué)家課程的教師培訓(xùn)經(jīng)驗,還形成低、中、高端數(shù)字環(huán)境裝備下課程實施經(jīng)驗,已經(jīng)具備了在更大范圍試驗與推廣的條件。
數(shù)據(jù)探究理論——數(shù)字科學(xué)家計劃的基石
探討破解大數(shù)據(jù)時代的科學(xué)教育難題的途徑涉及大而復(fù)雜的社會問題,僅憑經(jīng)驗而沒有理論的指導(dǎo)是難以理解與完成的。但是數(shù)字科學(xué)家計劃已經(jīng)形成了一些基本的概念與教學(xué)原理。這些基本概念與教學(xué)原理構(gòu)成了所謂的數(shù)據(jù)探究理論。數(shù)據(jù)探究理論是數(shù)字科學(xué)家計劃的基石。
信息(Information)是數(shù)據(jù)探究理論的邏輯起點。何謂信息?這是一個復(fù)雜而神奇的概念,學(xué)者們有著不同的見解,美國數(shù)學(xué)家和控制論創(chuàng)始者維納不得已這樣定義信息:信息就是信息,既非物質(zhì),也非能量。筆者考慮到人的因素,對信息進行了如下的定義:信息既不是物質(zhì),也不是能量,而是物質(zhì)的波-粒二像性與人相互作用的存在形式。
數(shù)據(jù)(Data)是數(shù)據(jù)探究理論的另一個重要概念。數(shù)據(jù)是載荷或記錄信息而留下的明確印跡。數(shù)據(jù)可以是數(shù)字、文字、圖像、錄像,也可以是計算機代碼等。對數(shù)據(jù)背景的解讀是獲取意義的一種途徑。數(shù)據(jù)背景是接收者針對特定數(shù)據(jù)的意義準備,即當(dāng)接收者了解數(shù)據(jù)序列的規(guī)律,并知道每個數(shù)據(jù)或數(shù)據(jù)組合的指向性目標和含義時,便可以獲得數(shù)據(jù)所載荷的意義。觀察數(shù)據(jù)或者數(shù)據(jù)挖掘就是對數(shù)據(jù)背景的解讀過程。數(shù)字科學(xué)家計劃的核心環(huán)節(jié)在于信息觀測、數(shù)據(jù)挖掘和數(shù)據(jù)價值與交流。
探究式教學(xué)是一種以科學(xué)探究為基本特征的教學(xué)模式,其實質(zhì)是引導(dǎo)學(xué)生通過類似科學(xué)家的探索過程理解科學(xué)概念和科學(xué)本質(zhì)。依據(jù)科學(xué)的三種形態(tài),將探究式教學(xué)分成實物實驗探究、數(shù)學(xué)推理探究和數(shù)據(jù)探究。所謂數(shù)據(jù)探究是一種基于計算機的探究式教學(xué),是提高學(xué)生數(shù)據(jù)素養(yǎng)水平的必要途徑。數(shù)據(jù)探究與其說是一種適應(yīng)大數(shù)據(jù)時代的手段和途徑,不如說是大數(shù)據(jù)時代的一種生活理念和生活態(tài)度。
數(shù)據(jù)探究在教師觀、學(xué)生觀、學(xué)習(xí)觀和評價觀上均具有新的內(nèi)涵。簡單介紹如下:(1)教師是數(shù)據(jù)探究的促進者與合作者。(2)學(xué)生是具有創(chuàng)造能力的學(xué)習(xí)主體。數(shù)據(jù)探究應(yīng)該把學(xué)生置于一個有社會意義的團體中,培養(yǎng)“共生性”與“交互性”,體驗創(chuàng)造的意義和價值。還應(yīng)該體現(xiàn)STS教育,強調(diào)人對自然、社會、人生的責(zé)任和義務(wù)。(3)數(shù)據(jù)探究是一個建構(gòu)的、社會化的綜合體驗過程。學(xué)習(xí)者總是依據(jù)已有經(jīng)驗、心理結(jié)構(gòu)和信念來選擇一些信息或者數(shù)據(jù),從中經(jīng)過數(shù)據(jù)挖掘得到推論,并根據(jù)推論來構(gòu)建關(guān)于世界的認識。(4)評價是開放、多元的反饋過程。數(shù)據(jù)探究評價認為學(xué)習(xí)是一種建構(gòu)獨特意義的過程,注重對于探究過程的評價,關(guān)注評價的開放性與多元性。
首先,科學(xué)出現(xiàn)了新的形態(tài)?,F(xiàn)代科學(xué)之父伽利略是個里程碑式的人物,正是伽利略明確地將實物實驗和數(shù)學(xué)推理方法引入到了科學(xué)研究之中,科學(xué)才得以系統(tǒng)而迅速地發(fā)展。從那時起,科學(xué)家們開始以實物實驗和數(shù)學(xué)推理的方式認識自然世界,科學(xué)因此形成了兩種形態(tài),其一是實物實驗形態(tài),其二是數(shù)學(xué)推理形態(tài)。隨著科學(xué)發(fā)展到今天的大數(shù)據(jù)時代,一些科學(xué)家和工程師離不開借助計算機手段研究事物,科學(xué)出現(xiàn)了基于計算機的第三種形態(tài)——計算形態(tài)。各個學(xué)科的邊界變得模糊,科學(xué)研究的范式有了新的變化。以前學(xué)科分化越來越精細,但是科學(xué)發(fā)展到今天,信息科學(xué)、納米技術(shù)、生物科學(xué)和生命科學(xué)、認知和神經(jīng)科學(xué)被公認為最具革命性的學(xué)科領(lǐng)域,這四種科技的整合,將對人類社會產(chǎn)生深刻的影響,并可能再次改變我們?nèi)祟惖奈锓N。學(xué)科在高度分化的基礎(chǔ)之上開始走向?qū)W科之間的滲透和融合,特別是開始走向自然與人的融合?;谟嬎銠C的整合是當(dāng)今科學(xué)發(fā)展與突破的必由之路。但是如何整合卻是仁者見仁智者見智之事。
其次,技術(shù)的高速發(fā)展帶來了日益嚴重的社會問題。比如生命科學(xué)中的克隆技術(shù)直接挑戰(zhàn)人類社會傳統(tǒng)的倫理問題;對于自然界的無節(jié)制索取,帶來了日益嚴重的能源危機和生態(tài)環(huán)境惡化危機等。此外,物質(zhì)生活的豐富與網(wǎng)絡(luò)的言論自由帶來了日益高漲的民主與平等的社會訴求。這些問題可能直接源自高速發(fā)展的科技,以致于我們的精神與理解出現(xiàn)相對滯后。諸多危機與問題要得到根治,除了需要加快人類智慧文明發(fā)展,還需要科技與科學(xué)教育的進一步高度發(fā)展,此所謂解鈴還須系鈴人??茖W(xué)史上,科學(xué)家們?yōu)槿祟惙e累了豐富的化解人類危機的智慧與知識。
最后,一方面“科教興國”得到普遍共識,人們開始懂得在科學(xué)教育之信息化方面投入大量的人力和物力;另一方面人們對技術(shù)的發(fā)展給生存環(huán)境構(gòu)成影響認識不足,主要表現(xiàn)在看不到現(xiàn)代教育技術(shù)的革命性影響潛力,或者在現(xiàn)代教育技術(shù)面前感到茫然。這種狀況除了造成設(shè)備因為閑置而帶來的嚴重浪費現(xiàn)象之外,還限制了我們破解當(dāng)今科技與科學(xué)教育難題的思考與方法。
為了解決諸多危機與沖突,需要探討各種可行而有效的解決方案。通過分析大數(shù)據(jù)時代的科學(xué)教育的現(xiàn)狀不難發(fā)現(xiàn),如果只是從局部進行個別改動,問題難以有效地得到解決,當(dāng)今的科學(xué)教育問題要想從根本上得以解決,必須運用系統(tǒng)觀念,從整體上改變或者構(gòu)建科學(xué)教育體系,換句話講,需要從整合的角度才能提出可行的解決方案。
數(shù)字科學(xué)家計劃
針對大數(shù)據(jù)時代人類面臨的諸多危機,人們提出了一些對策與良方,其中影響最大的是國際21世紀教育委員會在向聯(lián)合國教科文組織(UNIESCO)提出的21世紀教育的四大支柱策略:(1)學(xué)會認知(Learning to know):培養(yǎng)學(xué)生學(xué)會運用認知工具求知,學(xué)會發(fā)現(xiàn)問題,學(xué)會探究知識,學(xué)會構(gòu)建知識。即培養(yǎng)學(xué)生認知方法,引導(dǎo)學(xué)生通過發(fā)現(xiàn)、探究和意義構(gòu)建的途徑獲取知識,培養(yǎng)學(xué)生的繼續(xù)學(xué)習(xí)能力。(2)學(xué)會做事(Learning to do) :既要學(xué)會實踐,也要學(xué)會創(chuàng)造。重視建造可供學(xué)生參與的環(huán)境,激發(fā)學(xué)生興趣,使學(xué)習(xí)者通過環(huán)境的交互作用,通過實踐,通過做事獲得知識和能力。(3)學(xué)會合作(Learning to together) :要培養(yǎng)學(xué)生學(xué)會與他人共同生活,就要學(xué)會合作生活,合作學(xué)習(xí),從過去的集中教學(xué)方式到個別學(xué)習(xí)方式,到現(xiàn)在提倡的協(xié)作學(xué)習(xí)。(4)學(xué)會生存(Learning to be) :學(xué)會生活、學(xué)會做人、學(xué)會自身的發(fā)展。既要傳授知識,還要注重能力和高尚情操的培養(yǎng)。
在科學(xué)教育領(lǐng)域之中形成了一種強調(diào)親自動手學(xué)習(xí)科學(xué)的潮流。在美國、法國、英國、加拿大等國的國家科學(xué)課程改革方案中,科學(xué)探究被列為課程目標和課程體系的關(guān)鍵而基本的要素?!皩W(xué)習(xí)必須是主動的”已成為國際上基本的教育理念。其中影響較大的有“做中學(xué)”、“Hands-on”(動手做)、“Minds-on”(動腦做)、“STEM”(科學(xué)、技術(shù)、工程、數(shù)學(xué))等科學(xué)教育實踐。這些科學(xué)教育實踐旨在使學(xué)生以科學(xué)的方法學(xué)習(xí)知識,強調(diào)學(xué)習(xí)方法、思維方法、學(xué)習(xí)態(tài)度的培養(yǎng)。
這些先進的科學(xué)教育理念與實踐推動了科學(xué)教育的創(chuàng)新與實踐。但是實踐表明,一個好的理念要想轉(zhuǎn)化為教學(xué)行為,往往需要一個較長時期的培訓(xùn)與轉(zhuǎn)化過程,這個過程是艱難的,特別是對于教師和學(xué)生需要具有一定的專業(yè)理解能力。能否綜合上述先進的科學(xué)教育理念,提出一種直觀、易懂而且有效的科學(xué)教育模式的推廣方案呢?數(shù)字科學(xué)家計劃(E-scientist Project, ESP)給出了一種大數(shù)據(jù)時代下科學(xué)教育模式的推廣方案。
所謂數(shù)字科學(xué)家計劃,就是一種大數(shù)據(jù)環(huán)境下以提高每一位學(xué)生科學(xué)素養(yǎng)水平為宗旨,以探究式教學(xué)為鮮明特征,以科學(xué)思想、科學(xué)方法和數(shù)據(jù)挖掘方法為核心,播種未來科學(xué)家種子的教學(xué)模式的推廣方案。
數(shù)字科學(xué)家計劃主要有兩方面特征,其一,數(shù)字科學(xué)家是一種科學(xué)教育模式符號,以“科學(xué)家”符號將抽象的科學(xué)教育理念人物化和直觀化,即準確地表述了現(xiàn)代的科學(xué)教育理念,也便于師生理解與實施。榜樣的力量是無窮的,雖然科學(xué)不能解決人類所有的問題,但是科學(xué)家們?yōu)槲覀兎e累的知識、思想、方法、科學(xué)精神在過去和將來都是破解社會難題的重要途徑;其二,強調(diào)發(fā)揮大數(shù)據(jù)環(huán)境下第三種科學(xué)形態(tài)的育人功能,這是當(dāng)今科技與科學(xué)教育創(chuàng)新的重要切入點。
數(shù)字科學(xué)家的教學(xué)模式是在WebQuest(基于網(wǎng)絡(luò)的主題探究)模式的基礎(chǔ)上改造而成的。主要有以下五個模塊:(1)核心問題:WebQuest的核心是設(shè)置一個開放性的問題。這個問題設(shè)定了WebQuest的清晰目標,鼓勵學(xué)生回顧原先掌握的知識,激發(fā)學(xué)習(xí)者進一步探索的動機。(2)任務(wù)指南:提供一個“腳手架”,引導(dǎo)學(xué)生設(shè)計、經(jīng)歷和體驗專家的思維過程。“腳手架”將令人望而生畏的探究項目打碎成若干個片段,引導(dǎo)學(xué)生研究較為復(fù)雜的科學(xué)問題。(3)海量資源:創(chuàng)建一些到其他互聯(lián)網(wǎng)站點的鏈接來共享網(wǎng)絡(luò)資源。通過運用多樣化的互聯(lián)網(wǎng)資源,可以為不同學(xué)習(xí)水平或不同學(xué)習(xí)方式的學(xué)生提供信息資源。(4)實施“做中學(xué)”:要提供高層次的思維指南,體現(xiàn)“做中學(xué)”的教學(xué)理念,保證動腦和動手的教學(xué)方式落到實處。(5)交流與評價:WebQuest一般用量規(guī)提供了自我評估的標準,提示學(xué)生已經(jīng)學(xué)到了什么,并鼓勵把這種探究的經(jīng)驗擴展到其他領(lǐng)域。評價人員可以是教師,也可以是家長和同學(xué)。
數(shù)字科學(xué)家計劃產(chǎn)生于筆者主持的北京市教育科學(xué)“十一五”規(guī)劃課題《數(shù)字科學(xué)家計劃:基于數(shù)據(jù)探究理論的物理選修課程建設(shè)與研究》(2010年立項),已經(jīng)在北京景山學(xué)校、北京一零一中學(xué)、北京師范大學(xué)亞太實驗學(xué)校等學(xué)校展開實驗。該項目在課題階段探討了校本特色選修課程的建設(shè),但是隨著課題研究的深入開展,數(shù)字科學(xué)家計劃已經(jīng)不再局限于校本選修課程,開始運用到正規(guī)的物理課堂教學(xué);也不僅局限在物理學(xué)科教學(xué),已經(jīng)開始運用到小學(xué)高年級的科學(xué)課程與教學(xué);還不僅局限在學(xué)??茖W(xué)教學(xué),已經(jīng)開始運用于北京市東城區(qū)青少年科技館的科普性質(zhì)科學(xué)課程,并配合教學(xué),于2013年11月成功地舉辦了北京市東城區(qū)“數(shù)碼探科學(xué)”大賽。大賽令人耳目一新,引起了學(xué)者和教師的廣泛關(guān)注。著名教育家顧明遠先生在頒獎會上講到,這次大賽讓人們看到了大數(shù)據(jù)環(huán)境下的教學(xué)實踐,學(xué)生們在數(shù)碼探究中有模有樣,學(xué)到了科學(xué)思想、科學(xué)方法,體驗到了數(shù)碼探究的樂趣。
經(jīng)過三年的探索與實踐,數(shù)字科學(xué)家計劃已經(jīng)從課題研究轉(zhuǎn)向項目推廣的初期階段。初步建設(shè)了數(shù)字科學(xué)家網(wǎng)站,形成了一種大數(shù)據(jù)環(huán)境下的科學(xué)教育模式,也形成數(shù)字科學(xué)家課程的教師培訓(xùn)經(jīng)驗,還形成低、中、高端數(shù)字環(huán)境裝備下課程實施經(jīng)驗,已經(jīng)具備了在更大范圍試驗與推廣的條件。
數(shù)據(jù)探究理論——數(shù)字科學(xué)家計劃的基石
探討破解大數(shù)據(jù)時代的科學(xué)教育難題的途徑涉及大而復(fù)雜的社會問題,僅憑經(jīng)驗而沒有理論的指導(dǎo)是難以理解與完成的。但是數(shù)字科學(xué)家計劃已經(jīng)形成了一些基本的概念與教學(xué)原理。這些基本概念與教學(xué)原理構(gòu)成了所謂的數(shù)據(jù)探究理論。數(shù)據(jù)探究理論是數(shù)字科學(xué)家計劃的基石。
信息(Information)是數(shù)據(jù)探究理論的邏輯起點。何謂信息?這是一個復(fù)雜而神奇的概念,學(xué)者們有著不同的見解,美國數(shù)學(xué)家和控制論創(chuàng)始者維納不得已這樣定義信息:信息就是信息,既非物質(zhì),也非能量。筆者考慮到人的因素,對信息進行了如下的定義:信息既不是物質(zhì),也不是能量,而是物質(zhì)的波-粒二像性與人相互作用的存在形式。
數(shù)據(jù)(Data)是數(shù)據(jù)探究理論的另一個重要概念。數(shù)據(jù)是載荷或記錄信息而留下的明確印跡。數(shù)據(jù)可以是數(shù)字、文字、圖像、錄像,也可以是計算機代碼等。對數(shù)據(jù)背景的解讀是獲取意義的一種途徑。數(shù)據(jù)背景是接收者針對特定數(shù)據(jù)的意義準備,即當(dāng)接收者了解數(shù)據(jù)序列的規(guī)律,并知道每個數(shù)據(jù)或數(shù)據(jù)組合的指向性目標和含義時,便可以獲得數(shù)據(jù)所載荷的意義。觀察數(shù)據(jù)或者數(shù)據(jù)挖掘就是對數(shù)據(jù)背景的解讀過程。數(shù)字科學(xué)家計劃的核心環(huán)節(jié)在于信息觀測、數(shù)據(jù)挖掘和數(shù)據(jù)價值與交流。
李成剛說,我國已經(jīng)從網(wǎng)絡(luò)安全兼管、輿情監(jiān)控與引導(dǎo)入手,利用大數(shù)據(jù)實施網(wǎng)絡(luò)治理,開展網(wǎng)絡(luò)空間內(nèi)容監(jiān)管和應(yīng)急相應(yīng)平臺建設(shè)?!耙⒆阒腔鄢鞘薪ㄔO(shè),推進大數(shù)據(jù)安全應(yīng)用。建設(shè)對‘防御、監(jiān)測、評估、治理、運營’五位一體網(wǎng)絡(luò)安全治理能力?!?/p>
發(fā)展大數(shù)據(jù)
要同步構(gòu)建安全體系
360公司創(chuàng)始人兼總裁、360企業(yè)安全集團董事長齊向東表示,大數(shù)據(jù)技術(shù)是一把雙刃劍,在鼓勵發(fā)展的同時,一定要同步構(gòu)建大數(shù)據(jù)安全體系,要用大數(shù)據(jù)方法來解決大數(shù)據(jù)安全難題。
近來,大數(shù)據(jù)安全事件呈高發(fā)之勢。日前,廣東警方破獲一起高科技經(jīng)濟犯罪案件,17歲的“黑客”攻破了多個商業(yè)銀行網(wǎng)站,竊取了儲戶的身份證號、銀行卡號、支付密碼等數(shù)據(jù),帶領(lǐng)一批人在網(wǎng)上大肆盜刷別人的信用卡,涉案金額近15億元,涉及銀行49家。
類似的案例不勝枚舉。齊向東表示,當(dāng)前,接入互聯(lián)網(wǎng)的設(shè)備越多,網(wǎng)絡(luò)攻擊的發(fā)生機率就越高,網(wǎng)絡(luò)攻擊首先瞄準大數(shù)據(jù),攻擊造成大數(shù)據(jù)丟失、情報泄密和破壞網(wǎng)絡(luò)安全運行。大數(shù)據(jù)技術(shù)是一把雙刃劍,既可以造福社會、造福人民,又可以被一些人用來損害社會公共利益和民眾利益。如果不能很好地解決安全問題,就會影響發(fā)展。因此,各級政府在鼓勵發(fā)展大數(shù)據(jù)的同時,要同步考慮構(gòu)建大數(shù)據(jù)安全體系。
傳統(tǒng)安全思路
無法保障大數(shù)據(jù)安全
2016年年初,在全球最大規(guī)模的企業(yè)信息安全領(lǐng)域的會議RSA大會上,與會人員有一個基本共識,傳統(tǒng)的防護思路已經(jīng)無法保障網(wǎng)絡(luò)安全,用大數(shù)據(jù)的方法做安全是不爭的事實。
傳統(tǒng)網(wǎng)絡(luò)安全的防護思路是劃分邊界,將內(nèi)網(wǎng)外網(wǎng)分開、業(yè)務(wù)網(wǎng)和公眾網(wǎng)分離,用終端設(shè)備將潛在風(fēng)險隔離。通過在每個邊界設(shè)立網(wǎng)關(guān)設(shè)備和網(wǎng)絡(luò)流量設(shè)備,來守住“邊界”,以期解決安全問題。
但隨著移動互聯(lián)網(wǎng)、云服務(wù)的出現(xiàn),移動終端在4G信號、WiFi信號、電纜之間穿梭,網(wǎng)絡(luò)邊界實際上已經(jīng)消亡了。
但網(wǎng)絡(luò)攻擊者以“分鐘級”千變?nèi)f化。齊向東說:“360安全中心每天發(fā)現(xiàn)木馬樣本近千萬個,每天發(fā)現(xiàn)的各種軟硬件漏洞、網(wǎng)站漏洞超過120個,每一個木馬每一個漏洞,都可能攻破預(yù)先部署的安全設(shè)備和安全軟件。”他認為,現(xiàn)在要保障大數(shù)據(jù)安全,最重要的是要“看得見、管得住”。通俗的說,就是要能在被攻擊的時候,能夠看見在被誰攻擊、如何被攻擊;還要能在被攻擊的時候,管住核心數(shù)據(jù)資產(chǎn)的安全,黑客就算進得來,但是帶不走。
數(shù)據(jù)驅(qū)動安全
臺達電子作為一家在世界各地都有銷售網(wǎng)點、生產(chǎn)設(shè)備及研發(fā)中心的企業(yè),需要擁有高度計算機化的系統(tǒng)以有效處理全球業(yè)務(wù)。為保護企業(yè)資源規(guī)劃(ERP)、電子郵件服務(wù)器、網(wǎng)頁服務(wù)器和其他各種應(yīng)用程序服務(wù)器等各種重要系統(tǒng)及 IT 應(yīng)用,數(shù)據(jù)中心基礎(chǔ)設(shè)施的可靠度是優(yōu)先的考慮因素。
此外,可能更重要的是,臺達電子決心基于“Smarter, Greener, Together 共創(chuàng)智能綠生活”的理念,打造一個年平均電源使用效率(PUE)低于 1.43 的新機房,以符合Green Grid聯(lián)盟所定義機房效率的黃金級標準。
新建成的數(shù)據(jù)中心占地約230平方米,分為冷通道封閉區(qū)A/B和熱通道封閉區(qū)C/D,共有63套機柜,計劃在5年內(nèi)達到240kW~280kW 的IT設(shè)備容量。另有獨立房間儲放兩套UPS及多組電池柜。用于顯示臺達InfraSuite Manager數(shù)據(jù)中心基礎(chǔ)設(shè)施管理系統(tǒng)、IT設(shè)備使用率和實時視訊監(jiān)控的2x3 LCD 液晶面板電視墻,可實時、充分地對數(shù)據(jù)中心能耗進行監(jiān)控并管理機房設(shè)備。
針對新數(shù)據(jù)中心的改造,臺達電子從空調(diào)系統(tǒng)、電源、機柜、環(huán)境管理系統(tǒng)四大方面入手,具體方案包括:
一、空調(diào)系統(tǒng)
諸多因素使得兩個舊機房每年耗費大量電力。舊數(shù)據(jù)中心的PUE值高達 2.01,即每 1kW 的 IT 設(shè)備功率消耗,需要等量的非 IT 功率消耗來冷卻。新的數(shù)據(jù)中心為大幅度提高能效達成 PUE 1.43 以下的目標,臺達電子采取下列六大對策:
1.冷/熱通道封閉及 RowCool 系列機柜式精密空調(diào)的應(yīng)用
冷/熱通道封閉設(shè)計方案,可避免冷熱空氣混合,提高冷卻效率。搭配貼近熱源的臺達RowCool系列機柜式精密空調(diào)的應(yīng)用,可以有效移除熱點,避免IT設(shè)備過熱導(dǎo)致宕機。
2.冷凍水式空調(diào)系統(tǒng)
相較于傳統(tǒng)氣冷式空調(diào)系統(tǒng),冷凍水式空調(diào)系統(tǒng)可節(jié)能三成,以 40RT(冷凍噸)的系統(tǒng)為例,能耗可從 1.25kW/RT 降到0.89kW/RT。
3.變頻 HVAC(高壓直流)系統(tǒng)
RowCool系列機柜式精密空調(diào)的連續(xù)可調(diào)式風(fēng)扇轉(zhuǎn)速和水量控制有助于大幅度節(jié)能,風(fēng)扇速度降低一成,估計可節(jié)能27%。RowCool 系統(tǒng)中直流風(fēng)扇及室外機組皆采用變頻技術(shù)。冷卻水塔的風(fēng)扇采用可變氣流量控制,冰水主機和冷凝水泵浦則采用可變水流量控制。
4.自然冷卻Free Cooling(空氣側(cè)及水側(cè))
在臺北市的天候狀況下,一年里有46%的時間可采用自然冷卻。溫度低于25℃時,空氣側(cè)自然冷卻自動啟動,將外部冷空氣導(dǎo)入機房,并將 RowCool機組、泵浦、冷卻水塔及冰水機組關(guān)機。溫度低于15℃時,水側(cè)熱交換器及冷卻水塔自然冷卻系統(tǒng)啟動,機房冰水機組則關(guān)機降低能耗。
5.數(shù)據(jù)中心與大樓冰水主機智能同步
臺達電子的臺北總部大樓獲認證為“鉆石級綠建筑”,能耗較一般辦公大樓低58%。大樓本身配備兩套冰水主機系統(tǒng):
數(shù)據(jù)中心冰水機組日間關(guān)機,使用大樓高效率冰水主機。夜間數(shù)據(jù)中心冰水主機開機,為數(shù)據(jù)中心提供冷氣。數(shù)據(jù)中心空調(diào)系統(tǒng)與大樓空調(diào)系統(tǒng)智能同步,將節(jié)能效果發(fā)揮到極致。
6.最佳機房溫度設(shè)定
按國際標準的建議值,數(shù)據(jù)中心溫度變化范圍在18~27℃及20~25℃之間。數(shù)據(jù)中心溫度一般雖然設(shè)定在符合建議范圍的18~20℃之間,但仍有改善空間。
粗略估計,數(shù)據(jù)中心溫度每升高一度可帶來2%~3%的節(jié)能。依此規(guī)則,如把冷信道的溫度從18~20℃ 提高到 25℃,數(shù)據(jù)中心可節(jié)能10%~14%。此外,RowCool系列機柜式精密空調(diào)的入水溫度也可提高進一步節(jié)能,通常的做法是將冰水入水溫度設(shè)定在7℃,如果提高到 13℃,數(shù)據(jù)中心可節(jié)能20%。
除空調(diào)系統(tǒng)外,臺達數(shù)據(jù)中心整體基礎(chǔ)設(shè)施解決方案還應(yīng)用到高效率電源系統(tǒng)、模塊化機柜及數(shù)據(jù)中心環(huán)境管理系統(tǒng),使整個數(shù)據(jù)中心各方面都達到綠色節(jié)能。
二、UPS電源系統(tǒng)
數(shù)據(jù)中心對可靠度、效率及擴充性的要求,對UPS電源系統(tǒng)是極大的挑戰(zhàn)。新數(shù)據(jù)中心所采用的臺達Modulon DPH 系列 UPS,是新一代全模塊化、可熱插入、AC-AC 效率達96% 的高性能UPS,其熱插入電源模塊可支持數(shù)據(jù)中心從中長期的無縫升級。臺達電子的 PDC 及 PDU 也采用模塊化設(shè)計,例如,其輸出斷路器可熱插入、兩組配電盤各可擴充達 42 組斷路器。PDC 及 PDU具備優(yōu)異的電源保護及監(jiān)控能力,其彈性及擴充性可配合實際的配電需求。
三、機柜及配件
氣流管理對于配備中高功率密度機柜的機房極為重要。臺達電子的臺北總部新機房長期規(guī)劃機柜功率密度可達10kVA~15kVA。模塊化機柜的開孔率達70%以上,可滿足高密度IT機房的需求。機柜具有高承載力,靜態(tài)承重達1420kg或動態(tài)承重達1000kg,不占太多寶貴的機房空間。
四、環(huán)境管理系統(tǒng)
臺達數(shù)據(jù)中心管理系統(tǒng)(DCIM)系統(tǒng)的 InfraSuite Manager,整合各種設(shè)施及 IT 設(shè)備于單一平臺。環(huán)境監(jiān)測器(EnviroProbe)搭配中央監(jiān)測站(EnviroStation)可以對能源、電力系統(tǒng)、空調(diào)、環(huán)境、保全、資產(chǎn)、服務(wù)器監(jiān)控等各種裝置,進行無縫、實時及完整的管理。PUE歷史紀錄可協(xié)助 IT 管理人員,分析及了解機房電源使用的效率。
總之,這座采用多種綠色空調(diào)、電源、機柜解決方案的節(jié)能數(shù)據(jù)中心已經(jīng)改造完成并正式投入使用,可望達成以下節(jié)能效益:
Sybase公司是數(shù)據(jù)管理、分析、移動訊息和企業(yè)移動領(lǐng)域的市場領(lǐng)導(dǎo)者,目前3.4萬個企業(yè)客戶及財富百強中的91個客戶信賴并使用Sybase產(chǎn)品。從1984年涉足企業(yè)級軟件至今,公司共獲得148個數(shù)據(jù)管理與移動方面的專利,目前尚有185個專利在申請中。公司目前有4000多名雇員分布在60個國家。2007年,Sybase公司收入超過10億美元,2008年繼續(xù)增長了10%。在2008年的年度報告中,Sybase持有6.4億美元的現(xiàn)金。
Sybase贏得了遍及世界各地的忠誠客戶群,公司在金融服務(wù)、通信、制造和政府部門等主要垂直市場處于領(lǐng)先地位。全球排名前25家銀行中的24家、全球排名前50家銀行及證券機構(gòu)的46家,都信賴并使用Sybase技術(shù)來進行當(dāng)天的風(fēng)險分析。每天,Sybase處理著幾十萬條從華爾街到東京、從香港到倫敦的實時金融交易數(shù)據(jù)。
通信行業(yè)也正在大量使用Sybase的移動服務(wù),通過700多家移動運營商連接30多億個用戶,每年發(fā)送的信息達2000多億條。利用Sybase公司的數(shù)據(jù)管理解決方案,處理著數(shù)十億條的通話記錄事務(wù)。在政府機構(gòu),職能部門利用Sybase解決方案移動化了供應(yīng)管理系統(tǒng),秒間訪問數(shù)百萬條記錄,進行復(fù)雜分析,并安全管理關(guān)鍵數(shù)據(jù)資產(chǎn)。
在零售市場,百貨商場使用Sybase企業(yè)移動解決方案來改善顧客的購物體驗、管理收銀系統(tǒng),并在企業(yè)的后端與商場零售點之間提供數(shù)據(jù)的實時同步。
在信息領(lǐng)域, Sybase是全球領(lǐng)先的信息管理、分析和移動化的軟件公司,無論這些信息是在何種系統(tǒng)、網(wǎng)絡(luò)和設(shè)備上。
Sybase在中國
Sybase于1991年12月進入中國,并于1993年成立賽貝斯軟件(中國) 有限公司。秉承“用戶第一,市場第二;服務(wù)第一,銷售第二”的市場發(fā)展策略,Sybase與用戶共擔(dān)風(fēng)險,共同前進,穩(wěn)步發(fā)展。如今,Sybase在中國的員工總數(shù)已近500人,成為Sybase全球發(fā)展最快的海外分支機構(gòu)之一。為了更好地給國內(nèi)用戶提供一流的技術(shù)支持和服務(wù),Sybase已在上海、廣州、成都等地設(shè)立了分公司,在北京、上海、西安建立研發(fā)中心,合作伙伴遍布全國各地。
依靠先進而實用的技術(shù)和完善的服務(wù),Sybase不斷在中國贏得新的客戶,這些客戶遍及金融行業(yè)、電信行業(yè)、政府、交通及能源工業(yè)等行業(yè),數(shù)量將近2000家。
經(jīng)過十余載在中國市場不懈的耕耘和努力,Sybase的技術(shù)與服務(wù)贏得了業(yè)界的贊譽和用戶的認可,于2007年8月榮膺中國電子信息產(chǎn)業(yè)發(fā)展研究院、中國信息化推進聯(lián)盟頒發(fā)的中國“IT服務(wù)十年成就獎”。Sybase的技術(shù)與服務(wù)在中國軟件市場的雙重優(yōu)勢地位得到了進一步鞏固和印證。
完善的解決方案
1. 數(shù)據(jù)管理
許多公司花費數(shù)百萬美元管理關(guān)鍵信息。隨著企業(yè)信息量增加,成本和復(fù)雜性也開始飚升。更重要的是,許多公司信息是通過硬連線方式接入信息孤島的。信息被囚困于這樣的孤島上,很難在動態(tài)的業(yè)務(wù)流程中被訪問和利用。Sybase公司的信息管理產(chǎn)品能夠幫助用戶管理復(fù)雜的信息,并沖破此類內(nèi)部障礙,從而保證信息在利用及相關(guān)性方面的一致性,并可隨時提供經(jīng)濟價值。
從推出第一個C/S架構(gòu)上的分布式數(shù)據(jù)庫服務(wù)器開始,大到數(shù)據(jù)倉庫引擎,小到移動數(shù)據(jù)庫,Sybase憑借領(lǐng)先的技術(shù)優(yōu)勢,結(jié)合用戶的應(yīng)用模式和需求,推出了適合各種各樣的數(shù)據(jù)管理的解決方案,主要包括Sybase Adaptive Server Enterprise、Sybase ASE 集群版、Replication Server 、Sybase Mirror Activator以及Sybase Real-Time Data Services等。
Sybase的數(shù)據(jù)管理以“Always Available”(永遠可用)信息體系結(jié)構(gòu)為基礎(chǔ),通過可靠、安全和高效的工具,能夠幫助企業(yè)更好地管理信息,更能夠幫助企業(yè)從阻礙生產(chǎn)力和效率的傳統(tǒng)技術(shù)的羈絆中解放信息。
2. 商務(wù)智能
Sybase商業(yè)智能(BusinessIntelligence)致力于為 新一代商業(yè)智能提供核心的解決方案。SybaseBI部門所提供的軟件產(chǎn)品與專業(yè)服務(wù)將數(shù)據(jù)轉(zhuǎn)化為信息、知識與智慧,以使企業(yè)提高市場份額、減少客戶流失、向已有客戶進行衍生銷售等。BI部門與其他領(lǐng)先的商業(yè)智能供應(yīng)商締結(jié)合作伙伴關(guān)系,為各類行業(yè)市場提供完整的商業(yè)智能解決方案,包括金融服務(wù)、信用卡市場、保險、銀行、通信以及互聯(lián)網(wǎng)等。
Sybase IQ是全球領(lǐng)先的、基于列的分析服務(wù)器,它提供了最智能的方法,使企業(yè)能夠通過分析,把原始數(shù)據(jù)變成可付諸行動的措施,從而增加收入、擴大客戶群和提高利潤。Sybase IQ是唯一能夠基于企業(yè)的全部信息,按照任意條件,面向所有用戶,提供更快速、更準確分析的分析服務(wù)器。憑借基于列的核心架構(gòu)和創(chuàng)新功能,Sybase IQ從多個層面提供了靈活性和可擴展性,能夠為最大的數(shù)據(jù)集、最為復(fù)雜的分析任務(wù)以及快速增長的BI用戶群,提供非凡的查詢性能。
Sybase RAP(風(fēng)險分析平臺)是為資本市場公司設(shè)計的新一代數(shù)據(jù)服務(wù)技術(shù)平臺,既可以管理海量數(shù)據(jù),又提供實時數(shù)據(jù)分析所需的速度。它可使資本市場公司及時全面地洞察市場風(fēng)云,作出更好的低風(fēng)險的交易和組合投資決策。美國航空、德意志銀行等不同客戶都已成功地將數(shù)據(jù)轉(zhuǎn)換為利潤,它們共同的特點就是使用Sybase信息流動解決方案。
Sybase 列式數(shù)據(jù)庫機(Analytic Appliance)是一個集成的解決方案,專門用于高性能和 TB數(shù)量級的分析。Sybase列式數(shù)據(jù)庫機結(jié)合各類領(lǐng)先的技術(shù),包括 Sybase IQ、Sybase PowerDesigner、IBM Power Systems 和 MicroStrategy。它除了擁有所有量身定制的數(shù)據(jù)倉庫功能外,還具有簡單、快捷和經(jīng)濟實惠的特點。
3. 移動商務(wù)
顯而易見,移動時代已經(jīng)來臨了。然而,許多企業(yè)仍在苦苦尋覓如何以最佳方式面向移動性重構(gòu)自身。您所需要的移動解決方案應(yīng)當(dāng)能夠隨時隨地將您的企業(yè)系統(tǒng)擴展至移動用戶,以保持競爭優(yōu)勢。Sybase及其iAnywhere子公司在移動數(shù)據(jù)庫和 移動中間件市場上占有最大的市場份額,而且,我們的移動服務(wù)擁有數(shù)十億以上的注冊用戶,目前位居全球規(guī)模最大的移動應(yīng)用之列。
Sybase Unwired Platform 是 Sybase 新一代支持企業(yè)實現(xiàn)應(yīng)用程序移動化的體系架構(gòu)。它提供一系列全面的服務(wù),幫助企業(yè)將適當(dāng)?shù)臄?shù)據(jù)和業(yè)務(wù)流程移動化到任何移動設(shè)備上。Sybase Unwired Platform利用一個綜合平臺,將 4GL 工具和標準開發(fā)環(huán)境集成而支持的快速開發(fā)、異構(gòu)設(shè)備部署和市場領(lǐng)先的設(shè)備管理技術(shù)結(jié)合起來,從而滿足企業(yè)的所有移動應(yīng)用需求。而且,它通過推動企業(yè)戰(zhàn)略化的移動部署,而非采用小規(guī)?;蚓植恳苿討?yīng)用的方法,從而極大地降低了企業(yè)的總擁有成本。
iAnywhere Mobile Office強大而靈活的解決方案能安全地將電子郵件和業(yè)務(wù)流程擴展至移動工作人員的手中。她將對眾多基礎(chǔ)架構(gòu)的支持、高度的設(shè)備安全性、可用性和高性能集成在一起。
SQL Anywhere所提供的數(shù)據(jù)管理和數(shù)據(jù)交換技術(shù),使企業(yè)能快速開發(fā)和部署基于數(shù)據(jù)庫的應(yīng)用。為企業(yè)量身訂制的SQL Anywhere數(shù)據(jù)庫大可支持到數(shù)千用戶在64位的服務(wù)器上使用,小可部署到精致的手持設(shè)備上。SQL Anywhere的數(shù)據(jù)交換技術(shù)將企業(yè)應(yīng)用和企業(yè)系統(tǒng)的信息拓展到運行著前端關(guān)鍵業(yè)務(wù)的數(shù)據(jù)庫中。
大數(shù)據(jù)不一定是復(fù)雜的分析
許多人一提到大數(shù)據(jù),首先想到的是復(fù)雜的數(shù)據(jù)分析。這讓有些希望采用大數(shù)據(jù)分析工具的用戶產(chǎn)生了畏難情緒,也讓有些用戶產(chǎn)生了誤解,認為大數(shù)據(jù)分析只是那些擁有復(fù)雜業(yè)務(wù)流程和海量數(shù)據(jù)的大企業(yè)的事。市場研究機構(gòu)麥肯錫的研究人員表示:“要創(chuàng)造新的重大價值,并不一定要采用復(fù)雜的大數(shù)據(jù)分析方法,有時只要能保證數(shù)據(jù)的可用性或?qū)?shù)據(jù)應(yīng)用進行基本的分析,就能獲得所需的重要價值?!?/p>
不同的企業(yè)或一個企業(yè)內(nèi)部不同的部門對數(shù)據(jù)分析和數(shù)據(jù)價值的理解都不相同。企業(yè)處于不同的信息化發(fā)展階段,也會設(shè)定不同的數(shù)據(jù)分析目標,采用不同的數(shù)據(jù)分析工具。正是基于此,戴爾率先提出了大數(shù)據(jù)成熟度模型。戴爾公司全球企業(yè)級解決方案副總裁Cheryl Cook表示:“這一模型已經(jīng)得到了業(yè)內(nèi)許多分析機構(gòu)的認可。所有行業(yè)以及所有數(shù)據(jù)應(yīng)用都適用于此模型?!?/p>
如下圖所示,大數(shù)據(jù)成熟度模型分成五個階段。第一個階段,數(shù)據(jù)處于混亂狀態(tài),數(shù)據(jù)存儲無章可循,數(shù)據(jù)難以訪問,企業(yè)的信息系統(tǒng)處于高風(fēng)險狀態(tài)。第二個階段,實現(xiàn)數(shù)據(jù)的保留。在這個階段,企業(yè)被動地對數(shù)據(jù)進行存儲。數(shù)據(jù)雖然經(jīng)過一定的處理,但還不具有高質(zhì)量,數(shù)據(jù)的訪問也會受到一定限制。第三個階段,實現(xiàn)存儲的優(yōu)化。在這個階段,通過對存儲系統(tǒng)的進一步優(yōu)化以及基于策略的控制與管理,用戶可以逐步發(fā)現(xiàn)數(shù)據(jù)的價值。第四個階段,實現(xiàn)簡單的分析。在存儲優(yōu)化的基礎(chǔ)上,用戶可以進行數(shù)據(jù)建模和簡單的數(shù)據(jù)分析,對歸檔數(shù)據(jù)進行搜索等。第五個階段,實現(xiàn)復(fù)雜的分析。在這個階段,大數(shù)據(jù)分析工具將得到充分應(yīng)用,用戶可以進行比較復(fù)雜的建模、分析和決策。經(jīng)過上述五個階段,曾經(jīng)雜亂無章的數(shù)據(jù)也將經(jīng)歷從數(shù)據(jù)到信息再到知識的轉(zhuǎn)變過程,最終成為企業(yè)決策的重要依據(jù)。
這個大數(shù)據(jù)成熟度模型可以解答人們對于大數(shù)據(jù)應(yīng)用的幾個疑惑。第一,用戶使用大數(shù)據(jù)分析工具,并不意味著一定要進行復(fù)雜的分析。舉例來說,處于存儲優(yōu)化階段的用戶就可以實現(xiàn)無障礙的數(shù)據(jù)訪問,并能獲得所需的數(shù)據(jù)價值。第二,大數(shù)據(jù)的應(yīng)用要經(jīng)歷一個逐步完善的過程,必須循序漸進,先做好數(shù)據(jù)存儲和優(yōu)化,然后再進行數(shù)據(jù)分析。第三,大數(shù)據(jù)解決方案通常包括兩個部分:一是大數(shù)據(jù)保留解決方案,二是大數(shù)據(jù)分析解決方案。將兩類解決方案有機地結(jié)合在一起,才能有效降低大數(shù)據(jù)分析應(yīng)用的成本,更好地挖掘數(shù)據(jù)的價值。Cheryl Cook表示,戴爾可以提供上述兩種解決方案。一方面,戴爾可以提供針對結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的大數(shù)據(jù)保留解決方案,主要包括存儲虛擬化與整合、應(yīng)用程序優(yōu)化、數(shù)據(jù)保護、災(zāi)難恢復(fù)以及數(shù)據(jù)保留與管理解決方案;另一方面,戴爾還能提供支持Hadoop、Cloudera等開源軟件的大數(shù)據(jù)分析解決方案。
記者曾與包括大慶油田、太平洋保險公司等在內(nèi)的一些用戶進行過交流。它們目前都沒有計劃部署大數(shù)據(jù)應(yīng)用。“從全球范圍來看,大數(shù)據(jù)應(yīng)用還處于起步階段。”戴爾亞太及日本地區(qū)商用事業(yè)部企業(yè)解決方案副總裁Philip A. Davis表示,“與云計算興起時一樣,可能要經(jīng)過兩三年的市場培育,用戶才能逐漸接受大數(shù)據(jù)應(yīng)用?!?/p>
中國東方航空股份有限公司信息部總經(jīng)理嚴振紅介紹說:“在大數(shù)據(jù)的概念出現(xiàn)以前,我們就在做客戶數(shù)據(jù)、經(jīng)營數(shù)據(jù)的分析工作。但是客戶數(shù)據(jù)庫、經(jīng)營數(shù)據(jù)庫等都是相互獨立的,數(shù)據(jù)不能共享?,F(xiàn)在,我們要做的是將這些系統(tǒng)的數(shù)據(jù)整合起來,統(tǒng)一進行分析。”
Hadoop不是萬能的
簡單來說,Hadoop是一個能夠?qū)Υ罅繑?shù)據(jù)進行分布式處理的軟件框架。Hadoop最獨特的優(yōu)勢在于為用戶提供了一個分布式的、高容錯的文件系統(tǒng)和加速數(shù)據(jù)處理的辦法。隨著Web 2.0、社交網(wǎng)站的大規(guī)模興起,人們需要一個高效的處理非結(jié)構(gòu)化數(shù)據(jù)的平臺。Hadoop正好可以滿足人們的需求。有些人甚至在Hadoop和大數(shù)據(jù)之間劃上了等號。Hadoop能夠解決大數(shù)據(jù)應(yīng)用的所有難題嗎?
“Hadoop是一個復(fù)雜的工具套件。如果沒有廠商或?qū)I(yè)技術(shù)人員的幫助,用戶自己部署Hadoop是一件十分困難的事。目前,Hadoop的應(yīng)用并不普及?;ヂ?lián)網(wǎng)用戶是最早采用Hadoop平臺的?!盤hilip A.Davis表示,“如果想讓大數(shù)據(jù)解決方案充分發(fā)揮其作用,就必須搭建一個高效的信息基礎(chǔ)架構(gòu),實現(xiàn)信息基礎(chǔ)架構(gòu)的自動化、智能化,同時提高其可管理性?!?/p>
Hadoop的應(yīng)用是有一定技術(shù)門檻的。如今,許多IT廠商都推出了基于Hadoop的解決方案包,其目的是幫助用戶簡化Hadoop的部署與應(yīng)用。Philip A.Davis表示:“戴爾提供的基于Hadoop的大數(shù)據(jù)分析方案可以將Hadoop的部署周期從原來的兩個月縮短至兩天?!?/p>
VMware全球高級副總裁范承工也認為,由于缺少精通Hadoop技術(shù)的專業(yè)人才,Hadoop的部署對于用戶來說是一件費時費力的事。如今,VMware可以將Hadoop部署在虛擬化架構(gòu)之上,將部署工作從半自動化變?yōu)槿詣踊?,從而減少了人工干預(yù),使得Hadoop的部署變得更加簡單,也不容易出錯。
“很多中國企業(yè)的CIO認為,大數(shù)據(jù)解決方案是有價值的,但實施起來確實有許多困難?!贝鳡柸蚋笨偛?、中國區(qū)大型企業(yè)及公共事業(yè)部總經(jīng)理容永康舉例說,“國內(nèi)懂得在Hadoop上進行開發(fā)的專業(yè)技術(shù)人員非常少。一些金融行業(yè)的用戶很想現(xiàn)在就部署大數(shù)據(jù)解決方案,但是苦于找不到既懂Hadoop技術(shù),又懂得金融業(yè)務(wù)的專業(yè)人才?!?/p>
Informatica首席技術(shù)官James Markarian表示:“在IT環(huán)境中,Hadoop不可能作為一個孤島存在。為了讓Hadoop跨越不同平臺,用戶需要將Hadoop作為其IT大環(huán)境中的一部分來管理,并通過Hadoop重復(fù)使用他們的開發(fā)技巧、資產(chǎn)及數(shù)據(jù),同時還要統(tǒng)籌管理全部數(shù)據(jù)?!?/p>
在美國市場上,70%的大數(shù)據(jù)應(yīng)用處理的還是結(jié)構(gòu)化的數(shù)據(jù)。從技術(shù)的角度看,雖然Hadoop也能處理結(jié)構(gòu)化的數(shù)據(jù),但是目前基于Hadoop的大數(shù)據(jù)分析解決方案主要還是用于處理非結(jié)構(gòu)化的數(shù)據(jù)。因此,用戶處理結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)通常是用兩套不同的分析工具。這種混合的大數(shù)據(jù)處理模式是一種普遍現(xiàn)象。
從未來的發(fā)展看,非結(jié)構(gòu)化數(shù)據(jù)的快速增長是大數(shù)據(jù)分析的主要驅(qū)動因素。從這個角度講,Hadoop的應(yīng)用前景還是十分廣闊的。
在云計算、大數(shù)據(jù)時代,企業(yè)更需要以互聯(lián)網(wǎng)的思維方式構(gòu)建面向未來的分布式應(yīng)用,這就需要一個全新的技術(shù)架構(gòu)。從這個角度說,F(xiàn)usionCube融合一體機解決方案與面向大數(shù)據(jù)應(yīng)用的SAP HANA相得益彰。
“SAP HANA是一個能夠充分挖掘和體現(xiàn)大數(shù)據(jù)價值的解決方案。與傳統(tǒng)的數(shù)據(jù)分析、商業(yè)智能解決方案不同,SAP HANA提供了一整套模型和工具,可以通過對大數(shù)據(jù)的分析預(yù)測未來的業(yè)務(wù)發(fā)展,給企業(yè)帶來新的商機。”任志鵬分析說,“針對SAP HANA,華為提供了一個創(chuàng)新的技術(shù)平臺FusionCube,將計算、存儲、網(wǎng)絡(luò)有機地結(jié)合在一起,并融合了華為分布式存儲引擎以及云管理軟件,使得大數(shù)據(jù)的實時分析與處理可以達到更高的水平?!痹赥PC-H測試中,華為FusionCube 刷新了基于Sybase IQ的集群性能世界記錄,充分展示了其融合架構(gòu)帶來的性能優(yōu)勢。
大規(guī)模定制是云計算、大數(shù)據(jù)時代的一個典型特征。許多企業(yè)客戶都需要廠商提供基于其個性化需求定制的解決方案。今天,針對不同企業(yè)的不同需求,華為提供了支持單節(jié)點HANA的RH5885方案和多節(jié)點HANA的FusionCube方案。任志鵬介紹說:“SAP HANA對基礎(chǔ)設(shè)施有很嚴格的要求。華為FusionCube for HANA一體機具備更快的同步寫性能、更低延時和更高的讀寫帶寬,以及很好的線性擴展能力。FusionCube可實現(xiàn)一站式交付、家電化安裝,并能按需靈活擴展應(yīng)用,運維非常簡單?!?/p>
華為FusionCube for HANA一體機已經(jīng)在許多行業(yè)得到了應(yīng)用。以金融行業(yè)為例,F(xiàn)usionCube for HANA在包括銀行小微貸項目等在內(nèi)的新興業(yè)務(wù)中得到了成功應(yīng)用。華為內(nèi)部還成立了一支技術(shù)團隊,專門負責(zé)支持SAP HANA。
交付“三位一體”
華為進軍IT領(lǐng)域后始終堅持“被集成”的策略。因此在IT解決方案的推廣過程中,華為與集成商、分銷商一直保持緊密合作。華為FusionCube for HANA一體機就是通過富通集團在中國市場上進行銷售的?!叭A為、SAP與富通集團基于FusionCube for HANA實現(xiàn)了三位一體的交付。”任志鵬表示。
“x86+Hadoop”被認為是承載大數(shù)據(jù)應(yīng)用的主流平臺,其開發(fā)和應(yīng)用生態(tài)系統(tǒng)已經(jīng)得到了市場的驗證,但這并不意味著大數(shù)據(jù)基礎(chǔ)平臺會呈現(xiàn)一種架構(gòu)“通吃”的局面。
在IBM看來,Power平臺是構(gòu)建大數(shù)據(jù)應(yīng)用的一把“利器”?!按髷?shù)據(jù)是一個跨行業(yè)的需求,不僅在互聯(lián)網(wǎng)公司,傳統(tǒng)企業(yè)客戶,像金融、政府、電信等行業(yè)也有非常多的有關(guān)大數(shù)據(jù)的應(yīng)用?!?IBM大中華區(qū)副總裁及系統(tǒng)與科技部Power Systems總經(jīng)理侯淼表示,“Power平臺所具有的大內(nèi)存、大Cache、多線程等技術(shù)特征,使之非常符合大數(shù)據(jù)的應(yīng)用需求。”
數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、業(yè)務(wù)數(shù)據(jù)庫,這些都是Power平臺傳統(tǒng)的優(yōu)勢領(lǐng)域。在IBM系統(tǒng)與科技部大中華區(qū)Power Systems產(chǎn)品總監(jiān)李紅看來,這些既有優(yōu)勢為Power平臺在大數(shù)據(jù)領(lǐng)域的應(yīng)用奠定了基礎(chǔ)。
“首先,大數(shù)據(jù)應(yīng)用需要與既有系統(tǒng)進行平滑、無縫的連接和交互。在此基礎(chǔ)上,Power平臺可以拓展新的需求,例如開源的非結(jié)構(gòu)化數(shù)據(jù)、流數(shù)據(jù)的分析等,都可以集成到新的需求中去。在這個過程中,傳統(tǒng)方案需要和新方案實現(xiàn)很好的整合,Power平臺的價值進一步得到體現(xiàn)。此外,軟件生態(tài)系統(tǒng)至關(guān)重要,對軟件以及并發(fā)處理等場景的廣泛支持(包括DB2、GPFS等)使基于Power的解決方案具備更多優(yōu)勢。”李紅告訴記者。
面向數(shù)據(jù)類型的解決方案
多樣性是大數(shù)據(jù)的一個典型特征,在IBM看來,面向不同大數(shù)據(jù)類型,大數(shù)據(jù)應(yīng)用可分為靜態(tài)批量大數(shù)據(jù)處理、實時大數(shù)據(jù)處理、數(shù)據(jù)倉庫整合、數(shù)據(jù)集市構(gòu)建四類,IBM面向這四類應(yīng)用都有專門的解決方案?!耙詳?shù)據(jù)倉庫應(yīng)用為基礎(chǔ),發(fā)展出了新的大數(shù)據(jù)應(yīng)用場景和需求,例如靜態(tài)數(shù)據(jù)的批處理、流數(shù)據(jù)的實時分析等。 IBM的思路是提供整合的解決方案,幫助用戶最終獲得完整的數(shù)據(jù)價值。”李紅表示。
在靜態(tài)大數(shù)據(jù)解決方案中,Power可支持Open Hadoop、 BigInsights、 Symphony 等大數(shù)據(jù)解決方案,并能夠與傳統(tǒng)數(shù)據(jù)倉庫系統(tǒng)無縫集成。李紅解釋說:“Symphony專門面向計算密集型大數(shù)據(jù)應(yīng)用,BigInsight在Hadoop框架上增加了安全管理、工作流等特性,并融入了IBM獨特的數(shù)據(jù)分析、機器學(xué)習(xí)和文本數(shù)據(jù)分析挖掘等技術(shù)?!?/p>