您的位置:首頁 > 資訊 > 行業(yè)動態(tài) > 正文

喚醒“沉睡”的大數(shù)據(jù)

2017-04-05 06:47 性質(zhì):轉載 作者:龍為科技 來源:龍為科技
免責聲明:中叉網(wǎng)(zulingongsi.com.cn)尊重合法版權,反對侵權盜版。(凡是我網(wǎng)所轉載之文章,文中所有文字內(nèi)容和圖片視頻之知識產(chǎn)權均系原作者和機構所有。文章內(nèi)容觀點,與本網(wǎng)無關。如有需要刪除,敬請來電商榷?。?/div>
據(jù)中國信息通信研究院發(fā)布的《大數(shù)據(jù)白皮書(2016)》分析,未來五年,全球數(shù)據(jù)量將呈指數(shù)級增長。但龐大的總量卻并不意味著完全有效的開...

  據(jù)中國信息通信研究院發(fā)布的《大數(shù)據(jù)白皮書(2016)》分析,未來五年,全球數(shù)據(jù)量將呈指數(shù)級增長。但龐大的總量卻并不意味著完全有效的開發(fā)利用。記者采訪了解到,除了技術瓶頸外,開放和合作的障礙正在讓大量數(shù)據(jù)陷入“沉睡”。數(shù)據(jù)原材料的缺乏與信息“孤島”的形成,嚴重制約著大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。

阿里 馬云:數(shù)博會 大數(shù)據(jù)
全球大數(shù)據(jù)應用論壇:大數(shù)據(jù)時代的產(chǎn)業(yè)深度創(chuàng)新

  對于“大數(shù)據(jù)”(Big data)研究機構Gartner給出了這樣的定義。“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應海量、高增長率和多樣化的信息資產(chǎn)。

  麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉、多樣的數(shù)據(jù)類型和價值密度低四大特征。

  大數(shù)據(jù)技術的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。換而言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。

  從技術上看,大數(shù)據(jù)與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無法用單臺的計算機進行處理,必須采用分布式架構。它的特色在于對海量數(shù)據(jù)進行分布式數(shù)據(jù)挖掘。但它必須依托云計算的分布式處理、分布式數(shù)據(jù)庫和云存儲、虛擬化技術。

  隨著云時代的來臨,大數(shù)據(jù)(Big data)也吸引了越來越多的關注。分析師團隊認為,大數(shù)據(jù)(Big data)通常用來形容一個公司創(chuàng)造的大量非結構化數(shù)據(jù)和半結構化數(shù)據(jù),這些數(shù)據(jù)在下載到關系型數(shù)據(jù)庫用于分析時會花費過多時間和金錢。大數(shù)據(jù)分析常和云計算聯(lián)系到一起,因為實時的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。
 
  大數(shù)據(jù)需要特殊的技術,以有效地處理大量的容忍經(jīng)過時間內(nèi)的數(shù)據(jù)。適用于大數(shù)據(jù)的技術,包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計算平臺、互聯(lián)網(wǎng)和可擴展的存儲系統(tǒng)。

 

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關資訊

關注官方微信

手機掃碼看新聞