歡迎訪(fǎng)問(wèn)哈爾濱市速爾科技開(kāi)發(fā)有限公司網(wǎng)站!
哈爾濱門(mén)禁

新聞分類(lèi)

產(chǎn)品分類(lèi)

聯(lián)系我們

哈爾濱市速爾科技開(kāi)發(fā)有限公司

聯(lián)系人:姜女士

電話(huà):0451-87523352-801財(cái)務(wù)部

         0451-87523352-802商務(wù)部

         0451-87523352-803技術(shù)部

         0451-87523352-805傳真

         0451-87523352-804維修部

         0451-82565951

手機(jī):13836033567

郵箱:467371934@qq.com

網(wǎng)址:mdyeasinarafat.com

地址:

哈爾濱市南崗區(qū)南通大街258號(hào)


大數(shù)據(jù)時(shí)代:大數(shù)據(jù)是什么?

您的當(dāng)前位置: 首 頁(yè) >> 新聞中心 >> 公司新聞

大數(shù)據(jù)時(shí)代:大數(shù)據(jù)是什么?

發(fā)布日期:2019-11-06 作者:速爾科技 點(diǎn)擊:

     大數(shù)據(jù)(big data),是指無(wú)法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合。
在維克托·邁爾-舍恩伯格及肯尼斯·庫(kù)克耶編寫(xiě)的《大數(shù)據(jù)時(shí)代》  中大數(shù)據(jù)指不用隨機(jī)分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理。大數(shù)據(jù)的4V特點(diǎn):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)。

WT8S`8N4L`L$`299S4G24WD.png
對(duì)于“大數(shù)據(jù)”(Big data)研究機(jī)構(gòu)Gartner給出了這樣的定義。“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
根據(jù)維基百科的定義,大數(shù)據(jù)是指無(wú)法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合。
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵,在于提高對(duì)數(shù)據(jù)的“加工能力”,通過(guò)“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”。


產(chǎn)生背景

進(jìn)入2012年,大數(shù)據(jù)(big data)一詞越來(lái)越多地被提及,人們用它來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。它已經(jīng)上過(guò)《紐約時(shí)報(bào)》《華爾街日?qǐng)?bào)》的專(zhuān)欄封面,進(jìn)入美國(guó)白宮官網(wǎng)的新聞,現(xiàn)身在國(guó)內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺(jué)靈敏的國(guó)金證券、國(guó)泰君安、銀河證券等寫(xiě)進(jìn)了投資推薦報(bào)告。

數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來(lái)發(fā)展,雖然很多企業(yè)可能并沒(méi)有意識(shí)到數(shù)據(jù)爆炸性增長(zhǎng)帶來(lái)問(wèn)題的隱患,但是隨著時(shí)間的推移,人們將越來(lái)越多的意識(shí)到數(shù)據(jù)對(duì)企業(yè)的重要性。

正如《紐約時(shí)報(bào)》2012年2月的一篇專(zhuān)欄中所稱(chēng),"大數(shù)據(jù)"時(shí)代已經(jīng)降臨,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗(yàn)和直覺(jué)。

哈佛大學(xué)社會(huì)學(xué)教授加里·金說(shuō):"這是一場(chǎng)革命,龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開(kāi)始了量化進(jìn)程,無(wú)論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開(kāi)始這種進(jìn)程。"

影響大數(shù)據(jù)  

    現(xiàn)在的社會(huì)是一個(gè)高速發(fā)展的社會(huì),科技發(fā)達(dá),信息流通,人們之間的交流越來(lái)越密切,生活也越來(lái)越方便,大數(shù)據(jù)就是這個(gè)高科技時(shí)代的產(chǎn)物。

隨著云時(shí)代的來(lái)臨,大數(shù)據(jù)(Big data)也吸引了越來(lái)越多的關(guān)注。大數(shù)據(jù)(Big data)通常用來(lái)形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)過(guò)多時(shí)間和金錢(qián)。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來(lái)向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。

在現(xiàn)今的社會(huì),大數(shù)據(jù)的應(yīng)用越來(lái)越彰顯他的優(yōu)勢(shì),它占領(lǐng)的領(lǐng)域也越來(lái)越大,電子商務(wù)、O2O、物流配送等,各種利用大數(shù)據(jù)進(jìn)行發(fā)展的領(lǐng)域正在協(xié)助企業(yè)不斷地發(fā)展新業(yè)務(wù),創(chuàng)新運(yùn)營(yíng)模式。有了大數(shù)據(jù)這個(gè)概念,對(duì)于消費(fèi)者行為的判斷,產(chǎn)品銷(xiāo)售量的預(yù)測(cè),精確的營(yíng)銷(xiāo)范圍以及存貨的補(bǔ)給已經(jīng)得到全面的改善與優(yōu)化。

"大數(shù)據(jù)"在互聯(lián)網(wǎng)行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運(yùn)營(yíng)中生成、累積的用戶(hù)網(wǎng)絡(luò)行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用G或T來(lái)衡量。

大數(shù)據(jù)到底有多大?一組名為"互聯(lián)網(wǎng)上一天"的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部?jī)?nèi)容可以刻滿(mǎn)1.68億張DVD;發(fā)出的郵件有2940億封之多(相當(dāng)于美國(guó)兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達(dá)200萬(wàn)個(gè)(相當(dāng)于《時(shí)代》雜志770年的文字量);賣(mài)出的手機(jī)為37.8萬(wàn)臺(tái),高于全球每天出生的嬰兒數(shù)量37.1萬(wàn)……

截止到2012年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級(jí)別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級(jí)別。國(guó)際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,2009年的數(shù)據(jù)量為0.8ZB,2010年增長(zhǎng)為1.2ZB,2011年的數(shù)量更是高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到2012年為止,人類(lèi)生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類(lèi)歷史上說(shuō)過(guò)的所有話(huà)的數(shù)據(jù)量大約是5EB。IBM的研究稱(chēng),整個(gè)人類(lèi)文明所獲得的全部數(shù)據(jù)中,有90%是過(guò)去兩年內(nèi)產(chǎn)生的。而到了2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。 每一天,全世界會(huì)上傳超過(guò)5億張圖片,每分鐘就有20小時(shí)時(shí)長(zhǎng)的視頻被分享。然而,即使是人們每天創(chuàng)造的全部信息--包括語(yǔ)音通話(huà)、電子郵件和信息在內(nèi)的各種通信,以及上傳的全部圖片、視頻與音樂(lè),其信息量也無(wú)法匹及每一天所創(chuàng)造出的關(guān)于人們自身的數(shù)字信息量。

這樣的趨勢(shì)會(huì)持續(xù)下去。我們現(xiàn)在還處于所謂"物聯(lián)網(wǎng)"的最初級(jí)階段,而隨著技術(shù)成熟,我們的設(shè)備、交通工具和迅速發(fā)展的"可穿戴"科技將能互相連接與溝通??萍嫉倪M(jìn)步已經(jīng)使創(chuàng)造、捕捉和管理信息的成本降至2005年的六分之一,而從2005年起,用在硬件、軟件、人才及服務(wù)之上的商業(yè)投資也增長(zhǎng)了整整50%,達(dá)到了4000億美元。


折疊大數(shù)據(jù)的精髓

大數(shù)據(jù)帶給我們的三個(gè)顛覆性觀念轉(zhuǎn)變:是全部數(shù)據(jù),而不是隨機(jī)采樣;是大體方向,而不是精確制導(dǎo);是相關(guān)關(guān)系,而不是因果關(guān)系。

A.不是隨機(jī)樣本,而是全體數(shù)據(jù):在大數(shù)據(jù)時(shí)代,我們可以分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴(lài)于隨機(jī)采樣(隨機(jī)采樣,以前我們通常把這看成是理所應(yīng)當(dāng)?shù)南拗疲咝阅艿臄?shù)字技術(shù)讓我們意識(shí)到,這其實(shí)是一種人為限制);

B.不是精確性,而是混雜性:研究數(shù)據(jù)如此之多,以至于我們不再熱衷于追求精確度;之前需要分析的數(shù)據(jù)很少,所以我們必須盡可能精確地量化我們的記錄,隨著規(guī)模的擴(kuò)大,對(duì)精確度的癡迷將減弱;擁有了大數(shù)據(jù),我們不再需要對(duì)一個(gè)現(xiàn)象刨根問(wèn)底,只要掌握了大體的發(fā)展方向即可,適當(dāng)忽略微觀層面上的精確度,會(huì)讓我們?cè)诤暧^層面擁有更好的洞察力;

C.不是因果關(guān)系,而是相關(guān)關(guān)系:我們不再熱衷于找因果關(guān)系,尋找因果關(guān)系是人類(lèi)長(zhǎng)久以來(lái)的習(xí)慣,在大數(shù)據(jù)時(shí)代,我們無(wú)須再緊盯事物之間的因果關(guān)系,而應(yīng)該尋找事物之間的相關(guān)關(guān)系;相關(guān)關(guān)系也許不能準(zhǔn)確地告訴我們某件事情為何會(huì)發(fā)生,但是它會(huì)提醒我們這件事情正在發(fā)生。


十年前,葛大爺曾說(shuō)過(guò),"21世紀(jì)什么最貴?"--"人才",深以為然。只是,十年后的今天,大數(shù)據(jù)時(shí)代也帶來(lái)了身價(jià)不斷翻番的各種數(shù)據(jù)。由于急速拓展的網(wǎng)絡(luò)帶寬以及各種穿戴設(shè)備所帶來(lái)的大量數(shù)據(jù),數(shù)據(jù)的增長(zhǎng)從未停歇,甚至呈井噴式增長(zhǎng)。

一分鐘內(nèi),微博推特上新發(fā)的數(shù)據(jù)量超過(guò)10萬(wàn);社交網(wǎng)絡(luò)"臉譜"的瀏覽量超過(guò)600萬(wàn)……


相關(guān)標(biāo)簽:哈速爾科技

最近瀏覽:

在線(xiàn)客服
分享
歡迎給我們留言
請(qǐng)?jiān)诖溯斎肓粞詢(xún)?nèi)容,我們會(huì)盡快與您聯(lián)系。
姓名
聯(lián)系人
電話(huà)
座機(jī)/手機(jī)號(hào)碼
地址
地址