首(shou)頁慕課(ke)課(ke)程正文(wen)

上海彩票快三

  現如(ru)今,我們身邊(bian)很多(duo)人對一些熱門(men)的新(xin)技術、新(xin)趨(qu)勢(shi)往往趨(qu)之若鶩卻又(you)很難(nan)說得透徹(che),比(bi)如(ru)大數據,如(ru)果被問大數據和你有(you)什麼關系(xi),估計很少能說出一二(er)三來。究(jiu)其原因,一是(shi)因為大家對yun)xin)技術有(you)著相同的原始渴shi)qiu),至(zhi)少知其然(ran),在聊天時不會顯(xian)得很“ba)簾睢保歡er)是(shi)在工作和生活環境(jing)中,真正能參與(yu)實dao)拇笫蒞咐li)實在太少了,所(suo)以大家沒有(you)機會花時間(jian)去知其所(suo)以然(ran)。

  我希(xi)望有(you)些不一樣,所(suo)以對該如(ru)何(he)去認識大數據進行了一番(fan)思索,包括查閱了資(zi)料xi)  牧俗鐶xin)的專業(ye)書籍,但我並不想把(ba)那些零散的資(zi)料碎片或不同理解論述簡單(dan)規整並堆積起來形(xing)成毫無價值的轉述或評(ping)論,我很真誠xi)南xi)望進入(ru)事物探尋本質sheng)/p>

  如(ru)果你說大數據就是(shi)數據大,或者侃侃而談4個V,也許(xu)很有(you)深度的談到BI或預(yu)測的價值,又(you)zhi)蛘唚oogle和Amazon舉例(li),技術流可能會聊起Hadoop和Cloud Computing,不管對錯,只(zhi)是(shi)無法勾勒(le)對大數據的整體認識,不說是(shi)片面,但至(zhi)少有(you)些管窺(kui)蠡(li)測、隔衣瘙癢了。……也許(xu),“解構”是(shi)最好的方法。

  怎(zen)樣結構大數據?

  首(shou)先,我認為大數據就是(shi)互聯網發(fa)展到jiao)紙窠錐蔚囊恢直(zhi)硐xiang)或特征而已,沒有(you)必(bi)要神話它或對它保持敬畏之心,在以雲計算為代表的技術創新(xin)大幕的襯(chen)托下,這(zhe)些原本很難(nan)收集和使用的數據開始ji)菀yi)被利用起來了,通過各行各業(ye)的不斷創新(xin),大數據會逐步為人類創造更多(duo)的價值。

  其次,想要系(xi)統che)娜現 笫藎 bi)須(xu)要全面而細致的分解它,我yi)攀執(zhi)尤霾忝 湊箍 /p>

  第一層面是(shi)理論,理論是(shi)認知的必(bi)經途徑,也是(shi)被廣泛認同和傳播的基線。我會從大數據的特征定義理解行業(ye)對大數據的整體描繪和定性;從對大數據價值的探討(tao)來深入(ru)解析大數據的珍貴所(suo)在;從對大數據的現在和未來去洞悉(xi)大數據的發(fa)展趨(qu)勢(shi);從大數據隱(yin)私這(zhe)個特別而重要的視(shi)角審視(shi)人和數據之間(jian)的長久博弈(yi)。

  第二(er)層面是(shi)技術,技術是(shi)大數據價值體現的手段和前進的基石。我將分zhi)鶇釉萍撲恪 植bu)式處(chu)理技術、存儲技術和感知技術的發(fa)展來說明大數據從采集、處(chu)理、存儲到形(xing)成結果的整個過程。

  第三層面是(shi)實dao) 導(dao)shi)大數據的最終價值體現。我將分zhi)鶇踴? 拇笫藎 fu)的大數據,企業(ye)的大數據和個人的大數據四個方面來描繪大數據已經展現的美好景象(xiang)及即(ji)將實現的藍圖(tu)。

  和大數據相關的理論

   特征定義

  最早(zao)提出大數據時代到來的是(shi)麥肯錫︰“數據,已經滲透到當(dang)今每一個行業(ye)和業(ye)務職能領(ling)域,成為重要的na)蛩亍H嗣嵌雜yu)海量(liang)數據的挖掘和運用,預(yu)示著新(xin)一波生產率(lv)增長和消費者盈余浪潮的到來。”

  業(ye)界(jie)(IBM 最早(zao)定義)將大數據的特征歸納(na)為4個“V”(量(liang)Volume,多(duo)樣Variety,價值Value,速Velocity),或者說特點(dian)有(you)四個層面︰第一,數據體量(liang)巨大。大數據的起始計量(liang)單(dan)位(wei)至(zhi)少是(shi)P(1000個T)、E(100萬(wan)個T)或Z(10億個T);第二(er),數據類型繁多(duo)。比(bi)如(ru),網絡日(ri)志、視(shi)頻、圖(tu)片、地理位(wei)置信息等等。第三,價值密(mi)度低ting) 桃ye)價值高。第四,處(chu)理速度快。最後這(zhe)一點(dian)也是(shi)和傳統che)氖萃誥蚣際跤you)著本質的不同。

  其實這(zhe)些V並不能真正說清楚大數據的所(suo)有(you)特征,下面這(zhe)張圖(tu)對大數據的一些相關特性做出了有(you)效的說明。

  古語雲︰三分技術,七分數據,得數據者得天下。先不論誰說的,但是(shi)這(zhe)句話an)惱沸砸丫 揮萌?壑?恕N 送(song)小(xiao)?醵舍恩伯格在《大數據時代》一書中舉了百般例(li)證,都是(shi)為了說明一個道理︰在大數據時代已經到來的時候(hou)要用大數據思維去發(fa)掘大數據的潛在價值。書中,作者提及最多(duo)的是(shi)Google如(ru)何(he)利用人們的搜索記錄挖掘數據二(er)次利用價值,比(bi)如(ru)預(yu)測某che)亓韝斜 fa)的趨(qu)勢(shi);Amazon如(ru)何(he)利用用戶的購買和瀏覽歷(li)史數據進行有(you)針對yun)緣氖榧 郝蟯萍觶 源擻you)效提升銷售量(liang);Farecast如(ru)何(he)利用過去十年所(suo)有(you)的航(hang)jiao) 奔鄹翊蛘窞藎 叢yu)測用戶購買機票的時機是(shi)否合(he)適sheng)/p>

  那麼,什麼ci)譴笫菟嘉維克song)小(xiao)?醵舍恩伯格認為,1-需要全部數據樣本而不是(shi)抽(chou)樣;2-關注效率(lv)而不是(shi)精確度;3-關注相關性而不是(shi)因果關系(xi)。

  阿里巴(ba)巴(ba)的王堅對于(yu)大數據也有(you)一些獨特的見解,比(bi)如(ru),

  “今天的數據不是(shi)大,真正有(you)意思的是(shi)數據變得在線了,這(zhe)個恰恰是(shi)互聯網的特點(dian)。”

  “非qiang)? 逼詰牟罰 δ芤歡ㄊshi)它的價值,今天互聯網的產品,數據一定是(shi)它的價值。”

  “你千(qian)萬(wan)不要想著拿數據去改進一個業(ye)務,這(zhe)不是(shi)大數據。你一定是(shi)去做了一huan)鄖白霾渙說氖慮欏!/p>

  特別是(shi)最後一點(dian),我是(shi)非常認同的,大數據的真正價值在于(yu)創造,在于(yu)填補無數個還未ci)迪止目瞻住(zhu)/p>

  有(you)人把(ba)數據比(bi)喻為蘊藏能量(liang)的煤礦。煤炭按照性質shi)薪jiao)煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又(you)不一樣。與(yu)此類似,大數據並不在“大”,而在于(yu)“有(you)用”。價值含量(liang)、挖掘成本比(bi)數量(liang)更為重要。

   價值探討(tao)

  大數據是(shi)什麼?投資(zi)者眼里是(shi)金光閃閃的兩(liang)個字︰資(zi)產。比(bi)如(ru),Facebook上市時,評(ping)估機構評(ping)定的有(you)效資(zi)產中大部分都是(shi)其社交網站(zhan)上xi)氖蕁/p>

  如(ru)果把(ba)大數據比(bi)作一種產業(ye),那麼這(zhe)種產業(ye)實現盈利的關鍵,在于(yu)提高對數據的“加工能力(li)”,通過“加工”實現數據的“增值”。

  Target 超市以20多(duo)種zhi)吃yun)期間(jian)孕(yun)婦jiu)贍芑 郝虻納(na)唐肺 。  suo)有(you)用戶的購買記錄作為數據來源,通過構建模型分析購買者的行xing) 喙匭裕 蘢既(ji)返耐貧銑鱸yun)婦jing)木嚀?lin)盆(pen)時間(jian),這(zhe)樣Target的銷售部門(men)就可以有(you)針對的在每個懷孕(yun)顧客(ke)的不同階段寄送(song)相應的產品優惠卷。

  Target的例(li)子you)且桓齪艿湫偷陌咐li),這(zhe)樣印證了維克song)小(xiao)?醵舍恩伯格提過的一個很有(you)指(zhi)導(dao)意義的觀點(dian)︰通過找出一個關聯物並監控它,就可以預(yu)測未來。Target通過監測購買者購買商品的時間(jian)和品種來準ji)吩yu)測顧客(ke)的孕(yun)期,這(zhe)就是(shi)對數據的二(er)次利用的典型案例(li)。如(ru)果,我們通過采集駕駛(shi)員手zhi)PS數據,就可以分析出當(dang)前哪些道路(lu)正在堵(du)車(che),並可以yue)笆狽fa)布(bu)道路(lu)交通提醒(xing);通過采集汽(qi)車(che)的GPS位(wei)置數據,就可以分析城市的哪些區域停(ting)車(che)較(jiao)多(duo),這(zhe)也代表該區域有(you)著較(jiao)為活躍jing)娜巳海 zhe)些分析數據適合(he)賣給廣告投放(fang)商。

  不管大數據的核心價值是(shi)不是(shi)預(yu)測,但是(shi)基于(yu)大數據形(xing)成決策的模式已經為不少的企業(ye)帶(dai)來了盈利和聲譽。

  從大數據的價值鏈條(tiao)來分析,存在三種模式︰

  1- 手握大數據,但是(shi)沒有(you)利用好;比(bi)較(jiao)典型的是(shi)金融機構,電(dian)信行業(ye),政府(fu)機構等。

  2- 沒有(you)數據,但是(shi)知道如(ru)何(he)幫助有(you)數據的人利用它;比(bi)較(jiao)典型的是(shi)IT咨詢和服務企業(ye),比(bi)如(ru),埃森哲(zhe),IBM,Oracle等。

  3- 既(ji)有(you)數據,又(you)有(you)大數據思維;比(bi)較(jiao)典型的是(shi)Google,Amazon,Mastercard等。

  未來在大數據領(ling)域最具有(you)價值的是(shi)兩(liang)種事物︰1-擁(yong)有(you)大數據思維的人,這(zhe)種人可以將大數據的潛在價值轉化為實dao)世2-還未有(you)被大數據觸及過的業(ye)務領(ling)域。這(zhe)些是(shi)還未被挖掘的油井,金礦,是(shi)所(suo)謂的藍海。

  Wal-Mart作為零售行業(ye)的巨頭,他(ta)們的分析人員會對每個階段的銷售記錄進行了全面的分析,有(you)一次他(ta)們無意中發(fa)現雖不相關但很有(you)價值的數據,在美國的颶風來臨(lin)季節,超市的蛋(dan)撻和抵御颶風物品竟(jing)gu)幌liang)都有(you)大幅增加,于(yu)是(shi)他(ta)們做了一個明智決策,就是(shi)將蛋(dan)撻的銷售位(wei)置移到了颶風物品銷售區域旁邊(bian),看(kan)起來ci)俏 朔獎閿沒 粞xuan),但是(shi)沒有(you)想到蛋(dan)撻的銷量(liang)因此又(you)提高了很多(duo)。

  還有(you)一個有(you)趣的例(li)子,1948年遼沈戰役期間(jian),司令員林zhi)胍 qiu)每天要進行例(li)常的“每日(ri)軍情匯報(bao)”,由值dan)嗖文(wen)倍臉魷率(lv) 韝鱟荻印?Α?tuan)用電(dian)台報(bao)告的當(dang)日(ri)戰況和繳獲情況。那幾乎是(shi)重復著千(qian)篇一律枯燥無味的數據︰每支(zhi)部隊殲(jian)敵多(duo)少、俘虜(lu)多(duo)少;繳獲的火炮、車(che)輛多(duo)少,槍支(zhi)、物資(zi)多(duo)少……有(you)一天,參wen)閉(bi)綻li)匯報(bao)當(dang)日(ri)的戰況,林zhi)臚tu)然(ran)打斷他(ta)︰“剛才(cai)念的在胡家窩ya)錟歉穌蕉返慕苫瘢 忝翹攪寺”大家都很茫然(ran),因為如(ru)此戰斗每天都有(you)幾十起,不都是(shi)差不多(duo)一模一樣的枯燥數字嗎?林zhi) ㄊshi)you)恢埽 奕嘶卮穡 憬恿 柿巳洌骸拔 裁茨搶鎝苫竦畝糖褂yu)長槍的比(bi)例(li)比(bi)rao)淥蕉仿願”“為什麼那里繳獲和tu)骰俚男xiao)車(che)與(yu)大車(che)的比(bi)例(li)比(bi)rao)淥蕉仿願”“為什麼在那里俘虜(lu)和tu)鞅械木儆yu)士兵的比(bi)例(li)比(bi)rao)淥蕉仿願”林zhi) 玖鈐貝蟛階呦蜆gua)滿軍用地圖(tu)的牆壁(bi),指(zhi)著nuo)贗tu)上xi)哪歉齙dian)說︰“我猜想,不,我斷定!敵人的指(zhi)揮所(suo)就在這(zhe)里!”果然(ran),部隊很快就抓住(zhu)了敵方的指(zhi)揮官廖耀湘,並取得這(zhe)場重要戰役的勝利。

  這(zhe)些例(li)子真實的反映在各行各業(ye),探求(qiu)數據價值取決于(yu)把(ba)握數據的人,關鍵是(shi)人的數據思維;與(yu)其說是(shi)大數據創造了價值,不如(ru)說是(shi)大數據思維觸發(fa)了新(xin)的價值增長。

   現在和未來

  我們先看(kan)看(kan)大數據在當(dang)下有(you)怎(zen)樣的杰(jie)出表現︰

  大數據幫助政府(fu)實現市場經濟調(diao)控、公共衛生安全防範ding) 幟nan)預(yu)警、社會輿論監督;

  大數據幫助城市預(yu)防犯罪,實現智qiang)勱煌  嶸艏庇 蹦芰li);

  大數據幫助醫療機構建立(li)患(huan)者的疾病風險跟蹤機制,幫助醫藥企業(ye)提升藥品的臨(lin)床使用效果,幫助艾滋病研究(jiu)機構為患(huan)者提供定制的藥物;

  大數據幫助航(hang)空公司節省(sheng)運營成本,幫助電(dian)信企業(ye)實現售後服務質量(liang)提升,幫助保險企業(ye)識別欺詐騙保行xing)  鎦斕di)公司監測分析運輸車(che)輛jing)墓收舷漲橐蘊崆霸yu)警維修,幫助電(dian)力(li)公司有(you)效識別預(yu)警即(ji)將發(fa)生故障xi)納(na)璞

  大數據幫助電(dian)商公司向用戶推薦商品和服務,幫助旅游(you)網站(zhan)為旅游(you)者提供心儀的旅游(you)路(lu)線,幫助二(er)手市場的買賣雙方找ye)階詈he)適的交易(yi)目標,幫助用戶找ye)階詈he)適的na)唐飯郝蚴逼 ?碳液妥鈑嘔菁鄹

  大數據幫助企業(ye)提升營銷的針對yun)裕 檔臀 骱涂獯嫻某殺荊 跎僂蹲zi)的風險,以yue)鞍鎦笠ye)提升廣告投放(fang)精準度;

  大數據幫助娛樂(le)行業(ye)預(yu)測歌(ge)手,歌(ge)曲(qu),電(dian)影,電(dian)視(shi)劇的受歡迎(ying)程度,並為投資(zi)者分析評(ping)估拍一部電(dian)影需要投入(ru)多(duo)少錢才(cai)最合(he)適,否則就有(you)可能收不回成本;

  大數據幫助社交網站(zhan)提供更準ji)返暮糜you)推薦,為用戶提供更精準的企業(ye)招聘信息,向用戶推薦可能喜歡的游(you)戲(xi)以yue)笆屎he)購買的na)唐貳/p>

  其實,這(zhe)些還遠遠不夠(gou),未來大數據的na)磧壩Ω夢藪chu)不在,就算無法準ji)吩yu)測大數據終會將人類社會帶(dai)往到哪種最終形(xing)態,但我相信只(zhi)要發(fa)展腳步在繼續,因大數據而產生的變革浪潮將很快淹沒地球(qiu)的每一個角落(luo)。

  比(bi)如(ru),Amazon的最終期望是(shi)︰“最成功的書籍推薦應該只(zhi)有(you)一本書,就是(shi)用戶要買的下一本書。”

  Google也希(xi)望當(dang)用戶在搜索時,最好的體驗是(shi)搜索結果只(zhi)包含用戶所(suo)需要的內容,而這(zhe)並不需要用戶給予Google太多(duo)的提示。

  而當(dang)物聯網發(fa)展到達(da)一定規模時,借助條(tiao)形(xing)碼(ma)、二(er)維碼(ma)、RFID等能夠(gou)唯(wei)一標識產品,傳感器、可穿戴設備、智能感知、視(shi)頻采集、增強現實等ran)際蹩墑迪質凳鋇男畔 杉 頭治觶 zhe)些數據能夠(gou)支(zhi)撐智qiang)鄢鞘校 腔(qiang)勱煌  腔(qiang)勰茉矗 腔(qiang) 攪疲 腔(qiang)芻繁5睦砟鐶枰  zhe)些都所(suo)謂的智qiang)勱 shi)大數據的采集數據來源和服務範圍。

  未來的大數據除了將更好的解決社會問題(ti),商業(ye)營銷問題(ti),科學技術問題(ti),還有(you)一個可預(yu)見的趨(qu)勢(shi)是(shi)以人為本jing)拇笫莘秸搿H瞬cai)是(shi)地球(qiu)的主宰,大部分的數據都與(yu)人類有(you)關,要通過大數據解決人的問題(ti)。

  比(bi)如(ru),建立(li)個人的數據中心,將每個人的日(ri)常生活習慣,身體體征,社會網絡,知識能力(li),愛好性情,疾病嗜(shi)好,情緒(xu)波動……換言之就是(shi)記錄ji)舜映鏨且豢唐鸕拿懇環置懇幻耄  慫嘉 獾囊磺卸即(ji) 嫦呂矗 zhe)些數據可以被充分的利用︰

  醫療機構將實時的監測用戶的na)硤褰】底zhuang)況;

  教育機構更有(you)針對的制定用戶喜歡的教育培訓dao)隻

  服務行業(ye)為用戶提供即(ji)ci)苯】檔姆he)用戶生活習慣的食物和其它服務;

  社交網絡能為你提供合(he)適的交友(you)對象(xiang),並為志同道合(he)的人群組(zu)織各種聚(ju)會活動;

  政府(fu)能在用戶的心理健康出現問題(ti)時有(you)效的干預(yu),防範自殺,刑事案件(jian)的發(fa)生;

  金融機構能幫助用戶進行有(you)效的理財(cai)管理,為用戶的資(zi)金提供更有(you)效的使用建議和規劃;

  道路(lu)交通、汽(qi)車(che)租賃及運輸行業(ye)可以為用戶提供更合(he)適的出行線路(lu)和路(lu)途服務安cai)

  ……

  當(dang)然(ran),上面的一切看(kan)起來都很美好,但是(shi)否是(shi)以犧(xi)牲了用戶的自由為前提呢?只(zhi)能說當(dang)新(xin)鮮事物帶(dai)來了革新(xin)的同時也can) dai)來了“病菌”。比(bi)如(ru),在手zhi)雌佔扒(ba)埃 蠹蟻不毒ju)在一起聊天,自從you)只(zhi)佔昂筇乇鶚shi)有(you)了互聯網,大家不用聚(ju)在一起也可以隨時隨地的聊天,只(zhi)是(shi)“病菌”滋生了si)磽庖恢智樾xing),大家慢慢習慣了和手zhi)捕du)時光,人與(yu)人之間(jian)情感交流仿lu)鷯澇陡餱乓徽擰巴(ba)薄/p>

   大數據隱(yin)私

  你或許(xu)並不敏感,當(dang)你在不同的網站(zhan)上注冊了個人信息後,可能這(zhe)些信息已經被擴散出去了,當(dang)你莫(mo)名其妙的接yong)礁髦鐘you)件(jian),電(dian)話,短信nuo)淖倘攀保 悴換嵯氳階約(yue)旱牡dian)話號碼(ma),郵(you)箱(xiang),生日(ri),購買記錄,收入(ru)水(shui)平,家庭住(zhu)址(zhi),親朋好友(you)等私人信息早(zao)就被各種商業(ye)機構非法存儲或賤賣給其它任何(he)有(you)需要的企業(ye)或個人si)恕/p>

  更可怕的是(shi),這(zhe)些信息你永遠無法刪jing) 怯澇洞嬖謨yu)互聯網的某些你不知道的角落(luo)。除非你更換掉自yue)旱乃suo)有(you)信息,但是(shi)這(zhe)代價太大了。

  用戶隱(yin)私問題(ti)一直(zhi)是(shi)大數據應用難(nan)以繞(rao)開的一個問題(ti),如(ru)被央(yang)視(shi)曝光過的分眾無線、羅維鄧白zi)弦約(yue)巴(ba)yi)郵(you)箱(xiang)都涉及ba)址(zhi)贛沒?yin)私。目前,中國並沒有(you)專門(men)的法律法規來界(jie)定用戶隱(yin)私,處(chu)理相關問題(ti)時多(duo)采用其他(ta)相關法規條(tiao)例(li)來解釋。但隨著民眾隱(yin)私意識的日(ri)益增強,合(he)xi) he)規地獲取數據、分析數據和應用數據,是(shi)進行大數據分析時必(bi)須(xu)遵循(xun)的原則。

  說到隱(yin)私被侵zhi)福  de)華(hua)斯諾(nuo)登應該佔據一席之地,這(zhe)位(wei)前美國中xing)yang)情報(bao)局(CIA)雇員一手引爆了美國“稜鏡(jing)計劃”(PRISM)的內幕消息。“稜鏡(jing)”項目是(shi)一項由美國國家安全局(NSA)自2007年起開始實施(shi)的絕密(mi)電(dian)子監听計劃,年耗資(zi)近(jin)2000億美元,用于(yu)監听全美電(dian)話ba) 凹鍬跡 莩隻箍梢允骨楸bao)人員通過“後門(men)”進入(ru)9家主要科技公司jing)姆衿鰨 ㄎwei)軟(ruan)、雅(ya)虎、谷(gu)歌(ge)、Facebook、PalTalk、美國在線、Skype、YouTube、隻果。這(zhe)個事件(jian)引發(fa)了人們對政府(fu)使用大數據時對公民隱(yin)私侵zhi)傅牡P摹/p>

  再看(kan)看(kan)我們身邊(bian),當(dang)微(wei)博,微(wei)信,QQ空間(jian)這(zhe)些社交平台肆(si)意的吞噬著數億用戶的各種信息時,你就不要指(zhi)望你還有(you)隱(yin)私權了,就算你在某個地方刪jing)耍  殘xu)這(zhe)些信息已經被其他(ta)人轉載或保存了,更有(you)可能已經被百度ran)oogle存為快照,早(zao)就提供給任意用戶搜索了。

  因此在大數據的背(bei)景下,很多(duo)人都在積極的抵制無底線的數字zhi)  zhe)種zhi)笫鶯透鎏逯 jian)的博弈(yi)還gou)嵋恢zhi)繼續下去……

  專家給予了我們一些如(ru)何(he)有(you)效保護大數據背(bei)景下隱(yin)私權的建議︰1-減少信息的數字zhi)2-隱(yin)私權立(li)法;3-數字隱(yin)私權基礎設施(shi)(類似DRM數字版權管理);4-人類改變認知(接you)芎雎怨;5-創造良性的信息生態;6-語境(jing)化。

  但是(shi)這(zhe)些都很難(nan)立(li)即(ji)見效或者有(you)實質性的改na)啤/p>

  比(bi)如(ru),現在有(you)一種職業(ye)叫刪帖人,專門(men)負責幫人到各大網站(zhan)刪帖,刪jing)ping)論。其實這(zhe)些人就是(shi)通過黑客(ke)tu)際跚秩ru)各大網站(zhan),破獲管理員的密(mi)碼(ma)然(ran)後進行手工定向刪jing)Vzhi)不過他(ta)們保護的不是(shi)客(ke)戶的隱(yin)私,而大多(duo)是(shi)丑聞。還有(you)一種職業(ye)叫人肉專家,他(ta)們負責從互聯網上找ye)揭桓 yu)他(ta)們根本就無關系(xi)用戶的任意信息。這(zhe)是(shi)很可怕的事情,也就是(shi)說,如(ru)果有(you)人想找ye)僥悖 zhi)需要兩(liang)個條(tiao)件(jian)︰1-你上過網,留下過痕跡;2-你的親朋好友(you)或僅僅是(shi)認識你的人上過網,留下過你的痕跡。這(zhe)兩(liang)個條(tiao)件(jian)滿足其一,人肉專家就可以很輕松的找ye)僥悖 贍芑怪 濫閬衷謖諛掣霾can)廳和誰一起共進晚餐(can)。

  當(dang)很多(duo)互聯網企業(ye)意識到隱(yin)私對于(yu)用戶的重要性時,為了繼續得到用戶的信任,他(ta)們采取了很多(duo)辦法,比(bi)如(ru)google承諾(nuo)僅保留用戶的搜索記錄9個月(yue),瀏覽器廠商提供了無痕沖浪模式,社交網站(zhan)拒絕公共搜索引擎(qing)的爬蟲進入(ru),並將提供出去的數據全部采取匿(ni)名方式處(chu)理等。

  在這(zhe)種zhi)叢擁(yong)幕肪jing)里面,很多(duo)人依然(ran)沒有(you)建立(li)對于(yu)信息隱(yin)私的保護意識,讓自yue)閡恢zhi)處(chu)于(yu)被滋擾,被精心na)杓疲 煥茫 患(huan)嗍shi)yong)拇chu)境(jing)中xiao)?墑shi),我們能做的幾乎微(wei)乎其微(wei),因為個人隱(yin)私數據已經無法由我們自yue)赫瓶亓耍 拖xiang)一首(shou)zi) 鎪檔降模骸叭ru)果你現在繼續麻木,那就別指(zhi)望這(zhe)麻木能抵擋得住(zhu)被”扒(ba)光”那一刻的驚恐和絕望……”

  和大數據相關的技術

   雲技術

  大數據常和雲計算聯系(xi)到一起,因為實時的大型數據集分析需要分布(bu)式處(chu)理框架來向數十、數百或甚至(zhi)數萬(wan)的電(dian)腦分配工作。可以說,雲計算充當(dang)了工業(ye)革命(ming)時期的發(fa)動機的角色,而大數據則是(shi)電(dian)。

  雲計算思想的起源ci)鍬罌ㄎ諫鮮蘭0年代提出的︰把(ba)計算能力(li)作為一種像(xiang)水(shui)和電(dian)一樣的公用事業(ye)提供給用戶。

  如(ru)今,在Google、Amazon、Facebook等一批(pi)互聯網企業(ye)引領(ling)下,一種行之有(you)效的模式出現zhi)耍涸萍撲閭 └【芄蠱教  笫縈τ迷誦性謖zhe)個平台上。

  業(ye)內是(shi)這(zhe)麼形(xing)容兩(liang)者的關系(xi)︰沒有(you)大數據的信息積澱,則雲計算的計算能力(li)再強kan)螅 材nan)以找ye)接夢渲 沒有(you)雲計算的處(chu)理能力(li),則大數據的信息積澱再豐富,也終zhan)恐zhi)是(shi)鏡(jing)花水(shui)月(yue)。

  那麼大數據到底需要哪些雲計算技術呢?

  這(zhe)里暫且列舉一些,比(bi)如(ru)虛擬化技術,分布(bu)式處(chu)理技術,海量(liang)數據的存儲和管理技術,NoSQL、實時流數據處(chu)理、智能分析技術(類似模式識別以yue)白勻ran)語言理解)等。

  雲計算和大數據之間(jian)的關系(xi)可以用下面的一張圖(tu)來說明,兩(liang)者之間(jian)結合(he)後li)岵ru)下效應︰可以提供更多(duo)基于(yu)海量(liang)業(ye)務數據的創新(xin)型服務;通過雲計算技術的不斷xi) 菇檔痛笫菀ye)務的創新(xin)成本。

  如(ru)果將雲計算與(yu)大數據進行一些比(bi)較(jiao),最明顯(xian)的區分在兩(liang)個方面︰

  第一,在概(gai)念上兩(liang)者有(you)所(suo)不同,雲計算改變了IT,而大數據則改變了業(ye)務。然(ran)而大數據必(bi)須(xu)有(you)雲作為基礎架構,才(cai)能得以順暢(chang)運營。

  第二(er),大數據和雲計算的目標受眾不同,雲計算是(shi)CIO等關心的技術層,是(shi)一個進階的IT解決方案。而大數據是(shi)CEO關注的、是(shi)業(ye)務層的產品,而大數據的決策者是(shi)業(ye)務層。

   分布(bu)式處(chu)理技術

  分布(bu)式處(chu)理系(xi)統可以將不同地點(dian)的或具有(you)不同功能的或擁(yong)有(you)不同數據的多(duo)台計算機用通信網絡連接起來,在控制系(xi)統che)耐騁還芾 ?葡攏  diao)地完成信息處(chu)理任務—這(zhe)就是(shi)分布(bu)式處(chu)理系(xi)統che)畝ㄒ濉/p>

  以Hadoop(Yahoo)為例(li)進行說明,Hadoop是(shi)一個實現zhi)apReduce模式的能夠(gou)對大量(liang)數據進行分布(bu)式處(chu)理的軟(ruan)件(jian)框架,是(shi)以一種可靠、高效、可伸縮的方式進行處(chu)理的。

  而MapReduce是(shi)Google提出的一種雲計算的核心計算模式,是(shi)一種zhi)植bu)式運算技術,也是(shi)簡化的分布(bu)式編(bian)程模式,MapReduce模式的主要思想是(shi)將自動分zhi)鉅 zhi)行的問題(ti)(例(li)如(ru)程序)拆解成map(映射)和reduce(化簡)的方式,在數據被分zhi)詈笸 ap 函數的程序將數據映射成不同的區塊,分配給計算機機群處(chu)理達(da)到分布(bu)式運算的效果,在通過Reduce 函數的程序將結果匯整,從而輸出開發(fa)者需要的結果。

  再來看(kan)看(kan)Hadoop的特性,第一,它是(shi)可靠的,因為它假(jia)設計算元素和存儲會失敗,因此它維護多(duo)個工作數據副本,確保能夠(gou)針對失敗的節點(dian)重新(xin)lu)植bu)ji) 懟F浯危adoop 是(shi)高效的,因為它以並行的方式jiao)?鰨   寫chu)理加快處(chu)理速度。Hadoop 還是(shi)可伸縮的,能夠(gou)處(chu)理 PB 級數據。此song)猓adoop 依賴于(yu)社區服務器,因此它的成本比(bi)較(jiao)低ting) 魏he)人都可以使用。

  你也可以這(zhe)麼理解Hadoop的構成,Hadoop=HDFS(文(wen)件(jian)系(xi)統,數據存儲技術相關) HBase(數據庫) MapReduce(數據處(chu)理) ……Others

  Hadoop用到的一些技術有(you)︰

  HDFS: Hadoop分布(bu)式文(wen)件(jian)系(xi)統(Distributed File System) - HDFS (HadoopDistributed File System)

  MapReduce︰並行計算框架

  HBase: 類似Google BigTable的分布(bu)式NoSQL列數據庫。

  Hive︰數據倉庫工具,由Facebook貢獻zhu)/p>

  Zookeeper︰分布(bu)式鎖(suo)設施(shi),提供類似Google Chubby的功能,由Facebook貢獻zhu)/p>

  Avro︰新(xin)的數據序列化格式與(yu)傳輸工具,將逐步取代Hadoop原有(you)的IPC機制。

  Pig:大數據分析平台,為用戶提供多(duo)種接口。

  Ambari︰Hadoop管理工具,可以快捷的監控、部署、管理集群。

  Sqoop︰用于(yu)在Hadoop與(yu)傳統che)氖菘餳jian)進行數據的傳遞(di)。

  說了這(zhe)麼多(duo),舉個實dao)實睦li)子,雖然(ran)這(zhe)個例(li)子有(you)些陳舊(jiu),但是(shi)淘寶的海量(liang)數據技術架構gou)故shi)有(you)助于(yu)我們理解對于(yu)大數據的運作處(chu)理機制:

  如(ru)上圖(tu)所(suo)示,淘寶的海量(liang)數據產品技術架構分為五(wu)個層次,從上至(zhi)下來看(kan)它們分zhi)鶚shi)︰數據源,計算層,存儲層,查詢層和產品層。

  數據來源層。存放(fang)著淘寶各店(dian)的交易(yi)zi)蕁T謔菰床悴氖藎  ataX,DbSync和Timetunel準實時的傳輸到jiao)旅嫻點(dian)所(suo)述的“雲梯(ti)”。

  計算層。在這(zhe)個計算層內,淘寶采用的是(shi)Hadoop集群,這(zhe)個集群,我們暫且稱之為雲梯(ti),是(shi)計算層的主要組(zu)成部分。在雲梯(ti)上xi) xi)統每天會對數據產品進行不同的MapReduce計算。

  存儲層。在這(zhe)一層,淘寶采用了si)礁齠 xi),一個使MyFox,一個是(shi)Prom。MyFox是(shi)基于(yu)MySQL的分布(bu)式jiao)叵xi)型數據庫的集群,Prom是(shi)基于(yu)Hadoop Hbase技術的一個NoSQL的存儲集群。

  查詢層。在這(zhe)一層中,Glider是(shi)以HTTP協議對外提供restful方式的接口。數據產品通過一個唯(wei)一的URL來獲取到它想要的數據。同時,數據查詢即(ji)ci)峭 yFox來查詢的。

  最後一層是(shi)產品層,這(zhe)個就不用解釋了。

   存儲技術

  大數據可以抽(chou)象(xiang)的分為大數據存儲和大數據分析,這(zhe)兩(liang)者的關系(xi)是(shi)︰大數據存儲的目的是(shi)支(zhi)撐大數據分析。到目前為止,還是(shi)兩(liang)種截然(ran)不同的計算機技術領(ling)域︰大數據存儲致力(li)于(yu)研發(fa)可以擴展至(zhi)PB甚至(zhi)EB級別的數據存儲平台;大數據分析關注在最短時間(jian)內處(chu)理大量(liang)不同類型的數據集。

  提到存儲,有(you)一個著(zhu)名的摩爾定律相信大家都听過︰18個月(yue)集成電(dian)路(lu)的復雜you)躍馱黽右(you)槐丁(ding)Ksuo)以,存儲器的成本大約(yue)每18-24個月(yue)就下降一半。成本jing)牟歡舷陸狄蒼煬土舜笫蕕目紗媧 浴/p>

  比(bi)如(ru),Google大約(yue)管理著超過50萬(wan)台服務器和100萬(wan)塊硬cai)蹋 oogle還在不斷xi)睦┐蠹撲隳芰li)和存儲能力(li),其中很多(duo)的擴展都是(shi)基于(yu)在廉價服務器和普通存儲硬cai)痰幕∩轄械模 zhe)大大降低了其服務成本,因此可以將更多(duo)的資(zi)金投入(ru)到技術的nan)蟹fa)當(dang)中xiao)/p>

  以Amazon舉例(li),Amazon S3 是(shi)一種面向 Internet 的存儲服務。該服務旨在讓開發(fa)人員能更輕松的進行網絡規模計算。Amazon S3 提供一個簡明的 Web 服務界(jie)面,用戶可通過它隨時在 Web 上xi)娜魏he)位(wei)置存儲和tu)燜韉娜我獯笮xiao)的數據。此服務讓所(suo)有(you)開發(fa)人員都能訪問同一個具備高擴展性、可靠性、安全性和快速價廉的基礎設施(shi),Amazon 用它來運行其全球(qiu)的網站(zhan)網絡。再看(kan)看(kan)S3的na)杓浦zhi)標︰在特定年度內為數據元提供 99.999999999% 的耐久性和 99.99% 的可用性,並能夠(gou)承受兩(liang)個設施(shi)中的數據同時丟(ding)失。

  S3很成功也確實卓有(you)成效,S3雲的存儲對象(xiang)已達(da)到萬(wan)億級別,而且性能表現相當(dang)良好。S3雲已經擁(yong)萬(wan)億跨地域存儲對象(xiang),同時AWS的對象(xiang)執(zhi)行請求(qiu)也達(da)到百萬(wan)的峰(feng)值數量(liang)。目前全球(qiu)範圍內已經有(you)數以十萬(wan)計的企業(ye)在通過AWS運行自yue)旱娜 炕蛘 糠秩ri)常業(ye)務。這(zhe)些企業(ye)用戶遍布(bu)190多(duo)個國家,幾乎世界(jie)上xi)拿扛黿鍬luo)都有(you)Amazon用戶的na)磧啊/p>

   感知技術

  大數據的采集和感知技術的發(fa)展是(shi)緊密(mi)聯系(xi)的。以傳感器技術,指(zhi)紋識別技術,RFID技術,坐標定位(wei)huan)際醯任 〉母兄 芰li)提升同樣是(shi)物聯網發(fa)展的基石。全世界(jie)的工業(ye)設備、汽(qi)車(che)、電(dian)表上有(you)著無數的數碼(ma)傳感器,隨時測量(liang)和傳遞(di)著有(you)關位(wei)置、運動、震(zhen)動、溫度、濕度乃至(zhi)liang)掌謝  鎦實謀浠  薊岵Aliang)的數據信息。

  而隨著智能手zhi)鈉佔埃 兄﹤際蹩晌接ying)來了發(fa)展的高峰(feng)期,除了地理位(wei)置信息被廣泛的應用外,一些新(xin)的感知手段也開始登上舞台,比(bi)如(ru),最新(xin)的”iPhone 5S”在home鍵內嵌指(zhi)紋傳感器,新(xin)型手zhi)賞 hu)氣直(zhi)接檢測燃(ran)燒(shao)脂肪量(liang),用于(yu)手zhi)男峋jue)傳感器面世可以yue)嗖獯涌掌?鏡(jing)轎O盞幕 ?├罰 wei)軟(ruan)正在研發(fa)可感知用戶當(dang)前心情智能手zhi)際  gu)歌(ge)眼鏡(jing)InSight新(xin)技術可通過衣著進行人物識別。

  除此之外,還有(you)很多(duo)與(yu)感知相關的技術革新(xin)讓我們耳目一新(xin)︰比(bi)如(ru),牙(ya)齒傳感器實時監控口腔(qiang)活動及飲(yin)食狀(zhuang)況,嬰兒穿戴設備可用大數據去養育寶寶,Intel正研發(fa)3D筆記本jiu)閬xiang)頭可追蹤眼球(qiu)讀懂情緒(xu),日(ri)本jing) 究(jiu) fa)新(xin)型可監控用戶心率(lv)的紡(fang)織材料xi) ye)界(jie)正在嘗(chang)試將生物測定技術引入(ru)支(zhi)付領(ling)域等。

  其實,這(zhe)些感知被逐漸(jian)捕獲的過程就是(shi)就世界(jie)被數據化的過程,一旦世界(jie)被完全數據化了,那麼ci)瀾jie)的本質也就是(shi)信息了。

  就像(xiang)一句名言所(suo)說,“人類以前ba)有(you)氖shi)文(wen)明,現在傳承的是(shi)信息。”

  大數據的實dao)/strong>

  互聯網的大數據

  互聯網上xi)氖菝磕暝齔0%,每兩(liang)年便將翻一番(fan),而目前世界(jie)上90%以上xi)氖菔shi)最近(jin)幾年才(cai)產生的。據IDC預(yu)測,到2020年全球(qiu)將總共擁(yong)有(you)35ZB的數據量(liang)。互聯網是(shi)大數據發(fa)展的前哨陣地,隨著WEB2.0時代的發(fa)展,人們似乎都習慣了將自yue)旱納(na)鍆 緗惺蓴  獎惴窒xiang)以yue)凹鍬疾 匾洹/p>

  互聯網上xi)拇笫鶯苣nan)清晰的界(jie)定分類界(jie)限,我們先看(kan)看(kan)BAT的大數據︰

  百度擁(yong)有(you)兩(liang)種類型的大數據︰用戶搜索表征的需求(qiu)數據;爬蟲和阿拉丁(ding)獲取的公共web數據。搜索巨頭百度圍繞(rao)數據而生。它對網頁數據的爬取、網頁chen)諶蕕淖zu)織和解析,通過語義分析對搜索需求(qiu)的精準理解進而從海量(liang)數據中找yi)冀  約(yue)熬 嫉乃閹饕qing)關鍵字廣告,實質上就是(shi)一個數據的獲取、組(zu)織、分析和挖掘的過程。搜索引擎(qing)在大數據時代面臨(lin)的挑戰有(you)︰更多(duo)的暗(an)網數據;更多(duo)的WEB化但是(shi)沒有(you)結構gou) 氖更多(duo)的WEB化、結構gou)  shi)封閉(bi)的數據。

  阿里巴(ba)巴(ba)擁(yong)有(you)交易(yi)zi)鶯托龐檬蕁Uzhe)兩(liang)種數據更容易(yi)變現,挖掘出商業(ye)價值。除此之外阿里巴(ba)巴(ba)tu)雇 蹲zi)等方式掌握了部分社交數據、移動數據。如(ru)微(wei)博和高德(de)。

  騰訊擁(yong)有(you)用戶關系(xi)數據和tu)yu)此產生的na)緗皇蕁Uzhe)些數據可以分析人們的na)詈托形(xing)從里面挖掘出政治、社會、文(wen)化、商業(ye)、健康等領(ling)域的信息,甚至(zhi)預(yu)測未來。

  在信息技術更為發(fa)達(da)的美國,除了行業(ye)知名的類似Google,Facebook外,已經涌現zhi)撕芏duo)大數據類型的公司,它們專門(men)經營數據產品,比(bi)如(ru)︰

  Metamarkets︰這(zhe)家公司對Twitter、支(zhi)付ding)?┐膠鴕恍┬yu)互聯網相關的問題(ti)進行了分析,為客(ke)戶提供了很好的數據分析支(zhi)持。

  Tableau︰他(ta)們的精力(li)主要集中于(yu)將海量(liang)數據以可視(shi)化的方式展現出來。Tableau為數字媒體提供了一個新(xin)的展示數據的方式。他(ta)們提供了一個免(mian)費工具,任何(he)人在沒有(you)編(bian)程tao) 侗bei)景an)那榭魷露寄苤圃斐鍪葑ㄓ猛tu)表。這(zhe)個軟(ruan)件(jian)還能對數據進行分析,並提供有(you)價值的建議。

  ParAccel︰他(ta)們向美國執(zhi)法機構提供了數據分析,比(bi)如(ru)對15000個有(you)犯罪前科的人進行跟蹤,從而向執(zhi)法機構提供了參考性較(jiao)高的犯罪預(yu)測。他(ta)們是(shi)犯罪的預(yu)言者。

  QlikTech︰QlikTech旗下的Qlikview是(shi)一個商業(ye)智能領(ling)域的自主服務工具,能夠(gou)應用于(yu)科學研究(jiu)和藝術等領(ling)域。為了幫助開發(fa)者對這(zhe)些數據進行分析,QlikTech提供了對原始數據進行可視(shi)化處(chu)理等功能的工具。

  GoodData︰GoodData希(xi)望幫助客(ke)戶從you) 型誥蠆cai)富。這(zhe)家創業(ye)公司主要面向商業(ye)用戶和IT企業(ye)高管,提供數據存儲、性能報(bao)告、數據分析等工具。

  TellApart︰TellApart和電(dian)商公司進行合(he)作,他(ta)們qiang)岣縈沒?匿(ni) 佬形(xing) 仁萁蟹治觶  suo)定潛在買家方式提高電(dian)商企業(ye)的收入(ru)。

  DataSift︰DataSift主要收集並分析社交網絡媒體上xi)氖藎  鎦放(fang)乒 菊莆脹tu)發(fa)新(xin)聞nuo)撓唄鄣dian),並制定有(you)針對yun)緣撓 槳浮Uzhe)家公司還和Twitter有(you)合(he)作協議,使得自yue)罕涑閃誦幸ye)中xing) 歡duo)可以分析早(zao)期tweet的創業(ye)公司。

  Datahero︰公司jing)哪勘曄shi)將復雜yong)氖荼淶黴蛹虻dan)明了,方便普通人去理解和想象(xiang)。

  舉了很多(duo)例(li)子,這(zhe)里簡要歸納(na)一下,在互聯網大數據的典型代表性包括︰

  1-用戶行xing) 精準廣告投放(fang)、內容推薦、行xing) 骯吆拖埠梅治觥 酚嘔 

  2-用戶消費數據(精準營銷、信用記錄分析、活動促(chun)銷、理財(cai)等)

  3-用戶地理位(wei)置數據(O2O推廣,商家推薦,交友(you)推薦等)

  4-互聯網金融數據(P2P,小(xiao)額貸款,支(zhi)付,信用,供應鏈金融等)

  5-用戶社交等UGC數據(趨(qu)勢(shi)分析、流行元素分析、受歡迎(ying)程度分析、輿論監控分析、社會問題(ti)分析等)

   政府(fu)的大數據

  近(jin)期,奧(ao)巴(ba)馬政府(fu)宣(xuan)布(bu)投資(zi)2億美元拉動大數據相關產業(ye)發(fa)展,將“大數據戰略”上升為國家意志。奧(ao)巴(ba)馬政府(fu)將數據定義為“未來的新(xin)石油”,並表示一個國家擁(yong)有(you)數據的規模、活性yue)敖饈馱擻玫哪芰li)將成為綜(zong)合(he)國力(li)的重要組(zu)成部分,未來,對數據的佔有(you)和控制甚至(zhi)liang) 晌 餃  H  杖ㄖ 獾牧硪恢止液誦淖zi)產。

  在國內,政府(fu)各個部門(men)都握有(you)構成社會基礎的原始數據,比(bi)如(ru),氣象(xiang)數據,金融數據,信用數據,電(dian)力(li)數據,煤氣數據,自來水(shui)數據,道路(lu)交通數據,客(ke)運數據,安全刑事案件(jian)數據,住(zhu)房數據,海關數據,出入(ru)境(jing)數據,旅游(you)數據,醫療數據,教育數據,環保數據等等。這(zhe)些數據在每個政府(fu)部門(men)里面看(kan)起來ci)塹dan)一的,靜態的。但是(shi),如(ru)果政府(fu)可以將這(zhe)些數據關聯起來,並對這(zhe)些數據進行有(you)效的關聯分析和統一管理,這(zhe)些數據必(bi)定將獲得新(xin)生,其價值是(shi)無法估量(liang)的。

  具體來說,現在城市都在走向智能和智qiang)郟 bi)如(ru),智能電(dian)網、智qiang)勱煌  腔(qiang) 攪啤 腔(qiang)芻繁! 腔(qiang)鄢鞘校 zhe)些都依托于(yu)大數據,可以說大數據是(shi)智qiang)鄣暮誦哪茉礎4庸謖逋蹲zi)規模來看(kan),到2012年底全國開建智qiang)鄢鞘械某鞘惺 80個,通信網絡和數據平台等ran)∩枋shi)建設投資(zi)規模接近(jin)5000億元。“十二(er)五(wu)”期間(jian)智qiang)鄢鞘薪ㄉ櫪  納(na)璞竿蹲zi)規模將達(da)1萬(wan)億元人民幣。大數據為智qiang)鄢鞘械母韝雋ling)域提供決策支(zhi)持。在城市規劃方面,通過對城市地理、氣象(xiang)等自然(ran)信息和經濟、社會、文(wen)化、人口等人文(wen)社會信息的挖掘,可以為城市規劃提供決策,強化城市管理服務的科學性和前瞻性。在交通管理方面,通過對道路(lu)交通信息的實時挖掘,能有(you)效緩hang)飩煌ㄓyong)堵(du),並快速響(xiang)應突(tu)發(fa)狀(zhuang)況,為城市交通的良性運轉提供科學的決策依據。在輿情監控方面,通過網絡關鍵詞(ci)搜索及語義智能分析,能提高輿情分析的及時性、全面性,全面掌握社情民意,提高公共服務能力(li),應對網絡突(tu)發(fa)的公共事件(jian),打擊違(wei)法犯罪。在安防與(yu)防災zhi)ling)域,通過大數據的挖掘,可以yue)笆狽fa)現人為或自然(ran)災害(hai)、恐怖(bu)事件(jian),提高應急處(chu)理能力(li)和安全防範能力(li)。

  另外,作為國家ye)墓芾碚擼 fu)應該有(you)勇氣將手中的數據逐步開放(fang),供給更多(duo)有(you)能力(li)的機構組(zu)織或個人來分析並加you)岳茫 約(yue)鈾僭旄H死唷1bi)如(ru),美國政府(fu)就籌建了一個data.gov網站(zhan),這(zhe)是(shi)奧(ao)巴(ba)馬任期內的一個重要舉措︰要求(qiu)政府(fu)公開透明,而核心就是(shi)實現政府(fu)機構的數據公開。截止目前,已經開放(fang)了有(you)91054 個datasets;349citizen-developed apps;137 mobile apps;175 agencies and subagencies;87 galleries;295 Government APIs。

分享(xiang)︰
延伸閱讀
    數博故事
    大數據概(gai)念_大數據分析_大數據應用_大數據百科專題(ti)
    上海彩票快三 | 下一页