亚洲an日韩专区在线-亚洲an天堂an在线观看-亚洲a区视频-亚洲a图-免费黄网大全-免费黄网在线

大數據有時對科學不利

2013-11-28 10:41:00 大云網  點擊量: 評論 (0)
外媒稱,科學家通常對大量數據的可利用性表示歡迎。大多數科學家都在贊美規模龐大的數據庫所帶來的科研機遇,但或許這是因為大家并不真正了解大數據的情況。不時會聽到一些專家提醒說,大數據也有其不利的一面

       外媒稱,科學家通常對大量數據的可利用性表示歡迎。大多數科學家都在贊美規模龐大的數據庫所帶來的科研機遇,但或許這是因為大家并不真正了解大數據的情況。不時會聽到一些專家提醒說,大數據也有其不利的一面。


       據美國《科學新聞》雙周刊網站報道,普林斯頓大學的統計學家范劍青及其同事寫道:“科學進步越來越多地由數據來推動。海量數據給數據分析既帶來了機遇,也構成了新的挑戰。”

       首先,大規模的數據集很有誘惑力,能促使人們展開積極的分析,而且分析者希望能夠從中獲取有獲獎可能性的科學發現。但有時,利用大數據意味著最終得到的是糟糕的數據。要從大數據中得出高見,給計算機科學、統計推斷方法甚至科學方法本身帶來了巨大的挑戰。

       當然,計算機領域的科學家通過開發出卓越的計算能力和信息存儲技術,讓大數據的積累成為可能。但是收集數據及存儲信息與理解這些內容并不是一回事。了解大數據的真正意義并不等同于對小數據進行解讀,就像明白鳥群的行為特征并不能解釋一只孤獨的海鷗所發出的叫聲一樣。

      文章指出,標準的統計檢驗和計算程序原本是要分析從大的群體中提取的小樣本,從而得出科學推斷。但是大數據提供的樣本極大,有時甚至包括整個群體或者群體的大部分。任務之艱巨會給實施計算過程從而完成統計檢驗帶來問題。

      加利福尼亞大學伯克利分校的邁克爾·喬丹說:“許多統計程序要么是有未知的運行時刻,要么是運行時刻讓該程序無法用于大規模的數據。面對這種局面,大規模數據的收集者往往不得不求助于臨時的程序,而這種程序有可能具有糟糕的甚至災難性的統計特性。”

      聽起來很糟糕。不過還有更糟的。大數據樣本不僅需要更多的時間去分析,它們往往還包含被抽樣的所有個體的許多不同信息,從統計學的角度講,這意味著這些樣本是“高維的”。更多的維度增加了發現欺騙性關聯的風險。比如,在醫學研究中,可能會將某種藥物的療效與病人的身高聯系在一起。但是這可能僅僅是因為大數據包含方方面面的信息,從身高、體重到眼睛的顏色,再到鞋子的尺碼和最喜歡的棒球隊。需要考慮的維度如此之多,有些維度顯得重要似乎只是出于偶然。

      范劍青和合作者說:“高維度可能會導致錯誤的統計推斷和錯誤的科學結論。”

      除此之外,范劍青和合作者指出,大數據往往是利用眾多技術和方法,綜合源自多個渠道、不同時間的信息而獲得的。“為了應對大數據帶來的挑戰,我們需要新的統計思路和計算方法。”

大云網官方微信售電那點事兒

責任編輯:小沈

免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
?
主站蜘蛛池模板: 99在线热播精品免费 | 手机在线播放av | 美女被男人桶到嗷嗷叫爽网站 | a毛片在线播放 | 日本一区二区三区欧美在线观看 | 久久久久久综合对白国产 | a一级毛片录像带 录像片 | 手机看片午夜 | japanese 色系 tube日本 | 日本一级特黄在线播放 | 日韩精品久久久毛片一区二区 | 男女福利社 | 久草视频福利在线 | 国内外成人免费在线视频 | 欧美成人午夜在线全部免费 | 中文三级视频 | 国产老鸭窝毛片一区二区 | 京野结衣免费一区二区 | 亚洲天堂视频在线 | 2018久久久国产精品 | 色三级大全高清视频在线观看 | 欧美一区视频在线 | 亚洲一区三区 | 久久久久久国产精品免费 | 北岛玲亚洲一区在线观看 | 欧美激情亚洲色图 | 颜值超高的女神啪啪 | 美女被躁爽死 | 亚洲欧洲eeea在线观看 | 精品三级在线观看 | 欧美在线不卡 | 国产人成精品综合欧美成人 | 精品一区二区三区波多野结衣 | 韩日一级视频 | 草草日| 特级aa一级欧美毛片 | 欧美成人鲁丝片在线观看 | 欧美激情一级欧美精品 | 美女被免费视频网站a国产 美女被免费网站视频软件 美女被免费网站在线软件 美女被免费网站在线视频软件 | 亚洲国产激情 | 在线观看视频99 |