時間:2023-08-12 09:04:31
導言:作為寫作愛好者,不可錯過為您精心挑選的10篇數(shù)據(jù)分析統(tǒng)計學方法,它們將為您的寫作提供全新的視角,我們衷心期待您的閱讀,并希望這些內容能為您提供靈感和參考。
1.定量資源
對于定量資料,應根據(jù)所采用的設計類型、資料所具備的條件和分析目的,選用合適的統(tǒng)計分析方法,不應盲目套用t檢驗和單因索方差分析;
2.定性資源
對于定性資料,應根據(jù)所采用的設計類型、定性變量的性質和頻數(shù)所具備的條件以及分析目的,選用合適的統(tǒng)計分析方法,不應盲目套用X-檢驗;
3.回歸分析
對于回歸分析,應結合專業(yè)知識和散布圖,選用合適的回歸類型,不應盲目套用簡單直線回歸分析,對具有重復實驗數(shù)據(jù)的回歸分析資料,不應簡單化處理;
隨著大數(shù)據(jù)時代的到來,各企業(yè)采用了新的策略,獲得了更多的利潤。對于統(tǒng)計專業(yè)來說,改變發(fā)展策略,使培養(yǎng)出來的專業(yè)人才能夠適應大數(shù)據(jù)背景的需求是其主要任務。目前,高校統(tǒng)計學專業(yè)逐漸認識到大數(shù)據(jù)時代綜合性人才培養(yǎng)的重要性,并對專業(yè)建設進行了相關改革。
一、大數(shù)據(jù)時代對統(tǒng)計學的影響
大數(shù)據(jù)時代的到來對現(xiàn)代統(tǒng)計專業(yè)的發(fā)展造成了新的沖擊,要確保培養(yǎng)出來的人才能夠起到應有的作用,首先要了解大數(shù)據(jù)時代對統(tǒng)計專業(yè)所造成的影響。
(一)大數(shù)據(jù)時代使數(shù)據(jù)結構和數(shù)據(jù)性質發(fā)生變化
網絡技術以及基于網絡技術的電子商務等新的數(shù)據(jù)記錄模式標志著大數(shù)據(jù)時代的到來。大數(shù)據(jù)時代,不再依賴于抽樣調查的記錄模式,網站瀏覽、視頻監(jiān)控都將形成大量數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)結構甚至是數(shù)據(jù)性質發(fā)生了變化。大量的數(shù)據(jù)信息對于需求者來說,如何甄別其可用價值成為關鍵。傳統(tǒng)的數(shù)據(jù)可以二維表格顯示和整理。但大數(shù)據(jù)時代所產生的數(shù)據(jù)具有多樣化和復雜化特征,往往包含了大量的音頻、視頻、HTML等。這要求大數(shù)據(jù)的收集具有較強的目的性,才能實現(xiàn)其價值。
(二)大數(shù)據(jù)時代要求統(tǒng)計分析方法和統(tǒng)計思維更新
大數(shù)據(jù)時代的主要特征為數(shù)據(jù)多且復雜,數(shù)據(jù)分析要求分析者對總體進行分析。在這一背景下,參數(shù)統(tǒng)計不再具有意義,假設檢驗法也隨著總體分析而失去價值。數(shù)據(jù)的復雜化對傳統(tǒng)大數(shù)據(jù)統(tǒng)計思維造成了巨大的沖擊,要求統(tǒng)計者具有活躍的思維。只有對傳統(tǒng)數(shù)據(jù)的改變進行分析,并且樹立新的統(tǒng)計方法。
二、大數(shù)據(jù)時代下的統(tǒng)計學發(fā)展新策略
為適應大數(shù)據(jù)時代的需求,統(tǒng)計學專業(yè)的發(fā)展勢必要對傳統(tǒng)模式進行改革。目前,多數(shù)高校統(tǒng)計學專業(yè)已經認識到大數(shù)據(jù)對于其發(fā)展帶來的沖擊。為此,本文提出了以下策略,以及能夠幫助統(tǒng)計學取得更好發(fā)展。
(一)加強統(tǒng)計應用性教學
根據(jù)大數(shù)據(jù)時代數(shù)據(jù)的總體分析特征,數(shù)據(jù)分析人員應掌握全面的分析方法。在人才培養(yǎng)過程中,應致力于培養(yǎng)實踐分析能力,提高數(shù)據(jù)和資料收集能力,并且培養(yǎng)其強烈的數(shù)據(jù)價值觀,使其能夠從眾多數(shù)據(jù)中找到所需的。另外,對傳統(tǒng)模式進行改革,增加大數(shù)據(jù)統(tǒng)計內容,以適應時代的需求?;诖髷?shù)據(jù)的結構特點,實施資料透視化教學,提高分析者對復雜數(shù)據(jù)的分析能力。
(二)培養(yǎng)大數(shù)據(jù)統(tǒng)計思維
在人才培養(yǎng)過程中,新的統(tǒng)計思維的培養(yǎng)具有重要意義,即強調數(shù)據(jù)分析實踐能力的提高。統(tǒng)計思維的培養(yǎng)有助于數(shù)據(jù)分析者對復雜的數(shù)據(jù)進行區(qū)分,從而整理有效信息。在大數(shù)據(jù)時代,不僅要以傳統(tǒng)的平均思維、動態(tài)思維和變異思維為基礎,還要注重基于整體分析的大數(shù)據(jù)思維。另外,還要培養(yǎng)數(shù)據(jù)分者的復雜性思維,以應對復雜的數(shù)據(jù)庫??傊髷?shù)據(jù)時代需要數(shù)據(jù)分析者具有全面的、創(chuàng)新性的思維。
(三)強化基礎性統(tǒng)計知識
統(tǒng)計學自身具有復雜性,其改變多且抽象?;A的統(tǒng)計知識是進一步掌握大數(shù)據(jù)分析思維的基礎,可見學習基礎性統(tǒng)計知識的重要性是不言而喻的。為此,應該采取深入淺出的方法,利用多媒體等方式使復雜的數(shù)據(jù)統(tǒng)計清晰化、簡單化。結合具體的案例使數(shù)據(jù)分析者正確認識統(tǒng)計概念、掌握統(tǒng)計原理和方法。此外大數(shù)據(jù)分析不再是一種專業(yè),而是更傾向于一種技術,這要求我們將大數(shù)據(jù)分析與統(tǒng)計學以外的相關知識相互聯(lián)系。注重真實相關與偽相關的講解,強調商務智能的開發(fā)和分析。只有具有堅實的基礎,才能確保數(shù)據(jù)分析者大數(shù)據(jù)分析思維的養(yǎng)成,適應現(xiàn)代社會的需求。
(四)加強復合型人才培養(yǎng)
為適應大數(shù)據(jù)時代的需求,復合型人才的培養(yǎng)是關鍵。所謂復合型人才,是指其不但要具有專業(yè)的數(shù)據(jù)分析能力,還要相應的具備管理以及其從事專業(yè)的技術。大數(shù)據(jù)時代,高校應建立全面的人才培養(yǎng)模式,注重培養(yǎng)人才的數(shù)據(jù)分析能力、編程能力等,使其真正了解大數(shù)據(jù),懂得如何利用大數(shù)據(jù)對其所處的行業(yè)起到積極作用才是關鍵??傊髷?shù)據(jù)時代對綜合性人才具有更高的需求,大數(shù)據(jù)時代不僅培養(yǎng)的是一種能力,而且是一種思維,是對全新模式下的數(shù)據(jù)的分析和利用。高校作為人才培養(yǎng)的重要基地,其教學模式的改革、對大數(shù)據(jù)時代所需教學模式的認識是高校的主要任務。
三、總結
統(tǒng)計學是經濟學的基礎課程,傳統(tǒng)的統(tǒng)計人才培養(yǎng)具有定向性。而隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)產生的形式多樣,且具有復雜性。大數(shù)據(jù)分析不僅是作為一種專業(yè)存在,而是應以一項必備的技術而存在。大數(shù)據(jù)時代,傳統(tǒng)的統(tǒng)計思維和統(tǒng)計方法發(fā)生了改變,統(tǒng)計人才培養(yǎng)方式的改革也就勢在必行。(作者單位:海南師范大學)
參考文獻:
[1] 朱懷慶.大數(shù)據(jù)時代對本科經管類統(tǒng)計學教學的影響及對策[J].高等教育研究,2014(3).
[2] 姚壽福.經濟管理類本科專業(yè)統(tǒng)計學課程教學改革思考[J].高等教育研究,2012(3).
中圖分類號:G632 文獻標識碼:A 文章編號:1674-2117(2014)10-0008-02
1 大數(shù)據(jù)的統(tǒng)計涵義
通常來說,凡是數(shù)據(jù)量超過一定大小,導致常規(guī)軟件無法在一個可接受的時間范圍內完成對其進行抓取、管理和處理工作的數(shù)據(jù)即可稱為大數(shù)據(jù)。業(yè)界通常用4個V(即Volume、Variety、Value、Velocity)來概括大數(shù)據(jù)的特征:數(shù)據(jù)體量巨大、數(shù)據(jù)類型繁多、價值密度低、處理速度快。
大數(shù)據(jù)潮流讓我們獲得了海量的數(shù)據(jù),數(shù)據(jù)已經成為相關行業(yè)創(chuàng)造價值的重要資源。因此,許多IT企業(yè)和互聯(lián)網企業(yè)都已將業(yè)務范圍延伸至大數(shù)據(jù)產業(yè),探索大數(shù)據(jù)驅動的業(yè)務模式。2012年,美國政府投資2億美元啟動的“大數(shù)據(jù)研究和發(fā)展計劃”,更是將大數(shù)據(jù)的研究上升到國家戰(zhàn)略層面。然而,大數(shù)據(jù)的真正意義不在于數(shù)據(jù)量的巨大,而在于對數(shù)據(jù)信息進行專業(yè)化的處理,核心是對數(shù)據(jù)進行分析。面對大數(shù)據(jù),越來越多的領域都開始運用數(shù)學特別是統(tǒng)計學的工具,挖掘大數(shù)據(jù)中真正蘊藏的價值。正如西內啟在《看穿一切數(shù)字的統(tǒng)計學》書中所指出的,“從數(shù)據(jù)中得出有意義的結果,關鍵在于控制和減少誤差,得出因果關系,單純收集數(shù)據(jù)并加以全部量化分析在很多情況下會得出謬誤結果,”而科學的統(tǒng)計學方法是得出因果關系的最佳方法。
從統(tǒng)計學角度看,一方面,大數(shù)據(jù)具有類型繁多、結構復雜、體量巨大等特點,海量數(shù)據(jù)以分布式方式進行存儲,特別是圖片、音頻、視頻等非結構化數(shù)據(jù)的廣泛存在,傳統(tǒng)的統(tǒng)計方法和統(tǒng)計分析工具已無法滿足大數(shù)據(jù)分析的需要,亟需統(tǒng)計方法的革新。另一方面,數(shù)據(jù)分析結果需要用生動、直觀、容易被接受的方式展示給讀者,可視化分析能夠直觀地呈現(xiàn)大數(shù)據(jù)的特點,闡釋數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系。因此,統(tǒng)計學要挺立大數(shù)據(jù)潮頭,創(chuàng)新統(tǒng)計分析工具、可視化分析方法,以大數(shù)據(jù)的挖掘和應用為核心,將傳統(tǒng)文本、圖像的統(tǒng)計、分析向數(shù)據(jù)分析轉變,以適應大數(shù)據(jù)時代的發(fā)展及其對統(tǒng)計學帶來的挑戰(zhàn)。
2 大數(shù)據(jù)時代統(tǒng)計學教育面臨的挑戰(zhàn)與應對
據(jù)互聯(lián)網數(shù)據(jù)中心(Internet Data Center)預測,中國大數(shù)據(jù)技術與服務市場將會從2011年的7760萬美元快速增長到2016年的6.16億美元,而據(jù)業(yè)界專家估算,中國大數(shù)據(jù)市場的人才需求量至少為100萬人,其中統(tǒng)計人才、技術更是捉襟見肘。傳統(tǒng)數(shù)據(jù)收集和分析技術的知識結構已不能滿足大數(shù)據(jù)時代對“數(shù)據(jù)科學家”的要求,多家企業(yè)在面對大數(shù)據(jù)發(fā)展時遭遇人才瓶頸。大數(shù)據(jù)相關人才供給不足將會成為影響大數(shù)據(jù)市場發(fā)展的一個重要因素。
當前,全世界范圍內已有數(shù)百個高校開設了大數(shù)據(jù)分析專業(yè)。卡內基梅隆大學和新澤西州立大學在培養(yǎng)目標和課程設置上項目設置偏重于計算機方向。課程設置偏重統(tǒng)計學與運籌學(包括決策科學)的典型學校有田納西大學和約克大學。2013年,北京航空航天大學與慧科教育合作開辦了國內首個“大數(shù)據(jù)技術與應用”軟件工程碩士項目研究生班,這是目前國內唯一一個培養(yǎng)大數(shù)據(jù)行業(yè)專業(yè)型人才的項目,但其培養(yǎng)目標、知識體系是面向計算機領域,而立足統(tǒng)計學基礎的大數(shù)據(jù)分析人才培養(yǎng)項目,在國內可謂是鳳毛麟角。
知者隨事而制。高等院校統(tǒng)計學專業(yè)要通過有效利用和整合人才培養(yǎng)資源,承擔大學人才培養(yǎng)的責任,駕馭大數(shù)據(jù)的浪潮,占領大數(shù)據(jù)發(fā)展人才培養(yǎng)的制高點,體現(xiàn)高等院校向社會、企業(yè)提供智力支撐,輸送企業(yè)亟需的復合型、實用性大數(shù)據(jù)分析人才的載體作用,確保產業(yè)科學、持續(xù)、高速的發(fā)展。一是教育資源的整合,走在前列的首都經濟貿易大學、北京大學、中國人民大學、中國科學院大學、中央財經大學五所應用統(tǒng)計專業(yè)碩士培養(yǎng)單位在北京成立了“中國大數(shù)據(jù)教育協(xié)同創(chuàng)新體”,在高校之間實現(xiàn)學科融合、優(yōu)勢互補、強強聯(lián)合,通過共享優(yōu)質資源平臺、共同建立課程體系、共同建設案例資源庫、聯(lián)合搭建實踐實訓平臺等多種形式,創(chuàng)新人才培養(yǎng)體制機制。二是高等院校教育資源與業(yè)界資源的整合,通過與國有超大型企業(yè)、互聯(lián)網翹楚的協(xié)同培養(yǎng),立足應用統(tǒng)計專業(yè)碩士教育,建立人才培養(yǎng)基地,進行協(xié)同創(chuàng)新,探索構建應用統(tǒng)計(大數(shù)據(jù)分析)專業(yè)碩士人才協(xié)同培養(yǎng)模式。以緩解當前大數(shù)據(jù)人才供需矛盾為目的,建立“校校協(xié)同、校企協(xié)同、院系協(xié)同”的大數(shù)據(jù)分析方向人才協(xié)同培養(yǎng)模式,最終實現(xiàn)協(xié)同培養(yǎng)“數(shù)據(jù)科學家”的目標。[5]
3 面向大數(shù)據(jù)分析方向的應用統(tǒng)計專業(yè)碩士培養(yǎng)模式的構建
本研究認為,可以將大數(shù)據(jù)分析及相關的案例教學模式融入應用統(tǒng)計專業(yè)碩士學位研究生的培養(yǎng)過程,進而打破統(tǒng)計學傳統(tǒng)的以闡述統(tǒng)計理論、公式推導、數(shù)學計算為主的教學模式。以情境浸潤為基礎,為學生呈現(xiàn)統(tǒng)計學在大數(shù)據(jù)領域應用為核心的教學模式,可以培養(yǎng)學生對大數(shù)據(jù)的挖掘、整合、分析價值的能力,以期更好、更快地適應企業(yè)對數(shù)據(jù)分析師、數(shù)據(jù)科學家的需求。
3.1 科學構建課程體系,突出大數(shù)據(jù)分析特點
大數(shù)據(jù)具有強烈的行業(yè)特點,在充分借鑒國外大學成功經驗的基礎上,大數(shù)據(jù)分析專業(yè)碩士的課程設置,強化數(shù)據(jù)分析能力和數(shù)據(jù)挖掘能力,注重上述技術在金融等領域的應用。必修課在講授統(tǒng)計基礎理論(描述、多元、時序、空間、可視化等)課程的基礎上,為增強學生的大規(guī)模分布式計算技能,引入主流的大數(shù)據(jù)計算平臺,如Hadoop分布式平臺、MapReduce并行編程算法。與此同時,為提高學生動手能力,構建數(shù)據(jù)模型思維,開設《大數(shù)據(jù)分析案例》等多門課程。選修課方面,考慮到學生二次開發(fā)的需要,設置大數(shù)據(jù)開發(fā)基礎課程,如C++、Java等。為突出應用統(tǒng)計專業(yè)碩士側重應用的特點,開設面向數(shù)據(jù)的編程語言,如R、SAS、Python等課程。這些課程模塊的設置并非體現(xiàn)某一學科知識的縱深發(fā)展,而是將相關學科的知識融合,有利于突出大數(shù)據(jù)分析的特點。
3.2 創(chuàng)新教學培養(yǎng)模式,注重培用結合
以“編組”方式開展教學活動。授課教師和學生均采用團隊編組模式,多名教師協(xié)同工作,共同完成一門課程的授課任務。打破原有學科思維、教材的束縛。采用導師指導與集體培養(yǎng)相結合的方式。教師不可照搬舊有的教學大綱、課程內容,要學習和熟悉大數(shù)據(jù)相關知識體系與技術新進展,充分結合大數(shù)據(jù)分析需求和實際案例,使課程內容緊貼實際需求,注重培養(yǎng)學生對模型的理解,對數(shù)據(jù)的想象力,真正實現(xiàn)學以致用、培用結合。
采取“訂制化”培養(yǎng)模式,突出培養(yǎng)與應用相結合的特點,力爭做到人、崗的高度匹配?!坝喼苹迸囵B(yǎng)模式打破了目前應用統(tǒng)計專業(yè)碩士統(tǒng)一培養(yǎng)、與市場需求脫節(jié)的模式壁壘,教學實踐以市場需求為導向,依照企業(yè)的崗位標準、用人要求,強調以崗位需求制定培養(yǎng)方案,更好地滿足用人單位對大數(shù)據(jù)分析人才的需求。
3.3 開展校企協(xié)同培養(yǎng),構建問題導向、項目牽引的實踐教學模式
根據(jù)國務院學位委員會的規(guī)定,應用統(tǒng)計學專業(yè)碩士學位研究生教育的目的是培養(yǎng)具有良好的統(tǒng)計學背景,系統(tǒng)掌握數(shù)據(jù)采集、處理、分析和開發(fā)的知識與技能,具備熟練應用計算機處理和分析數(shù)據(jù)的能力,能夠并適應行業(yè)或職業(yè)實際工作需要的應用型高層次人才。因此,要摒棄普遍存在的重理論輕實踐、重知識輕技能的教學方式。
協(xié)同創(chuàng)新培養(yǎng)在實踐教學中建立了以問題為導向,以項目為牽引的運作機制,強調實踐教學內容的呈現(xiàn)方式要面向企業(yè)需求,讓學生參與到企業(yè)的項目運行過程中,引導學生建立業(yè)務建模能力,培養(yǎng)學生的數(shù)據(jù)資源整合能力,激發(fā)學生參與項目的積極性和自覺性。學生不拘泥于學校的實驗實訓基地和各類實驗室,在第二學年中安排一定時間走出校門,進入到企業(yè)的實際環(huán)境中,參與企業(yè)的項目組織、實施過程,在實踐過程中提升自我認知能力,在實踐過程應用知識和理論研究實際問題的能力,培養(yǎng)和鍛煉數(shù)據(jù)資源整合能力、溝通協(xié)調能力、IT支撐能力、業(yè)務建模能力,真正實現(xiàn)面向能力培養(yǎng)的目的。指導教師方面,在案例教學和實習階段引進業(yè)務素質高、項目經驗豐富、對大數(shù)據(jù)發(fā)展有敏銳洞察力的企業(yè)高級數(shù)據(jù)分析人員,指導學生在實習實踐中提出問題、建立模型、解決問題的能力。
4 結語
應用統(tǒng)計(大數(shù)據(jù)分析)專業(yè)碩士人才協(xié)同培養(yǎng)模式,是一項可持續(xù)發(fā)展的應用統(tǒng)計專業(yè)碩士人才培養(yǎng)的新模式,是專業(yè)碩士教學實踐的創(chuàng)新舉措,也是在全國率先建立起來的立足統(tǒng)計學,在大數(shù)據(jù)分析人才層面建立的校校協(xié)同、校企系統(tǒng)辦學體。體現(xiàn)了面向能力培養(yǎng)、面向社會需求培養(yǎng)、面向人才價值培養(yǎng)的“三個面向”的培養(yǎng)目標,著重培養(yǎng)學生分析數(shù)據(jù)、處理數(shù)據(jù)、展示數(shù)據(jù)的能力,對于培養(yǎng)“高層次、實用性、復合型、國際化”大數(shù)據(jù)分析人才意義重大,同時也是順應大數(shù)據(jù)技術革命的浪潮,必將對大數(shù)據(jù)等新興技術產業(yè)的發(fā)展注入活力。
(首都經濟貿易大學,北京 100070)
參考文獻:
[1]劉軍.Hodoop大數(shù)據(jù)處理[M].人民郵電出版社,2013.
[2]大數(shù)據(jù)的四個典型特征[N].中國電子報、電子信息產業(yè)網,2012(12).
大數(shù)據(jù)在如今社會已經成為熱點詞匯,不僅在計算機領域,在其他各個行業(yè)都能夠得到運用,為各個行業(yè)提供便捷,為了讓大數(shù)據(jù)能夠得到充分利用,下文將對大數(shù)據(jù)分析相關方面進行討論。
一、大數(shù)據(jù)與大數(shù)據(jù)時代
(一)大數(shù)據(jù)大數(shù)據(jù)是在當今科技飛速發(fā)展的情況下,一種新興的信息數(shù)據(jù)處理技術。隨著社會科技的進步,各行各業(yè)對于數(shù)據(jù)的應用也越來越廣泛,傳統(tǒng)的數(shù)據(jù)處理技術耗時較長且精準度較為低下,已經不能滿足現(xiàn)代科技對數(shù)據(jù)應用的要求。新時代的大數(shù)據(jù)系統(tǒng)具有超大的數(shù)據(jù)容量,同時兼容半結構化與結構化的數(shù)據(jù),遠遠超出傳統(tǒng)數(shù)據(jù)庫管理系統(tǒng)的管理能力。因此新的大數(shù)據(jù)技術就此誕生。大數(shù)據(jù)在發(fā)展過程中,具有比為鮮明的特點。與傳統(tǒng)數(shù)據(jù)處理技術相比,大數(shù)據(jù)具有數(shù)量龐大、多樣化、速率快、價值高的特點。在信息處理的速度不斷加快的當今社會,這樣的特點為大數(shù)據(jù)的廣泛應用打下了堅實基礎。由于數(shù)據(jù)的數(shù)量較為龐大,且各種數(shù)據(jù)近年來的增長趨勢呈指數(shù)型,其數(shù)據(jù)的種類和形式也各有不同。其次,合理利用大數(shù)據(jù)技術,能夠在一定程度上降低成本,提高效率,因此,大數(shù)據(jù)處理各項關鍵技術的進一步的開發(fā)與利用已成為了提高自身效率,實現(xiàn)核心競爭力的重中之重。
(二)大數(shù)據(jù)時代大數(shù)據(jù)時代是指在物聯(lián)網技術、計算機技術、數(shù)據(jù)信息處理技術的基礎上,通過互聯(lián)網途徑,大量收集并處理分析數(shù)據(jù)資源,而形成一種新型的信息時代。大數(shù)據(jù)時代的主要核心內容是對龐大的數(shù)據(jù)體系進行處理以發(fā)揮價值,從而提升數(shù)據(jù)分析效率以及數(shù)據(jù)應用價值。大數(shù)據(jù)時代是由多種信息技術共同組成,可以有效地避免數(shù)據(jù)處理中不同步、使用不方便的情況發(fā)生,具有高效可靠的數(shù)據(jù)處理、整合、分析及匯總的功能。因此,大數(shù)據(jù)時代的新型數(shù)據(jù)處理技術可最大程度的對數(shù)據(jù)進行分析與挖掘,極大提高處理數(shù)據(jù)的效率。
二、大數(shù)據(jù)時代與統(tǒng)計學
(一)大數(shù)據(jù)時代與統(tǒng)計學的關系統(tǒng)計工作是集數(shù)據(jù)的搜集、整理、分析和解釋為一體的系統(tǒng)的過程。大數(shù)據(jù)與統(tǒng)計二者互相依存,通過統(tǒng)計的方法和原理對數(shù)據(jù)進行整理和分析,提高數(shù)據(jù)的精確度和適用度,以此來實現(xiàn)數(shù)據(jù)的價值和利用率。由此看來,大數(shù)據(jù)與統(tǒng)計學的聯(lián)系既緊密,又存在區(qū)別。大數(shù)據(jù)與統(tǒng)計學的關系甚為密切,它們都是關于數(shù)字的學科。統(tǒng)計學為大數(shù)據(jù)提供了了施展方向,而大數(shù)據(jù)將統(tǒng)計學引領至更深更廣的空間。共性之一就是社會與數(shù)據(jù)。幾乎所有的行業(yè)與大數(shù)據(jù)都有著密切聯(lián)系,這些聯(lián)系或直接或間接,而人們正是通過獲取數(shù)據(jù)并進行分析,從而才能得到商業(yè)知識和社會服務等能力。大數(shù)據(jù)與統(tǒng)計學的區(qū)別。首先,信息規(guī)模不同。大數(shù)據(jù)的分析對象是與某事物有關聯(lián)的所有數(shù)據(jù),要求數(shù)據(jù)量龐大。統(tǒng)計學則是用樣本來分析和推斷總體的數(shù)量特征。在大數(shù)據(jù)時代,則可以通過各種方法和渠道獲得全面而又完整的的信息資料,從而完成更多從前無法完成的事情。其次,動靜標準不同。數(shù)據(jù)經過了搜集、整理、分析的過程就很有可能因為精確性不足而被認為失去了用處。而大數(shù)據(jù)時代,則不必再擔心這個問題,數(shù)據(jù)的精確性和原始性不在被過分重視,人們可以接受復雜數(shù)據(jù)。第三,數(shù)據(jù)搜集形式不同。在以往數(shù)據(jù)搜集形式主要是抽樣調查,方法局限。而在大數(shù)據(jù)時代,特點是信息爆炸和互聯(lián)網飛速發(fā)展,這一情況得到改觀。最后,思維方式不同。大數(shù)據(jù)時代人們的思維發(fā)生轉變,人們開始更多的關注事物的相關關聯(lián)。
(二)大數(shù)據(jù)對統(tǒng)計學研究工作的影響首先,大數(shù)據(jù)豐富了統(tǒng)計學的研究對象。在大數(shù)據(jù)時代,我們既可以以結構化數(shù)據(jù)作為測量單位對文本、圖像和視頻等進行分析,還可以對非結構化數(shù)據(jù)實行分析。其次,大數(shù)據(jù)影響了統(tǒng)計學的工作進程。統(tǒng)計數(shù)據(jù)需求豐富,原有的統(tǒng)計抽樣分析不能在適應時代的發(fā)展,而現(xiàn)代科技方法如透過傳感器自動收集數(shù)據(jù)等方法取代了傳統(tǒng)方法,更加便捷有效。
三、大數(shù)據(jù)數(shù)據(jù)分析理念
統(tǒng)計思想需要經歷統(tǒng)計觀念、統(tǒng)計意識、統(tǒng)計理念等階段。統(tǒng)計思想是根據(jù)人類社會需求的變化而開展各種統(tǒng)計實踐、統(tǒng)計理論研究與概括,才能逐步形成系統(tǒng)的數(shù)理統(tǒng)計思想。
二、數(shù)理統(tǒng)計思想的特點
數(shù)理統(tǒng)計思想從數(shù)理統(tǒng)計學派汲取新的營養(yǎng),并且越來越廣泛的應用數(shù)學方法,聯(lián)系也越來越密切,但在數(shù)理統(tǒng)計思想的體現(xiàn)上與通用學派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現(xiàn)出:(1)數(shù)理統(tǒng)計思想強調方法性與應用性的統(tǒng)一;(2)數(shù)理統(tǒng)計思想強調科學性與藝術性的統(tǒng)一;(3)數(shù)理統(tǒng)計思想強調客觀性與主觀性的統(tǒng)一;(4)數(shù)理統(tǒng)計思想強調定性分析與定量分析的統(tǒng)一。
三、數(shù)理統(tǒng)計思想
就是統(tǒng)計實際工作、數(shù)理統(tǒng)計學理論及應用研究中必須遵循的基本理念和指導思想。數(shù)理統(tǒng)計的思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想。
1.均值思想
均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有數(shù)理統(tǒng)計學理論,是數(shù)理統(tǒng)計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發(fā)展趨勢,避免個別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。
2.變異思想
統(tǒng)計研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計方法就是要認識事物數(shù)量方面的差異。數(shù)理統(tǒng)計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
3.估計思想
估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹?shù)谋匾襟E。
4.相關思想
事物是普遍聯(lián)系的,在變化中,經常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯(lián)的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯(lián)的。
5.擬合思想
擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現(xiàn)得非常復雜,這種方法就是對規(guī)律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數(shù)量上所體現(xiàn)的模于此而預示的可能性”。
6.檢驗思想
數(shù)理統(tǒng)計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規(guī)律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征的假設是否可信。
四、數(shù)理統(tǒng)計的思想方法?
1.要更正不正確的思想認識
英國著名生物學家、統(tǒng)計學家高爾頓曾經說過:“統(tǒng)計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統(tǒng)計學可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現(xiàn)實問題可能要比想象的復雜得多。此外,有些人認為方法越復雜越科學,在實際的分析研究中,喜歡簡單問題復雜化,似乎這樣才能顯示其科學含量。其實,真正的科學是使復雜的問題簡單化而不是追求復雜化。與此相關聯(lián)的是,有些人認為只有推斷統(tǒng)計才是科學,描述統(tǒng)計不是科學,并延伸擴大到只有數(shù)理統(tǒng)計是科學、社會經濟統(tǒng)計不是科學這樣的認識。這種認識是極其錯誤的,至少是對社會經濟統(tǒng)計的無知。比利時數(shù)學家凱特勒不僅研究概率論,并且注重于把統(tǒng)計學應用于人類事物,試圖把統(tǒng)計學創(chuàng)建成改良社會的一種工具。經濟學和人口統(tǒng)計學中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產。
2.要不斷拓展統(tǒng)計思維方式
數(shù)理統(tǒng)計學是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數(shù)據(jù)信息(尤其是不完全甚至劣質的信息)去產生新的知識或去驗證一個假設,即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結論。歸納推理是要在數(shù)據(jù)信息的基礎上透過偶然性去發(fā)現(xiàn)必然性。演繹推理是對統(tǒng)計認識能力的深化,尤其是在根據(jù)必然性去研究和認識偶然性方面,具有很大的作用。
3.要深化對數(shù)據(jù)分析的認識
任何統(tǒng)計研究都離不開數(shù)據(jù)分析。因為這是得到統(tǒng)計研究結論的必要環(huán)節(jié)。雖然統(tǒng)計分析的形式隨時代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計分析的目的卻一直沒有改變。對統(tǒng)計數(shù)據(jù)分析的原因有以下三個方面:一是基于同樣的數(shù)據(jù)會得出不同、甚至相反的分析結論;二是我們所面對的分析數(shù)據(jù)有時是缺損的或存在不真實性;三是我們所面對的分析數(shù)據(jù)有時則又是海量的,讓人無從下手。雖然統(tǒng)計數(shù)據(jù)分析已經經歷了描述性數(shù)據(jù)分析、推斷性數(shù)據(jù)分析和探索性數(shù)據(jù)分析等階段,分析的方法技術已經有了質的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數(shù)據(jù)分析的認識,圍繞“準確解答特定問題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開展數(shù)據(jù)分析方法技術的研究。
數(shù)理統(tǒng)計思想方法應用必須堅持以事實為依據(jù)、用數(shù)據(jù)說話的原則,把統(tǒng)計技術的應用與專業(yè)技術緊密結合,在考慮統(tǒng)計項目實施時,應從理論和事實層面上注重分析和使用條件,認真權衡各種關聯(lián)因素。數(shù)理統(tǒng)計學是繼承和發(fā)展基礎統(tǒng)計的理論成果,堅持統(tǒng)計學的社會科學性質,使統(tǒng)計理論研究更接近統(tǒng)計工作實際,在國家和社會得到廣泛發(fā)展。
參考文獻
[1] 陳福貴.統(tǒng)計思想雛議[J]北京統(tǒng)計,?2004,(05).
[2] 龐有貴.統(tǒng)計工作及統(tǒng)計思想[J]科技情報開發(fā)與經濟,?2004,(03).
1關于統(tǒng)計學
統(tǒng)計學是一門實質性的社會科學,既研究社會生活的客觀規(guī)律,也研究統(tǒng)計方法。統(tǒng)計學是繼承和發(fā)展基礎統(tǒng)計的理論成果,堅持統(tǒng)計學的社會科學性質,使統(tǒng)計理論研究更接近統(tǒng)計工作實際,在國家和社會得到廣泛發(fā)展。
2 統(tǒng)計學中的幾種統(tǒng)計思想
2.1 統(tǒng)計思想的形成
統(tǒng)計思想不是天然形成的,需要經歷統(tǒng)計觀念、統(tǒng)計意識、統(tǒng)計理念等階段。統(tǒng)計思想是根據(jù)人類社會需求的變化而開展各種統(tǒng)計實踐、統(tǒng)計理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計思想。
2.2 比較常用的幾種統(tǒng)計思想
所謂統(tǒng)計思想,就是統(tǒng)計實際工作、統(tǒng)計學理論及應用研究中必須遵循的基本理念和指導思想。統(tǒng)計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想?,F(xiàn)分述如下:
2.2.1 均值思想
均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統(tǒng)計學理論,是統(tǒng)計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發(fā)展趨勢,避免個別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。
2.2.2 變異思想
統(tǒng)計研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計方法就是要認識事物數(shù)量方面的差異。統(tǒng)計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
2.2.3 估計思想
估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹?shù)谋匾襟E。
2.2.4 相關思想
事物是普遍聯(lián)系的,在變化中,經常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯(lián)的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯(lián)的。
2.2.5 擬合思想
擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現(xiàn)得非常復雜,這種方法就是對規(guī)律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數(shù)量上所體現(xiàn)的模式和基于此而預示的可能性”。
2.2.6 檢驗思想
統(tǒng)計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規(guī)律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征的假設是否可信。
2.3 統(tǒng)計思想的特點
作為一門應用統(tǒng)計學,它從數(shù)理統(tǒng)計學派汲取新的營養(yǎng),并且越來越廣泛的應用數(shù)學方法,聯(lián)系也越來越密切,但在統(tǒng)計思想的體現(xiàn)上與通用學派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現(xiàn)出:(1)統(tǒng)計思想強調方法性與應用性的統(tǒng)一;(2)統(tǒng)計思想強調科學性與藝術性的統(tǒng)一;(3)統(tǒng)計思想強調客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計思想強調定性分析與定量分析的統(tǒng)一。
3 對統(tǒng)計思想的一些思考
3.1 要更正當前存在的一些不正確的思想認識
英國著名生物學家、統(tǒng)計學家高爾頓曾經說過:“統(tǒng)計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統(tǒng)計學可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現(xiàn)實問題可能要比想象的復雜得多。此外,有些人認為方法越復雜越科學,在實際的分析研究中,喜歡簡單問題復雜化,似乎這樣才能顯示其科學含量。其實,真正的科學是使復雜的問題簡單化而不是追求復雜化。與此相關聯(lián)的是,有些人認為只有推斷統(tǒng)計才是科學,描述統(tǒng)計不是科學,并延伸擴大到只有數(shù)理統(tǒng)計是科學、社會經濟統(tǒng)計不是科學這樣的認識。這種認識是極其錯誤的,至少是對社會經濟統(tǒng)計的無知。比利時數(shù)學家凱特勒不僅研究概率論,并且注重于把統(tǒng)計學應用于人類事物,試圖把統(tǒng)計學創(chuàng)建成改良社會的一種工具。經濟學和人口統(tǒng)計學中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產。
3.2要不斷拓展統(tǒng)計思維方式
統(tǒng)計學是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數(shù)據(jù)信息(尤其是不完全甚至劣質的信息)去產生新的知識或去驗證一個假設,即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結論。歸納推理是要在數(shù)據(jù)信息的基礎上透過偶然性去發(fā)現(xiàn)必然性。演繹推理是對統(tǒng)計認識能力的深化,尤其是在根據(jù)必然性去研究和認識偶然性方面,具有很大的作用。
3.3深化對數(shù)據(jù)分析的認識
任何統(tǒng)計研究都離不開數(shù)據(jù)分析。因為這是得到統(tǒng)計研究結論的必要環(huán)節(jié)。雖然統(tǒng)計分析的形式隨時代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計分析的目的卻一直沒有改變。對統(tǒng)計數(shù)據(jù)分析的原因有以下三個方面:一是基于同樣的數(shù)據(jù)會得出不同、甚至相反的分析結論;二是我們所面對的分析數(shù)據(jù)有時是缺損的或存在不真實性;三是我們所面對的分析數(shù)據(jù)有時則又是海量的,讓人無從下手。雖然統(tǒng)計數(shù)據(jù)分析已經經歷了描述性數(shù)據(jù)分析(DDA)、推斷性數(shù)據(jù)分析(IDA)和探索性數(shù)據(jù)分析(EDA)等階段,分析的方法技術已經有了質的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數(shù)據(jù)分析的認識,圍繞“準確解答特定問題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開展數(shù)據(jù)分析方法技術的研究。
參考文獻:
[1] 陳福貴.統(tǒng)計思想雛議[J]北京統(tǒng)計, 2004,(05) .
[2] 龐有貴.統(tǒng)計工作及統(tǒng)計思想[J]科技情報開發(fā)與經濟, 2004,(03) .
1關于統(tǒng)計學
統(tǒng)計學是一門實質性的社會科學,既研究社會生活的客觀規(guī)律,也研究統(tǒng)計方法。統(tǒng)計學是繼承和發(fā)展基礎統(tǒng)計的理論成果,堅持統(tǒng)計學的社會科學性質,使統(tǒng)計理論研究更接近統(tǒng)計工作實際,在國家和社會得到廣泛發(fā)展。
2統(tǒng)計學中的幾種統(tǒng)計思想
2.1統(tǒng)計思想的形成
統(tǒng)計思想不是天然形成的,需要經歷統(tǒng)計觀念、統(tǒng)計意識、統(tǒng)計理念等階段。統(tǒng)計思想是根據(jù)人類社會需求的變化而開展各種統(tǒng)計實踐、統(tǒng)計理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計思想。
2.2比較常用的幾種統(tǒng)計思想
所謂統(tǒng)計思想,就是統(tǒng)計實際工作、統(tǒng)計學理論及應用研究中必須遵循的基本理念和指導思想。統(tǒng)計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想?,F(xiàn)分述如下:
2.2.1均值思想
均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統(tǒng)計學理論,是統(tǒng)計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發(fā)展趨勢,避免個別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。
2.2.2變異思想
統(tǒng)計研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計方法就是要認識事物數(shù)量方面的差異。統(tǒng)計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
2.2.3估計思想
估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹?shù)谋匾襟E。
2.2.4相關思想
事物是普遍聯(lián)系的,在變化中,經常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯(lián)的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯(lián)的。
2.2.5擬合思想
擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現(xiàn)得非常復雜,這種方法就是對規(guī)律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數(shù)量上所體現(xiàn)的模式和基于此而預示的可能性”。
2.2.6檢驗思想
統(tǒng)計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規(guī)律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征的假設是否可信。
2.3統(tǒng)計思想的特點
作為一門應用統(tǒng)計學,它從數(shù)理統(tǒng)計學派汲取新的營養(yǎng),并且越來越廣泛的應用數(shù)學方法,聯(lián)系也越來越密切,但在統(tǒng)計思想的體現(xiàn)上與通用學派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現(xiàn)出:(1)統(tǒng)計思想強調方法性與應用性的統(tǒng)一;(2)統(tǒng)計思想強調科學性與藝術性的統(tǒng)一;(3)統(tǒng)計思想強調客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計思想強調定性分析與定量分析的統(tǒng)一。
3對統(tǒng)計思想的一些思考
3.1要更正當前存在的一些不正確的思想認識
英國著名生物學家、統(tǒng)計學家高爾頓曾經說過:“統(tǒng)計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統(tǒng)計學可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現(xiàn)實問題可能要比想象的復雜得多。此外,有些人認為方法越復雜越科學,在實際的分析研究中,喜歡簡單問題復雜化,似乎這樣才能顯示其科學含量。其實,真正的科學是使復雜的問題簡單化而不是追求復雜化。與此相關聯(lián)的是,有些人認為只有推斷統(tǒng)計才是科學,描述統(tǒng)計不是科學,并延伸擴大到只有數(shù)理統(tǒng)計是科學、社會經濟統(tǒng)計不是科學這樣的認識。這種認識是極其錯誤的,至少是對社會經濟統(tǒng)計的無知。比利時數(shù)學家凱特勒不僅研究概率論,并且注重于把統(tǒng)計學應用于人類事物,試圖把統(tǒng)計學創(chuàng)建成改良社會的一種工具。經濟學和人口統(tǒng)計學中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產。
3.2要不斷拓展統(tǒng)計思維方式
統(tǒng)計學是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數(shù)據(jù)信息(尤其是不完全甚至劣質的信息)去產生新的知識或去驗證一個假設,即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結論。歸納推理是要在數(shù)據(jù)信息的基礎上透過偶然性去發(fā)現(xiàn)必然性。演繹推理是對統(tǒng)計認識能力的深化,尤其是在根據(jù)必然性去研究和認識偶然性方面,具有很大的作用。
3.3深化對數(shù)據(jù)分析的認識
任何統(tǒng)計研究都離不開數(shù)據(jù)分析。因為這是得到統(tǒng)計研究結論的必要環(huán)節(jié)。雖然統(tǒng)計分析的形式隨時代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計分析的目的卻一直沒有改變。對統(tǒng)計數(shù)據(jù)分析的原因有以下三個方面:一是基于同樣的數(shù)據(jù)會得出不同、甚至相反的分析結論;二是我們所面對的分析數(shù)據(jù)有時是缺損的或存在不真實性;三是我們所面對的分析數(shù)據(jù)有時則又是海量的,讓人無從下手。雖然統(tǒng)計數(shù)據(jù)分析已經經歷了描述性數(shù)據(jù)分析(DDA)、推斷性數(shù)據(jù)分析(IDA)和探索性數(shù)據(jù)分析(EDA)等階段,分析的方法技術已經有了質的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數(shù)據(jù)分析的認識,圍繞“準確解答特定問題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開展數(shù)據(jù)分析方法技術的研究。
論文摘要】所謂統(tǒng)計思想,就是在統(tǒng)計實際工作、統(tǒng)計學理論的應用研究中,必須遵循的基本理念和指導思想。統(tǒng)計思想主要包括均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想等思想。文章通過對統(tǒng)計思想的闡釋,提出關于統(tǒng)計思想認識的三點思考。
參考文獻:
[1]陳福貴.統(tǒng)計思想雛議[J]北京統(tǒng)計,2004,(05).
1關于統(tǒng)計學
統(tǒng)計學是一門實質性的社會科學,既研究社會生活的客觀規(guī)律,也研究統(tǒng)計方法。統(tǒng)計學是繼承和發(fā)展基礎統(tǒng)計的理論成果,堅持統(tǒng)計學的社會科學性質,使統(tǒng)計理論研究更接近統(tǒng)計工作實際,在國家和社會得到廣泛發(fā)展。
2 統(tǒng)計學中的幾種統(tǒng)計思想
2.1 統(tǒng)計思想的形成
統(tǒng)計思想不是天然形成的,需要經歷統(tǒng)計觀念、統(tǒng)計意識、統(tǒng)計理念等階段。統(tǒng)計思想是根據(jù)人類社會需求的變化而開展各種統(tǒng)計實踐、統(tǒng)計理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計思想。
2.2 比較常用的幾種統(tǒng)計思想
所謂統(tǒng)計思想,就是統(tǒng)計實際工作、統(tǒng)計學理論及應用研究中必須遵循的基本理念和指導思想。統(tǒng)計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想?,F(xiàn)分述如下:
2.2.1 均值思想
均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統(tǒng)計學理論,是統(tǒng)計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發(fā)展趨勢,避免個別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。
2.2.2 變異思想
統(tǒng)計研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計方法就是要認識事物數(shù)量方面的差異。統(tǒng)計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
2.2.3 估計思想
估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹?shù)谋匾襟E。
2.2.4 相關思想
事物是普遍聯(lián)系的,在變化中,經常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯(lián)的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯(lián)的。
2.2.5 擬合思想
擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現(xiàn)得非常復雜,這種方法就是對規(guī)律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數(shù)量上所體現(xiàn)的模式和基于此而預示的可能性”。
2.2.6 檢驗思想
統(tǒng)計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規(guī)律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征的假設是否可信。
2.3 統(tǒng)計思想的特點
作為一門應用統(tǒng)計學,它從數(shù)理統(tǒng)計學派汲取新的營養(yǎng),并且越來越廣泛的應用數(shù)學方法,聯(lián)系也越來越密切,但在統(tǒng)計思想的體現(xiàn)上與通用學派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現(xiàn)出:(1)統(tǒng)計思想強調方法性與應用性的統(tǒng)一;(2)統(tǒng)計思想強調科學性與藝術性的統(tǒng)一;(3)統(tǒng)計思想強調客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計思想強調定性分析與定量分析的統(tǒng)一。
3 對統(tǒng)計思想的一些思考
3.1 要更正當前存在的一些不正確的思想認識
英國著名生物學家、統(tǒng)計學家高爾頓曾經說過:“統(tǒng)計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統(tǒng)計學可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現(xiàn)實問題可能要比想象的復雜得多。此外,有些人認為方法越復雜越科學,在實際的分析研究中,喜歡簡單問題復雜化,似乎這樣才能顯示其科學含量。其實,真正的科學是使復雜的問題簡單化而不是追求復雜化。與此相關聯(lián)的是,有些人認為只有推斷統(tǒng)計才是科學,描述統(tǒng)計不是科學,并延伸擴大到只有數(shù)理統(tǒng)計是科學、社會經濟統(tǒng)計不是科學這樣的認識。這種認識是極其錯誤的,至少是對社會經濟統(tǒng)計的無知。比利時數(shù)學家凱特勒不僅研究概率論,并且注重于把統(tǒng)計學應用于人類事物,試圖把統(tǒng)計學創(chuàng)建成改良社會的一種工具。經濟學和人口統(tǒng)計學中的某些近代概念,如gnp、人口增長率等等,均是凱特勒及其弟子們的遺產。
3.2要不斷拓展統(tǒng)計思維方式
統(tǒng)計學是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數(shù)據(jù)信息(尤其是不完全甚至劣質的信息)去產生新的知識或去驗證一個假設,即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結論。歸納推理是要在數(shù)據(jù)信息的基礎上透過偶然性去發(fā)現(xiàn)必然性。演繹推理是對統(tǒng)計認識能力的深化,尤其是在根據(jù)必然性去研究和認識偶然性方面,具有很大的作用。
3.3深化對數(shù)據(jù)分析的認識
任何統(tǒng)計研究都離不開數(shù)據(jù)分析。因為這是得到統(tǒng)計研究結論的必要環(huán)節(jié)。雖然統(tǒng)計分析的形式隨時代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計分析的目的卻一直沒有改變。對統(tǒng)計數(shù)據(jù)分析的原因有以下三個方面:一是基于同樣的數(shù)據(jù)會得出不同、甚至相反的分析結論;二是我們所面對的分析數(shù)據(jù)有時是缺損的或存在不真實性;三是我們所面對的分析數(shù)據(jù)有時則又是海量的,讓人無從下手。雖然統(tǒng)計數(shù)據(jù)分析已經經歷了描述性數(shù)據(jù)分析(dda)、推斷性數(shù)據(jù)分析(ida)和探索性數(shù)據(jù)分析(eda)等階段,分析的方法技術已經有了質的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數(shù)據(jù)分析的認識,圍繞“準確解答特定問題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開展數(shù)據(jù)分析方法技術的研究。
參考文獻:
[1] 陳福貴.統(tǒng)計思想雛議[j]北京統(tǒng)計, 2004,(05) .
1關于統(tǒng)計學
統(tǒng)計學是一門實質性的社會科學,既研究社會生活的客觀規(guī)律,也研究統(tǒng)計方法。統(tǒng)計學是繼承和發(fā)展基礎統(tǒng)計的理論成果,堅持統(tǒng)計學的社會科學性質,使統(tǒng)計理論研究更接近統(tǒng)計工作實際,在國家和社會得到廣泛發(fā)展。
2 統(tǒng)計學中的幾種統(tǒng)計思想
2.1 統(tǒng)計思想的形成
統(tǒng)計思想不是天然形成的,需要經歷統(tǒng)計觀念、統(tǒng)計意識、統(tǒng)計理念等階段。統(tǒng)計思想是根據(jù)人類社會需求的變化而開展各種統(tǒng)計實踐、統(tǒng)計理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計思想。
2.2 比較常用的幾種統(tǒng)計思想
所謂統(tǒng)計思想,就是統(tǒng)計實際工作、統(tǒng)計學理論及應用研究中必須遵循的基本理念和指導思想。統(tǒng)計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想?,F(xiàn)分述如下:
2.2.1 均值思想
均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統(tǒng)計學理論,是統(tǒng)計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發(fā)展趨勢,避免個別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。
2.2.2 變異思想
統(tǒng)計研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計方法就是要認識事物數(shù)量方面的差異。統(tǒng)計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
2.2.3 估計思想
估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹?shù)谋匾襟E。
2.2.4 相關思想
事物是普遍聯(lián)系的,在變化中,經常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯(lián)的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯(lián)的。
2.2.5 擬合思想
擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現(xiàn)得非常復雜,這種方法就是對規(guī)律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數(shù)量上所體現(xiàn)的模式和基于此而預示的可能性”。
2.2.6 檢驗思想
統(tǒng)計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規(guī)律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征的假設是否可信。
2.3 統(tǒng)計思想的特點
作為一門應用統(tǒng)計學,它從數(shù)理統(tǒng)計學派汲取新的營養(yǎng),并且越來越廣泛的應用數(shù)學方法,聯(lián)系也越來越密切,但在統(tǒng)計思想的體現(xiàn)上與通用學派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現(xiàn)出:(1)統(tǒng)計思想強調方法性與應用性的統(tǒng)一;(2)統(tǒng)計思想強調科學性與藝術性的統(tǒng)一;(3)統(tǒng)計思想強調客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計思想強調定性分析與定量分析的統(tǒng)一。
3 對統(tǒng)計思想的一些思考
3.1 要更正當前存在的一些不正確的思想認識
英國著名生物學家、統(tǒng)計學家高爾頓曾經說過:“統(tǒng)計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統(tǒng)計學可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現(xiàn)實問題可能要比想象的復雜得多。此外,有些人認為方法越復雜越科學,在實際的分析研究中,喜歡簡單問題復雜化,似乎這樣才能顯示其科學含量。其實,真正的科學是使復雜的問題簡單化而不是追求復雜化。與此相關聯(lián)的是,有些人認為只有推斷統(tǒng)計才是科學,描述統(tǒng)計不是科學,并延伸擴大到只有數(shù)理統(tǒng)計是科學、社會經濟統(tǒng)計不是科學這樣的認識。這種認識是極其錯誤的,至少是對社會經濟統(tǒng)計的無知。比利時數(shù)學家凱特勒不僅研究概率論,并且注重于把統(tǒng)計學應用于人類事物,試圖把統(tǒng)計學創(chuàng)建成改良社會的一種工具。經濟學和人口統(tǒng)計學中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產。
3.2要不斷拓展統(tǒng)計思維方式
統(tǒng)計學是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數(shù)據(jù)信息(尤其是不完全甚至劣質的信息)去產生新的知識或去驗證一個假設,即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結論。歸納推理是要在數(shù)據(jù)信息的基礎上透過偶然性去發(fā)現(xiàn)必然性。演繹推理是對統(tǒng)計認識能力的深化,尤其是在根據(jù)必然性去研究和認識偶然性方面,具有很大的作用。
3.3深化對數(shù)據(jù)分析的認識
任何統(tǒng)計研究都離不開數(shù)據(jù)分析。因為這是得到統(tǒng)計研究結論的必要環(huán)節(jié)。雖然統(tǒng)計分析的形式隨時代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計分析的目的卻一直沒有改變。對統(tǒng)計數(shù)據(jù)分析的原因有以下三個方面:一是基于同樣的數(shù)據(jù)會得出不同、甚至相反的分析結論;二是我們所面對的分析數(shù)據(jù)有時是缺損的或存在不真實性;三是我們所面對的分析數(shù)據(jù)有時則又是海量的,讓人無從下手。雖然統(tǒng)計數(shù)據(jù)分析已經經歷了描述性數(shù)據(jù)分析(DDA)、推斷性數(shù)據(jù)分析(IDA)和探索性數(shù)據(jù)分析(EDA)等階段,分析的方法技術已經有了質的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數(shù)據(jù)分析的認識,圍繞“準確解答特定問題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開展數(shù)據(jù)分析方法技術的研究。
參考文獻
[1] 陳福貴.統(tǒng)計思想雛議[J]北京統(tǒng)計, 2004,(05) .
2統(tǒng)計學中的幾種統(tǒng)計思想
2.1統(tǒng)計思想的形成
統(tǒng)計思想不是天然形成的,需要經歷統(tǒng)計觀念、統(tǒng)計意識、統(tǒng)計理念等階段。統(tǒng)計思想是根據(jù)人類社會需求的變化而開展各種統(tǒng)計實踐、統(tǒng)計理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計思想。
2.2比較常用的幾種統(tǒng)計思想
所謂統(tǒng)計思想,就是統(tǒng)計實際工作、統(tǒng)計學理論及應用研究中必須遵循的基本理念和指導思想。統(tǒng)計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想?,F(xiàn)分述如下:
2.2.1均值思想
均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統(tǒng)計學理論,是統(tǒng)計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發(fā)展趨勢,避免個別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。
2.2.2變異思想
統(tǒng)計研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計方法就是要認識事物數(shù)量方面的差異。統(tǒng)計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
2.2.3估計思想
估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹?shù)谋匾襟E。
2.2.4相關思想
事物是普遍聯(lián)系的,在變化中,經常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯(lián)的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯(lián)的。
2.2.5擬合思想
擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現(xiàn)得非常復雜,這種方法就是對規(guī)律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數(shù)量上所體現(xiàn)的模式和基于此而預示的可能性”。
2.2.6檢驗思想
統(tǒng)計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規(guī)律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征的假設是否可信。
2.3統(tǒng)計思想的特點
作為一門應用統(tǒng)計學,它從數(shù)理統(tǒng)計學派汲取新的營養(yǎng),并且越來越廣泛的應用數(shù)學方法,聯(lián)系也越來越密切,但在統(tǒng)計思想的體現(xiàn)上與通用學派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現(xiàn)出:(1)統(tǒng)計思想強調方法性與應用性的統(tǒng)一;(2)統(tǒng)計思想強調科學性與藝術性的統(tǒng)一;(3)統(tǒng)計思想強調客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計思想強調定性分析與定量分析的統(tǒng)一。
3對統(tǒng)計思想的一些思考
3.1要更正當前存在的一些不正確的思想認識
英國著名生物學家、統(tǒng)計學家高爾頓曾經說過:“統(tǒng)計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統(tǒng)計學可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現(xiàn)實問題可能要比想象的復雜得多。此外,有些人認為方法越復雜越科學,在實際的分析研究中,喜歡簡單問題復雜化,似乎這樣才能顯示其科學含量。其實,真正的科學是使復雜的問題簡單化而不是追求復雜化。與此相關聯(lián)的是,有些人認為只有推斷統(tǒng)計才是科學,描述統(tǒng)計不是科學,并延伸擴大到只有數(shù)理統(tǒng)計是科學、社會經濟統(tǒng)計不是科學這樣的認識。這種認識是極其錯誤的,至少是對社會經濟統(tǒng)計的無知。比利時數(shù)學家凱特勒不僅研究概率論,并且注重于把統(tǒng)計學應用于人類事物,試圖把統(tǒng)計學創(chuàng)建成改良社會的一種工具。經濟學和人口統(tǒng)計學中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產。新晨
3.2要不斷拓展統(tǒng)計思維方式
統(tǒng)計學是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數(shù)據(jù)信息(尤其是不完全甚至劣質的信息)去產生新的知識或去驗證一個假設,即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結論。歸納推理是要在數(shù)據(jù)信息的基礎上透過偶然性去發(fā)現(xiàn)必然性。演繹推理是對統(tǒng)計認識能力的深化,尤其是在根據(jù)必然性去研究和認識偶然性方面,具有很大的作用。
3.3深化對數(shù)據(jù)分析的認識
任何統(tǒng)計研究都離不開數(shù)據(jù)分析。因為這是得到統(tǒng)計研究結論的必要環(huán)節(jié)。雖然統(tǒng)計分析的形式隨時代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計分析的目的卻一直沒有改變。對統(tǒng)計數(shù)據(jù)分析的原因有以下三個方面:一是基于同樣的數(shù)據(jù)會得出不同、甚至相反的分析結論;二是我們所面對的分析數(shù)據(jù)有時是缺損的或存在不真實性;三是我們所面對的分析數(shù)據(jù)有時則又是海量的,讓人無從下手。雖然統(tǒng)計數(shù)據(jù)分析已經經歷了描述性數(shù)據(jù)分析(DDA)、推斷性數(shù)據(jù)分析(IDA)和探索性數(shù)據(jù)分析(EDA)等階段,分析的方法技術已經有了質的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數(shù)據(jù)分析的認識,圍繞“準確解答特定問題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開展數(shù)據(jù)分析方法技術的研究。
參考文獻:
[1]陳福貴.統(tǒng)計思想雛議[J]北京統(tǒng)計,2004,(05).