時間:2023-11-18 10:08:44
導言:作為寫作愛好者,不可錯過為您精心挑選的10篇統(tǒng)計學大數據分析,它們將為您的寫作提供全新的視角,我們衷心期待您的閱讀,并希望這些內容能為您提供靈感和參考。
【關鍵詞】大數據 高中統(tǒng)計 數據分析 內容數據鏈
大數據的價值性,快速性,大量性,多樣性,和預測功為教育提供了一種可能目前教育的形式多種多樣,慕課、微課、網絡公開課等等。大數據時代下的教育是怎樣的呢?是基于個性化學習,是量化的,自我組織學習內容的教育,不僅要了解學生“心聲”,認知水平和學習興趣,而且要師生互動、合作探討學習內容,將傳統(tǒng)課程、教學、教材的內容數據化,利用可視化技術,提高學習興趣。提升內容吸引力。高中統(tǒng)計內容必須系統(tǒng)化、過程方法直觀化,這對高中的統(tǒng)計內容提出了挑戰(zhàn)。使專題塊和課程案例集以數據知識鏈為核心,使教育在大數據時代下的“量化”。
一、高中統(tǒng)計內容的新契機是大數據
使教育由數字支撐變化到數據支撐。高中統(tǒng)計教學場景布置,統(tǒng)計內容設計,學習場景的變革等等過去靠“敲腦袋”或者“理念靈感加經驗”的東西,在背景為物聯(lián)網、云計算、大數據下,變成一種由數據支撐的“行為科學”.用數據分析的方法對高中統(tǒng)計內容進行分析、挖掘,利用大數據更改高中統(tǒng)計內容,建立主線為“統(tǒng)計知識鏈”、目標為培養(yǎng)“數據分析能力”首尾呼應內容數據鏈,使高中統(tǒng)計內容的系統(tǒng)更加優(yōu)化。
由于各種原因使高中統(tǒng)計內容,沒有得到較好的發(fā)展.直到國家教育部頒布了各種政策,統(tǒng)計才得以發(fā)展.然而各種問題的存在仍然困擾著我國統(tǒng)計教學發(fā)展。大數據關注每一位學生的個性化需求與發(fā)展,關注學生的自我意識,分析群體心理,讓教師關注學生的興趣愛好,選擇適合學生的方法,讓學生自主的、創(chuàng)新的學習。
正如教育家張韞所說:“大數據時代的到來,讓社會科學領域的發(fā)展和研究從宏觀群體逐漸走向微觀個體,讓追蹤每一個人的數據成為可能,從而讓研究每一個個體成為可能.對于教育研究者來說,我們將比任何時候都更接近發(fā)現(xiàn)真正的學生。”大數據在充分了解學生各種需求,目前處于的狀態(tài)的情況下合理運用各種統(tǒng)計內容,各種現(xiàn)代化的教學方式,不拘泥于傳統(tǒng)化教學方式,利用各種資源形成螺旋式上升的統(tǒng)計內容數據鏈。使每一位學生都樂于學習,其個性化學習需求成為可能。
二、高中統(tǒng)計內容數據鏈在大數據視域下的內涵
數據高中統(tǒng)計內容的核心研究對象,數據分析是重點,統(tǒng)計學習是在初中的基礎上,進一步學習數據統(tǒng)計方面的各種方法;用各種操作培養(yǎng)學生的歸納推斷能力、統(tǒng)計思維、數據分析素養(yǎng),提升學生在數據分析方面的能力,統(tǒng)計內容數據鏈為學生統(tǒng)計能力的提升提供了研究平臺。把課程目標,學生需求、與大數據算法,數據鏈式結構有機結合起來是大數據視域下的統(tǒng)計內容數據鏈核心思想,利用大數據,將統(tǒng)計內容數據化,增強內容的可讀性,銜接性、合理性、連貫性,織成統(tǒng)計知識,形成統(tǒng)計內容數據鏈。例如:具體環(huán)節(jié)為:鏈宿是“樣本估計總體、”等數據分析方法,鏈源是“系統(tǒng)抽樣,等距抽樣、分層抽樣”,鏈節(jié)是的數據描述、統(tǒng)計圖形.通過統(tǒng)計知識的實際應用使“統(tǒng)計知識鏈”為統(tǒng)計內容數據鏈的內化,“統(tǒng)計能力鏈”為其外化,“統(tǒng)計能力鏈”,“統(tǒng)計素養(yǎng)鏈”為其發(fā)展,成為對學生產生重大影響的“統(tǒng)計思想鏈”所以,利用大數據的科學方法可使統(tǒng)計內容體系最終形成的統(tǒng)計思想體系;數據結構的鏈式模型,將促進學生創(chuàng)新思維,增強學生的參與積極性,使高中統(tǒng)計集“知識鏈、能力鏈、素養(yǎng)鏈、思想鏈”于一體。
三、高中統(tǒng)計內容大數據視域下下的數據鏈設計
(一)高中數學統(tǒng)計內容知識結構
各種版本的高中數學統(tǒng)計內容都介紹了基本的獲取樣本數據的獲取,提取方法,就是我們常說的用樣本推斷總體,部分推斷整體.統(tǒng)計知識注重培B學生數據分析的能力,利用實例講解數據的各種思想,方法結合在一起,提高學生的綜合能力。例如:結合具體問題情境,學習如何進行數據收集,分析,如何思維理解其含義。
(二)高中數學統(tǒng)計內容的教學要求
課標充分重視高中數學統(tǒng)計內容,并采取了有效的改進和創(chuàng)新措施。教學過程中,注重學生自我特長的發(fā)展,創(chuàng)新教學方式,不拘泥于傳統(tǒng)的書本知識,強調以人為本,面向未來,讓學生有數據意識,學會用數據說話,將統(tǒng)計知識運用于實踐。
(三)高中統(tǒng)計內容在大數據視域下數據鏈設計
量化教育是大數據時代的可行教育,通過數據了解學生的個性化需求,促進學生的個性發(fā)展,注重創(chuàng)新式培養(yǎng)。結合教材利用現(xiàn)代化信息技術設計出學生樂于接受的教學方式。從“數據讀心”,到“抓心入心”,再到“知心交心”,最終形成“數據育心”的培養(yǎng)鏈是統(tǒng)計內容數據鏈的設計原則。例如:分層抽樣內容數據鏈的設計.首先,將分層抽樣知識系統(tǒng)化。其次,將分層抽樣的過程方法直觀化。最后,依據統(tǒng)計內容數據鏈的設計原則和學生個性化學習需求,動態(tài)生成分層抽樣內容數據鏈。把具體問題數據化。使分層抽樣內容數據鏈成為滿足自我發(fā)展需要的“知識鏈、方法鏈、素材鏈”。
四、結語
綜上所述,對統(tǒng)計內容數據我們應該就地取材,因地制宜,開創(chuàng)多種方式的教學方式,注重學生的個性化需求,不要拘泥于傳統(tǒng)的教材,注重培養(yǎng)學生的創(chuàng)新思維和自主參與能力,要讓學生發(fā)揮主觀能動性,積極主動的自己去思索,發(fā)展自己的特長,學會將具體的事情數據化不用數據的思想去思考問題,去看世界,老師也要探索更好的教學方法。將現(xiàn)代化的科學技術與傳統(tǒng)枯燥的教材相結合創(chuàng)造出一種能夠發(fā)揮學生潛能,特長的教學方式,要循循善誘,引導學生??傊?,統(tǒng)計內容數據鏈能更好地使學生不斷提升自己的數據分析“能力鏈”使學生學會用統(tǒng)計思想、統(tǒng)計方法、統(tǒng)計思維、統(tǒng)計觀念、統(tǒng)計意識來認識世界,改造世界。
參考文獻:
近年來,移動互聯(lián)網、大數據等信息技術發(fā)展日新月異,已經成為推動教育變革的重要力量。移動通信終端的普及為學生營造了泛在英語學習環(huán)境,大數據技術開啟了個性化智能教育時代,翻轉課堂、MOOC、微課等新型教學模式層出不窮,雖然它們不能取代傳統(tǒng)教學模式,但英語教師必須與時俱進,重視信息技術對傳統(tǒng)英語課堂的改造和提升,以全新的視角思考英語教學的變革方向。
一、研究理論概述
1.泛在學習理論
泛在學習是指任何人在任何時間和任何地點都可以通過泛在網絡實現(xiàn)任何知識內容的學習。泛在網絡和泛在計算技術為人類實現(xiàn)隨時隨地的泛在學習提供了技術保障,信息技術和教育技術的融合發(fā)展正深刻改變著知識的傳播方式和學生的學習方式,不斷重構著教育和學習的生態(tài)環(huán)境。一方面,移動通信終端的多元化發(fā)展解除了傳統(tǒng)英語學習對地點的約束,翻轉課堂、MOOC等新型教學模式使學生可以自由地選擇學習時間、進度、內容和學習方式。另一方面,傳統(tǒng)教學設備正在向數字教學設備變遷,教育領域信息基礎設施建設有效地推動跨區(qū)域教學資源整合,海量的多媒體教學內容必須和學生的碎片化時間有效結合,教師需要針對不同學情的學生進行精準施策和差異化施策。
2.學習生態(tài)理論
學習生態(tài)是由學習群體及其所處的環(huán)境共同構成的生態(tài)系統(tǒng)。系統(tǒng)由信息技術、多媒體教學設施等支撐,通過以合作、交流、共享、互動為特征的教育實踐,實現(xiàn)知識信息傳遞和有效學習,從而促進系統(tǒng)的不斷優(yōu)化。學生與學習環(huán)境、學生和學習群體之間密切聯(lián)系、相互作用,通過知識的吸納、內化、創(chuàng)新、外化、反饋等過程實現(xiàn)有效學習[1]。在泛在學習的背景下,學習生態(tài)研究的是教育信息、學習主體、教師、教育信息環(huán)境之間相互作用的生態(tài)系統(tǒng),需要從教育信息化建設和應用的視角研究各個生態(tài)系統(tǒng)成員之間的相互作用規(guī)律,維護生態(tài)系統(tǒng)的平衡發(fā)展。
3.有效學習理論
有效學習是指學生在教師的指導下,針對學習內容采取適合自己的學習策略,積極主動地參與到學習過程中,高效率地完成知識建構,從而實現(xiàn)學習目標并優(yōu)化自身知識結構的學習行為。有效學習是對學習內容、學習方法、學習過程、學習結果的價值追求[2],學生可以實現(xiàn)對知識的深層次理解和靈活應用。學習內容的優(yōu)化在大數據背景下表現(xiàn)為對海量學習內容的篩選、清洗與轉化[3],使之滿足學生的學習需要。學習方法調整是建立在對學生學習情況進行多元評價的基礎上,根據學生個人學習偏好、認知習慣、學習方式、情感態(tài)度因素、學習內容的變化而動態(tài)進行的。學習過程的積極參與是指學生能夠積極主動地學習,充分和師生進行合作、交流,善于提出問題、分析問題和解決問題。學習評價是學生改變學習計劃、優(yōu)化學習方法的重要手段,對學生學習可以起到引導、激勵、啟示和教育作用。
二、當前英語泛在學習模式存在的主要問題
1.傳統(tǒng)課堂教學和線上教學環(huán)節(jié)缺乏有效銜接
首先,魍晨翁媒萄Ш拖呱轄萄г誚萄Ы謐?、肿R范圍上沒有有效銜接。例如,學生不知道如何在線上學習課堂上沒有掌握的知識點,或者在線上環(huán)節(jié)重復學習課堂中已經掌握的知識點。其次,缺乏對課堂英語學習和個性化英語自主學習的融合創(chuàng)新設計。在傳統(tǒng)課堂教學中,整齊劃一的教學標準無法滿足英語學習分層分級的差異化教學要求。不同學情的學生對學習時間、空間、內容、方式的需求不盡相同,教師在教學中沒能和學生線上學習的大數據分析結果進行有效的融合對接,僅根據自身的教學經驗和主觀判斷作為實施因材施教的依據,因此其決策缺乏精準性和穩(wěn)定性。
2.泛在學習缺乏生態(tài)性系統(tǒng)設計,學生英語泛在學習的用戶黏性不高
當前泛在學習過程特別是在線學習過程缺乏師生互動性、社交互動性、線上線下互動性。泛在學習僅停留在將文字、圖像、視頻等教學資料數字化、網絡化、集成化和泛在化的階段,這在某種程度上增加了學生英語學習的選擇性和便利性,但缺乏針對不同學生的學習黏性設計,因此泛在學習效果并不理想。
3.英語泛在學習體系缺乏具有“參與感”和“現(xiàn)場感”的語言學習環(huán)境
建構主義理論認為,知識的獲得是在學習環(huán)境的特定情境作用下,借助教師的幫助與學習伙伴的協(xié)作,通過意義的建構過程實現(xiàn)的。因此在英語泛在學習過程中,必須增強學生在特定情境下的溝通和交際活動的參與性[4]。例如,如果在英語課程設計和在線學習設計環(huán)節(jié),鼓勵學生廣泛參與學習內容、學習方法、學習偏好的設計,就會讓學生感受到教師對學生的愛與尊重,從而增強學生學習的主動性和積極性,使不同學情的學生都能在學習過程中體驗自我實現(xiàn)感,實現(xiàn)自主學習。另外,教師缺乏對學生多元需求的感知和把握,缺乏語言鍛煉的“現(xiàn)場感”設計,使學生無法在接近真實生活情境的語言環(huán)境中得到語言交際鍛煉。
三、基于大數據分析的英語泛在學習生態(tài)系統(tǒng)
移動通信和大數據分析技術的發(fā)展為有效解決當前英語泛在學習模式存在的問題提供新的方式和途徑。基于大數據分析的英語泛在學習生態(tài)系統(tǒng)以學生的英語學習需求、特征、習慣、喜好等大數據挖掘為切入點,聯(lián)合學校、互聯(lián)網教育機構、教材編寫人員、教師、信息化支撐機構、教育管理機構、在校學生和在職學員等生態(tài)系統(tǒng)成員共同把泛在學習落實到教學環(huán)境、模式設計、資源開發(fā)、評價機制和管理機制等工作中,不僅僅是教育內容資源和信息的共享空間,而且是實施素質教育和個性化學習的公共服務平臺。因此,本文構建了基于大數據分析的英語泛在學習生態(tài)系統(tǒng),主要包括大數據采集、大數據存儲、大數據分析、大數據應用四個子系統(tǒng),并構建了系統(tǒng)體系結構模型(圖1)。
1.大數據采集子系統(tǒng)
首先,大數據采集子系統(tǒng)要實現(xiàn)數據、文字、圖像、音頻、視頻、多媒體等結構化數據和非結構化數據采集,實現(xiàn)跨區(qū)域、跨機構、跨教學環(huán)節(jié)的數據互聯(lián)互通和數據采集功能,解決教育數據資源配置效率不高的問題。其次,實現(xiàn)英語教學設計、教學實施、課程內容建設、網絡學習內容資源建設、語料庫建設、學生學習認知過程監(jiān)控、學生學習情感態(tài)度監(jiān)控和學習評價等全教學鏈條的數據采集功能,為生態(tài)系統(tǒng)成員之間的共生發(fā)展提供良好的數據資源基礎。
英語教學設計數據主要采集教師按照教學大綱和教學目標要求對不同學生制定的學習內容、學習進度、學習路徑等數據,厘清學生在課堂上和網絡上分別學什么、在哪學、怎么學的問題。教學過程數據主要采集教師在教學中幫助學生解決英語學習問題的經驗、做法和策略,包括情感態(tài)度、認知因素的調控、語言情境的構建、師生的有效互動等。課程內容數據主要是采集教師、學校、互聯(lián)網教育機構課程教學內容數據,包括教材內容、課件、題庫、案例等授課內容資料,以及以上資料經過碎片化處理的數據資料。
網絡資源數據庫主要采集互聯(lián)網、校園網上英語學習方面的相關資料。英語語料庫數據主要采集中國學習者英語語料庫、美國當代英語語料庫等語料庫內容,以及英語教材、英美小說、散文、演說詞、電影劇本、新聞稿等英文自然語料。學習行為數據庫主要采集學生課堂學習行為和線上學習行為數據。課堂學習行為包括是否預習、復習等,線上學習行為數據采集學習日志、學習習慣、學習時長和學習路徑等。學習評價數據主要采集教師或者在線學習系統(tǒng)對學生的學習能力、學習方法、學習策略運用、學習過程和學習結果的評價數據。學習情感態(tài)度數據主要是通過問卷、訪談等方式采集影響學生英語語言習得的動機、態(tài)度、焦慮、自信等指標。
2.大數據存儲子系統(tǒng)
大數據存儲子系統(tǒng)主要實現(xiàn)對大數據采集子系統(tǒng)采集的海量結構化、非結構化數據進行數據清理、歸檔、壓縮,實現(xiàn)一體化數據存儲??梢詫崿F(xiàn)跨區(qū)域、跨系統(tǒng)的英語泛在學習數據的融合,解決不同教學機構、數據結構、操作系統(tǒng)帶來的信息孤島問題。英語學習數據倉庫是指集成了大數據分析子系統(tǒng)和應用子系統(tǒng)決策分析所需的泛在學習數據,這些數據是按照一定的英語學習主題進行組織,是在對原有分散的各類英語泛在學習數據庫數據進行加工、匯總和整理后得到的,有效地消除了各類源數據中的不一致性,所以英語學習數據倉庫的信息均是關于學生英語泛在學習全局情況的一致性信息。數據倉庫的這些全局性信息同r通過網絡云平臺實現(xiàn)英語泛在學習數據的云端存儲,可以直接由大數據應用子系統(tǒng)調用。
3.大數據分析子系統(tǒng)
認知因素和情感因素是影響英語習得效果的兩個重要方面。大數據分析子系統(tǒng)首先結合學生應該達到的學習目標對學生個體的英語學習認知行為和學習的情感態(tài)度進行數據挖掘,分析學生的動機、態(tài)度、焦慮、自信、興趣等情感因素,以及學習毅力、能力、習慣、方法、英語水平和常犯錯誤等認知行為因素,對數據挖掘結果進行聚類運算和分類處理,根據學生的學習認知行為和學習態(tài)度情況將學生細分,以識別不同學生之間相似的泛在學習需求,以及某個學生個體在不同學習階段泛在學習需求的差異性。同時,大數據分析子系統(tǒng)會對學生的學習過程和學習結果進行動態(tài)綜合評價,并根據學習評價結果判斷學習方案的優(yōu)劣,有針對性地進行線上和線下學習方案的調整。
4.大數據應用子系統(tǒng)
大數據應用子系統(tǒng)包括學習信息推送系統(tǒng)、學習信息定制系統(tǒng)、在線互動學習系統(tǒng)、語言情境仿真系統(tǒng)、知識關聯(lián)推薦系統(tǒng)、知識精準搜索系統(tǒng)、知識樹形管理系統(tǒng)和娛樂在線學習系統(tǒng)等應用。學生可以通過學習終端連接到相關應用系統(tǒng)進行英語語言知識的有效學習。學習信息推薦系統(tǒng)自動推薦給學生的學習信息是學生應掌握而目前未掌握的英語知識。學習信息定制系統(tǒng)可以滿足學生根據自身學習需求而定制某類主題的學習信息。學生一方面通過在線互動學習系統(tǒng)可以和輔導教師進行交流互動,解決學習中遇到的問題,另一方面可以通過社交軟件實現(xiàn)和其他學習者的溝通和交流,共享英語學習經驗。
語言情境仿真系統(tǒng)可以實現(xiàn)某類主題的英語學習情境的在線仿真,讓學生在接近真實環(huán)境的英語語言情境中進行英語交際鍛煉。知識關聯(lián)推薦系統(tǒng)是根據學生所學知識點,自動關聯(lián)推薦對應的拓展知識點。知識精準搜索系統(tǒng)可以幫助學生快速實現(xiàn)英語知識的精準有效搜索,從而進行有針對性的學習。知識樹形管理系統(tǒng)可以實現(xiàn)學生已掌握知識和未掌握知識的樹形目錄管理,實現(xiàn)線上學習和課堂學習知識管理的無縫鏈接。
基于大數據分析的英語泛在學習生態(tài)系統(tǒng)有利于充分發(fā)揮信息技術對傳統(tǒng)英語教育的改造提升作用,可以有效促進信息技術與教學過程、內容、方法和教學評價體系的深度融合。在生態(tài)系統(tǒng)的價值取向上注重以促進學生全面健康發(fā)展為中心,注重需求導向的個性化學生培養(yǎng)模式。在學生習得效果評價體系上注重加強學習過程評估,強調過程評估和結果評估相結合。系統(tǒng)注重充分挖掘學生的個體差異,充分挖掘學生的學習潛能,圍繞學生英語學習習慣的形成和學習情感態(tài)度的培養(yǎng),以現(xiàn)代信息技術為輔助手段,將英語語言知識進行碎片化、情境化、可視化處理,通過采取教育信息推送、關聯(lián)推薦和定制化相結合的方式實現(xiàn)知識的在線傳播,給學生提供個性化、定制化的英語學習信息服務,帶給學生全新的英語泛在學習體驗。
參考文獻
[1] 張豪鋒,卜彩麗.略論學習生態(tài)系統(tǒng)[J].中國遠程教育,2007(4).
[2] 曹貞.以有效學習為目標的大學課堂教學[J].教育與職業(yè),2007(26).
一、引言
“數據,已經滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來?!保溈襄a咨詢公司)大數據時代已經到來了,決策將日益基于數據和分析而做出,而并非基于經驗和直覺。大數據應用已經在商業(yè)、經濟等領域取得了顯著的成功。而在目前,教育領域中,各種數字學習環(huán)境的普及和推廣,越來越多的人員在網絡環(huán)境下發(fā)生學習行為。學習者與學習系統(tǒng)之間,學習者與學習者之間,學習者與設備之間,每天都在發(fā)生大量的交互數據,這些數據有著海量的數據規(guī)模(Volume)、多樣的數據類型(Variety)、快速的數據流動和動態(tài)的數據體系(Velocity)、巨大的數據價值(Value),這些都符合大數據的4V特性。海量的數據給傳統(tǒng)教育數據的存儲和分析都帶來了巨大的挑戰(zhàn)。如何通過技術手段對教育大數據進行分析處理,使教育領域的方方面面都受益,最終有效促進教與學,已經越來越受到研究者的重視。而學習分析理念的提出,為教育大數據的應用找到了很好的途徑。
二、學習分析概述
早在2010年美國新媒體聯(lián)盟的《地平線報告》中就預測學習分析技術將在未來的四到五年內成為主流。第一屆學習分析和知識國際會議認為:學習分析技術是測量、收集、分析和報告有關學生及其學習環(huán)境的數據,用以理解和優(yōu)化學習及其產生的環(huán)境的技術。
學習分析所服務的對象涉及教育系統(tǒng)的各個相關人員,學習者、教育者、教育研究者、教育管理者、學習服務提供者等等。使用數據挖掘、社會網絡分析、統(tǒng)計分析等多種技術對教育大數據進行解釋和分析,根據解釋與分析的結果,評估學習者的學習進展,預測未來的表現(xiàn),并發(fā)現(xiàn)潛在問題,以便學習者能更準確地把握自己的學習情況,優(yōu)化學習過程,教育者能及時調整教學活動和教學內容,優(yōu)化教學方法和教學策略,為學生提供個性化的教學資源與建議,同時也能為教育管理者的決策提供科學依據。國外對學習分析技術的研究已經取得了一定的效果,而國內還處在理論研究和綜述階段?;诮逃髷祿膶W習分析系統(tǒng)的構建可以為學習分析的應用和實踐提供重要指導,更好地提高學習效率,有效促進教與學。
三、學習分析系統(tǒng)的總體架構
國內外許多學者都從不同角度對學習分析進行了整體框架的設計,但每個框架都有其局限性,經過實踐驗證的框架依然很少。學習分析的基礎和核心是海量的教育數據。圍繞數據開展數據的采集、存儲、分析、表示以及應用五個環(huán)節(jié)的活動。本文以數據為核心,依據數據流動的過程來構建一個更加靈活和可擴展的學習分析系統(tǒng)的架構模型(見圖1所示)。
圖1 學習分析系統(tǒng)架構圖
學習者的學習行為發(fā)生在各種數字環(huán)境中,如傳統(tǒng)的學習管理系統(tǒng)、網絡課程以及開放學習環(huán)境(MOOCs)等,社會性學習系統(tǒng),如博客,微博,各種社交網絡等。交互當中所產生的數據都會被記錄到原始數據庫中,而原始數據來源眾多,形式不一,存儲和處理都有困難。通過聚集、抽樣、維歸約、離散化和二元化等預處理,讓原始數據更加適合挖掘,將預處理得到的學習數據存儲到學習數據庫中,與學習者相關的一些基本數據存儲在學生信息庫中。在特定的時間中學習分析引擎會從學習數據庫和學生信息庫中獲取數據進行分析,依據需求不同,在分析過程中使用不同的數據挖掘和分析工具及模型。分析結果作用于學習者、教育者、研究者、教育管理者等不同層次,提供相應的教育干預,學習內容和過程、教學設計和策略優(yōu)化。當然,分析結果也要以報告或可視化圖表等形式在展示平臺輸出。
四、結束語
學習分析是大數據技術在教育領域中的應用。在大數據技術的支持下,深度挖掘學習行為模式,交互數據之間所隱藏的潛在價值,學習質量分析,個性化教學內容推送等都將成為可能。在對學習分析進行不斷深入研究的同時,也存在許多挑戰(zhàn)。如何快速有效地收集和預處理來源多樣的原始數據,使用哪種工具、算法能更準確地得到有效預測,如何做到保護學生隱私等,都是我們要考慮的問題。相信這些挑戰(zhàn)都將在不久的將來得到解決。
【參考文獻】
[1]Barwick H.The “four Vs” of Big Data.Implementing Information Infrastructure Symposium[EB/OL].2012-10-02.
1 引言
隨著計算機科學技術的不斷進步,數字信息化的時代已經到來,21世紀是信息化全球大爆發(fā)的時代,信息全球化已經滲透到生活的每個角落,校園作為人口比較密集的場所,很多高校都在投入大量的人力以及財力用于校園信息數字化網絡的建設,校園數字化網絡的建設為校園數字化網絡管理提供了足夠的保證,能夠進一步提高各高校的信息化管理水平。
高校數字化建設是完全建立在高校的校園網網絡的基礎上,目前,校園網絡已經實現(xiàn)了光纖入網的條件,校園數字化建設能夠完全將目前比較先進的互聯(lián)網技術、信息技術、多媒體技術融為一體,充分地將校園的科研工作、管理工作、生活以及教學等工作集成起來形成一個統(tǒng)一的整體,最終為高校的全面信息化教學打下堅實的基礎。
高校數字化網絡的建設實質上是借助先進的信息化技術將高校的各個部門的各種信息資源進行有效的整合、集成以及優(yōu)化,進一步提升高校的信息資源的合理利用以及配置。
2 校園一卡通
校園一卡通是“數字化校園”建設的最為重要的組成部分,校園一卡通具備的主要功能必須包括身份認證功能、數據管理功能、金融服務功能、綜合消費功能、公共信息管理功能等。校園一卡通能夠有效地集成高校內的所有資源以及子系統(tǒng),通過校園一卡通能夠掌握每一個持卡用戶動態(tài)的、實時的情況,不僅能夠加快高校數字化管理系統(tǒng)建設的進度,還能夠進一步提升高校的數字化管理水平。
校園一卡通數字信息管理系統(tǒng)的建設是IC卡技術應用比較成功的典范之一。真正意義上的校園一卡通并不僅要具備消費以及結算功能,而是通過智能的數字化管理實現(xiàn)高校內的各種業(yè)務管理。校園一卡通必須能夠將高校內的消費以及管理集成與一身才可以稱之為真正實現(xiàn)了校園一卡通管理,才能通過校園卡實現(xiàn)校園內的學籍管理、消費、結算、身份識別、網上付費等。
3 校園一卡通建設
校園一卡通是目前高校流通非常廣泛的信息集成平臺,也是目前大部分高校所采用的信息管理平臺。校園一卡通管理系統(tǒng)建設是建立在“集中控制、信息共享”的需求上的,因此,校園一卡通系統(tǒng)的設計是多個信息功能模塊的有效集成,具體實現(xiàn)的設計思路是將所管理的資源集成在統(tǒng)一的互聯(lián)網平臺,并采用統(tǒng)一的數據庫服務器,對資源采用絕對安全的、統(tǒng)一的身份ID認證體系,進而實現(xiàn)信息數據的安全集成、安全傳輸、安全管理。校園一卡通可以通俗的理解為各個管理系統(tǒng)、射頻設備、讀卡設備等終端的高效集成,進一步提升了系統(tǒng)管理的智能化水平。
隨著各個高校的校園信息化、網絡化建設的逐漸深入,高校內的所有信息資源的整合過程已經進入到了全面的規(guī)劃以及實施階段,現(xiàn)階段。校園一卡通的建設必須與高?,F(xiàn)有的人事、教學、身份認證等MIS系統(tǒng)以及其余的高校信息應用系統(tǒng)緊密的結合,通過全面的、安全的統(tǒng)一身份認證機制實現(xiàn)高校信息資源的無縫集成及其共享,使得校園一卡通能夠友好的融入校園,成為校園信息化建設的非常重要的組成部分,通過校園一卡通的有機整合,能夠有效地避免高校的不必要投入,進一步提高高校的信息化建設進度,為高校系統(tǒng)之間資源的無縫共享打下堅實的基礎。
4 校園一卡通數據管理
校園一卡通的核心部分內容便是數據,數據信息資源的安全將直接影響到整個校園一卡通系統(tǒng)的安全運行。數據存儲行為是校園一卡通在高校校園中應用的最重要的數字化行為,數據IC卡存儲的數據不僅包括純粹的相關數據信息,還包括功能信息、系統(tǒng)運行狀態(tài)信息、系統(tǒng)交互之間產生的交換數據以及各個功能模塊產生的歷史記錄信息,數據信息的安全存儲是確保校園一卡通能夠正常運行各個功能模塊的關鍵保障,數據存儲行為不是簡單的將數據入庫操作,更重要的是采用合理的數據加密技術措施以及認證機制確保相關數據的安全,為系統(tǒng)的安全性防護添加一層核心屏障,除此之外,信息資源數據的安全存儲行為貫穿到整個系統(tǒng)的設計、研發(fā)、實現(xiàn)、實施、管理等各個階段,甚至包括硬件資源的選取都必須嚴格遵守對應的安全策略。
校園一卡通數據的安全傳輸是數據數字化行為的又一重要屬性,特別是涉及到財務的相關數據。因此,數據的安全傳輸必須建立在專有的局域網內,必須在物理以及軟件上實現(xiàn)局域網與外部網絡的完全隔離,數據在傳輸的過程中必須采用各種安全措施以確保傳輸的數據不被修改,比如信道簽名、數字簽名等。
除此之外,校園一卡通的數據管理行為還必須具備數據恢復功能,由于網絡的突然故障或者系統(tǒng)的嚴重故障經常會造成數據丟失或者損壞,校園一卡通的數據管理必須建立完善的歷史數據備份記錄,能夠自行修復損壞數據,使得系統(tǒng)運行數據正確、可靠、穩(wěn)定。
5 校園一卡通消費行為
現(xiàn)階段,校園一卡通在各個高校中應用的最為廣泛的便是高校的消費管理上,可以將其理解為高校學生以及教職員工的“電子錢包”。高校校園一卡通消費管理系統(tǒng)采用目前先進的IC卡信息載體,對高校中的學生以及教職工消費行為進行有效的管理。
校園一卡通消費管理系統(tǒng)的建設是實現(xiàn)高校各個部門以及后勤管理服務部門信息化建設的關鍵手段,能夠將后勤服務以及消費管理相關資源進行優(yōu)化、整理、重構,進而實現(xiàn)后勤資源以及管理資源的合理配置,將復雜的、種類繁多的各種資源充分的利用起來,幫助高校的后勤管理以及校務管理實現(xiàn)過程的高效協(xié)調、合理優(yōu)化,進而實現(xiàn)大幅度提升校園后勤以及校務的信息管理水平,以進一步提升后勤以及校務的服務效率以及高校的效益。
高校員工以及學生的消費行為是后勤管理工作的重點。校園一卡通消費信息管理系統(tǒng)的建設能夠有效地緩解校務以及后勤管理工作的繁重業(yè)務,簡化校務以及后勤的工作流程,實現(xiàn)以較少的人力資源實現(xiàn)全校的合理化管理的目的,在提高后勤服務質量的同時,也實現(xiàn)了精簡校園后后勤以及校務管理人員的目的,一定程度上降低了高校的整體管理經費。
校園一卡通消費信息管理系統(tǒng)很大程度上提升了高校的財務管理水平,也實現(xiàn)了高校財務的無紙化辦公,消費管理系統(tǒng)的建設能夠有效地規(guī)范高校內的費用結算管理,進而確保財務的正確管理,有效地規(guī)避了一些漏洞,不僅提高了財務的管理水平,還進一步改善了財務管理的工作模式,使得高校的消費行為更加靈活多變,一定程度上提升了高校財務以及消費的管理水平。
目前,校園一卡通的消費行為實現(xiàn)了食堂飲食消費,超市購物消費,飲水消費、洗澡消費、個人醫(yī)療消費、四六級考試報名消費、有償上級消費、個人賬戶自助存款消費等,基本上實現(xiàn)了高校的可以消費的所有領域。
6 校園一卡通身份認證行為
校園一卡通在高校中應用的另外一個重要數字行為便是身份認證管理,校園一卡通系統(tǒng)需要將校園網網絡內的各個子系統(tǒng)有機融合,因此需要將各自獨立的相關驗證進行統(tǒng)一管理,采用統(tǒng)一的認證機制對用戶身份進行統(tǒng)一管理,用戶身份的認證以及授權目前校園一卡通研究的重點領域。
校園一卡通的身份識別系統(tǒng)采用目前比較先進的智能卡技術,通過用戶身份信息的識別實現(xiàn)高校校內門鎖的控制、門禁的控制、重要安全通道的控制、校內各項考勤制度的管理、參會人員的會議簽到等,并在此基礎上有機地結合了安全防范相關技術措施以及計算機網絡控制技術措施,通過軟件系統(tǒng)的高效管理實現(xiàn)對校園一卡通用戶身份的安全認證和識別。
門禁管理系統(tǒng)是控制和管理校內人員出入的有效措施,通過該系統(tǒng)能夠準確有效地對校內人員的出入進行數字化控制,最重要的是確保了校區(qū)各個場所的安全,很大程度上提升了持卡用戶身份識別的正確性以及效率。
考勤管理系統(tǒng)能夠及時地將學生的上課出勤率反饋到學校,還能夠有效的考察教職員工的出勤情況,通過考勤管理系統(tǒng)能夠有效的實現(xiàn)教務課程的合理化安排,能夠提高學生以及教職員工的出勤情況,實時掌握學生在校的一切活動。
校園一卡通的身份認證功能模塊的實現(xiàn)能夠真正意義上實現(xiàn)校園網網絡用戶的的身份信息的安全存儲以及數據共享。網絡認證技術是現(xiàn)階段應用比較廣泛的一套集管理、計費以及認證于一體的安全性極高的綜合性網絡信息管理系統(tǒng),網絡認證與校園一卡通的有效集成是未來校園一卡通身份認證的發(fā)展趨勢,涉及到高校內的每個校園一卡通的用戶,身份認證系統(tǒng)的整合能夠有效的加速高校網絡數字信息化建設的進度。
7 結束語
隨著各個高校實現(xiàn)校園數字現(xiàn)代化管理意識的不斷加強,高校校園管理數字化建設進度也變得愈加強烈,基于智能芯片應用的計算機網絡信息化管理系統(tǒng)也變得越來越普及,高校學員以及教職員工眾多,往往持有大量的傳統(tǒng)的卡片以及不同的證件,比如學生證、圖書證、上機證等,一定程度上增加了高校的管理成本,還使得學生的管理水平變得異常混亂。
傳統(tǒng)的校園管理模式已經無法滿足現(xiàn)階段的教育模式。信息時代當然離不開教育信息化管理。校園一卡通強大的功能能夠有效地融合高校內的一切資源以及子系統(tǒng),能夠實現(xiàn)校園系統(tǒng)以及資源的有機集成,真正意義上的實現(xiàn)校園的數字化系統(tǒng)建設,使得數字化行為軌跡深入到高校數字化管理的方方面面。
參考文獻
[1] 宋文功,楊培敏. “數字化校園”與“校園一卡通”關聯(lián)的實現(xiàn)[J]. 長沙鐵道學院學報(社會科學版). 2006(01).
[2] 趙震偉. 數字化校園一卡通系統(tǒng)的研發(fā)[J].思茅師范高等??茖W校學報. 2009(03).
[3] 王正坤,蔣濤濤. 試論基于數字化校園的一卡通系統(tǒng)的構建[J].農業(yè)網絡信息,2009(08).
[4] 王筱超,王蔚.校園一卡通平臺的規(guī)劃與建設研究[J].現(xiàn)代計算機(專業(yè)版). 2009(05).
隨著大數據時代的到來,各企業(yè)采用了新的策略,獲得了更多的利潤。對于統(tǒng)計專業(yè)來說,改變發(fā)展策略,使培養(yǎng)出來的專業(yè)人才能夠適應大數據背景的需求是其主要任務。目前,高校統(tǒng)計學專業(yè)逐漸認識到大數據時代綜合性人才培養(yǎng)的重要性,并對專業(yè)建設進行了相關改革。
一、大數據時代對統(tǒng)計學的影響
大數據時代的到來對現(xiàn)代統(tǒng)計專業(yè)的發(fā)展造成了新的沖擊,要確保培養(yǎng)出來的人才能夠起到應有的作用,首先要了解大數據時代對統(tǒng)計專業(yè)所造成的影響。
(一)大數據時代使數據結構和數據性質發(fā)生變化
網絡技術以及基于網絡技術的電子商務等新的數據記錄模式標志著大數據時代的到來。大數據時代,不再依賴于抽樣調查的記錄模式,網站瀏覽、視頻監(jiān)控都將形成大量數據。傳統(tǒng)的數據結構甚至是數據性質發(fā)生了變化。大量的數據信息對于需求者來說,如何甄別其可用價值成為關鍵。傳統(tǒng)的數據可以二維表格顯示和整理。但大數據時代所產生的數據具有多樣化和復雜化特征,往往包含了大量的音頻、視頻、HTML等。這要求大數據的收集具有較強的目的性,才能實現(xiàn)其價值。
(二)大數據時代要求統(tǒng)計分析方法和統(tǒng)計思維更新
大數據時代的主要特征為數據多且復雜,數據分析要求分析者對總體進行分析。在這一背景下,參數統(tǒng)計不再具有意義,假設檢驗法也隨著總體分析而失去價值。數據的復雜化對傳統(tǒng)大數據統(tǒng)計思維造成了巨大的沖擊,要求統(tǒng)計者具有活躍的思維。只有對傳統(tǒng)數據的改變進行分析,并且樹立新的統(tǒng)計方法。
二、大數據時代下的統(tǒng)計學發(fā)展新策略
為適應大數據時代的需求,統(tǒng)計學專業(yè)的發(fā)展勢必要對傳統(tǒng)模式進行改革。目前,多數高校統(tǒng)計學專業(yè)已經認識到大數據對于其發(fā)展帶來的沖擊。為此,本文提出了以下策略,以及能夠幫助統(tǒng)計學取得更好發(fā)展。
(一)加強統(tǒng)計應用性教學
根據大數據時代數據的總體分析特征,數據分析人員應掌握全面的分析方法。在人才培養(yǎng)過程中,應致力于培養(yǎng)實踐分析能力,提高數據和資料收集能力,并且培養(yǎng)其強烈的數據價值觀,使其能夠從眾多數據中找到所需的。另外,對傳統(tǒng)模式進行改革,增加大數據統(tǒng)計內容,以適應時代的需求?;诖髷祿慕Y構特點,實施資料透視化教學,提高分析者對復雜數據的分析能力。
(二)培養(yǎng)大數據統(tǒng)計思維
在人才培養(yǎng)過程中,新的統(tǒng)計思維的培養(yǎng)具有重要意義,即強調數據分析實踐能力的提高。統(tǒng)計思維的培養(yǎng)有助于數據分析者對復雜的數據進行區(qū)分,從而整理有效信息。在大數據時代,不僅要以傳統(tǒng)的平均思維、動態(tài)思維和變異思維為基礎,還要注重基于整體分析的大數據思維。另外,還要培養(yǎng)數據分者的復雜性思維,以應對復雜的數據庫。總之,大數據時代需要數據分析者具有全面的、創(chuàng)新性的思維。
(三)強化基礎性統(tǒng)計知識
統(tǒng)計學自身具有復雜性,其改變多且抽象?;A的統(tǒng)計知識是進一步掌握大數據分析思維的基礎,可見學習基礎性統(tǒng)計知識的重要性是不言而喻的。為此,應該采取深入淺出的方法,利用多媒體等方式使復雜的數據統(tǒng)計清晰化、簡單化。結合具體的案例使數據分析者正確認識統(tǒng)計概念、掌握統(tǒng)計原理和方法。此外大數據分析不再是一種專業(yè),而是更傾向于一種技術,這要求我們將大數據分析與統(tǒng)計學以外的相關知識相互聯(lián)系。注重真實相關與偽相關的講解,強調商務智能的開發(fā)和分析。只有具有堅實的基礎,才能確保數據分析者大數據分析思維的養(yǎng)成,適應現(xiàn)代社會的需求。
(四)加強復合型人才培養(yǎng)
為適應大數據時代的需求,復合型人才的培養(yǎng)是關鍵。所謂復合型人才,是指其不但要具有專業(yè)的數據分析能力,還要相應的具備管理以及其從事專業(yè)的技術。大數據時代,高校應建立全面的人才培養(yǎng)模式,注重培養(yǎng)人才的數據分析能力、編程能力等,使其真正了解大數據,懂得如何利用大數據對其所處的行業(yè)起到積極作用才是關鍵。總之,大數據時代對綜合性人才具有更高的需求,大數據時代不僅培養(yǎng)的是一種能力,而且是一種思維,是對全新模式下的數據的分析和利用。高校作為人才培養(yǎng)的重要基地,其教學模式的改革、對大數據時代所需教學模式的認識是高校的主要任務。
三、總結
統(tǒng)計學是經濟學的基礎課程,傳統(tǒng)的統(tǒng)計人才培養(yǎng)具有定向性。而隨著大數據時代的到來,數據產生的形式多樣,且具有復雜性。大數據分析不僅是作為一種專業(yè)存在,而是應以一項必備的技術而存在。大數據時代,傳統(tǒng)的統(tǒng)計思維和統(tǒng)計方法發(fā)生了改變,統(tǒng)計人才培養(yǎng)方式的改革也就勢在必行。(作者單位:海南師范大學)
參考文獻:
[1] 朱懷慶.大數據時代對本科經管類統(tǒng)計學教學的影響及對策[J].高等教育研究,2014(3).
[2] 姚壽福.經濟管理類本科專業(yè)統(tǒng)計學課程教學改革思考[J].高等教育研究,2012(3).
大數據在如今社會已經成為熱點詞匯,不僅在計算機領域,在其他各個行業(yè)都能夠得到運用,為各個行業(yè)提供便捷,為了讓大數據能夠得到充分利用,下文將對大數據分析相關方面進行討論。
一、大數據與大數據時代
(一)大數據大數據是在當今科技飛速發(fā)展的情況下,一種新興的信息數據處理技術。隨著社會科技的進步,各行各業(yè)對于數據的應用也越來越廣泛,傳統(tǒng)的數據處理技術耗時較長且精準度較為低下,已經不能滿足現(xiàn)代科技對數據應用的要求。新時代的大數據系統(tǒng)具有超大的數據容量,同時兼容半結構化與結構化的數據,遠遠超出傳統(tǒng)數據庫管理系統(tǒng)的管理能力。因此新的大數據技術就此誕生。大數據在發(fā)展過程中,具有比為鮮明的特點。與傳統(tǒng)數據處理技術相比,大數據具有數量龐大、多樣化、速率快、價值高的特點。在信息處理的速度不斷加快的當今社會,這樣的特點為大數據的廣泛應用打下了堅實基礎。由于數據的數量較為龐大,且各種數據近年來的增長趨勢呈指數型,其數據的種類和形式也各有不同。其次,合理利用大數據技術,能夠在一定程度上降低成本,提高效率,因此,大數據處理各項關鍵技術的進一步的開發(fā)與利用已成為了提高自身效率,實現(xiàn)核心競爭力的重中之重。
(二)大數據時代大數據時代是指在物聯(lián)網技術、計算機技術、數據信息處理技術的基礎上,通過互聯(lián)網途徑,大量收集并處理分析數據資源,而形成一種新型的信息時代。大數據時代的主要核心內容是對龐大的數據體系進行處理以發(fā)揮價值,從而提升數據分析效率以及數據應用價值。大數據時代是由多種信息技術共同組成,可以有效地避免數據處理中不同步、使用不方便的情況發(fā)生,具有高效可靠的數據處理、整合、分析及匯總的功能。因此,大數據時代的新型數據處理技術可最大程度的對數據進行分析與挖掘,極大提高處理數據的效率。
二、大數據時代與統(tǒng)計學
(一)大數據時代與統(tǒng)計學的關系統(tǒng)計工作是集數據的搜集、整理、分析和解釋為一體的系統(tǒng)的過程。大數據與統(tǒng)計二者互相依存,通過統(tǒng)計的方法和原理對數據進行整理和分析,提高數據的精確度和適用度,以此來實現(xiàn)數據的價值和利用率。由此看來,大數據與統(tǒng)計學的聯(lián)系既緊密,又存在區(qū)別。大數據與統(tǒng)計學的關系甚為密切,它們都是關于數字的學科。統(tǒng)計學為大數據提供了了施展方向,而大數據將統(tǒng)計學引領至更深更廣的空間。共性之一就是社會與數據。幾乎所有的行業(yè)與大數據都有著密切聯(lián)系,這些聯(lián)系或直接或間接,而人們正是通過獲取數據并進行分析,從而才能得到商業(yè)知識和社會服務等能力。大數據與統(tǒng)計學的區(qū)別。首先,信息規(guī)模不同。大數據的分析對象是與某事物有關聯(lián)的所有數據,要求數據量龐大。統(tǒng)計學則是用樣本來分析和推斷總體的數量特征。在大數據時代,則可以通過各種方法和渠道獲得全面而又完整的的信息資料,從而完成更多從前無法完成的事情。其次,動靜標準不同。數據經過了搜集、整理、分析的過程就很有可能因為精確性不足而被認為失去了用處。而大數據時代,則不必再擔心這個問題,數據的精確性和原始性不在被過分重視,人們可以接受復雜數據。第三,數據搜集形式不同。在以往數據搜集形式主要是抽樣調查,方法局限。而在大數據時代,特點是信息爆炸和互聯(lián)網飛速發(fā)展,這一情況得到改觀。最后,思維方式不同。大數據時代人們的思維發(fā)生轉變,人們開始更多的關注事物的相關關聯(lián)。
(二)大數據對統(tǒng)計學研究工作的影響首先,大數據豐富了統(tǒng)計學的研究對象。在大數據時代,我們既可以以結構化數據作為測量單位對文本、圖像和視頻等進行分析,還可以對非結構化數據實行分析。其次,大數據影響了統(tǒng)計學的工作進程。統(tǒng)計數據需求豐富,原有的統(tǒng)計抽樣分析不能在適應時代的發(fā)展,而現(xiàn)代科技方法如透過傳感器自動收集數據等方法取代了傳統(tǒng)方法,更加便捷有效。
三、大數據數據分析理念
中圖分類號:C8 文獻標識碼:A 文章編號:1674-098X(2017)01(c)-0136-02
近年來,對大數據的研究和應用已經受到我國各界人士的廣泛關注,國家統(tǒng)計局已經把信息處理技術列為關鍵性的創(chuàng)新技術工程之一。隨著我國大型計算機的迅速發(fā)展,處理大規(guī)模的復雜數據的能力逐漸提升,從這些大數據中提取有效信息的能力也逐步加強,毫無疑問,我國進入大數據時代的腳步將會進一步加快,人們將會感受到大數據時代下給其帶來的生活、工作上的便利。
1 大數據和大數據時代簡介
1.1 大數據
大數據是指遠大于一般數據的巨量資料,需要人們通過全新的處理模式才能獲取其中有價值的數據信息。“大數據”這一概念最早由維克托在《大數據時代》一書中引用得來,最開始對其定義為:不通過傳統(tǒng)的隨機分析方法直接對所有數據進行分析處理,主要有大量、高速、多樣和價值4個特征。
大數據可以分為大數據技術、大數據工程、大數據科學和大數據應用等領域。目前受到最多應用的是大數據技術和大數據應用。人們通過收集數據,提取有效信息就可以為企業(yè)發(fā)展或者社會活動提供最有效的實施途徑。因此,可以這樣說,在大數據的王國里,最成功的企業(yè)就是那些善于運用機遇的公司。
1.2 大數據時代
大數據時代是建立在信息時代的基礎上,通過互聯(lián)網、物聯(lián)網等渠道廣泛搜集海量數據資源并對其進行存儲、提取和展示。在大數據時代,幾乎所有人都能夠享受從任一數據中獲得所需要的信息,大數據時代也具有社會性、廣泛性、公開性和動態(tài)性4個特征。大數據時代的發(fā)展將會引領社會眾多領域和行業(yè)的變革,對人類的生產、生活方式產生深遠影響。
在大數據時代下,傳統(tǒng)的數據分析思想已經不再適用,應該做出改變。首先,應該轉變抽樣思想,大數據時代下的樣本即總體,已經不再依靠少量樣本分析事物的相關規(guī)律;其次,要轉變數據精確測量的思想,大數據時代要學會接受繁冗復雜的多樣性數據;最后要轉變探究事物的因果關系思想,轉為研究事物的相關規(guī)律。以上思想的轉變,均與統(tǒng)計學有關,因此,下面將分析大數據對統(tǒng)計學帶來的具體影響。
2 大數據對統(tǒng)計學研究工作的影響
2.1 大稻莘岣渙送臣蒲У難芯慷韻
大數據影響的領域范圍非常廣泛,在大數據時代,不僅能夠對以結構數據為度量單位的客觀主體,還可以對不能用數據衡量關系的文本、圖片、音像等非結構數據進行分析,大大擴展了傳統(tǒng)統(tǒng)計學的研究范疇。
2.2 大數據影響統(tǒng)計學的工作進程
統(tǒng)計學是對所搜集的數據進行整理和歸納的方法論學科。大數據時代的資料十分豐富,分析數據已經不再需要抽取樣本了,因為數據總體即是樣本。此時,傳統(tǒng)的統(tǒng)計學抽取樣本分析的工作方法已經不再適用,而是被現(xiàn)代化通過傳感器自動采集數據的方法所取代。
3 大數據時代下數據分析理念辨析
3.1 數據分析理念
傳統(tǒng)的數據分析是指用統(tǒng)計學方法將收集的數據資料進行系列分析,以便最大化地開發(fā)數據中的功能,從中提取有價值的數據,再和未經處理的數據進行對比,發(fā)揮數據的作用。大數據時代下的數據分析,由于數據量非常大,數據本身的動態(tài)特性使人們要研究的數據難度加大,因此,大數據時代的數據分析一般利用統(tǒng)計學的理念,采用更廣泛的方法統(tǒng)計和分析數據,以此擺脫對數據樣本的依賴,也可以避免數據的流動性給分析結果帶來的不確定性。大數據時代更加注重數據的增值分析工作,研究數據的未來走向,使其中有價值的數據可以增值,將有效數據有機整合,能夠及時發(fā)現(xiàn)問題和解決問題。
3.2 數據分析的主要程序
3.2.1 數據整理
統(tǒng)計數據的整理主要分為4個步驟:審核統(tǒng)計資料、對資料進行分組、匯總和編制統(tǒng)計表格或圖表、保管和公布。當統(tǒng)計對象為數據資料龐大、類型復雜、要求處理速度快的大數據時,這些步驟就顯得繁冗了,尤其是圖表的繪制是沒辦法實現(xiàn)的,因此,只需要對資料進行審核和存儲。大數據的審核和存儲不同于傳統(tǒng)意義上的數據審核和保存,大數據時代利用先進的現(xiàn)代化工具進行數據的審核和保存。
3.2.2 數據的開發(fā)
傳統(tǒng)數據的樣本量較小,目的主要著眼于解決問題,數據的時效性較強,數據的使用價值會隨時間流逝而降低。而大數據的流動性很強,隨著時間的推移會越來越壯大,而且具有推陳出新、價值重塑的可能,因此,在大數據時代,數據是會不斷增值的,開發(fā)大數據,是一項有重要意義的工作。
3.2.3 數據的應用
其中分別對教育、運輸、消費品、電力、石油與天然氣、醫(yī)療護理、消費金融等進行分析和預測。根據這些行業(yè)的特點,可以總結出大數據挖掘商業(yè)價值的基本方法為:客戶群體細分,為每個群體量定特別的服務;模擬現(xiàn)實環(huán)境,發(fā)掘新的需求的同時提高投資的回報率;降低部門聯(lián)系,提高整條管理鏈條和產業(yè)鏈條的效率;降低服務成本,發(fā)現(xiàn)隱藏線索產品和服務的創(chuàng)新。從圖1中可以看出,大數據的應用群體十分廣泛,能否對獲取的數據及時、迅速處理,對該行業(yè)的發(fā)展具有重要意義。
4 結語
該文主要對大數據時代下數據分析理念進行了相關的分析和研究。首先對大數據及大數據時代的概念做了簡要闡述,接著分析了大數據對統(tǒng)計學的兩點影響,最后分析了大數據時代下的數據分析理念??偠灾?,在現(xiàn)代社會,大數據的應用已經成為時代新的特征,能否從海量數據中提取有價值的信息做出相應的預測,對于企業(yè)或者個人的發(fā)展具有重要意義。
二、數據科學的統(tǒng)計學內涵
(一)理論基礎
數據科學中的數據處理和分析方法是在不同學科領域中分別發(fā)展起來的,譬如,統(tǒng)計學、統(tǒng)計學習或稱統(tǒng)計機器學習、數據挖掘、應用數學、數據密集型計算、密集計算方法等。在量化分析的浪潮下甚至出現(xiàn)了“metric+模式”,如計量經濟學、文獻計量學、網絡計量學、生物統(tǒng)計學等。因此,有學者將數據科學定義為計算機科學技術、數學與統(tǒng)計學知識、專業(yè)應用知識三者的交集,這意味著數據科學是一門新興的交叉學科。但是這種沒有側重的疊加似乎只是羅列了數據科學所涉及到的學科知識,并沒有進行實質性的分析,就好似任何現(xiàn)實活動都可以拆解為不同的細分學科,這是必然的。根據Naur(1960,1974)的觀點,數據科學或稱數據學是計算機科學的一個替代性稱謂。但是這種字面上的轉換,并沒有作為一個獨立的學科而形成。Cleveland(2001)首次將數據科學作為一個獨立的學科提出時,將數據科學表述為統(tǒng)計學加上它在計算技術方面的擴展。這種觀點表明,數據科學的理論基礎是統(tǒng)計學,數據科學可以看作是統(tǒng)計學在研究范圍(對象)和分析方法上不斷擴展的結果。一如統(tǒng)計學最初只是作為征兵、征稅等行政管理的附屬活動,而現(xiàn)在包括了范圍更廣泛的理論和方法。從研究范圍的擴展來看,是從最初的結構型大規(guī)模數據(登記數據),到結構型的小規(guī)模數據(抽樣數據)、結構型的大規(guī)模數據(微觀數據),再擴展到現(xiàn)在的非(半)結構型的大規(guī)模數據(大數據)和關系數據等類型更為豐富的數據。從分析方法的擴展來看,是從參數方法到非參數方法,從基于模型到基于算法,一方面?zhèn)鹘y(tǒng)的統(tǒng)計模型需要向更一般的數據概念延伸;另一方面,算法(計算機實現(xiàn))成為必要的“可行性分析”,而且在很多方面算法模型的優(yōu)勢越來越突出。注意到,數據分析有驗證性的數據分析和探索性的數據分析兩個基本取向,但不論是哪一種取向,都有一個基本的前提假設,就是觀測數據是由背后的一個(隨機)模型生成,因此數據分析的基本問題就是找出這個(隨機)模型。Tukey(1980,2000)明確提到,EDA和CDA并不是替代關系,兩者皆必不可少,強調EDA是因為它被低估了。數據導向是計算機時代統(tǒng)計學發(fā)展的方向,這一觀點已被越來越多的統(tǒng)計學家所認同。但是數據導向仍然有基于模型與基于算法兩種聲音,其中,前文提到的EDA和CDA都屬于基于模型的方法,它們都假定數據背后存在某種生成機制;而算法模型則認為復雜的現(xiàn)實世界無法用數學公式來刻畫,即,不設置具體的數學模型,同時對數據也不做相應的限制性假定。算法模型自20世紀80年代中期以來隨著計算機技術的迅猛發(fā)展而得到快速成長,然而很大程度上是在統(tǒng)計學這個領域之外“悄然”進行的,比如人工神經網絡、支持向量機、決策樹、隨機森林等機器學習和數據挖掘方法。若響應變量記為y,預測變量記為x,擾動項和參數分別記為ε和β,則基于模型的基本形式是:y=f(x,β,ε),其目的是要研究清楚y與x之間的關系并對y做出預測,其中,f是一個有顯式表達的函數形式(若f先驗假定,則對應CDA;若f是探索得到的,則對應EDA),比如線性回歸、Logistic回歸、Cox回歸等??梢姡瑐鹘y(tǒng)建模的基本觀點是,不僅要得到正確的模型———可解釋性強,而且要得到準確的模型———外推預測能力強。而對于現(xiàn)實中復雜的、高維的、非線性的數據集,更切合實際的做法是直接去尋找一個恰當的預測規(guī)則(算法模型),不過代價是可解釋性較弱,但是算法模型的計算效率和可擴展性更強?;谒惴ǖ幕拘问筋愃朴诜菂捣椒▂=f(x,ε),但是比非參數方法的要求更低yx,因為非參數方法很多時候要求f或其一階導數是平滑的,而這里直接跳過了函數機制的探討,尋找的只是一個預測規(guī)則(后續(xù)的檢驗也是基于預測構造的)。在很多應用場合,算法模型得到的是針對具體問題的解(譬如某些參數是被當作一個確定的值通過優(yōu)化算法得到的),并不是統(tǒng)計意義上的推斷解。
(二)技術維度
數據科學是基于數據的決策,數據分析的本質既不是數學,也不是軟件程序,而是對數據的“閱讀”和“理解”。技術只是輔助數據理解的工具,一個毫無統(tǒng)計學知識的人應用統(tǒng)計軟件也可以得到統(tǒng)計結果,但無論其過程還是結果都是可疑的,對統(tǒng)計結果的解釋也無法令人信服?!皬挠嬎銠C科學自身來看,這些應用領域提供的主要研究對象就是數據。雖然計算機科學一貫重視數據的研究,但數據在其中的地位將會得到更進一步的加強”。不可否認,統(tǒng)計分析逐漸向計算機科學技術靠近的趨勢是明顯的。這一方面是因為,數據量快速膨脹,數據來源、類型和結構越來越復雜,迫切需要開發(fā)更高效率的存儲和分析工具,可以很好地適應數據量的快速膨脹;另一方面,計算機科學技術的迅猛發(fā)展為新方法的實現(xiàn)提供了重要的支撐。對于大數據而言,大數據分析丟不掉計算機科學這個屬性的一個重要原因還不單純是因為需要統(tǒng)計軟件來協(xié)助基本的統(tǒng)計分析和計算,而是大數據并不能像早先在關系型數據庫中的數據那樣可以直接用于統(tǒng)計分析。事實上,面對越來越龐雜的數據,核心的統(tǒng)計方法并沒有實質性的改變,改變的只是實現(xiàn)它的算法。因此,從某種程度上來講,大數據考驗的并不是統(tǒng)計學的方法論,而是計算機科學技術和算法的適應性。譬如大數據的存儲、管理以及分析架構,這些都是技術上的應對,是如何實現(xiàn)統(tǒng)計分析的輔助工具,核心的數據分析邏輯并沒有實質性的改變。因此,就目前而言,大數據分析的關鍵是計算機技術如何更新升級來適應這種變革,以便可以像從前一樣滿足統(tǒng)計分析的需要。
(三)應用維度
在商業(yè)應用領域,數據科學被定義為,將數據轉化為有價值的商業(yè)信息①的完整過程。數據科學家要同時具備數據分析技術和商業(yè)敏感性等綜合技能。換句話說,數據科學家不僅要了解數據的來源、類型和存儲調用方式,而且還要知曉如何選擇相應的分析方法,同時對分析結果也能做出切合實際的解釋②。這實際上提出了兩個層面的要求:①長期目標是數據科學家從一開始就應該熟悉整個數據分析流程,而不是數據庫、統(tǒng)計學、機器學習、經濟學、商業(yè)分析等片段化碎片化的知識。②短期目標實際上是一個“二級定義”,即,鼓勵已經在專業(yè)領域內有所成就的統(tǒng)計學家、程序員、商業(yè)分析師相互學習。在提及數據科學的相關文獻中,對應用領域有更多的傾向;數據科學與統(tǒng)計學、數學等其他學科的區(qū)別恰在于其更傾向于實際應用。甚至有觀點認為,數據科學是為應對大數據現(xiàn)象而專門設定的一個“職業(yè)”。其中,商業(yè)敏感性是數據科學家區(qū)別于一般統(tǒng)計人員的基本素質。對數據的簡單收集和報告不是數據科學的要義,數據科學強調對數據多角度的理解,以及如何就大數據提出相關的問題(很多重要的問題,我們非但不知道答案而且不知道問題何在以及如何發(fā)問)。同時數據科學家要有良好的表達能力,能將數據中所發(fā)現(xiàn)的事實清楚地表達給相關部門以便實現(xiàn)有效協(xié)作。從商業(yè)應用和服務社會的角度來看,強調應用這個維度無可厚非,因為此處是數據產生的土壤,符合數據科學數據導向的理念,數據分析的目的很大程度上也是為了增進商業(yè)理解,而且包括數據科學家、首席信息官這些提法也都肇始于實務部門。不過,早在20世紀90年代中期,已故圖靈獎得主格雷(JimGray)就已經意識到,數據庫技術的下一個“大數據”挑戰(zhàn)將會來自科學領域而非商業(yè)領域(科學研究領域成為產生大數據的重要土壤)。2008年9月4日刊出的《自然》以“bigdata”作為專題(封面)探討了環(huán)境科學、生物醫(yī)藥、互聯(lián)網技術等領域所面臨的大數據挑戰(zhàn)。2011年2月11日,《科學》攜其子刊《科學-信號傳導》、《科學-轉譯醫(yī)學》、《科學-職業(yè)》專門就日益增長的科學研究數據進行了廣泛的討論。格雷還進一步提出科學研究的“第四范式”是數據(數據密集型科學),不同于實驗、理論、和計算這三種范式,在該范式下,需要“將計算用于數據,而非將數據用于計算”。這種觀點實際上是將數據從計算科學中單獨區(qū)別開來了。
三、數據科學范式對統(tǒng)計分析過程的直接影響
以前所謂的大規(guī)模數據都是封閉于一個機構內的(數據孤島),而大數據注重的是數據集間的關聯(lián)關系,也可以說大數據讓孤立的數據形成了新的聯(lián)系,是一種整體的、系統(tǒng)的觀念。從這個層面來說,將大數據稱為“大融合數據”或許更為恰當。事實上,孤立的大數據,其價值十分有限,大數據的革新恰在于它與傳統(tǒng)數據的結合、線上和線下數據的結合,當放到更大的環(huán)境中所產生的“1+1>2”的價值。譬如消費行為記錄與企業(yè)生產數據結合,移動通訊基站定位數據用于優(yōu)化城市交通設計,微博和社交網絡數據用于購物推薦,搜索數據用于流感預測、利用社交媒體數據監(jiān)測食品價等等。特別是數據集之間建立的均衡關系,一方面無形中增強了對數據質量的監(jiān)督和約束;另一方面,為過去難以統(tǒng)計的指標和變量提供了另辟蹊徑的思路。從統(tǒng)計學的角度來看,數據科學(大數據)對統(tǒng)計分析過程的各個環(huán)節(jié)(數據收集、整理、分析、評價、等)都提出了挑戰(zhàn),其中,集中表現(xiàn)在數據收集和數據分析這兩個方面。
(一)數據收集方面
在統(tǒng)計學被作為一個獨立的學科分離出來之前(1900年前),統(tǒng)計學家們就已經開始處理大規(guī)模數據了,但是這個時期主要是全國范圍的普查登記造冊,至多是一些簡單的匯總和比較。之后(1920-1960年)的焦點逐漸縮聚在小規(guī)模數據(樣本),大部分經典的統(tǒng)計方法(統(tǒng)計推斷)以及現(xiàn)代意義上的統(tǒng)計調查(抽樣調查)正是在這個時期產生。隨后的45年里,統(tǒng)計方法因廣泛的應用而得到快速發(fā)展。變革再次來自于統(tǒng)計分析的初始環(huán)節(jié)———數據收集方式的轉變:傳統(tǒng)的統(tǒng)計調查方法通常是經過設計的、系統(tǒng)收集的,而大數據是零散實錄的、有機的,這些數據通常是用戶使用電子數碼產品的副產品或用戶自行產生的內容,比如社交媒體數據、搜索記錄、網絡日志等數據流等,而且數據隨時都在增加(數據集是動態(tài)的)。與以往大規(guī)模數據不同的是,數據來源和類型更加豐富,數據庫間的關聯(lián)性也得到了前所未有的重視(大數據的組織形式是數據網絡),問題也變得更加復雜。隨著移動電話和網絡的逐漸滲透,固定電話不再是識別住戶的有效工具變量,相應的無回答率也在增加(移動電話的拒訪率一般高于固定電話),同時統(tǒng)計調查的成本在增加,人口的流動性在增加,隱私意識以及法律對隱私的保護日益趨緊,涉及個人信息的數據從常規(guī)調查中越來越難以取得(從各國的經驗來看,拒訪率或無回答率的趨勢是增加的),對時效性的要求也越來越高。因此,官方統(tǒng)計的數據來源已經無法局限于傳統(tǒng)的統(tǒng)計調查,迫切需要整合部門行政記錄數據、商業(yè)記錄數據、個人行為記錄數據等多渠道數據源,與部門和搜索引擎服務商展開更廣泛的合作。
(二)數據分析方面
現(xiàn)代統(tǒng)計分析方法的核心是抽樣推斷(參數估計和假設檢驗),然而數據收集方式的改變直接淡化了樣本的意義。比如基于瀏覽和偏好數據構建的推薦算法,誠然改進算法可以改善推薦效果,但是增加數據同樣可以達到相同的目的,甚至效果更好。即所謂的“大量的數據勝于好的算法”這與統(tǒng)計學的關鍵定律(大數定律和中心極限定理)是一致的。同樣,在大數據分析中,可以用數量來產生質量,而不再需要用樣本來推斷總體。事實上,在某些場合(比如社會網絡數據),抽樣本身是困難的。數據導向的、基于算法的數據分析方法成為計算機時代統(tǒng)計學發(fā)展無法回避的一個重要趨勢。算法模型不僅對數據分布結構有更少的限制性假定,而且在計算效率上有很大的優(yōu)勢。特別是一些積極的開源軟件的支撐,以及天生與計算機的相容性,使算法模型越來越受到學界的廣泛重視。大數據分析首先涉及到存儲、傳輸等大數據管理方面的問題。僅從數量上來看,信息爆炸、數據過剩、數據泛濫、數據墳墓、豐富的數據貧乏的知識……這些詞組表達的主要是我們匱乏的、捉襟見肘的存儲能力,同時,存儲數據中有利用價值的部分卻少之又少或塵封窖藏難以被發(fā)現(xiàn)。這除了對開采工具的渴求,當時的情緒主要還是遷怨于盲目的記錄,把過多精力放在捕捉和存儲外在信息。在這種情況下,開采有用的知識等價于拋棄無用的數據。然而,大數據時代的思路改變了,開始變本加厲巨細靡遺地記錄一切可以記錄的數據。因為:數據再怎么拋棄還是會越來越多。我們不能通過刪減數據來適應自己的無能,為自己不愿做出改變找借口,而是應該面對現(xiàn)實,提高處理海量數據的能力。退一步,該刪除哪些數據呢?當前無用的數據將來也無用嗎?顯然刪除數據的成本要大于存儲的成本。大數據存儲目前廣泛應用的是GFS、HDFS等基于計算機群組的文件系統(tǒng),它可以通過簡單增加計算機來無限地擴充存儲能力。值得注意的是,分布式文件系統(tǒng)存儲的數據僅僅是整個架構中最基礎的描述,是為其他部件服務的(比如MapReduce),并不能直接用于統(tǒng)計分析。而NoSQL這類分布式存儲系統(tǒng)可以實現(xiàn)高級查詢語言,事實上,有些RDBMS開始借鑒MapReduce的一些思路,而基于MapReduce的高級查詢語言也使MapReduce更接近傳統(tǒng)的數據庫編程,二者的差異將變得越來越模糊。大數據分析的可行性問題指的是,數據量可能大到已經超過了目前的存儲能力,或者盡管沒有大到無法存儲,但是如果算法對內存和處理器要求很高,那么數據相對也就“大”了。換句話說,可行性問題主要是,數據量太大了,或者算法的復雜度太高。大數據分析的有效性問題指的是,盡管目前的硬件條件允許,但是耗時太久,無法在可容忍的或者說可以接受的時間范圍內完成。目前對有效性的解決辦法是采用并行處理。注意到,高性能計算和網格計算也是并行處理,但是對于大數據而言,由于很多節(jié)點需要訪問大量數據,因此很多計算節(jié)點會因為網絡帶寬的限制而不得不空閑等待。而MapReduce會盡量在計算節(jié)點上存儲數據,以實現(xiàn)數據的本地快速訪問。因此,數據本地化是MapReduce的核心特征。
四、結論
(一)數據科學不能簡單地理解為統(tǒng)計學的重命名,二者所指“數據”并非同一概念,前者更為寬泛,不僅包括結構型數據,而且還包括文本、圖像、視頻、音頻、網絡日志等非結構型和半結構型數據;同時,數量級也是后者難以企及的(PB以上)。但是數據科學的理論基礎是統(tǒng)計學,數據科學可以看作是統(tǒng)計學在研究范圍(對象)和分析方法上不斷擴展的結果,特別是數據導向的、基于算法的數據分析方法越來越受到學界的廣泛重視。
(二)從某種程度上來講,大數據考驗的并不是統(tǒng)計學的方法論,而是計算機科學技術和算法的適應性。譬如大數據的存儲、管理以及分析架構,這些都是技術上的應對,核心的數據分析邏輯并沒有實質性的改變。因此,大數據分析的關鍵是計算機技術如何更新升級以適應這種變革,以便可以像從前一樣滿足統(tǒng)計分析的需要。
(三)大數據問題很大程度上來自于商業(yè)領域,受商業(yè)利益驅動,因此數據科學還被普遍定義為,將數據轉化為有價值的商業(yè)信息的完整過程。這種強調應用維度的觀點無可厚非,因為此處是數據產生的土壤,符合數據科學數據導向的理念。不過,早在20世紀90年代中期,已故圖靈獎得主格雷就已經意識到,數據庫技術的下一個“大數據”挑戰(zhàn)將會來自科學領域而非商業(yè)領域(科學研究領域成為產生大數據的重要土壤)。他提出科學研究的“第四范式”是數據,不同于實驗、理論、和計算這三種范式,在該范式下,需要“將計算用于數據,而非將數據用于計算”。這種觀點實際上將數據從計算科學中單獨區(qū)別開了。
2019年12月,農業(yè)農村部、中央網絡安全和信息化委員會辦公室關于印發(fā)《數字農業(yè)農村發(fā)展規(guī)劃(2019-2025年)》的通知,部署了用數字化引領驅動農業(yè)農村現(xiàn)代化,加快農業(yè)農村生產經營、管理服務的數字化改造的發(fā)展戰(zhàn)略,將全面提升農業(yè)農村生產智能化、經營網絡化、管理高效化、服務便捷化水平作為農業(yè)農村發(fā)展的目標[1]。農業(yè)農村的數字化建設離不開專業(yè)人才的培養(yǎng)。農林經濟管理專業(yè)畢業(yè)生的就業(yè)方向主要有農業(yè)經營單位、面向農業(yè)農村的政府管理部門、事業(yè)單位、科研院所等。隨著農業(yè)農村數字化發(fā)展戰(zhàn)略的推進,給傳統(tǒng)的農經人才培養(yǎng)帶來了一系列的挑戰(zhàn)[2]。在數字經濟和智慧農業(yè)的時展背景下,數據分析能力是農經專業(yè)學生重要的核心競爭力。如何提升農經專業(yè)學生數據分析能力,是農經專業(yè)人才培養(yǎng)中面臨的重要課題[3]。
1農業(yè)農村數字化發(fā)展戰(zhàn)略給農經人才培養(yǎng)帶來的挑戰(zhàn)
1.1對農經人才的數據思維的更高要求
在大數據時代,無論是農業(yè)生產經營活動,還是農村的行政管理中都有大量的數據資源。農業(yè)企業(yè)、農業(yè)合作經營組織、農產品產銷數據、農產品溯源數據為農業(yè)經營者提供了生產、物流、銷售環(huán)節(jié)大量的數據資源。經營者需要認識到數據是一種新的生產要素,要調動數據作為生產要素的屬性,讓數據分析為管理決策服務[4]。在數字中國的建設進程中,各級政府部門工作人員通過各級各部門的行政管理智能,收集了大量省、市、區(qū)、縣級的區(qū)域經濟社會發(fā)展數據。社區(qū)網格化管理下收集了微觀層面的農業(yè)經營單位數據、農村常住人口數據、醫(yī)保數據、扶貧數據、農村小額信貸數據。這些數據資源是政府提高行政效率、提高政務服務質量的寶貴資源。
1.2對農經人才的數據分析能力的更高要求
在大數據時代,每天都有海量數據生成,如何能更好地利用這些數據,讓數據能發(fā)揮其為管理決策服務的功能,與數據使用者的數據分析能力是密切相關的。例如,農業(yè)經營單位在農業(yè)生產環(huán)節(jié)的農業(yè)投入數據、農產品銷售數據、電商平臺的客戶反饋評論、農產品庫存的動態(tài)數據,如何整合分析這些數據,要求農業(yè)經營者系統(tǒng)掌握數據分析、數據挖掘、文本分析等多元化的數據分析方法。政府管理部門掌握的農業(yè)人口的遷移數據、農村常住人口網格管理數據、農村居民醫(yī)保數據、扶貧數據等,數據類型豐富,數據量龐雜,如何實現(xiàn)數據庫的整合,要求政府部門工作人員掌握數據庫管理、大數據分析技術。
2農經專業(yè)數據分析課程群建設中存在的問題
2.1課程之間連貫性不足
以筆者所在的高校為例,為農經專業(yè)本科生開設的數據分析類課程,見表1。數據分析課程群包括了通識教育、專業(yè)教育和實踐教育。從目前的課程設置來看,涵蓋了數據庫、統(tǒng)計學、經濟計量學、多元統(tǒng)計、大數據分析等領域,內容豐富。數據庫應用由計算機學院開設,是一門通識教育課程,在授課時教師往往將其視為一門計算機類的入門課程,在教學中沒有針對農經專業(yè)學生的特質,將數據庫的教學與其在農經領域的應用結合起來。學生在學習中往往會覺得該課程與專業(yè)聯(lián)系不夠緊密,教學內容枯燥,缺乏學習興趣。
2.2學生學習的軟件種類繁多,但不夠深入
在統(tǒng)計學和多元統(tǒng)計課程中,學生將學習EXCEL、SPSS或者R語言的應用,在經濟計量學課程中學生將學習Eviews或STATA的應用,在數據挖掘與大數據分析課程中學生將學習Python語言的應用。在每一門課程中學習的軟件都不同,對于軟件的學習缺乏連貫性和延續(xù)性,雖然學生接觸的軟件種類多,但是由于學時所限,每一種軟件都只是入門級的介紹,無法進入到深度學習。
2.3與專業(yè)課學習聯(lián)系不夠緊密,缺乏應用機會
學生缺乏在專業(yè)課學習中運用數據分析類課程所學知識的機會。數據分析類課程主要介紹數據分析方法和軟件的應用,但大部分都安排在第5學期和第6學期。學生在學習了數據分析方法后,缺少在專業(yè)學習領域里運用這些方法的機會。例如學生若要完成產業(yè)經濟學、農業(yè)技術經濟學、農產品國際貿易學的專題研究、課程論文,需要用到統(tǒng)計學、經濟計量學、大數據分析的方法,但在第2-4學期開設大量專業(yè)課的學期,數據分析類課程還沒有開設。若能將數據分析類課程盡量靠前安排,學生可以在后續(xù)的專業(yè)學習、課題研究中運用所學的方法,一方面夯實數據分析技能,另一方面也可以增加學生對專業(yè)課的學習興趣。
2.4排課不夠科學
在大三階段,學生可以選修多元統(tǒng)計、數據挖掘與大數據分析、Python語言三門選修課。但到了大三,學生專業(yè)課的學習任務重,選修課種類考慮繁多,學生選課可能出于興趣、學分安排或者準備考研保研考慮,并不是每一位同學都會選修上述課程。尤其是計算機能力不太強、對數學類課程感到困難的同學,會傾向于選擇難度小的課程。
3基于項目驅動式教學理念的數據分析課程群改革
3.1開展項目驅動式教學的意義
項目驅動教學法是基于行動導向的探究式教學方法,是將真實的或模擬的項目轉化為教學項目,結合課程內容將項目分解為若干工作任務,創(chuàng)設工作情境,引導學生完成任務,進而實現(xiàn)項目教學目標的教學活動[4-5]。項目驅動式教學法最顯著的特點是“以項目為主線、教師為主導、學生為主體”,改變了以往“教師講,學生聽”被動的教學模式,完善了學生主動參與、自主協(xié)作、探索創(chuàng)新的新型教學模式。與傳統(tǒng)教學方法相比,教學實施過程中,學生的目標更清晰明確,可避免傳統(tǒng)課堂教學的被動性,進而提高學生學習知識的興趣和主動性[6]。在數據分析課程群中引入項目驅動教學,一方面能讓學生運用所學的數據分析方法分析現(xiàn)實問題,創(chuàng)設數據分析情境,加深對所學方法的理解和運用,激發(fā)學習興趣,培養(yǎng)自主學習能力;另一方面也可以有針對性地創(chuàng)設圍繞“三農”問題的數據分析項目,讓學生從數據分析中加深對“三農”問題的感性認識,培養(yǎng)對農經專業(yè)學習的興趣,提升對農經專業(yè)的認同度。具體來講,可以從以下方面開展對數據分析課程群的改革[7]。
3.2統(tǒng)籌規(guī)劃教學內容,加強課程間的連貫和遞進
農經專業(yè)數據分析課程群目前主要包括必修課數據庫應用、統(tǒng)計學和經濟計量學,選修課多元統(tǒng)計、數據挖掘與大數據分析,以及實踐課R語言與統(tǒng)計應用、Python語言。統(tǒng)計學教學的重點在于對基礎性的統(tǒng)計方法的運用,經濟計量學教學的重點在于讓學生掌握經濟計量分析的范式,如何利用經濟計量模型開展實證分析。多元統(tǒng)計強調對復雜多維數據信息的提煉。數據挖掘與大數據分析教學的重點在于大數據時代數據挖掘方法的應用。此外,針對于目前學生所學的軟件門類過多,軟件操作不夠熟練,建議在統(tǒng)計學、多元統(tǒng)計、數據挖掘大數據分析中統(tǒng)一采用R語言進行教學,讓學生通過幾門課程的學習,能夠熟練掌握一種統(tǒng)計分析軟件。
3.3基于項目驅動對教學內容進行整合及優(yōu)化,調動學生主動參與
例如統(tǒng)計學課程介紹了基礎性的統(tǒng)計分析方法,在后續(xù)課程經濟計量學、多元統(tǒng)計、數據挖掘與大數據分析中引導學生運用基礎性統(tǒng)計分析方法,對數據進行初步的統(tǒng)計分析和整理,為經濟計量分析、多元統(tǒng)計、數據挖掘做好數據處理上的準備,讓學生體會到關聯(lián)課程中所學知識的聯(lián)結。鼓勵學生積極參與“三下鄉(xiāng)”活動,開展田野調查實踐,圍繞“三農”開展調研,運用統(tǒng)計和計量方法對調研數據進行分析,鼓勵學生參與到教學中來,培養(yǎng)學生的學習興趣,學以致用。
3.4建設“項目驅動”實踐教學模塊
結合農經專業(yè)課程體系,建設數據分析課程群“項目驅動”實踐教學模塊。在農經專業(yè)的課程體系中開設的農業(yè)經濟學、農產品貿易、農村社會學等專業(yè)性課程對大量的“三農”問題進行了探討,這類課程中涉及的城鄉(xiāng)差異問題、收入和消費問題、農產品價格波動、農產品貿易等現(xiàn)實問題的研究,都離不開基于現(xiàn)實數據的定量分析。因此,在農經專業(yè)的數據分析課程群中可以結合教學內容引導學生對專業(yè)課學習中熱點問題的研究,圍繞課程教學大綱,建設“項目驅動”實踐教學模塊,理論聯(lián)系實際,讓學生在研究項目中運用所學的數據分析方法,加深對專業(yè)知識的理解。
4農經專業(yè)數據分析課程群優(yōu)化方案
在大數據時代,數據分析能力是學生的核心競爭力之一。數據分析類課程在建設中要強調理論與實踐的結合,不能只是將教學停留在課堂上,引入體現(xiàn)專業(yè)特色的實踐教學環(huán)節(jié)。可以從以下幾方面開展數據分析課程群的優(yōu)化:第一,數據分析基礎類必修課安排在大一學年。在第1學期,可以安排R入門、Python入門、數據可視化課程,讓學生盡早接觸當前主流的數據分析軟件,激發(fā)學生對R或Python的學習興趣,讓學生自我拓展學習空間。R入門、Python入門、或者數據可視化課程都屬于數據分析的基礎課程,無需其他先修課程。在這一時期,讓學生開始接觸數據分析軟件,學習數據可視化的分析工具,有利于培養(yǎng)學生的數據思維、數據意識和軟件實操能力。第二,將與農經專業(yè)課有關的專業(yè)必修課統(tǒng)計學、經濟計量學安排在第3-4學期學習。統(tǒng)計學課程需要學生先行修讀高等數學和概率論課程,經濟計量學需要學生先行修讀微觀經濟學、宏觀經濟學,因此可安排在第3-4學期。讓學生在掌握了一定經濟管理專業(yè)知識后,可以更好地體會統(tǒng)計學、經濟計量學方法論學科的應用價值。第三,將數據分析進階類選修課多元統(tǒng)計、大數據分析、數據挖掘、機器學習等課程安排在第5-6學期。為高年學生提供豐富的數據分析類選修課,讓學生結合自己的興趣、未來的發(fā)展規(guī)劃學習更加多元化的數據分析技術。鼓勵學生能在專業(yè)論文習作、學科競賽中有更多的機會運用自己所學的數據分析方法,增加學生的收獲感和成就感,挖掘學生的學習潛力。第四,改革課程考核評價體系,采用項目式管理和評估的思路,由學生自主開展一個數據分析項目,從收集數據、提出問題、分析數據到提煉研究結論,開展小組團隊成員互評。教師跟蹤學生的項目開展過程,從學生的學習態(tài)度、投入程度、數據分析質量等綜合評價學生的學習效果。
5結束語
將項目驅動教學引入到農經專業(yè)數據分析課程群的建設,讓學生參與到教學中去,突破傳統(tǒng)教學中“教師教學生學”的局面,讓學生通過參與項目,運用數據分析方法解決項目中的實際問題,激發(fā)學生的學習興趣和潛能,讓學生體會到所學知識的應用價值,讓學生不再對數據分析類課程望而生畏。本文的研究對于農經專業(yè)學生數據分析能力的培養(yǎng)有重要的意義,強調理論與實踐的結合,提高學生數據分析的高階能力,也能為同類課程開展項目驅動教學提供借鑒。
參考文獻:
[1]農業(yè)農村部中央網絡安全和信息化委員會辦公室關于印發(fā)《數字農業(yè)農村發(fā)展規(guī)劃(2019-2025年)》的通知[EB/OL].(2019-12-25)[2020-4-14].
[2]李虹賢.農業(yè)經濟管理專業(yè)人才培養(yǎng)模式創(chuàng)新研究與實踐[J].智慧農業(yè)導刊,2022,2(7):110-112.
[3]馮開文,陶冶.農業(yè)經濟管理專業(yè)實踐教學改革———以中國農業(yè)大學經濟管理學院為例[J].教育現(xiàn)代化,2017,4(23):54-56+63.
[4]杜洪燕,陳俊紅.鄉(xiāng)村振興背景下中國數字農業(yè)高質量發(fā)展路徑研究[J].南方農業(yè),2021,15(21):213-214.
[5]金娥.基于項目式學習的《現(xiàn)代教育技術應用》課程學習框架的設計與實踐研究[D].武漢:華中師范大學,2021.
一、應用統(tǒng)計學的主要步驟和要點
1.1樣本的選擇
樣本是應用統(tǒng)計學方法實踐的首要要素。所有的統(tǒng)計歸納和對比分析都是建立在樣本群的調查之上的。所以樣本的選擇至關重要,既需要具有隨機性,又要有代表性,不能過于偏向某一領域又不能不顧及權重的配比。
1.2統(tǒng)計方法的確定
應用統(tǒng)計學科中有很多統(tǒng)計學的方法,可以對樣本量進行多種處理與計算,既可以簡單分析樣本的分布特征,又能夠從時間序列上獲取其趨勢。而一些復雜的統(tǒng)計學模型則提供了更加精確和量化的對比模擬方案。
1.3統(tǒng)計結果的分析
對統(tǒng)計結果的分析也是統(tǒng)計學應用的重要環(huán)節(jié),在分析時不僅要考慮結果直接體現(xiàn)出來的表面特征,還要學會從表面特征挖掘出其背后可能存在的因素與條件,進而得到一個比較合理科學的解釋。
二、應用統(tǒng)計學在生產實際中的應用表現(xiàn)
2.1應用統(tǒng)計學在經濟學領域的應用
經濟一直是我國發(fā)展過程中重點關注的對象,經濟基礎決定上層建筑,所以有效的把控經濟走勢,快速精準的判斷經濟拐點,果斷堅決的進行經濟指導和干預才是推動和保障我國經濟穩(wěn)步發(fā)展的關鍵。應用統(tǒng)計學作為一門需要使用統(tǒng)計學理論進行現(xiàn)狀分析的學科,恰好可以滿足經濟學發(fā)展的需要。越來越多的經濟分析實例需要建立在完善和科學的統(tǒng)計結果之上,而經濟學專業(yè)的學生也不斷加強自身的統(tǒng)計學相關知識。例如對于金融行業(yè)來說,無論是風險投資還是項目推廣,都需要提前對市場進行預判,對受眾和用戶進行一個大概的了解。應用統(tǒng)計學就能夠在進行樣本選定和調查后,根據長期經驗得到的指數建立模型,分析客戶心理和消費能力等要素,進而為后續(xù)的發(fā)展指明方向。
2.2應用統(tǒng)計學在醫(yī)學領域的應用
2020年一場突發(fā)的公共衛(wèi)生事件牽動著全球人民的心,一種新型的病毒在人群中大肆傳播,造成身體健康的嚴重損害甚至奪去生命,對醫(yī)學領域帶來了巨大的挑戰(zhàn)。這時,應用統(tǒng)計學的知識和理論就為防疫戰(zhàn)疫提供了重要的理論依據。通過前人對類似傳染病的統(tǒng)計結果,建立一個傳染病擴散速率和死亡率等的數量關系,各個參數都由經驗給出,從而就可以針對不同的病毒傳播特征得到一個模型,既可以比較早的對未來情況有一個把握,又能夠為公眾提供一個科普的窗口,提醒人們注意保護和預防。
三、統(tǒng)計學理論在大數據時代的應用
3.1數據分析、統(tǒng)計學理論之間的結合
應用傳統(tǒng)統(tǒng)計抽樣方式,無法對龐雜數據來進行分析、處理,也難以展現(xiàn)出大數據的知識密度,獲取的分析結果自然不夠精確,這無疑會影響數據的挖掘、使用成效。將數據分析、統(tǒng)計學理論之間結合,能夠打破傳統(tǒng)數據分析模式的限制,充分發(fā)揮出大數據的價值。大數據內容多元、混亂,對數據形式準確性要求不高,可以利用統(tǒng)計學分析方式來對比數據變化,同時,大數據對數據精度的要求并不是很高,而是“以量取勝”,更加側重于整體研究,通過數據分析、統(tǒng)計學理論之間的結合融合了兩者優(yōu)勢。
3.2創(chuàng)新數據分析理念
大數據具有價值、多樣、高速、大量4個方面的特點?;诖髷祿治龅奶攸c,既往相關專家總結出了如下公式,即:大數據=高頻海量數據+復雜類型的數據。在大數據時代下,數據分析工作便是對海量數據的分析、歸納、統(tǒng)計、總結,挖掘出其中具有價值的信息和內容,進行對比,以得出具有價值的信息。在數據收集、處理環(huán)節(jié)中,需要進一步創(chuàng)新數據分析渠道,擴充數據來源,對于相關人員而言,要具備數據積累、處理的意識。大數據具有一定的流動性,在時間的流逝下,數據信息數量會繼續(xù)增加,因此,相關人員要具備創(chuàng)新化的數據分析理念,讓數據真正實現(xiàn)增值,以幫助人們更好地解決問題。
四、加強校企深度合作,構建統(tǒng)計專業(yè)學生的培養(yǎng)體系策略
4.1完善校企合作政策法規(guī)保障
首先,政府應以立法的形式完善專業(yè)教育校企合作相關法律法規(guī),通過法律對院校與企業(yè)在開展合作中的責任、義務與權利加以確認,為校企雙方在人才培養(yǎng)方面的深層合作提供制度保障。其次,保證政策“落地”,一方面可通過教育宣講的方式,強化院校、相關企業(yè)以及社會組織等對有關政策的深入了解,從而獲得合作各方的配合與支持;另一方面,在政策實施過程中還要及時收集反饋信息,并針對合作受阻原因,繼續(xù)完善相關政策,保證政策真正“落地”。
4.2開創(chuàng)多元化的合作模式
第一,可通過“產教結合”的方式,這也是當前校企合作的主流模式,主要包括短期性實習、參觀考察、專業(yè)技能競賽等形式。第二,實行“訂單式培養(yǎng)”模式,為企業(yè)定制輸送專業(yè)人才,此模式只能應用于特定合作項目。第三,實行“校企共建”模式,校企雙方通過整合資源,在合作中充分發(fā)揮各自優(yōu)勢,實現(xiàn)校企雙方的良性互動。
4.3打造“雙師”高校教師隊伍