時間:2023-08-20 14:46:43
導(dǎo)言:作為寫作愛好者,不可錯過為您精心挑選的10篇數(shù)據(jù)分析的方法,它們將為您的寫作提供全新的視角,我們衷心期待您的閱讀,并希望這些內(nèi)容能為您提供靈感和參考。
中圖分類號:N37 文獻標(biāo)識碼:B 文章編號:1009-9166(2009)02(c)-0063-02
現(xiàn)代企業(yè)的決策往往是在整合大量信息資料的基礎(chǔ)上制定出來的,對數(shù)據(jù)的理解和應(yīng)用將是企業(yè)決策的基石。與傳統(tǒng)的操作型應(yīng)用相比,數(shù)據(jù)利用的應(yīng)用建設(shè)難度更大,它是隨著管理水平而發(fā)展,同時又取決于業(yè)務(wù)人員的主觀意識,這就決定了以數(shù)據(jù)利用為核心的應(yīng)用建設(shè)不可能一蹴而就,而是一個長期迭展的建設(shè)過程。從2003年起工廠開始全面推進數(shù)據(jù)分析應(yīng)用工作,經(jīng)歷過曲折,同時也有收獲。經(jīng)過多年的努力,工廠的數(shù)據(jù)分析應(yīng)用工作開始進入良性發(fā)展階段,筆者認為有必要對工廠目前數(shù)據(jù)分析應(yīng)用工作作一總結(jié)和思考。
一、工廠數(shù)據(jù)分析應(yīng)用工作開展現(xiàn)狀
工廠數(shù)據(jù)分析應(yīng)用工作推進至今已有四五年的時間,從最初全面調(diào)研工廠數(shù)據(jù)量和數(shù)據(jù)分析應(yīng)用狀況,將數(shù)據(jù)分析應(yīng)用率指標(biāo)作為方針目標(biāo)定量指標(biāo)來考核,到后來將數(shù)據(jù)分析應(yīng)用工作的推進重心從量向質(zhì)轉(zhuǎn)移,采用以項目為載體進行管理,著重體現(xiàn)數(shù)據(jù)分析應(yīng)用的實效性,再到目前以分析應(yīng)用的需求為導(dǎo)向,以分析應(yīng)用點為載體,分層次進行策劃。經(jīng)過上述三個階段,工廠數(shù)據(jù)分析應(yīng)用工作推進機制得到了逐步的完善,形成了廣度深度協(xié)同發(fā)展的信息資源利用管理框架。截止到目前,工廠數(shù)據(jù)分析應(yīng)用率達到96%,四個層次的分析應(yīng)用點共計100多個,數(shù)據(jù)分析應(yīng)用工作在生產(chǎn)、質(zhì)量、成本、物耗、能源等條線得到廣泛開展,有效推動了工廠管理數(shù)字化和精細化。2007年,工廠開始探索細化四個應(yīng)用層次的推進脈絡(luò),進一步豐富工廠信息資源利用框架,形成層次清晰、脈絡(luò)鮮明、職責(zé)分明的信息資源利用立體化的推進思路。
1、第一層次現(xiàn)場監(jiān)控層。第一層次現(xiàn)場監(jiān)控層,應(yīng)用主體是一線工人和三班管理干部,應(yīng)用對象是生產(chǎn)過程實時數(shù)據(jù),應(yīng)用目標(biāo)是通過加強生產(chǎn)過程控制,輔助一線及時發(fā)現(xiàn)生產(chǎn)過程中的異常情況,提高生產(chǎn)穩(wěn)定性。例如制絲車間摻配工段的生產(chǎn)報警,通過對生產(chǎn)過程中葉絲配比、膨絲配比、梗絲配比、薄片配比、加香配比等信息進行判異操作,對異常情況通過語音報警方式提醒擋車工進行異常處理;例如卷包車間通過在機臺電腦上對各生產(chǎn)機組的工藝、設(shè)備參數(shù)、實時產(chǎn)量、質(zhì)量、損耗數(shù)據(jù)的監(jiān)控,提高對產(chǎn)品質(zhì)量的過程控制能力。第一層次應(yīng)用以上位機和機臺電腦上固化的監(jiān)控模型為主,制絲車間每個工序、卷包車間每種機型的應(yīng)用點都有所不同,為此我們建立了制絲車間以工序為脈絡(luò),卷包車間以機種為脈絡(luò)的應(yīng)用點列表,圍繞脈絡(luò)對第一層次應(yīng)用點進行梳理,形成第一層次應(yīng)用的規(guī)范化模板。制絲車間第一層次應(yīng)用點模板包括工序名稱、應(yīng)用點名稱、應(yīng)用模型描述、應(yīng)用對象、應(yīng)用平臺、異常處置路徑等基本要素。卷包車間應(yīng)用點模板橫向根據(jù)機種分,縱向按上班及交接班、上班生產(chǎn)過程中、下班及交接班三個時間段分,通過調(diào)研分別列出擋車工針對每個機種在三個時間段分別要查看的數(shù)據(jù)和進行的操作。隨著模板的擴充和完善,一線職工的知識、經(jīng)驗不斷充實其中,第一層次應(yīng)用點模板將成為一線工人和三班管理干部日常應(yīng)用監(jiān)控的標(biāo)準(zhǔn),同時可以規(guī)避人員退休或調(diào)動帶來的經(jīng)驗、知識流失的風(fēng)險。2、第二層次日常管理分析層。第二層次日常管理分析層,應(yīng)用主體是一般管理干部,應(yīng)用對象是產(chǎn)質(zhì)損、設(shè)備、動能等指標(biāo),應(yīng)用目標(biāo)是通過加強對各類考核指標(biāo)的監(jiān)控和分析,提高工廠整體的關(guān)鍵績效指標(biāo)水平。例如制絲車間的劣質(zhì)成本數(shù)據(jù)匯總和分析,通過對車間內(nèi)各類廢物料、劣質(zhì)成本的數(shù)據(jù)進行匯總、對比和分析,尋找其中規(guī)律及薄弱環(huán)節(jié),并尋根溯源,采取措施,降低劣質(zhì)成本。例如卷包車間的產(chǎn)量分析,通過對產(chǎn)量數(shù)據(jù)、工作日安排、計劃產(chǎn)量進行統(tǒng)計和匯總,結(jié)合車間定額計劃、作業(yè)計劃和實際產(chǎn)量進行分析,尋找實際生產(chǎn)情況與計劃間的差異,并分析原因。第二層次應(yīng)用以管理人員個性化的分析為主,呈現(xiàn)出分析方法多樣化、應(yīng)用工具多樣化的特點。但是萬變不離其中的是每個管理崗位的管理目標(biāo)以及圍繞管理目標(biāo)開展的分析應(yīng)用是相對固定的,至少在短期內(nèi)不會有太大的變化。為此我們建立了一份以重點崗位為脈絡(luò)的應(yīng)用點列表,圍繞脈絡(luò)對第二層次應(yīng)用點進行梳理,形成第二層次應(yīng)用的規(guī)范化模板。模板包括崗位名稱、管理目標(biāo)、應(yīng)用點名稱、應(yīng)用描述、涉及主要考核指標(biāo)、應(yīng)用平臺、應(yīng)用頻次、分析去向等基本要素。通過構(gòu)建第二層次應(yīng)用點模板,明確了每個管理崗位應(yīng)用信息資源支撐管理目標(biāo)的內(nèi)容和職責(zé)。隨著新的管理目標(biāo)的不斷提出以及應(yīng)用的逐步深入,模板每年都會有更新和擴充。3、第三層次針對性分析應(yīng)用層。第三層次針對性分析應(yīng)用層,應(yīng)用主體是項目實施者,應(yīng)用對象是各類項目的實施過程,例如QC項目、六西格瑪項目、質(zhì)量改進項目,或針對生產(chǎn)中的特定事件進行的分析和研究。應(yīng)用目標(biāo)是通過應(yīng)用數(shù)據(jù)資源和統(tǒng)計方法開展現(xiàn)狀調(diào)查、因果分析、效果驗證等工作,提高各類項目實施的嚴(yán)密性和科學(xué)性。第三層次的應(yīng)用工具在使用初級統(tǒng)計方法的基礎(chǔ)上會大量應(yīng)用包括方差分析、回歸分析、正交試驗、假設(shè)檢驗、流程圖等在內(nèi)的中級統(tǒng)計方法。以QC活動為例,我們可以看出其實施過程無一不與數(shù)據(jù)應(yīng)用之間有密切的聯(lián)系[1]。近年來,在質(zhì)量改進項目和QC項目的評審工作中已逐步將“應(yīng)用數(shù)據(jù)說話、運用用正確合理的統(tǒng)計方法,提高解決問題的科學(xué)性”作為項目質(zhì)量考核標(biāo)準(zhǔn)之一。而六西格瑪項目實施的核心思想更是強調(diào)“以數(shù)據(jù)和事實驅(qū)動管理”,其五個階段[2]D(定義)、M(測量)、A(分析)、I(改善)、C(控制),每個階段都要求結(jié)合如FMEA(失效模式后果分析),SPC(統(tǒng)計流程控制),MSA(測量系統(tǒng)分析),ANOVE(方差分析),DOE(實驗設(shè)計)等統(tǒng)計方法和統(tǒng)計工具的應(yīng)用。4、第四層次主題性應(yīng)用層。第四層次主題性應(yīng)用層,應(yīng)用主體是中層管理者,應(yīng)用對象是專業(yè)性或綜合性的分析主題,應(yīng)用目標(biāo)是通過專業(yè)科室設(shè)計的專題性分析模型或綜合性分析模型,為中層管理層提供決策依據(jù)。工廠在實施了業(yè)務(wù)流程“自動化”之后,產(chǎn)生了大量的數(shù)據(jù)和報表。如何將工廠的業(yè)務(wù)信息及時、精煉、明確地陳述給中層管理層,以此來正確地判斷工廠的生產(chǎn)經(jīng)營狀況,是擺在我們眼前的一個突出問題。大家都有開車的經(jīng)驗,司機在駕駛車輛的時候,他所掌握的車況基本上是來自汽車的儀表盤,在車輛行使的過程中,儀表盤指針的變化,告知汽車的車速、油料、水溫等的狀況,駕駛員只要有效地控制這些指標(biāo)在安全范圍之內(nèi),車子就能正常地運行。我們不妨將儀表盤的理念移植于工廠,建立工廠關(guān)鍵指標(biāo)及運行管理儀表盤,將工廠的關(guān)鍵信息直觀地列在上面,及時提醒各級管理人員工廠生產(chǎn)運營是否正常。
⑴關(guān)鍵績效指標(biāo)監(jiān)控系統(tǒng)。對分布在各處的當(dāng)前及歷史數(shù)據(jù)進行統(tǒng)一展示,以工廠關(guān)鍵績效指標(biāo)為中心,支持統(tǒng)計分析和挖掘,可為中層管理者提供工廠關(guān)鍵績效指標(biāo)一門式的查詢服務(wù),使各業(yè)務(wù)部門尋找、闡釋問題產(chǎn)生的原因,以有效監(jiān)控各類關(guān)鍵績效指標(biāo),及時采取改進措施,提高生產(chǎn)經(jīng)營目標(biāo)完成質(zhì)量。⑵系統(tǒng)運行狀態(tài)監(jiān)控系統(tǒng)。通過數(shù)據(jù)采集、手工錄入等各種渠道收集各類系統(tǒng)的運行狀態(tài),及時掌握故障情況,采取措施加以閉環(huán),將因系統(tǒng)故障造成對用戶的影響減至最小,確保各類系統(tǒng)的穩(wěn)定運行和有效應(yīng)用。通過建立系統(tǒng)運行狀態(tài)監(jiān)控系統(tǒng),中層管理人員上班一打開電腦進入系統(tǒng),就能了解到當(dāng)天及上一天各類系統(tǒng)的運轉(zhuǎn)情況,發(fā)生了什么異常,哪些故障已經(jīng)得到解決,哪些故障還未解決。⑶第四層次主題性分析應(yīng)用。在展示關(guān)鍵績效指標(biāo)和系統(tǒng)運行狀態(tài)的基礎(chǔ)上,由各專業(yè)科室思考專業(yè)條線上的分析主題,采用先進科學(xué)的理念和方法對數(shù)據(jù)進行分析和挖掘。近兩年來,工廠充分發(fā)揮專業(yè)科室的優(yōu)勢和力量,相繼設(shè)計和開發(fā)了工藝質(zhì)量條線的六西格瑪測評系統(tǒng),設(shè)備條線的設(shè)備效能分析系統(tǒng),還有質(zhì)量成本核算與分析系統(tǒng)。通過這些分析主題的支持,工廠管理人員可以更方便快捷地了解質(zhì)量、設(shè)備、成本等條線上的關(guān)鍵信息,及時采取相應(yīng)措施,從而提升管理效率。
二、數(shù)據(jù)分析應(yīng)用工作存在的不足及思考
工廠數(shù)據(jù)分析應(yīng)用工作的推進方法從最初的采用數(shù)據(jù)分析應(yīng)用率單個指標(biāo)進行推進發(fā)展到目前按上文所述的四個層次進行推進,每個層次的推進脈絡(luò)已經(jīng)逐步清晰和明朗,但事物發(fā)展到一定的階段總會達到一個瓶頸口,目前工廠數(shù)據(jù)分析應(yīng)用工作存在的問題及措施思考如下:
1、從推進手段上要突破信息條線,充分發(fā)揮專業(yè)條線的力量。信息條線作為推進工廠數(shù)據(jù)分析應(yīng)用的主管條線,其作用往往局限在技術(shù)層面上的支撐。雖然信息條線每年都會規(guī)劃形成工廠數(shù)據(jù)分析應(yīng)用整體的工作思路和具體的實施計劃,但是無論從工廠層面還是從車間層面來講,單純依靠信息條線從側(cè)面加以引導(dǎo)和推進,使得數(shù)據(jù)分析應(yīng)用工作始終在業(yè)務(wù)條線的邊緣徘徊,與產(chǎn)量、質(zhì)量、設(shè)備、消耗、成本、動能等各個條線本身工作的結(jié)合度有一定的距離。所以工廠要進一步推進數(shù)據(jù)分析應(yīng)用工作,調(diào)動起業(yè)務(wù)人員的積極性和主動性,突破現(xiàn)有的瓶頸,應(yīng)該考慮如何調(diào)動起專業(yè)條線的力量。一是可以在年初策劃應(yīng)用點的時候要加強專業(yè)條線對車間業(yè)務(wù)自上而下的指導(dǎo),引導(dǎo)管理人員加強對缺少數(shù)據(jù)分析支撐的工序、崗位/管理目標(biāo)的思考;二是建立平臺加強各車間同性質(zhì)崗位之間的溝通與交流,均衡各個車間的數(shù)據(jù)分析應(yīng)用水平和能力;三是對車間提交的分析報告給出專業(yè)性的指導(dǎo)意見。2、要加強對數(shù)據(jù)中心的應(yīng)用。數(shù)據(jù)中心的建立可以使業(yè)務(wù)系統(tǒng)從報表制作、數(shù)據(jù)導(dǎo)出等功能中解放出來,專注于事務(wù)處理,將數(shù)據(jù)應(yīng)用方面的功能完全交給數(shù)據(jù)中心來解決。目前,數(shù)據(jù)中心已建立了涉及產(chǎn)量、質(zhì)量、消耗等各個條線的Universe模型,并對全廠管理干部進行了普及性的培訓(xùn)。但是從目前應(yīng)用情況來看,還比較局限于個別管理人員,追尋原因如下:一是業(yè)務(wù)系統(tǒng)開發(fā)根據(jù)用戶需求定制開發(fā)報表,業(yè)務(wù)人員通常習(xí)慣于從現(xiàn)成的報表中獲取信息。如果要求業(yè)務(wù)人員使用數(shù)據(jù)中心工具自行制作報表模板,甚至可能需要將其導(dǎo)出再作二次處理,那么業(yè)務(wù)人員一定更傾向于選擇第一種方式。二是近幾年來人員更替較多,新進管理人員不熟悉數(shù)據(jù)中心應(yīng)用,導(dǎo)致數(shù)據(jù)中心應(yīng)用面受到限制。隨著今后MES的建設(shè),業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)、報表、臺帳和分析功能將有可能由業(yè)務(wù)用戶自行通過集成在MES中的數(shù)據(jù)中心前端開發(fā)工具來訪問和靈活定制。因此,要盡快培養(yǎng)工廠業(yè)務(wù)人員數(shù)據(jù)中心的應(yīng)用能力,包括數(shù)據(jù)獲取以及報表定制方面的技能。筆者認為應(yīng)對方法如下:一是對于崗位人員變更做好新老人員之間一傳一的交接和培訓(xùn);二是適時針對新進管理人員開展集中培訓(xùn);三是通過采用一定的考核方法。3、提高新增應(yīng)用點的質(zhì)量。工廠每年都會組織各部門審視第一、第二層次應(yīng)用點列表,圍繞重點工序和重點管理崗位調(diào)研有哪些應(yīng)用上的空白點是需要重點思考的,以新增分析應(yīng)用點的方式進行申報和實施。同時針對第三層次針對性分析應(yīng)用,工廠也會要求部門以新增分析應(yīng)用點的方式將需要數(shù)據(jù)支撐的項目進行申報。作為一項常規(guī)性工作,工廠每年都會組織部門進行應(yīng)用點的申報,并按項目管理的思想和方法實施,事先確立各個應(yīng)用點的應(yīng)用層次、數(shù)據(jù)獲取方式、實現(xiàn)平臺,并對其實施計劃進行事先的思考和分解,確定每一個階段的活動目標(biāo)、時間節(jié)點以及負責(zé)人員,每個季度對實施情況予以總結(jié),并動態(tài)更新下一階段的實施計劃。該項工作從2005年起已經(jīng)連續(xù)開展了三年,部門可供挖掘的應(yīng)用點越來越少,如何調(diào)動部門的積極性,保持并提高應(yīng)用點的實效性,我們有必要對新增分析應(yīng)用點的質(zhì)量和實施情況進行考評,考評標(biāo)準(zhǔn)為:一是新增分析應(yīng)用點是否能體現(xiàn)數(shù)據(jù)應(yīng)用開展的進取性、開拓性和創(chuàng)新性;二是新增分析應(yīng)用點是否能切實提高管理的精細化和科學(xué)化水平;三是新增分析應(yīng)用點是否能采用項目管理的思想和方法實施,按時間節(jié)點完成各項預(yù)定計劃。
三、結(jié)束語。隨著近幾年來技術(shù)平臺的相繼成熟以及管理手段的逐步推進,工廠業(yè)務(wù)人員用數(shù)據(jù)說話的意識已經(jīng)越來越強,但是要真正使工廠管理達到“三分技術(shù)、七分管理、十二分數(shù)據(jù)”的水平,還有很長的路要走,這既需要我們的業(yè)務(wù)人員從自身出發(fā)提高應(yīng)用數(shù)據(jù)的水平和能力,同時也需要工廠從管理手段和管理方法上不斷拓寬思路、創(chuàng)新手段,真正實現(xiàn)數(shù)據(jù)分析應(yīng)用成為工廠管理的重要支撐手段。
作者單位:上海卷煙廠
(一)統(tǒng)計規(guī)律分析
就是采用數(shù)理統(tǒng)計方法、模糊數(shù)學(xué)方法以及適用于小同環(huán)境要素的數(shù)學(xué)和物理方程等方法,對所得的監(jiān)測數(shù)據(jù)進行深度剖析,做出詳細的分析評價。這種數(shù)據(jù)分析方法主要適用于環(huán)境調(diào)查、環(huán)境規(guī)劃和環(huán)評等工作。
(二)合理性分析
實際的環(huán)境監(jiān)測中,影響環(huán)境要素變化的因素錯綜復(fù)雜,而有效的能用于綜合分析的監(jiān)測數(shù)據(jù)十分有限,所以我們需要考慮到各種環(huán)境要素之間的相互影響,以及監(jiān)測項目之間的關(guān)系,理論結(jié)合實際全面分析數(shù)據(jù)的合理性,這樣才可能得到準(zhǔn)確可靠的、合理的監(jiān)測數(shù)據(jù)分析結(jié)果。
二、提高環(huán)境監(jiān)測數(shù)據(jù)分析質(zhì)量的方法
為了促進環(huán)境執(zhí)法工作的嚴(yán)肅和公正,在科學(xué)化環(huán)境管理政策中,提高環(huán)境數(shù)據(jù)分析質(zhì)量很有必要。在前人的研究工作基礎(chǔ)之上,我們提出了以下幾種方法來提高數(shù)據(jù)分析質(zhì)量。
(一)加強審核
加強各項審核是提高環(huán)境監(jiān)測數(shù)據(jù)分析質(zhì)量的重要方法,它主要是指加強對現(xiàn)有數(shù)據(jù)的綜合審核。在進行例行監(jiān)測或是年度監(jiān)測計劃時,我們的工作一般都是連續(xù)性的展開的,一年或是好幾年,因此,我們可以建立一個動態(tài)的分析數(shù)據(jù)庫,錄入每次的監(jiān)測數(shù)據(jù),包括每個污染源的詳細信息(污染點的地理位置和排放口的排污狀況等),在以后的審核中,我們可以迅速地在數(shù)據(jù)審核中對于同一采樣點、同一分析項目進行新舊數(shù)據(jù)的分析對比。當(dāng)數(shù)據(jù)分析結(jié)果出現(xiàn)異常時,可以及時的發(fā)現(xiàn)并找到原因,這可以對污染應(yīng)急事故的發(fā)生起到提前警示的作用。另外,在數(shù)據(jù)審核中,也要密切注意到同一水樣、不同的分析項目之間的相關(guān)性,比如:同一水體中氟化物和總硬度、色度和pH的關(guān)系、氨氮和總氮之間的相關(guān)性等,這樣也能及時發(fā)現(xiàn)數(shù)據(jù)分析中出現(xiàn)的誤差。
(二)加強監(jiān)督機制
通過調(diào)研我們發(fā)現(xiàn),目前在傳統(tǒng)的監(jiān)測數(shù)據(jù)質(zhì)量控制系統(tǒng)中依舊存在許多不足,我們可以通過引入反饋和交流機制,加強監(jiān)督機制來有效提高數(shù)據(jù)分析的質(zhì)量。首先,通過強化平面控制,在系統(tǒng)內(nèi)部全面優(yōu)化管理的模式,提高工作人員的分析技術(shù)水平,盡可能的減少或消除數(shù)據(jù)誤差,以此來提高監(jiān)測分析的準(zhǔn)確性;其次,我們應(yīng)該主動接受來自外界的監(jiān)督,對于外界有異議的監(jiān)測數(shù)據(jù)要進行反復(fù)的檢測;再次,我們也應(yīng)該多舉辦技術(shù)交流會,讓技術(shù)人員可以與各級環(huán)境監(jiān)測部門的人員溝通,學(xué)習(xí)他們的先進技術(shù)和方法,同時進行數(shù)據(jù)分析結(jié)果對比,找到自身的不足,發(fā)現(xiàn)問題并能及時更正。
(三)加強采樣及實驗室測量質(zhì)量的控制
1.采樣控制
工作人員在每次采樣前,都應(yīng)該根據(jù)實際環(huán)境情況來制定采樣技術(shù)細則,做好采樣控制,比如:需要校準(zhǔn)儀器并確保儀器可以正常運轉(zhuǎn);使用的采樣管和濾膜要正確安裝,采樣器干凈整潔沒有受到污染源的污染,其放置的位置也能滿足采樣要求等。采集好的樣品,要妥善存放避免污染。如果樣品不能及時進行檢測,考慮到樣品的穩(wěn)定性,最好將樣品密封并存放在于冰箱中。
2.實驗室測量控制
在實驗室進行樣品測試之前,首先應(yīng)該對所要用到的玻璃量器及分析測試儀器進行校驗。日常工作中,也應(yīng)該根據(jù)各種儀器保養(yǎng)規(guī)定,對儀器定期進行維護和校驗,確保儀器可以正常運轉(zhuǎn)工作。其次,需要準(zhǔn)確調(diào)配各種溶液,特別是標(biāo)準(zhǔn)溶液,配置時要使用合格的實驗用蒸餾水。測試數(shù)據(jù)時,先要測定標(biāo)準(zhǔn)樣品并繪制標(biāo)準(zhǔn)曲線。測定樣品時要檢查相關(guān)系數(shù)和計算回歸方程,并對實驗系統(tǒng)誤差進行測驗,每一步都不能少。
分析網(wǎng)站流量這是首要工作,如果是網(wǎng)站建設(shè)初期,那么此時的流量分析就只要記住網(wǎng)站登陸搜索引擎后的流量基數(shù)即可。如果是網(wǎng)站建設(shè)中期的話,就要記錄網(wǎng)站流量一周的平均值,如果是網(wǎng)站建設(shè)后期的話,就要記錄網(wǎng)站流量的階段性波動值!記錄好了流量值之后,就可以很好的計劃出下一步優(yōu)化推廣的流量值了。
網(wǎng)站優(yōu)化數(shù)據(jù)分析方法二:關(guān)鍵詞分析
網(wǎng)站關(guān)鍵詞分析也是網(wǎng)站優(yōu)化的重要工作之一!分析現(xiàn)在網(wǎng)站關(guān)鍵詞的布局,分析網(wǎng)站有流量的關(guān)鍵詞,分析網(wǎng)站還沒有覆蓋的與網(wǎng)站業(yè)務(wù)相關(guān)的關(guān)鍵詞,分析出網(wǎng)站主關(guān)鍵詞的排名情況,分析關(guān)鍵詞的設(shè)計是否合理。分析頂級關(guān)鍵詞是否占據(jù)了搜索引擎首頁的排名,分析搜索關(guān)鍵詞的質(zhì)量高不高,與網(wǎng)站業(yè)務(wù)的相關(guān)度如何?!分析關(guān)鍵詞轉(zhuǎn)化率如何等等。
中圖分類號:F01 文獻標(biāo)識碼:A 文章編號:1006-0278(2013)02-024-01
在計量經(jīng)濟學(xué)中,我們一般應(yīng)用的最多的數(shù)據(jù)分析是截面數(shù)據(jù)回歸分析和時間序列分析,但截面數(shù)據(jù)分析和時間序列分析都有著一定的局限性。在實際經(jīng)濟研究當(dāng)中,截面數(shù)據(jù)回歸分析會遺漏掉數(shù)據(jù)的時間序列特征,例如在分析某年中國各省的GDP增長數(shù)據(jù)時,單純的截面數(shù)據(jù)回歸分析無法找出各省GDP隨時間變化的特征,使得分析結(jié)果沒有深度。而如果只用時間序列分析,則會遺漏掉不同截面間的聯(lián)系與區(qū)別,例如在分析中國單個省市的GDP隨時間增長的數(shù)據(jù)時,無法找出各個省市之間經(jīng)濟增長的聯(lián)系與區(qū)別,因而同樣無法滿足我們的需要。而面板數(shù)據(jù),是一種既包括了時間序列數(shù)據(jù),也包括了相關(guān)截面數(shù)據(jù)的復(fù)合數(shù)據(jù),是近年來用得較多的一種數(shù)據(jù)類型。
下面我們將基于2000-2009年中國各省GDP和財政收入的面板數(shù)據(jù)的實例來詳細闡述面板數(shù)據(jù)的分析方法。
一、GDP與財政收入關(guān)系的經(jīng)濟學(xué)模型
財政收入是保證國家有效運轉(zhuǎn)的經(jīng)濟基礎(chǔ),在一國經(jīng)濟建設(shè)中發(fā)揮著重要作用。隨著中國經(jīng)濟發(fā)展速度的日益加快,財政收入不斷擴大,而擴大的財政收入又以政府支出來調(diào)節(jié)和推動國民經(jīng)濟發(fā)展。正確認識財政收入與經(jīng)濟增長之間的長期關(guān)系,把握財政收入與經(jīng)濟增長之間的相互影響,發(fā)揮財政收入對經(jīng)濟發(fā)展的調(diào)節(jié)和促進功能,對于完善財稅政策,深化財稅體制改革,實現(xiàn)財政與經(jīng)濟之間的良性互動,具有重要的現(xiàn)實意義。文章就將從中國各省的面板數(shù)據(jù)出發(fā)研究,中國不同地域間財政收入和GDP之間的關(guān)系。
二、實證分析
(一)單位根檢驗
Eviews有兩種單位根檢驗方法,一種在相同根的假設(shè)下的檢驗,包括LLC、Breintung、Hadri。另一種則是在不同根下的假設(shè)前提下,包括IPS,ADF-Fisher和PP-Fisher5。檢驗結(jié)果表明所有檢驗都拒絕原假設(shè),因此序列GDP和CZSR均為一個2階單整序列。
(二)協(xié)整檢驗
如果基于單位根檢驗的結(jié)果發(fā)現(xiàn)變量之間是同階單整的,那么我們可以進行協(xié)整檢驗。協(xié)整檢驗是考察變量間長期均衡關(guān)系的方法。所謂的協(xié)整是指若兩個或多個非平穩(wěn)的變量序列,其某個線性組合后的序列呈平穩(wěn)性。此時我們稱這些變量序列間有協(xié)整關(guān)系存在。
在最終的結(jié)果中,Pedroni方法中除了rho-Statistic、PP-Statistic項目外都拒絕GDP和CZSR不存在協(xié)整關(guān)系的原假設(shè),同樣Kao和Johansen檢驗方法也都拒絕原假設(shè),因此,上述檢驗結(jié)果表明,我國各省2000-20009年的GDP和財政收入面板數(shù)據(jù)間存在著協(xié)整關(guān)系。既然通過了協(xié)整檢驗,說明變量之間存在著長期穩(wěn)定的均衡關(guān)系,其方程回歸殘差是平穩(wěn)的,因此可以在此基礎(chǔ)上直接對進行回歸分析,此時假設(shè)方程的回歸結(jié)果是較精確的。
三、建立模型
混合模型:如果從時間上看,不同個體之間不存在顯著性差異;從截面上看,不同截面之間也不存在顯著性差異,那么就可以直接把面板數(shù)據(jù)混合在一起用普通最小二乘法(OLS)估計參數(shù)。
我們根據(jù)混合模型的回歸結(jié)果,得到財政收入和GDP之間的回歸方程為:
CZSR=227.3123+0.103224*GDP
(26.47637)(0.002839)
R2=0.810995 F=1321.587
顯然從模型的回歸結(jié)構(gòu)來看,R2的值達到了0.81,有了比較好的回歸解釋力,同時,GDP的回歸系數(shù)為0.103224,表明各省的財政收入平均占到了國民收入的10.3%左右。
變系數(shù)模型:顯然,在中國各省之間由于處在不同的地區(qū),因而擁有不同的區(qū)位優(yōu)勢,那么各省的發(fā)展水平顯然就不一樣。正是由于這種不同的地方政策、管理水平、文化差異等會導(dǎo)致經(jīng)濟變量間出現(xiàn)一些關(guān)聯(lián)性的變化,此時在進行模型回歸的時候,我們就有必要考慮變系數(shù)模型。
在回歸結(jié)果中,R2的值達到了0.97,比混合模型擁有更好的回歸解釋力,而在變系數(shù)模型回歸結(jié)果中,GDP的回歸系數(shù)大于0.5的只有、青海、寧夏三個省份,也就是說這三個省份的財政收入占到了GDP的50%以上,他們同處于經(jīng)濟并不是很發(fā)達的西部地區(qū),由此可以看出,處在經(jīng)濟發(fā)達地區(qū)的財政收入占GDP的比重要低,而不發(fā)達地區(qū)則要高。
四、結(jié)論
通過以上的分析檢驗,我們發(fā)現(xiàn)針對于中國財政收入和GDP的面板數(shù)據(jù),我們應(yīng)建立起變系數(shù)模型,并通過模型分析,我們可以得出這樣的結(jié)論,中國各省間由于存在著地域經(jīng)濟發(fā)展水平不同、管理水平不同以及國家的相關(guān)政策等諸多不同,造成了各省之間在財政收入以及國民收入上面存在著一定的差異。而回歸結(jié)果也告訴我們,我國西部地區(qū)的財政收入占GDP的比例要明顯高于東部地區(qū),地區(qū)發(fā)展落后地區(qū)的財政收入占GDP的比例也要明顯高于東部地區(qū)。因此,這為我們改善我國落后地區(qū)的經(jīng)濟發(fā)展提供了一定的新思路,就是對一地區(qū)的稅收征收可以適當(dāng)放緩,而將GDP中以前政府占用的部分歸還于民眾和企業(yè),因為,按照發(fā)達地區(qū)的經(jīng)驗表明,財政收入所占比重過高,經(jīng)濟發(fā)展的活力或者就不會很高,對于進一步刺激財政收入的增加也沒有任何幫助。因此,我們應(yīng)該適度降低財政收入占GDP的比重,從而增加經(jīng)濟活力,使西部地區(qū)以及落后地區(qū)及早的跟上東部發(fā)達地區(qū)的發(fā)展步伐,從而消除我國經(jīng)濟發(fā)展的地域不平衡。
參考文獻:
[1]謝識予,朱洪鑫.高級計量經(jīng)濟學(xué)[M].復(fù)旦大學(xué)出版社,2005.
這就是為什么行業(yè)越來越傾向于使用特定的玩家反饋和可執(zhí)行的分析結(jié)果來指導(dǎo)游戲設(shè)計調(diào)整。
了解真實的玩家觀點并不容易。對發(fā)行商和開發(fā)者而言,玩家、平臺和設(shè)備類型多樣化導(dǎo)致分析學(xué)的數(shù)據(jù)追蹤成了一大挑戰(zhàn)。
那就是為什么我們最近發(fā)表了《Analytics Driven Game Design》白皮書,旨在使這個過程更加簡單和有效。
以下是一些重要的設(shè)計和執(zhí)行建議:
1、提前收集數(shù)據(jù)
人們往往不會把執(zhí)行分析學(xué)的數(shù)據(jù)標(biāo)注當(dāng)作優(yōu)先任務(wù)。
這是錯誤的,因為數(shù)據(jù)收集一般要貫穿整個開發(fā)過程,需要的時間是執(zhí)行的三到五倍。
2、盡早收集事件數(shù)據(jù)
當(dāng)事件及其參數(shù)定義好時,開發(fā)者就可以確定什么時候需要什么數(shù)據(jù)了。
一開始就把這樣的數(shù)據(jù)結(jié)構(gòu)結(jié)合到代碼中,可以保證當(dāng)代碼需要這些數(shù)據(jù)時就能有現(xiàn)成的數(shù)據(jù)。
如果把事件收集放在開發(fā)過程的末尾,通常只能收集到60%有價值的數(shù)據(jù),這說明沒有充分利用分析學(xué)。
3、統(tǒng)一視角
復(fù)雜的游戲通常涉及多個系統(tǒng)。例如,登錄系統(tǒng)可能不同于支付系統(tǒng),這意味著數(shù)據(jù)來源通常有兩個:服務(wù)器和游戲客戶端。
因此,有必統(tǒng)一視角,即使戶ID與登錄活動保持一致。
這樣,分析時就可以忽略數(shù)據(jù)來源,把所有信息放在一起。
4、同步時間標(biāo)記
類似地,因為事件數(shù)據(jù)來自多個來源、時區(qū)和應(yīng)用商店,有必要使用同步時間標(biāo)記,以確保觀察玩家行為的視角能夠保持一致。
發(fā)送客戶端數(shù)據(jù)時通常使用本地時間標(biāo)記,而服務(wù)器數(shù)據(jù)記錄的通常是保存數(shù)據(jù)的時間。
如果兩個時間標(biāo)記不一樣,就會很難知道真正的事件順序,從而不利于建立玩家行為檔案。
5、創(chuàng)建單一登錄ID
將這個獨特的ID與一次登錄中發(fā)生的所有事件聯(lián)系在一起,對高效分析特別重要。
如果事件發(fā)生后才關(guān)聯(lián)數(shù)據(jù),必然會導(dǎo)致誤差和錯誤。
考慮到大量初次玩家留存分析學(xué)專注于第一次游戲,統(tǒng)一而準(zhǔn)確地定義你的登錄活動是很重要的。
6、總是記錄結(jié)果
事件的目標(biāo)應(yīng)該是記錄結(jié)果而不是變化。
換句話說,記錄任務(wù)的結(jié)果比記錄任務(wù)中的各種變化更好。例如,記錄當(dāng)玩家完成任務(wù)時獲得了什么,即得到多少經(jīng)驗點或殺敵數(shù),比記錄每一次射擊更實用。
一、數(shù)據(jù)統(tǒng)計分析的內(nèi)涵
數(shù)據(jù)分析是指運用一定的分析方法對數(shù)據(jù)進行處理,從而獲得解決管理決策或營銷研究問題所需信息的過程。所謂的數(shù)據(jù)統(tǒng)計分析就是運用統(tǒng)計學(xué)的方法對數(shù)據(jù)進行處理。在實際的市場調(diào)研工作中,數(shù)據(jù)統(tǒng)計分析能使我們挖掘出數(shù)據(jù)中隱藏的信息,并以恰當(dāng)?shù)男问奖憩F(xiàn)出來,并最終指導(dǎo)決策的制定。
二、數(shù)據(jù)統(tǒng)計分析的原則
(1)科學(xué)性??茖W(xué)方法的顯著特征是數(shù)據(jù)的收集、分析和解釋的客觀性,數(shù)據(jù)統(tǒng)計分析作為市場調(diào)研的重要組成部分也要具有同其他科學(xué)方法一樣的客觀標(biāo)準(zhǔn)。(2)系統(tǒng)性。市場調(diào)研是一個周密策劃、精心組織、科學(xué)實施,并由一系列工作環(huán)節(jié)、步驟、活動和成果組成的過程,而不是單個資料的記錄、整理或分析活動。(3)針對性。就不同的數(shù)據(jù)統(tǒng)計分析方法而言,無論是基礎(chǔ)的分析方法還是高級的分析方法,都會有它的適用領(lǐng)域和局限性。(4)趨勢性。市場所處的環(huán)境是在不斷的變化過程中的,我們要以一種發(fā)展的眼光看待問題。(5)實用性。市場調(diào)研說到底是為企業(yè)決策服務(wù)的,而數(shù)據(jù)統(tǒng)計分析也同樣服務(wù)于此,在保證其專業(yè)性和科學(xué)性的同時也不能忽略其現(xiàn)實意義。
三、推論性統(tǒng)計分析方法
(1)方差分析。方差分析是檢驗多個總體均值是否相等的一種統(tǒng)計方法,它可以看作是t檢驗的一種擴展。它所研究的是分類型自變量對數(shù)值型因變量的影響,比如它們之間有沒有關(guān)聯(lián)性、關(guān)聯(lián)性的程度等,所采用的方法就是通過檢驗各個總體的均值是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響。(2)回歸分析。在數(shù)據(jù)統(tǒng)計分析中,存在著大量的一種變量隨著另一種變量的變化而變化的情況,這種對應(yīng)的因果變化往往無法用精確的數(shù)學(xué)公式來描述,只有通過大量觀察數(shù)據(jù)的統(tǒng)計工作才能找到他們之間的關(guān)系和規(guī)律,解決這一問題的常用方法是回歸分析。回歸分析是從定量的角度對觀察數(shù)據(jù)進行分析、計算和歸納。
四、多元統(tǒng)計分析方法
(1)相關(guān)分析。相關(guān)分析是描述兩組變量間的相關(guān)程度和方向的一種常用的統(tǒng)計方法。值得注意的是,事物之間有相關(guān)關(guān)系,不一定是因果關(guān)系,也可能僅僅是伴隨關(guān)系;但如果事物之間有因果關(guān)系,則兩者必然存在相關(guān)關(guān)系。(2)主成分分析。在大部分數(shù)據(jù)統(tǒng)計分析中,變量之間是有一定的相關(guān)性的,人們自然希望找到較少的幾個彼此不相關(guān)的綜合指標(biāo)盡可能多地反映原來眾多變量的信息。所謂的主成分分析就是利用降維的思想,把多指標(biāo)轉(zhuǎn)化為幾個綜合指標(biāo)的多元統(tǒng)計分析方法,很顯然在一個低維空間識別系統(tǒng)要比在一個高維空間容易的多。(3)因子分析。因子分析的目的是使數(shù)據(jù)簡單化,它是將具有錯綜復(fù)雜關(guān)系的變量綜合為數(shù)量較少的幾個因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系,同時根據(jù)不同因子,對變量進行分類。這些因子是不可觀測的潛在變量,而原先的變量是可觀測的顯在變量。(4)聚類分析。在市場調(diào)研中,市場細分是最常見的營銷術(shù)語之一,它按照一定的標(biāo)準(zhǔn)將市場分割為不同的族群,并使族群之間具有某種特征的顯著差異,而族群內(nèi)部在這種特征上具有相似性。聚類分析就是實現(xiàn)分類的一種多元統(tǒng)計分析方法,它根據(jù)聚類變量將樣本分成相對同質(zhì)的族群。聚類分析的主要優(yōu)點是,對所研究的對象進行了全面的綜合分析,歸類比較客觀,有利于分類指導(dǎo)。(5)判別分析。判別分析是判別樣品所屬類型的一種多元統(tǒng)計方法。若在已知的分類下,遇到新的樣本,則可利用此法選定一種判別標(biāo)準(zhǔn),以判定將該新樣品放置于哪個類中。由定義我們可以知道判別分析區(qū)別于聚類分析的地方,而在判別分析中,至少要有一個已經(jīng)明確知道類別的“訓(xùn)練樣本”,從而利用這個數(shù)據(jù)建立判別準(zhǔn)則,并通過預(yù)測變量來為未知類別的觀測值進行判別。與聚類分析相同的地方是,判別分析也是利用距離的遠近來把對象歸類的。
參考文獻
一、數(shù)據(jù)統(tǒng)計分析的內(nèi)涵
數(shù)據(jù)分析是指運用一定的分析方法對數(shù)據(jù)進行處理,從而獲得解決管理決策或營銷研究問題所需信息的過程。所謂的數(shù)據(jù)統(tǒng)計分析就是運用統(tǒng)計學(xué)的方法對數(shù)據(jù)進行處理。在實際的市場調(diào)研工作中,數(shù)據(jù)統(tǒng)計分析能使我們挖掘出數(shù)據(jù)中隱藏的信息,并以恰當(dāng)?shù)男问奖憩F(xiàn)出來,并最終指導(dǎo)決策的制定。
二、數(shù)據(jù)統(tǒng)計分析的原則
(1)科學(xué)性??茖W(xué)方法的顯著特征是數(shù)據(jù)的收集、分析和解釋的客觀性,數(shù)據(jù)統(tǒng)計分析作為市場調(diào)研的重要組成部分也要具有同其他科學(xué)方法一樣的客觀標(biāo)準(zhǔn)。(2)系統(tǒng)性。市場調(diào)研是一個周密策劃、精心組織、科學(xué)實施,并由一系列工作環(huán)節(jié)、步驟、活動和成果組成的過程,而不是單個資料的記錄、整理或分析活動。(3)針對性。就不同的數(shù)據(jù)統(tǒng)計分析方法而言,無論是基礎(chǔ)的分析方法還是高級的分析方法,都會有它的適用領(lǐng)域和局限性。(4)趨勢性。市場所處的環(huán)境是在不斷的變化過程中的,我們要以一種發(fā)展的眼光看待問題。(5)實用性。市場調(diào)研說到底是為企業(yè)決策服務(wù)的,而數(shù)據(jù)統(tǒng)計分析也同樣服務(wù)于此,在保證其專業(yè)性和科學(xué)性的同時也不能忽略其現(xiàn)實意義。
三、推論性統(tǒng)計分析方法
(1)方差分析。方差分析是檢驗多個總體均值是否相等的一種統(tǒng)計方法,它可以看作是t檢驗的一種擴展。它所研究的是分類型自變量對數(shù)值型因變量的影響,比如它們之間有沒有關(guān)聯(lián)性、關(guān)聯(lián)性的程度等,所采用的方法就是通過檢驗各個總體的均值是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響。(2)回歸分析。在數(shù)據(jù)統(tǒng)計分析中,存在著大量的一種變量隨著另一種變量的變化而變化的情況,這種對應(yīng)的因果變化往往無法用精確的數(shù)學(xué)公式來描述,只有通過大量觀察數(shù)據(jù)的統(tǒng)計工作才能找到他們之間的關(guān)系和規(guī)律,解決這一問題的常用方法是回歸分析。回歸分析是從定量的角度對觀察數(shù)據(jù)進行分析、計算和歸納。
中圖分類號:TP391 文獻標(biāo)志碼:A 文章編號:1006-8228(2017)03-62-03
Abstract: This paper puts forward a method of analyzing public opinion and satisfaction on the evaluation data of scenic spots based on tourist demand template. By means of keywords template library building and expansion based on the template of tourism demand, the paper analyses and builds the model of the public opinion and satisfaction on the evaluation data. It solves the problem that unstructured content such as tourists' travels and evaluation cannot be efficiently searched and utilized by other tourists. It can not only provide tourists with scenic spots' comprehensive satisfaction value, but also satisfaction values in the specific area of cuisine, housing, transportation, travelling, shopping, and entertainment, and even more specific related content of the satisfaction value in those six aspects. Thus it helps visitors quickly understand the evaluation of the various parameters of the area.
Key words: template library; public opinion of scenic spots; satisfaction; evaluation data
0 引言
隨著經(jīng)濟的發(fā)展,現(xiàn)在已經(jīng)進入旅游智能化階段和大數(shù)據(jù)的時代,游客通常通過查看媒體互動分享評價來決定自己旅游計劃。然而,傳統(tǒng)游客在游記中對景區(qū)景點的評價內(nèi)容是非結(jié)構(gòu)化、離散的,即難以采用一定的算法對其進行有規(guī)律地提取和組織,從而導(dǎo)致不能采用計算機智能對其提取分類。然而游客對“吃、住、行、游、購、娛”的評價獲取需求頗為急切,因此需要采用一種新的技術(shù)來實現(xiàn)游客評價的自動化提取并對大量的數(shù)據(jù)進行高效的有價值的分析[1-3]。
1 本文提出的方法步驟及特征
本文提出一種基于旅游需求模板的景區(qū)評價數(shù)據(jù)分析輿情滿意度方法,主要有基于旅游需求模板的關(guān)鍵詞模板庫構(gòu)建(見圖1)、關(guān)鍵詞模板庫的擴充(見圖2)和針對景區(qū)評價數(shù)據(jù)的輿情滿意度分析計算三個步驟。該方法的特征在于:所述的旅游需求模板主要由內(nèi)容大類關(guān)鍵詞、內(nèi)容子類關(guān)鍵詞和情感關(guān)鍵詞構(gòu)成,每個內(nèi)容大類關(guān)鍵詞下分屬有其對應(yīng)的內(nèi)容子類關(guān)鍵詞,每個內(nèi)容子類關(guān)鍵詞下分屬有其對應(yīng)的情感關(guān)鍵詞[4-5]。
1.1 基于旅游需求模板的關(guān)鍵詞模板庫構(gòu)建
主要由基于旅游需求模板引導(dǎo)評價的內(nèi)容大類關(guān)鍵詞、內(nèi)容子類關(guān)鍵詞和情感關(guān)鍵詞構(gòu)成,每個內(nèi)容大類關(guān)鍵詞下分屬有其對應(yīng)的內(nèi)容子類關(guān)鍵詞,每個內(nèi)容子類關(guān)鍵詞下分屬有其對應(yīng)的情感關(guān)鍵詞。
關(guān)鍵詞模板庫初始由列舉而成,所述的內(nèi)容大類關(guān)鍵詞包括吃、住、行、游、購、娛的六個類別;所述的內(nèi)容子類關(guān)鍵詞是在內(nèi)容大類關(guān)鍵詞的基礎(chǔ)上構(gòu)建的;所述情感關(guān)鍵詞是對內(nèi)容子類關(guān)鍵詞的描述性詞語。
1.2 關(guān)鍵詞模板庫的擴充
關(guān)鍵詞模板庫的擴充具體是采用以下方式對內(nèi)容子類關(guān)鍵詞和情感關(guān)鍵詞進行擴充:
⑴ 在已構(gòu)建的關(guān)鍵詞模板庫基礎(chǔ)上,通過網(wǎng)絡(luò)爬蟲工具在內(nèi)容大類關(guān)鍵詞所在段落文字附近搜索內(nèi)容子類關(guān)鍵詞,將找到的在已構(gòu)建關(guān)鍵詞模板庫中不存在的內(nèi)容子類關(guān)鍵詞作為新的內(nèi)容子類關(guān)鍵詞,并加入到關(guān)鍵詞模板庫中;
⑵ 在已構(gòu)建的關(guān)鍵詞模板庫基礎(chǔ)上,通過網(wǎng)絡(luò)爬蟲工具在內(nèi)容子類關(guān)鍵詞所在段落文字附近搜索情感關(guān)鍵詞,將找到的在已構(gòu)建關(guān)鍵詞模板庫中不存在的情感關(guān)鍵詞作為新的情感關(guān)鍵詞,對新的情感關(guān)鍵詞賦權(quán)值后加入到關(guān)鍵詞模板庫中。
1.3 針對景區(qū)評價數(shù)據(jù)的輿情滿意度分析計算
所述針對景區(qū)評價數(shù)據(jù)的輿情滿意度分析計算具體是:由擴充后的關(guān)鍵詞模板庫通過網(wǎng)絡(luò)爬蟲工具搜索景區(qū)下的文字數(shù)據(jù),抽取出內(nèi)容大類關(guān)鍵詞所在段落文字附近的內(nèi)容子類關(guān)鍵詞,再搜索抽取出每個內(nèi)容子類關(guān)鍵詞所在段落文字附近的情感關(guān)鍵詞,從而獲得所有情感關(guān)鍵詞及其每個情感關(guān)鍵詞對應(yīng)的內(nèi)容子類關(guān)鍵詞和內(nèi)容大類關(guān)鍵詞,然后構(gòu)建景區(qū)輿情與滿意度的分析模型,通過景區(qū)輿情與滿意度的分析模型獲得以平均滿意度值作為該景區(qū)的輿情滿意度值。
2 景區(qū)輿情與滿意度的分析模型
⑴ 先采用以下公式計算獲得文字數(shù)據(jù)中所有評論中的關(guān)于某一個內(nèi)容子類關(guān)鍵詞的滿意度值:
其中,表示第i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞的平均滿意度值,t是分值(1~5),表示i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞對應(yīng)分值為t的情感關(guān)鍵詞的數(shù)量,Bij表示第i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞,B{B11,B12,B13…B21,B22,B23…}代表內(nèi)容子類關(guān)鍵詞集合。
⑵ 再采用以下公式計算獲得文字數(shù)據(jù)中一個內(nèi)容大類關(guān)鍵詞的滿意度值:
其中,表示第i個內(nèi)容大類關(guān)鍵詞的滿意度值,表示第i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞的權(quán)值,n表示第i個內(nèi)容大類關(guān)鍵詞下內(nèi)容子類關(guān)鍵詞的數(shù)量,A{A1,A2,…,A6}代表內(nèi)容大類關(guān)鍵詞集合。
⑶ 再采用以下公式計算獲得該景區(qū)的綜合滿意度值:
其中,Y表示景區(qū)的綜合滿意度值,i表示內(nèi)容大類關(guān)鍵詞的序號,i取值范圍是1~6,表示第i個內(nèi)容大類關(guān)鍵詞下的的權(quán)值。
3 具體實施方式
3.1 基于旅游需求模板的關(guān)鍵詞模板庫構(gòu)建
⑴ 內(nèi)容大類關(guān)鍵詞構(gòu)建,主要包括吃、住、行、游、購、娛幾個大類。
⑵ 內(nèi)容子類關(guān)鍵詞構(gòu)建,主要是在內(nèi)容大類關(guān)鍵詞的基礎(chǔ)上構(gòu)建,比如和內(nèi)容大類關(guān)鍵詞吃相關(guān)的內(nèi)容子類關(guān)鍵詞有飯店、餐館、快餐店、小吃街等。
⑶ 情感關(guān)鍵詞構(gòu)建,主要是在內(nèi)容子類關(guān)鍵詞基礎(chǔ)上構(gòu)建,比如和內(nèi)容子類關(guān)鍵詞‘吃’對應(yīng)的情感關(guān)鍵詞有味道很好,價格實惠,環(huán)境優(yōu)美等。
3.2 關(guān)鍵詞模板庫的擴充
⑴ 基于需求模板引導(dǎo)評價的內(nèi)容子類關(guān)鍵詞庫擴充,通過網(wǎng)絡(luò)爬蟲工具在內(nèi)容大類關(guān)鍵詞附近搜索相關(guān)的內(nèi)容子類關(guān)鍵詞并與已有的模板庫進行對比,遇到新的內(nèi)容子類關(guān)鍵詞后,自動加入到模板庫,比如遇到與內(nèi)容大類關(guān)鍵詞吃相關(guān)的新的內(nèi)容子類關(guān)鍵詞野味店等。
⑵ 基于需求模板引導(dǎo)評價的情感關(guān)鍵詞庫擴充,通過網(wǎng)絡(luò)爬蟲工具八爪魚采集器,在內(nèi)容子類關(guān)鍵詞附近搜索相關(guān)的情感關(guān)鍵詞并與已有的模板庫進行對比,遇到新的情感關(guān)鍵詞后,自動加入到模板庫。
⑶ 情感關(guān)鍵詞均已由用戶進行賦分,給出分值(1~5),比如非常好/棒極了/美妙極了,這三個情感詞表達的滿意度是相同的,對應(yīng)的分值都是5分,一般/湊合/還行對應(yīng)的分值則都是3分;差極了/難受死了/簡直就是受罪/再也不會去了,對應(yīng)的分值則是1分。
3.3 針對景區(qū)評價數(shù)據(jù)的輿情滿意度分析計算
⑴ 根據(jù)已有模版庫構(gòu)建評價體系表。內(nèi)容大類關(guān)鍵詞和內(nèi)容子類關(guān)鍵詞的權(quán)重和情感關(guān)鍵詞的分值以及相同分值評論數(shù)量如表1所示,表中{}表示第i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞對應(yīng)分值為t的情感關(guān)鍵詞的集合。
⑵ 通過網(wǎng)絡(luò)爬蟲工具搜索景區(qū)網(wǎng)頁的每個帖子,按內(nèi)容子類關(guān)鍵詞,搜索所有相關(guān)的情感關(guān)鍵詞,根據(jù)表1進行分類統(tǒng)計,把相應(yīng)的情感關(guān)鍵詞的數(shù)量記錄到對應(yīng)到中。
比如:通過網(wǎng)絡(luò)爬蟲工具搜到網(wǎng)頁得到1000個情感關(guān)鍵詞,有600個是與內(nèi)容大類關(guān)鍵詞‘吃A1’有關(guān)的,其中300個是與內(nèi)容子類關(guān)鍵詞‘味道B11’有關(guān)的,對應(yīng)的情感關(guān)鍵詞集{}及數(shù)量如表2所示。
由內(nèi)容子類關(guān)鍵詞滿意度計算公式可知該景區(qū)關(guān)于吃的味道的滿意度值為:
即:該景區(qū)關(guān)于吃的味道的滿意度值為3.6,同理可以計算其他內(nèi)容子類的關(guān)鍵詞的滿意度值。
4 結(jié)束語
通過這種方法得到滿意度值,解決了以往游客的游記、評價等非結(jié)構(gòu)化內(nèi)容難以被其他游客高效搜索利用的問題,除了可以向游客提供某個景區(qū)的綜合滿意度值外,還可以向游客提供該景區(qū)具體的關(guān)于吃、住、行、游、購、娛六個方面的滿意度值,以及比吃、住、行、游、購、娛更具體的相關(guān)內(nèi)容子類關(guān)鍵詞的滿意度值,讓游客快速了解該景區(qū)的各個評價參數(shù)。
參考文獻(References):
[1] 維克托.邁爾舍恩伯格著,盛楊燕,周濤譯.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].浙江人民出版社,2013.
[2] 馬建光,姜巍.大數(shù)據(jù)的概念、特征及其應(yīng)用[J].國防科技,2013.2:10-11
所謂的交通事故預(yù)測是根據(jù)已發(fā)生交通事故的數(shù)據(jù)進行統(tǒng)計,在對事故原因進行分析的基礎(chǔ)上,探尋事故規(guī)律,以針對交通事故做出更為合理的推測和判斷。當(dāng)前,交通事故預(yù)測方法相對較為多樣,如回歸分析、時間序列等,雖然都能對交通事故做出科學(xué)合理的決策性指導(dǎo),但各具優(yōu)缺點和適用條件,因而有關(guān)人員應(yīng)在遵循交通事故預(yù)測思想的基礎(chǔ)上,對幾種主要預(yù)測方法進行分析,確保交通部門人員能夠根據(jù)實際情況而合理選擇交通事故預(yù)測方法。
1 交通事故預(yù)測思想
交通事故對人類造成的危害相對較大,對人類產(chǎn)生嚴(yán)重的威脅。從我國發(fā)展實踐中可知,交通事故在一定程度上制約我國經(jīng)濟的發(fā)展進程,尤其對人類社會福利、醫(yī)療保險等方面的影響較大。據(jù)不完全統(tǒng)計,2015年全年間,我國交通事故約為10597358起,死亡人數(shù)約為68432人,財產(chǎn)損失高達10億元以上??梢?,交通事故威脅隱患相對較大。交通事故預(yù)測能夠根據(jù)已發(fā)生交通事故進行統(tǒng)計、分析、處理,在遵循規(guī)律的基礎(chǔ)上,對未來可能發(fā)生的交通事故作出科學(xué)合理的預(yù)測,該預(yù)測結(jié)果以科學(xué)邏輯推斷為基礎(chǔ)。就交通事故原因而言,道路環(huán)境、交通條件、車輛、駕駛員等都是影響因素。通過交通事故預(yù)測,我國交通部門人員能夠?qū)煌ㄊ鹿首鞒隹茖W(xué)合理的判斷和制定有效的預(yù)防策略,以最大限度降低和消除交通事故隱患。
2 交通事故主要預(yù)測方法
2.1 回歸分析預(yù)測法
回歸分析預(yù)測法在交通事故預(yù)測中的有效應(yīng)用,主要分為線性回歸和非線性回歸兩種方法。首先,背景交通工程研究所人員提出線性回歸分析預(yù)測法,通過對自變量和因變量之間關(guān)系問題的探討,對因變量趨勢加以預(yù)測,其模型為:
Y=3577.79+93.3028lgX1+824.921lgX3+326.777lgX4+800.454lgX5-1149.051lgX6-224.902lgX8-45.0499lgX9-152.6081lgX10-287.191lgX11。
其中X1-X11分別表示臨時人口、常住人口、機動車輛、自行車、道路長度、道路面積、燈控路口、交通標(biāo)志、交通標(biāo)線、失控部位、交警人數(shù)。
其次,英國倫敦大學(xué)SemeedR.J教授對歐洲國家十余載的交通事故資料進行研究,提出非線性回歸分析預(yù)測法。對此,他建立冪函數(shù)曲線事故模型,
即:D=0.0003。其中D為交通事故死亡人數(shù);N是機動車保有量;P為人口數(shù)量。
回歸分析預(yù)測法能夠?qū)煌ㄊ鹿视绊懸蛩亻g的因果關(guān)系加以反應(yīng),以達到預(yù)測結(jié)果的目的,但對變化趨勢的反應(yīng)可能較為遲鈍。該預(yù)測方法適用于樣本量較大、數(shù)據(jù)波動小和極具規(guī)律性的預(yù)測實踐中。
2.2 時間序列預(yù)測法
時間序列預(yù)測法主要有兩種類型,分別為移動平均預(yù)測法和指數(shù)平滑預(yù)測法。首先,移動平均預(yù)測法是比較簡單的平滑預(yù)測技術(shù),通過計算項數(shù)時序平均值,對長期發(fā)展趨勢變化做出科學(xué)合理的預(yù)測。內(nèi)蒙古科技大學(xué)韋麗琴、徐勇勇利用時間序列ARIMA模型做出科學(xué)合理的預(yù)測分析,對交通事故加以預(yù)測。其次,指數(shù)平滑預(yù)測法的通式為:
Ft+1=αxt+(1-α)Ft
時間序列預(yù)測法屬于定量預(yù)測方法,擬合效果良好,但在短期預(yù)測中,受諸多因素干擾影響較大,使預(yù)測結(jié)果具有不確定性。該方法適用于國內(nèi)縣區(qū)等區(qū)域范圍較小的預(yù)測實踐中。
2.3 灰色馬爾科夫鏈預(yù)測法
道路交通系統(tǒng)屬于動態(tài)時變系統(tǒng),但影響交通安全的因素多且復(fù)雜。在灰色馬爾科夫鏈預(yù)測法的指導(dǎo)下,相關(guān)人員能夠通過灰色預(yù)測模型,做出短期預(yù)測,以縮小預(yù)測區(qū)間,提高預(yù)測效率。云南交通職業(yè)技術(shù)學(xué)院王剛對灰色馬爾科夫鏈預(yù)測法而建立模型,對交通事故進行預(yù)測,根據(jù)實踐可知,基于該模型的預(yù)測精確度十分高,取得良好的預(yù)測成效。
灰色預(yù)測以短期預(yù)測為主,馬爾科夫鏈預(yù)測以長期預(yù)測為主,通過二者結(jié)合,可提高預(yù)測精度,但如若數(shù)據(jù)變化大,則灰色模型的吻合度和精度下降。借助該預(yù)測方法,能夠?qū)顟B(tài)下的轉(zhuǎn)移規(guī)律加以預(yù)測,并揭示交通事故時序變化總趨勢。
2.4 貝葉斯預(yù)測法
貝葉斯預(yù)測法主要相對于交通事故中的車速問題而言。在交通事故中,車速是重要影響因素,如若車輛速度過快,則駕駛員反應(yīng)的時間較少,其應(yīng)急策略不足,造成重大交通安全隱患。貝葉斯預(yù)測法能夠?qū)ξ磥斫煌ㄊ鹿拾l(fā)生的可能性進行預(yù)測。該預(yù)測方法應(yīng)用中,必須建立在交通事故和車速有關(guān)聯(lián)的基礎(chǔ)之上,有助于交通部門人員更好開展數(shù)據(jù)統(tǒng)計和交通流進行觀測。
2.5 灰關(guān)聯(lián)分析及神經(jīng)網(wǎng)絡(luò)預(yù)測法
就灰關(guān)聯(lián)分析及神經(jīng)網(wǎng)絡(luò)預(yù)測法而言,哈爾濱工業(yè)大學(xué)交通研究所和中國城市規(guī)劃設(shè)計研究院的裴玉龍與張宇提出該方法,旨在通過交通事故影響因素分析,對事故進行進一步解析,并建立合理的模型理論和確定預(yù)測指標(biāo),對未來交通事故發(fā)展趨勢加以預(yù)測。該預(yù)測方法的適應(yīng)性較強,在我國交通事故預(yù)測工作實踐中有著較為有效的運用,可解決傳統(tǒng)預(yù)測方法難以解決的問題,建立在BP網(wǎng)絡(luò)基礎(chǔ)之上,并利用計算機開展輔計算活動。
2.6 多層遞階預(yù)測方法
多層遞階預(yù)測方法能夠規(guī)避傳統(tǒng)統(tǒng)計預(yù)測方法的缺陷,以現(xiàn)代控制理論“系統(tǒng)辨識”為重要基礎(chǔ),對對象的未來狀態(tài)做科學(xué)的預(yù)測。動態(tài)系統(tǒng)數(shù)學(xué)模型為:y(k)=。在交通事故預(yù)測中,多層遞階預(yù)測方法是大數(shù)據(jù)時代背景下的重要處理方式,有利于增強預(yù)測效果。
3 結(jié)論
交通部門對交通事故進行合理的預(yù)測,有利于提高道路交通系統(tǒng)的安全系數(shù)。所以,相關(guān)人員合理選擇交通事故預(yù)測方法具有必要性,為規(guī)避交通事故而做出科學(xué)合理的決策。目前,使用較多的交通事故預(yù)測方法主要有:回歸分析預(yù)測法、時間序列預(yù)測法、灰色馬爾科夫鏈預(yù)測法、貝葉斯預(yù)測法、灰關(guān)聯(lián)分析及神經(jīng)網(wǎng)絡(luò)預(yù)測法等,因其各具優(yōu)缺點和適用條件,因而要求相關(guān)人員必須對系列問題進行深入探究,確保公路交通事故預(yù)測的有效性。
參考文獻
[1]李景文,高桂清.交通事故預(yù)測分析[J].中國安全科學(xué)學(xué)報,2015,6(01):20-23.
[2]劉志強.道路交通事故預(yù)測方法比較研究[J].交通與計算機,2013,19(05):7-10.
【中圖分類號】G64 【文獻標(biāo)識碼】A 【文章編號】2095-3089(2015)06-0155-02
大數(shù)據(jù),或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)[2]。大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對那些含有意義的數(shù)據(jù)進行專業(yè)化處理。本文將以東北地區(qū)數(shù)學(xué)專業(yè)教師大數(shù)據(jù)為基礎(chǔ),通過“加工”實現(xiàn)數(shù)據(jù)的“增值”,使其為決策與預(yù)測服務(wù)。
一、東北地區(qū)數(shù)學(xué)專業(yè)教師大數(shù)據(jù)來源及準(zhǔn)備
通過查閱資料與調(diào)查,收集到東北三省各高校數(shù)學(xué)教師相關(guān)大數(shù)據(jù),包括教師教齡(?S年)、收入(?S元)、稅收(?S元)和職業(yè)病情況等方面的實際數(shù)據(jù)。由于得到的數(shù)據(jù)信息量大,輕重各異,所以首先需要進行數(shù)據(jù)預(yù)處理,即清除異常數(shù)據(jù)、錯誤糾正、格式標(biāo)準(zhǔn)化等,再通過數(shù)據(jù)挖掘技術(shù),利用一系列相關(guān)算法和數(shù)據(jù)處理技術(shù)從大量的數(shù)據(jù)中提取人們所需要的重要信息,也就是上面所提到的實現(xiàn)信息的“增值”,同時大大提高數(shù)據(jù)處理效率,下面具體介紹本項目所采用的模型和計算方法。
二、東北地區(qū)數(shù)學(xué)專業(yè)教師大數(shù)據(jù)分析與結(jié)果
收集并處理好教師教齡、收入、稅收和職業(yè)病情況等方面的數(shù)據(jù)后,本文主要針對三個方面進行了詳細的分析:
1.教師收入隨年份的變化
(1)數(shù)據(jù)范圍:1994年-2014年東三省各高校數(shù)學(xué)教師收入(單位:元);
(2)計算條件:matlab軟件,最小二乘回歸分析,高性能計算工作站;
(3)求解過程:年份作為自變量x,收入為因變量y,從總體上看,二者統(tǒng)計關(guān)系大致符合一元線性的正態(tài)誤差模型[3],即對給定xi的有最小二乘一元線性回歸公式y(tǒng)i=b0+b1xi+εi,其中:
b■=■, ■=■■x■b0=■-b■■, ■ =■■y■
其中εi是由變量可能的內(nèi)在隨機性、未知影響因素等隨機擾動造成的誤差??傊煽闯墒潜姸嗉毿∮绊懸蛩氐木C合代表。最后,由Matlab提供polyfit函數(shù)實現(xiàn)回歸函數(shù)擬合[4];
(4)結(jié)果分析:計算結(jié)果表明,隨著年份的增加,教師收入也在不斷增加。估計的因變量的系數(shù)b1約為191,也就是說,每過一年,教師收入大致可增加近191元。
2.教師職業(yè)病情況與教齡的關(guān)系
(1)數(shù)據(jù)范圍:1994年―2014年東三省各高校數(shù)學(xué)教師教齡(單位:年)、職業(yè)病情況;
(2)結(jié)果分析:首先利用matlab軟件,以橫軸為某年東三省數(shù)學(xué)教師教齡,縱軸反映相應(yīng)教齡的平均職業(yè)病情況(為方便,規(guī)定越接近縱軸正方向,職業(yè)病越嚴(yán)重)利用matlab軟件繪制圖形[5],發(fā)現(xiàn)教師教齡越長,職業(yè)病也愈加嚴(yán)重。每一年的教師職業(yè)病情況均可繪制一張圖表,通過將這11張圖表的最高值(即每一年職業(yè)病的最高值)做比較,發(fā)現(xiàn)其趨勢是先逐年下降,最后趨于穩(wěn)定。
3.對教師專業(yè)發(fā)展階段的研究
(1)數(shù)據(jù)范圍:2014年東三省各高校數(shù)學(xué)教師收入、教齡、稅收和職業(yè)病大數(shù)據(jù);
(2)計算條件:IBM處理器、大數(shù)據(jù)挖掘分類算法;
(3)求解過程:用神經(jīng)網(wǎng)絡(luò)研究方法(即模擬生物上神經(jīng)元工作的方法)。圖中每個橢圓形節(jié)點接受輸入數(shù)據(jù),將數(shù)據(jù)處理后輸出,輸入層節(jié)點接受教師信息的輸入,然后將數(shù)據(jù)傳遞給隱藏層,隱藏層將數(shù)據(jù)傳給輸出層,輸出層輸出教師專業(yè)發(fā)展處于哪一專業(yè)成熟階段;
(4)結(jié)果分析:若將教師專業(yè)成熟過程分為三個階段:形成期、發(fā)展期和成熟期。那么利用IBM處理器和以上算法,在所調(diào)查的教師中,約70%處于發(fā)展時期,是其基本適應(yīng)教育教學(xué)工作的時期;約20%處于形成期,是形成良好心理素質(zhì)和正確教育思想的關(guān)鍵時期;約10%處于成熟期,是掌握教學(xué)主動權(quán),成為學(xué)校教學(xué)骨干的時期;
(5)研究意義:研究東三省高校數(shù)學(xué)教師專業(yè)發(fā)展成熟階段,可以基本掌握教師資源結(jié)構(gòu),從而能夠遵循不同發(fā)展階段的不同特征、觀念、心理、發(fā)展需求,制定相應(yīng)教研活動、政策和制度,促進教師全面持續(xù)發(fā)展[6]。
三、結(jié)果討論
1.數(shù)據(jù)呈現(xiàn)以上結(jié)果的原因
(1)隨著國家科教興國戰(zhàn)略的深入實施,教師的工資和待遇將被逐步納入國家工作人員統(tǒng)一管理,教師的收入將得到很大的提高。另一方面,數(shù)學(xué)能力的培養(yǎng)是學(xué)習(xí)各專業(yè)、走入各行業(yè)的基礎(chǔ),國家將加大數(shù)學(xué)知識的教育力度,進而數(shù)學(xué)專業(yè)教師所付出的辛苦也更加不可小覷,綜合以上幾個重要原因,教師收入隨年份增加而增加也是符合經(jīng)濟理論的。
(2)教齡越長,職業(yè)病也越嚴(yán)重的依存關(guān)系,我們?nèi)菀桌斫?。但隨著時間的推移,職業(yè)病的嚴(yán)重性呈現(xiàn)下降趨勢正是反映了我國科技的革新:環(huán)境的改變、教學(xué)設(shè)備和教學(xué)技術(shù)的更新使得教師的課堂教學(xué)更加高效和輕松便捷,如多媒體、電子白板使得課堂不再“塵土飛揚”。
(3)在對教師專業(yè)發(fā)展階段的研究中,處于專業(yè)發(fā)展時期的教師所占比例最高,達到近70%。實際上,他們多數(shù)處于青壯年的人生階段,是社會的中堅力量,又曾在高等教育多樣化與綜合化的背景下受到過良好的教育,并具有較豐富的教學(xué)經(jīng)驗和緊跟新時代的創(chuàng)新思想,自然在專業(yè)發(fā)展的角度也占有較大比例。
2.合理的相關(guān)預(yù)測
大數(shù)據(jù)最有價值的特點就是其“預(yù)見性”。上述數(shù)值結(jié)果表明,在經(jīng)濟平穩(wěn)發(fā)展和社會穩(wěn)定的前提下,東三省數(shù)學(xué)專業(yè)教師的收入在未來的幾十年依舊處于增長趨勢,教師職業(yè)病總體減輕,專業(yè)發(fā)展越來越成熟,使得教師隊伍整體素質(zhì)越來越高,而未來教師的考核獎勵制度也會變得更加嚴(yán)格和全面。
3.建議
(1)無論是對教師行業(yè)還是其他行業(yè)感興趣,都要關(guān)注其變化,分析其形勢及趨勢,以便對此行業(yè)的認知更加科學(xué)合理。
(2)本文采用的大數(shù)據(jù)處理所用模型和方法,可以進一步推廣到其它相關(guān)領(lǐng)域,使之成為研究大數(shù)據(jù)的更通用的工具。
本文利用matlab軟件、最小二乘法模型及IBM處理器分析了東北地區(qū)數(shù)學(xué)專業(yè)教師大數(shù)據(jù),得出的結(jié)果對于掌握該地區(qū)數(shù)學(xué)教師基本情況并預(yù)測其發(fā)展趨勢有著重要的作用,還為熱心同類問題的研究者提供高效的方法和技術(shù)。當(dāng)我們不能有效處理所獲取的大數(shù)據(jù),它們就是一些平凡的數(shù)字和符號。如果我們能夠很好地駕馭大數(shù)據(jù),它們必定會為我們帶來諸多的方便。
最小二乘法模型在處理大數(shù)據(jù)時有一定的優(yōu)勢[7],統(tǒng)計分析,神經(jīng)網(wǎng)絡(luò)算法和遺傳算法都是處理大數(shù)據(jù)的有效方法,如果能將這些方法有機的結(jié)合起來,將更能獲得許多滿意的數(shù)值分析結(jié)果。當(dāng)大數(shù)據(jù)超過計算條件的時空允許時,不僅耗時費力,甚至使得計算成為不可能,通常需要采用并行算法等高效計算手段。在高性能計算方面,我們并沒有用到并行算法,如果能利用并行算法,所處理的數(shù)值結(jié)果容量會更大更有參考價值。
參考文獻:
[1]蔡鎖章主編.數(shù)學(xué)建模:原理與方法.北京:海洋出版社,2000.
[2]維克托邁爾舍恩伯格.大數(shù)據(jù)時代.浙江:浙江人民出版社,2012.
[3]吳翊,吳孟達,成禮智編著.數(shù)學(xué)建模的理論與實踐.長沙:國防科技大學(xué)出版社,1999.
[4]張德豐編著.Matlab數(shù)值分析與仿真案例.北京:清華大學(xué)出版社,2011.10(21世紀(jì)高等學(xué)校規(guī)劃教材計算機應(yīng)用)IBSN 978―7―302―26254―1.