伊人色婷婷综在合线亚洲,亚洲欧洲免费视频,亚洲午夜视频在线观看,最新国产成人盗摄精品视频,日韩激情视频在线观看,97公开免费视频,成人激情视频在线观看,成人免费淫片视频男直播,青草青草久热精品视频99

數(shù)據(jù)分析方法模板(10篇)

時(shí)間:2024-01-10 14:58:46

導(dǎo)言:作為寫作愛好者,不可錯(cuò)過為您精心挑選的10篇數(shù)據(jù)分析方法,它們將為您的寫作提供全新的視角,我們衷心期待您的閱讀,并希望這些內(nèi)容能為您提供靈感和參考。

數(shù)據(jù)分析方法

篇1

(1)現(xiàn)狀分析:告訴你過去發(fā)生了什么;

(2)原因分析:告訴你為什么發(fā)生了;

(3)預(yù)測(cè)分析:告訴你將來發(fā)生什么。

明確數(shù)據(jù)分析這三大作用后,那么大家是否思考過這三大作用都要通過什么方法來實(shí)現(xiàn)呢?現(xiàn)在我們就來看看數(shù)據(jù)分析三大作用都需要用哪些數(shù)據(jù)分析方法來實(shí)現(xiàn)。這三大作用基本可分別對(duì)應(yīng)對(duì)比、細(xì)分、預(yù)測(cè)三大基本方法,每個(gè)基本方法都有相應(yīng)具體的數(shù)據(jù)分析方法,如對(duì)比基本方法下有對(duì)比分析、分組分析、結(jié)構(gòu)分析、交叉分析、矩陣分析、綜合評(píng)價(jià)分析等,這些方法核心關(guān)鍵詞都是對(duì)比。下面我們就來學(xué)習(xí)這幾個(gè)常用的分析方法。

對(duì)比分析法

第一個(gè)數(shù)據(jù)分析方法就是對(duì)比分析法。它可是數(shù)據(jù)分析的基本方法之一。對(duì)比分析法,是指將兩個(gè)或兩個(gè)以上的數(shù)據(jù)進(jìn)行比較,分析它們的差異,從而揭示這些數(shù)據(jù)所代表的事物發(fā)展變化情況和規(guī)律性。對(duì)比分析的特點(diǎn)是:可以非常直觀地看出事物某方面的變化或差距,并且可以準(zhǔn)確、量化地表示出這種變化或差距是多少。

對(duì)比分析法可分為靜態(tài)比較和動(dòng)態(tài)比較兩類。

(1)靜態(tài)比較是在同一時(shí)間條件下對(duì)不同總體指標(biāo)的比較,如不同部門、不同地區(qū)、不同國(guó)家的比較,也叫橫向比較,簡(jiǎn)稱橫比。

(2)動(dòng)態(tài)比較是在同一總體條件下對(duì)不同時(shí)期指標(biāo)數(shù)值的比較,也叫縱向比較,簡(jiǎn)稱縱比。

這兩種方法既可單獨(dú)使用,也可結(jié)合使用。進(jìn)行對(duì)比分析時(shí),可以單獨(dú)使用總量指標(biāo)、相對(duì)指標(biāo)或平均指標(biāo),也可將它們結(jié)合起來進(jìn)行對(duì)比。比較的結(jié)果可用相對(duì)數(shù)表示,如百分?jǐn)?shù)、倍數(shù)等指標(biāo)。

目前對(duì)比分析常用的有以下幾個(gè)維度:

(1)與目標(biāo)對(duì)比。實(shí)際完成值與目標(biāo)進(jìn)行對(duì)比,屬于橫比。例如每個(gè)公司每年都有自己的業(yè)績(jī)目標(biāo)或計(jì)劃,所以首先可將目前的業(yè)績(jī)與全年的業(yè)績(jī)目標(biāo)進(jìn)行對(duì)比,看是否完成目標(biāo)。

(2)不同時(shí)期對(duì)比。選擇不同時(shí)期的指標(biāo)數(shù)值作為對(duì)比標(biāo)準(zhǔn),屬于縱比。與去年同期對(duì)比簡(jiǎn)稱同比,與上個(gè)月完成情況對(duì)比簡(jiǎn)稱環(huán)比。通過對(duì)比自身在不同時(shí)間點(diǎn)上的完成情況,就可知道自身是進(jìn)步還是退步。

(3)同級(jí)部門、單位、地區(qū)對(duì)比。與同級(jí)部門、單位、地區(qū)進(jìn)行對(duì)比,屬于橫比。這樣可了解自身某一方面或各方面的發(fā)展水平在公司、集團(tuán)內(nèi)部或各地區(qū)處于什么樣的位置,明確哪些指標(biāo)是領(lǐng)先的,哪些指標(biāo)是落后的,進(jìn)而找出下一步發(fā)展的方向和目標(biāo)。

(4)行業(yè)內(nèi)對(duì)比。與行業(yè)中的標(biāo)桿企業(yè)、競(jìng)爭(zhēng)對(duì)手或行業(yè)的平均水平進(jìn)行對(duì)比,屬于橫比。同樣我們也可了解自身某一方面或各方面的發(fā)展水平在行業(yè)內(nèi)處于什么樣的位置,明確哪些指標(biāo)是領(lǐng)先的,哪些指標(biāo)是落后的,進(jìn)而找出未來發(fā)展的方向和目標(biāo)。

(5)活動(dòng)效果對(duì)比。對(duì)某項(xiàng)營(yíng)銷活動(dòng)開展前后進(jìn)行對(duì)比,屬于縱比。做這樣的比較可以分析營(yíng)銷活動(dòng)開展得是否有效果,效果是否明顯;還可對(duì)企業(yè)投放廣告的前后業(yè)務(wù)狀況進(jìn)行對(duì)比分析,了解投放的廣告是否有效果,如品牌知名度是否提升、產(chǎn)品銷量是否有大幅增長(zhǎng)等。

對(duì)比分析的維度不限于以上5點(diǎn),這里只是列出常用的5種維度,當(dāng)然還有其他維度,可根據(jù)自己的實(shí)際情況采用不同的維度進(jìn)行對(duì)比分析。

進(jìn)行對(duì)比分析時(shí)還要考慮以下幾點(diǎn)因素:

(1)指標(biāo)的口徑范圍、計(jì)算方法、計(jì)量單位必須一致,即要用同一種單位或標(biāo)準(zhǔn)去衡量。如果各指標(biāo)的口徑范圍不一致,必須進(jìn)行調(diào)整之后才能進(jìn)行對(duì)比。沒有統(tǒng)一的標(biāo)準(zhǔn),就無法比較。例如600美元與3000元人民幣就無法直接比較,需要根據(jù)當(dāng)期的匯率進(jìn)行換算后才可進(jìn)行比較,否則不具有可比性。

(2)對(duì)比的對(duì)象要有可比性。例如不能拿廣州市與華西村、美國(guó)與亞洲進(jìn)行對(duì)比??傊畬?duì)比對(duì)象之間相似之處越多,可比性就越強(qiáng)。因此,我們?cè)谶x擇和確定對(duì)比對(duì)象時(shí),一定要分析它們是否具有對(duì)比的意義。

(3)對(duì)比的指標(biāo)類型必須一致。無論絕對(duì)數(shù)指標(biāo)、相對(duì)數(shù)指標(biāo),還是其他不同類型的指標(biāo),在進(jìn)行對(duì)比時(shí),雙方必須統(tǒng)一。例如2012年廣州的GDP值與2012年深圳GDP增長(zhǎng)率,是無法進(jìn)行對(duì)比的。

分組分析法

數(shù)據(jù)分析不僅要對(duì)總體的數(shù)量特征和數(shù)量關(guān)系進(jìn)行分析,還要深入總體內(nèi)部進(jìn)行分組分析。分組分析法是一種重要的數(shù)據(jù)分析方法,這種方法是根據(jù)數(shù)據(jù)分析對(duì)象的特征,按照一定的標(biāo)志(指標(biāo)),把數(shù)據(jù)分析對(duì)象劃分為不同的部分和類型來進(jìn)行研究,以揭示其內(nèi)在的聯(lián)系和規(guī)律性。

分組的目的就是為了進(jìn)行組間對(duì)比,是把總體中具有不同性質(zhì)的對(duì)象區(qū)分開,把性質(zhì)相同的對(duì)象合并在一起,保持各組內(nèi)對(duì)象屬性的一致性、組與組之間屬性的差異性,以便進(jìn)一步運(yùn)用各種數(shù)據(jù)分析方法來解構(gòu)內(nèi)在的數(shù)量關(guān)系,因此分組分析法必須與對(duì)比分析法結(jié)合運(yùn)用。

分組分析法的關(guān)鍵在于確定組數(shù)與組距。在數(shù)據(jù)分組中,各組之間的取值界限稱為組限,一個(gè)組的最小值稱為下限,最大值稱為上限;上限與下限的差值稱為組距;上限值與下限值的平均數(shù)稱為組中值,它是一組變量值的代表值。

結(jié)構(gòu)分析法

結(jié)構(gòu)分析法是指研究總體內(nèi)各部分與總體之間關(guān)系的分析方法,即總體內(nèi)各部分占總體的比例。一般某部分的比例越大,說明其重要程度越高,對(duì)總體的影響也就越大。例如通過對(duì)國(guó)民經(jīng)濟(jì)的構(gòu)成分析,可以得到國(guó)民經(jīng)濟(jì)在生產(chǎn)、流通、分配各環(huán)節(jié)占國(guó)民經(jīng)濟(jì)的比重,或是各部門貢獻(xiàn)比重,揭示各部分之間的相互聯(lián)系及其變化規(guī)律。

結(jié)構(gòu)分析法的優(yōu)點(diǎn)是簡(jiǎn)單實(shí)用,在實(shí)際的企業(yè)運(yùn)營(yíng)分析中,市場(chǎng)占有率就是一個(gè)非常經(jīng)典的應(yīng)用。

交叉分析法

交叉分析法通常用于分析兩個(gè)或兩個(gè)以上分組變量(字段)之間的關(guān)系,以交叉表形式進(jìn)行變量間關(guān)系的對(duì)比分析,所以也叫交叉表分析法。交叉表當(dāng)然也有二維以上的,維度越多,交叉表就越復(fù)雜,所以在選擇幾個(gè)維度的時(shí)候需要根據(jù)分析的目的決定。

交叉分析的原理就是從數(shù)據(jù)的不同維度綜合進(jìn)行分組細(xì)分,以進(jìn)一步了解數(shù)據(jù)的構(gòu)成、分布特征。

矩陣分析法

矩陣分析法是指根據(jù)事物(如產(chǎn)品、服務(wù)等)的兩個(gè)重要屬性(指標(biāo))作為分析的依據(jù),進(jìn)行分類關(guān)聯(lián)分析,進(jìn)而找出解決問題的一種分析方法,也稱為矩陣關(guān)聯(lián)分析法,簡(jiǎn)稱矩陣分析法。

矩陣以屬性A為橫軸,屬性B為縱軸,組成一個(gè)坐標(biāo)系,在兩坐標(biāo)軸上分別按某一標(biāo)準(zhǔn)(可取平均值、經(jīng)驗(yàn)值、行業(yè)水平等)進(jìn)行刻度劃分,構(gòu)成4個(gè)象限,將要分析的每個(gè)事物對(duì)應(yīng)投射至這4個(gè)象限內(nèi),進(jìn)行交叉分類分析,直觀地將兩個(gè)屬性的關(guān)聯(lián)性表現(xiàn)出來,進(jìn)而分析每一個(gè)事物在這兩個(gè)屬性上的表現(xiàn),因此它也稱為象限圖分析法。

綜合評(píng)價(jià)分析法

綜合評(píng)價(jià)分析法是針對(duì)事物不同方面的數(shù)量特征,運(yùn)用數(shù)學(xué)、統(tǒng)計(jì)等方法,得出綜合數(shù)量水平的一種分析方法。綜合評(píng)價(jià)分析法的基本思想是將多個(gè)指標(biāo)轉(zhuǎn)化為一個(gè)能夠反映綜合情況的指標(biāo)來進(jìn)行分析評(píng)價(jià)。如不同國(guó)家的經(jīng)濟(jì)實(shí)力,不同地區(qū)的社會(huì)發(fā)展水平,各企業(yè)經(jīng)濟(jì)效益評(píng)價(jià)、企業(yè)內(nèi)各員工績(jī)效評(píng)價(jià)等,都可以運(yùn)用這種方法。進(jìn)行綜合評(píng)價(jià)分析,主要有5個(gè)步驟:

步驟1:確定綜合評(píng)價(jià)指標(biāo)體系,即包含哪些指標(biāo);

步驟2:收集數(shù)據(jù)并進(jìn)行不同計(jì)量單位的數(shù)據(jù)標(biāo)準(zhǔn)化處理;

步驟3:確定指標(biāo)體系中各指標(biāo)的權(quán)重;

步驟4:對(duì)經(jīng)過處理后的指標(biāo)進(jìn)行匯總計(jì)算綜合得分;

篇2

中圖分類號(hào):N37 文獻(xiàn)標(biāo)識(shí)碼:B 文章編號(hào):1009-9166(2009)02(c)-0063-02

現(xiàn)代企業(yè)的決策往往是在整合大量信息資料的基礎(chǔ)上制定出來的,對(duì)數(shù)據(jù)的理解和應(yīng)用將是企業(yè)決策的基石。與傳統(tǒng)的操作型應(yīng)用相比,數(shù)據(jù)利用的應(yīng)用建設(shè)難度更大,它是隨著管理水平而發(fā)展,同時(shí)又取決于業(yè)務(wù)人員的主觀意識(shí),這就決定了以數(shù)據(jù)利用為核心的應(yīng)用建設(shè)不可能一蹴而就,而是一個(gè)長(zhǎng)期迭展的建設(shè)過程。從2003年起工廠開始全面推進(jìn)數(shù)據(jù)分析應(yīng)用工作,經(jīng)歷過曲折,同時(shí)也有收獲。經(jīng)過多年的努力,工廠的數(shù)據(jù)分析應(yīng)用工作開始進(jìn)入良性發(fā)展階段,筆者認(rèn)為有必要對(duì)工廠目前數(shù)據(jù)分析應(yīng)用工作作一總結(jié)和思考。

一、工廠數(shù)據(jù)分析應(yīng)用工作開展現(xiàn)狀

工廠數(shù)據(jù)分析應(yīng)用工作推進(jìn)至今已有四五年的時(shí)間,從最初全面調(diào)研工廠數(shù)據(jù)量和數(shù)據(jù)分析應(yīng)用狀況,將數(shù)據(jù)分析應(yīng)用率指標(biāo)作為方針目標(biāo)定量指標(biāo)來考核,到后來將數(shù)據(jù)分析應(yīng)用工作的推進(jìn)重心從量向質(zhì)轉(zhuǎn)移,采用以項(xiàng)目為載體進(jìn)行管理,著重體現(xiàn)數(shù)據(jù)分析應(yīng)用的實(shí)效性,再到目前以分析應(yīng)用的需求為導(dǎo)向,以分析應(yīng)用點(diǎn)為載體,分層次進(jìn)行策劃。經(jīng)過上述三個(gè)階段,工廠數(shù)據(jù)分析應(yīng)用工作推進(jìn)機(jī)制得到了逐步的完善,形成了廣度深度協(xié)同發(fā)展的信息資源利用管理框架。截止到目前,工廠數(shù)據(jù)分析應(yīng)用率達(dá)到96%,四個(gè)層次的分析應(yīng)用點(diǎn)共計(jì)100多個(gè),數(shù)據(jù)分析應(yīng)用工作在生產(chǎn)、質(zhì)量、成本、物耗、能源等條線得到廣泛開展,有效推動(dòng)了工廠管理數(shù)字化和精細(xì)化。2007年,工廠開始探索細(xì)化四個(gè)應(yīng)用層次的推進(jìn)脈絡(luò),進(jìn)一步豐富工廠信息資源利用框架,形成層次清晰、脈絡(luò)鮮明、職責(zé)分明的信息資源利用立體化的推進(jìn)思路。

1、第一層次現(xiàn)場(chǎng)監(jiān)控層。第一層次現(xiàn)場(chǎng)監(jiān)控層,應(yīng)用主體是一線工人和三班管理干部,應(yīng)用對(duì)象是生產(chǎn)過程實(shí)時(shí)數(shù)據(jù),應(yīng)用目標(biāo)是通過加強(qiáng)生產(chǎn)過程控制,輔助一線及時(shí)發(fā)現(xiàn)生產(chǎn)過程中的異常情況,提高生產(chǎn)穩(wěn)定性。例如制絲車間摻配工段的生產(chǎn)報(bào)警,通過對(duì)生產(chǎn)過程中葉絲配比、膨絲配比、梗絲配比、薄片配比、加香配比等信息進(jìn)行判異操作,對(duì)異常情況通過語音報(bào)警方式提醒擋車工進(jìn)行異常處理;例如卷包車間通過在機(jī)臺(tái)電腦上對(duì)各生產(chǎn)機(jī)組的工藝、設(shè)備參數(shù)、實(shí)時(shí)產(chǎn)量、質(zhì)量、損耗數(shù)據(jù)的監(jiān)控,提高對(duì)產(chǎn)品質(zhì)量的過程控制能力。第一層次應(yīng)用以上位機(jī)和機(jī)臺(tái)電腦上固化的監(jiān)控模型為主,制絲車間每個(gè)工序、卷包車間每種機(jī)型的應(yīng)用點(diǎn)都有所不同,為此我們建立了制絲車間以工序?yàn)槊}絡(luò),卷包車間以機(jī)種為脈絡(luò)的應(yīng)用點(diǎn)列表,圍繞脈絡(luò)對(duì)第一層次應(yīng)用點(diǎn)進(jìn)行梳理,形成第一層次應(yīng)用的規(guī)范化模板。制絲車間第一層次應(yīng)用點(diǎn)模板包括工序名稱、應(yīng)用點(diǎn)名稱、應(yīng)用模型描述、應(yīng)用對(duì)象、應(yīng)用平臺(tái)、異常處置路徑等基本要素。卷包車間應(yīng)用點(diǎn)模板橫向根據(jù)機(jī)種分,縱向按上班及交接班、上班生產(chǎn)過程中、下班及交接班三個(gè)時(shí)間段分,通過調(diào)研分別列出擋車工針對(duì)每個(gè)機(jī)種在三個(gè)時(shí)間段分別要查看的數(shù)據(jù)和進(jìn)行的操作。隨著模板的擴(kuò)充和完善,一線職工的知識(shí)、經(jīng)驗(yàn)不斷充實(shí)其中,第一層次應(yīng)用點(diǎn)模板將成為一線工人和三班管理干部日常應(yīng)用監(jiān)控的標(biāo)準(zhǔn),同時(shí)可以規(guī)避人員退休或調(diào)動(dòng)帶來的經(jīng)驗(yàn)、知識(shí)流失的風(fēng)險(xiǎn)。2、第二層次日常管理分析層。第二層次日常管理分析層,應(yīng)用主體是一般管理干部,應(yīng)用對(duì)象是產(chǎn)質(zhì)損、設(shè)備、動(dòng)能等指標(biāo),應(yīng)用目標(biāo)是通過加強(qiáng)對(duì)各類考核指標(biāo)的監(jiān)控和分析,提高工廠整體的關(guān)鍵績(jī)效指標(biāo)水平。例如制絲車間的劣質(zhì)成本數(shù)據(jù)匯總和分析,通過對(duì)車間內(nèi)各類廢物料、劣質(zhì)成本的數(shù)據(jù)進(jìn)行匯總、對(duì)比和分析,尋找其中規(guī)律及薄弱環(huán)節(jié),并尋根溯源,采取措施,降低劣質(zhì)成本。例如卷包車間的產(chǎn)量分析,通過對(duì)產(chǎn)量數(shù)據(jù)、工作日安排、計(jì)劃產(chǎn)量進(jìn)行統(tǒng)計(jì)和匯總,結(jié)合車間定額計(jì)劃、作業(yè)計(jì)劃和實(shí)際產(chǎn)量進(jìn)行分析,尋找實(shí)際生產(chǎn)情況與計(jì)劃間的差異,并分析原因。第二層次應(yīng)用以管理人員個(gè)性化的分析為主,呈現(xiàn)出分析方法多樣化、應(yīng)用工具多樣化的特點(diǎn)。但是萬變不離其中的是每個(gè)管理崗位的管理目標(biāo)以及圍繞管理目標(biāo)開展的分析應(yīng)用是相對(duì)固定的,至少在短期內(nèi)不會(huì)有太大的變化。為此我們建立了一份以重點(diǎn)崗位為脈絡(luò)的應(yīng)用點(diǎn)列表,圍繞脈絡(luò)對(duì)第二層次應(yīng)用點(diǎn)進(jìn)行梳理,形成第二層次應(yīng)用的規(guī)范化模板。模板包括崗位名稱、管理目標(biāo)、應(yīng)用點(diǎn)名稱、應(yīng)用描述、涉及主要考核指標(biāo)、應(yīng)用平臺(tái)、應(yīng)用頻次、分析去向等基本要素。通過構(gòu)建第二層次應(yīng)用點(diǎn)模板,明確了每個(gè)管理崗位應(yīng)用信息資源支撐管理目標(biāo)的內(nèi)容和職責(zé)。隨著新的管理目標(biāo)的不斷提出以及應(yīng)用的逐步深入,模板每年都會(huì)有更新和擴(kuò)充。3、第三層次針對(duì)性分析應(yīng)用層。第三層次針對(duì)性分析應(yīng)用層,應(yīng)用主體是項(xiàng)目實(shí)施者,應(yīng)用對(duì)象是各類項(xiàng)目的實(shí)施過程,例如QC項(xiàng)目、六西格瑪項(xiàng)目、質(zhì)量改進(jìn)項(xiàng)目,或針對(duì)生產(chǎn)中的特定事件進(jìn)行的分析和研究。應(yīng)用目標(biāo)是通過應(yīng)用數(shù)據(jù)資源和統(tǒng)計(jì)方法開展現(xiàn)狀調(diào)查、因果分析、效果驗(yàn)證等工作,提高各類項(xiàng)目實(shí)施的嚴(yán)密性和科學(xué)性。第三層次的應(yīng)用工具在使用初級(jí)統(tǒng)計(jì)方法的基礎(chǔ)上會(huì)大量應(yīng)用包括方差分析、回歸分析、正交試驗(yàn)、假設(shè)檢驗(yàn)、流程圖等在內(nèi)的中級(jí)統(tǒng)計(jì)方法。以QC活動(dòng)為例,我們可以看出其實(shí)施過程無一不與數(shù)據(jù)應(yīng)用之間有密切的聯(lián)系[1]。近年來,在質(zhì)量改進(jìn)項(xiàng)目和QC項(xiàng)目的評(píng)審工作中已逐步將“應(yīng)用數(shù)據(jù)說話、運(yùn)用用正確合理的統(tǒng)計(jì)方法,提高解決問題的科學(xué)性”作為項(xiàng)目質(zhì)量考核標(biāo)準(zhǔn)之一。而六西格瑪項(xiàng)目實(shí)施的核心思想更是強(qiáng)調(diào)“以數(shù)據(jù)和事實(shí)驅(qū)動(dòng)管理”,其五個(gè)階段[2]D(定義)、M(測(cè)量)、A(分析)、I(改善)、C(控制),每個(gè)階段都要求結(jié)合如FMEA(失效模式后果分析),SPC(統(tǒng)計(jì)流程控制),MSA(測(cè)量系統(tǒng)分析),ANOVE(方差分析),DOE(實(shí)驗(yàn)設(shè)計(jì))等統(tǒng)計(jì)方法和統(tǒng)計(jì)工具的應(yīng)用。4、第四層次主題性應(yīng)用層。第四層次主題性應(yīng)用層,應(yīng)用主體是中層管理者,應(yīng)用對(duì)象是專業(yè)性或綜合性的分析主題,應(yīng)用目標(biāo)是通過專業(yè)科室設(shè)計(jì)的專題性分析模型或綜合性分析模型,為中層管理層提供決策依據(jù)。工廠在實(shí)施了業(yè)務(wù)流程“自動(dòng)化”之后,產(chǎn)生了大量的數(shù)據(jù)和報(bào)表。如何將工廠的業(yè)務(wù)信息及時(shí)、精煉、明確地陳述給中層管理層,以此來正確地判斷工廠的生產(chǎn)經(jīng)營(yíng)狀況,是擺在我們眼前的一個(gè)突出問題。大家都有開車的經(jīng)驗(yàn),司機(jī)在駕駛車輛的時(shí)候,他所掌握的車況基本上是來自汽車的儀表盤,在車輛行使的過程中,儀表盤指針的變化,告知汽車的車速、油料、水溫等的狀況,駕駛員只要有效地控制這些指標(biāo)在安全范圍之內(nèi),車子就能正常地運(yùn)行。我們不妨將儀表盤的理念移植于工廠,建立工廠關(guān)鍵指標(biāo)及運(yùn)行管理儀表盤,將工廠的關(guān)鍵信息直觀地列在上面,及時(shí)提醒各級(jí)管理人員工廠生產(chǎn)運(yùn)營(yíng)是否正常。

⑴關(guān)鍵績(jī)效指標(biāo)監(jiān)控系統(tǒng)。對(duì)分布在各處的當(dāng)前及歷史數(shù)據(jù)進(jìn)行統(tǒng)一展示,以工廠關(guān)鍵績(jī)效指標(biāo)為中心,支持統(tǒng)計(jì)分析和挖掘,可為中層管理者提供工廠關(guān)鍵績(jī)效指標(biāo)一門式的查詢服務(wù),使各業(yè)務(wù)部門尋找、闡釋問題產(chǎn)生的原因,以有效監(jiān)控各類關(guān)鍵績(jī)效指標(biāo),及時(shí)采取改進(jìn)措施,提高生產(chǎn)經(jīng)營(yíng)目標(biāo)完成質(zhì)量。⑵系統(tǒng)運(yùn)行狀態(tài)監(jiān)控系統(tǒng)。通過數(shù)據(jù)采集、手工錄入等各種渠道收集各類系統(tǒng)的運(yùn)行狀態(tài),及時(shí)掌握故障情況,采取措施加以閉環(huán),將因系統(tǒng)故障造成對(duì)用戶的影響減至最小,確保各類系統(tǒng)的穩(wěn)定運(yùn)行和有效應(yīng)用。通過建立系統(tǒng)運(yùn)行狀態(tài)監(jiān)控系統(tǒng),中層管理人員上班一打開電腦進(jìn)入系統(tǒng),就能了解到當(dāng)天及上一天各類系統(tǒng)的運(yùn)轉(zhuǎn)情況,發(fā)生了什么異常,哪些故障已經(jīng)得到解決,哪些故障還未解決。⑶第四層次主題性分析應(yīng)用。在展示關(guān)鍵績(jī)效指標(biāo)和系統(tǒng)運(yùn)行狀態(tài)的基礎(chǔ)上,由各專業(yè)科室思考專業(yè)條線上的分析主題,采用先進(jìn)科學(xué)的理念和方法對(duì)數(shù)據(jù)進(jìn)行分析和挖掘。近兩年來,工廠充分發(fā)揮專業(yè)科室的優(yōu)勢(shì)和力量,相繼設(shè)計(jì)和開發(fā)了工藝質(zhì)量條線的六西格瑪測(cè)評(píng)系統(tǒng),設(shè)備條線的設(shè)備效能分析系統(tǒng),還有質(zhì)量成本核算與分析系統(tǒng)。通過這些分析主題的支持,工廠管理人員可以更方便快捷地了解質(zhì)量、設(shè)備、成本等條線上的關(guān)鍵信息,及時(shí)采取相應(yīng)措施,從而提升管理效率。

二、數(shù)據(jù)分析應(yīng)用工作存在的不足及思考

工廠數(shù)據(jù)分析應(yīng)用工作的推進(jìn)方法從最初的采用數(shù)據(jù)分析應(yīng)用率單個(gè)指標(biāo)進(jìn)行推進(jìn)發(fā)展到目前按上文所述的四個(gè)層次進(jìn)行推進(jìn),每個(gè)層次的推進(jìn)脈絡(luò)已經(jīng)逐步清晰和明朗,但事物發(fā)展到一定的階段總會(huì)達(dá)到一個(gè)瓶頸口,目前工廠數(shù)據(jù)分析應(yīng)用工作存在的問題及措施思考如下:

1、從推進(jìn)手段上要突破信息條線,充分發(fā)揮專業(yè)條線的力量。信息條線作為推進(jìn)工廠數(shù)據(jù)分析應(yīng)用的主管條線,其作用往往局限在技術(shù)層面上的支撐。雖然信息條線每年都會(huì)規(guī)劃形成工廠數(shù)據(jù)分析應(yīng)用整體的工作思路和具體的實(shí)施計(jì)劃,但是無論從工廠層面還是從車間層面來講,單純依靠信息條線從側(cè)面加以引導(dǎo)和推進(jìn),使得數(shù)據(jù)分析應(yīng)用工作始終在業(yè)務(wù)條線的邊緣徘徊,與產(chǎn)量、質(zhì)量、設(shè)備、消耗、成本、動(dòng)能等各個(gè)條線本身工作的結(jié)合度有一定的距離。所以工廠要進(jìn)一步推進(jìn)數(shù)據(jù)分析應(yīng)用工作,調(diào)動(dòng)起業(yè)務(wù)人員的積極性和主動(dòng)性,突破現(xiàn)有的瓶頸,應(yīng)該考慮如何調(diào)動(dòng)起專業(yè)條線的力量。一是可以在年初策劃應(yīng)用點(diǎn)的時(shí)候要加強(qiáng)專業(yè)條線對(duì)車間業(yè)務(wù)自上而下的指導(dǎo),引導(dǎo)管理人員加強(qiáng)對(duì)缺少數(shù)據(jù)分析支撐的工序、崗位/管理目標(biāo)的思考;二是建立平臺(tái)加強(qiáng)各車間同性質(zhì)崗位之間的溝通與交流,均衡各個(gè)車間的數(shù)據(jù)分析應(yīng)用水平和能力;三是對(duì)車間提交的分析報(bào)告給出專業(yè)性的指導(dǎo)意見。2、要加強(qiáng)對(duì)數(shù)據(jù)中心的應(yīng)用。數(shù)據(jù)中心的建立可以使業(yè)務(wù)系統(tǒng)從報(bào)表制作、數(shù)據(jù)導(dǎo)出等功能中解放出來,專注于事務(wù)處理,將數(shù)據(jù)應(yīng)用方面的功能完全交給數(shù)據(jù)中心來解決。目前,數(shù)據(jù)中心已建立了涉及產(chǎn)量、質(zhì)量、消耗等各個(gè)條線的Universe模型,并對(duì)全廠管理干部進(jìn)行了普及性的培訓(xùn)。但是從目前應(yīng)用情況來看,還比較局限于個(gè)別管理人員,追尋原因如下:一是業(yè)務(wù)系統(tǒng)開發(fā)根據(jù)用戶需求定制開發(fā)報(bào)表,業(yè)務(wù)人員通常習(xí)慣于從現(xiàn)成的報(bào)表中獲取信息。如果要求業(yè)務(wù)人員使用數(shù)據(jù)中心工具自行制作報(bào)表模板,甚至可能需要將其導(dǎo)出再作二次處理,那么業(yè)務(wù)人員一定更傾向于選擇第一種方式。二是近幾年來人員更替較多,新進(jìn)管理人員不熟悉數(shù)據(jù)中心應(yīng)用,導(dǎo)致數(shù)據(jù)中心應(yīng)用面受到限制。隨著今后MES的建設(shè),業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)、報(bào)表、臺(tái)帳和分析功能將有可能由業(yè)務(wù)用戶自行通過集成在MES中的數(shù)據(jù)中心前端開發(fā)工具來訪問和靈活定制。因此,要盡快培養(yǎng)工廠業(yè)務(wù)人員數(shù)據(jù)中心的應(yīng)用能力,包括數(shù)據(jù)獲取以及報(bào)表定制方面的技能。筆者認(rèn)為應(yīng)對(duì)方法如下:一是對(duì)于崗位人員變更做好新老人員之間一傳一的交接和培訓(xùn);二是適時(shí)針對(duì)新進(jìn)管理人員開展集中培訓(xùn);三是通過采用一定的考核方法。3、提高新增應(yīng)用點(diǎn)的質(zhì)量。工廠每年都會(huì)組織各部門審視第一、第二層次應(yīng)用點(diǎn)列表,圍繞重點(diǎn)工序和重點(diǎn)管理崗位調(diào)研有哪些應(yīng)用上的空白點(diǎn)是需要重點(diǎn)思考的,以新增分析應(yīng)用點(diǎn)的方式進(jìn)行申報(bào)和實(shí)施。同時(shí)針對(duì)第三層次針對(duì)性分析應(yīng)用,工廠也會(huì)要求部門以新增分析應(yīng)用點(diǎn)的方式將需要數(shù)據(jù)支撐的項(xiàng)目進(jìn)行申報(bào)。作為一項(xiàng)常規(guī)性工作,工廠每年都會(huì)組織部門進(jìn)行應(yīng)用點(diǎn)的申報(bào),并按項(xiàng)目管理的思想和方法實(shí)施,事先確立各個(gè)應(yīng)用點(diǎn)的應(yīng)用層次、數(shù)據(jù)獲取方式、實(shí)現(xiàn)平臺(tái),并對(duì)其實(shí)施計(jì)劃進(jìn)行事先的思考和分解,確定每一個(gè)階段的活動(dòng)目標(biāo)、時(shí)間節(jié)點(diǎn)以及負(fù)責(zé)人員,每個(gè)季度對(duì)實(shí)施情況予以總結(jié),并動(dòng)態(tài)更新下一階段的實(shí)施計(jì)劃。該項(xiàng)工作從2005年起已經(jīng)連續(xù)開展了三年,部門可供挖掘的應(yīng)用點(diǎn)越來越少,如何調(diào)動(dòng)部門的積極性,保持并提高應(yīng)用點(diǎn)的實(shí)效性,我們有必要對(duì)新增分析應(yīng)用點(diǎn)的質(zhì)量和實(shí)施情況進(jìn)行考評(píng),考評(píng)標(biāo)準(zhǔn)為:一是新增分析應(yīng)用點(diǎn)是否能體現(xiàn)數(shù)據(jù)應(yīng)用開展的進(jìn)取性、開拓性和創(chuàng)新性;二是新增分析應(yīng)用點(diǎn)是否能切實(shí)提高管理的精細(xì)化和科學(xué)化水平;三是新增分析應(yīng)用點(diǎn)是否能采用項(xiàng)目管理的思想和方法實(shí)施,按時(shí)間節(jié)點(diǎn)完成各項(xiàng)預(yù)定計(jì)劃。

三、結(jié)束語。隨著近幾年來技術(shù)平臺(tái)的相繼成熟以及管理手段的逐步推進(jìn),工廠業(yè)務(wù)人員用數(shù)據(jù)說話的意識(shí)已經(jīng)越來越強(qiáng),但是要真正使工廠管理達(dá)到“三分技術(shù)、七分管理、十二分?jǐn)?shù)據(jù)”的水平,還有很長(zhǎng)的路要走,這既需要我們的業(yè)務(wù)人員從自身出發(fā)提高應(yīng)用數(shù)據(jù)的水平和能力,同時(shí)也需要工廠從管理手段和管理方法上不斷拓寬思路、創(chuàng)新手段,真正實(shí)現(xiàn)數(shù)據(jù)分析應(yīng)用成為工廠管理的重要支撐手段。

作者單位:上海卷煙廠

篇3

中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2017)06(c)-0053-03

隨著云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)等新一代信息技術(shù)的發(fā)展,傳統(tǒng)企業(yè)級(jí)IT架構(gòu)正在朝基于互聯(lián)網(wǎng)的分布式新架構(gòu)轉(zhuǎn)型。大數(shù)據(jù)作為新一代信息技術(shù)的核心,正在使各個(gè)領(lǐng)域變得越來越可感知,并走向智能化。大數(shù)據(jù)將會(huì)發(fā)揮自身獨(dú)特的優(yōu)勢(shì),帶給我們更多的方便和便捷。大數(shù)據(jù)分析的方法理論有哪些、在行業(yè)、企業(yè)的活動(dòng)中有哪些應(yīng)用。

1 大數(shù)據(jù)分析的五個(gè)基本要素

1.1 大數(shù)據(jù)預(yù)測(cè)性分析

大數(shù)據(jù)技術(shù)的主要應(yīng)用是預(yù)測(cè)性分析,如在線教學(xué)資源網(wǎng)站通過數(shù)據(jù)分析用戶會(huì)對(duì)推薦的教學(xué)模是否感興趣,保險(xiǎn)公司通過數(shù)據(jù)預(yù)測(cè)被保險(xiǎn)人是否會(huì)違規(guī),地震監(jiān)測(cè)部門通過對(duì)大數(shù)據(jù)的分析,預(yù)測(cè)某地點(diǎn)發(fā)生地震的大致時(shí)間,氣象部門利用數(shù)據(jù)預(yù)測(cè)天氣變化等。預(yù)測(cè)是人類本能的一部分,通過大數(shù)據(jù)預(yù)測(cè)人類才可以獲得有意義的、智能的信息。許許多多的行業(yè)應(yīng)用都會(huì)涉及到大數(shù)據(jù),大數(shù)據(jù)的豐富特征表述了快速增長(zhǎng)的存儲(chǔ)數(shù)據(jù)的復(fù)雜性。大數(shù)據(jù)預(yù)測(cè)分析打破了數(shù)據(jù)預(yù)測(cè)一直是象牙塔里數(shù)據(jù)科學(xué)家和統(tǒng)計(jì)學(xué)家的工作,伴隨著大數(shù)據(jù)的出現(xiàn),并融合到現(xiàn)有的MIS、MRPII、DSS 、CIMS和其他核心業(yè)務(wù)系統(tǒng),大數(shù)據(jù)預(yù)測(cè)分析將起到越來越重要的作用。

1.2 數(shù)據(jù)管理和數(shù)據(jù)質(zhì)量

大數(shù)據(jù)分析跟數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理緊密相關(guān),而質(zhì)量高的數(shù)據(jù)和有效的數(shù)據(jù)管理可以使分析結(jié)果有價(jià)值、真實(shí)并得到有力的保證。

1.3 可視化分析

普通用戶和大數(shù)據(jù)分析專家是大數(shù)據(jù)分析的直接使用者,因此他們對(duì)大數(shù)據(jù)分析的基本要求就是要可視化,因?yàn)樗麄兿胪ㄟ^可視化分析獲得可觀的大數(shù)據(jù)特征,讓用戶直觀看到結(jié)果。

提高解釋信息的能力可以通過數(shù)據(jù)的可視化展示來實(shí)現(xiàn),而可視化展示主要由圖形和圖表來呈現(xiàn)。要從大量的數(shù)據(jù)和信息中找尋相關(guān)性非常的不容易,而圖形或圖表能夠在短時(shí)間內(nèi)展示數(shù)據(jù)之間的相關(guān)信息,并為用戶提供所需的信息。

1.4 語義引擎

語義引擎是把現(xiàn)有的數(shù)據(jù)標(biāo)注語義,其實(shí)可以把它理解為結(jié)構(gòu)化或者非結(jié)構(gòu)化的數(shù)據(jù)集上的一個(gè)語義疊迭層。它是數(shù)據(jù)分析及語義技術(shù)最直接的應(yīng)用,好的語義引擎能夠使大數(shù)據(jù)分析用戶快而準(zhǔn)地獲得比較全面的數(shù)據(jù)。

數(shù)據(jù)分析的新挑戰(zhàn)及困難主要表現(xiàn)在非結(jié)構(gòu)化數(shù)據(jù)與異構(gòu)數(shù)據(jù)等的多樣性,必須配合大量的工具去分析、解析、提取數(shù)據(jù)。語義引擎的設(shè)計(jì)可以達(dá)到能夠從文檔中自動(dòng)提取有用信息,使語義引擎能挖掘出大數(shù)據(jù)的特征,在此基礎(chǔ)上科學(xué)建模和輸入新的數(shù)據(jù),來預(yù)測(cè)未來的可用數(shù)據(jù)。

1.5 數(shù)據(jù)挖掘算法

大數(shù)據(jù)分析的理論核心就是數(shù)據(jù)挖掘。各種數(shù)據(jù)的算法基于不同的數(shù)據(jù)類型和格式,能更加科學(xué)地呈現(xiàn)出數(shù)據(jù)本身的特點(diǎn),能更快速地處理大數(shù)據(jù)。如果采用一個(gè)算法需要花好幾年才能得出結(jié)論,那大數(shù)據(jù)價(jià)值也就無從f起了??梢暬墙o人看的,數(shù)據(jù)挖掘是給機(jī)器看的。集群、分割、孤立點(diǎn)分析還有其他的算法可以使我們深入挖掘數(shù)據(jù)內(nèi)部的價(jià)值,并且這些算法能夠處理大數(shù)據(jù)的數(shù)據(jù)量,也可以滿足處理大數(shù)據(jù)的效率要求。

2 大數(shù)據(jù)處理方法

大數(shù)據(jù)處理技術(shù)在社會(huì)的發(fā)展中占有重要的地位,現(xiàn)在有很多的研究者對(duì)大數(shù)據(jù)處理技術(shù)進(jìn)行研究,將大數(shù)據(jù)處理技術(shù)與交互設(shè)計(jì)結(jié)合,讓交叉科學(xué)得到發(fā)展,計(jì)算機(jī)技術(shù)的進(jìn)步,讓交叉技術(shù)被廣泛應(yīng)用,并引起了很多人的重視,例如:計(jì)算機(jī)技術(shù)可以在藝術(shù)中被應(yīng)用,進(jìn)行色彩搭配,還可以將計(jì)算機(jī)技術(shù)應(yīng)用到垃圾分類里,這些都是研究人員對(duì)計(jì)算機(jī)和交叉設(shè)計(jì)的結(jié)合。這種結(jié)合讓設(shè)計(jì)學(xué)與計(jì)算機(jī)技術(shù)緊急的結(jié)合在一起,將傳統(tǒng)的調(diào)研方式和測(cè)試方式應(yīng)用到交叉科學(xué)領(lǐng)域,這種方法的研究可以為用戶調(diào)研和測(cè)試方法提供依據(jù),能夠減少人工的成本。大數(shù)據(jù)處理方法其實(shí)有很多,筆者根據(jù)長(zhǎng)時(shí)間的實(shí)踐,總結(jié)了幾種基本的大數(shù)據(jù)處理方法,如非結(jié)構(gòu)數(shù)據(jù)處理法、自然語言處理法等,該文主要介紹非結(jié)構(gòu)數(shù)據(jù)處理流程涉及到的主要方法和技術(shù)。非結(jié)構(gòu)化數(shù)據(jù)處理流程主要以網(wǎng)頁處理為例來闡述,包括3個(gè)階段,分別是信息采集、網(wǎng)頁預(yù)處理和網(wǎng)頁分類。

2.1 信息采集

信息采集主要是根據(jù)相關(guān)主題由固定的專業(yè)人士來完成,其采集的數(shù)據(jù)只能用于所針對(duì)的主題和相關(guān)的模塊,出于對(duì)效率和成本的考慮完全不必對(duì)整個(gè)互聯(lián)網(wǎng)進(jìn)行遍歷,因此,模塊信息采集時(shí)往往需要研究以哪種方式預(yù)測(cè)鏈接指向的頁面與主題的關(guān)聯(lián)性,并測(cè)算其是否值得訪問;然后研究以哪種相關(guān)策略訪問Web,以在采集到主題相關(guān)頁面的同時(shí),盡可能地減少采集到主題無關(guān)的頁面。

預(yù)先設(shè)定好種子鏈接是信息采集的基本方法,充分使用HTTP協(xié)議下載被訪問的頁面,運(yùn)用分析算法對(duì)頁面與主題的相關(guān)性進(jìn)行分析,然后確定待訪問的相關(guān)鏈接,預(yù)測(cè)可能指向主題相關(guān)頁面的鏈接,最后循環(huán)迭代地運(yùn)用不同的相關(guān)策略訪問網(wǎng)頁。

2.2 網(wǎng)頁預(yù)處理

網(wǎng)頁預(yù)處理最主要涉及到網(wǎng)頁去重處理,網(wǎng)頁去重可以歸為兩類:一類是基于URL的對(duì)比去重,它適用哈希算法;另一類是基于內(nèi)容的對(duì)比去重,它適用基于信息指紋的文本相似度算法。

網(wǎng)頁去重是先抽取文檔對(duì)象的特征,再對(duì)文檔內(nèi)容進(jìn)行分解,將文檔的特征集合表示出來,然后有目的針對(duì)特征集合的壓縮編碼,通過將哈希編碼等文本轉(zhuǎn)為數(shù)字串映射方式,為后續(xù)的特征存儲(chǔ)以及特征比較提供方便,這樣可以起到減少存儲(chǔ)空間,提高比較速度的作用,最后就是計(jì)算文檔的相似度,此步需要根據(jù)文檔特征重復(fù)比例來確定文檔內(nèi)容是否重復(fù)。一般是提取網(wǎng)頁的某一個(gè)信息特征,通常是一組關(guān)鍵詞,或者是關(guān)鍵詞加權(quán)重的組合,調(diào)用相應(yīng)的算法,轉(zhuǎn)換為一組關(guān)鍵代碼,也被稱為指紋,若兩個(gè)頁面有大數(shù)量的相似指紋,那么可以預(yù)測(cè)這兩個(gè)頁面內(nèi)容具有很高的重復(fù)性。

2.3 網(wǎng)頁分類

網(wǎng)絡(luò)時(shí)代,人類所面臨的一個(gè)非常重要且具有普遍意義的問題就是網(wǎng)頁分類。將網(wǎng)絡(luò)信息正確分類,方便人們更好地使用網(wǎng)絡(luò)資源,使雜亂無章的網(wǎng)絡(luò)環(huán)境變得有條理。而網(wǎng)頁分類一般是先對(duì)網(wǎng)頁中的文本素材進(jìn)行分類,通常采用文本分類來完成。文本分類主要應(yīng)用于電子郵件分類、信息過濾、文獻(xiàn)翻譯、數(shù)據(jù)檢索等任務(wù),文本分類的一個(gè)關(guān)鍵問題是特征詞的選擇問題及其權(quán)重分配。

在搜索引擎中,文本分類主要有以下用途:相關(guān)性排序會(huì)根據(jù)不同的網(wǎng)頁類型做相應(yīng)的排序規(guī)則;根據(jù)網(wǎng)頁是索引頁面還是信息頁面,下載調(diào)度時(shí)會(huì)做不同的調(diào)度策略;在做頁面信息抽取的時(shí)候,會(huì)根據(jù)頁面分類的結(jié)果做不同的抽取策略;在做檢索意圖識(shí)別的時(shí)候,會(huì)根據(jù)用戶所點(diǎn)擊的URL所屬的類別來推斷檢索串的類別等。

網(wǎng)頁分類方法有SVM分方法和樸素貝葉斯方法,其中比較推薦的是支持向量機(jī)分類方法(SVM),該算法主要基于統(tǒng)計(jì)學(xué)理論及線性分類器準(zhǔn)則之上,從線性可分入手,再擴(kuò)展到線性不可分的情況。甚至有時(shí)會(huì)擴(kuò)展到使用非線性函數(shù)中去,這種分類器統(tǒng)稱為支持向量機(jī)。近年來,支持向量機(jī)分類方法越來越多的受到網(wǎng)頁分類技術(shù)人員的青睞。

3 大數(shù)據(jù)分析在行業(yè)活動(dòng)中的應(yīng)用

非結(jié)構(gòu)數(shù)據(jù)處理和數(shù)據(jù)挖掘的應(yīng)用范圍較廣,它可能應(yīng)用于運(yùn)營(yíng)商、銀行、傳統(tǒng)企業(yè)和電商,挑選幾個(gè)具有代表性的案例與大家分享。

3.1 電信行業(yè)

某城市電信運(yùn)營(yíng)商的上網(wǎng)日志分析系統(tǒng),該系統(tǒng)通過收集用戶上網(wǎng)日志歷史記錄數(shù)據(jù),分析出每個(gè)用戶的偏好。首先該系統(tǒng)通過并行統(tǒng)計(jì)出每個(gè)人有效歷史上網(wǎng)日志URL;然后從日志URL中抓取網(wǎng)頁內(nèi)容,提取正文,并通過文本分類算法計(jì)算分類;最后通過統(tǒng)計(jì)出每個(gè)用戶上網(wǎng)關(guān)注類別總數(shù),分析出每個(gè)用戶的偏好。

3.2 地產(chǎn)行業(yè)

某房地產(chǎn)企業(yè)的社會(huì)化品牌實(shí)時(shí)營(yíng)銷系統(tǒng),該系統(tǒng)通過社交媒體數(shù)據(jù),進(jìn)行網(wǎng)絡(luò)口碑監(jiān)測(cè),負(fù)面情緒被及時(shí)地發(fā)現(xiàn)并制止;通過與客戶進(jìn)行互動(dòng),爭(zhēng)取客戶忠誠(chéng)度;通過監(jiān)控同行及競(jìng)爭(zhēng)對(duì)手的各方面資訊,量化評(píng)估競(jìng)爭(zhēng)態(tài)勢(shì);快速提升品牌知曉度和美譽(yù)度,將媒體影響力轉(zhuǎn)換為客戶量,縮短人氣聚集周期。

3.3 證券行業(yè)

某證券商戰(zhàn)略信息監(jiān)測(cè)通過歷史回顧與信息摘要,提供題目、摘要、原文URL,今日輿情焦點(diǎn),今日輿論,展示抓取的所有期貨產(chǎn)品相關(guān)信息的縮略,并提供全文鏈接。通過熱點(diǎn)事件列表可以看到歷史相似事件對(duì)趨勢(shì)的影響,通過天氣指數(shù)與趨勢(shì)對(duì)應(yīng)曲線可以看到歷史相似天氣與歷史趨勢(shì)的對(duì)照。

3.4 金融行業(yè)

某大型股份制商業(yè)銀行供應(yīng)商風(fēng)險(xiǎn)評(píng)估系統(tǒng),該系統(tǒng)通過抓取供應(yīng)商內(nèi)部數(shù)據(jù),如企業(yè)年報(bào)、公司變動(dòng)、領(lǐng)導(dǎo)情況、財(cái)務(wù)狀況等數(shù)據(jù),分析公司運(yùn)營(yíng)指數(shù);通過計(jì)算各供應(yīng)商社交數(shù)據(jù),對(duì)其社會(huì)影響力做評(píng)估;通過同行之間的數(shù)據(jù)分析對(duì)比,對(duì)供應(yīng)商進(jìn)行實(shí)力評(píng)估,這些數(shù)據(jù)指數(shù)可以有效協(xié)助商業(yè)銀行進(jìn)行供應(yīng)商風(fēng)險(xiǎn)評(píng)估。

4 結(jié)語

大數(shù)據(jù)處理數(shù)據(jù)的基本理念是用全體代替抽樣,用效率代替絕對(duì)精確,用相關(guān)代替因果。證券、微商、地產(chǎn)等行業(yè)每天都會(huì)產(chǎn)生巨大的數(shù)據(jù)量,大數(shù)據(jù)分析與處理已成為大數(shù)據(jù)技術(shù)的最重要的應(yīng)用,通過大數(shù)據(jù)技術(shù)從海量數(shù)據(jù)中提取、挖掘?qū)I(yè)務(wù)發(fā)展有價(jià)值的、潛在的信息,找出產(chǎn)品或服務(wù)未來發(fā)展趨勢(shì),為決策者提供有力依據(jù),有益于推動(dòng)企業(yè)內(nèi)部的科學(xué)化、信息化管理。

參考文獻(xiàn)

[1] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-149.

[2] 國(guó)際電子商情2013年大數(shù)據(jù)應(yīng)用與趨勢(shì)調(diào)查[Z].

[3] 大數(shù)據(jù)時(shí)代來臨:國(guó)內(nèi)IT企業(yè)布局已然落后[EB/OL].新浪網(wǎng),2012-06-01.

[4] 大數(shù)據(jù)時(shí)代降臨[EB/OL].半月談網(wǎng),2012-09-22.

篇4

最簡(jiǎn)單的拆分方法就是不看平均值,看數(shù)據(jù)分布。因?yàn)榉?是“總和”或者“平均”類的統(tǒng)計(jì)數(shù)據(jù)都會(huì)丟失掉很多重要的信息。例如李嘉誠(chéng)來我們公司參觀,這一時(shí)間我們公司辦公室里的“平均資產(chǎn)”就會(huì)因?yàn)槔罴握\(chéng)一個(gè)人 被抬高到人均幾億身家。如果有人根據(jù)這個(gè)“平均資產(chǎn)”數(shù)據(jù)來判定說我們辦公室的人都是豪華游艇的潛在顧客,這自然是荒謬的。

可實(shí)際上,我們每天都在做著類似的判斷,比如當(dāng)我們聽到說顧客“平均在線時(shí)間”是3分34秒,就可能根據(jù)這個(gè)時(shí)間來進(jìn)行業(yè)務(wù)決策,例如設(shè)置“停留時(shí)間超過3分34秒為高價(jià)值流量”,或者設(shè)置系統(tǒng),在用戶停留了3分34秒還沒有下單的話就彈出在線客服服務(wù)窗口。我們?cè)O(shè)置這些時(shí)間點(diǎn)的根據(jù)是“平均停留時(shí)間”,在我們的想象里,我們的每個(gè)顧客都有著“平均的”表現(xiàn),停留時(shí)間大致都是3分34秒,可實(shí)際上真正的顧客訪問時(shí)間有長(zhǎng)有短,差別巨大:

在一些數(shù)據(jù)中我們可以看得出來,訪客平均停留在頁面的時(shí)間非常的短暫,具體的也就是說,問需要在淘寶數(shù)據(jù)分析上面下工夫的,那么,究竟該怎么弄才能比較好的呢?這個(gè)就看個(gè)人是怎么想的了,這里也就不多說了。

再舉一個(gè)例子,比如我們看到上個(gè)月平均訂單金額500元/單,這個(gè)月也是500元/單,可能會(huì)覺得數(shù)字沒有變化??墒菍?shí)際上有可能上個(gè)月5萬單都是400~600元,而這個(gè)月5萬單則是2萬單300元,2萬單400元,5千單500元,5000單超過2500元 ——客戶購買習(xí)慣已經(jīng)發(fā)生了巨大變化,一方面可能是客戶訂單在變?。赡苁且?yàn)楫a(chǎn)品單價(jià)下降,采購數(shù)量減少,或者客戶選擇了比較便宜的替代品),另一方面 出現(xiàn)了一些相對(duì)較大的訂單(可能是中小企業(yè)采購,或者是網(wǎng)站擴(kuò)充產(chǎn)品線見效了)?!磾?shù)據(jù)分布可以讓我們更容易發(fā)現(xiàn)這些潛在的變化,及時(shí)的做出應(yīng)對(duì)。

二、拆因子

很多時(shí)候我們很難直接從數(shù)據(jù)變化中分析出具體的原因,這時(shí)可以考慮拆分因子,將問題一步步細(xì)化找尋原因。

例如網(wǎng)站轉(zhuǎn)化率下降,我們要找原因。因?yàn)椤稗D(zhuǎn)化率”=“訂單”/“流 量”,所以“轉(zhuǎn)化率”下降的原因很可能是“訂單量下降”,“流量上升”,或者兩者皆是。按照這個(gè)思路我們可能發(fā)現(xiàn)主要的原因是“流量上升”和“訂單量升幅 不明顯”,那么

下面我們就可以來拆解“流量”的構(gòu)成,例如拆成“直接訪問流量”、“廣告訪問流量”和“搜索引擎訪問流量”再看具體是哪部分的流量發(fā)生了變 化,接下來再找原因。這時(shí)我們可能看到說是搜索引擎訪問流量上升,那就可以再進(jìn)一步分析是付費(fèi)關(guān)鍵詞部分上升,還是自然搜索流量上升,如果是自然流量,是 品牌(或者網(wǎng)站名相關(guān))關(guān)鍵詞流量上升,還是其他詞帶來的流

量上升——假如最后發(fā)現(xiàn)是非品牌類關(guān)鍵詞帶來的流量上升,那么繼續(xù)尋找原因——市場(chǎng)變化(淡季旺季之類),競(jìng)爭(zhēng)對(duì)手行動(dòng),還是自身改變。假如剛好在最近把產(chǎn)品頁面改版過,就可以查一下是不是因?yàn)楦陌孀屗阉饕媸珍涀兌啵瑱?quán)重變高。接下來再分析自己到底哪里做對(duì)了幫助網(wǎng)站SEO了(比如把頁面導(dǎo)航欄從圖片換成了文字),把經(jīng)驗(yàn)記下來為以后改版提供參考;另

一方面還要分析哪里沒做好(因?yàn)樾略隽髁康遣]有相應(yīng)增加太多銷售),研究怎樣讓“產(chǎn)品頁面”更具吸引力——因?yàn)閷?duì)很多搜索引擎流量來說,他們對(duì)網(wǎng)站的第一印象是產(chǎn)品頁面,而不是首頁。

三、拆步驟

還有些時(shí)候,我們通過拆分步驟來獲取更多信息。

舉兩個(gè)例子:

第一個(gè)例子:兩個(gè)營(yíng)銷活動(dòng),帶來一樣多的流量,一樣多的銷售,是不是說明兩個(gè)營(yíng)銷活動(dòng)效率差不多?

如果我們把每個(gè)營(yíng)銷活動(dòng)的流量拆細(xì)去看每一步,就會(huì)發(fā)現(xiàn)不一樣的地方。營(yíng)銷活動(dòng)B雖然和營(yíng)銷活動(dòng)A帶來了等量的流量,可是這部分流量對(duì)產(chǎn)品更感興趣,看完著陸頁之后更多的人去看了產(chǎn)品頁面??上У氖请m然看產(chǎn)品的人很多,最后轉(zhuǎn)化率不高,訂單數(shù)和營(yíng)銷活動(dòng) A一樣。

這里面還可以再深入分析(結(jié)合之前提到的分析方法,和下一章要說的細(xì)分方法),但是光憑直覺,也可以簡(jiǎn)單的得出一些猜測(cè)來,例如兩個(gè)營(yíng)銷活動(dòng)的顧客習(xí)慣不太一樣,營(yíng)銷活動(dòng) B的著陸頁設(shè)計(jì)更好,營(yíng)銷活動(dòng) B的顧客更符合我們的目標(biāo)客戶描述、更懂產(chǎn)品——但是我們的價(jià)格沒有優(yōu)勢(shì)等等這些猜想是我們深入進(jìn)行分析,得出行動(dòng)方案的起點(diǎn)。至少,它可以幫助我們

更快的累計(jì)經(jīng)驗(yàn),下次設(shè)計(jì)營(yíng)銷活動(dòng)的時(shí)候會(huì)更有的放矢,而不是僅僅寫一個(gè)簡(jiǎn)單report說這兩個(gè)營(yíng)銷活動(dòng)效果一樣就結(jié)案了。(注:這是個(gè)簡(jiǎn)化的例子,實(shí)際上還可以分更多層)

第二個(gè)例子可能更常見一些,比如網(wǎng)站轉(zhuǎn)化率下降,我們可以拆成這樣的漏斗:

這樣拆好之后,更能清楚地看到到底是哪一步的轉(zhuǎn)化率發(fā)生了變化。有可能是訪客質(zhì)量下降,都在著陸頁流失了,也可能是“購物車–>登錄”流失了(如果你把運(yùn)費(fèi)放到購物車中計(jì)算,很可能就看到這一步流失率飆升),這樣拆細(xì)之后更方便我們分析。

曾經(jīng)有一個(gè)例子就是轉(zhuǎn)化率下降,市場(chǎng)部查流量質(zhì)量發(fā)現(xiàn)沒問題,產(chǎn)品經(jīng)理查價(jià)格競(jìng)爭(zhēng)力也沒問題——最后發(fā)現(xiàn)是技術(shù)部為了防止惡意注冊(cè),在登錄頁面加了驗(yàn)證碼(而且那個(gè)驗(yàn)證碼極度復(fù)雜),降低了“登錄頁面–>填寫訂單信息“這一步的轉(zhuǎn)化率。

四、細(xì)分用戶族群

篇5

中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2007)06-11651-01

1 引言

粗糙集(Rough Set)理論[1]是波蘭數(shù)學(xué)家Z.Pawlak于1982年提出的,它建立在完善的數(shù)學(xué)基礎(chǔ)之上,是一種新的處理含糊性和不確定性問題的數(shù)學(xué)工具。其主要思想是在保持分類能力不變的前提下,通過知識(shí)約簡(jiǎn),導(dǎo)出問題的決策或分類規(guī)則[2]。由于粗糙集理論不需要任何預(yù)備或額外的有關(guān)數(shù)據(jù)信息,使得粗糙集理論成為研究熱點(diǎn)之一,被廣泛應(yīng)用與知識(shí)發(fā)現(xiàn)、機(jī)器學(xué)習(xí)、決策分析、模式識(shí)別、專家系統(tǒng)和數(shù)據(jù)挖掘等領(lǐng)域。

屬性約簡(jiǎn)是粗糙集理論中核心研究?jī)?nèi)容之一[3]。在眾多的屬性約簡(jiǎn)算法中,大致可以分為兩類:一類是基于信息熵的啟發(fā)式算法[4],這類算法往往不能得到系統(tǒng)的所有約簡(jiǎn).另一類是基于區(qū)分矩陣和區(qū)分函數(shù)構(gòu)造的算法[5],這種算法直觀,易于理解,能夠計(jì)算出所有約簡(jiǎn)。但在區(qū)分矩陣中會(huì)出現(xiàn)大量的重復(fù)元素,造成時(shí)間和空間的浪費(fèi),從而降低了屬性約簡(jiǎn)算法的效率。

本文基于數(shù)據(jù)分析方法[6]的屬性簡(jiǎn)約算法是在保持分類能力不變的前提下,逐個(gè)約去冗余的屬性,直到不再有冗余的屬性,此時(shí)得到的屬性集是最小屬性集,即為約簡(jiǎn)。該算法簡(jiǎn)單,能夠求出所有約簡(jiǎn),不會(huì)出現(xiàn)區(qū)分矩陣中大

量的重復(fù)元素,從而提高了屬性約簡(jiǎn)的效率。

2 粗糙集概念

定義2.1設(shè)U為所討論對(duì)象的非空有限集合,稱為論域;R為建立在U上的一個(gè)等價(jià)關(guān)系族,稱二元有序組S=(U,R)為近似空間。

定義2.2令R為等價(jià)關(guān)系族,設(shè)P?哿R,且P≠?I,則P中所有等價(jià)關(guān)系的交集稱為P上的不可分辨關(guān)系,記作IND(P),即有:[x] IND(P)= ∩ [x]R,顯然IND(P)也是等價(jià)關(guān)系。

定義2.3稱4元有序組K=(U,A,V,f)為信息系統(tǒng),其中U為所考慮對(duì)象的非空有限集合,稱為論域;A為屬性的非空有限集合;V=∪Va,Va為屬性a的值域;f:U×AV是一個(gè)信息函數(shù),?坌x∈U,a∈A,f(x,a)∈Va。對(duì)于給定對(duì)象x,f(x,a)賦予對(duì)象x在屬性a下的屬性值。信息系統(tǒng)也可簡(jiǎn)記為K=(U,A)。若A=C∪D且C∩D=?I,則S稱,為決策表,其中C為條件屬性集,D為決策屬性集。

顯然,信息系統(tǒng)中的屬性與近似空間中的等價(jià)關(guān)系相對(duì)應(yīng)。

定義2.4設(shè)K=(U,A,V,f)為信息系統(tǒng),P?哿A且P≠?I,定義由屬性子集P導(dǎo)出的二元關(guān)系如下:

IND(P)={(x,y)|(x,y)∈U×U且?坌a∈P有f(x,a)=f(y,a)}

則IND(P)也是等價(jià)關(guān)系,稱其為由屬性集P導(dǎo)出的不可分辨關(guān)系。

定義2.5稱決策表是一致的當(dāng)且僅當(dāng)D依賴于C,即IND(C)?哿IND(D),否則決策表是不一致的。一致決策表說明:在不同個(gè)體的條件屬性值相同時(shí),他們的決策屬性值也相同。

定義2.6設(shè)K=(U,A)為一個(gè)信息系統(tǒng)。若P?哿A是滿足IND(P)=IND(A)的極小屬性子集,則稱P為A的一個(gè)約簡(jiǎn),或稱為信息系統(tǒng)的一個(gè)約簡(jiǎn)。

定義2.7設(shè)K=(U,CUD)為一個(gè)決策表,其中C為條件屬性集,D為決策屬性,若P?哿C為滿足POSC(D)=POSP(D)的極小屬性子集,則稱P為決策表K的一個(gè)約簡(jiǎn)。其中POSC(D)表示決策D關(guān)于屬性集C的正域。

定義2.8數(shù)據(jù)分析方法對(duì)于信息系統(tǒng)K=(U,A),逐個(gè)移去A中的屬性,每移去一個(gè)屬性即刻檢查新得到的屬性子集的不可分辨關(guān)系,如果等于IND(A),則該屬性可被約去,否則該屬性不可被約去;對(duì)于決策表K=(U,CUD),逐個(gè)移去C中的屬性,每移去一個(gè)屬性即刻檢其決策表,如果不出現(xiàn)新的不一致,則該屬性可被約去,否則該屬性不可被約去。

3 基于數(shù)據(jù)分析方法的屬性簡(jiǎn)約算法

3.1 算法思路

利用函數(shù)的遞歸調(diào)用,逐個(gè)判定信息系K=(U,A)中屬性a(a∈A),若IND(A)=ND(A-{a}),則a可以約去,A‘=A-{a},否則a不可以約去,繼續(xù)檢查A‘中的每個(gè)屬性是否能被約去,此過程一直進(jìn)行下去,直到出現(xiàn)某一屬性子集中的每個(gè)屬性都不可約去為止,此時(shí)該屬性子集即為所求的屬性簡(jiǎn)約。對(duì)于決策表,每次檢查是否增加了不一致的決策規(guī)則,作為是否約去屬性的依據(jù)。

算法如下:

輸入:信息系統(tǒng)K=(U,A)。

輸出:K的屬性約簡(jiǎn)。

Match(A') // A’=A-{a}//

begin

for i=1to|U|-1 //|U|表示U的基數(shù)//

for j=i+1to|U|

begin

r=|R|//|R|表示屬性個(gè)數(shù)//

if((f(ui,a1)= f(uj,a1))∧(f(ui,a2)= f(uj,a2))∧….∧(f(ui,ar)= f(uj,ar)))

then a不可被約去,return0

end

a可以被約去return1

end

Reduce (A)

begin

flag=1

for i=1 to |R|//|R|表示屬性個(gè)數(shù)//

begin

a=ai

A'=A-{ai}

if match(A')thenflag =0 , reduce (A’)

if (flag且A未被輸出)then

輸出A中所有元素//flag≠0,說明A中所有元素不可移去,且不會(huì)被重復(fù)輸出//

End

end

以上給出的函數(shù)是求解信息系統(tǒng)的屬性約簡(jiǎn)算法;對(duì)于決策表,只要將Match(A’)函數(shù)中的if語句的條件換成(f(ui,a1)= f(uj,a1))∧(f(ui,a2)= f(uj,a2))∧….∧(f(ui,ar)= f(uj,ar))∧(f(ui,ag)≠f(uj,ag)),r=|C|是條件屬性個(gè)數(shù),ag是決策屬性。Reduce (A)函數(shù)中|R|換成|C|即可。該算法適用于一致決策表,對(duì)非一致決策表,算法類似,也就是逐個(gè)移去屬性并檢查決策表是否出現(xiàn)新的不一致,作為約去此屬性的依據(jù)。

4 舉例

文獻(xiàn)[7]中決策表1,a,b,c,d,e是條件屬性,g是決策屬性,求出的約簡(jiǎn)是{a,b,d}

應(yīng)用本算法,求得的屬性約簡(jiǎn)為{a,e}和{a,b,d},得到?jīng)Q策簡(jiǎn)化表2和表3。

表1 決策表表2簡(jiǎn)化表表3簡(jiǎn)化表

如果將決策表表1看作一信息系統(tǒng),運(yùn)用本算法,求得的屬性約簡(jiǎn)有{c,d,e,g}, {b,e,g}, {a,c,d,g}, {a,c,d,e}, {a,b,g}, {a,b,e}h和{a,b,d}

5 結(jié)束語

本文通過數(shù)據(jù)分析方法討論了屬性約簡(jiǎn)問題。該算法是基于不可分辨關(guān)系的,具有直觀、易于理解和完備性的特點(diǎn)。當(dāng)屬性和對(duì)象都較少時(shí),效率較高,但當(dāng)屬性和對(duì)象較多時(shí),計(jì)算的復(fù)雜度較高。實(shí)例表明,該算法是有效的。

參考文獻(xiàn):

[1]PAWLAK z.Rough set[J].International jom:ua ofcomputer and information science,1982,(11):341―356.

[2]張文修,吳偉志,梁吉業(yè)等.粗糙集理論與方法[M].北京:科學(xué)出版社,2001.

[3]Pawlak Z.Slowinski R.Rough set approach to muhiattribute decision analysis.Ivited Review[J].European Journal of Operational Research.1994,72:443-459

[4]王國(guó)胤,于洪,楊大春.基于條件信息熵的決策表約簡(jiǎn)[J].計(jì)算機(jī)學(xué)報(bào),2002(7):760―765.

[5]Skowron A,Rauszer C.The Discernibility Matrices and Functions in Information Systems[A].I Slowinsk R.ntelligent Decision Support― Handbook of Applications and Advances of the Rough Sets Theory[c].1991,331-362.

篇6

1.測(cè)試方案的制定

數(shù)字電視測(cè)試方案制定時(shí),第一步是確定選擇多少個(gè)地點(diǎn)進(jìn)行測(cè)試,以及它們的特定位置。被選定的地點(diǎn)在數(shù)學(xué)統(tǒng)計(jì)上必須是相關(guān)的,通常應(yīng)超過100個(gè)(最好超過200個(gè))。在給定方向上最遠(yuǎn)的測(cè)試地點(diǎn)距離通常由F(50,90)曲線確定,F(xiàn)CC過去使用的確定NTSC頻率規(guī)劃的方法也被用于DTV的頻道分配。發(fā)射機(jī)的ERP和HAAT首先影響最遠(yuǎn)距離的測(cè)試地點(diǎn)的確定。另外, 如果在數(shù)字電視發(fā)射機(jī)附近有模擬NTSC發(fā)射機(jī)且頻率接近,則測(cè)試計(jì)劃還應(yīng)包括測(cè)量模擬信號(hào),比較模擬電視的數(shù)值和數(shù)字電視的數(shù)值。

2.數(shù)字電視場(chǎng)強(qiáng)測(cè)試數(shù)據(jù)分析方法

標(biāo)準(zhǔn)的歸一化的數(shù)據(jù)采集方法對(duì)于結(jié)果的分析來說是非常重要的。盡管對(duì)一個(gè)廣播公司而言,特定的地理環(huán)境可能會(huì)有一些唯一的與其它地方不同的測(cè)試結(jié)果,但是,測(cè)試中的一些關(guān)鍵參數(shù),是非常重要同時(shí)又是必須測(cè)試的。

例如,有不同的服務(wù)區(qū)域預(yù)測(cè)技術(shù)要考慮。舊的基于統(tǒng)計(jì)測(cè)量的方法所得到的F(50,50)和F(50,10)曲線,從50年代起在約50年的時(shí)間內(nèi),被用作預(yù)測(cè)場(chǎng)強(qiáng)數(shù)值(dBmV/m),這兩條預(yù)測(cè)曲線,在FCC規(guī)則的73.699節(jié)中出現(xiàn)(參考資料5),給出了預(yù)測(cè)的50%的地點(diǎn)在50%或10%的時(shí)間概率下的最小場(chǎng)強(qiáng)電平,通常使用的F(50,90)曲線是從F(50,50)和F(50,10)采用下式計(jì)算得到:

F(50,90) = F(50,50)-[F(50,10)- F(50,50)]

就是說,F(xiàn)(50,90)場(chǎng)強(qiáng)電平值高于F(50,50)值,F(xiàn)(50,10)場(chǎng)強(qiáng)值低于F(50,50)值。這些FCC的標(biāo)準(zhǔn)曲線是基于發(fā)射機(jī)的ERP和HAAT、接收裝置的天線高度、發(fā)射機(jī)與測(cè)試地點(diǎn)之間距離而確定。通過在每一個(gè)測(cè)試地點(diǎn)應(yīng)用這些曲線,場(chǎng)強(qiáng)電平可以被預(yù)計(jì)并且與測(cè)量的場(chǎng)強(qiáng)電平相比較。同樣,可以計(jì)算出超過最小場(chǎng)強(qiáng)電平的被測(cè)地點(diǎn)的百分比,按照統(tǒng)計(jì)規(guī)律,這些地點(diǎn)能基于F(50,90) 曲線成功地接收數(shù)字電視信號(hào)。可以直接比較在最小場(chǎng)強(qiáng)電平以上的測(cè)量地點(diǎn)數(shù)量和成功地接收數(shù)字電視信號(hào)的地點(diǎn)數(shù)量。

另一種場(chǎng)強(qiáng)電平預(yù)測(cè)技術(shù)是Longley-Rice算法,在FCC的工程技術(shù)部門(OET)公告69號(hào)(參考資料7)中有詳細(xì)的描述,不僅用到發(fā)射機(jī)的ERP,HAAT和接收裝置天線高度,而且涉及到在發(fā)射機(jī)和接收裝置之間的地面的類型。應(yīng)用這種算法可以預(yù)計(jì)每個(gè)測(cè)試地點(diǎn)的場(chǎng)強(qiáng)電平,這些預(yù)測(cè)值也應(yīng)與測(cè)量的數(shù)值進(jìn)行比較。對(duì)于F(50,90)曲線,基于Longley-Rice算法,可以計(jì)算出最小場(chǎng)強(qiáng)電平以上的地點(diǎn)的百分比,以給出能成功地收到數(shù)字電視信號(hào)的地點(diǎn)的百分?jǐn)?shù)。這能直接與成功地接收數(shù)字電視的地點(diǎn)的測(cè)量數(shù)字進(jìn)行比較。

兩種場(chǎng)強(qiáng)電平預(yù)測(cè)方法不僅能評(píng)估數(shù)字電視的場(chǎng)強(qiáng)分布曲線和效果,也能評(píng)估成功地進(jìn)行數(shù)字電視服務(wù)的區(qū)域和效果。隨著更多的數(shù)字電視發(fā)射機(jī)投入使用,進(jìn)行覆蓋狀況的試驗(yàn)和分析,將會(huì)有更好的統(tǒng)計(jì)曲線來預(yù)測(cè)數(shù)字電視的覆蓋曲線。實(shí)際上,原有的F(50,50)曲線與實(shí)際的對(duì)于數(shù)字電視覆蓋的要求是不同的,數(shù)字電視要保證可靠接收,要求是F(90,90)。

還有幾個(gè)其它的參數(shù)被用于數(shù)字電視場(chǎng)強(qiáng)測(cè)試評(píng)估:服務(wù)有效性、系統(tǒng)性能指標(biāo)、造成誤碼的極限電平、場(chǎng)強(qiáng)電平、C/N門限值、接收機(jī)靈敏度、地形輪廓及高度變化的統(tǒng)計(jì)等。并且每個(gè)參數(shù)在數(shù)字電視的系統(tǒng)構(gòu)成上提供寶貴的信息,并且被分別描述。

服務(wù)有效性是指所有的可成功地接收數(shù)字電視信號(hào)的測(cè)試地點(diǎn)的百分比,包括那些場(chǎng)強(qiáng)電平較小但又可以成功解碼的所有的地點(diǎn),對(duì)廣播公司來說是重要的,在測(cè)試的期間給定發(fā)射機(jī)ERP和HAAT,它是表示覆蓋區(qū)域的大小和服務(wù)有效性的主要參數(shù)。

另一方面,作為數(shù)字電視場(chǎng)強(qiáng)的測(cè)試手段,系統(tǒng)性能指標(biāo)是其效果如何的一種表示方法。即,接收S/N在15dB(誤差極限)以上的站點(diǎn)的百分比。這種統(tǒng)計(jì)分析所確定的距離,對(duì)于那些低于接收門限的數(shù)字電視信號(hào)測(cè)試點(diǎn)(如嚴(yán)重的地形遮擋或天線增益過小)無效。在場(chǎng)強(qiáng)測(cè)試期間,在非白噪聲干擾情況下(如多徑反射、脈沖干擾或模擬電視與數(shù)字電視同頻干擾),系統(tǒng)性能指標(biāo)可從本質(zhì)上得到很好的反映。

對(duì)于數(shù)字電視的接收而言,接收機(jī)的靈敏度同樣影響到接收的效果,實(shí)際上是覆蓋范圍的大小。接收機(jī)的最小接收門限值越低,越容易收到數(shù)字電視節(jié)目。反過來,在許多高于接收門限電平的地點(diǎn)并非一定能很好地接收,還受到載噪比門限的限制,只有載噪比門限超過所要求的數(shù)值,才能可靠地對(duì)數(shù)字電視信號(hào)進(jìn)行解碼??煽拷邮杖Q于兩個(gè)條件,一是接收的場(chǎng)強(qiáng)大于接收機(jī)的最小輸入門限電平,二是接收信號(hào)的載噪比大于可靠解碼所要求的數(shù)值。

篇7

3、方法三:分組對(duì)比法。分組之后,我們就可以對(duì)數(shù)據(jù)進(jìn)行匯總計(jì)算了。常見的方法是通過求和、平均值、百分比、技術(shù)等方式,把相同類別的數(shù)據(jù),匯總成一個(gè)數(shù)據(jù),減少數(shù)據(jù)量。

篇8

A Method of Automobile Driving Behavior and Data Analysis

ZHANG Zhi-de

(Guangzhou Automobile Group Co.,Ltd.,Automobile Engineering Institute,Guangzhou Guangdong 510640,China)

【Abstract】A car bus data collection and analysis methods of environment,expatiates the bus signal correlation between performance and corresponding working principle of the electronic control module,each over a period of time the data to carry on the comprehensive analysis,put forward several kinds of conditions associated with economic driving model,and through the working condition of model reflects in a period of time correlation between vehicle fuel consumption and driving behavior,for the analysis of driving behavior to provide the reference basis.

【Key words】Driving behavior;Oil consumption;Big Data;Eco-driving

0 引言

隨著近幾年汽車銷售和保有量的急劇增加,降低能源消耗與汽車排放的要求越來越嚴(yán)格。節(jié)能減排政策成為對(duì)應(yīng)汽車領(lǐng)域能源問題和治理環(huán)境污染的主要措施之一。橄煊節(jié)能減排,各個(gè)汽車制造商都在積極研究新技術(shù)以對(duì)應(yīng)能源與環(huán)境需求。其中車輛動(dòng)力技術(shù)、道路條件以及汽車駕駛運(yùn)用是目前影響汽車燃油消耗的三大主要因素。汽車的駕駛運(yùn)用水平直接反應(yīng)在汽車駕駛?cè)藛T對(duì)于汽車燃油經(jīng)濟(jì)性掌控的關(guān)鍵環(huán)節(jié)。駕駛?cè)藛T以較少的汽車燃油消耗實(shí)現(xiàn)車輛空間位置安全轉(zhuǎn)移的駕駛行為就是目前我們所倡導(dǎo)的汽車節(jié)能駕駛。通過研究駕駛行為數(shù)據(jù)并進(jìn)行分析提示,輔助提高駕駛技術(shù)、研究節(jié)能駕駛輔助系統(tǒng)有巨大的節(jié)能潛力。

狹義上的駕駛行為數(shù)據(jù)分析一般是以考慮經(jīng)濟(jì)性駕駛為基礎(chǔ)研究對(duì)象和主要前提。通過對(duì)駕駛員控制油門、擋位和制動(dòng)等相關(guān)操作,在不改變車輛動(dòng)力結(jié)構(gòu)前提下,計(jì)算一段時(shí)間的控制數(shù)據(jù)和車輛理想駕駛模型數(shù)據(jù)進(jìn)行對(duì)比,提醒駕駛?cè)藛T日常駕駛行動(dòng)的統(tǒng)計(jì)結(jié)果,包括對(duì)操作車輛油門、擋位、制動(dòng)的方式。并以此為依托進(jìn)行駕駛習(xí)慣改進(jìn)、駕駛操作輔助、“人―車―路”多環(huán)境協(xié)調(diào),合理匹配車輛運(yùn)動(dòng)與道路條件、交通狀態(tài)、車輛性能之間的關(guān)系,以滿足節(jié)能減排的目的。

1 駕駛行為分析模型

車輛運(yùn)行過程中主要存在四種行駛狀態(tài):怠速、加速(含啟動(dòng))、減速、巡航。

圖1是城市工況的不同行駛狀態(tài)所占能耗比。由圖1可知,加速(含啟動(dòng))過程占比最大,達(dá)到38% ;其次是巡航過程,約為35%。這說明城市工況中,采用經(jīng)濟(jì)性的加速和巡航策略對(duì)降低能耗具有積極意義。經(jīng)濟(jì)性加速主要指以適宜的加速度、檔位、油門開度等完成加速過程,盡量避免急加速工況的出現(xiàn);經(jīng)濟(jì)的巡航策略主要指盡量把車速維持在經(jīng)濟(jì)車速區(qū)間。

根據(jù)一般駕駛工況,按照與能耗關(guān)聯(lián)的行為可以得出以下幾種行為模式:

1)急加速

在緊急加速過程中,燃燒室中燃油多、空氣少,燃燒室內(nèi)呈現(xiàn)缺氧狀態(tài),燃油不能夠充分燃燒,導(dǎo)致油耗增加。

2)急減速

減速過程屬于動(dòng)能轉(zhuǎn)換為熱能的過程,合理的預(yù)判行車減速過程進(jìn)行適宜的制動(dòng)強(qiáng)度有利于充分利用車輛慣性,減少油耗;頻繁的急減速會(huì)消耗較多的車輛動(dòng)力裝置產(chǎn)生的動(dòng)能。

3)脫檔滑行

汽車帶檔滑行,不踩油門,發(fā)動(dòng)機(jī)管理系統(tǒng)EMS會(huì)切斷供油利用慣性來維持運(yùn)轉(zhuǎn);脫檔滑行則需要一個(gè)怠速油耗。因此長(zhǎng)距離滑行時(shí)采用脫檔滑行會(huì)增加油耗。

4)打開車窗高速行駛

汽車以較高車速行駛時(shí),打開車窗會(huì)增加整車的空氣阻力系數(shù),增加空氣阻力,進(jìn)而導(dǎo)致油耗提高。

5)換擋時(shí)的轉(zhuǎn)速(高轉(zhuǎn)換擋)

合理的控制檔位,能保證發(fā)動(dòng)機(jī)在不同的車速區(qū)間里均能維持在經(jīng)濟(jì)轉(zhuǎn)速區(qū)域,有利于減少發(fā)動(dòng)機(jī)的油耗。

6)長(zhǎng)時(shí)間怠速

長(zhǎng)時(shí)間的怠速狀態(tài)會(huì)導(dǎo)致發(fā)動(dòng)機(jī)做過多的無用功,導(dǎo)致油耗上升。

7)頻繁變道和曲線行車

頻繁變道超車使汽車經(jīng)常加速、減速、制動(dòng),發(fā)動(dòng)機(jī)工作不穩(wěn)定,同時(shí)使汽車處于曲線行駛狀態(tài)。汽車曲線行駛時(shí),如汽車轉(zhuǎn)彎,地面對(duì)輪胎將產(chǎn)生側(cè)向反作用力、滾動(dòng)阻力大幅增加,導(dǎo)致油耗上升。

1.1 急加速模式

當(dāng)車輛加速度n_vehicleActSpeed>X1*,油門踏板開度n_emsGasPedalActPst>X2*(排除下坡導(dǎo)致的無油門輸入加速),記錄為一次急加速,急加速計(jì)數(shù)器Drastic_Acc_Counter++。

X1*為設(shè)定的加速度限值,考慮到不同車速區(qū)間內(nèi)車輛提供的加速能力不一致,為獲得更優(yōu)的評(píng)價(jià)方法,在不同速度區(qū)間能選用不同的限值。加速度限值是車速的函數(shù),車速越低限值越大。X2*為油門踏板開度限值可以設(shè)置為定值20%。

加速度限值函數(shù) X1:

y=a■x+b■,x?綴(0,40]a■x+b■,x?綴(40,80]a■x+b■,x?綴(80,max)

1.2 急轉(zhuǎn)彎模式

對(duì)于急轉(zhuǎn)彎駕駛行為,為濾去低速工況下掉頭等實(shí)際狀況的影響,首先判斷車速,車速當(dāng)車速n_vehicleSpeed>20km/h時(shí),再進(jìn)行急轉(zhuǎn)彎判斷,判斷方法如下:

1)當(dāng)某時(shí)間區(qū)間內(nèi)(如1s)車輛角速度均值n_averageSteeringAngleSpeed大于預(yù)設(shè)角速度X*時(shí),記錄為一次急轉(zhuǎn)彎,急轉(zhuǎn)彎計(jì)數(shù)器n_turnCounter++;

2)當(dāng)車輛行車速度大于50km/h且一秒內(nèi)方向盤轉(zhuǎn)動(dòng)角度大于 Y*時(shí),記錄為一次急轉(zhuǎn)彎急轉(zhuǎn)彎計(jì)數(shù)器n_turnCounter++;

3)當(dāng)車輛轉(zhuǎn)彎角度大于31°,且車輛行駛速度大于S時(shí),記錄為一次急轉(zhuǎn)彎,例如:S取值范圍為51km/h至60km/h,急轉(zhuǎn)彎計(jì)數(shù)器n_turnCounter++;

注:X*為動(dòng)態(tài)限制量,是一個(gè)和車速有關(guān)的函數(shù),車速越大轉(zhuǎn)角速度極限值X*越小。

Y*為動(dòng)態(tài)限制量,是一個(gè)和車速有關(guān)的函數(shù),車速越大轉(zhuǎn)角極限值Y*越小。

如下:

X*=k■x+l■,x?綴(0,40]k■x+l■,x?綴(40,80]k■x+l■,x?綴(80,max),Y■=r■x+t■,x?綴(0,40]r■x+t■,x?綴(40,80]r■x+t■,x?綴(80,max)

其中:k1,k2,k3,l1,l2,l3,r1,r2,r3,t1,t2,t3為常數(shù)。

2 非經(jīng)濟(jì)駕駛行為數(shù)據(jù)統(tǒng)計(jì)

根據(jù)第一章節(jié)中的描述,對(duì)行程中不利于油耗降低的駕駛行為(急駕駛、急減速、急轉(zhuǎn)彎、怠速過長(zhǎng)等)進(jìn)行記錄,并將每次行程的結(jié)果保存在存儲(chǔ)區(qū)中作為歷史數(shù)據(jù)。統(tǒng)計(jì)界面的默認(rèn)界面為本次行程的駕駛行為統(tǒng)計(jì)(如圖2左圖);通過操作駕駛者可以進(jìn)入歷史統(tǒng)計(jì)界面,該界面內(nèi)駕駛者可以觀察本次駕駛行程中各駕駛行為發(fā)生次數(shù)與歷史行程的對(duì)比(如圖2右圖)。

3 不同平均車速下的歷史綜合油耗統(tǒng)計(jì)

實(shí)際駕駛過程中不同路況下的油耗差異性很大,例如:高速公路駕駛中高速行駛發(fā)動(dòng)機(jī)運(yùn)行在經(jīng)濟(jì)區(qū)域占比較大,油耗較低;而城市道路駕駛過程中,車流量較大、交通燈數(shù)量多,車輛處于中低速區(qū)域比例較大,油耗較高。僅僅從平均油耗進(jìn)行對(duì)比,有時(shí)不能正確反映駕駛者駕駛習(xí)慣。平均車速能較為有效的反應(yīng)出道路工況,因此可以以行程的平均車速進(jìn)行區(qū)間劃分,歷史油耗對(duì)比時(shí)僅對(duì)比同一區(qū)間內(nèi)的油耗,可將平均車速劃分為低速行駛區(qū)域(0~40km/h)、中速行駛區(qū)域(40~80km/h)、高速行駛區(qū)域(V≥80km/h),加入行程平均車速的考慮因素再做燃油消耗的統(tǒng)計(jì)。

4 方法總結(jié)

通^統(tǒng)計(jì)與經(jīng)濟(jì)駕駛關(guān)聯(lián)的幾種模式進(jìn)行算法設(shè)計(jì),可以將駕駛行為轉(zhuǎn)化為可以具體量化的數(shù)據(jù)結(jié)果?;跀?shù)據(jù)有限分析和樣本量,數(shù)據(jù)累計(jì)歷史等前提下,可以通過模型進(jìn)行一些可視化的輸出結(jié)果。并以此作為駕駛?cè)藛T輔助駕駛和行為提醒的基本數(shù)據(jù)。當(dāng)然如果該模型能基于大數(shù)據(jù)后臺(tái)平臺(tái),通過建立復(fù)雜的算法模型和自學(xué)習(xí)模型??梢愿嗟姆治鲴{駛?cè)藛T、同類車型、相似工況環(huán)境等。并以此為基礎(chǔ)逐步影響駕駛?cè)藛T的駕駛習(xí)慣,建立起良好的駕駛行為。

篇9

概念的內(nèi)涵就是反映在概念中的事物的本質(zhì)屬性,這是概念的內(nèi)容。概念的外延就是具有概念所反映的本質(zhì)屬性的對(duì)象,這是概念的適用范圍。學(xué)生對(duì)于概念的掌握程度可以通過各種判斷題、選擇題的綜合檢測(cè)得到體現(xiàn),概念的正確掌握能從根本上解決計(jì)算題、實(shí)驗(yàn)題及綜合題等。只有學(xué)好的基本概念,深刻理解概念的內(nèi)涵和外延,把握概念的本質(zhì)屬性,才能扎實(shí)地掌握相關(guān)的知識(shí)內(nèi)容,正確而有效地學(xué)好化學(xué)知識(shí)。

一、運(yùn)用數(shù)據(jù)分析,把握化學(xué)概念的內(nèi)涵

高中化學(xué)選修四《化學(xué)反應(yīng)原理》一書中的一些化學(xué)基本概念比較抽象,教師應(yīng)在教學(xué)中依據(jù)教材提供的數(shù)據(jù)材料或通過實(shí)驗(yàn)所得數(shù)據(jù)及推理演算,引導(dǎo)學(xué)生在探索中得出相關(guān)概念,并進(jìn)一步理解概念的本質(zhì)。通過數(shù)據(jù)分析的教學(xué),讓學(xué)生自己收集數(shù)據(jù),應(yīng)用數(shù)據(jù)分析,從而感受數(shù)據(jù)分析的實(shí)際價(jià)值,深刻理解概念的內(nèi)涵。

例如,弱電解質(zhì)電離平衡常數(shù)用Ki表示。弱電解質(zhì)通常為弱酸或弱堿,所以在化學(xué)上,可以用Ka、Kb分別表示弱酸和弱堿的電離平衡常數(shù)。用HA表示弱酸,則其電離方程式為HA H++A-,則電離常數(shù)Ka=[H]*[A]/[HA],電離平衡常數(shù)描述了一定溫度下弱電解質(zhì)的電離能力。在相同溫度和濃度時(shí),電離度的大小也可以表示弱電解質(zhì)的相對(duì)強(qiáng)弱。用電離度比較幾種電解質(zhì)的相對(duì)強(qiáng)弱時(shí),應(yīng)當(dāng)注意所給條件,即濃度和溫度,如不注明溫度通常指25℃。

在教學(xué)過程中,我們發(fā)現(xiàn)這些概念抽象難以用啟發(fā)式教學(xué)法讓學(xué)生去學(xué)習(xí),因?yàn)閷W(xué)生對(duì)于課本上弱酸的電離平衡常數(shù)的理解總是基于表面,沒能真正理解化學(xué)概念的內(nèi)涵。

教師在教學(xué)中應(yīng)充分利用課本中的數(shù)據(jù),分析Ka與電離度α的關(guān)系,比較Ka與電離度α的相同點(diǎn)與不同點(diǎn)。電離常數(shù)K與電離度α的關(guān)系可近似地表示為K=cα2,其中c為弱電解質(zhì)溶液的濃度。教師通過設(shè)計(jì)一組具體數(shù)據(jù),讓學(xué)生從電離常數(shù)可以算出不同濃度、不同溫度時(shí)弱電解質(zhì)的電離度,比較電離常數(shù)與電離度的區(qū)別,可看出Ka是常數(shù)而α不是常數(shù)。Ka隨溫度而變化,α隨Ka而變化,因此α也隨溫度而變化,Ka不因濃度改變而變化,但α卻隨濃度而變化,Ka不因溶液中其他電解質(zhì)的存在而變化,但α卻因溶液中其他電解質(zhì)離子的存在而變化。

例如,在醋酸溶液中加入醋酸鈉(CH3COONa),則因同離子效應(yīng)而使平衡向左移動(dòng),α將減小。在室內(nèi)溫度下,醋酸的電離常數(shù)是1.8×10-5,學(xué)生對(duì)這一數(shù)據(jù)并沒有什么印象,但通過計(jì)算可以得出它的電離度α=1.3%,學(xué)生得出每1000個(gè)醋酸分子室溫條件下只有13個(gè)醋酸分子發(fā)生電離,987個(gè)醋酸分子的形式存在溶液中。通過數(shù)據(jù)的分析轉(zhuǎn)換,學(xué)生容易理解弱電解質(zhì)的電離程度的大小,有利于把握化學(xué)概念的內(nèi)涵。

二、運(yùn)用數(shù)據(jù)分析,準(zhǔn)確化學(xué)概念的外延

化學(xué)課本中有許多數(shù)據(jù),教學(xué)中并不要求具體記憶這些數(shù)值,但對(duì)這些數(shù)據(jù)的統(tǒng)計(jì)分析,既能幫助學(xué)生理解概念本質(zhì),形成學(xué)科觀念,又有利于培養(yǎng)學(xué)生嚴(yán)謹(jǐn)?shù)目茖W(xué)態(tài)度,全面提升科學(xué)素養(yǎng)。對(duì)這些數(shù)據(jù)的統(tǒng)計(jì)分析,有利于學(xué)生建立準(zhǔn)確的數(shù)據(jù)觀念,可以發(fā)展學(xué)生的數(shù)據(jù)意識(shí),學(xué)生從中提取相關(guān)信息,從而充分體現(xiàn)化學(xué)基本概念對(duì)元素化合物性質(zhì)學(xué)習(xí)的指導(dǎo)作用。例如,關(guān)于Ka概念外延的教學(xué),我們應(yīng)該清楚該概念的適用范圍。

(1)根據(jù)Ka判斷弱酸的酸性強(qiáng)弱。通過Ka的學(xué)習(xí)達(dá)到指導(dǎo)元素化合物性質(zhì)的學(xué)習(xí)。相同條件下,Ka越大,酸性越強(qiáng)。通過比較Ka,我們可以得出常見弱酸的酸性:CH3COOH>H2CO3>

H2SiO3;H2CO3>HClO;H2CO3>Al(OH)3。這樣,學(xué)生就很容易理解醋酸溶液與碳酸鈣的反應(yīng),還有漂白粉放置在空氣中失效、水玻璃溶液中通入二氧化碳?xì)怏w、偏鋁酸鈉溶液中通入二氧化碳?xì)怏w等一系列反應(yīng),這些反應(yīng)都是高一化學(xué)課本中的重要反應(yīng),都符合“酸性強(qiáng)的制取酸性弱”的基本原理。

(2)以Ka來判斷鹽類物質(zhì)的水解相對(duì)大小。根據(jù)鹽類水解規(guī)律“越弱越水解”,我們可以判斷出相同條件下醋酸銨溶液、氯化銨溶液、次氯酸銨溶液水解的相對(duì)大小,從而判斷出溶液的酸堿性。分析利用醋酸Ka和氨水Kb數(shù)據(jù)的特殊性可知:醋酸銨溶液接近中性,進(jìn)而可以探究Mg(OH)2沉淀溶于濃銨鹽的反應(yīng)原理。

(3)根據(jù)Ka1、Ka2判斷酸式鹽溶液的酸堿性。在25℃時(shí),碳酸的電離平衡常數(shù)分別為:碳酸Ka1=4.30×10-7,Ka2=5.61×10-11;亞硫酸的電離平衡常數(shù)Ka1=1.54×10-2 ,Ka2=1.02×10-7。對(duì)于酸式鹽NaHA的水溶液, NaHA 中 HA-既可電離:HA- H++A2-,也可水解:HA-+ H2O H2A + OH-。酸式鹽溶液由于NaHCO3溶液的Ka1Kh1而顯酸性。

(4)根據(jù)Ka1、Ka2的相對(duì)大小判斷物|的性質(zhì)、理解離子反應(yīng)的實(shí)質(zhì)。碳酸Ka1=4.30×10-7 ,Ka2=5.61×10-11 ;苯酚C6H5OH ,Ka=1.0×10-10; 氫氧化鋁的酸式電離Ka= 6.3×10-13 。通過對(duì)這些數(shù)據(jù)的分析,我們?nèi)菀椎贸鏊嵝裕篐2CO3>HCO3->Al(OH)3-;H2CO3>

C6H5OH>HCO3-。這樣就容易理解以下四個(gè)反應(yīng):

A.往苯酚鈉水溶液中通入少量或足量CO2 : C6H5O-+H2O+CO2 C6H5OH+

HCO3-

B.往偏鋁酸鈉水溶液中通入少量CO2 :AlO2-+H2O+CO2Al(OH)3+CO32-

C.往偏鋁酸鈉水溶液中通入足量CO2:AlO2-+H2O+CO2Al(OH)3+

HCO3-

D. 偏鋁酸鈉水溶液與碳酸氫鈉水溶液混合: AlO2-+HCO3-+H2O

Al(OH)3+CO32-

三、運(yùn)用數(shù)據(jù)分析,拓展提高學(xué)生綜合應(yīng)用概念的水平

化學(xué)計(jì)算是中學(xué)化學(xué)教學(xué)的重要內(nèi)容,也是中學(xué)生必須掌握的一個(gè)基本技能,學(xué)會(huì)數(shù)據(jù)分析是提高計(jì)算能力的關(guān)鍵?;瘜W(xué)計(jì)算題中,往往題目數(shù)據(jù)多、綜合性強(qiáng),但學(xué)生們因綜合分析能力差,不善于對(duì)知識(shí)準(zhǔn)確遷移,因而覺得十分棘手。分析化學(xué)過程、融會(huì)貫通理解化學(xué)概念的內(nèi)涵是正確解決化學(xué)計(jì)算題的基礎(chǔ)。

在學(xué)習(xí)《溶液中的離子反應(yīng)》專題后,許多教師會(huì)引導(dǎo)學(xué)生對(duì)化學(xué)平衡常數(shù)K、酸堿電離平衡常數(shù)Ka、Kb、水的離子積Kw、難溶電解質(zhì)的溶度積Ksp等一些概念進(jìn)行比較歸納,分析他們的異同,但是若能進(jìn)一步拓展到酸電離平衡常數(shù)Ka與鹽的水解常數(shù)Kh、與難溶電解質(zhì)的溶度積Ksp、配合物的穩(wěn)定系數(shù)Kw之間的聯(lián)系,就能進(jìn)一步提高學(xué)生的綜合能力。

例如,在25℃下,于0.010mol?L-1

FeSO4溶液中通入H2S(g), 使其成為飽和溶液 (C(H2S)= 0.10mol?L-1) 。

篇10

中圖分類號(hào):TP274文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2008)15-20ppp-

The Research Content And Data Analysis Methods On the Gene Regulatory Networks

GUO Zhi-long1,2,JI Zhao-hua1,3,TU Hua-wei1,LIANG Yan-chun1

(1.College of Computer Science and Technology,Jilin University,Changchun 130012,China;2.Dalian Huaxin Software Corporation,DaLian 116000,China; 3.Inner Mongolia Xing'an Vocational and Technical College,Wulanhaote 137400,China)

Abstract:Gene regulatory networks,which reveals the complex phenomena of life from the view of the complex interactions of genes,is very important to understand the functional genomics for researchers.The article focuses on the research content and data analysis methods about gene regulatory networks.

Key words:gene regulatory networks;Self-organizing Map;machine learning

基因調(diào)控網(wǎng)絡(luò)是計(jì)算機(jī)科學(xué)、數(shù)學(xué)、信息學(xué)向分子生物學(xué)滲透形成的交叉點(diǎn),是運(yùn)用生物信息學(xué)的方法和技術(shù)通過數(shù)據(jù)采集、分析、建模、模擬和推斷等手段研究復(fù)雜的基因網(wǎng)絡(luò)關(guān)系。作為一種系統(tǒng)的、定量的研究方法建立在包括分子生物學(xué),非線性數(shù)學(xué)和程序算法設(shè)計(jì)等知識(shí)等基礎(chǔ)上,運(yùn)用生物信息學(xué)的方法和技術(shù)通過數(shù)據(jù)采集、分析、建模、模擬和推斷等手段,整合已有的實(shí)驗(yàn)數(shù)據(jù)和知識(shí),構(gòu)建生物基因調(diào)控網(wǎng)絡(luò),從整體的層次,了解細(xì)胞的功能;從整體的角度,闡述基因參與的生物調(diào)控過程,在全基因組水平上以系統(tǒng)的、全局的觀點(diǎn)研究生命現(xiàn)象及其本質(zhì),是后基因組時(shí)代研究的重要內(nèi)容。

1 基因調(diào)控網(wǎng)絡(luò)概念

基因調(diào)控網(wǎng)絡(luò)本質(zhì)上是一個(gè)連續(xù)而復(fù)雜的動(dòng)態(tài)系統(tǒng),即復(fù)雜的動(dòng)力系統(tǒng)網(wǎng)絡(luò)。

1.1 基因調(diào)控網(wǎng)絡(luò)的定義

生物體任何細(xì)胞的遺傳信息、基因都是同樣的,但同一個(gè)基因在不同組織、不同細(xì)胞中的表現(xiàn)并不一樣。一個(gè)基因的表達(dá)既影響其它的基因,又受其它基因的影響,基因之間相互促進(jìn)、相互抑制,在特定的細(xì)胞內(nèi)和時(shí)間下綜合環(huán)境等因素這樣的大環(huán)境中呈現(xiàn)活化狀態(tài),構(gòu)成一個(gè)復(fù)雜的基因調(diào)控網(wǎng)絡(luò)。

1.2 基因調(diào)控網(wǎng)絡(luò)的特性:

基因調(diào)控網(wǎng)絡(luò)是連續(xù)的多層次動(dòng)力系統(tǒng)模型,具有穩(wěn)定姓、層次性、復(fù)雜性、動(dòng)態(tài)性等。

1.2.1 復(fù)雜性

生物具有大量的基因,諸多基因組成各個(gè)模塊,不同的基因網(wǎng)絡(luò)模塊可以在不同層次上發(fā)生相互作用,同一個(gè)基因可能參與各種不同的分子機(jī)理,使得基因網(wǎng)絡(luò)有著高度的復(fù)雜性。

1.2.2 層次性

基因調(diào)控網(wǎng)絡(luò)具有一定層次結(jié)構(gòu),按照調(diào)控元件、motif、模塊和整個(gè)網(wǎng)絡(luò)的四層結(jié)構(gòu),將各個(gè)節(jié)點(diǎn)有規(guī)律的來接在一起。調(diào)控元件分為順式(cis-)和反式(trans-)兩種類型, 分別表示受調(diào)控基因的結(jié)合位點(diǎn)DNA 序列和結(jié)合在該序列上對(duì)基因起激活或者抑制作用的轉(zhuǎn)錄因子。Motif 和模塊都是由基因集合構(gòu)成的調(diào)控模式, 是分析網(wǎng)絡(luò)局部特征和網(wǎng)絡(luò)構(gòu)成以及研究調(diào)控機(jī)理的重要結(jié)構(gòu)。

1.2.3 動(dòng)態(tài)性

生物過程是動(dòng)態(tài)的,用來理解生物過程意義的基因調(diào)控網(wǎng)絡(luò)自然就動(dòng)態(tài)存在?;蛘{(diào)控網(wǎng)絡(luò)是隨著生物過程的動(dòng)態(tài)發(fā)生而具有動(dòng)態(tài)的特性,不同條件、不同時(shí)間的基因調(diào)控網(wǎng)絡(luò)是不同的。

1.2.4 穩(wěn)定性

基因調(diào)控網(wǎng)絡(luò)的穩(wěn)定性體現(xiàn)在生物體緩解突變的影響方面,功能上無關(guān)基因之間的相互作用可以抵抗系統(tǒng)突變;一個(gè)基因在突變中喪失的功能,有另外一個(gè)或更多具有相似功能的基因所補(bǔ)償,以減弱該突變對(duì)表型造成的影響,保持生物進(jìn)化中的穩(wěn)定性。

1.2.5 功能模塊性

基因調(diào)控相關(guān)的生物功能主要是通過網(wǎng)絡(luò)模塊來實(shí)現(xiàn)的,有適當(dāng)尺度下的動(dòng)力學(xué)特征和生物學(xué)功能解釋的模塊是由多個(gè)motif 構(gòu)成的,實(shí)現(xiàn)相同功能的基因或蛋白質(zhì)存在拓?fù)浣Y(jié)構(gòu)上是相關(guān)的。

1.3 基因調(diào)控網(wǎng)絡(luò)研究的目的

通過對(duì)基因調(diào)控網(wǎng)絡(luò)的研究,識(shí)別和推斷基因網(wǎng)絡(luò)的結(jié)構(gòu)、特性和調(diào)控關(guān)系,認(rèn)識(shí)復(fù)雜的分子調(diào)控過程,理解支配基因表達(dá)和功能的基本規(guī)則,揭示基因表達(dá)過程中的信息傳輸規(guī)律,清楚整體的框架下研究基因的功能。

2 基因調(diào)控網(wǎng)絡(luò)研究?jī)?nèi)容

基因調(diào)控網(wǎng)絡(luò)的研究是假設(shè)兩個(gè)基因列譜相似,則這兩個(gè)基因協(xié)作調(diào)控,并可能功能相近,有同樣表達(dá)模式的基因可能有同樣的表達(dá)過程?;蛘{(diào)控網(wǎng)絡(luò)主要在三個(gè)水平上進(jìn)行:DNA水平、轉(zhuǎn)錄水平、翻譯水平。DNA水平主要是研究基因在空間上的關(guān)系影響基因的表達(dá);轉(zhuǎn)錄水平主要研究代謝或者是信號(hào)轉(zhuǎn)導(dǎo)過程決定轉(zhuǎn)錄因子濃度的調(diào)控過程;翻譯水平主要研究蛋白質(zhì)翻譯后修飾,從而影響基因產(chǎn)物的活性和種類的過程。基因轉(zhuǎn)錄調(diào)控信息隱藏在基因組序列中,基因表達(dá)數(shù)據(jù)代表基因轉(zhuǎn)錄調(diào)控的結(jié)果,是轉(zhuǎn)錄調(diào)控信息的實(shí)際體現(xiàn)。

基因調(diào)控網(wǎng)絡(luò)試圖從DNA微陣列等海量數(shù)據(jù)中推斷基因之間的調(diào)控關(guān)系,對(duì)某一物種或組織中全部基因的表達(dá)關(guān)系進(jìn)行整體性研究。采用帶有反饋回路的基因網(wǎng)絡(luò),首先是按照同步或反同步表達(dá),以及表達(dá)強(qiáng)度的變化,系統(tǒng)地識(shí)別各基因的特點(diǎn),再用聚類的方法將各基因歸類,在此基礎(chǔ)上構(gòu)建基因調(diào)控網(wǎng)絡(luò),分析相關(guān)控制參數(shù).利用其本身或調(diào)節(jié)位點(diǎn)或拓?fù)浣Y(jié)構(gòu)進(jìn)行不同的研究。