首頁(yè) > 優(yōu)秀范文 > 統(tǒng)計(jì)學(xué)決策規(guī)則
時(shí)間:2023-11-15 11:14:50
序論:速發(fā)表網(wǎng)結(jié)合其深厚的文秘經(jīng)驗(yàn),特別為您篩選了11篇統(tǒng)計(jì)學(xué)決策規(guī)則范文。如果您需要更多原創(chuàng)資料,歡迎隨時(shí)與我們的客服老師聯(lián)系,希望您能從中汲取靈感和知識(shí)!
中圖分類號(hào):F830.5 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-5192(2009)05-0032-06
Credit Risk Evaluation Based on Fuzzy Cluster and Variable Precision Rough Set
GUO Jun-hua1,2,LI Bang-yi1
(1.School of Economics and Management, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China; 2.School of Economics and Management, East China Jiaotong University, Nanchang 330013, China)
Abstract:Credit risk evaluation is one of the most important problems in the finance field. Fuzzy cluster and variable precision rough set theory are introduced to evaluate credit risk. Fuzzy cluster is applied to discriminate sample data. Then, decision rules are extracted by variable precision rough set theory. The result indicates that sample datacan be classifiedcorrectly by the decision rules which have the character of anti-interference.
Key words:credit risk; fuzzy cluster; variable precision rough set; decision rule
1 引言
信用風(fēng)險(xiǎn)評(píng)價(jià)是商業(yè)銀行貸款的重要依據(jù)。世界銀行對(duì)全球銀行業(yè)危機(jī)的研究表明,導(dǎo)致銀行破產(chǎn)的主要原因就是信用風(fēng)險(xiǎn)[1]。隨著2007年我國(guó)銀行業(yè)的全面放開,我國(guó)商業(yè)銀行面臨的競(jìng)爭(zhēng)更加劇烈,如何科學(xué)、合理地對(duì)企業(yè)做出正確的信用風(fēng)險(xiǎn)評(píng)價(jià),是一個(gè)值得研究的問(wèn)題。傳統(tǒng)的信用評(píng)價(jià)方法存在某些不足,必須引入新的理論,對(duì)信用評(píng)價(jià)方法加以改進(jìn)。粗糙集理論作為研究不確定知識(shí)表達(dá)、學(xué)習(xí)、歸納的新型數(shù)學(xué)工具,其重要特點(diǎn)是不需要預(yù)先給定某些特征或?qū)傩缘臄?shù)量描述,而直接從給定問(wèn)題的描述集合出發(fā),在信息不確定情況下,仍可挖掘出大量對(duì)決策有幫助的知識(shí)信息[2]。粗糙集理論提供了一整套比較成熟的樣本學(xué)習(xí)式?jīng)Q策方法。由于標(biāo)準(zhǔn)粗糙集理論在某些條件下具有一定的局限性,缺乏對(duì)復(fù)雜系統(tǒng)的處理機(jī)制,對(duì)于不確定性概念的邊界區(qū)域,刻畫過(guò)于簡(jiǎn)單,缺乏對(duì)噪音數(shù)據(jù)的適應(yīng)能力。而在實(shí)際應(yīng)用中,噪音是難免的,因此Ziarko提出了變精度粗糙集(Variable Precision Rough Set,簡(jiǎn)稱VPRS)模型[3],增強(qiáng)粗糙集合模型的抗干擾能力。本文利用變精度粗糙集理論,根據(jù)2007年我國(guó)部分上市公司公布的年報(bào)數(shù)據(jù),以部分財(cái)務(wù)指標(biāo)作為基本屬性,從中篩選出能反映評(píng)價(jià)指標(biāo)本質(zhì)關(guān)系的重要屬性,從而挖掘出數(shù)據(jù)間的關(guān)系而形成信用評(píng)價(jià)決策規(guī)則。通過(guò)這些由訓(xùn)練數(shù)據(jù)抽取的決策規(guī)則對(duì)測(cè)試數(shù)據(jù)進(jìn)行判別表明,該方法具有良好的分類判別能力。
2 文獻(xiàn)回顧
在信用風(fēng)險(xiǎn)評(píng)價(jià)的文獻(xiàn)中,主要存在三類不同的方法。第一類是統(tǒng)計(jì)分類方法,第二類是神經(jīng)網(wǎng)絡(luò)方法,另一類是支持向量機(jī)方法。
2.1 統(tǒng)計(jì)分類方法
早在1966年,Beaver[4]首次運(yùn)用單變量判定分析法來(lái)研究公司財(cái)務(wù)危機(jī)問(wèn)題,但該方法因財(cái)務(wù)比例的選取不同而觀測(cè)結(jié)果相差很大,所以很快被多變量分析法所取代。1968年,Altman率先將判別分析法應(yīng)用于財(cái)務(wù)危機(jī)、公司破產(chǎn)及違約風(fēng)險(xiǎn)的分析,建立了Z-Score模型[5],該模型只適用于短期的預(yù)測(cè)。Altman在1977年及1983年又在Z-Score模型基礎(chǔ)上進(jìn)行了改進(jìn),建立了ZETA模型[6,7],研究結(jié)果表明ZETA模型優(yōu)于Z-Score模型。Martin、Ohlson、Maddala[8~10]等人分別在1980年前后將Logistic模型應(yīng)用于信用風(fēng)險(xiǎn)分析,并認(rèn)為L(zhǎng)ogistic模型優(yōu)于Z-Score模型和ZETA模型。
國(guó)內(nèi)學(xué)者在統(tǒng)計(jì)分類方法應(yīng)用于信用風(fēng)險(xiǎn)評(píng)價(jià)的研究上也做出了具大貢獻(xiàn)。陳靜[11] 、張玲[12]分別利用線性判別分析法對(duì)企業(yè)信用風(fēng)險(xiǎn)進(jìn)行了研究。唐曉岸、孟慶福[13]、姜天、韓立巖[14]、陳曉虹、戴靜[15]、宋榮威[16]等人分別運(yùn)用Logit模型對(duì)企業(yè)進(jìn)行了財(cái)務(wù)預(yù)警分析。研究表明,線性判別分析法和Logit模型對(duì)企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)有一定的準(zhǔn)確性。
2.2 神經(jīng)網(wǎng)絡(luò)方法
從20世紀(jì)90年代開始,國(guó)內(nèi)外學(xué)者將神經(jīng)網(wǎng)絡(luò)方法應(yīng)用于信用風(fēng)險(xiǎn)的評(píng)價(jià),方法大致有多層感知器(MLP)、BP算法網(wǎng)絡(luò)、徑向基函數(shù)(RBF)網(wǎng)絡(luò)、概率神經(jīng)網(wǎng)絡(luò)(PNN)等幾種,其中用得最多的是BP算法網(wǎng)絡(luò)。Altman、Marco和Varetto運(yùn)用MLP神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)意大利公司進(jìn)行財(cái)務(wù)危機(jī)預(yù)測(cè)[17]。West分別建立MLP網(wǎng)絡(luò)結(jié)構(gòu)和RBF網(wǎng)絡(luò)對(duì)德國(guó)和澳大利亞的銀行貸款企業(yè)的財(cái)務(wù)數(shù)據(jù)進(jìn)行兩類模式分類[18]。Jensen、Tam、Coats等人[19~21]則分別應(yīng)用BP算法針對(duì)財(cái)務(wù)狀況進(jìn)行了評(píng)價(jià)。Yang和Marjorie利用PNN技術(shù)建立公司破產(chǎn)預(yù)警模型,對(duì)美國(guó)122家石油公司進(jìn)行財(cái)務(wù)困境預(yù)警研究[22]。
在國(guó)內(nèi),學(xué)者龐素琳[23~25]對(duì)神經(jīng)網(wǎng)絡(luò)的幾種模型分別進(jìn)行了研究。陳雄化、林成德、葉武[26]、勝、梁[27]等研究了BP算法在信用評(píng)價(jià)中的應(yīng)用。從國(guó)內(nèi)已有文獻(xiàn)來(lái)看,國(guó)內(nèi)研究對(duì)BP算法及其改進(jìn)模型在信用評(píng)價(jià)中的應(yīng)用較多。
2.3 支持向量機(jī)方法
支持向量機(jī)(SVM)方法是1995年Vapnik根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論提出的一種學(xué)習(xí)方法,研究如何根據(jù)有限學(xué)習(xí)樣本進(jìn)行模式識(shí)別和回歸預(yù)測(cè)等,使在對(duì)未知樣本的估計(jì)過(guò)程中,期望風(fēng)險(xiǎn)達(dá)到最小[28]。該方法提出后,國(guó)內(nèi)外很多學(xué)者把SVM模型應(yīng)用到信用評(píng)價(jià)分析。Fan和Palaniswami利用SVM對(duì)企業(yè)破產(chǎn)進(jìn)行預(yù)測(cè)[29]。姚奕和葉中行[30]利用SVM研究銀行客戶信用評(píng)估系統(tǒng)。鐘波等[31]建立了基于LS-SVM的信用評(píng)價(jià)模型。肖文兵、費(fèi)奇、萬(wàn)虎[32]也對(duì)支持向量機(jī)的信用評(píng)價(jià)模型進(jìn)行了分析。
以上各種方法各有其優(yōu)缺點(diǎn)。線性判別分析法最大的優(yōu)點(diǎn)是解釋性強(qiáng),且簡(jiǎn)單明了,但其假定條件過(guò)于嚴(yán)格,如要求每組數(shù)據(jù)滿足:(1)服從多元正態(tài)分布。(2)協(xié)方差矩陣相同。(3)均值向量、協(xié)方差矩陣、先驗(yàn)概率和誤判代價(jià)已知。而現(xiàn)實(shí)中這幾個(gè)條件難以滿足。Logit模型的優(yōu)點(diǎn)是不需要假定任何概率分布,也不要求等協(xié)方差性,但當(dāng)樣本點(diǎn)完全分離時(shí),模型參數(shù)的最大似然估計(jì)可能不存在而導(dǎo)致該方法完全失效。人工神經(jīng)網(wǎng)絡(luò)是一種對(duì)數(shù)據(jù)分布無(wú)任何要求的非線性技術(shù),它能有效解決非正態(tài)分布、非線性的信用評(píng)估問(wèn)題,但其結(jié)構(gòu)確定困難,且解釋性差。支持向量機(jī)方法的最大優(yōu)點(diǎn)是能有效解決小樣本問(wèn)題,并且無(wú)須樣本數(shù)據(jù)滿足正態(tài)性和齊次方差的條件,但其分類準(zhǔn)確率和預(yù)測(cè)準(zhǔn)確率依賴于核函數(shù)的選取,其參數(shù)的選取都是通過(guò)反復(fù)的試驗(yàn),人工選擇出令人滿意的參數(shù),這種方法需要人的經(jīng)驗(yàn)做指導(dǎo),并且它的選取需要付出較高的時(shí)間代價(jià),這樣限制了支持向量機(jī)的發(fā)展。目前這三種方法中哪種方法的綜合效果較優(yōu)還存在一些爭(zhēng)論,考慮到粗糙集理論在數(shù)據(jù)推理方面的強(qiáng)大功能,本文嘗試引入變精度粗糙集理論構(gòu)造信用評(píng)價(jià)模型,并對(duì)我國(guó)2007年部分上市公司進(jìn)行分類。
3 數(shù)據(jù)選取和模型介紹
3.1 指標(biāo)體系說(shuō)明
企業(yè)信用風(fēng)險(xiǎn)的形成主要取決于企業(yè)財(cái)務(wù)狀況,因此,企業(yè)信用評(píng)級(jí)通常將對(duì)企業(yè)信用風(fēng)險(xiǎn)的測(cè)度轉(zhuǎn)化為對(duì)企業(yè)財(cái)務(wù)狀況的衡量。而影響公司財(cái)務(wù)變化的主要因素包括公司的盈利能力、營(yíng)運(yùn)能力、償債能力、成長(zhǎng)能力等指標(biāo)。結(jié)合已有相關(guān)文獻(xiàn)[2~31],本文擬采取如下指標(biāo)體系,見表1。
3.2 樣本數(shù)據(jù)選擇
考慮到不同行業(yè)的生產(chǎn)經(jīng)營(yíng)特點(diǎn)不一樣,在信用評(píng)價(jià)時(shí)如果采用相同的評(píng)價(jià)方法難免有失公允,在數(shù)據(jù)選取時(shí)應(yīng)盡量選取具有相同特點(diǎn)的行業(yè)板塊。本文在滬深證券交易所2007年年報(bào)公布的按照CSRC行業(yè)分類中的所有制造業(yè)板塊中隨機(jī)抽取40家企業(yè)為樣本,其中ST類10家,不虧損公司30家。從其中10家ST公司中隨機(jī)選擇5家作為訓(xùn)練樣本,另5家作為測(cè)試樣本;同理,從30家不虧損公司中隨機(jī)選擇15家作為訓(xùn)練樣本,另15家作為測(cè)試樣本。主要數(shù)據(jù)采自中國(guó)上市公司資訊網(wǎng)上市公司財(cái)務(wù)報(bào)表及《上海證券報(bào)》、《中國(guó)證券報(bào)》上刊登的上市公司相關(guān)公告。
3.3 模型說(shuō)明
變精度粗糙集是對(duì)標(biāo)準(zhǔn)粗糙集理論的一種擴(kuò)展,它通過(guò)設(shè)置閾值參數(shù)β,放松了標(biāo)準(zhǔn)粗糙集理論對(duì)近似邊界的嚴(yán)格定義,允許概率分類。與標(biāo)準(zhǔn)粗糙集相比,當(dāng)對(duì)象在變精度粗糙集中分類時(shí),在它的正確分類中有一個(gè)置信度,這一方面完善了近似空間的概念,另一方面也有利于根據(jù)粗糙集理論從認(rèn)為不相關(guān)的數(shù)據(jù)中發(fā)現(xiàn)相關(guān)信息。當(dāng)對(duì)象按變精度粗糙集分類時(shí),需定義一個(gè)正確分類的閾值β。Ziarko稱β為分類誤差,定義區(qū)域?yàn)?≤β
(1)模糊聚類法(Fuzzy Cluster,簡(jiǎn)稱FC)離散化決策表
粗糙集理論分析要求數(shù)據(jù)必須以類別的形式出現(xiàn)。因此,連續(xù)數(shù)據(jù)必須首先進(jìn)行離散化處理,離散的結(jié)果可能會(huì)減小原始數(shù)據(jù)的精度,但將會(huì)提高它的一般性。數(shù)據(jù)離散方法一般分為專家離散與自動(dòng)離散。專家離散指由某領(lǐng)域的專家根據(jù)他的判斷或使用該領(lǐng)域確定的專家進(jìn)行離散;自動(dòng)離散方法可分為有監(jiān)督離散法和無(wú)監(jiān)督離散法,其中無(wú)監(jiān)督離散法可視為一個(gè)簡(jiǎn)單的聚類過(guò)程,本文使用模糊聚類分析法分別對(duì)每個(gè)指標(biāo)進(jìn)行離散化處理。
在實(shí)際問(wèn)題中,一組事物是否屬于某一類常常帶有模糊性,即問(wèn)題的界限不是很清晰,對(duì)該類問(wèn)題,模糊聚類分析能做出“在某種程度上是”的回答,用該方法能較好地對(duì)決策表進(jìn)行離散化。假定待分類的對(duì)象集合為X={X1,X2,…,Xn},集合中的每個(gè)元素具有m個(gè)特征,設(shè)Xi中的第j個(gè)特征值為xij(j=1,2,…,m),本文中對(duì)每個(gè)指標(biāo)分別進(jìn)行分類,故m=1。離散步驟如下:
當(dāng)β=1時(shí),aprβp(X)、aprβp(X)與標(biāo)準(zhǔn)粗糙集模型的上近似和下近似相同,則標(biāo)準(zhǔn)粗糙集模型就變成了變精度粗糙集模型的特殊情況。對(duì)于標(biāo)準(zhǔn)粗糙集意義下的不一致規(guī)則,根據(jù)設(shè)定的閾值β,若不一致性較弱,則可以認(rèn)為這種不一致性是由于數(shù)據(jù)中存在少量噪聲引起的,因此仍可把這部分規(guī)則或者主要部分看作一致性規(guī)則,若不一致性較強(qiáng),則可認(rèn)為據(jù)此不能得到任何確定性的信息,而將每個(gè)數(shù)據(jù)對(duì)象看作一條隨機(jī)規(guī)則。
(3)變精度粗糙集的分類質(zhì)量
變精度粗糙集的分類質(zhì)量為
4 實(shí)證分析
首先使用模糊聚類分析法分別對(duì)訓(xùn)練樣本中的每個(gè)指標(biāo)進(jìn)行離散化處理,每個(gè)指標(biāo)分為三類,產(chǎn)生的決策表如表2所示,其中“1”表示該指標(biāo)“好”,“2”表示該指標(biāo)“中等”,“3”表示該指標(biāo)“差”,可表示為123。對(duì)于決策屬性本文沿用國(guó)內(nèi)文獻(xiàn)的研究習(xí)慣,采用兩類模式分類,即非ST類上市公司視為“信用好”企業(yè),用“1”表示, ST企業(yè)視為“信用差”企業(yè),用“2”表示,表中的D為決策屬性。
由表3所述的決策規(guī)則一表明,如果上市公司每股收益至少為中等,并且主營(yíng)業(yè)務(wù)利潤(rùn)率至少中等,同時(shí)滿足主營(yíng)業(yè)務(wù)增長(zhǎng)率至少中等,則該企業(yè)可視為“信用好”的企業(yè);如果在每股收益、主營(yíng)業(yè)務(wù)利潤(rùn)率及主營(yíng)業(yè)務(wù)增長(zhǎng)率之間有一個(gè)為差,則該企業(yè)視為“信用差”的企業(yè)。其中每股收益和主營(yíng)業(yè)務(wù)利潤(rùn)率反映的是企業(yè)的贏利能力,主營(yíng)業(yè)務(wù)增長(zhǎng)率反映的是企業(yè)的發(fā)展能力,這三者分別表明了該企業(yè)的贏利能力及持續(xù)發(fā)展能力。表4所述的決策規(guī)則二表明,如果上市公司每股收益至少為中等,并且凈資產(chǎn)收益率至少中等,同時(shí)滿足凈資產(chǎn)增長(zhǎng)率至少中等,則該企業(yè)可視為“信用好”的企業(yè);如果在每股收益、凈資產(chǎn)收益率及凈資產(chǎn)增長(zhǎng)率之間有一個(gè)為差,則該企業(yè)視為“信用差”的企業(yè)。其中每股收益和凈資產(chǎn)收益率反映的是企業(yè)的贏利能力,凈資產(chǎn)增長(zhǎng)率反映的是企業(yè)的發(fā)展能力,這三者同樣表明了該企業(yè)的贏利能力及持續(xù)發(fā)展能力。這兩條決策規(guī)則都反映了上市公司的贏利能力及上市公司的成長(zhǎng)性,是企業(yè)信用評(píng)價(jià)的重要依據(jù)。
分別用表3及表4中的決策規(guī)則對(duì)測(cè)試樣本中的20家公司進(jìn)行判別表明,在抽取的兩類決策規(guī)則中各有一例ST公司誤判為信用好的公司,誤判率為5%,分類準(zhǔn)確率為95%(見表5),這充分說(shuō)明了變精度粗糙集在信用風(fēng)險(xiǎn)評(píng)價(jià)上的可行性。
由生成的決策規(guī)則一和決策規(guī)則二對(duì)20個(gè)測(cè)試樣本分析結(jié)果可知,變精度粗糙集方法能很好地識(shí)別樣本企業(yè)的信用等級(jí),證明了該方法的有效性。并且該方法具有一定的抗干擾能力,對(duì)偶然因素導(dǎo)致的異常數(shù)據(jù)也能較好地識(shí)別。比如某ST公司每股收益為0.13元,該指標(biāo)雖然為“中等”,但由于其主營(yíng)業(yè)務(wù)利潤(rùn)率為負(fù)并且呈下降趨勢(shì),故該公司仍然存在財(cái)務(wù)風(fēng)險(xiǎn),從而信用風(fēng)險(xiǎn)較大,變精度粗糙集方法能夠識(shí)別這種異常數(shù)據(jù),排除干擾;另外兩家ST公司雖然凈資產(chǎn)增長(zhǎng)率指標(biāo)都為“好”,但這主要是因?yàn)檫@兩家公司實(shí)施了資產(chǎn)注入或投資收益導(dǎo)致的,其主營(yíng)并沒發(fā)生很好的改觀,所以其經(jīng)營(yíng)仍然存在較大的風(fēng)險(xiǎn),存在一定的信用風(fēng)險(xiǎn),則利用生成的決策規(guī)則能很好地排除這種異常數(shù)據(jù)的干擾,能夠識(shí)別出這類公司的信用風(fēng)險(xiǎn)。
5 結(jié)束語(yǔ)
在當(dāng)前的分類評(píng)價(jià)決策問(wèn)題中,由事例導(dǎo)出規(guī)則是人工智能中的一個(gè)典型的方法。本文先利用模糊聚類方法對(duì)原始數(shù)據(jù)進(jìn)行離散化處理,然后將變精度粗糙集理論應(yīng)用于企業(yè)信用評(píng)價(jià)中,獲得了一些有益的規(guī)則和知識(shí)。獲取的規(guī)則能夠?qū)ζ髽I(yè)財(cái)務(wù)狀況進(jìn)行科學(xué)地分類評(píng)價(jià),并且能有效地排除異常數(shù)據(jù)的干擾。這種規(guī)則數(shù)量較少、解釋性較強(qiáng),能夠?yàn)槠髽I(yè)信用評(píng)價(jià)提供一些指導(dǎo)性的決策建議。變精度粗糙集理論無(wú)需任何假定條件,避免了統(tǒng)計(jì)分類方法的弊端;由變精度粗糙集理論生成的決策規(guī)則解釋性強(qiáng),彌補(bǔ)了神經(jīng)網(wǎng)絡(luò)方法的不足;變精度粗糙集理論的應(yīng)用也能排除支持向量機(jī)理論反復(fù)選取核函數(shù)的較大的時(shí)間代價(jià)?;谏鲜鰞?yōu)點(diǎn),變精度粗糙集理論在信用評(píng)價(jià)中必然具有廣闊的應(yīng)用前景。需要指出的是,由于本文所研究的決策表較小,所以能較容易地搜索到所有約簡(jiǎn),并對(duì)其進(jìn)行系統(tǒng)地分析,若決策表很大,則搜尋所有的約簡(jiǎn)是一個(gè)NP難問(wèn)題,在實(shí)際應(yīng)用中,只需選擇其中的一個(gè)約簡(jiǎn)進(jìn)行分析即可。由于β值與分類精度是逆相關(guān)的,隨著β值的增大,分類精度減小,X的正域與負(fù)域?qū)⒖s小,而邊界將擴(kuò)大,這意味著只有少數(shù)對(duì)象被分類;而隨著β值的減小,分類精度增大,X的正域與負(fù)域?qū)U(kuò)大,而邊界將縮小,這意味著大多數(shù)對(duì)象被分類,但可能被誤分;在實(shí)際運(yùn)用中應(yīng)該根據(jù)精度要求對(duì)β作合理的設(shè)置。
參 考 文 獻(xiàn):
[1]世界銀行.新興市場(chǎng)經(jīng)濟(jì)中的商業(yè)銀行[M].北京:中國(guó)經(jīng)濟(jì)出版社,1997.
[2]Pawlak Z. Rough sets theory and its applications to data analysis[J]. Cybernetics and Systems, 1998, 29: 661-668.
[3]張文修,吳志偉,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學(xué)出版社,2001.
[4]Beaver W H. Financial Distress: a complete guide to predicting, avoiding, and dealing with bankruptcy[M]. Brain-Brum Field Inc., 1982.
[5]Altman E I. Financial ratios,discriminant analysis and the prediction of corporate bankruptcy[J]. Journal of Finance, 1968, 9(4): 589-679.
[6]Altman E I, Heldeman R G, Narayanan P. ZETA analysis: a new model to identify bankruptcy risk of corporations[J]. Journal of Banking and Finance, 1977, 1: 29-54.
[7]Altman E I. Corporte financial distress[M]. New York:John Wiley & Sons, 1983.
[8]Earky M D. Warning of bank failure: a logit regression approach[J]. Journal of Banking and Finance, 1977,1(3): 249-276.
[9]Ohlson J. Financial rations and the probabilistic predcition of bankruptcy[J]. Journal of Accounting Research, 1980, 1: 109-130.
[10]Maddala G S. Limited-dependent and qualitative variables in econometrics[M]. Cambridge: Cambridge University Press, 1983.
[11]陳靜.上市公司財(cái)務(wù)惡化預(yù)測(cè)的實(shí)證分析[J].會(huì)計(jì)研究,1999,(4):31-38.
[12]張玲,張佳林.信用風(fēng)險(xiǎn)評(píng)估方法發(fā)展趨勢(shì)[J].預(yù)測(cè),2000,19(4):72-75.
[13]唐曉岸,孟慶福.上市公司信用評(píng)價(jià)模型[J].預(yù)測(cè),2002,21(2):39-43.
[14]姜天,韓立巖.基于Logit模型的中國(guó)預(yù)虧上市公司財(cái)務(wù)困境預(yù)測(cè)[J].北京航空航天大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2004,17(1):54-58.
[15]陳曉虹,戴靜.基于Logit模型的中小企業(yè)成長(zhǎng)危機(jī)預(yù)警[J].系統(tǒng)工程,2007,25(1):72-77.
[16]宋榮威.信貸風(fēng)險(xiǎn)度量的Logit模型檢驗(yàn)[J].電子科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2007,9(5):18-21.
[17]Altman E I, Marco G, Varetto F. Corporate distress diagnosis:comparisons using linear discriminant analysis and neural netwoeks(the Italian experience)[J]. Journal of Banking and Finance, 1994, 18: 505-529.
[18]West D. Neural network credit scoring models[J]. Computer & Operations Research, 2000, 27: 1131-1152.
[19]Jensen H L. Using neural networks for credit scoring[J]. Managerial Finance, 1992, 18(6): 15-26.
[20]Tam K Y, Kiang M. Predicting bank failures: a neural network approach[J]. Management Science, 1992, 38(7): 927-947.
[21]Coats P, Pant L. Recoganizing financial disstress patterns using a neural network tool[J]. Financial Management, 1993, 22(3): 142-155.
[22]Yang Z R, Marjorie B, Platt H D. Probabilistic neural networks in bankruptcy prediction[J]. Journal of Business Ressearch, 1999, 44: 67-74.
[23]龐素琳,王燕鳴.多層感知器信用評(píng)價(jià)模型研究[J].中山大學(xué)學(xué)報(bào)(自然科學(xué)版),2003,42(4):118-122.
[24]龐素琳,黎榮舟,徐建閩.BP算法在信用風(fēng)險(xiǎn)分析中的應(yīng)用[J].控制理論與應(yīng)用,2005,22(1):139-143.
[25]龐素琳.概率神經(jīng)網(wǎng)絡(luò)信用評(píng)價(jià)模型及預(yù)警研究[J].系統(tǒng)工程理論與實(shí)踐,2005,(5):43-48.
[26]陳雄華,林成德,葉武.基于神經(jīng)網(wǎng)絡(luò)的企業(yè)信用等級(jí)評(píng)估[J].系統(tǒng)工程學(xué)報(bào),2002,16(6):570-575.
[27]勝,梁.遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)及信用評(píng)價(jià)研究[J].中國(guó)管理科學(xué),2004,12(1):68-74.
[28]Vapnik V N. The nature of statistical learning theory[M]. New York: Springer-Verlag, 1998.
[29]Fan A, Palaniswami M. Selecting bankruptcy predictors using a support vector machine apporach[A]. Proceedings of the International Joint Conference on Neural Network[C]. USA:IEEE Computer Society Washington,DC, 2000. 354-359.
一、引言
群體決策的研究涉及多個(gè)學(xué)科,不同學(xué)科對(duì)群體決策的研究所采取的方法和著重點(diǎn)不一樣。在經(jīng)濟(jì)學(xué)、政治學(xué)、管理學(xué)領(lǐng)域?qū)θ后w決策的研究側(cè)重于偏好的集結(jié),較少考慮影響偏好形成的潛在背景信息。其中社會(huì)選擇理論與公共選擇理論利用數(shù)學(xué)分析的方法和福利經(jīng)濟(jì)學(xué)的一些基本原理,研究如何“公平合理地”將群體成員的偏好集結(jié)為群體的偏好并據(jù)以作出群體的選擇,這方面的研究源于Condorcet投票悖論的提出,從20世紀(jì)50年代開始經(jīng)過(guò)Arrow、Sen、Gibbard和Satterthwaite等人的進(jìn)一步發(fā)展,已形成完整的理論體系,通過(guò)對(duì)理性社會(huì)選擇本質(zhì)的剖析,促進(jìn)了人們對(duì)選舉、立法以及政治機(jī)構(gòu)運(yùn)作等問(wèn)題的理解。
在管理科學(xué)領(lǐng)域,對(duì)群體決策的研究主要強(qiáng)調(diào)如何通過(guò)對(duì)群體成員以不同形式表達(dá)的偏好的集結(jié),使得群體成員就最終決策達(dá)成某種程度上的一致,而一致性則意味著“正確性”,這方面最具代表性的是社會(huì)決策圖式理論。
在社會(huì)心理學(xué)領(lǐng)域?qū)θ后w決策的研究主要采用實(shí)驗(yàn)性方法,通過(guò)對(duì)群體成員之間交互過(guò)程的分析研究群體決策的信息集結(jié)有效性,一般假定群體成員具有共同的目標(biāo),很少考慮決策過(guò)程中的策略,心理學(xué)研究的主要成果是對(duì)群體思維和群體極化現(xiàn)象的分析。
近年來(lái)國(guó)外出現(xiàn)了不少用博弈論作為理論工具研究群體決策信息集結(jié)問(wèn)題的文獻(xiàn),這些文獻(xiàn)主要發(fā)表于經(jīng)濟(jì)學(xué)、政治學(xué)與政治經(jīng)濟(jì)學(xué)期刊,通過(guò)對(duì)群體決策過(guò)程中群體成員的動(dòng)機(jī)和理的分析,給出了一些與人們的直覺完全相反的結(jié)論。筆者將對(duì)此領(lǐng)域的研究進(jìn)展從決策信息的獲取、審議過(guò)程中信息的披 露、透明性的影響與最優(yōu)決策規(guī)則四個(gè)方面進(jìn)行評(píng)述。需要說(shuō)明的是,這四個(gè)方面緊密關(guān)聯(lián),特別是決策群體成員的信息披露動(dòng)機(jī)直接受到?jīng)Q策過(guò)程對(duì)公眾是否透明以及最終的投票表決規(guī)則的影響,而群體成員的信息獲取動(dòng)機(jī)則部分地取決于信息披露動(dòng)機(jī),但由于利用博弈論分析群體決策問(wèn)題的復(fù)雜性,現(xiàn)有的文獻(xiàn)主要還是相對(duì)集中于其中的一兩個(gè)方面。
文[1]是注意到此領(lǐng)域較早的綜述性文章,該文發(fā)表于1999年,討論了當(dāng)時(shí)出現(xiàn)不久的研究政治機(jī)構(gòu)信息集結(jié)作用的文獻(xiàn),其中對(duì)最先考慮策略性投票表決行為的文[2-5]等進(jìn)行了簡(jiǎn)要介紹。同年9月份,《美國(guó)國(guó)家科學(xué)院院刊》發(fā)文評(píng)述了研究選舉的信息集結(jié)作用及因投票者私有信息的不準(zhǔn)確而導(dǎo)致的策略性投票表決行為的成果[6],其中提及的部分研究工作尚處于未發(fā)表狀態(tài)。文[7]對(duì)研究貨幣政策委員會(huì)決策過(guò)程中的動(dòng)機(jī)問(wèn)題的文獻(xiàn)進(jìn)行了系統(tǒng)討論。文[8]總結(jié)了貨幣政策委員會(huì)決策機(jī)制設(shè)計(jì)應(yīng)該考慮的各種因素,對(duì)與群體決策相關(guān)的經(jīng)濟(jì)學(xué)與社會(huì)心理學(xué)理論與實(shí)驗(yàn)分析文獻(xiàn)進(jìn)行了評(píng)述,其中討論了信息集結(jié)問(wèn)題。應(yīng)該說(shuō)文[9]是目前評(píng)述基于博弈論的群體決策信息集結(jié)研究文獻(xiàn)較為全面和細(xì)致的文章,該文從策略性投票、信息獲取、利益沖突和交流四個(gè)方面進(jìn)行了詳細(xì)評(píng)述,并討論了此領(lǐng)域的研究成果對(duì)貨幣政策委員會(huì)決策機(jī)制設(shè)計(jì)的參考價(jià)值。
本研究與文[9]的差別在于:第一,文[9]的討論基本上局限于基于博弈論的群體決策信息集結(jié)研究本身,而筆者從研究方法、研究對(duì)象與研究成果等方面將基于博弈論的群體決策信息集結(jié)研究與經(jīng)濟(jì)學(xué)、政治學(xué)、管理學(xué)以及社會(huì)心理學(xué)領(lǐng)域?qū)θ后w決策的傳統(tǒng)主流研究進(jìn)行了對(duì)比,分析了博弈論作為理論工具研究群體決策信息集結(jié)問(wèn)題的優(yōu)缺點(diǎn),并深入探討了現(xiàn)有研究工作存在的不足之處,也即指出了此領(lǐng)域可能的研究方向,因此,筆者的深度與廣度有所超越。第二,文[9]對(duì)此領(lǐng)域研究成果的評(píng)述思路稍顯混亂,文獻(xiàn)分類較不合理。第三,筆者特別關(guān)注了研究決策過(guò)程的透明性對(duì)群體成員信息獲取與信息披露動(dòng)機(jī)以及投票表決行為的影響的文獻(xiàn),而文[9]對(duì)此幾乎沒有涉及。第四,文[9]發(fā)表后此領(lǐng)域出現(xiàn)了不少具有重要參考價(jià)值的文獻(xiàn),筆者對(duì)這些最新的文獻(xiàn)給予了較為詳細(xì)的評(píng)述。
二、決策信息的獲取
(一) Condorcet陪審團(tuán)定理與搭便車問(wèn)題
與決策問(wèn)題相關(guān)的各類信息一般以分散的、局部的形式存在于社會(huì)系統(tǒng),群體決策的意義之一,是可能更充分地利用這些信息,因而更有可能作出正確的決策。不考慮其他因素,僅從信息集結(jié)的角度看,讓更多擁有信息的個(gè)體參與決策可以改善決策質(zhì)量,這種觀點(diǎn)符合人們的直覺,其形式化證明出自18世紀(jì)Condorcet給出的陪審團(tuán)定理。該定理認(rèn)為:群體決策可以有效集結(jié)信息,在多數(shù)決定規(guī)則下,增加群體成員數(shù)量可以增加作出正確決策的概率,并且隨著成員數(shù)量趨于無(wú)窮,作出正確決策的概率趨于1。
Condorcet陪審團(tuán)定理及其后來(lái)的很多拓展往往都有個(gè)潛在的假設(shè):群體決策者所掌握的與決策問(wèn)題相關(guān)的信息是事前外部給定的,或是以零成本獲得的[9]。但對(duì)于許多現(xiàn)實(shí)決策情形,信息并不是不需要投入成本和努力就能輕易得到的,如審稿專家需要付出一定的時(shí)間和精力才能決定稿件是否符合錄用標(biāo)準(zhǔn),因此決策者必須決定是否付出以及付出多少代價(jià)以獲取信息。而在群體決策中,與決策問(wèn)題相關(guān)的信息是公共物品,因而存在典型的所謂社會(huì)惰化(social loafing)現(xiàn)象或搭便車問(wèn)題(freerider problem)。
文[10]對(duì)陪審團(tuán)決策中的信息獲取問(wèn)題進(jìn)行了研究,認(rèn)為陪審員的信息準(zhǔn)確程度取決于陪審團(tuán)的大小,更大的陪審團(tuán)的陪審員具有更少的動(dòng)機(jī)認(rèn)真聽取審判過(guò)程,所以更大的陪審團(tuán)作出正確判決的概率可能更小,從而導(dǎo)致陪審團(tuán)定理不再成立。文[11-17]進(jìn)一步研究了群體決策中的理性無(wú)知(rational ignorance)問(wèn)題,對(duì)仍能有效集結(jié)信息時(shí)信息獲取成本或成本函數(shù)需要滿足的條件進(jìn)行了分析,這些文獻(xiàn)針對(duì)多數(shù)決定規(guī)則,假定所有群體成員具有完全相同的決策偏好。其中文[11,13-15]證明,當(dāng)全體或部分群體成員的信息獲取成本函數(shù)在獲取零信息處的二階導(dǎo)數(shù)為零,則Condorcet陪審團(tuán)定理仍然有效。
另外,文[18]通過(guò)一個(gè)僅有兩個(gè)成員的群體決策模型,指出群體成員間的交流可能會(huì)惡化信息獲取中的搭便車問(wèn)題。在該文中,決策成員首先收集關(guān)于一項(xiàng)工程實(shí)施后果的信息,然后相互交流,再投票表決是否實(shí)施該項(xiàng)工程。文章指出,如果交流的作用僅限于信息集結(jié),則交流可能會(huì)減少作出正確決策的概率,特別是當(dāng)高質(zhì)量的信息很容易獲得時(shí),交流會(huì)減少?zèng)Q策成員收集信息的動(dòng)機(jī),加劇信息收集中的搭便車問(wèn)題,但當(dāng)信息收集需要付出高昂的代價(jià)時(shí),更多的交流通常會(huì)增加作出正確決策的概率。
(二)搭便車問(wèn)題避免措施
因?yàn)樾畔@取活動(dòng)一般是不可觀測(cè)的,搭便車者可以通過(guò)提供一個(gè)虛假的信息假裝已經(jīng)給予了足夠的投入,所以無(wú)法通過(guò)有效的懲罰措施以阻止搭便車問(wèn)題,只能夠從決策群體的成員組成和決策規(guī)則等方面考慮避免該問(wèn)題的發(fā)生。
文[19-20]的研究結(jié)論從決策群體人員組成方面為避免信息獲取中的搭便車問(wèn)題提供了理論參考,指出具有極端偏好的成員相對(duì)來(lái)說(shuō)更具有收集高成本信息的動(dòng)機(jī),但這兩篇文獻(xiàn)的研究?jī)?nèi)容不屬于嚴(yán)格意義上的群體決策,因?yàn)槠渲械奈瘑T會(huì)成員僅負(fù)責(zé)收集與報(bào)告信息,自身并沒有決策權(quán)。在文[19]中,委員會(huì)成員在信息收集之前相互間沒有偏好差異,在投入不可觀測(cè)的努力收集信息后形成各自不同的政策偏好,該文證明最優(yōu)的委員會(huì)規(guī)模和總的社會(huì)剩余有時(shí)會(huì)隨委員會(huì)成員偏好差異期望值的增大而增大,因?yàn)轭A(yù)期的偏好差異為成員提供了收集信息的動(dòng)機(jī)。文[20]指出,如果信息收集的成本較低,委員會(huì)成員的偏好應(yīng)該與決策者的偏好類似,這是因?yàn)橐环矫媾c決策者偏好類似的成員會(huì)收集決策者想要的信息,另一方面由于偏好類似所以在報(bào)告時(shí)不會(huì)產(chǎn)生信息的扭曲問(wèn)題;如果信息收集的成本較高,則委員會(huì)應(yīng)該由具有極端偏好的成員組成,只有這些成員才具有足夠強(qiáng)烈的動(dòng)機(jī)付出代價(jià)收集信息,但因?yàn)樾湃螁?wèn)題,他們往往只會(huì)收集硬信息,即客觀上可驗(yàn)證的信息。對(duì)于在投票表決前需要對(duì)決策選項(xiàng)進(jìn)行審議的群體決策來(lái)說(shuō),文[20]的研究結(jié)論尤其具有參考價(jià)值。
從群體決策機(jī)制設(shè)計(jì)的角度看,如果存在信息獲取問(wèn)題,則機(jī)制設(shè)計(jì)者必須既要考慮如何提供充分的激勵(lì)促使群體成員獲取信息,又要考慮如何有效集結(jié)成員所獲得的信息,以最大化群體決策的期望效用。
文[21]證明,采用適當(dāng)保守的決策規(guī)則可以促進(jìn)群體成員收集證據(jù),從而改善決策質(zhì)量。文[22-23]對(duì)存在信息獲取時(shí)的群體決策最優(yōu)規(guī)則與最優(yōu)群體成員數(shù)量進(jìn)行了研究。文[22]指出,盡管一致性規(guī)則使每個(gè)群體成員的投票選擇對(duì)最終結(jié)果都具有決定性影響力,但一致性規(guī)則并不能為獲取信息提供適當(dāng)?shù)募?lì),而且一致性規(guī)則特別不適合于信息較不準(zhǔn)確的情形,也即更需要群體決策的情形,在只考慮單調(diào)純策略均衡的條件下,除非群體成員的信息足夠準(zhǔn)確,否則一致性規(guī)則或接近于一致性規(guī)則的規(guī)則不可能最優(yōu)。文[23]認(rèn)為,為了提供足夠的信息獲取激勵(lì),對(duì)于相當(dāng)普遍的決策情形,事前最優(yōu)的決策機(jī)制事后可能是非最優(yōu)的,即不必然利用了所有群體成員獲取的信息導(dǎo)致從統(tǒng)計(jì)學(xué)角度有最優(yōu)的信息集結(jié),該事前最優(yōu)的決策機(jī)制是在激勵(lì)成員獲取信息與最大程度提取成員信息之間折中的產(chǎn)物。需要指出的是,文[21-23]均假定決策群體成員具有相同的偏好。
三、審議過(guò)程中信息的披露
決策群體,尤其是規(guī)模較小的群體,一般會(huì)在投票表決前對(duì)決策選項(xiàng)進(jìn)行審議,交流各自的私有信息。信息的共享能引起成員信念的收斂。但群體成員通常代表著不同的利益集體,具有不同的利益追求或偏好,因而具有操縱或隱藏私有信息的動(dòng)機(jī),從而限制了信息共享的可能性,成員間策略性的信息操縱與反操縱甚至導(dǎo)致比純粹偏好沖突更大程度上的意見不一致。
絕大多數(shù)群體決策文獻(xiàn)對(duì)審議(deliberation)、交流(communication)、辯論(debate)、廉價(jià)磋商(cheap talk)等類似表述用語(yǔ)沒有進(jìn)行明確的區(qū)分,雖然這些用語(yǔ)在不同場(chǎng)合有一些微妙甚至較大的差異,如文[24]認(rèn)為審議是辯論的子集。
研究審議對(duì)群體決策的影響的文獻(xiàn)一般將決策過(guò)程建模為兩階段博弈:先審議后正式投票表決,通過(guò)對(duì)貝葉斯Nash均衡策略和均衡存在條件的分析,研究審議是否以及如何對(duì)群體決策發(fā)生作用。這類文獻(xiàn)一般假定無(wú)論是以公共利益還是以私人利益作為評(píng)判標(biāo)準(zhǔn),好的決策選擇總是部分取決于世界的真實(shí)狀態(tài),而世界的真實(shí)狀態(tài)對(duì)決策群體成員來(lái)說(shuō)無(wú)法確切知道,他們僅不對(duì)稱地掌握了有關(guān)世界真實(shí)狀態(tài)的部分信息。在正式投票表決之前的審議過(guò)程可以使群體成員有機(jī)會(huì)告訴其他成員他們所掌握的私有信息,然后,根據(jù)各自已掌握的關(guān)于世界真實(shí)狀態(tài)的部分信息,群體成員形成自己對(duì)世界真實(shí)狀態(tài)的判斷,進(jìn)而根據(jù)自己的評(píng)判標(biāo)準(zhǔn)形成各自的決策選擇偏好,如果他們的決策選擇偏好不一致,就有可能在審議的過(guò)程中不披露自己的真實(shí)信息,或提供虛假的信息以誘導(dǎo)其他成員作出對(duì)自己有利的決策選擇。因此,此類文獻(xiàn)注重從信息集結(jié)角度對(duì)完全信息披露均衡和完全信息集結(jié)均衡的分析。
Coughlan在文[25]中認(rèn)為,當(dāng)所有群體成員的決策偏好完全相同或足夠接近,在審議過(guò)程中每個(gè)成員都具有真實(shí)披露私有信息的動(dòng)機(jī)。文[26]則進(jìn)一步證明,只要群體成員主觀上認(rèn)為多數(shù)成員與他擁有共同偏好具有較大的可能性,客觀上的偏好差異不會(huì)影響信息的真實(shí)共享。然而,該文同時(shí)指出,審議并不總是能有效集結(jié)信息,特別是當(dāng)群體成員沒有較強(qiáng)的先驗(yàn)信念認(rèn)為自己的價(jià)值取向就是群體主流的價(jià)值取向時(shí),可能出現(xiàn)有意的相互欺騙。需要說(shuō)明的是,在文[26]給出的模型中,所有群體成員的偏好或者完全相同,或者完全相反,與此相符的現(xiàn)實(shí)群體決策情形很少,甚至幾乎沒有。文[24,27-28]證明一致性規(guī)則在很多情況下為群體成員在審議過(guò)程中策略性地隱藏信息提供了動(dòng)機(jī),多數(shù)決定規(guī)則比一致性規(guī)則能引導(dǎo)出更多的信息共享。文[28]還證明,在相當(dāng)一般的條件下,審議使得除一致性規(guī)則以外的所有其他規(guī)則具有相同的序貫均衡集合,也即審議使得所有的無(wú)否決權(quán)規(guī)則在序貫均衡方面等價(jià),從而說(shuō)明如果群體成員在投票表決前有向所有成員公開宣布各自私有信息的機(jī)會(huì),那么采用除一致性規(guī)則以外的其他任何決策規(guī)則,都會(huì)產(chǎn)生相同的決策結(jié)果。文[29]對(duì)陪審團(tuán)在審議階段信息的披露進(jìn)行了實(shí)驗(yàn)研究,以無(wú)約束力的意向性投票形式實(shí)現(xiàn)信息的交流,實(shí)驗(yàn)結(jié)果與理論分析基本近似。
另外,文[30]給出了一個(gè)兩成員的交流與決策模型,兩個(gè)成員投票表決是否組成具有不確定回報(bào)的合伙關(guān)系,他們的偏好不一致且為私有信息。文章分析了均衡的特征,發(fā)現(xiàn)在均衡時(shí)僅有部分信息被傳遞,交流對(duì)于雙方的福利是有益的。
對(duì)于很多現(xiàn)實(shí)決策問(wèn)題,決策者可能擁有客觀上可驗(yàn)證的信息,即所謂硬信息(hard information)。文[31]對(duì)硬信息在具有偏好沖突的委員會(huì)中的交流進(jìn)行了研究,證明完全信息集結(jié)均衡在偏好為私有信息的情況下比在偏好為常識(shí)情況下更有可能存在,即允許更大程度上的偏好差異;另外該文證明,如果信息可驗(yàn)證,完全信息集結(jié)均衡的存在條件等同于完全信息披露均衡的存在條件。文[32]指出,在審議階段群體成員共享私有信息的動(dòng)機(jī)一定程度上取決于其私有信息的可驗(yàn)證性,如果決策成員能夠?yàn)樽约旱男畔⑻峁?yàn)證材料,則一致性規(guī)則比其他規(guī)則提供了更強(qiáng)的信息共享激勵(lì),更有可能實(shí)現(xiàn)完全信息共享。文章給出了在一致性規(guī)則下審議階段存在完全信息披露均衡的充分必要條件。
文[33]指出,盡管偏好與信息的差異可能使得部分成員在審議過(guò)程中具有錯(cuò)誤表達(dá)私有信息的動(dòng)機(jī),但給予群體成員適當(dāng)?shù)耐獠考?lì)能消除此類動(dòng)機(jī),促進(jìn)信息與偏好的完全集結(jié),而且隨著群體規(guī)模的擴(kuò)大,外部激勵(lì)的強(qiáng)度可以很小,外部激勵(lì)的具體措施包括對(duì)成員決策能力的肯定等。
四、透明性的影響
隨著社會(huì)的進(jìn)步,公眾對(duì)涉及自身利益的重要決策過(guò)程的透明性提出了越來(lái)越高的要求。透明的決策過(guò)程意味著公眾可以評(píng)價(jià)決策群體成員的偏好、能力與貢獻(xiàn),從而引起決策者對(duì)自身聲譽(yù)的關(guān)注,而對(duì)聲譽(yù)的關(guān)注既可能促進(jìn)信息的獲取和真實(shí)信息的披露,但也有可能導(dǎo)致信息傳遞與投票表決行為的扭曲。
在文[34]中,委員會(huì)成員在前一時(shí)期表現(xiàn)出的決策能力影響了他在后一時(shí)期能否獲得連任,而作為委員會(huì)成員可為其帶來(lái)一定的效用。該文證明公開個(gè)人投票記錄可以促進(jìn)委員會(huì)成員努力獲取信息。文[35]認(rèn)為,僅公布最終決策結(jié)果,不公開個(gè)人投票記錄,會(huì)誘導(dǎo)委員會(huì)成員按照現(xiàn)有偏見作出投票選擇,因此,委員會(huì)的決策傾向于保守化,向公眾公開成員的投票記錄則能夠減少現(xiàn)有偏見對(duì)決策的影響。該文同時(shí)認(rèn)為,群體決策機(jī)制的設(shè)計(jì)應(yīng)該不僅考慮決策過(guò)程的透明性,也要考慮決策規(guī)則的適當(dāng)性,如果決策規(guī)則選擇合適,則不透明的決策過(guò)程可能比透明的決策過(guò)程得到更好的決策結(jié)果。在文[34-35]所給出的模型中,都沒有考慮委員會(huì)成員在投票表決前可能會(huì)相互交流各自的私有信息。
在文[36]中,委員會(huì)代表公眾對(duì)一項(xiàng)新工程的實(shí)施與否進(jìn)行表決,委員會(huì)成員既關(guān)心工程的實(shí)際價(jià)值,又關(guān)心委員會(huì)在公眾中的聲譽(yù),如果維持現(xiàn)狀,不實(shí)施新工程,則暴露出委員會(huì)成員意見的不一致,從而給委員會(huì)的聲譽(yù)帶來(lái)負(fù)面影響,而公眾僅能注意到委員會(huì)的決策結(jié)果,事后不能觀測(cè)到工程的實(shí)際價(jià)值。該文證明,在審議階段,部分成員對(duì)聲譽(yù)的過(guò)分關(guān)注可能使他們不愿真實(shí)披露私有信息,而是夸大工程的價(jià)值,導(dǎo)致更容易采取實(shí)施新工程的決策。文[37]認(rèn)為,公開委員會(huì)的具體審議記錄可能會(huì)降低決策質(zhì)量。由于委員會(huì)成員關(guān)心公眾對(duì)其決策能力的判斷,使得他們?cè)谡綍?huì)議交流過(guò)程中可能隱藏內(nèi)部存在的意見分歧,公眾對(duì)于決策過(guò)程透明性的要求,可能導(dǎo)致委員會(huì)在正式會(huì)議之前組織秘密的非正式預(yù)備會(huì)議,將真正實(shí)質(zhì)性的討論從公開的正式會(huì)議階段轉(zhuǎn)移到秘密的預(yù)備會(huì)議階段,從而對(duì)公眾消除委員會(huì)內(nèi)部意見的不一致,而非正式的會(huì)議更具有不穩(wěn)定性,因此,透明性要求并不一定能增加社會(huì)福利。
在文[38-40]中,外部利益關(guān)聯(lián)者可以觀察到公開委員會(huì)每個(gè)成員的具體投票記錄和決策結(jié)果,但對(duì)于秘密委員會(huì)則只能看到最終決策結(jié)果,而委員會(huì)成員既關(guān)心決策結(jié)果又關(guān)心外部利益關(guān)聯(lián)者所給予的回報(bào)。文[38]和[39]認(rèn)為,不公布委員會(huì)成員的個(gè)人投票記錄可以減少外部利益關(guān)聯(lián)者對(duì)決策的影響,在某些情況下秘密委員會(huì)優(yōu)于公開委員會(huì)。文[39]還特別指出,由于隨著群體成員數(shù)量的增加,單個(gè)成員的投票對(duì)最終決策具有決定性影響的概率減小,對(duì)單個(gè)成員而言不誠(chéng)實(shí)投票的代價(jià)隨之減小,所以對(duì)于公開委員會(huì)來(lái)說(shuō),其成員更容易因外部利益關(guān)聯(lián)者承諾給予的回報(bào)而不誠(chéng)實(shí)投票,因此Condorcet陪審團(tuán)定理可能不再成立。在文[40]中,對(duì)于秘密委員會(huì),外部利益關(guān)聯(lián)者可以根據(jù)投票表決規(guī)則的閾值和最終決策結(jié)果對(duì)委員會(huì)成員的投票作出推斷。文章分析了秘密委員會(huì)的最優(yōu)決策規(guī)則,指出決策規(guī)則中增加選擇某一選項(xiàng)需要的投票比例可能會(huì)導(dǎo)致該選項(xiàng)更容易成為最終決策結(jié)果,傳統(tǒng)看法認(rèn)為降低決策規(guī)則的閾值可以防止委員會(huì)過(guò)于保守的看法未必正確,但對(duì)于公開委員會(huì)則不存在此問(wèn)題。文[41]雖然不是直接研究透明性,但其研究結(jié)論與此處內(nèi)容相關(guān),該文通過(guò)一個(gè)博弈模型,說(shuō)明在特定情況下,外部利益集團(tuán)可以不用付出任何代價(jià)就能操縱委員會(huì)的決策。
另外,不少文獻(xiàn)從理論與實(shí)證兩方面研究了決策過(guò)程的透明性對(duì)貨幣政策委員會(huì)決策的影響。文[7,42]對(duì)這方面的文獻(xiàn)進(jìn)行了綜述。文[42]區(qū)分了三種類型的透明性:決策目標(biāo)透明性;知識(shí)透明性,這里的知識(shí)指決策所依據(jù)的經(jīng)濟(jì)數(shù)據(jù)或經(jīng)濟(jì)模型等;操作透明性,包括委員會(huì)會(huì)議記錄與投票記錄的透明性以及決策結(jié)果的透明性等。該文評(píng)述的文獻(xiàn)有部分運(yùn)用了博弈理論作為分析工具。文[7]專門討論了貨幣政策委員會(huì)決策過(guò)程中的動(dòng)機(jī)問(wèn)題,指出貨幣政策委員會(huì)的最優(yōu)規(guī)模與透明性等仍有待進(jìn)一步研究。
類似于文[34],研究透明性對(duì)貨幣政策委員會(huì)決策信息集結(jié)有效性的影響的文獻(xiàn),一般認(rèn)為委員會(huì)成員希望得到社會(huì)公眾對(duì)其決策能力或決策偏好的正面評(píng)價(jià),從而獲得連任的機(jī)會(huì),如文[43]假設(shè)委員會(huì)成員希望公眾認(rèn)為他是通貨膨脹的強(qiáng)硬抵制者,而最近的文獻(xiàn)如文[44-46]等,則假設(shè)委員會(huì)成員希望公眾認(rèn)為他是具有較強(qiáng)決策能力者。文[44]認(rèn)為,公開審議過(guò)程的詳細(xì)記錄會(huì)使得貨幣政策委員會(huì)成員不愿意表達(dá)不同的意見,該文通過(guò)對(duì)美聯(lián)儲(chǔ)聯(lián)邦公開市場(chǎng)委員會(huì)在被要求公開會(huì)議記錄之前和之后的會(huì)議記錄的分析說(shuō)明了理論結(jié)果的有效性。文[45-46]分析了投票記錄的公開對(duì)委員會(huì)成員投票表決行為的影響,認(rèn)為投票記錄對(duì)公眾的透明帶來(lái)的負(fù)面效應(yīng)占主導(dǎo)地位,透明性不能增加社會(huì)福利。
五、最優(yōu)決策規(guī)則
顯而易見,不同的決策規(guī)則極大地影響了群體決策的信息集結(jié)效率,尤其是決策群體成員的偏好或能力不完全一致時(shí),決策規(guī)則更是直接影響了群體成員的投票選擇行為,進(jìn)而影響了決策結(jié)果的正確性。前述文獻(xiàn)大多不同程度地討論了決策規(guī)則的比較和選擇,除此以外,另有部分文獻(xiàn)對(duì)各種情況下的最優(yōu)決策規(guī)則進(jìn)行了研究。
文[47-48]從最大化期望效用的角度對(duì)固定規(guī)模的委員會(huì)形式集體決策的最優(yōu)決策規(guī)則進(jìn)行了分析,文[49-50]研究了在特定約束條件下的最優(yōu)決策規(guī)則。然而,這些早期的文獻(xiàn)都有個(gè)潛在的假設(shè):決策成員僅按照自身獲得的信息作出投票選擇。文[2,51]等指出,即使決策群體成員的偏好完全一致,也不能保證一定能夠如Condorcet陪審團(tuán)定理所預(yù)測(cè)的那樣有效集結(jié)各成員的信息,因?yàn)槿后w成員僅根據(jù)自身信息作出非策略性的選擇不符合理性要求,當(dāng)且僅當(dāng)所使用的決策規(guī)則為集結(jié)群體成員私有信息的最優(yōu)規(guī)則時(shí),所有群體成員僅按自身信息投票才是Nash均衡,而最優(yōu)決策規(guī)則則取決于特定的決策情形。
文[52]證明,當(dāng)采用文[48]所定義的最優(yōu)決策規(guī)則時(shí),所有成員僅按照自身獲得的信息投票表決形成Nash均衡,但僅按自身信息投票可能不是有效的,因?yàn)椴糠殖蓡T聯(lián)合決定策略性投票可以增加期望效用。文[53]討論了投票者對(duì)不同決策選項(xiàng)具有可用基數(shù)表示的效用時(shí)的誠(chéng)實(shí)投票問(wèn)題,試圖給出當(dāng)決策機(jī)制允許多種消息類型時(shí)誠(chéng)實(shí)投票的準(zhǔn)確定義。為使投票者具有誠(chéng)實(shí)投票的動(dòng)機(jī),文[54]提出了一種在隨機(jī)選擇的投票表決集合上運(yùn)用多數(shù)決定規(guī)則得到最終決策的方法,在對(duì)所有投票者的表決結(jié)果運(yùn)用多數(shù)決定規(guī)則和僅對(duì)投票表決結(jié)果的隨機(jī)抽樣子集運(yùn)用多數(shù)決定規(guī)則之間進(jìn)行隨機(jī)選擇,可以激勵(lì)投票者誠(chéng)實(shí)投票,從而得到Condorcet陪審團(tuán)定理的有效性收斂結(jié)果。
文[55]基于陪審員的私有信息和策略性表決行為構(gòu)建了一個(gè)陪審團(tuán)決策模型,證明一致同意規(guī)則可能會(huì)導(dǎo)致無(wú)辜被告得到有罪判決和有罪被告得到無(wú)罪判決這兩種錯(cuò)誤的概率都增加。文[56]分析了決策群體所投票表決的決策選項(xiàng)不獨(dú)立于投票表決規(guī)則的情形:給定決策群體的投票表決規(guī)則,提案者向決策群體提出一個(gè)要么完全接受要么完全拒絕的議案,群體投票表決是接受還是拒絕該議案。該文證明由于一致同意規(guī)則能促使提案者提出更有吸引力的議案,所以增加了決策群體的期望效用,在某些情況下,一致同意規(guī)則甚至是Pareto最優(yōu)的表決規(guī)則,因?yàn)樗苍黾恿颂岚刚叩钠谕в?,即使提案者與決策群體的利益追求可能完全相反。總結(jié)考慮一致性規(guī)則的文獻(xiàn)[22,24,27,28,32,55,56],可見博弈分析得到的結(jié)論往往與人們直觀上的認(rèn)識(shí)截然相反,一致性規(guī)則是不是合適的決策規(guī)則完全取決于特定的決策情形。
既然投票表決規(guī)則直接影響了投票者的投票選擇行為,那么,對(duì)于群體決策機(jī)制的設(shè)計(jì)者來(lái)說(shuō),他在選擇投票表決規(guī)則時(shí)是否需要考慮投票者在各種表決規(guī)則下的投票行為,換言之,機(jī)制設(shè)計(jì)者關(guān)于投票者在各種規(guī)則下的博弈行為的信念是否會(huì)影響到最優(yōu)決策規(guī)則的選擇。文[57-58]對(duì)此問(wèn)題進(jìn)行了研究,其中假設(shè)群體成員的決策偏好完全一致。文[57]分析了決策成員的能力存在差異且這種差異是常識(shí)的情況下的投票表決規(guī)則,指出最優(yōu)的匿名單調(diào)投票規(guī)則并不取決于成員是否按照自身信息投票或策略性投票。類似于文[57]的結(jié)論,文[58]認(rèn)為,決策機(jī)制設(shè)計(jì)者對(duì)最優(yōu)投票表決規(guī)則的選擇與機(jī)制設(shè)計(jì)者關(guān)于投票者在不同表決規(guī)則下的投票行為的信念無(wú)關(guān),在該文中,機(jī)制設(shè)計(jì)者為決策群體選擇投票表決規(guī)則,其目的是為了最大化決策群體的期望福利,文章證明,僅從信息集結(jié)的角度看,關(guān)于投票者在各種表決規(guī)則下的投票行為的不同假設(shè)對(duì)于最優(yōu)決策規(guī)則的選擇來(lái)說(shuō),結(jié)論是一樣的,不同的行為假設(shè)導(dǎo)致相同的結(jié)論。對(duì)于具有相同偏好的決策群體來(lái)說(shuō),文[57-58]的研究結(jié)論大大簡(jiǎn)化了決策規(guī)則的選擇。
現(xiàn)實(shí)中的決策群體往往存在具有極端偏好的成員,這些成員的存在為信息的有效集結(jié)帶來(lái)較大的困難。文[59]對(duì)存在極端偏好者和中立者的群體面對(duì)二分決策問(wèn)題時(shí)的最優(yōu)決策規(guī)則進(jìn)行了研究,考慮了決策成員之間存在轉(zhuǎn)移支付的情況,指出最優(yōu)投票表決規(guī)則相對(duì)于轉(zhuǎn)移支付可能性的大小來(lái)說(shuō)是非單調(diào)的。文[60]對(duì)由兩類具有完全相反的偏好的成員所組成的委員會(huì)決策進(jìn)行了分析,對(duì)比了一致性規(guī)則與非一致性規(guī)則的信息集結(jié)效率。文[61]給出了一個(gè)現(xiàn)實(shí)中較難接受的非單調(diào)性決策規(guī)則――超多數(shù)懲罰(supermajority penalty)規(guī)則,當(dāng)選擇某一選項(xiàng)的投票過(guò)多時(shí),將該選項(xiàng)作為群體決策最終結(jié)果的概率反而會(huì)下降,該文證明,當(dāng)對(duì)于每個(gè)選項(xiàng)都存在極端偏好者時(shí),超多數(shù)懲罰規(guī)則是最優(yōu)匿名激勵(lì)相容規(guī)則。
前述文獻(xiàn)都假定群體成員的偏好相互獨(dú)立,而文[62]對(duì)群體成員具有相互關(guān)聯(lián)但不完全相同的偏好的情況進(jìn)行了分析,其中的決策選擇空間是連續(xù)的,該文分別討論了采用平均規(guī)則與中值規(guī)則時(shí)所對(duì)應(yīng)博弈的對(duì)稱貝葉斯Nash均衡的存在性問(wèn)題,并比較了這兩種規(guī)則在不同偏好關(guān)聯(lián)程度下的性能。
由于從眾心理,群體成員經(jīng)常會(huì)根據(jù)對(duì)其他成員行為的觀察相應(yīng)調(diào)整自己的行為。文[63-64]對(duì)從眾心理對(duì)群體決策的影響進(jìn)行了研究,其中假定群體成員一方面希望選出好的決策選項(xiàng),另一方面又希望自己成為勝出的一方。文[63]分析了群體規(guī)模較大時(shí)同時(shí)投票機(jī)制與順序投票機(jī)制的均衡特征和信息集結(jié)質(zhì)量,文[64]指出這種從眾心理導(dǎo)致同時(shí)存在多個(gè)均衡,而且對(duì)于這些均衡中的多數(shù),信息不能被有效集結(jié)。文[64]從某種程度上說(shuō)明了最優(yōu)決策規(guī)則設(shè)計(jì)的困難。
六、現(xiàn)有研究工作的不足之處
其一,社會(huì)選擇理論與公共選擇理論以及管理學(xué)領(lǐng)域?qū)θ后w決策的研究,主要考慮偏好集結(jié)的有效性,而其中的偏好則是指對(duì)決策選項(xiàng)的偏好,這種偏好取決于決策者對(duì)最終結(jié)果的更根本意義上的偏好和對(duì)世界真實(shí)狀態(tài)的信念。在現(xiàn)實(shí)社會(huì)中,純粹以偏好的有效集結(jié)為終極目標(biāo)的重要群體決策問(wèn)題幾乎不存在,例如社會(huì)選擇理論與公共選擇理論最重要的應(yīng)用領(lǐng)域――選舉,既是偏好集結(jié)(這里指更根本意義上的偏好),更是信息集結(jié)。僅考慮偏好的集結(jié)問(wèn)題,不考慮偏好的形成過(guò)程以及信息在偏好形成過(guò)程中的潛在作用,無(wú)法分析群體內(nèi)外部交流與互動(dòng)等對(duì)決策的影響,無(wú)法解釋現(xiàn)實(shí)中的很多現(xiàn)象,因而對(duì)相關(guān)決策機(jī)制設(shè)計(jì)的指導(dǎo)作用較為有限。
其二,社會(huì)心理學(xué)從認(rèn)知的角度研究群體決策,其結(jié)論出自于對(duì)實(shí)驗(yàn)和經(jīng)驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)學(xué)分析,易于為人們接受。但由于從實(shí)驗(yàn)或經(jīng)驗(yàn)數(shù)據(jù)中利用統(tǒng)計(jì)學(xué)方法推導(dǎo)出群體的偏好分布參數(shù)極為困難,所以無(wú)法深入研究群體決策過(guò)程中因偏好不一致而導(dǎo)致的隱藏與扭曲私有信息等策略。
其三,與社會(huì)選擇理論和公共選擇理論一樣,用博弈論研究群體決策信息集結(jié)問(wèn)題的文獻(xiàn)也是以理性選擇假設(shè)作為判斷與決策的微觀基礎(chǔ)。盡管所有群體成員嚴(yán)格按照貝葉斯規(guī)則更新自己的信念等完全理性假設(shè)對(duì)于心理學(xué)家和普通人來(lái)說(shuō)都是難以接受的,但博弈論文獻(xiàn)還是以其數(shù)學(xué)分析的簡(jiǎn)潔與嚴(yán)謹(jǐn)顛覆了很多直覺上的認(rèn)識(shí),通過(guò)對(duì)群體決策者動(dòng)機(jī)的分析,有助于我們理解決策機(jī)制的哪些方面可能會(huì)引起不利于決策目標(biāo)實(shí)現(xiàn)的策略,進(jìn)而有助于決策機(jī)制的改進(jìn)。隨著群體成員偏好差異程度和決策問(wèn)題重要程度的增加,審議方式和決策規(guī)則趨向于書面化和正規(guī)化,群體思維與群體極化現(xiàn)象將很少出現(xiàn),決策結(jié)果也將更接近于博弈分析的預(yù)測(cè)。
目前對(duì)群體決策信息集結(jié)問(wèn)題的研究尚處于起步階段,還有很多不完善之處,在某些方面甚至存在根本性的缺陷。
第一,可能是受到信息經(jīng)濟(jì)學(xué)研究的誤導(dǎo),本領(lǐng)域的很多理論與實(shí)驗(yàn)分析文獻(xiàn),包括一些奠基性的文獻(xiàn),混淆了信息與在信息基礎(chǔ)上形成的判斷。真實(shí)信息的披露不會(huì)引起其他群體成員以及公眾對(duì)自己決策能力的負(fù)面評(píng)價(jià),更不會(huì)如判斷的披露那樣引起認(rèn)知上的從眾,如果決策者掌握了確鑿可靠的信息,則其不會(huì)因?yàn)槠渌嘶谄渌畔a(chǎn)生的不同看法而輕易改變自己的信念。
除個(gè)別文獻(xiàn)外,現(xiàn)有研究群體決策信息集結(jié)問(wèn)題的文獻(xiàn)幾乎都是將審議完全等同于信息經(jīng)濟(jì)學(xué)領(lǐng)域的廉價(jià)磋商,將交流限制為每個(gè)群體成員同時(shí)向所有其他成員發(fā)送一輪公開的消息。在現(xiàn)實(shí)群體決策過(guò)程中,審議至少包括對(duì)各方面提供的信息的真實(shí)性的審議,以及對(duì)信息與世界真實(shí)狀態(tài)之間的邏輯關(guān)聯(lián)(即潛在的決策模型)的審議。因此,將審議建模為完全的廉價(jià)磋商的現(xiàn)實(shí)意義極為有限,對(duì)于偏好差異較大的群體更是如此。
第二,客觀上難以驗(yàn)證的信息的可接受性,取決于接收者對(duì)于信息發(fā)送者的偏好的信念,例如,人們有充分的理由懷疑壟斷企業(yè)單方面提供的企業(yè)運(yùn)營(yíng)成本數(shù)據(jù)的真實(shí)性。另一方面,在很多情況下,信息的軟硬程度(可驗(yàn)證程度)與信息獲取者和信息接收者的成本投入相關(guān)。因此,群體成員獲取可驗(yàn)證信息與不可驗(yàn)證信息的動(dòng)機(jī),以及群體成員對(duì)信息軟硬程度的投入,既取決于是否有審議階段以及審議方式和決策規(guī)則,也取決于群體成員的偏好和群體成員關(guān)于群體偏好差異程度的先驗(yàn)信念。諸如此類問(wèn)題現(xiàn)有文獻(xiàn)幾乎沒有涉及。
群體決策在現(xiàn)代社會(huì)無(wú)處不在,如政府部門對(duì)重大戰(zhàn)略性問(wèn)題的決策、公司董事會(huì)對(duì)重要項(xiàng)目投資與實(shí)施問(wèn)題的決策、審判委員會(huì)對(duì)犯罪嫌疑人的判決、專家對(duì)科學(xué)基金項(xiàng)目申請(qǐng)書的評(píng)審等。從組織或社會(huì)的目標(biāo)出發(fā),針對(duì)特定的決策問(wèn)題,為了盡可能作出正確的決策,應(yīng)該如何組成決策群體,選擇何種決策規(guī)則?此類群體決策的科學(xué)化與民主化問(wèn)題很久以來(lái)一直是管理、政治、法律和經(jīng)濟(jì)等領(lǐng)域討論的中心,其研究結(jié)果對(duì)于各類政治、社會(huì)、經(jīng)濟(jì)組織的運(yùn)行機(jī)制設(shè)計(jì)具有重要的意義。
中國(guó)學(xué)者對(duì)群體決策的理論與方法進(jìn)行了大量的研究,提出了不少新的概念和方法,作出了很多重要貢獻(xiàn),國(guó)家自然科學(xué)基金委員會(huì)對(duì)群體決策理論與方法研究也較為重視,曾將其列為優(yōu)先資助領(lǐng)域。但根據(jù)現(xiàn)有的各類文獻(xiàn)和歷年的基金項(xiàng)目研究摘要,總體感覺國(guó)內(nèi)對(duì)決策群體成員的動(dòng)機(jī)和理考慮較少,到目前為止還沒有發(fā)現(xiàn)國(guó)內(nèi)其他學(xué)者利用博弈論研究群體決策信息集結(jié)問(wèn)題。
筆者試圖利用不完全信息博弈論和機(jī)制設(shè)計(jì)理論,研究決策群體成員的策略性信息獲取、信息傳遞和投票表決行為,揭示決策群體人員組成、審議方式、決策規(guī)則、透明性等決策機(jī)制的各個(gè)方面對(duì)群體決策的信息集結(jié)有效性的具體影響。并試圖從信息集結(jié)角度,為一些典型公共決策情形優(yōu)化決策機(jī)制。
參考文獻(xiàn):
[1] PIKETTY T. The informationaggregation approach to political institutions[J]. European Economic Review, 1999, 43(4-6):791-800.
[2] AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem[J]. American Political Science Review, 1996, 90(1):34-45.
[3] FEDDERSEN T, PESENDORFER W. The swing voter’s curse[J]. American Economic Review, 1996, 86(3):408-424.
[4] FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information[J]. Econometrica, 1997, 65(9):1029-1058.
[5] MYERSON R. Extended Poisson games and the Condorcet jury theorem[J]. Games and Economic Behavior, 1998, 25(1):111-131.
[6] FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.
[7] FUJIKI H. The monetary policy committee and the incentive problem: A selective survey[J]. Monetary and Economic Studies, 2005, 23(S1):37-82.
[8] VANDENBUSSCHE J. Elements of optimal monetary policy committee design[EB/OL]. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.
[9] GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey[J]. European Journal of Political Economy, 2005, 21(3):563-597.
[10] Mukhopadhaya K. Jury Size and the Free Rider Problem[J]. The Journal of Law, Economics, and Organization, 2003, 19:24-44.
[11] MARTINELLI C. Would rational voters acquire costly information?[J]. Journal of Economic Theory, 2006, 129(1):225-251.
[12] MARTINELLI C. Rational ignorance and voting behavior[J]. International Journal of Game Theory, 2007, 35(3):315-335.
[13] KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition[EB/OL]. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.
[14] KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions[J]. Economics Bulletin, 2006, 4(25):1-8.
[15] KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance[J]. Journal of Public Economic Theory, 2008, 10(2):281-300.
[16] BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem[J]. Economics Bulletin, 2006, 4(3):1-12.
[17] TRIOSSI M. Costly information acquisition. Better to toss a coin?[EB/OL]. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.
[18] SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making[EB/OL]. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.
[19] CAI H. Costly participation and heterogeneous preferences in informational committees[J]. The RAND Journal of Economics. 2009, 40(1):173-189.
[20] BENIERS K, SWANK O. On the composition of committees[J]. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.
[21] LI H. A theory of conservatism[J]. Journal of Political Economy, 2001, 109(3):617-636.
[22] NICOLA P. Committee design with endogenous information[J]. Review of Economic Studies, 2004, 71(1):165-191.
[23] GERARDI D, YARIV L. Information acquisition in committees[J]. Games and Economic Behavior, 2008, 62(2):436-459.
[24] AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules[M]//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.
[25] COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting[J]. American Political Science Review, 2000, 94(2): 375-393.
[26] MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values[J]. Journal of Theoretical Politics, 2007, 19(3): 301-327.
[27] AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules[J]. American Political Science Review, 2006, 100: 209-217.
[28] GERARDI D, YARIV L. Deliberative voting[J]. Journal of Economic Theory, 2007, 134(1): 317-338.
[29] GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules[J]. American Political Science Review, 2000, 94: 407-423.
[30] DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information[J]. Contributions to Theoretical Economics, 2003, 3(1), Article 6.
[31] SCHULTE E. Information aggregation and preference heterogeneity in committees[J]. Theory and Decision, 2010, 69(1):97118.
[32] MATHIS J. Deliberation with partially verifiable information[EB/OL]. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.
[33] MEIROWITZ A. Designing institutions to aggregate preferences and information[J]. Quarterly Journal of Political Science, 2006, 1(4): 373-392.
[34] GERSBACH H, HAHN V. Information acquisition and transparency in committees[EB/OL]. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.
[35] LEVY G. Decision making in committees: Transparency, reputation and voting rules[J]. American Economic Review, 2007, 97(1):150-168.
[36] VISSER B, SWANK O. On committees of experts[J]. The Quarterly Journal of Economics. 2007, 122(1):337-372.
[37] SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals[EB/OL]. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.
[38] SEIDMANN D. A Theory of voting patterns and performance in private and public committees[EB/OL]. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.
[39] FELGENHAUER M, GRUNER H. Committees and special interests[J]. Journal of Public Economic Theory, 2008, 10(2): 219-243.
[40] SEIDMANN D. Optimal quotas in private committees[J]. The Economic Journal, 2008, 118(525):16-36.
[41] DAL B E. Bribing voters[J]. American Journal of Political Science, 2007, 51(4):789-803.
[42] HAHN V. Transparency in monetary policy: A survey[J]. IFO Studien, 2002, 48(3):429-455.
[43] SIBERT A. Monetary policy committees: Individual and collective reputations[J]. The Review of Economic Studies, 2003, 70(3):649-665.
[44] MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve[J]. The Economic Journal, 2008, 118(528):695-717.
[45] HAHN V. Committees, sequential voting and transparency[J]. Mathematical Social Sciences, 2008, 56(3):366-385.
[46] HANS G, HAHN V. Should the individual voting records of central bankers be published?[J]. Social Choice and Welfare, 2008, 30(4):655-683.
[47] NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation[J]. International Economic Review, 1982, 23:289-297.
[48] BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result[J]. International Economic Review, 1997, 38:175-186.
[49] BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints[J]. Mathematical Social Science, 2001, 41:349-364.
[50] KRAUS S. Optimal collective dichotomous choice under quota constraints[J]. Economic Theory, 2002, 19:839-852.
[51] MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents[J]. American Political Science Review, 1998, 92:413-418.
[52] BENYASHAR R. Information is important to Condorcet jurors[J]. Public Choice, 2006, 127(3):305-319.
[53] BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms[J]. Social Choice and Welfare, 2009, 33(3):477-494.
[54] LASLIER J, WEIBULL J. Providing incentives for informative voting[EB/OL]. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.
[55] FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting[J]. The American Political Science Review, 1998, 92(1):23-35.
[56] BOND P, ERASLAN H. Strategic voting over strategic proposals[J]. Review of Economic Studies, 2009, 77(2):459-490.
[57] BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees[J]. Social Choice and Welfare, 2007, 29(3):453486.
[58] COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences[EB/OL]. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.
[59] MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers[J]. Theory and Decision, 2002, 52(3):267286.
[60] JAEHOON K. A model of adversarial committees[EB/OL]. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.
[61] CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality[J]. Quarterly Journal of Political Science, 2010, 5(1):4570.
入侵檢測(cè)系統(tǒng)(IDS,Intrusion Detection System)是一種主動(dòng)保護(hù)自己免受攻擊的一種網(wǎng)絡(luò)安全技術(shù)。作為防火墻的有效補(bǔ)充,入侵檢測(cè)技術(shù)能夠幫助系統(tǒng)應(yīng)付網(wǎng)絡(luò)攻擊,擴(kuò)展了系統(tǒng)管理員的安全管理能力,提高了信息安全基礎(chǔ)結(jié)構(gòu)的完整性。本文就其幾個(gè)角度的分類加以簡(jiǎn)單研究。
一、按數(shù)據(jù)來(lái)源進(jìn)行分類
1.基于主機(jī)的入侵檢測(cè)系統(tǒng)
該系統(tǒng)通常是安裝在被重點(diǎn)檢測(cè)的主機(jī)上,其數(shù)據(jù)源來(lái)自主機(jī),如日志文件、審計(jì)記錄等。該系統(tǒng)通過(guò)監(jiān)視與分析主機(jī)中的上述文件,就能夠檢測(cè)到入侵。能否及時(shí)采集到上述文件是這些系統(tǒng)的關(guān)鍵點(diǎn)之一。因?yàn)槿肭终邥?huì)將主機(jī)的審計(jì)子系統(tǒng)作為攻擊目標(biāo)以避開IDS。
2.基于網(wǎng)絡(luò)的入侵檢測(cè)系統(tǒng)
此系統(tǒng)使用原始網(wǎng)絡(luò)包作為數(shù)據(jù)源。通常利用一個(gè)運(yùn)行在隨機(jī)模式下網(wǎng)絡(luò)的適配器來(lái)實(shí)時(shí)監(jiān)視并分析通過(guò)網(wǎng)絡(luò)的所有通信業(yè)務(wù)。它的攻擊辯識(shí)模塊通常使用四種常用技術(shù)來(lái)識(shí)別攻擊標(biāo)志:模式、表達(dá)式或字節(jié)匹配,頻率或穿越閥值,次要事件的相關(guān)性,統(tǒng)計(jì)學(xué)意義上的非常規(guī)現(xiàn)象檢測(cè)。一旦檢測(cè)到了攻擊行為,響應(yīng)模塊就提供多種選項(xiàng)以通知、報(bào)警并對(duì)攻擊采取相應(yīng)的反應(yīng)。反應(yīng)因產(chǎn)品而異,但通常都包括通知管理員、中斷連接或?yàn)榉ㄍシ治龊妥C據(jù)收集而作的會(huì)話記錄。
基于網(wǎng)絡(luò)的IDS有許多僅靠基于主機(jī)的入侵檢測(cè)法無(wú)法提供的功能。實(shí)際上,許多客戶在最初使用IDS時(shí),都配置了基于網(wǎng)絡(luò)的入侵檢測(cè)。
二、根據(jù)檢測(cè)原理進(jìn)行分類
傳統(tǒng)觀點(diǎn)根據(jù)入侵行為的屬性將其分為異常和濫用兩種,然后分別對(duì)其建立異常檢測(cè)模型和濫用檢測(cè)模型。近年來(lái)又涌現(xiàn)出一些新的檢測(cè)方法,它們產(chǎn)生的模型對(duì)異常和濫用都適用。
1.統(tǒng)計(jì)分析與異常檢測(cè)
統(tǒng)計(jì)分析最大優(yōu)點(diǎn)是它可以“學(xué)習(xí)”用戶的使用習(xí)慣,從而具有較高檢出率與可用性。但它的“學(xué)習(xí)”能力也給入侵者以機(jī)會(huì)通過(guò)逐步“訓(xùn)練”使入侵事件符合正常操作的統(tǒng)計(jì)規(guī)律,從而透過(guò)入侵檢測(cè)系統(tǒng)。
異常檢測(cè)只能識(shí)別出那些與正常過(guò)程有較大偏差的行為,而無(wú)法知道具體的入侵情況。由于對(duì)各種網(wǎng)絡(luò)環(huán)境的適應(yīng)性不強(qiáng),且缺乏精確的判定準(zhǔn)則,異常檢測(cè)經(jīng)常會(huì)出現(xiàn)虛警情況。異常檢測(cè)可以通過(guò)以下系統(tǒng)實(shí)現(xiàn)。
(1)自學(xué)習(xí)系統(tǒng):通過(guò)學(xué)習(xí)事例構(gòu)建正常行為模型,分為時(shí)序和非時(shí)序兩種。
(2)編程系統(tǒng):該類系統(tǒng)需要通過(guò)編程學(xué)習(xí)如何檢測(cè)確定的異常事件,從而讓用戶知道什么樣的異常行為足以破壞系統(tǒng)的安全。分為描述統(tǒng)計(jì)和缺省否認(rèn)。
2.基于規(guī)則分析與濫用檢測(cè)
濫用檢測(cè)基于已知的系統(tǒng)缺陷和入侵模式,故又稱特征檢測(cè)。它能夠準(zhǔn)確地檢測(cè)到某些特征的攻擊,但卻過(guò)度依賴事先定義好的安全策略,所以無(wú)法檢測(cè)系統(tǒng)未知的攻擊行為,從而產(chǎn)生漏警。
濫用檢測(cè)通過(guò)對(duì)確知決策規(guī)則編程實(shí)現(xiàn),可以分為以下四種。
(1)狀態(tài)建模:它將入侵行為表示成許多個(gè)不同的狀態(tài)。如果在觀察某個(gè)可疑行為期間,所有狀態(tài)都存在,則判定為惡意入侵。
(2)專家系統(tǒng):它可以在給定入侵行為描述規(guī)則的情況下,對(duì)系統(tǒng)的安全狀態(tài)進(jìn)行推理。一般情況下,專家系統(tǒng)的檢測(cè)能力強(qiáng)大,靈活性也很高,但計(jì)算成本較高,通常以降低執(zhí)行速度為代價(jià)。
(3)串匹配:它通過(guò)對(duì)系統(tǒng)之間傳輸?shù)幕蛳到y(tǒng)自身產(chǎn)生的文本進(jìn)行子串匹配實(shí)現(xiàn)。該方法靈活性欠差,但易于理解。
(4)基于簡(jiǎn)單規(guī)則:類似于專家系統(tǒng),但相對(duì)簡(jiǎn)單些,故執(zhí)行速度快。
3.混合檢測(cè)
近幾年來(lái),混合檢測(cè)日益受到人們的重視。這類檢測(cè)在作出決策之前,既分析系統(tǒng)的正常行為,又觀察可疑的入侵行為,所以判斷更全面、準(zhǔn)確、可靠。它通常根據(jù)系統(tǒng)的正常數(shù)據(jù)流背景來(lái)檢測(cè)入侵行為,故而也有人稱其為“啟發(fā)式特征檢測(cè)”。
參考文獻(xiàn):
[1]韋文思,徐津.信息安全防御技術(shù)與實(shí)施.電子工業(yè)出版社,2009.
The users' privacy concerns about personal information arise with the emergence of the internet that also brings user's life many advantages.With a questionnaire survey, this paper investigates the personal information concerned by users and the concern level employing the statistical analysis and associative classification technology. The result indicates that Chinese internet user's concern level is still low although the concern level is much higher than ever. Moreover, the concern level for different kinds of privacy information is distinct. The concern level to specific personal information is also varied ranging from the user's age, sex and education level. The conclusions provide some useful suggestions for electronic commerce sites to effectively protect the users' personal information.
Key words:
一、引言
網(wǎng)絡(luò)發(fā)展到今天,已經(jīng)成為人們生活中不可或缺的一種工具。只需輕輕按動(dòng)鼠標(biāo),人們即可隨時(shí)隨地購(gòu)買所需產(chǎn)品或服務(wù)、與遠(yuǎn)在世界各地的親朋好友交流、從事一些特殊的研究、培訓(xùn)或工作,還可以及時(shí)快速的了解世界各地的新聞,等等。但是,隨著網(wǎng)絡(luò)使用率的不斷增高以及相關(guān)技術(shù)的不斷進(jìn)步,使得收集大量的用戶隱私信息變得非常容易。Federal Trade Commission (FTC) 在1999年3月所作的一次研究表明:約有92.8%的網(wǎng)站至少收集用戶的一項(xiàng)身份信息,56.8%的網(wǎng)站至少收集一項(xiàng)人口統(tǒng)計(jì)學(xué)方面的信息[1]。網(wǎng)站和個(gè)人的這些收集他人隱私信息的做法引起用戶對(duì)自己在網(wǎng)上活動(dòng)時(shí)所留下的個(gè)人隱私信息的關(guān)心。Harris 等人在1998年所作的調(diào)查結(jié)果顯示:87%的網(wǎng)絡(luò)用戶“關(guān)心”在線時(shí)自己的隱私信息是否會(huì)受到威脅,56%的用戶“非常關(guān)心”這一點(diǎn)[2]; Jupiter 于2002年的研究結(jié)果表明:70%的美國(guó)用戶關(guān)心自己的網(wǎng)絡(luò)隱私[3];Harris在2004的調(diào)查分析得出:65%的被調(diào)查者稱自己由于關(guān)心自己的隱私而拒絕在電子商務(wù)網(wǎng)站上注冊(cè)[4]。PC world survey于2003年調(diào)查了1500網(wǎng)絡(luò)用戶,結(jié)果表明88%的人對(duì)于網(wǎng)站是否分享他們的e-mail地址非常關(guān)心,91%的人關(guān)心當(dāng)自己在線時(shí)會(huì)不會(huì)被網(wǎng)站跟蹤[5];Statistics Canada 在2006年調(diào)查結(jié)果表明:57%的用戶在線使用信用卡時(shí)非常謹(jǐn)慎[6]。與用戶的隱私關(guān)注相一致,眾多學(xué)者開始從理論角度對(duì)隱私問(wèn)題進(jìn)行探討,得出了大量的研究成果[7-9]。
許多學(xué)者從不同的角度對(duì)隱私關(guān)心問(wèn)題進(jìn)行了研究。其中,大部分的研究是針對(duì)隱私關(guān)心和隱私行為之間的關(guān)系或隱私關(guān)心和信任之間的關(guān)系[9,10],這些研究?jī)H對(duì)用戶是否關(guān)心隱私進(jìn)行調(diào)查,建立隱私關(guān)心和隱私行為或信任之間的關(guān)系,并未對(duì)用戶具體關(guān)心的隱私信息及關(guān)心程度進(jìn)行研究;Huberman等人使用實(shí)驗(yàn)的方式對(duì)網(wǎng)絡(luò)用戶的隱私信息進(jìn)行了定量研究,得出每項(xiàng)隱私信息都有一定的價(jià)值,且價(jià)值因用戶不同而不同[11],但是并未說(shuō)明各類用戶的隱私價(jià)值在哪些方面存在差異。
中國(guó)在網(wǎng)絡(luò)隱私權(quán)方面的研究越來(lái)越多,但是在隱私關(guān)心方面卻鮮有研究。筆者針對(duì)這一情況,通過(guò)調(diào)查分析,找出網(wǎng)絡(luò)用戶所具體關(guān)心的隱私信息及關(guān)心程度,為后續(xù)更深入的研究網(wǎng)絡(luò)用戶對(duì)隱私關(guān)心程度不同的原因及其他相關(guān)問(wèn)題提供參考。
筆者在此基礎(chǔ)上認(rèn)為,在中國(guó)文化的影響下,中國(guó)網(wǎng)絡(luò)用戶對(duì)于各項(xiàng)隱私信息的總體關(guān)心程度是不同的;此外,受性別、年齡和學(xué)歷的影響,中國(guó)各類用戶對(duì)于各項(xiàng)個(gè)人隱私信息的關(guān)心程度存在一定的差異。因此,筆者提出兩個(gè)假設(shè):(1)中國(guó)網(wǎng)絡(luò)用戶對(duì)每項(xiàng)隱私信息的關(guān)心程度是不同的;(2)不同性別、年齡、學(xué)歷的用戶對(duì)各類隱私信息的關(guān)心程度存在一定的差異。筆者采用問(wèn)卷調(diào)查的方式,利用統(tǒng)計(jì)分析和關(guān)聯(lián)分類的方法,對(duì)這兩點(diǎn)假設(shè)進(jìn)行研究。
二、研究方法
(一)問(wèn)卷設(shè)計(jì)
筆者在參閱相關(guān)資料的基礎(chǔ)上,重點(diǎn)研究網(wǎng)絡(luò)用戶的26項(xiàng)隱私信息,并將其分為人口統(tǒng)計(jì)學(xué)信息、財(cái)務(wù)信息、偏好信息、家庭信息、社會(huì)信息等五類信息(見表1),這5類信息的劃分并沒有明顯的界限,有些信息可以同屬兩類信息,這對(duì)結(jié)果并沒有明顯的影響。
筆者采用問(wèn)卷調(diào)查的方式進(jìn)行研究。問(wèn)卷共九個(gè)問(wèn)題,每個(gè)問(wèn)題都有被選項(xiàng)(單選和多選均有)。問(wèn)卷。首先選擇30人做預(yù)調(diào)查,對(duì)預(yù)調(diào)查的結(jié)果請(qǐng)相關(guān)領(lǐng)域的專家分析后進(jìn)行了相應(yīng)的修改。然后進(jìn)行大范圍的調(diào)查,被調(diào)查者為在校大學(xué)生、研究生、工程師、醫(yī)生、教師、公務(wù)員等各個(gè)行業(yè)一共350人,其中在校大學(xué)生及研究生占整個(gè)被調(diào)查者的三分之一,收回問(wèn)卷332份,回收率為94.86%,其中有效問(wèn)卷為324份,針對(duì)這324份問(wèn)卷做了分析。問(wèn)卷的alpha系數(shù)為0.985。
參照中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)對(duì)網(wǎng)民年齡的劃分標(biāo)準(zhǔn),考慮到不同年齡段的用戶的生活背景,對(duì)網(wǎng)絡(luò)的認(rèn)識(shí)、接觸網(wǎng)絡(luò)的機(jī)會(huì)以及用途均不同,因此,為了了解各類用戶對(duì)各類隱私信息的關(guān)心程度的差異性,對(duì)被調(diào)查者的年齡和學(xué)歷進(jìn)行劃分,劃分結(jié)果如表2所示。
(二)數(shù)據(jù)處理方法
1.統(tǒng)計(jì)方法
為了驗(yàn)證引言中所述的第一個(gè)假設(shè),即網(wǎng)絡(luò)用戶對(duì)各項(xiàng)隱私信息的關(guān)心程度是不同的(網(wǎng)絡(luò)用戶對(duì)各項(xiàng)隱私信息關(guān)心程度的差異性),對(duì)調(diào)查結(jié)果進(jìn)行了分析。由于個(gè)人信息項(xiàng)非常多,如果采用劃分等級(jí)的方法(即請(qǐng)被調(diào)查者針對(duì)自己的每項(xiàng)信息都給一個(gè)關(guān)心等級(jí),如“非常關(guān)心”“關(guān)心”“比較關(guān)心”、“不關(guān)心”),可能會(huì)使被調(diào)查者很難選擇或者全都選 “非常關(guān)心”,因此請(qǐng)被調(diào)查者在所列出的26項(xiàng)個(gè)人信息當(dāng)中選出不超過(guò)15項(xiàng)自己關(guān)心的信息,然后再對(duì)每項(xiàng)信息進(jìn)行頻數(shù)統(tǒng)計(jì),得出用戶對(duì)每項(xiàng)信息的關(guān)心程度(見表3)。
2.關(guān)聯(lián)分類方法
為了驗(yàn)證第二個(gè)假設(shè),得出不同用戶對(duì)各項(xiàng)隱私程度關(guān)心程度的差異性,筆者采用關(guān)聯(lián)分類的方式對(duì)數(shù)據(jù)進(jìn)行了處理。
關(guān)聯(lián)分類(associative classification, AC)是一類新的面向決策表的規(guī)則獲取技術(shù),其核心思想是利用關(guān)聯(lián)規(guī)則挖掘技術(shù),通過(guò)頻繁項(xiàng)集挖掘、決策規(guī)則生成以及規(guī)則剪枝等過(guò)程獲取條件屬性與決策屬性的關(guān)聯(lián)關(guān)系,即決策規(guī)則 (稱為分類關(guān)聯(lián)規(guī)則(classification association rule) ),并利用生成的分類關(guān)聯(lián)規(guī)則構(gòu)建決策系統(tǒng)。研究表明,AC方法能夠發(fā)現(xiàn)傳統(tǒng)方法挖掘不到的規(guī)則[12-15]。因此,筆者以關(guān)聯(lián)分類為工具,對(duì)用戶的隱私信息進(jìn)行分析,以便找出用戶特征與其對(duì)隱私關(guān)心的聯(lián)系,并且根據(jù)這種聯(lián)系的強(qiáng)弱,得出用戶對(duì)不同隱私信息的關(guān)心程度。在掌握網(wǎng)絡(luò)用戶對(duì)不同隱私信息的關(guān)心程度之后,商務(wù)網(wǎng)站可以有針對(duì)性的重點(diǎn)保護(hù)網(wǎng)絡(luò)用戶比較關(guān)心的個(gè)人隱私信息,提高用戶對(duì)網(wǎng)站的信任水平,為企業(yè)創(chuàng)造更多的商機(jī)。
三、結(jié)果
(一)網(wǎng)絡(luò)用戶對(duì)隱私信息的關(guān)心程度
根據(jù)表3結(jié)果,將關(guān)心程度分為四個(gè)等級(jí)(非常關(guān)心、關(guān)心、比較關(guān)心和不關(guān)心),關(guān)心程度值大于0.7的為“非常關(guān)心”,關(guān)心程度值大于0.5的為“關(guān)心”(其中“家庭信貸情況”這項(xiàng)信息的關(guān)心程度值為0.494,非常接近0.5,所以將其劃分到“關(guān)心”這個(gè)等級(jí)),關(guān)心程度值大于0.2的為“比較關(guān)心”,小于0.2的為“不關(guān)心”,根據(jù)每項(xiàng)隱私信息的關(guān)心程度值將其放入相應(yīng)位置,建立了個(gè)人隱私信息的關(guān)心程度矩陣(表4)。
雖然近幾年中國(guó)網(wǎng)絡(luò)用戶的隱私觀念有所改變,但從表3可以知道,中國(guó)網(wǎng)絡(luò)用戶對(duì)個(gè)人隱私信息的關(guān)心程度依然不高,僅對(duì)銀行卡號(hào)和身份證號(hào)這兩隱私信息的關(guān)心程度超過(guò)了0.6。這主要是受中國(guó)傳統(tǒng)文化的影響[16]。
為了更進(jìn)一步的解釋假設(shè)一,下面筆者對(duì)每類隱私信息的關(guān)心程度進(jìn)行簡(jiǎn)要分析。
1.人口統(tǒng)計(jì)學(xué)信息
從表3中可以看出,網(wǎng)絡(luò)用戶最關(guān)心身份證號(hào)這項(xiàng)信息,其次是姓名和年齡,而對(duì)性別、身高、體重等信息則不關(guān)心。
在我國(guó),身份證號(hào)是確定一個(gè)人身份的重要證件,如果此項(xiàng)信息泄露,可能會(huì)對(duì)個(gè)人造成非常大的損失或帶來(lái)許多麻煩,所以用戶對(duì)此項(xiàng)信息的關(guān)心程度非常高是符合實(shí)際情況的。由于其他五項(xiàng)個(gè)人人口統(tǒng)計(jì)學(xué)信息僅為用戶個(gè)人的信息,不涉及到他人,而且即使泄露,一般也不會(huì)對(duì)用戶本身或他人造成較大損失,所以用戶對(duì)這些信息的關(guān)心程度很低。此外,在網(wǎng)絡(luò)世界中,為了更好更容易地與他人交流溝通,大部分用戶都隱藏自己的真實(shí)姓名和年齡,所以對(duì)這兩項(xiàng)信息的關(guān)心程度要稍微要高一些。
2.財(cái)務(wù)信息
從表3中可以看出,對(duì)于各類財(cái)務(wù)信息,用戶均很關(guān)心,關(guān)心程度最高的是銀行卡號(hào),其次是個(gè)人工資、家庭收入、配偶工資和家庭信貸情況等隱私信息。
對(duì)于財(cái)務(wù)信息,不論在中國(guó)還是其他國(guó)家,網(wǎng)絡(luò)用戶都都非常關(guān)心。因?yàn)檫@類信息涉及到用戶的經(jīng)濟(jì)情況,如果泄露,會(huì)對(duì)個(gè)人經(jīng)濟(jì)造成極大損失,尤其是銀行卡號(hào),在信息技術(shù)如此發(fā)達(dá)的時(shí)代,黑客等網(wǎng)絡(luò)高手可能會(huì)根據(jù)用戶的銀行卡號(hào)來(lái)竊取用戶的錢財(cái),所以用戶對(duì)銀行卡號(hào)的關(guān)心程度在所有隱私信息中是最高的。至于其他四項(xiàng)財(cái)務(wù)信息,相對(duì)其他類的個(gè)人信息來(lái)說(shuō),關(guān)心程度也要高一些。在這四項(xiàng)信息中,值得注意的是個(gè)人工資這項(xiàng)信息,在五年前,中國(guó)人并不關(guān)心這項(xiàng)信息是否泄露,甚至很多人主動(dòng)告訴他人自己的這項(xiàng)信息,但隨著社會(huì)的進(jìn)步、經(jīng)濟(jì)水平的提高和用戶觀念的轉(zhuǎn)變,近幾年越來(lái)越多的用戶開始關(guān)心自己的這項(xiàng)隱私信息。
3.個(gè)人偏好信息
從表3中可以看出,對(duì)于個(gè)人的各項(xiàng)偏好信息,用戶普遍都不關(guān)心。因?yàn)檫@類信息僅僅是個(gè)人的興趣愛好,即使泄露,也不會(huì)對(duì)他人造成損失或傷害,一般也不會(huì)給個(gè)人帶來(lái)影響,所以用戶對(duì)這類信息的關(guān)心程度都很低。
值得注意的是,年齡在31-35歲之間的人,對(duì)自己的政治傾向和宗教信仰這兩項(xiàng)信息的關(guān)心程度要高出其他信息許多(其他信息關(guān)心程度在0.8以下,而這兩項(xiàng)信息均約為0.4)。這是因?yàn)椋幱谶@一年齡段的用戶,工作已經(jīng)進(jìn)入快速發(fā)展期,生活閱歷又比較豐富,已經(jīng)認(rèn)識(shí)到政治問(wèn)題和宗教問(wèn)題可能會(huì)對(duì)自己的工作產(chǎn)生影響,所以對(duì)這兩項(xiàng)信息的關(guān)心程度相對(duì)來(lái)說(shuō)要高一些。
4.家庭信息
同樣從表3來(lái)看,對(duì)于各類家庭信息,網(wǎng)絡(luò)用戶同樣比較關(guān)心,但相比來(lái)說(shuō),更關(guān)心庭住址和家庭電話這兩項(xiàng)信息。
從古至今,家庭對(duì)中國(guó)人的意義和影響都非常大,這類信息的泄露,極有可能會(huì)給用戶及其家庭帶來(lái)極大的麻煩甚至傷害,尤其是家庭住址和家庭電話這兩項(xiàng)信息,直接關(guān)系到家庭的安全和穩(wěn)定,所以網(wǎng)絡(luò)用戶在對(duì)各類家庭信息都很關(guān)心的情況下,對(duì)這兩項(xiàng)家庭信息的關(guān)心程度要更高一些。
5.社會(huì)信息
對(duì)于個(gè)人的各類社會(huì)信息,從表3中可以看出,用戶一般比較關(guān)心自己的網(wǎng)絡(luò)聊天記錄和個(gè)人移動(dòng)電話這兩項(xiàng)隱私信息,其次是個(gè)人e-mail地址,而對(duì)職業(yè)、單位地址和單位電話等隱私信息則不關(guān)心。
網(wǎng)絡(luò)聊天記錄這項(xiàng)信息,一般涉及到朋友或同事的隱私信息,如果泄露可能會(huì)給自己的人際關(guān)系帶來(lái)影響,甚至影響到自己的工作,所以用戶對(duì)這項(xiàng)信息的關(guān)心程度比較高。而個(gè)人移動(dòng)電話的泄露會(huì)給個(gè)人帶來(lái)很多麻煩(如經(jīng)常接到騷擾電話或短信息),所以用戶對(duì)這項(xiàng)信息的關(guān)心程度也比較高。
(二)各類用戶對(duì)各類隱私信息的關(guān)心程度比較
在(一)中我們從總體上得出了網(wǎng)絡(luò)用戶對(duì)個(gè)人信息的關(guān)心程度,并對(duì)各類隱私信息的關(guān)心程度進(jìn)行了簡(jiǎn)要分析。為了更進(jìn)一步的了解各類用戶對(duì)個(gè)人各項(xiàng)隱私信息的關(guān)心情況,筆者采用關(guān)聯(lián)分類的分析方法得出了各類用戶對(duì)各項(xiàng)信息的關(guān)心程度的規(guī)則。
使用關(guān)聯(lián)分類分析方法會(huì)得出很多的規(guī)則,因?yàn)槠邢?,根?jù)網(wǎng)絡(luò)用戶的性別、年齡和學(xué)歷的不同,僅列出有代表性的規(guī)則,并對(duì)產(chǎn)生這些規(guī)則的原因進(jìn)行簡(jiǎn)要解釋,希望能為進(jìn)一步研究引起這些現(xiàn)象的深層次原因,如文化因素、社會(huì)環(huán)境、個(gè)人偏好等,提供有益的啟發(fā)。
表格5到7中的用戶類別用年齡、性別和學(xué)歷三個(gè)屬性來(lái)來(lái)劃分,表示方法為﹡﹡﹡,左邊﹡表示年齡段,中間的﹡表示性別,右邊的﹡表示學(xué)歷,如C1Ⅰ表示年齡在25到30歲之間、性別為男性的具有本??茖W(xué)歷的用戶。
1.不同年齡用戶對(duì)隱私信息的關(guān)心程度
如2.1中所述,不同年齡段的網(wǎng)絡(luò)用戶的社會(huì)經(jīng)歷不同,隨著年齡的增長(zhǎng),對(duì)事務(wù)的認(rèn)識(shí)和看法也不同。針對(duì)這一現(xiàn)象,筆者從分析結(jié)果中找出了不同年齡的用戶對(duì)隱私信息的關(guān)心程度的差別(見表5)。
規(guī)則1 年齡在25到30歲的女性用戶比年齡在21到24歲的女性用戶更關(guān)心年齡這項(xiàng)隱私信息。這是因?yàn)闊o(wú)論在中國(guó)還是西方國(guó)家,女性對(duì)年齡這項(xiàng)信息都比較敏感,尤其是年齡越大的人,對(duì)這項(xiàng)信息越敏感,所以得出了此項(xiàng)規(guī)則。
規(guī)則2 同樣具有本??茖W(xué)歷的男性,年齡在25到30歲的人比年齡在21到24歲的人更關(guān)心個(gè)人工資、家庭收入和詳細(xì)健康狀況這三項(xiàng)隱私信息。在本問(wèn)卷的被調(diào)查者中,約有三分之一的被調(diào)查者為在校學(xué)生,所以年齡在21到24歲的男性大部分為在校學(xué)生,而年齡在25到30歲的男性基本都為從事工作的人,處于這一年齡段的人一開始承擔(dān)家庭的各項(xiàng)經(jīng)濟(jì)支出,所以對(duì)個(gè)人工資和家庭收入這兩項(xiàng)信息更為關(guān)心。同時(shí),由于健康狀況可能會(huì)影響到自己的工作和家庭,所以他們對(duì)自己的詳細(xì)健康狀況這項(xiàng)信息的關(guān)心程度也比較高。
規(guī)則3 年齡在31到35歲的人比年齡在21到24歲的人更關(guān)心婚姻狀況和家庭電話這兩項(xiàng)隱私信息。由于前者基本都為成家立業(yè)的人,后者大都為在校學(xué)生,后者對(duì)婚姻和家庭尚未具體的理解和經(jīng)歷,所以后者對(duì)這兩項(xiàng)信息的關(guān)心程度比較低是很正常的現(xiàn)象。
規(guī)則4 對(duì)于職業(yè)這項(xiàng)信息,網(wǎng)絡(luò)用戶都不關(guān)心,但相比來(lái)說(shuō),年齡在31到35歲的人比其他年齡段的人更關(guān)心。由于小于此年齡段的人一般都未開始工作,即使工作也是剛剛起步,而大于此年齡段的人一般工作年限已比較長(zhǎng),工作已經(jīng)有了一定的基礎(chǔ)并且比較穩(wěn)定,而處于31到35歲的人正處于工作的重要階段,所以對(duì)于這項(xiàng)信息比較敏感,關(guān)心程度也較高。
2.不同性別用戶對(duì)隱私信息的態(tài)度
一般來(lái)說(shuō),男性和女性在人生觀、世界觀、價(jià)值觀方面的差異都比較大,為了了解不同性別的用戶對(duì)隱私信息的態(tài)度存在哪些方面的差異,筆者對(duì)結(jié)果進(jìn)行了分析,得出以下規(guī)則(見表6)。
規(guī)則5 女性比男性更關(guān)心年齡、體重、詳細(xì)健康狀況和家庭情況。如前所述,中西方國(guó)家的女性對(duì)年齡、體重這些信息都很敏感,所以對(duì)這兩項(xiàng)信息的關(guān)心程度比男性要高,至于更關(guān)心詳細(xì)健康狀況這項(xiàng)信息,是因?yàn)榕砸话泱w質(zhì)弱于男性,所以對(duì)該項(xiàng)信息更為敏感。此外,在中國(guó),女性的家庭觀念更強(qiáng),所以對(duì)家庭情況這項(xiàng)信息也比男性更關(guān)心。
規(guī)則6 男性比女性更關(guān)心姓名、性別、家庭住址、家庭電話。一般來(lái)說(shuō),在網(wǎng)絡(luò)世界里,女性要比男性更容易與他人溝通交流,而從姓名可以大致判斷性別,所以為了更方便的在網(wǎng)絡(luò)世界里與他人溝通,男性一般都隱瞞自己的性別,即對(duì)姓名和年齡這兩項(xiàng)信息的關(guān)心程度比女性高;此外,無(wú)論在中國(guó)還是西方國(guó)家,男性一般要承擔(dān)起保護(hù)保護(hù)家人的責(zé)任,而家庭住址和家庭電話這兩項(xiàng)信息的泄露可能會(huì)給家人帶來(lái)麻煩或危險(xiǎn),所以男性對(duì)這兩項(xiàng)信息的關(guān)心程度比女性高。
規(guī)則7 年齡在25到30歲之間的男性比女性更關(guān)心家庭信貸情況這項(xiàng)信息,但年齡在21到24歲之間的具有本??茖W(xué)歷的女性卻比男性更關(guān)心此項(xiàng)信息。處于前一年齡段的人一般為剛成家立業(yè)的人,在中國(guó),歷來(lái)有男人養(yǎng)家的傳統(tǒng)思想,所以處于這一年齡段的男性要比女性更關(guān)心自己的家庭信貸情況;而處于后一年齡段的人大都為在校學(xué)生,而女性一般比男性心思更加細(xì)膩,對(duì)父母更加體貼,所以處于這一年齡段的女性更關(guān)心家庭信貸情況是出于對(duì)父母的關(guān)心。
3.不同學(xué)歷用戶對(duì)隱私信息的態(tài)度
不同學(xué)歷的人,所受的教育程度不同,一般在對(duì)問(wèn)題的認(rèn)識(shí)深度等方面會(huì)存在一定的差異。筆者從分析結(jié)果中找出了不同學(xué)歷的用戶在隱私信息的關(guān)心程度方面的差異(見表7)。
規(guī)則8 具有本??茖W(xué)歷的女性比具有碩士學(xué)歷的女性更關(guān)心身高這項(xiàng)信息,而后者更關(guān)心配偶工資和網(wǎng)絡(luò)聊天記錄這兩項(xiàng)隱私信息。一般來(lái)說(shuō),女性對(duì)身高并沒有男性關(guān)心程度高,但是對(duì)于具有不同學(xué)歷的女性來(lái)說(shuō),在學(xué)歷上具有優(yōu)勢(shì)之后,對(duì)身高這項(xiàng)信息的關(guān)心程度自然也就沒有在學(xué)歷上具有弱勢(shì)的女性高;至于配偶工資這項(xiàng)信息,如果女性本身的學(xué)歷比較高,一般都希望配偶的工資能更高,所以對(duì)該項(xiàng)信息的關(guān)心程度也就比較高;此外,由于在校學(xué)生在本次調(diào)查中所占比例比較大,而在校本專科學(xué)生一般將網(wǎng)絡(luò)用于溝通交流和娛樂(lè),而在校研究生除了將網(wǎng)絡(luò)用于交流溝通娛樂(lè)外,最主要的一點(diǎn)是用于做研究,從網(wǎng)絡(luò)聊天的內(nèi)容價(jià)值來(lái)看,碩士研究生的聊天內(nèi)容價(jià)值更高,更需要保密,所以出現(xiàn)具有碩士學(xué)歷的女性比具有本??茖W(xué)歷的女性更關(guān)心網(wǎng)絡(luò)聊天記錄這項(xiàng)隱私信息。
四、討論
筆者采用問(wèn)卷調(diào)查的方式獲得了用戶對(duì)于自身隱私信息的關(guān)心程度,并采用關(guān)聯(lián)分類的方式分析了各類用戶對(duì)于各項(xiàng)隱私信息的關(guān)心程度的差別,分析結(jié)果驗(yàn)證了引言中提出的兩項(xiàng)假設(shè)。
如前所述,對(duì)于網(wǎng)絡(luò)隱私問(wèn)題,研究的人很多,但主要集中在隱私保護(hù)技術(shù)、隱私關(guān)心和隱私行為之間的關(guān)系或隱私和信任的關(guān)系問(wèn)題或隱私權(quán)問(wèn)題上。筆者主要是從用戶自身觀念出發(fā),旨在了解用戶到底對(duì)自身的哪些信息比較關(guān)心。此結(jié)論可以為電子商務(wù)網(wǎng)站服務(wù),網(wǎng)站在了解用戶關(guān)心的各項(xiàng)信息后,可以加強(qiáng)對(duì)這些信息的保護(hù),從而提高用戶對(duì)網(wǎng)站的信任水平,給網(wǎng)站帶來(lái)巨大商機(jī)。但是尚存在一些問(wèn)題,一是調(diào)查的信息項(xiàng)僅26項(xiàng),有許多信息沒有調(diào)查;二是樣本僅350人,且樣本年齡跨度?。ㄈ缯{(diào)查的年齡主要集中在20-35歲之間),涵蓋的范圍不夠?qū)挘蝗窃诜治鲇脩魧?duì)信息的關(guān)心程度時(shí)僅采用頻數(shù)分析,結(jié)果可能存在不合理的地方;四是關(guān)于各類用戶對(duì)各類信息的關(guān)心程度的差別僅得出一些結(jié)論性的結(jié)果和簡(jiǎn)單的分析。
目前,關(guān)于隱私問(wèn)題的研究越來(lái)越多,也越來(lái)越深入。但仍有許多問(wèn)題值得進(jìn)一步研究:(1)對(duì)本文未作調(diào)查的個(gè)人隱私信息需要調(diào)查研究,得出用戶對(duì)這些信息的關(guān)心程度(本文只是對(duì)小部分信息進(jìn)行調(diào)查,不完全,還需要進(jìn)一步做詳細(xì)的研究);(2)雖然由調(diào)查結(jié)果得出的規(guī)則可以看出用戶對(duì)于各種信息的關(guān)心程度是不同的,但是對(duì)產(chǎn)生這些規(guī)則的圓滿解釋還需進(jìn)一步的研究;(3)得出用戶對(duì)于各項(xiàng)信息的關(guān)心程度之后,電子商務(wù)網(wǎng)站如何利用這些結(jié)果提高用戶的信任水平也是值得研究的內(nèi)容之一。
參考文獻(xiàn)
[1] Forrester Research(1999). Post-web retail (September) [R/OL]. forrester.com/
[2] Harris and Associates Inc., Westin, A., 1998. Ecommerce and privacy: what net users want. Privacy and American Business and Pricewaterhouse Coopers. LLP. Available online at: pandan.org/ecommercesurvey.html. Accessed on 20 June 2005.
[3] Jupiter Research. Seventy percent of US consumers worry about online privacy, but few take protective action [EB/OL], 2002. jmm.com/xp/jmm/press/2002/pr_060
[4] Harris, 2004. National Survey on Consumer Privacy Attitudes. Available online at: epic.org/privacy/survey/S, accessed on 22 August 2006.
[5] PC world survey, 2003. Available online at: pcworld.com/article/id,112468-page,1/article.htmlS, accessed on August 22, 2006.
[6] Statistics Canada, 2006. Available online at: ca.today.reuters.com/news/newsArticle, accessed on August 22.
[7] Klein, S.,. The privacy debate: this time it's personal. The Guardian newspaper, April 26. 2004.
[8] Vise, D.,. Fears over Big Brother stalked Gmail. The Sunday Times news paper. Available online at:[EB/OL]business.timesonline.co.uk/article/, accessed on 8 December 2005.
[9] Carina Painea, Ulf-Dietrich Reipsb, Stefan Stiegerc, Adam Joinsona, Tom Buchanan. Internet users' perceptions of 'privacy concerns' and 'privacy actions' [J]. human-computer studies2007.65(526-536).
[10] Chang Liu, Jack T. Marchewka, June Lu, Chun-Sheng Yu. Beyond concern-a privacy-trust-behavioral intention model of electronic commerce[J]. Information & Management 42 (2005) 289-304.
[11] Huberman B, Adar E, Fine L. Valuating Privacy [J]. IEEE SECURITY&PRIVACY, 2005: 22-25.
[12] Thabtah F, Cowling P, Hammoud S. Improving rule sorting, predictive accuracy and training time in associative classification [J]. Expert Systems with Applications, 2006(31): 414-426.
[13] Liu B, Hsu W, Ma Y. Integrating classification and association rule mining [C]. Proceedings of the Fourth International Conference on Knowledge Discovery and Data Mining (KDD-98), 1998.
一、前言
教師在課堂教學(xué)中要打破傳統(tǒng)束縛學(xué)生思維發(fā)展的舊模式,遵循以人為本的觀念,給學(xué)生思維提供最大的空間,項(xiàng)目根據(jù)“應(yīng)用有機(jī)化學(xué)”教學(xué)大綱,把培養(yǎng)學(xué)生的創(chuàng)新素養(yǎng)作為教學(xué)的重點(diǎn)。轉(zhuǎn)變學(xué)生的學(xué)習(xí)方式,既要讓他們“學(xué)會(huì)”,也要“會(huì)學(xué)”,因此我們?cè)凇皯?yīng)用有機(jī)化學(xué)”課堂教學(xué)中,基于“憤悱術(shù)”和“產(chǎn)婆術(shù)”啟發(fā)式教學(xué)的課堂教學(xué)策略的基本理論依據(jù),設(shè)計(jì)了“應(yīng)用有機(jī)化學(xué)”課堂教學(xué)改革的幾種模式:主動(dòng)性模式、主體性模式、情感性模式、可持續(xù)性模式、舉一反三學(xué)習(xí)模式[1][2]。
“應(yīng)用有機(jī)化學(xué)”“憤悱術(shù)”和“產(chǎn)婆術(shù)”的啟發(fā)式教學(xué)策略源于一般啟發(fā)式教學(xué)策略,是一般啟發(fā)式教學(xué)策略的應(yīng)用,具有一般啟發(fā)式教學(xué)策略的特點(diǎn)。通過(guò)對(duì)甲班進(jìn)行試驗(yàn),而乙班的教學(xué)方法保持原狀。根據(jù)期末考試成績(jī),進(jìn)行顯著性檢驗(yàn)分析[3][4]。
二、以分析性統(tǒng)計(jì)檢驗(yàn)誤差,以確認(rèn)從樣本推斷總體的可靠性
(一)u檢驗(yàn)和t檢驗(yàn)理論依據(jù)
統(tǒng)計(jì)檢驗(yàn)是準(zhǔn)確解釋研究結(jié)果的前提,其方法可分為參數(shù)統(tǒng)計(jì)檢驗(yàn)和非參數(shù)統(tǒng)計(jì)檢驗(yàn)兩類。在中小學(xué)教育科研中,通常以參數(shù)統(tǒng)計(jì)檢驗(yàn)為主,其中u檢驗(yàn)和t檢驗(yàn)是兩種最常用的檢驗(yàn)方法。[5]
在教育統(tǒng)計(jì)中常以正態(tài)曲線分布下面積的95%或99%的理論u值為差異顯著性的臨界值,取0.05和0.01位兩個(gè)顯著水平。若樣本的u值等于或大于95%或99%的理論u值(分別為1.96和2.58),即表明樣本的平均數(shù)不超過(guò) μ±1.96σ或 μ±2.58σ的區(qū)間。也就是說(shuō),樣本來(lái)自同一總體的可能性(即概率P小于0.05或0.01)。在統(tǒng)計(jì)上將P≤0.05的差異稱為顯著差異,將P≤0.01的差異稱為非常顯著差異。反之,若樣本的u值小于95%的理論z值,則表明樣本來(lái)自同一總體的概率P>0.05,統(tǒng)計(jì)上稱為差異不顯著。
由于u檢驗(yàn)要求樣組的規(guī)模較大(n>30,嚴(yán)格地說(shuō),應(yīng)以n>50為大樣本),因此,對(duì)于小樣本的檢驗(yàn)通常都采用比較兩個(gè)平均數(shù)以確定它們之間的差值是真的差值而不是偶然差數(shù)的t檢驗(yàn)。在同一概率下,自由度越大,t值就越小;在自由度相同的情況下,則概率越小,t值越大。
(二)本次受試樣本采用t檢驗(yàn)
t檢驗(yàn)方法檢驗(yàn)樣本之間有無(wú)真正的差異(由操縱自變量引起的差異,而不是由抽樣誤差等引起的差異),其基本程序?yàn)椋孩賹?duì)試驗(yàn)樣本所在的總體提出假設(shè);②確定顯著水平;③在無(wú)效假設(shè)成立的前提下,研究統(tǒng)計(jì)量的抽樣分布,計(jì)算出檢驗(yàn)統(tǒng)計(jì)量;④估計(jì)相對(duì)概率P,根據(jù)小概率原理作出統(tǒng)計(jì)推斷。
1.建立虛無(wú)假設(shè)
差異檢驗(yàn)是以“反正”為特點(diǎn)的邏輯推理過(guò)程。其基本思想是,為了證實(shí)各樣本均數(shù)有顯著差異,可首先假設(shè)被比較的樣本均數(shù)(或百分?jǐn)?shù))沒有顯著差異,即假定它們是來(lái)自同一總體的,它們之間的差數(shù)為0,即便有差異,也純粹屬于隨機(jī)誤差,這種假設(shè),在統(tǒng)計(jì)上稱為“虛無(wú)假設(shè)”或“無(wú)效假設(shè)”(通常以H0表示)。倘若虛無(wú)假設(shè)成立的概率(通常以P表示)很?。≒≤0.05,或P ≤0.01),則根據(jù)小概率原理“概率很小的時(shí)間在一次實(shí)驗(yàn)中是幾乎不可能發(fā)生的”,就可拒絕虛無(wú)假設(shè),即原來(lái)假定的各樣本來(lái)自同一總體的可能性是極小的,從而可確定被比較的各數(shù)值之間的差異確實(shí)反映了自變量的處理效應(yīng)。反之,如果P值比較大(P>0.05),我們就將接受虛無(wú)假設(shè),認(rèn)為被比較的各數(shù)值之間的差異完全是由隨機(jī)誤差造成的。
2.計(jì)算t值
計(jì)算t值首先需要考慮所檢驗(yàn)的樣本是相互獨(dú)立的、互不關(guān)聯(lián)的,還是相互關(guān)聯(lián)的,并依據(jù)此選擇相應(yīng)的計(jì)算公式。這就是所謂的“獨(dú)立樣本”,是指兩個(gè)樣本的抽取互不影響,即受試者隨機(jī)地被分配于兩個(gè)樣本之中,它們之間沒有成對(duì)的關(guān)系。關(guān)于“相關(guān)樣本”主要有兩種情況:一種是對(duì)同一種研究對(duì)象進(jìn)行兩次檢測(cè)所得到的兩組數(shù)據(jù);另一種是對(duì)兩個(gè)并非通過(guò)隨機(jī)抽樣組成的配對(duì)組進(jìn)行同種檢測(cè)所得到的兩組結(jié)果。如果兩個(gè)配對(duì)組是通過(guò)隨機(jī)抽樣而構(gòu)造的等值組,則由同種檢測(cè)所得到的兩組數(shù)據(jù)只能屬于獨(dú)立樣本,而不能視作相關(guān)樣本。
3.進(jìn)行統(tǒng)計(jì)決策實(shí)例
即通過(guò)以t值與理論t值的比較,做出拒絕或接受虛無(wú)假設(shè)H0的決策。
如果采用的是t檢驗(yàn),則其決策程序?yàn)椋?/p>
(1)根據(jù)自由度df,從t值表中查出0.05顯著性水平上的臨界值t(df)0.05和早0.01顯著性水平上的臨界值t(df)0.01。
例如,對(duì)n=40的樣組進(jìn)行t檢驗(yàn),則其自由度df=40-1=39。據(jù)此,可從上表中分別查得:
t在0.05顯著性水平上的臨界值:t(39)0.05 = 2.020;
t在0.01顯著性水平上的臨界值:t(39)0.01 = 2.703。
(2)將計(jì)算所得的t值與查表所得的臨界值作比較,并根據(jù)下表進(jìn)行統(tǒng)計(jì)決策。現(xiàn)在,讓我們通過(guò)實(shí)例來(lái)進(jìn)一步對(duì)統(tǒng)計(jì)檢驗(yàn)問(wèn)題作出具體的說(shuō)明。試分析新的教學(xué)方法在提高學(xué)生數(shù)學(xué)水平方面與原來(lái)的教學(xué)方法有無(wú)顯著差異。具體兩個(gè)班級(jí)期末考試成績(jī)數(shù)據(jù)見表1、表2。
由于n =40,為小樣本,可采用t檢驗(yàn)。檢驗(yàn)步驟如下:
(3)計(jì)算t值。由于乙班為沒有進(jìn)行試驗(yàn)的考試結(jié)果,所以以乙班為基準(zhǔn)進(jìn)行計(jì)算,計(jì)算結(jié)果為:t=(78.90-70.08)/1.49 =5.92。t檢驗(yàn)統(tǒng)計(jì)決策規(guī)則見表3。
≤0.05在0.05顯著性水平上拒絕虛無(wú)假設(shè)H0,差異顯著。|t|≥t(df)0.01 P≤0.01 在0.01顯著性水平上拒絕虛無(wú)假設(shè)H0,差異極顯著。
(4)統(tǒng)計(jì)決策。將實(shí)際所得的t值與理論t值相比較。比較結(jié)果為:
t=5.92≥t(df)0.01=3.499,即P≤0.01。在0.01顯著性水平上拒絕虛無(wú)假設(shè)H0,表明差異極顯著。
三、結(jié)語(yǔ)
在0.01顯著性水平上拒絕虛無(wú)假設(shè)H0,表示采用“憤悱術(shù)”和“產(chǎn)婆術(shù)”啟發(fā)式教學(xué)方法的學(xué)生在期末考試成績(jī)方面有非常顯著的差異,且甲班學(xué)生的成績(jī)明顯優(yōu)于乙班學(xué)生。
采用“憤悱術(shù)”和“產(chǎn)婆術(shù)”啟發(fā)式教學(xué)方法安排教學(xué)內(nèi)容的教法與原來(lái)的教法相比,其教學(xué)效果在一般情況下是有極其顯著差異意義的,即這種教學(xué)方法優(yōu)于原來(lái)的教學(xué)方法,因而是可行的。
參考文獻(xiàn):
[1]靳乃錚.啟發(fā)式教學(xué)[M].北京:北京師范大學(xué)出版社,2002.
[2]盧小男.信息技術(shù)環(huán)境下再論數(shù)學(xué)啟發(fā)式教學(xué)[D].大連:遼寧師范大學(xué),2010.
引言
課堂教學(xué)是教學(xué)過(guò)程的中心環(huán)節(jié),是教師教學(xué)質(zhì)量的集中體現(xiàn),課堂教學(xué)質(zhì)量的好壞直接關(guān)系到學(xué)校教育質(zhì)量的高低。教師課堂教學(xué)質(zhì)量評(píng)價(jià)是教學(xué)管理的一個(gè)重要環(huán)節(jié),它在整個(gè)教師考核系統(tǒng)中占主要地位。課堂教學(xué)質(zhì)量的評(píng)價(jià)方法主要有“專家評(píng)價(jià)”、“同行評(píng)價(jià)”、“學(xué)生評(píng)價(jià)”、“教師自評(píng)”等。其中以學(xué)生問(wèn)卷調(diào)查形式的學(xué)生評(píng)價(jià)法最常用,對(duì)其可靠性和有效性的研究已進(jìn)行了50多年。本文所述的基于web的課堂教學(xué)質(zhì)量模糊綜合評(píng)價(jià)系統(tǒng)已在我校投入試運(yùn)行,效果良好。
1 評(píng)價(jià)指標(biāo)體系的建立
高校已有的課堂教學(xué)評(píng)價(jià)指標(biāo)體系越來(lái)越不適合高校教學(xué)評(píng)價(jià)的要求,影響了評(píng)價(jià)質(zhì)量,為此,結(jié)合高校教學(xué)新的發(fā)展和特點(diǎn),我校建立了一種新的科學(xué)的課堂教學(xué)評(píng)價(jià)指標(biāo)體系,即課堂教學(xué)質(zhì)量評(píng)價(jià)二級(jí)指標(biāo)體系模型,如表1所示。
2 評(píng)價(jià)系統(tǒng)的設(shè)計(jì)及開發(fā)
根據(jù)上面課堂教學(xué)評(píng)價(jià)指標(biāo)體系,筆者開發(fā)了基于模糊綜合評(píng)價(jià)的課堂教學(xué)質(zhì)量評(píng)估系統(tǒng)。
2.1 系統(tǒng)結(jié)構(gòu)及各模塊功能
系統(tǒng)的總體功能結(jié)構(gòu)主要分為三個(gè)功能模塊:前臺(tái)信息收集、后臺(tái)數(shù)據(jù)分析、系統(tǒng)維護(hù)功能。這三個(gè)主模塊中,最低層的相關(guān)功能(如圖1所示)分別用于:填寫評(píng)價(jià)信息;瀏覽評(píng)價(jià)結(jié)果;以列表的形式,為用戶提供多層次、多角度的分析結(jié)果瀏覽;瀏覽決策規(guī)則;維護(hù)用戶、評(píng)價(jià)指標(biāo)和系統(tǒng)信息。
我們使用所述指標(biāo)體系對(duì)評(píng)估對(duì)象進(jìn)行評(píng)價(jià)信息的收集。本模塊學(xué)生端由純Web頁(yè)面生成。學(xué)生通過(guò)圖2所示的填寫評(píng)價(jià)問(wèn)卷頁(yè)面對(duì)評(píng)價(jià)項(xiàng)目給出相應(yīng)的評(píng)語(yǔ)(“優(yōu)秀”、“良好”、“中等”或“差”,單選)后,點(diǎn)擊“提交”按鈕,即可將填寫的信息保存到系統(tǒng)數(shù)據(jù)庫(kù),作為后期開展評(píng)價(jià)的依據(jù)。
2.2.2 指標(biāo)權(quán)重的收集
評(píng)估體系中各指標(biāo)權(quán)重設(shè)計(jì)得合理與否直接影響教學(xué)評(píng)估效果。系統(tǒng)將根據(jù)專家分析按照判斷結(jié)果量化規(guī)則,計(jì)算出各指標(biāo)權(quán)重。如表2所示。的權(quán)重取值按判斷結(jié)果量化規(guī)則給定。
以一級(jí)評(píng)價(jià)指標(biāo)取代表2中的A經(jīng)專家填寫上表后,系統(tǒng)利用本文3.1.3中所介紹的層次分析法確定一級(jí)指標(biāo)權(quán)重集w=(W1,w2,W3,w4)。同理可以獲得各個(gè)二級(jí)指標(biāo)的權(quán)重集。
2.3 后臺(tái)數(shù)據(jù)分析
后臺(tái)數(shù)據(jù)分析,主要是對(duì)從學(xué)生、專家等相關(guān)評(píng)估人員收集來(lái)的數(shù)據(jù)進(jìn)行科學(xué)分析――使用下面介紹的模糊數(shù)學(xué)方法,采用模糊綜合評(píng)判模型。經(jīng)過(guò)模糊處理的信息可以瀏覽,瀏覽模塊以列表的形式呈現(xiàn)評(píng)價(jià)結(jié)果。
3 系統(tǒng)實(shí)現(xiàn)的關(guān)鍵技術(shù)
3.1 模糊綜合評(píng)價(jià)模型及算法
在課堂教學(xué)質(zhì)量評(píng)價(jià)中,某些評(píng)價(jià)因子帶有一定程度的模糊性,即具有非線性特征。它沒有十分明確的界限和清楚的外延,不存在絕對(duì)的十分精確的肯定與否定。如,對(duì)某老師課堂教學(xué)質(zhì)量的教學(xué)效果的優(yōu)劣進(jìn)行評(píng)價(jià)時(shí),人們的認(rèn)識(shí)不同褒貶程度也不盡相同,很難直接用統(tǒng)計(jì)學(xué)的方法確定這些因素的具體數(shù)值。
模糊綜合評(píng)價(jià)即是基于評(píng)價(jià)過(guò)程的非線性特點(diǎn)而提出的,它利用模糊數(shù)學(xué)中的模糊運(yùn)算法則,對(duì)非線性的評(píng)價(jià)論域進(jìn)行量化綜合,從而得到可比的量化評(píng)價(jià)結(jié)果。對(duì)課堂教學(xué)質(zhì)量采用模糊數(shù)學(xué)的方法進(jìn)行綜合評(píng)價(jià),將更接近于實(shí)際情況。
3.1.1指標(biāo)的評(píng)價(jià)因素集的確定
對(duì)課堂教學(xué)質(zhì)量(u)的評(píng)估,是全面的多因素評(píng)價(jià)。主要從4個(gè)方面來(lái)評(píng)估,每個(gè)方面又包含若干個(gè)子因素。評(píng)價(jià)指標(biāo)應(yīng)遵 循全面整體性和相對(duì)獨(dú)立性原則,即滿足u(i≠i),設(shè)每個(gè)指標(biāo)Ui=(u1 u2…un)。
3.1.2評(píng)語(yǔ)集
課堂教學(xué)質(zhì)量評(píng)價(jià)結(jié)論分4個(gè)等級(jí):優(yōu)秀、良好、中等及差。這4個(gè)等級(jí)組成評(píng)語(yǔ)集。評(píng)語(yǔ)集對(duì)應(yīng)的數(shù)值集。
3.1.3 權(quán)重集
設(shè)一級(jí)指標(biāo)的權(quán)重集為w=(WI,W2,W3,w4),二級(jí)指標(biāo)的權(quán)重集。本文用層次分析法確定一級(jí)和二級(jí)指標(biāo)的權(quán)重?cái)?shù)。以計(jì)算w一級(jí)指標(biāo)權(quán)重?cái)?shù)為例,算法說(shuō)明如下。首先確定目標(biāo)和一級(jí)評(píng)價(jià)因素集u=(Ul,U2,U3,U4),然后構(gòu)造判斷矩陣A,A中元素表示指標(biāo)u。對(duì)u的相對(duì)重要性數(shù)值,取值由專家判斷結(jié)果量化規(guī)則決定。A中元素滿足Aij=1/Aji,Aii=1,根據(jù)公式,求出最大特征根,一致性指標(biāo),一致性比率,其中恥為判斷矩陣的平均隨機(jī)一致性指標(biāo)。當(dāng)CR
3.1.4 構(gòu)造隸屬度子集R
對(duì)于每一個(gè)二級(jí)指標(biāo)u,根據(jù)學(xué)生評(píng)價(jià)結(jié)果,用模糊統(tǒng)計(jì)方法得出每個(gè)因素u,的模糊隸屬度子集。這里“指評(píng)價(jià)因素集中二級(jí)指標(biāo)U對(duì)應(yīng)評(píng)語(yǔ)集中每個(gè)v的隸屬度,一級(jí)指標(biāo)U的模糊評(píng)判矩陣R。
對(duì)于每一個(gè)二級(jí)評(píng)價(jià)指標(biāo)u。都可以得到一個(gè)隸屬度子集,那么re(m=4、5)個(gè)氏構(gòu)成一個(gè)u×V域上的m×4模糊評(píng)判矩陣R,即對(duì)于一級(jí)指標(biāo)u。的模糊評(píng)判矩陣:
3.1.6 一級(jí)指標(biāo)U的模糊綜合評(píng)判值S
鑒于運(yùn)用模糊矩陣相乘的取小取大法和隸屬度原則的弊端,這里按普通矩陣乘法法則綜合評(píng)價(jià)結(jié)果。到u的用隸屬度表示的模糊評(píng)判值;
3.1.7 課堂教學(xué)質(zhì)量(U)的模糊綜合評(píng)價(jià)結(jié)果S
重復(fù)3.1.5 的計(jì)算過(guò)程用二級(jí)求得的所有評(píng)判值s構(gòu)成。
3.2 B/S和G/S體系結(jié)構(gòu)
本系統(tǒng)的主要用戶包括校級(jí)和院系兩級(jí)教務(wù)管理人員和學(xué)生、專家等,教務(wù)人員大多在相對(duì)固定的位置使用系統(tǒng),而學(xué)生人數(shù)多,使用系統(tǒng)的位置也不固定。綜合分析,決定使用B/S和C/S模式交叉混合的多層體系結(jié)構(gòu)方案。這樣設(shè)計(jì)可以使該系統(tǒng)具有信息瀏覽和信息管理與維護(hù)的功能。
3.3數(shù)據(jù)庫(kù)的設(shè)計(jì)
教學(xué)評(píng)價(jià)系統(tǒng)選用Microsoft的SQL Server 2000作為數(shù)據(jù)庫(kù)的開發(fā)工具,因?yàn)樗粌H僅是一套功能強(qiáng)大的數(shù)據(jù)庫(kù)服務(wù)器軟件,而且最重要的是它具有支持?jǐn)?shù)據(jù)倉(cāng)庫(kù)的特性,并自帶聯(lián)機(jī)分析處理軟件包,同時(shí)可以獲得Windows平臺(tái)上各種軟件系統(tǒng)的支持。
3.4前臺(tái)開發(fā)工具
中圖分類號(hào):F014.5文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-949X(2008)-06-01-03
個(gè)人信用評(píng)分研究從技術(shù)層次上來(lái)講,主要經(jīng)歷了三個(gè)階段,從簡(jiǎn)單的分類模型到預(yù)測(cè)評(píng)分模型,再到?jīng)Q策評(píng)分模型。而從評(píng)分的類型上看,主要分為四個(gè)類型,即申請(qǐng)?jiān)u分、行為評(píng)分、利潤(rùn)評(píng)分以及考慮經(jīng)濟(jì)環(huán)境因素的信用評(píng)分。
一、申請(qǐng)?jiān)u分(Application Scoring)
授信機(jī)構(gòu)接受客戶信用申請(qǐng)時(shí),利用客戶提交的申請(qǐng)表中的特征變量建立評(píng)分模型得到申請(qǐng)者的一個(gè)信用值,將該值與事先設(shè)定的標(biāo)準(zhǔn)值相比,判斷該申請(qǐng)人逾期的可能性,從而決定是否授出信用及授信額度。這樣的信用評(píng)分,稱為申請(qǐng)?jiān)u分。
建立評(píng)分模型可以運(yùn)用的方法非常多,傳統(tǒng)統(tǒng)計(jì)學(xué)方法有判別分析、線性回歸、Logistic回歸等;非參數(shù)方法有最近鄰方法等;運(yùn)籌學(xué)方面則主要采用線性規(guī)劃方法。隨著信息技術(shù)的發(fā)展,近年來(lái)許多數(shù)據(jù)挖掘的新方法如神經(jīng)網(wǎng)絡(luò)、決策樹、遺傳算法、專家系統(tǒng)等陸續(xù)被引入信用評(píng)分領(lǐng)域中。
Durand(1941)首先將判別分析方法用于信用評(píng)分,正式系統(tǒng)的提出使用數(shù)理統(tǒng)計(jì)模型輔助消費(fèi)者授信決策的觀念,并將Fisher(1936)提出的判別分析法用來(lái)區(qū)分“好”的貸款和“壞”的貸款,從而對(duì)貸款的信用風(fēng)險(xiǎn)進(jìn)行評(píng)價(jià),這是個(gè)人信用評(píng)估從定性分析逐步過(guò)渡到定量分析的開端。
1958年William Fair & Earl Isaacs利用判別分析法建立了著名的FICO信用評(píng)分系統(tǒng)。Myers & Forgy(1963)采用判別分析和回歸分析方法,利用零售信貸領(lǐng)域消費(fèi)者信用申請(qǐng)表中的數(shù)據(jù)對(duì)財(cái)務(wù)公司的信用風(fēng)險(xiǎn)進(jìn)行了預(yù)測(cè)。 Orgler(1970)首次將線性回歸分析引入消費(fèi)者貸款的信用風(fēng)險(xiǎn)評(píng)估,利用線性回歸分析設(shè)計(jì)了一個(gè)評(píng)價(jià)未償還貸款的評(píng)分卡。Fitzpatrick(1976) 、Lucas(1992)、Henley(1995)等也先后將這種方法用于構(gòu)建個(gè)人信用評(píng)分模型。Myers & Forgy(1963)認(rèn)為這兩種方法對(duì)于降低商業(yè)銀行等機(jī)構(gòu)的壞賬損失有很大的幫助。Reichert (1983)也發(fā)現(xiàn)運(yùn)用這兩種方法構(gòu)建的個(gè)人信用評(píng)分模型在預(yù)測(cè)消費(fèi)信貸風(fēng)險(xiǎn)時(shí)都表現(xiàn)出了很強(qiáng)的穩(wěn)健性。Rosenberg & Gleit(1994)在他們的研究中也表示了與Reichert相似的贊同觀點(diǎn)。但Eisenbeis (1977)認(rèn)為只有在客戶分類較少的時(shí)候,基于判別分析和多元線性回歸方法建立的個(gè)人信用評(píng)分模型才會(huì)有好的效果。
Wiginton(1980)首次嘗試了在信用評(píng)分模型中使用Logistic回歸方法,并與判別分析法進(jìn)行了比較。但由于Logistic回歸法沒有變量正態(tài)性假設(shè)的要求,因此被學(xué)者認(rèn)為是最適合發(fā)展信用評(píng)分模型的理論。并且由于該法使用的前提假設(shè)少,建立的個(gè)人信用評(píng)分模型具有相當(dāng)?shù)臏?zhǔn)確性和穩(wěn)定性,因此成為了設(shè)計(jì)個(gè)人信用評(píng)分模型的主要方法,并且延續(xù)至今。
最近鄰分析方法最先是由Fix & Hodges(1952)提出的,它是一種標(biāo)準(zhǔn)的非參數(shù)分類技術(shù),通常被用來(lái)解決概率密度函數(shù)的估計(jì)和分類問(wèn)題。它的思想很簡(jiǎn)單,就是把預(yù)測(cè)目標(biāo)分為兩類,當(dāng)一個(gè)新的預(yù)測(cè)目標(biāo)加入時(shí),就將其并入最鄰近一類中。Chatterjee & Barcun(1970)首次將最近鄰法用于個(gè)人信用評(píng)分模型。Hand(1981)利用家庭貸款的數(shù)據(jù)對(duì)最近鄰法與決策樹進(jìn)行了比較,結(jié)果最近鄰法得到了相當(dāng)高的預(yù)測(cè)精度。
Mangasarian(1965)第一個(gè)意識(shí)到可以將線性規(guī)劃方法應(yīng)用于分類問(wèn)題。但是直到Freed & Glover( 1981a ,b)的文章發(fā)表以后,才引起了更多人的興趣。此后,有關(guān)的研究文獻(xiàn)大量涌現(xiàn)。Joachimsthaler & Stam(1990)就這一領(lǐng)域的70多篇文獻(xiàn)進(jìn)行了綜述。有些學(xué)者則對(duì)統(tǒng)計(jì)學(xué)方法與線性規(guī)劃方法的效果進(jìn)行了比較,盡管在Nath ,Jackson & Jones(1992)的研究中認(rèn)為統(tǒng)計(jì)學(xué)方法要比線性規(guī)劃方法好。
1990年Odom(1990) 首次將神經(jīng)網(wǎng)絡(luò)方法引入信用風(fēng)險(xiǎn)評(píng)估中。Desai等(1996,1997)、West(2000) 等人使用神經(jīng)網(wǎng)絡(luò)方法構(gòu)造了個(gè)人信用評(píng)分模型,并通過(guò)實(shí)證分析驗(yàn)證了在各種特征變量呈復(fù)雜的非線性關(guān)系的情況下,神經(jīng)網(wǎng)絡(luò)方法具有明顯的優(yōu)勢(shì)。
決策樹方法,也叫分類樹或遞歸分割法,通過(guò)使用一種分割方法,將原始樣本集遞歸分割成不相交的子集,目的是使期望損失達(dá)到最小。最早將決策樹方法用于信用評(píng)分的研究是Makowski(1985)。 Coffman(1986)將決策樹方法與判別分析方法進(jìn)行了比較,發(fā)現(xiàn)當(dāng)變量存在相關(guān)性時(shí),決策樹方法的表現(xiàn)較好。Carter & Catlett(1987) , Mehta(1988)等把這一方法應(yīng)用到信用評(píng)分領(lǐng)域。
遺傳算法是對(duì)一個(gè)問(wèn)題的潛在解的種群進(jìn)行系統(tǒng)的搜索,使得與解決問(wèn)題相近的解保留在候選解中的可能性比其他解要大。遺傳算法最早是由Holland(1975) 提出的。Albright(1994)首次將遺傳算法應(yīng)用于信用聯(lián)盟評(píng)分卡的開發(fā)。Michalewicz(1996)提出了一些啟發(fā)性的規(guī)則, Yobas, Crook, & Ross (1997)運(yùn)用遺傳算法并使用一個(gè)不同的函數(shù)對(duì)建立信用評(píng)分模型作了探討。
專家系統(tǒng)是仿效專家的決策行為的過(guò)程的集合,它由自然語(yǔ)言組成,將專家的意見匯入計(jì)算機(jī)中,專家系統(tǒng)能夠提高預(yù)測(cè)“壞”客戶的準(zhǔn)確性。主要的研究有Zocco(1985) , Davis(1987) , Leonard(l993a,b)、 Tessmer & Richey(1997) 等。Davis, Edelman & Gammerman (1992) 將Bayesian專家系統(tǒng)用于信用卡申請(qǐng)者的分類問(wèn)題,并將結(jié)果與神經(jīng)網(wǎng)絡(luò)方法的結(jié)果進(jìn)行了比較。Talebzadeh, Mandutianu & Winner (1994)依據(jù)專家系統(tǒng)設(shè)計(jì)出了抵押貸款的個(gè)人信用評(píng)分模型。Leonard (1993)則利用專家系統(tǒng)成功預(yù)測(cè)了信用卡用戶的違約率。Hand, Mcconway, & Stanghellini(1997), Sewart & Whittaker(1998)等則論述了運(yùn)用繪圖的方法可以更容易確定個(gè)人信用風(fēng)險(xiǎn)的全部因素。
二、行為評(píng)分(behavioral scoring)
一般信用評(píng)分模式只考慮申請(qǐng)者本身的條件是否良好,未考慮外在環(huán)境變化。行為評(píng)分是一種統(tǒng)計(jì)專門技術(shù),它是在一般信用評(píng)分的基礎(chǔ)上考慮到時(shí)間因素發(fā)展而來(lái)的。研究的主要目標(biāo)是通過(guò)預(yù)測(cè)現(xiàn)有授信客戶的未來(lái)行為幫助借貸機(jī)構(gòu)在管理客戶時(shí)作出更好的決策。
行為評(píng)分模型主要分為兩種方法,一種是申請(qǐng)?jiān)u分模型和額外信息變量的組合,另一種是建立客戶行為的概率模型。根據(jù)估計(jì)參數(shù)信息的獲取方式不同,后一種方法又分為兩類,一是從以前的客戶中抽樣,二是使用貝葉斯方法,即根據(jù)顧客自己的行為更新公司對(duì)客戶的信任度。概率模型本質(zhì)上是馬爾可夫鏈,顧客可以從一個(gè)狀態(tài)跳到另一個(gè)狀態(tài)。
有關(guān)第一類行為評(píng)分的研究有:Cyert, Davidson & Thompson(1962) 用馬爾柯夫鏈方法研究在貸款到期以后的不同時(shí)期,預(yù)計(jì)不可回收的貸款數(shù)目(C-D-T模型)。后來(lái)不少學(xué)者對(duì)C-D-T模型進(jìn)行了修正。Van Kuelen et al. (1981)的主要修正在于考慮了過(guò)期賬戶的部分還款事實(shí)。Corcoran (1978)指出如果對(duì)于不同特征的賬戶給出不同的轉(zhuǎn)移矩陣,系統(tǒng)將會(huì)更加穩(wěn)定。Fryman et al. (1985)區(qū)分了移動(dòng)者(movers)和停留者(stayers)這兩種客戶類型,發(fā)現(xiàn)后者更傾向于維持現(xiàn)有狀態(tài)。Banasik et al. (1996)的研究指出如果對(duì)客戶群體的分類不是足夠清晰,在實(shí)際應(yīng)用中得到的信用評(píng)分并不十分有效。
關(guān)于第二類行為評(píng)分的研究,最早基于Bayesian定理的概率模型是Bierman & Hausman( 1970)提出的。這一模型中,還款概率不是根據(jù)以前客戶的樣本得出的,而是被看作一個(gè)參數(shù)滿足Beta分布的Bernoulli隨機(jī)變量。Dirickx & Wakeman(1976)以及Srinivasan & Kim (1987)分別對(duì)該模型做了擴(kuò)展。Thomas (1994)將這一模型進(jìn)行了修正,他不僅把還款概率作為隨機(jī)變量,還把最大可能的還款金額也作為隨機(jī)變量,根據(jù)已經(jīng)還款的情況,這些隨機(jī)變量不斷被按Bayesian方法修正。
三、利潤(rùn)評(píng)分(profit scoring)
個(gè)人信用評(píng)分模型的研究目標(biāo)由客戶違約率最小化向公司從該客戶賺取利潤(rùn)最大化轉(zhuǎn)變, 是國(guó)外個(gè)人信用評(píng)分模型研究的前沿之一,也是信用評(píng)分領(lǐng)域近幾年來(lái)的研究熱點(diǎn)。這方面正在嘗試的方法大體上可以分成以下四種。
第一種是在現(xiàn)有的評(píng)分模型上建立的,估計(jì)違約率、交易量、接受和損失的比例,并根據(jù)不同測(cè)度下的得分對(duì)總體進(jìn)行細(xì)分,對(duì)不同的群體定義利潤(rùn)。Oliver(1993)首先使用該方法,并考察如果顧客有了“交易利潤(rùn)得分”和“違約得分”,那么決策規(guī)則是什么的問(wèn)題。 Fishelson-Holstine(1998)討論了運(yùn)用利潤(rùn)的兩種類型來(lái)細(xì)分顧客的問(wèn)題。Li & Hand (1997)則建議不估計(jì)最終的利潤(rùn),也不直接估計(jì)違約標(biāo)準(zhǔn),而是估計(jì)中間變量,如節(jié)余、購(gòu)買額等,然后使用這些因素估計(jì)最終的收入。Hand, McConway & Stanghellini(1997), Sewart & Whittaker(1998)認(rèn)為應(yīng)該根據(jù)違約率、交易量、接受和損失率來(lái)綜合考慮利潤(rùn)。
第二種類似于信用評(píng)分中的回歸方法,把利潤(rùn)表達(dá)成申請(qǐng)表格中定性變量的線性函數(shù)。Lai & Ying(1994)進(jìn)行了這方面的研究。
第三種是使用馬爾可夫鏈方法來(lái)進(jìn)行行為評(píng)分,以開發(fā)出更精確的消費(fèi)者行為隨機(jī)模型。Cyert et al (1962)對(duì)一個(gè)產(chǎn)品案例的利潤(rùn)進(jìn)行了建模分析,當(dāng)這些方法用于估計(jì)相同產(chǎn)品的顧客群體的壞賬準(zhǔn)備金時(shí),結(jié)果表明應(yīng)用非常成功。
第四種是成功地處理遺失數(shù)據(jù)的一種統(tǒng)計(jì)建模技術(shù)。人們?cè)噲D根據(jù)有限的數(shù)據(jù)來(lái)估計(jì)消費(fèi)者的長(zhǎng)期利潤(rùn)。Narain (1992)是第一個(gè)建議人們?cè)谛庞迷u(píng)分上使用該方法的學(xué)者,而Banasik et al (1999)的論文顯示人們也可以使用競(jìng)爭(zhēng)風(fēng)險(xiǎn)的思想來(lái)對(duì)消費(fèi)者什么時(shí)候會(huì)違約和什么時(shí)候會(huì)預(yù)先付款進(jìn)行估計(jì),這樣在一個(gè)分析中可以同時(shí)考慮違約率和流失率。Stepanova和Thomas(2001)利用PHAB模型進(jìn)行行為評(píng)分研究,結(jié)果顯示該模型在預(yù)測(cè)風(fēng)險(xiǎn)和預(yù)測(cè)利潤(rùn)兩個(gè)方面都有很好的表現(xiàn)。Stepanova和Thomas(2002)研究了比例風(fēng)險(xiǎn)模型(即Cox模型)的三種擴(kuò)展形式,研究表明該模型不論在預(yù)測(cè)風(fēng)險(xiǎn)還是在預(yù)測(cè)利潤(rùn)方面都非常有效。他們還提出了三個(gè)改進(jìn):在變量屬性分類方面提出了coarse-classifying的分類方法;在模型擬合度的檢驗(yàn)上提出了多個(gè)診斷方法;在數(shù)據(jù)處理上應(yīng)反應(yīng)其變化。Baesens, Stepanova和Vanthienen(2003)提出了幾種神經(jīng)網(wǎng)絡(luò)生存模型,認(rèn)為神經(jīng)網(wǎng)絡(luò)生存模型克服了比例風(fēng)險(xiǎn)模型要求輸入函數(shù)形式是線性的缺點(diǎn),并分別用神經(jīng)網(wǎng)絡(luò)生存模型與傳統(tǒng)的比例風(fēng)險(xiǎn)模型的性能進(jìn)行了比較。
四、考慮經(jīng)濟(jì)環(huán)境因素的信用評(píng)分
一般的信用評(píng)分模型中,都沒有考慮經(jīng)濟(jì)環(huán)境等外在因素的影響,但經(jīng)濟(jì)周期等宏觀經(jīng)濟(jì)變量無(wú)疑與客戶違約率存在著密不可分的關(guān)系。隨著信用評(píng)分技術(shù)方法的日益豐富以及計(jì)算機(jī)通信技術(shù)的迅猛發(fā)展,使得把經(jīng)濟(jì)環(huán)境因素整合到信用評(píng)分模型中成為必要和可能。其研究的主要目標(biāo)是通過(guò)將經(jīng)濟(jì)環(huán)境變量、申請(qǐng)表特征變量和現(xiàn)有客戶行為變量三者共同引入評(píng)分模型,以使得考慮的因素更充分,模型更加穩(wěn)定,生命周期更長(zhǎng)。
Crook, Hamilton & Thomas( 1992)證實(shí)了當(dāng)經(jīng)濟(jì)處于衰退期時(shí),即使信用歷史良好的顧客也會(huì)出現(xiàn)違約的情況。Zandi(1998)調(diào)查了美國(guó)90年代的情況,認(rèn)為違約率上升的主要原因在于信用標(biāo)準(zhǔn)的降低,因?yàn)榻鹑跈C(jī)構(gòu)為了爭(zhēng)取信用卡客戶和國(guó)內(nèi)的貸款人,調(diào)低了他們的授信界限。關(guān)于個(gè)人破產(chǎn)對(duì)經(jīng)濟(jì)變量的回歸分析表明,經(jīng)濟(jì)狀況的確對(duì)違約有顯著的影響。
構(gòu)造同經(jīng)濟(jì)環(huán)境、申請(qǐng)表變量和消費(fèi)者行為相聯(lián)系的更嚴(yán)格的模型的一種方法是使用圖形方法和貝葉斯學(xué)習(xí)網(wǎng)絡(luò)。Sewart & Whittaker (1998)以及Hand et al (1997)指出這些技術(shù)對(duì)于檢驗(yàn)自變量和因變量間的關(guān)系非常有用。Fung指出,使用模擬和馬爾可夫的思想對(duì)信用評(píng)分的內(nèi)容可以擬合得很好,由此分析可得到一個(gè)評(píng)分模型。
五、結(jié)論
個(gè)人信用評(píng)分的研究目標(biāo)和方向一直在不斷發(fā)生著變化,當(dāng)前研究的重點(diǎn)是將風(fēng)險(xiǎn)管理目標(biāo)從客戶違約可能性最小化調(diào)整到如何使公司從該客戶賺取的利潤(rùn)最大化。另外,信用評(píng)分的目的也從最初的評(píng)估違約風(fēng)險(xiǎn),逐步擴(kuò)大到評(píng)估響應(yīng)、使用、保持、流失、負(fù)債管理、以及欺詐評(píng)分。這也為今后這一領(lǐng)域的研究指明了新的方向和道路。
參考文獻(xiàn):
[1]Capon, N, Credit Scoring Systems: A Critical Analysis, Journal of Marketing,1982,46:82-91
[2]Srinivasan V.and Kim, Y .H. Credit Granting: A Comparative Analysis of Classification Procedures. Journal of Finance,1987,42:665-683
[3]Hand, D. J. Discrimination and Classification. John Wiley, Chichester,U.K,1981
[4]Henley, W .E and Hand, D. J.A k-nearest Neighbor Classifier for Assessing Consumer Credit Risk,Tire Statistician, 1996,45:77-95
[5]Desai, V. S.,Crook, J. N. and Overstreet, G. A. A Comparison of Neural Networks and Linear Scoring Models in the Credit Environment. European Journal of Operational Research,1996,95:24-37
隨著電子信息技術(shù)的迅速發(fā)展和信息處理自動(dòng)化需求的不斷擴(kuò)大,模式識(shí)別方法和技術(shù)在信息處理領(lǐng)域中的重要性越來(lái)越受到重視。在吸引了眾多研究者投身到模式識(shí)別研究領(lǐng)域的同時(shí),模式識(shí)別的教學(xué)也從研究生教學(xué)逐漸延伸到了本科教學(xué)。模式識(shí)別作為計(jì)算機(jī)、電子信息技術(shù)等專業(yè)的專業(yè)基礎(chǔ)課程,已經(jīng)在越來(lái)越多的高等院校開設(shè)。本科模式識(shí)別課程主要討論以統(tǒng)計(jì)學(xué)為基礎(chǔ)的模式識(shí)別理論和方法,內(nèi)容包括:貝葉斯決策理論以及參數(shù)估計(jì)方法、以誤差函數(shù)最小化為原則的線性和非線性判別、近鄰規(guī)則、特征提取和選擇、聚類分析、神經(jīng)網(wǎng)絡(luò)、支撐矢量機(jī)、隨機(jī)方法、非度量方法、獨(dú)立于算法的機(jī)器學(xué)習(xí)等內(nèi)容[1]。由于模式識(shí)別研究領(lǐng)域的廣泛性,模式識(shí)別本科教學(xué)的內(nèi)容和側(cè)重點(diǎn)的安排目前尚處于探索階段。模式識(shí)別領(lǐng)域的發(fā)展日新月異,這就要求教師在授業(yè)解惑的同時(shí)能夠與時(shí)俱進(jìn)地介紹該領(lǐng)域的發(fā)展前沿,從而培養(yǎng)學(xué)生主動(dòng)探索知識(shí)的興趣。
本文將結(jié)合本科模式識(shí)別教學(xué)的實(shí)踐,分析該課程在內(nèi)容設(shè)置方面面臨的問(wèn)題并給出相應(yīng)的解決問(wèn)題的建議;結(jié)合模式識(shí)別課程的特點(diǎn),提出了以應(yīng)用實(shí)例為先導(dǎo)的教學(xué)方法,以提高學(xué)生的學(xué)習(xí)興趣;針對(duì)不同類型的學(xué)生,提出了如何培養(yǎng)學(xué)生實(shí)踐能力和科研興趣的方法。
1模式識(shí)別教學(xué)內(nèi)容的層次劃分和講授方法
模式識(shí)別是一門理論與實(shí)踐緊密結(jié)合的學(xué)科,其理論基礎(chǔ)涉及高等數(shù)學(xué)、線性代數(shù)、數(shù)理統(tǒng)計(jì)、矩陣論、隨機(jī)過(guò)程、工程優(yōu)化方法、小樣本統(tǒng)計(jì)學(xué)習(xí)理論、模糊數(shù)學(xué)等學(xué)科[2]。然而除了高等數(shù)學(xué)、線性代數(shù)和數(shù)理統(tǒng)計(jì),其他課程都是研究生階段才會(huì)開設(shè)的數(shù)學(xué)基礎(chǔ)課。這就使得本科的模式識(shí)別教學(xué)面臨著尷尬的局面:既不能花過(guò)多的時(shí)間講數(shù)學(xué)基礎(chǔ)知識(shí),又要把以這些數(shù)學(xué)知識(shí)為基礎(chǔ)的內(nèi)容講清楚。面對(duì)這一難題,我們?cè)诮虒W(xué)實(shí)踐中總結(jié)出了一套辦法,具體做法是將教學(xué)內(nèi)容劃分為基礎(chǔ)型、前沿型兩類;并采用弱化公式推導(dǎo),強(qiáng)調(diào)數(shù)學(xué)表達(dá)式物理含義的方法進(jìn)行講授。
基礎(chǔ)型教學(xué)指的是已經(jīng)發(fā)展完善的模式識(shí)別原理和方法?;A(chǔ)型內(nèi)容包括:貝葉斯決策理論、概率密度函數(shù)估計(jì)、線性判別、近鄰規(guī)則、獨(dú)立于算法的機(jī)器學(xué)習(xí)等內(nèi)容。貝葉斯決策理論和概率密度函數(shù)估計(jì)是以數(shù)理統(tǒng)計(jì)為基礎(chǔ)的[3],這一部分也是模式識(shí)別的重點(diǎn)內(nèi)容。線性判別是以高等數(shù)學(xué)和線性代數(shù)為基礎(chǔ),同時(shí)涉及工程優(yōu)化方法課程的部分內(nèi)容。在這部分內(nèi)容中,公式推導(dǎo)占據(jù)了相當(dāng)大的篇幅,而且推導(dǎo)過(guò)程是學(xué)生可以理解和掌握的。對(duì)于基礎(chǔ)型的內(nèi)容,可以采取理論推導(dǎo)和實(shí)際例子相結(jié)合的講授方式。在公式推導(dǎo)的過(guò)程中,尤其要強(qiáng)調(diào)公式的物理含義,同時(shí)給出幾個(gè)有趣的例子,在增強(qiáng)記憶加深理解的同時(shí)提高學(xué)生的學(xué)習(xí)興趣。
前沿型教學(xué)指的是正在發(fā)展中的模式識(shí)別原理和方法。前沿型內(nèi)容包括:特征提取和選擇、聚類分析、神經(jīng)網(wǎng)絡(luò)、支撐矢量機(jī)、隨機(jī)方法等內(nèi)容。這部分內(nèi)容或者是數(shù)學(xué)基礎(chǔ)超出了本科生的能力范圍,或者處于發(fā)展前沿,很多內(nèi)容正處于探討階段。對(duì)于前沿型的內(nèi)容,可以忽略公式推導(dǎo)過(guò)程,直接講授推導(dǎo)的結(jié)論以及結(jié)論的物理含義,同樣結(jié)合實(shí)際例子加深學(xué)生的理解。對(duì)于發(fā)展中的模式識(shí)別方法可以適當(dāng)介紹該領(lǐng)域的發(fā)展前沿,在開拓視野的同時(shí)激發(fā)學(xué)生的科研興趣,引導(dǎo)部分學(xué)生從事感興趣的科學(xué)領(lǐng)域的研究。
2實(shí)例先導(dǎo)的教學(xué)方法
模式識(shí)別方法是為了解決信息處理中面臨的識(shí)別問(wèn)題而提出的。在講授方法之前,首先要明確將要介紹的模式識(shí)別方法的應(yīng)用背景和使用范圍,而不是像我們通常做的那樣,先介紹方法的理論基礎(chǔ)和流程,最后再給出一個(gè)例子,或者通過(guò)課后練習(xí)和作業(yè)的形式讓學(xué)生掌握課程介紹的理論和方法的應(yīng)用。針對(duì)本科模式識(shí)別課程的特點(diǎn),我們?cè)诮虒W(xué)實(shí)踐中摸索出了一套以實(shí)例為先導(dǎo)的教學(xué)方法,并與上機(jī)實(shí)驗(yàn)和課程設(shè)計(jì)相結(jié)合,大大提高了學(xué)生的學(xué)習(xí)興趣和動(dòng)手能力,取得了良好的教學(xué)效果。
實(shí)例先導(dǎo)的教學(xué)方法是在介紹每一章或者相關(guān)的幾章內(nèi)容之前首先用一個(gè)實(shí)際的例子引出要學(xué)習(xí)的內(nèi)容,在相關(guān)內(nèi)容的學(xué)習(xí)結(jié)束之后給出解決實(shí)例問(wèn)題的模式識(shí)別方法。例如:在講授貝葉斯決策理論之前,給出根據(jù)長(zhǎng)度和光澤度等數(shù)值特征識(shí)別鮭魚和鱸魚的例子[4];在講授決策樹之前,給出根據(jù)顏色,形狀、尺寸等非度量特征識(shí)別水果的例子等等。通過(guò)學(xué)習(xí),找到了解決這類問(wèn)題的一般方法,同時(shí)學(xué)生也通過(guò)實(shí)例記住并理解了該方法的適用范圍。又例如在講授特征的選擇與提取這一章時(shí),先不講特征空間的映射和變換,而是從幾個(gè)實(shí)例出發(fā),說(shuō)明并不是特征越多越好,而是要選擇合適的特征向量;特征的組合變換可以使復(fù)雜的分類問(wèn)題轉(zhuǎn)化為簡(jiǎn)單的問(wèn)題等。從而讓學(xué)生更好地理解特征選擇和提取的目的和重要性。
在接觸到實(shí)際的模式識(shí)別問(wèn)題時(shí),會(huì)引發(fā)學(xué)生的思考。在授課過(guò)程中,教師可以針對(duì)具體問(wèn)題組織學(xué)生進(jìn)行討論,看是否能夠利用已學(xué)過(guò)的模式識(shí)別方法解決該問(wèn)題。若可以解決,則引導(dǎo)學(xué)生分析用已學(xué)方法解決該問(wèn)題時(shí)存在的不足,從而引出下面將要介紹的新方法。這樣,在介紹新方法的同時(shí),學(xué)生會(huì)很自然地將新方法與舊的方法進(jìn)行比較,分析各種方法的優(yōu)劣,有利于學(xué)生對(duì)教學(xué)內(nèi)容的深入理解和掌握。這種方法在講授解決同一類模式識(shí)別問(wèn)題的不同方法時(shí)是適用的。如在講授貝葉斯決策時(shí),可以通過(guò)對(duì)比的方式介紹幾種決策規(guī)則的特點(diǎn),又如在講授線性判別方法中各種形式的感知器算法時(shí),也可以對(duì)比學(xué)習(xí)各種算法的優(yōu)劣。若該模式識(shí)別問(wèn)題不能用已學(xué)的方法解決,則引導(dǎo)學(xué)生分析該模式識(shí)別問(wèn)題的特點(diǎn),思考為何必須引入新的模式識(shí)別方法來(lái)解決該問(wèn)題,學(xué)生是否能夠提出自己的解決方案。在分析和思考之后,教師再將解決該問(wèn)題的思路引入到下面將要介紹的新方法上。這種方法在講授解決不同類型的模式識(shí)別問(wèn)題時(shí)是適用的。如在講授非度量模式識(shí)別方法時(shí),面對(duì)非度量語(yǔ)義屬性的模式識(shí)別問(wèn)題是前面介紹的方法無(wú)法解決的,要引入非度量模式識(shí)別方法加以解決。
因此我們建議在教材的編寫上可以嘗試采用實(shí)例先導(dǎo)的方法。首先在引言部分給出一個(gè)實(shí)際例子,然后在介紹方法的部分結(jié)合理論分析給出解決實(shí)例問(wèn)題的方法。這種方法有利于提高學(xué)生的學(xué)習(xí)興趣,增強(qiáng)記憶,加深理解。
3實(shí)踐能力和科研興趣的培養(yǎng)
模式識(shí)別是一門理論和實(shí)踐緊密結(jié)合的科學(xué),該學(xué)科的發(fā)展日新月異,在計(jì)算機(jī)和信息處理領(lǐng)域的地位越來(lái)越重要。因此,在模式識(shí)別課程的教學(xué)過(guò)程中要注重學(xué)生實(shí)踐能力和科研興趣的培養(yǎng)。在教學(xué)實(shí)踐中,我們采用了上機(jī)實(shí)驗(yàn)和科學(xué)報(bào)告相結(jié)合的教學(xué)方式。
掌握各種模式識(shí)別方法的原理和流程是本科模式識(shí)別教學(xué)的第一個(gè)階段。在此基礎(chǔ)上,我們要求學(xué)生在計(jì)算機(jī)上實(shí)現(xiàn)模式識(shí)別方法并用于解決實(shí)際的模式識(shí)別問(wèn)題。在上機(jī)實(shí)現(xiàn)的過(guò)程中,學(xué)生不僅需要掌握模式識(shí)別問(wèn)題在計(jì)算機(jī)中的表示方法和識(shí)別結(jié)果的展示形式,尤其重要的是學(xué)生需要對(duì)模式識(shí)別方法的每一個(gè)細(xì)節(jié)都要深入理解和掌握才能將算法實(shí)現(xiàn)。在上機(jī)教學(xué)中,我們采用了Matlab編程環(huán)境實(shí)現(xiàn)課程中介紹的模式識(shí)別方法。Matlab的編程語(yǔ)言簡(jiǎn)單高效,而且提供了功能強(qiáng)大的圖形展示功能[5]。例如在貝葉斯決策和線性分類器的上機(jī)實(shí)驗(yàn)中,學(xué)生可以利用畫圖函數(shù)用不同的顏色和符合標(biāo)記不同類別的樣本,可以輕松地畫出決策面,這種可視化的分類結(jié)果展示形式不僅提高了學(xué)生的學(xué)習(xí)興趣,而且加深了學(xué)生對(duì)模式識(shí)別方法及其特點(diǎn)的理解。
在學(xué)生成績(jī)考核中,除了筆試成績(jī)我們還增設(shè)了上機(jī)作業(yè)成績(jī)和科學(xué)報(bào)告成績(jī)兩個(gè)部分。上機(jī)作業(yè)的內(nèi)容是要求學(xué)生從若干個(gè)上機(jī)題目中選擇有興趣的實(shí)現(xiàn)一個(gè)簡(jiǎn)單的模式識(shí)別系統(tǒng)。例如設(shè)計(jì)實(shí)現(xiàn)貝葉斯分類器、線性分類器、神經(jīng)網(wǎng)絡(luò)分類器、決策樹等??茖W(xué)報(bào)告可以有兩種形式,要求學(xué)生或者在模式識(shí)別領(lǐng)域的主流英文期刊上選擇感興趣的英文文獻(xiàn),將其翻譯為中文;或者就模式識(shí)別領(lǐng)域的一個(gè)感興趣的話題談?wù)勛约旱目捶ê椭鲝垺Mㄟ^(guò)上機(jī)作業(yè)和科學(xué)報(bào)告的形式,學(xué)生的動(dòng)手能力得到了良好的鍛煉。不僅提高了學(xué)生的學(xué)習(xí)熱情,而且引導(dǎo)學(xué)生積極思考,不少同學(xué)在科學(xué)報(bào)告中提出了自己的學(xué)術(shù)看法和主張,有些內(nèi)容頗具獨(dú)到的見解。
在學(xué)生成績(jī)考核中,除了筆試成績(jī)我們還增設(shè)了上機(jī)作業(yè)成績(jī)和科學(xué)報(bào)告成績(jī)兩個(gè)部分。上機(jī)作業(yè)的內(nèi)容是要求學(xué)生從若干個(gè)上機(jī)題目中選擇有興趣的實(shí)現(xiàn)一個(gè)簡(jiǎn)單的模式識(shí)別系統(tǒng)。例如設(shè)計(jì)實(shí)現(xiàn)貝葉斯分類器、線性分類器、神經(jīng)網(wǎng)絡(luò)分類器、決策樹等??茖W(xué)報(bào)告可以有兩種形式,要求學(xué)生或者在模式識(shí)別領(lǐng)域的主流英文期刊上選擇感興趣的英文文獻(xiàn),將其翻譯為中文;或者就模式識(shí)別領(lǐng)域的一個(gè)感興趣的話題談?wù)勛约旱目捶ê椭鲝?。通過(guò)上機(jī)作業(yè)和科學(xué)報(bào)告的形式,學(xué)生的動(dòng)手能力得到了良好的鍛煉。不僅提高了學(xué)生的學(xué)習(xí)熱情,而且引導(dǎo)學(xué)生積極思考,不少同學(xué)在科學(xué)報(bào)告中提出了自己的學(xué)術(shù)看法和主張,有些內(nèi)容頗獨(dú)到的見解。
4結(jié)語(yǔ)
本科模式識(shí)別教學(xué)由于學(xué)生的數(shù)學(xué)基礎(chǔ)有限而面臨著兩難的境地。既要把原理和方法講清楚,又不能過(guò)多的涉及復(fù)雜的數(shù)學(xué)推導(dǎo),這給教學(xué)帶來(lái)很大困難。在教學(xué)實(shí)踐中,我們把教學(xué)內(nèi)容劃分為基礎(chǔ)型、前沿型兩類,并提出了弱化公式推導(dǎo),強(qiáng)調(diào)公式的物理含義,以及結(jié)合實(shí)例增強(qiáng)記憶的教學(xué)方法。為了提高學(xué)生的學(xué)習(xí)興趣,加深理解,我們提出了實(shí)例先導(dǎo)的教學(xué)方法。用實(shí)際例子引導(dǎo)學(xué)生思考,加深學(xué)生對(duì)模式識(shí)別方法應(yīng)用背景和適用范圍的理解。模式識(shí)別是實(shí)踐性很強(qiáng)的科學(xué),并且該學(xué)科的發(fā)展十分迅速。在教學(xué)實(shí)踐中,我們十分重視學(xué)生動(dòng)手能力和科研興趣的培養(yǎng)。通過(guò)上機(jī)作業(yè)和科學(xué)報(bào)告的形式引導(dǎo)學(xué)生積極動(dòng)手,積極思考。
參考文獻(xiàn):
[1] 邊肇祺,張學(xué)工. 模式識(shí)別[M]. 2版. 北京:清華大學(xué)出版社. ,2002:9-303.
[2] 顧波. 模式識(shí)別本科教學(xué)方法淺談[J]. 中國(guó)科教創(chuàng)新導(dǎo)刊.,2010(4):68.
[3] Andrew R. Webb. 統(tǒng)計(jì)模式識(shí)別[M]. 2版. 王萍,等,譯. 北京:電子工業(yè)出版社,2004:1-10.
[4] Richard O. Duda,Peter E. Hart,David G. Stork. 模式分類[M]. 2版. 李宏?yáng)|,姚天翔,等,譯. 北京:機(jī)械工業(yè)出版社. ,2003.
[5] 楊淑瑩. 模式識(shí)別與智能計(jì)算:Matlab技術(shù)實(shí)現(xiàn)[M]. 北京:電子工業(yè)出版社,2008:1-300.
Teaching Practices on Undergraduate Patten Recognition Course andCurriculum Reforming
QI Yu-tao1,2, LIU Fang 1,2, JIAO Li-cheng 2
B(Bond)債券(B)是社會(huì)經(jīng)濟(jì)主體為籌集負(fù)債資金而向投資人出具的承諾,并按一定利率定期支付利息,到期償還本金的債權(quán)債務(wù)憑證。如國(guó)債等。
C (Costs)成本(C)是企業(yè)為生產(chǎn)一定產(chǎn)品而發(fā)生的生產(chǎn)經(jīng)營(yíng)費(fèi)用。根據(jù)成本總額與產(chǎn)量和銷售量之間的依存關(guān)系形成的成本習(xí)性將產(chǎn)品成本分為固定成本FC(Fixed Cost)、變動(dòng)成本VC(Variable Cost)、半變動(dòng)成本SC(Semi variable Cost)
D (Dividends)股利(D)亦稱股息,它是股東憑股票定期從公司領(lǐng)取的盈利,主要有現(xiàn)金股利CD(Cash Dividends)、股票股利SD(Stock Dividends)、財(cái)產(chǎn)股利PD(Property Dividends)三種形式。
E(Earnings Before Interest and Taxes)息稅前盈余(EBIT)是指支付利息和繳納所得稅前的利潤(rùn),又稱營(yíng)業(yè)利潤(rùn),其計(jì)算公式為:EBIT=S-VC-FC或者(Earnings Per Share)每股盈余(EPS)是指普通股每股稅后利潤(rùn)。
F (Future value)終值(F)是指資金未來(lái)的價(jià)值。計(jì)算公式:F=P(1+i)n. G (Goals of financial management)財(cái)務(wù)管理的目標(biāo)又稱理財(cái)目標(biāo),是指企業(yè)進(jìn)行財(cái)務(wù)活動(dòng)所要達(dá)到的根本目的,它決定企業(yè)財(cái)務(wù)管理基本方向。主要有以下目標(biāo):利潤(rùn)最大化(Profit Maximization)、每股盈余最大化(Earnings Per Share Maximization)、股東財(cái)富最大化(Stockholder Maximization)、企業(yè)價(jià)值最大化(Company Maximization)。
H(Historic cost Method)歷史成本法就是根據(jù)企業(yè)的成本數(shù)據(jù),按照成本習(xí)性的原理,運(yùn)用數(shù)學(xué)方法來(lái)預(yù)測(cè)成本變動(dòng)的趨勢(shì)。是統(tǒng)計(jì)學(xué)中常用的趨勢(shì)分析法在財(cái)務(wù)管理上的具體運(yùn)用。除此之外,還有比率分析法、因素分析法。
I (Interest)利息(i)是指資金在周轉(zhuǎn)使用過(guò)程中,由于時(shí)間因素而形成的絕對(duì)差額價(jià)值。計(jì)息方式有兩種:?jiǎn)卫?jì)息(Simple Interest)和復(fù)利計(jì)息(Compound Interest)。
或者(Invesentment)投資(I)是指投放財(cái)力于一定對(duì)象,以期望未來(lái)獲得收益的經(jīng)濟(jì)行為。某項(xiàng)目原始投資額為I0. J (joint venture)合資企業(yè)(企業(yè)聯(lián)營(yíng))指在自愿互利的基礎(chǔ)上,由兩個(gè)以上具有法人地位企業(yè),在同一個(gè)生產(chǎn)過(guò)程或相關(guān)的生產(chǎn)過(guò)程中組成的經(jīng)濟(jì)聯(lián)合體。
K(Cost of Capital)資金成本(通常用K表示)是企業(yè)為籌集和使用資金而付出的代價(jià)。包括籌集費(fèi)用和使用費(fèi)用。
L(leverage)在公司理財(cái)中,杠桿(L)是指一個(gè)公司運(yùn)用固定成本性質(zhì)的資產(chǎn)或資金來(lái)擴(kuò)張利潤(rùn)的能力。當(dāng)杠桿作用程度愈大時(shí),公司利潤(rùn)愈不穩(wěn)定,風(fēng)險(xiǎn)越大。杠桿分二種:經(jīng)營(yíng)杠桿與財(cái)務(wù)杠桿;相應(yīng)的風(fēng)險(xiǎn)有經(jīng)營(yíng)風(fēng)險(xiǎn)與財(cái)務(wù)風(fēng)險(xiǎn)。我們通過(guò)計(jì)算杠桿系數(shù)來(lái)衡量企業(yè)二種風(fēng)險(xiǎn)的強(qiáng)弱。在財(cái)務(wù)管理教學(xué)中,要分別計(jì)算財(cái)務(wù)杠桿系數(shù)DFL(Degree of Financial Leverage),經(jīng)營(yíng)杠桿系數(shù)DOL(Degree of Operating Leverage),復(fù)合杠桿系數(shù)DTL(Degree of Total Leverage)。
M(merger)兼并又稱合并,指兩家公司以上的公司組合成一家公司,原公司的權(quán)力與義務(wù)由存續(xù)(或)新設(shè)的公司承擔(dān)。與之相對(duì)應(yīng)的是收購(gòu)(acquisition),又稱收買,指并購(gòu)公司購(gòu)買目標(biāo)公司的資產(chǎn)、營(yíng)業(yè)部門或股票。二者合起簡(jiǎn)稱并購(gòu)(M&A)。
N (net present value)凈現(xiàn)值(NPV)是指投資項(xiàng)目投入使用后的凈現(xiàn)金流量(NCF),按資本成本(K)或企業(yè)要求達(dá)到的報(bào)酬率折算為現(xiàn)值,減去初始投資后的余額(I0)。
O(Owners Equity)所有者權(quán)益(O)是企業(yè)投資者對(duì)企業(yè)凈資產(chǎn)的所有權(quán),包括投資者對(duì)企業(yè)的投入資本、企業(yè)存續(xù)過(guò)程中形成的資本公積、盈余公積、未分配利潤(rùn)。另外還有資產(chǎn)A(Assets)、負(fù)債D(Debt)。
P(Present Value)現(xiàn)值(P)就是以后年份收到或付出資金的現(xiàn)在價(jià)值。計(jì)算公式:P=F(1+i)-n. PI現(xiàn)值指數(shù)亦稱獲利能力指數(shù),是指項(xiàng)目未來(lái)投資收益現(xiàn)值與初始投資額的現(xiàn)值的比值?,F(xiàn)值指數(shù)法決策規(guī)則:根據(jù)PI>1,判斷該投資項(xiàng)目可行;PI〈1,該投資項(xiàng)目不可行;PI=1,投資不獲利。
Q(Economic Order Quantity)經(jīng)濟(jì)批量(EOQ)是指能夠使一定時(shí)期存貨的總成本達(dá)到最低點(diǎn)的進(jìn)貨數(shù)量。計(jì)算公式:
R(Internal Rate of Return)內(nèi)部報(bào)酬率(IRR,簡(jiǎn)稱r)又稱內(nèi)含報(bào)酬率,是使投資項(xiàng)目的凈現(xiàn)值等于零的貼現(xiàn)率。實(shí)際上反映了投資項(xiàng)目的真實(shí)報(bào)酬率。
S (Stocks)股票是股份公司為籌集自由資金而發(fā)行的有價(jià)證券,是持股人擁有公司股份的入股憑證,它代表持股人在公司中擁有的所有權(quán)。按股東權(quán)利和義務(wù)分為普通股(Common Stock)和優(yōu)先股(Preferred Stock)。
T(Taxes)企業(yè)所得稅(T)是對(duì)除外商投資企業(yè)以外的所有在我國(guó)境內(nèi)注冊(cè)、登記的,實(shí)行獨(dú)立核算的企業(yè)或組織運(yùn)用的稅種。其所得額為納稅年度的收入總額減去準(zhǔn)予扣除項(xiàng)目后的余額,其稅率統(tǒng)一以33%計(jì)征,對(duì)應(yīng)納所得款在60萬(wàn)元以下的,還規(guī)定了相應(yīng)的優(yōu)惠稅率。
U(Units of Production)產(chǎn)量折舊法是將折舊總額按固定資產(chǎn)使用期完成的總產(chǎn)量或總工作量計(jì)算分?jǐn)偟礁髌诔杀竞唾M(fèi)用的一種方法,是折舊計(jì)算的最基本方法。除此之外,還有雙倍余額遞減法、年數(shù)總和法。
V(Value)股票的價(jià)值(V)指預(yù)期的未來(lái)現(xiàn)金流入的現(xiàn)值。為了與股票的市價(jià)區(qū)分,有時(shí)也稱股票的內(nèi)在價(jià)值,它是股票的真實(shí)價(jià)值,也叫理論價(jià)值。
W(Weighted average)加權(quán)平均是一種統(tǒng)計(jì)計(jì)算方法,在財(cái)務(wù)管理中經(jīng)常運(yùn)用。如加權(quán)平均資金成本W(wǎng)ACC(Weighted average Cost of Capital)。
中圖分類號(hào): TN919?34; TP391.41 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2015)06?0101?04
New and old banknotes′ classification based on transmission images
QI Lei, REN Ming?wu
(School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)
Abstract: Classification of new or old banknotes is a important function in the banknote sorter. The transmission image is adopted in this paper to detect new or old banknotes. It is different from the traditional new or old banknote detection based on reflection images. According to the new or old degree of banknotes, all banknote samples are divided into three grades. The new or old banknote detection method based on gray level image brightness and pattern recognition method are used respectively. The histogram distribute of transmission image is used as feature of new or old banknotes. The KNN and SVM classifier are employed to carry out classification. A new cascade classifier which combines SVM and KNN is put forward. Test proves the new cascade classifier is more effective than SVM and KNN in detection of new or old banknotes.
Keywords: transmission image; pattern recognition; SVM; cascade classifier
0 引 言
紙幣清分機(jī)是一種集光機(jī)電磁于一體的高端金融現(xiàn)金處理設(shè)備,其主要功能是對(duì)紙幣進(jìn)行面值、面向、新舊程度及紙幣序列號(hào)的識(shí)別。紙幣清分機(jī)挑選適合在市場(chǎng)中流通的紙幣、高效地代替了人工選擇可流通紙幣的工作。當(dāng)紙幣流通時(shí)間過(guò)長(zhǎng)時(shí),表面會(huì)出現(xiàn)粗糙、模糊、磨損等現(xiàn)象。過(guò)舊的紙幣影響了紙幣的真?zhèn)舞b別、冠字號(hào)識(shí)別等,導(dǎo)致貨幣在市場(chǎng)中的流通帶來(lái)了不便。根據(jù)中國(guó)人民銀行的《不宜流通人民幣挑剔標(biāo)準(zhǔn)》,過(guò)舊的紙幣不宜流通,因此紙幣清分機(jī)中需要具有檢測(cè)紙幣新舊的功能來(lái)滿足這樣的需求。
早期國(guó)外曾根據(jù)紙幣在清分機(jī)中與傳送帶的摩擦聲音來(lái)判別新舊[1],但該技術(shù)已被數(shù)字圖像技術(shù)[2]所代替。目前,國(guó)內(nèi)紙幣清分機(jī)產(chǎn)品多采用基于數(shù)字圖像技術(shù)做相關(guān)研究[3]。紙幣新舊識(shí)別成為紙幣清分算法的核心和難點(diǎn),而且新舊等級(jí)分的越多,難度越大。目前國(guó)內(nèi)外現(xiàn)有的紙幣新舊檢測(cè)方法有基于紙幣反光強(qiáng)度的新舊判別[4?5],基于多光譜彩色圖像的新舊判別[2],基于標(biāo)準(zhǔn)圖像進(jìn)行灰度直方圖匹配來(lái)判斷紙幣新舊[6] 等。目前,對(duì)于紙幣的新舊檢測(cè)大多基于反射圖像的亮度。近年來(lái)也出現(xiàn)了將紙幣的新舊檢測(cè)轉(zhuǎn)換為模式識(shí)別的問(wèn)題,首先提取紙幣圖像上的有效特征,然后使用分類器來(lái)進(jìn)行新舊識(shí)別[7?8]。
本文將紙幣的新舊程度劃分為3個(gè)等級(jí),使用紙幣的透射圖像對(duì)紙幣進(jìn)行新舊判斷,分別采用了紙幣透射圖像平均亮度劃分圖像等級(jí)和傳統(tǒng)的模式識(shí)別的方法,提取了紙幣透射圖像的灰度直方圖分布作為紙幣新舊檢測(cè)特征,并分別采用了KNN(k近鄰),SVN(Support Vector Machine支持向量機(jī))分類器,并提出了一種簡(jiǎn)單的級(jí)聯(lián)分類器。
1 圖像數(shù)據(jù)說(shuō)明
本文通過(guò)人工劃分的方式將100元人民幣劃分為新舊程度不同的3個(gè)等級(jí),并且對(duì)于新舊程度不同的紙幣分別收集了170張,其中100張作為訓(xùn)練樣本,70張作為測(cè)試樣本。將所有收集得到的紙幣采用圖像傳感器進(jìn)行雙面采樣,獲得兩張圖像,白背景圖像中的奇偶行分別對(duì)應(yīng)紙幣的透射圖像和反射圖像,黑背景圖像中的奇偶行分別對(duì)應(yīng)圖像的反射圖像和彩色圖像如圖1所示。本文只使用了紙幣的透射圖像,只需要將白色背景的圖像提取出來(lái),無(wú)需判斷紙幣圖像的正反面。本文采集到的所有紙幣透射圖像都已確定4個(gè)角的坐標(biāo)位置。
<E:\王芳\現(xiàn)代電子技術(shù)201506\現(xiàn)代電子技術(shù)15年38卷第6期\Image\14T1.tif>
圖1 原始采樣數(shù)據(jù)分割
2 基于圖像亮度的紙幣新舊檢測(cè)
目前,針對(duì)于紙幣的新舊檢測(cè)提出的大多數(shù)方法都與紙幣的亮度有關(guān),因?yàn)樾屡f紙幣在圖像采集的時(shí)候反光的強(qiáng)弱不同,所得圖像的明暗有差異,因此可以根據(jù)紙幣圖像的亮度判定紙幣的新舊等級(jí)。常用的方法有使用紙幣空白區(qū)域的平均亮度,紙幣反射圖像某固定區(qū)域的平均灰度值。使用反射圖像進(jìn)行新舊檢測(cè)時(shí),必須先確定紙幣圖像的面向,還要定位到紙幣的固定的區(qū)域。對(duì)于紙幣透射圖像,無(wú)論采集到的圖像是紙幣的正面或反面,所得的透射圖像都一樣,所以采用紙幣的透射圖像就不需要檢測(cè)紙幣的面向。采用圖像的部分區(qū)域進(jìn)行檢測(cè)時(shí),當(dāng)此區(qū)域存在涂污時(shí),對(duì)紙幣的新舊檢測(cè)結(jié)果產(chǎn)生影響。本文采用完整的紙幣透射圖像亮度的平均值檢測(cè)紙幣的新舊,具有更好的魯棒性。
在所有訓(xùn)練樣本和測(cè)試樣本中,已經(jīng)準(zhǔn)確標(biāo)記了紙幣的4個(gè)頂點(diǎn)的坐標(biāo)。這樣就可以得到紙幣邊緣具置,可以利用行掃描,來(lái)統(tǒng)計(jì)每張紙幣的所有點(diǎn)的灰度值的和,然后求得其平均值,根據(jù)平均值與自己設(shè)定的標(biāo)準(zhǔn)進(jìn)行比較就可以得到紙幣的新舊等級(jí)。但由于紙幣在流通的過(guò)程中會(huì)出現(xiàn)磨損,完整的紙幣圖像經(jīng)常存在一些噪聲,例如對(duì)于過(guò)舊的紙幣中往往存在細(xì)小的孔洞區(qū)域和圖像邊緣檢測(cè)并非很精確(會(huì)殘留一些白色背景區(qū)域),這就導(dǎo)致了所統(tǒng)計(jì)的透射圖像的像素點(diǎn)中存在白色的噪聲區(qū)域如圖2所示,因此首先統(tǒng)計(jì)紙幣透射圖像的灰色直方圖,然后將根據(jù)紙幣圖像的直方圖去除亮度前%α的點(diǎn)和后%α的點(diǎn),最后計(jì)算所有剩余像素點(diǎn)的平均灰度值。
<E:\王芳\現(xiàn)代電子技術(shù)201506\現(xiàn)代電子技術(shù)15年38卷第6期\Image\14T2.tif>
圖2 原始圖像
基于紙幣透射圖像平均亮度檢測(cè)新舊,具體步驟如下:
(1) 統(tǒng)計(jì)訓(xùn)練樣本中新舊程度最新的樣本(本文為等級(jí)1)紙幣透射圖像的灰度直方圖,并去除最亮的前%α和最暗的前%α,計(jì)算每張紙幣的平均亮度,最后計(jì)算所有樣本平均亮度設(shè)為[vmax]。同理計(jì)算得到訓(xùn)練樣本中新舊程度最舊樣本(本文為等級(jí)3)的平均亮度設(shè)為[vmin]。
(2) 統(tǒng)計(jì)待檢測(cè)的樣本的灰度平均值,方法同(1),得到紙幣透射圖像的亮度為[v]。
step3判定新舊等級(jí),根據(jù)以下公式:
[d=v-vminvmax-vmin 等級(jí)1, d>t1等級(jí)3, d<t2等級(jí)2, 其他]
式中[t1]、[t2]根據(jù)多次實(shí)驗(yàn)獲得的閾值。
3 基于模式識(shí)別方法的紙幣新舊檢測(cè)
紙幣的新舊檢測(cè)除了采用圖像的整體平均亮度值,近年來(lái)也出現(xiàn)了將紙幣的新舊檢測(cè)轉(zhuǎn)換為模式識(shí)別的問(wèn)題,例如文獻(xiàn)[9]基于BP?LVQ神經(jīng)網(wǎng)絡(luò)的紙幣新舊識(shí)別算法研究,首先提取紙幣圖像的新舊特征,然后將特征送給分類器識(shí)別,得到識(shí)別結(jié)果,具體過(guò)程如圖3所示。
3.1 特征提取
紙幣圖像的新舊特征一般采用灰度直方圖的分布統(tǒng)計(jì),新舊紙幣的差異不僅反映在紙幣灰度圖像的平均值上,在灰度直方圖的分布中也有所差異。越新的紙幣圖像灰度直方圖波峰靠后,越舊的紙幣圖像直方圖波峰靠前。對(duì)于紙幣透射圖像也存在同樣的表現(xiàn)如圖4所示,分別為新舊等級(jí)一、二、三紙幣透射圖像直方圖統(tǒng)計(jì)分布。統(tǒng)計(jì)每張紙幣透射圖像的直方圖,得到256維的特征向量。所得到的特征向量中與基于亮度檢測(cè)新舊具有同樣的問(wèn)題,圖像中的最亮和最暗區(qū)域存在一定的噪聲,使用上述相同的方法去除亮度前%α的點(diǎn)和后%α的點(diǎn)后統(tǒng)計(jì)直方圖,得到256維紙幣新舊特征,并歸一化特征向量。
<E:\王芳\現(xiàn)代電子技術(shù)201506\現(xiàn)代電子技術(shù)15年38卷第6期\Image\14T3.tif>
圖3 模式識(shí)別方法的流程
<E:\王芳\現(xiàn)代電子技術(shù)201506\現(xiàn)代電子技術(shù)15年38卷第6期\Image\14T4.tif>
圖4 不同新舊程度的直方圖
3.2 KNN
K近鄰法(K?nearest neighbor,KNN)是由Cover和Hart在1968年提出的[10],它是最近鄰法的推廣形式,其主要的決策方法也是類似的,當(dāng)k=1時(shí)就是最近鄰法。K?近鄰法是通過(guò)找到與待識(shí)別樣本點(diǎn)最近的k個(gè)樣本點(diǎn),根據(jù)這k個(gè)訓(xùn)練樣本的類別,通過(guò)多數(shù)表決等方式進(jìn)行預(yù)測(cè)。因此k近鄰法不具有顯示的學(xué)習(xí)過(guò)程。k近鄰法實(shí)際上利用訓(xùn)練數(shù)據(jù)集對(duì)特征向量空間進(jìn)行劃分,并作其分類的“模型”[11],K近鄰法中的距離度量一般選用歐式距離。
假設(shè)訓(xùn)練樣本一共有[N]個(gè),并且分為[n]個(gè)類別分別為[w1,w2,…,wn],待識(shí)別樣本為[x],在[N]個(gè)樣本中找出與[x]最近[k]個(gè)樣本,假設(shè)這[k]個(gè)樣本中來(lái)自[w1]類的有[k1]個(gè),來(lái)自[w2]類的有[k2]個(gè),以此類推,來(lái)自[wn]類的有[kn]個(gè),其中[k=i=1nki],定義判別函數(shù):
[gi(x)=ki, i=1,2,…,n]
判別決策規(guī)則:如果
[gj(x)=arg maxi ki , i=1,2,…,n]
則待識(shí)別樣本[x∈wj]。
3.3 支持向量機(jī)
支持向量機(jī)(Support Vector Machine,SVM)是Cortes和Vapnik于1995年首先提出的[12],支持向量機(jī)就是能夠找出超平面并把空間中的樣本進(jìn)行分類的問(wèn)題,使其間隔最大化。該方法是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理找到最優(yōu)決策超平面從而實(shí)現(xiàn)分類。假設(shè)有訓(xùn)練樣本集
[T={(x1,y1),(x2,y2),…,(xN,yN)},xi∈RN,yi∈{-1,+1}]
式中:[xi]為第i個(gè)特征向量,[yi]為[xi]的類標(biāo)記,當(dāng)[yi=+1]時(shí),[xi]為正實(shí)例,當(dāng)[yi=-1]時(shí),[xi]為負(fù)實(shí)例,[(xi,yi)]稱為樣本點(diǎn)。假定訓(xùn)練樣本集是線性可分的,學(xué)習(xí)的目標(biāo)是找到最佳決策超平面,能將實(shí)例分為不同的兩類。分離超平面方程為:
[w?x+b=0]
分類超平面將特征空間劃分為兩部分,一部分是負(fù)類,一部分是正類,法向量[w]垂直于超平面并指向正類部分。
一般情況下,當(dāng)可知訓(xùn)練樣本可以線性分開的時(shí)候,則幾何空間中存在了無(wú)窮多個(gè)分類超平面可以將訓(xùn)練樣本分開。但是支持向量機(jī)利兩個(gè)平行向量之間距離最大化求得了最優(yōu)的分類超平面,這時(shí)的解是惟一的,圖5為樣本在線性可分情況下的支持向量示意圖。
<E:\王芳\現(xiàn)代電子技術(shù)201506\現(xiàn)代電子技術(shù)15年38卷第6期\Image\14T5.tif>
圖5 SVM線性可分
從圖5可以看出,相同的樣本訓(xùn)練機(jī)可以有不同的劃分,(b)圖代表著線性可分支持向量機(jī),其中虛線代表最優(yōu)的分類超平面,與分類超平面最近的樣本點(diǎn)稱為支持向量。從圖5中可以看出,此時(shí)兩條實(shí)線之間的間隔最大。對(duì)于線性不可分的樣本,可引入松弛變量加以解決。對(duì)于SVM分類器進(jìn)行訓(xùn)練就是求解[w]和[b]的過(guò)程,具體過(guò)程參考文獻(xiàn)[13]。
有時(shí)分類問(wèn)題不是線性可分的,這時(shí)就不能用線性可分支持向量機(jī)來(lái)解決問(wèn)題,如圖6所示。
<E:\王芳\現(xiàn)代電子技術(shù)201506\現(xiàn)代電子技術(shù)15年38卷第6期\Image\14T6.tif>
圖6 SVM線性不可分
非線性問(wèn)題的實(shí)質(zhì)就是把能夠?qū)⑵滢D(zhuǎn)化成線性問(wèn)題。所用的方法,就是構(gòu)造一個(gè)非線性變換,將樣本點(diǎn)的特征從一個(gè)低維線性不可分空間映射到一個(gè)高維線性可分空間。這里,就引入了核函數(shù)的概念。
設(shè)[χ]是輸入空間,H為特征空間,如果存在一個(gè)[χ]到H的映射[φ(x):χH]對(duì)所有的[x,z∈χ]都成立,函數(shù)[K(x,z)]滿足條件
[K(x,z)=φ(x)?φ(z)]
則稱[K(x,z)]為核函數(shù),[φ(x)]為映射函數(shù),[φ(x)?φ(z)]為[φ(x)]和[φ(z)]的內(nèi)積。
若直接將輸入數(shù)據(jù)映射到高維空間可能出現(xiàn)維度爆炸現(xiàn)象,可采用核函數(shù)在低維空間進(jìn)行計(jì)算,不需要顯示的寫出映射后的結(jié)果,其處理后的結(jié)果與高維映射等效。
3.4 級(jí)聯(lián)分類器
為得到更高的紙幣新舊檢測(cè)的準(zhǔn)確率,本文設(shè)計(jì)了一種級(jí)聯(lián)分類器SVM?KNN來(lái)判定紙幣新舊等級(jí)如圖7所示,第一級(jí)分類器采用SVM,第二級(jí)分類器采用KNN,首先使用訓(xùn)練樣本對(duì)SVM分類器進(jìn)行訓(xùn)練,得到SVN分類器的模型參數(shù)。
當(dāng)對(duì)待檢測(cè)樣本[x]進(jìn)行分類時(shí),先經(jīng)過(guò)SVM分類器進(jìn)行分類,獲得分類概率最大的兩類分別為[w1],[w2],概率分別為[p1]、[p1],當(dāng)[p1-p2<T](其中[T]為設(shè)定閾值)進(jìn)入下一級(jí)分類器KNN,分類得到分類結(jié)果,否則直接在本級(jí)分類器中分類,分類結(jié)果為[w1],[w2]中可能性最大的一類。
<E:\王芳\現(xiàn)代電子技術(shù)201506\現(xiàn)代電子技術(shù)15年38卷第6期\Image\14T7.tif>
圖7 級(jí)聯(lián)分類器
4 實(shí)驗(yàn)結(jié)果與分析
本文將紙幣新舊程度人工劃分成三個(gè)等級(jí),一共有300張紙幣透射圖像用于訓(xùn)練,210張紙幣透射圖像用于測(cè)試。其中每個(gè)等級(jí)紙幣透射圖像分別有100張訓(xùn)練樣本和70張測(cè)試樣本,本文分別實(shí)驗(yàn)了基于透射圖像亮度的新舊判別和傳統(tǒng)的模式識(shí)別方法,本文采用紙幣透射圖像灰度直方圖的分布作為新舊判別的特征,使用了KNN,SVM,和級(jí)聯(lián)分類器分別實(shí)驗(yàn)。基于透射圖像亮度檢測(cè)紙幣新舊時(shí)參數(shù)α,[t1],[t2]分別設(shè)為5,0.65,0.2。SVM分類器使用了臺(tái)灣大學(xué)LIBSVM[14],并選用RBF核,閾值[T]設(shè)為0.2。實(shí)驗(yàn)具體結(jié)果如表1所示。
表1 實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)結(jié)果表明在檢測(cè)紙幣的新舊等級(jí)實(shí)驗(yàn)中使用模式識(shí)別的方法明顯優(yōu)于使用圖像亮度特征的方法,將SVM分類器和KNN線性級(jí)聯(lián)使用的效果要優(yōu)于它們單獨(dú)使用,由于人工選擇紙幣新舊程度還存在一定偏差,在一定程度上也影響了新舊檢測(cè)的整體結(jié)果。經(jīng)試驗(yàn)分析誤識(shí)別結(jié)果一般為相鄰的兩類新舊等級(jí)之間。
5 結(jié) 語(yǔ)
與傳統(tǒng)使用紙幣反射圖像檢測(cè)新舊等級(jí)不同,本文使用了紙幣的透射圖像對(duì)紙幣的新舊等級(jí)進(jìn)行檢測(cè),分別采用了基于圖像整體平均亮度的方法和傳統(tǒng)的模式識(shí)別方法,選用紙幣透射圖像灰度直方圖的分布作為紙幣新舊判別特征,分別使用了KNN,SVM和SVM?KNN線性級(jí)聯(lián)的分類器。由于人工劃分紙幣新舊等級(jí)存在一定的誤差,對(duì)于具體的新舊等級(jí)判別的界定比較模糊,如何解決這些問(wèn)題并提高分類等級(jí)的準(zhǔn)確性是本文后續(xù)研究的重點(diǎn)。
參考文獻(xiàn)
[1] TERANISHI M, OMATU S, KOSAKA T. Neuro?classification of currency fatigue levels based on acoustic cepstrum patterns [J]. JACIII, 2000, 4(1): 18?23.
[2] 李朝.紙幣清分機(jī)圖像處理系統(tǒng)研究[D]. 湘潭:湘潭大學(xué),2012.
[3] 譚家國(guó).紙幣圖像高速采集系統(tǒng)設(shè)計(jì)[D].鞍山:遼寧科技大學(xué),2012.
[4] 魏巍.CF1000型紙幣清分機(jī)圖像識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].哈爾濱:哈爾濱工業(yè)大學(xué),2011.
[5] 郭玉佳.紙幣圖像處理技術(shù)研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2009.
[6] 許萬(wàn)征.紙幣多光譜圖像分析方法[D].哈爾濱:哈爾濱工業(yè)大學(xué),2010.
[7] 李慶峰.基于圖像處理的紙幣清分系統(tǒng)關(guān)鍵算法研究[D].北京:中國(guó)科學(xué)院,2006.
[8] 魏軍.紙幣動(dòng)態(tài)檢測(cè)識(shí)別算法研究[D].哈爾濱:哈爾濱理工大學(xué),2009.
[9] 王洪,陳麗,肖思寧.基于BP?LVQ神經(jīng)網(wǎng)絡(luò)的紙幣識(shí)別算法研究[J].光學(xué)與光電技術(shù),2010,8(4):64?67.
[10] COVER T, HART P. Nearest neighbor pattern classification [J]. IEEE Transactions on Information Theory, 1967, 13(1): 21?27.
[11] 李航.統(tǒng)計(jì)學(xué)習(xí)方法[M].北京:清華大學(xué)出版社,2012.
分類號(hào) B849:C93
網(wǎng)上購(gòu)物是個(gè)人通過(guò)Internet購(gòu)買商品或享受服務(wù)。購(gòu)物者可以瀏覽網(wǎng)上商品目錄,比較、選擇滿意的商品或服務(wù),通過(guò)Internet下訂單,網(wǎng)上付款或離線付款,賣方處理訂單,網(wǎng)上送貨或離線送貨,完成整個(gè)網(wǎng)上購(gòu)物的過(guò)程。1998年以來(lái),我國(guó)網(wǎng)上購(gòu)物飛速發(fā)展,表現(xiàn)為電子商務(wù)網(wǎng)站的增多和上網(wǎng)人數(shù)的增長(zhǎng)[1]。易觀國(guó)際《互聯(lián)網(wǎng)研究系列報(bào)告-電子商務(wù)(2004)》顯示,2004年中國(guó)電子交易總額達(dá)4,400億人民幣,而2005年預(yù)計(jì)將激增至6,200億人民幣。相對(duì)于傳統(tǒng)的購(gòu)物形式來(lái)說(shuō),網(wǎng)上購(gòu)物有七大優(yōu)勢(shì)[2],如購(gòu)物時(shí)間隨意安排,缺貨情況很少出現(xiàn),信息充足,搜尋方便,價(jià)格相對(duì)更低等。按照決策之前進(jìn)行調(diào)查分析的程度,網(wǎng)上購(gòu)物消費(fèi)者一般可分為沖動(dòng)型、耐心型和分析型三種,按他們之前進(jìn)行計(jì)劃的詳細(xì)性,網(wǎng)上購(gòu)物行為一般劃分為專門計(jì)劃型、一般計(jì)劃型、提醒型和完全無(wú)計(jì)劃型[3]。其中,前兩種類型的區(qū)別在于消費(fèi)者是否已經(jīng)選擇好了制造商。
網(wǎng)上購(gòu)物滿足了在線購(gòu)物者的特定需求,但仍存在著許多問(wèn)題。一個(gè)對(duì)用戶為什么不打算進(jìn)行網(wǎng)上購(gòu)物的調(diào)查發(fā)現(xiàn)[4],對(duì)產(chǎn)品質(zhì)量不了解占34.6%,認(rèn)為售后服務(wù)與廠商信用得不到保障的占33.5%,還有30.3%的人認(rèn)為網(wǎng)上購(gòu)物不安全。可見,為促進(jìn)網(wǎng)上購(gòu)物的發(fā)展,有必要從消費(fèi)者的購(gòu)物行為與網(wǎng)上信息行為角度作深度分析,以期加強(qiáng)網(wǎng)上購(gòu)物對(duì)消費(fèi)者的影響,并尋求可能的改進(jìn)策略。
學(xué)術(shù)界對(duì)于消費(fèi)者購(gòu)物決策的研究,大多關(guān)注在傳統(tǒng)的購(gòu)物方式的決策模型,對(duì)網(wǎng)上購(gòu)物決策模型研究較少且零散,也較少關(guān)注兩者發(fā)展過(guò)程中的連續(xù)性和共存性。基于這一點(diǎn),筆者在介紹兩種不同的購(gòu)物方式的消費(fèi)者決策模型的同時(shí),提出了綜合性的消費(fèi)者購(gòu)物決策模型,并認(rèn)為,網(wǎng)上搜尋、網(wǎng)下購(gòu)買的消費(fèi)者決策過(guò)程并不是消費(fèi)者從傳統(tǒng)購(gòu)物方式到網(wǎng)上購(gòu)物的過(guò)渡階段,而是像這兩種購(gòu)物方式所涉及的決策過(guò)程一樣,是一個(gè)獨(dú)立的決策類型。
1 傳統(tǒng)的消費(fèi)者決策模型
消費(fèi)者的購(gòu)買活動(dòng)表面上是為了直接獲得商品,實(shí)際上是為了從商品中獲得某些滿足。因此,經(jīng)濟(jì)學(xué)家將作為決策論、對(duì)策論和數(shù)理經(jīng)濟(jì)學(xué)的基礎(chǔ)之一的效用理論(Utility Theory)應(yīng)用于消費(fèi)理論研究,認(rèn)為消費(fèi)者消費(fèi)商品的數(shù)量和其獲得的效用有密切關(guān)系[5]。但是,效用理論并沒有提出消費(fèi)者決策模型,只是傳達(dá)了一種思想:首先是“經(jīng)濟(jì)人”假設(shè),即假定市場(chǎng)中的消費(fèi)者都是理性決策者。假定消費(fèi)者是在一系列約束條件下(如收入等)追求效用最大化的個(gè)體,而且被假定為是合乎理性的。消費(fèi)者知道自己的需要,也知道滿足需要的方法。因此,根據(jù)邊際效用遞減原理,消費(fèi)者作出決策,如信息搜索、選擇性評(píng)價(jià)等,都期望達(dá)到總效用的最大化。在“經(jīng)濟(jì)人”前提假設(shè)下,消費(fèi)者的消費(fèi)行為中也包含著大量的個(gè)人和情境變量。很多研究者從理論上提出了一些簡(jiǎn)單的消費(fèi)者購(gòu)物決策模型,來(lái)解釋消費(fèi)者的行為。其中,最主要的模型有三個(gè):Nicosia模型,Howard-Sheth模型和EBM模型[6]。后來(lái)的一些研究者致力于用數(shù)學(xué)模型來(lái)研究消費(fèi)者的行為,力圖在嚴(yán)格的假定下對(duì)消費(fèi)者的行為做出精確度解釋和預(yù)測(cè)[7,8]。這里,只介紹3個(gè)經(jīng)典的消費(fèi)者決策模型。
1.1 Nicosia模型
Francesco和Nicosia(1978)提出此模式,認(rèn)為消費(fèi)者行為源于廠商特性與消費(fèi)者特性,并把消費(fèi)者的購(gòu)物決策看成是一個(gè)四階段的決策過(guò)程:(1)根據(jù)廠商透露的信息形成態(tài)度;(2)信息收集與方案評(píng)估;消費(fèi)者主動(dòng)收集與產(chǎn)品有關(guān)信息作為評(píng)估標(biāo)準(zhǔn)并產(chǎn)生購(gòu)買動(dòng)機(jī)。(3)購(gòu)買行動(dòng);消費(fèi)者將動(dòng)機(jī)轉(zhuǎn)化為實(shí)際行動(dòng),并受產(chǎn)品評(píng)估準(zhǔn)則的影響。(4)信息反饋。消費(fèi)者使用過(guò)產(chǎn)品后的印象與經(jīng)驗(yàn)會(huì)影響再購(gòu)買行為。同時(shí)廠商根據(jù)消費(fèi)者的反應(yīng),亦獲得信息反饋并調(diào)整行銷組合。
1.2 Howard-Sheth模型
Howard-Sheth(1969)首先將滿意度概念應(yīng)用于消費(fèi)理論上,說(shuō)明一段時(shí)間內(nèi)消費(fèi)者對(duì)于品牌的選擇行為,其重點(diǎn)在于解釋是否會(huì)重復(fù)購(gòu)買某一品牌的產(chǎn)品。該模型把顧客滿意度界定為購(gòu)買者認(rèn)為其購(gòu)買某一產(chǎn)品的付出(如時(shí)間、金錢等)與其回報(bào)是否適當(dāng)?shù)囊环N認(rèn)知狀態(tài),這種認(rèn)知狀態(tài)決定了顧客是否重復(fù)購(gòu)買。因此,顧客對(duì)產(chǎn)品的認(rèn)知過(guò)程影響了其決策,消費(fèi)者決策過(guò)程事實(shí)上就是一個(gè)認(rèn)知的過(guò)程,在這個(gè)意義上,Howard-Sheth模型是一個(gè)認(rèn)知模型。
1.3 EBM模型
EBM模型是對(duì)EKB模型的發(fā)展。它嘗試從理論上去解釋消費(fèi)者的購(gòu)物決策過(guò)程,具有對(duì)不同情境的概括性和適用性,并與消費(fèi)者具體的決策行為相一致。它還考慮到一些購(gòu)物決策階段,如記憶、信息采集、考慮購(gòu)物的后果等。當(dāng)消費(fèi)者的實(shí)際狀態(tài)和期望狀態(tài)不平衡時(shí),就有了需求認(rèn)知,當(dāng)意識(shí)到自己的需求時(shí),就開始搜索信息,以滿足需求。消費(fèi)者根據(jù)自己頭腦中儲(chǔ)存的信息和從外部獲得的信息,得出自己的標(biāo)準(zhǔn),去評(píng)價(jià)和比較可能的選擇,產(chǎn)生一批偏好的選擇,并從中最后確定要購(gòu)買的物品,產(chǎn)生購(gòu)買行為。購(gòu)買后評(píng)價(jià)有助于制定以后的購(gòu)買決策:當(dāng)需要購(gòu)買相似的產(chǎn)品時(shí),好的經(jīng)驗(yàn)將提供信息,從而導(dǎo)致消費(fèi)者購(gòu)買該品牌的產(chǎn)品,而不滿意則會(huì)導(dǎo)致消費(fèi)者產(chǎn)生購(gòu)買后的心理失調(diào)。
EBM模型是一種解釋性的模型,它假定消費(fèi)者都是理性的,而且考慮了購(gòu)買后的效果是否與預(yù)期相一致,對(duì)預(yù)測(cè)很有用,因此,它幾乎可以用來(lái)解釋任何情境中的大量的研究結(jié)果。
1.4 三個(gè)模型對(duì)于理解網(wǎng)上購(gòu)物決策過(guò)程的可能意義
Nicosia模型著重強(qiáng)調(diào)消費(fèi)者與廠商之間信息交流的過(guò)程,它貫穿于消費(fèi)者購(gòu)買決策過(guò)程的始終,與Howard-Sheth模型相比,它更強(qiáng)調(diào)的是信息交流的過(guò)程是雙向的,而不僅僅是消費(fèi)者單向的認(rèn)知,也就是說(shuō),在消費(fèi)者購(gòu)物決策過(guò)程中,廠商也可以扮演主動(dòng)的角色,根據(jù)消費(fèi)者的信息反饋去相應(yīng)的調(diào)節(jié)營(yíng)銷組合,從而影響消費(fèi)者的認(rèn)知過(guò)程,并進(jìn)一步改變消費(fèi)者的行為。雖然是一個(gè)傳統(tǒng)的消費(fèi)者決策模型,Nicosia模型對(duì)信息交流的重視也為廠家重視網(wǎng)上購(gòu)物平臺(tái)的建構(gòu)提供了理論基礎(chǔ),通過(guò)這個(gè)平臺(tái),可以使完全無(wú)計(jì)劃購(gòu)物和提醒購(gòu)物的消費(fèi)者也能順利的作出網(wǎng)上購(gòu)物的決策。
Howard-Sheth模型可以看作是一個(gè)認(rèn)知模型,強(qiáng)調(diào)顧客滿意度對(duì)消費(fèi)者決策過(guò)程的影響。消費(fèi)者通過(guò)對(duì)付出與所得之間的對(duì)比,形成滿意或者不滿意的感覺,進(jìn)而決定消費(fèi)者的購(gòu)物行為。而EBM模型是一個(gè)典型的問(wèn)題解決模型,它把消費(fèi)者的購(gòu)物決策看成一個(gè)問(wèn)題解決的過(guò)程。一般的問(wèn)題解決模型由四個(gè)階段組成:對(duì)問(wèn)題的認(rèn)知、信息的尋求與評(píng)價(jià)、購(gòu)買活動(dòng)、購(gòu)買后的反應(yīng)。顯然,EBM模型只是將信息的尋求與評(píng)價(jià)這個(gè)階段分成了兩個(gè)具體的過(guò)程。因此,如果把信息的尋求這個(gè)階段的媒介具體化到網(wǎng)絡(luò)這個(gè)虛擬的平臺(tái)上,EBM模型就是一個(gè)簡(jiǎn)單適用的網(wǎng)上消費(fèi)者購(gòu)物決策模型。
可見,無(wú)論是Howard-Sheth模型,還是EBM模型,都強(qiáng)調(diào)了消費(fèi)者的認(rèn)知過(guò)程,而網(wǎng)上消費(fèi)者僅僅是通過(guò)網(wǎng)上商城的電子商務(wù)界面所提供的商品信息來(lái)了解商品,這種單一的視覺認(rèn)知過(guò)程也提醒廠商對(duì)建構(gòu)網(wǎng)上購(gòu)物平臺(tái)的關(guān)注和重視,一方面要提供貨真價(jià)實(shí)的產(chǎn)品,尤其是和網(wǎng)上商城界面上所提供的商品圖片及相關(guān)信息相符的產(chǎn)品,另一方面,需要重視通過(guò)每一次的接受訂單、配送商品、售后服務(wù)的流程,使消費(fèi)者感到滿意,從而提高商城的信譽(yù)。
2 網(wǎng)上消費(fèi)者購(gòu)物決策模型
傳統(tǒng)購(gòu)物模型雖然對(duì)于研究消費(fèi)者的網(wǎng)上購(gòu)物行為具有指導(dǎo)作用,但是,消費(fèi)者網(wǎng)上購(gòu)物決策行為仍然具有自己的特點(diǎn)。研究發(fā)現(xiàn),中國(guó)的網(wǎng)上消費(fèi)者,一般都是高學(xué)歷、高收入、年齡較輕、以及喜歡新事物的[9]。一份2000年對(duì)從事計(jì)算機(jī)及相關(guān)行業(yè)的“圈內(nèi)人”的調(diào)查結(jié)果表明[4],網(wǎng)上購(gòu)物的優(yōu)勢(shì)并不被“圈內(nèi)人”熟悉或認(rèn)可,大多數(shù)人進(jìn)行網(wǎng)上購(gòu)物并不是為了享受方便和快捷,而只是好奇或者為了跟上潮流,因此,他們的消費(fèi)金額很低。還有不少消費(fèi)者選擇了網(wǎng)上搜尋信息,網(wǎng)下購(gòu)買的消費(fèi)方式。目前,隨著家用電腦的普及,是否會(huì)有越來(lái)越多的人因?yàn)轶w會(huì)到網(wǎng)上購(gòu)物所固有的方便、快捷、價(jià)格便宜、個(gè)性化等優(yōu)勢(shì)而選擇這種消費(fèi)方式?而傳統(tǒng)的注重眼見為實(shí)的購(gòu)物習(xí)慣等網(wǎng)上購(gòu)物固有的劣勢(shì),以及曾經(jīng)擔(dān)心的安全、配送、質(zhì)量保證和售后服務(wù)等問(wèn)題,是否仍影響著消費(fèi)者的購(gòu)物決策過(guò)程?消費(fèi)者網(wǎng)上購(gòu)物決策有哪些特色?已有學(xué)者在這方面進(jìn)行研究并取得了一些研究結(jié)果。
2.1 兩階段模型
與傳統(tǒng)的購(gòu)物決策過(guò)程不同,網(wǎng)上購(gòu)物消費(fèi)者在購(gòu)物決策過(guò)程中,所面臨的是虛擬的、交互式的購(gòu)物環(huán)境,在這樣的環(huán)境中,消費(fèi)者很難去深入評(píng)價(jià)所有可能的選擇,因此,Häubl和Trifts提出了兩階段理論[10],認(rèn)為網(wǎng)上消費(fèi)者通過(guò)兩個(gè)階段的過(guò)程來(lái)作出他們的決定:第一階段,消費(fèi)者瀏覽大量有用的商品,并從中找出一些最有希望的選擇;第二階段,更深入的評(píng)價(jià)這些選擇,在一些重要品質(zhì)上在一些產(chǎn)品之間進(jìn)行對(duì)比,并作出購(gòu)買決策。因此,網(wǎng)上商店所提供的交互式的購(gòu)物工具在不同的階段作用不同:在第一階段,最初對(duì)可用的產(chǎn)品的搜索是為了決定哪些產(chǎn)品值得進(jìn)一步考慮,因此,交互式的購(gòu)物工具被稱為RA(recommendation agent,推薦),它使消費(fèi)者在網(wǎng)上購(gòu)物環(huán)境中能夠更有效的看到大量可用的產(chǎn)品信息,按照消費(fèi)者自身的效用評(píng)價(jià)標(biāo)準(zhǔn),給予不同的產(chǎn)品不同的權(quán)重和最小的可接受的品質(zhì)水平。從而使消費(fèi)者產(chǎn)生了一個(gè)個(gè)人購(gòu)物的可選擇清單;在第二階段,對(duì)已選擇出的商品進(jìn)行深入對(duì)比,從而作出購(gòu)買決策。因此,這一階段的決策工具被稱為CM(comparison matrix,對(duì)比矩陣),它幫助消費(fèi)者在已選擇的產(chǎn)品中進(jìn)行深入的對(duì)比,允許消費(fèi)者組織產(chǎn)品和屬性的信息,并在產(chǎn)品×屬性的矩陣中得到按照屬性分類的一些選擇。
2.2 信任導(dǎo)向觀點(diǎn)和頁(yè)面導(dǎo)向觀點(diǎn)
根據(jù)行為歸因理論并將其應(yīng)用到消費(fèi)者網(wǎng)上購(gòu)物行為領(lǐng)域,Jarvenpaa, Tractinsky, Vitale(2000)認(rèn)為,消費(fèi)者是否選擇網(wǎng)上購(gòu)買主要有兩個(gè)原因:對(duì)網(wǎng)上購(gòu)物的態(tài)度和對(duì)該網(wǎng)站知覺到的風(fēng)險(xiǎn),并提出,消費(fèi)者的風(fēng)險(xiǎn)認(rèn)知決定了消費(fèi)者的態(tài)度和意圖。但是,必須指出,這兒的風(fēng)險(xiǎn)認(rèn)知是對(duì)特定網(wǎng)站的認(rèn)知,而不是對(duì)網(wǎng)上購(gòu)物本身的認(rèn)知,為了彌補(bǔ)這個(gè)缺陷,持信任導(dǎo)向觀點(diǎn)的人提出,消費(fèi)者對(duì)公司的信任決定了他們的態(tài)度和認(rèn)知風(fēng)險(xiǎn),信任度越高,態(tài)度越好,知覺到的風(fēng)險(xiǎn)也越低。而消費(fèi)者對(duì)公司的信任由他們知覺到的公司大小和聲譽(yù)等因素決定,公司越大、信譽(yù)度越高,消費(fèi)者對(duì)公司就越信任。而Chau, Au,Tam根據(jù)技術(shù)認(rèn)可模型(Technology Acceptance Model, TAM)來(lái)解釋信息呈現(xiàn)和網(wǎng)上購(gòu)物意圖之間的聯(lián)系,提出頁(yè)面導(dǎo)向的觀點(diǎn),他們關(guān)注的是電子商務(wù)網(wǎng)站中的信息呈現(xiàn),他們認(rèn)為,電子商務(wù)網(wǎng)站的信息呈現(xiàn)越有效,越容易使用(如速度、使用方便等),消費(fèi)者對(duì)該網(wǎng)站的評(píng)價(jià)就越高,從而更易產(chǎn)生購(gòu)物意圖[11]。
2.3 態(tài)度和行為研究模型
不論是傳統(tǒng)的購(gòu)物決策模型,還是兩階段模型,都離不開四階段的固有模式,離不開總效用最大化的理論基礎(chǔ)。后來(lái)的研究者著力于對(duì)消費(fèi)者決策過(guò)程中一些具體影響因素的研究,試圖對(duì)這個(gè)模式進(jìn)行橫向或者縱向的具體化。Bellman,Lohse和Johnson(1999)調(diào)查了人口統(tǒng)計(jì)學(xué)特征、人格與網(wǎng)上購(gòu)物態(tài)度之間的關(guān)系[12],發(fā)現(xiàn)生活方式拘束、時(shí)間安排不自由的人更有可能經(jīng)常使用網(wǎng)上購(gòu)物。Bhatnagar,Misra和Rao(2000)調(diào)查了人口統(tǒng)計(jì)學(xué)因素,賣方/服務(wù)/產(chǎn)品特征和網(wǎng)頁(yè)的質(zhì)量如何影響消費(fèi)者的網(wǎng)上購(gòu)物態(tài)度以及他們相應(yīng)的網(wǎng)上購(gòu)物行為[13],發(fā)現(xiàn)Internet所提供的方便性與態(tài)度這個(gè)因變量正相關(guān),消費(fèi)者所認(rèn)識(shí)到的風(fēng)險(xiǎn)分別與行為這個(gè)因變量負(fù)相關(guān)。Jarvenpaa,Tractinsky和 Vitale(2000)調(diào)查了消費(fèi)者所認(rèn)識(shí)到的商店的大小和名聲是如何影響他們對(duì)商店的信任、感受到風(fēng)險(xiǎn)、態(tài)度和想要專門在這家商店買東西的意愿的[14],發(fā)現(xiàn)消費(fèi)者對(duì)商店的信任與商店的名聲和大小有正相關(guān)。高的信任感也減少了網(wǎng)上購(gòu)物所感受到的風(fēng)險(xiǎn)并更樂(lè)意專門在這家商店買東西。
Li Na和Zhang Ping總結(jié)了這些消費(fèi)者決策的影響因素及其如何影響的研究,提出了消費(fèi)者網(wǎng)上購(gòu)物態(tài)度和行為的研究模型,著重于態(tài)度和行為及其影響因素,如外部環(huán)境、人口統(tǒng)計(jì)變量、人格特征、賣方/服務(wù)/產(chǎn)品特征、網(wǎng)頁(yè)質(zhì)量等[15],著力于澄清這些因素和消費(fèi)者最后的決策之間的關(guān)系。
2.4 與傳統(tǒng)購(gòu)物決策模型的比較
從縱向看,傳統(tǒng)的購(gòu)物決策模型也可以容納網(wǎng)上購(gòu)物過(guò)程,但是,兩階段模型更強(qiáng)調(diào)了信息搜尋及評(píng)估的過(guò)程,而態(tài)度和行為研究模型在分析決策過(guò)程中的影響因素時(shí),體現(xiàn)了網(wǎng)上購(gòu)物的特色,信任導(dǎo)向觀點(diǎn)和頁(yè)面導(dǎo)向觀點(diǎn)更是致力于從網(wǎng)上購(gòu)物所固有的對(duì)電子商務(wù)網(wǎng)站的信任和頁(yè)面特點(diǎn)出發(fā),來(lái)研究消費(fèi)者決策??梢姡瑹o(wú)論是傳統(tǒng)的購(gòu)物方式,還是網(wǎng)上購(gòu)物,消費(fèi)者的決策過(guò)程都是大同小異的。但是,由于網(wǎng)上購(gòu)物環(huán)境獨(dú)特而又功能強(qiáng)大的搜索引擎,個(gè)性化的服務(wù)方式,使得網(wǎng)上購(gòu)物消費(fèi)者有了更多的信息搜尋和評(píng)價(jià)的機(jī)會(huì),增強(qiáng)了網(wǎng)絡(luò)用戶選擇商家的能力,也就更可能得到總效用最大化的結(jié)果。另一方面,由于網(wǎng)上購(gòu)物固有的劣勢(shì),如不符合人們的消費(fèi)習(xí)慣、網(wǎng)絡(luò)安全問(wèn)題等,習(xí)慣傳統(tǒng)購(gòu)物的消費(fèi)者在排斥網(wǎng)上購(gòu)物的同時(shí),可能并不排斥網(wǎng)上搜尋相關(guān)商品信息,因此,網(wǎng)上搜尋信息、網(wǎng)下購(gòu)買的新的購(gòu)物模式與傳統(tǒng)購(gòu)物模式相比,只有信息搜尋這一階段不同,與網(wǎng)上購(gòu)物模式相比,只有購(gòu)買這一階段不同,可以說(shuō)是介于傳統(tǒng)購(gòu)物模式和網(wǎng)上購(gòu)物模式之間的一個(gè)妥協(xié)型的嘗試。
因此,與傳統(tǒng)的問(wèn)題解決模型相比,網(wǎng)上消費(fèi)者購(gòu)物決策模型除了吸收上述傳統(tǒng)購(gòu)物模型的優(yōu)勢(shì)外,更注重網(wǎng)絡(luò)這個(gè)虛擬環(huán)境,網(wǎng)上消費(fèi)者的特點(diǎn)和網(wǎng)上購(gòu)物信息搜索的獨(dú)特工具,從而在與傳統(tǒng)模型相兼容的同時(shí),也與一般的消費(fèi)者購(gòu)物決策模型相區(qū)別。
3 綜合的消費(fèi)者購(gòu)物決策模型
基于以上比較,筆者以問(wèn)題解決模型為基礎(chǔ),結(jié)合網(wǎng)上消費(fèi)者的特點(diǎn),試著提出了整合傳統(tǒng)購(gòu)物、網(wǎng)上搜尋信息網(wǎng)下購(gòu)物、網(wǎng)上購(gòu)物三種購(gòu)物方式的消費(fèi)者購(gòu)物決策模型,見圖2。
受Nicosia模型和Howard-Sheth模型的啟發(fā),綜合模型增加了影響個(gè)體對(duì)于問(wèn)題的認(rèn)知以及信息的尋找以及備擇物的評(píng)價(jià)過(guò)程的原因因素(外界刺激輸入)和個(gè)體因素(經(jīng)驗(yàn)、動(dòng)機(jī)、個(gè)性、態(tài)度等)。例如,情景因素或者廠商的營(yíng)銷努力可以使完全無(wú)計(jì)劃購(gòu)物的消費(fèi)者有了解決問(wèn)題的動(dòng)機(jī),從而產(chǎn)生提醒購(gòu)物的行為,而消費(fèi)者是否有解決問(wèn)題的動(dòng)機(jī)還取決于兩個(gè)因素:一是期望狀態(tài)與實(shí)際狀態(tài)之間差異的大小,二是該問(wèn)題的重要性。另一方面,消費(fèi)者對(duì)于網(wǎng)上購(gòu)物的態(tài)度又決定了他是否選擇網(wǎng)上搜尋信息,進(jìn)而深入到具體的兩階段的信息搜尋與評(píng)價(jià)的過(guò)程。
在信息搜尋與評(píng)價(jià)的具體決策過(guò)程,本模型整合了傳統(tǒng)搜尋與評(píng)價(jià)和網(wǎng)上信息搜尋和評(píng)價(jià)兩種決策方式,這兒所涉及的估價(jià),不僅僅是對(duì)商品或者商家的估價(jià),也包括對(duì)選擇何種購(gòu)物方式的估價(jià),因此,具體的購(gòu)買過(guò)程,也分為傳統(tǒng)購(gòu)買與網(wǎng)上購(gòu)買兩種購(gòu)買方式。相應(yīng)的,消費(fèi)者購(gòu)買后的評(píng)價(jià)也不僅僅包括傳統(tǒng)的對(duì)商品或者服務(wù)的評(píng)價(jià),還包括對(duì)消費(fèi)者自己所選擇的購(gòu)物方式的評(píng)價(jià),這種反饋性的評(píng)價(jià)信息不僅可以影響消費(fèi)者今后對(duì)商家的選擇,而且也影響了消費(fèi)者今后對(duì)購(gòu)物方式的選擇。
總的來(lái)說(shuō),這個(gè)綜合的模型的優(yōu)勢(shì)在于,將購(gòu)買方式的選擇也納入消費(fèi)者決策需要考慮的范圍中,從而適用于傳統(tǒng)與網(wǎng)絡(luò)兩種不同的購(gòu)物方式,以及介于兩者之間的網(wǎng)上搜索信息、網(wǎng)下購(gòu)買方式,彌補(bǔ)了傳統(tǒng)和網(wǎng)上購(gòu)物決策模型在考慮決策時(shí),購(gòu)物方式單一的不足。但是,這個(gè)模型也存在缺陷:消費(fèi)者對(duì)于購(gòu)物方式的選擇也可以發(fā)生在信息搜索階段之前,而且,對(duì)于消費(fèi)者的重復(fù)購(gòu)買行為來(lái)說(shuō),并不需要花費(fèi)許多認(rèn)知努力。所以,這個(gè)模型主要適用于有限型(以購(gòu)買介入程度適中,信息搜集有限,決策規(guī)則簡(jiǎn)單,備選方案少,購(gòu)后評(píng)價(jià)少為主要特征)和擴(kuò)展型(以購(gòu)買介入程度高,大量的信息搜集,多種備選方案,全面的購(gòu)后評(píng)價(jià)為主要特征)消費(fèi)者決策行為[16]。
4網(wǎng)上購(gòu)物消費(fèi)者決策過(guò)程研究的發(fā)展趨勢(shì)
綜合的購(gòu)物決策模型涵蓋了傳統(tǒng)和網(wǎng)上兩種購(gòu)物方式,考慮了網(wǎng)上搜尋信息、網(wǎng)下購(gòu)買這種新的購(gòu)物決策類型,能夠綜合的考慮各個(gè)影響因素的作用,建議未來(lái)的研究者在研究網(wǎng)上消費(fèi)者的購(gòu)物行為時(shí),可以以此為依據(jù),并著重于以下幾個(gè)方向:
(1)信息搜索和評(píng)價(jià)行為的定量研究 根據(jù)兩階段決策模型,可以研究RA和CM對(duì)消費(fèi)者信息搜尋數(shù)量、考慮的商品系列和決策質(zhì)量的影響,并與傳統(tǒng)的購(gòu)物模式進(jìn)行對(duì)比,從而幫助消費(fèi)者作出更有利于達(dá)到總效用最大化的決策。
(2)消費(fèi)者放棄因素研究 可以針對(duì)某一個(gè)大型網(wǎng)上商城,研究有過(guò)在該商城搜尋信息的行為,但最終沒有下訂單達(dá)成交易的消費(fèi)者放棄在該商城購(gòu)物的原因。從而對(duì)該商城的BtoC電子商務(wù)平臺(tái)的購(gòu)物環(huán)境作出技術(shù)上的改善,或者對(duì)該商城的營(yíng)銷策略進(jìn)行改進(jìn)。也可以針對(duì)那些網(wǎng)上搜尋信息,網(wǎng)下購(gòu)買商品的習(xí)慣傳統(tǒng)購(gòu)物方式的消費(fèi)者,研究與之放棄行為相關(guān)的影響因素。
總之,伴隨著全球化時(shí)代下電子商務(wù)的發(fā)展,消費(fèi)者的購(gòu)物方式也更加多樣和復(fù)雜,因而消費(fèi)者的購(gòu)物決策模型也就需要考慮諸多方面的因素。傳統(tǒng)的購(gòu)物決策模型是這些模型的核心和靈魂,以后提出的諸多模型,則是傳統(tǒng)模型的發(fā)展和具體化,可見,現(xiàn)代的購(gòu)物方式,仍然離不開傳統(tǒng)的購(gòu)物決策的步驟,廣大消費(fèi)者在這個(gè)過(guò)程中的變與不變,正是后續(xù)的研究者努力的方向。
參考文獻(xiàn)
[1] 李大立,孫婷,李正良. 電子商務(wù)消費(fèi)者不滿意因素分析.湘潭工學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2002,4(4):36~41
[2] 熊德勇. 網(wǎng)上購(gòu)物的思考. 商業(yè)研究,2001,(12):178~179
[3] 劉立. 信息技術(shù)條件下的消費(fèi)者行為特征. 情報(bào)學(xué)報(bào),2002,21(2):237~241
[4] 張巖. 網(wǎng)上購(gòu)物距離我們有多遠(yuǎn). 服務(wù),2000,(5):188~193
[5] 馬謀超,陸躍祥. 廣告與消費(fèi)心理學(xué). 人民教育出版社,2000. 135~156
[6] Thompson S H, Yeong Y D. Assessing the consumer decision process in the digital marketplace. The International Journal of Management Science, 2003, 31(5): 349~363
[7] Merelo J J, Prieto A, Rivas V, et al. A neural net-based model for decision making in marketing. Accounting Management and Information Technologies, 1998, 8(4): 237~253
[8] Namwoon K, Rajendra K, Srivastava, et al. Consumer decision-making in a multi-generational choice set context. Journal of Business Research , 2001, 53(3): 123~136
[9] 丁娟. 冷觀網(wǎng)上消費(fèi). 經(jīng)濟(jì)師,2000,(9): 49
[10] Haubl G, Trifts V. Consumer Decision Making in Online Shopping Environments: The Effects of Interactive Decision Aids. Marketing Science, 2000, 19(1): 4~21
[11] Heijden H V, Verhagen T, Creemers M. Predicting Online Purchase Behavior: Replications and Tests of Competing Models. Proceedings of the 34th Hawaii International Conference on System Sciences, 2001
[12] Bellman S, Lohse G, Johnson E. Predictors of online buying behavior. Communications of the ACM (42:12), 1999. 32~38
[13] Bhatnagar A, Misra S, Rao H R. Online risk, convenience, and Internet shopping munications of the ACM (43:11), 2000: 98~105
[14] Jarvenpaa S L, Tractinsky N, Vitale M. Consumer trust in an Internet store. Information Technology and Management, 2000: 45~71
[15] Li Na , Zhang Ping. Consumer online shopping attitudes and behavior: An assessment of research.Eighth Americas Conference on Information Systems, 2002. 508~518
[16] Hawkins D J, Best R J, Coney K A. 符國(guó)群等譯. Consumer Behavior: Building Marketing Strategy. 8th ed. 北京:機(jī)械工業(yè)出版社,2003. 475~479
Shopping Decision-Making Model: An analysis of Consumer Online
Li Shuangshuang1,2Chen Yiwen1Li Jiangyu3
(1Institute of Psychology, the Chinese Academy of Sciences, Beijing 100101, China)
(2Graduate School of the Chinese Academy of Sciences, Beijing 100039, China)