你的位置:首頁 >> 理論學(xué)習(xí)與思想教育 >> 正文
我國政府績效評估需要思考的幾個問題
周志忍
18世紀的英國詩人亞歷山大•波普說過:“關(guān)于政府的形式讓那些愚人去爭論吧,管得最好的政府就是最好的政府!”政府管理好壞的主要評價標準是其工作績效,而要提高績效,必須首先了解目前的績效水平是什么,不測定也就無法改善。因此,績效評估成為當(dāng)代發(fā)達國家政府改革的熱門實踐,同時也在我國得到廣泛應(yīng)用,被視為完善問責(zé)制和改進管理的重要環(huán)節(jié)。經(jīng)過多年實踐之后,有必要對我國政府績效評估做一考察和反思。本文從評估目的、評估內(nèi)容、評估主體、結(jié)果應(yīng)用四個方面,討論我國政府績效評估實踐中存在的問題或值得關(guān)注的傾向,期望引起理論和實踐界的關(guān)注和探討。
為什么要進行績效評估?
績效評估在政府管理中可以發(fā)揮多種積極作用和功能:計劃輔助、監(jiān)控支持、激勵、資源優(yōu)化、公眾溝通、社會監(jiān)督等,但這些可以劃分為“外部責(zé)任”和“內(nèi)部控制”兩種基本類型。發(fā)達國家當(dāng)代的績效評估著眼于外部問責(zé),屬于“外部責(zé)任型評估”。其主要特點包括:政府部門績效評估堅持公民為本原則,指標體系設(shè)計聚焦于公民關(guān)注的客觀效果,評估結(jié)果公開化并接受社會問責(zé)和監(jiān)督;社會組織獨立對政府部門進行評估,政府主動配合并積極做出回應(yīng)。相比而言,我國的地方政府的績效評估更多著眼于內(nèi)部控制,“保障政令暢通”、“提高執(zhí)行力”等等,成了績效評估的主要目標。
首先,內(nèi)部控制取向表現(xiàn)為績效評估的政府主導(dǎo)和公民參與不足。早期的績效評估完全是政府發(fā)動,政府實施,結(jié)果“內(nèi)部消費”,對社會和公民完全封閉。近年來的一個積極變化是績效評估中強調(diào)公民介入,其主要形式是滿意度測評或社會評價。但從總體上看,公民作用還限于某些環(huán)節(jié)的“部分參與”而非“全程參與”,公民角色屬于被動的“信息供給者”而非“信息供給與決策共享者”,而且在整個過程中,公民的發(fā)言權(quán)和影響力依然有限。
其次,內(nèi)部控制表現(xiàn)為評估的“單向性特征”。一是熱衷于上對下的評估,除了上級政府對下級的綜合評估外,還有職能部門對特定工作領(lǐng)域的評估,甚至相關(guān)科室對特定工作領(lǐng)域的分項評估,形形色色的評估達標活動,搞得下面苦不堪言;二是重視政府主管部門對所屬企事業(yè)單位的評估,衛(wèi)生部為醫(yī)院設(shè)立的績效評估體系,教育部門為各級各類學(xué)校設(shè)立的評估體系,有關(guān)部門推出的國有企業(yè)效績評價系統(tǒng)等,行業(yè)績效評估的高度發(fā)達,是控制型績效評估的明顯例證。由于忽視下級、社會對政府部門的評估與監(jiān)督,我國的績效評估具有了對人不對己的“手電筒式評估”的特征,成了主管部門樂于享用的居高臨下的權(quán)力,而非對公民和社會承擔(dān)責(zé)任的機制。
最后,績效評估有可能淪為干部人事調(diào)整的工具。一把手到新地任職,往往都有調(diào)整干部的沖動,其必要性可以理解,但隱藏的巨大風(fēng)險人人心知肚明。于是乎,績效評估被搬了出來:評估體系中領(lǐng)導(dǎo)評價占據(jù)較大權(quán)重,評價結(jié)果不公開透明,可以保證領(lǐng)導(dǎo)中意的人選獲得高分;對那些不滿者,績效評估得分低就成了最有說服力的理由;當(dāng)實現(xiàn)“一切盡在掌握中”之后,績效評估就被拋到了九霄云外。這種事例為數(shù)不多,但特別值得警惕。
因此,就服務(wù)的目標而言,我國的政府績效評估需要實現(xiàn)從“內(nèi)部控制型”到“外部責(zé)任型”的模式轉(zhuǎn)換。
績效評估應(yīng)該評什么?
績效評估內(nèi)容應(yīng)該是一個系統(tǒng)的體系,這一體系立足于施政理念和政策,同時應(yīng)隨著環(huán)境的變化而與時俱進。篇幅所限,本部分不從應(yīng)然角度探討績效評估的內(nèi)容框架,而集中討論實踐中值得關(guān)注的幾個問題。
第一,分內(nèi)職責(zé)與政府越位。部門角色的合理定位,是科學(xué)績效評估的前提??冃гu估當(dāng)然只能評政府該做的事,其應(yīng)用范圍僅限于政府的份內(nèi)事或法定職責(zé)。政府越位基礎(chǔ)上的績效評估,可以說是我國實踐中的一個大問題。許多地方績效評估圍繞所謂“中心工作”展開,而所確定的中心工作,許多不屬于政府的份內(nèi)職責(zé)。比如,強制推廣某種經(jīng)濟作物,強制興辦科技示范園等等,其中最值得關(guān)注的是普遍的招商引資考核。當(dāng)面臨巨大的招商壓力時,部門難免會利用自己掌握的權(quán)力進行交易:法院可以給商戶提供偏袒的許諾或某種默契,治安警察可給商人提供特殊安全保護,交警可以贈予交通違規(guī)的免罰權(quán),教育部門在子女上學(xué)上可以提供特殊照顧,勞動部門對惡劣勞動條件或欠付工資/保險睜一只眼閉一只眼,土地管理部門可以提供用地方面的優(yōu)惠……在一個為招商引資而展開政策拍賣或優(yōu)惠競賽的環(huán)境下,政府部門會成為“公正仲裁者”或良好市場秩序的締造者嗎?政府角色越位基礎(chǔ)上的績效評估不僅起不到應(yīng)有的積極效果,而且會妨礙政府職能轉(zhuǎn)變,扭曲政府部門的行為。
第二,投入導(dǎo)向與結(jié)果導(dǎo)向。當(dāng)代政府績效評估的一個重要理念是“結(jié)果導(dǎo)向”,聚焦于客觀效果和結(jié)果。績效管理在西方亦稱“結(jié)果管理”,即為實現(xiàn)期望的結(jié)果而實施的系統(tǒng)化努力。反觀我國的績效評估,投入和過程導(dǎo)向依然是其特征之一。以治理超載為例,出動了警力多少人次,設(shè)立了多少個檢查站,檢查時間從過去的多少小時延長到多少小時,發(fā)現(xiàn)并處罰了多少個違規(guī)車輛等,都是成績匯報的著力點。投入導(dǎo)向正在固化成一種模式:領(lǐng)導(dǎo)重視、組織保障、組織的活動、效果或服務(wù)對象得到的實惠,各占1/4的比重。問題在于:領(lǐng)導(dǎo)重視也好,組織保障和組織的活動也好,都屬于部門的投入或付出的努力,如果沒有落腳到服務(wù)對象受益這一結(jié)果上,這種努力到底有什么意義?用最少的投入獲取最大可能的效果,才是高績效政府的真諦。當(dāng)投入和付出的努力占據(jù)了績效評估75%的比重時,它所鼓勵的只能是形式主義。
國人對結(jié)果導(dǎo)向理念存在兩個認識上的誤區(qū):一是把產(chǎn)出等同于結(jié)果。其實,抓獲的罪犯多了是產(chǎn)出的增加,但不一定意味著治安狀況的總體改善(結(jié)果);同理,抓獲的貪官多了并一定意味著政府更清廉。二是結(jié)果界定主體認識不到位。有人質(zhì)疑,唯GDP論是不是結(jié)果導(dǎo)向?其后果是否值得質(zhì)疑?這個問題的答案很簡單,這里所講的結(jié)果,是公民所期望的結(jié)果而非官員追求的結(jié)果。換言之,結(jié)果導(dǎo)向是公民為本為前提的。
第三,關(guān)鍵指標與貪大求全??冃гu估指標總量應(yīng)該有合理的度。國際上看,績效評估指標體系經(jīng)歷了一個由簡到繁,再由繁到簡的過程,這應(yīng)該是智慧和經(jīng)驗的結(jié)晶。我國績效評估似乎趨向于繁瑣化,甚至繁瑣成為炫耀的資本。有的城市邀請國際著名咨詢公司,設(shè)計了據(jù)說包含3000多指標的評估體系。我對洋和尚念中國政府經(jīng)的能力十分懷疑,同時對官員的盲目崇洋媚外感到驚奇。美國法律明文規(guī)定,政府部門制定績效規(guī)劃和起草績效報告的工作,不得轉(zhuǎn)包給咨詢公司。這就是說,國際著名的咨詢公司,在西方也缺乏這方面的實際經(jīng)驗。美國州政府的績效評估體系,多數(shù)包括200個左右的指標。整合了所有服務(wù)和內(nèi)部管理的英國地方政府的綜合績效評估體系,也沒有超過700個指標??冃гu估繁瑣化的另一表現(xiàn)是專項評估的泛濫,綜合評估外有部門的評估,日常工作評估外還有專項活動評估,甚至突出什么就評估什么,如公共服務(wù)評估體系、和諧社區(qū)評估體系、維穩(wěn)評估體系、學(xué)習(xí)型組織評估體系等,評估趨于多元化和碎片化。需要在干部中樹立一種觀念,指標體系繁瑣化不是本事,而是能力低下的象征,即系統(tǒng)化思考能力低下,抓重點的能力和設(shè)計關(guān)鍵指標的能力低下。
第四,相對穩(wěn)定與“打一槍換個地方”??冃Ч芾淼木枋强冃У?ldquo;持續(xù)性改進”,這要求評估框架體系相對穩(wěn)定,進而實現(xiàn)績效改進從量的積累到質(zhì)的飛躍。觀察發(fā)達國家十多年的實踐,評估框架和指標體系高度穩(wěn)定,而我國實踐的一個特征是評估框架和指標體系的變動不居。這固然和轉(zhuǎn)型時期的環(huán)境和施政理念的變化相關(guān),但“打一槍換一個地方”的弊端不可否認:結(jié)果經(jīng)常變,有??冃Ч芾碜非笃谕Y(jié)果的本質(zhì);指標無法縱向?qū)Ρ?,有違持續(xù)性改進這一績效管理的精髓。實現(xiàn)評估體系的相對穩(wěn)定,既需要領(lǐng)導(dǎo)者任職的相對穩(wěn)定,更需要解決權(quán)力過度集中的問題,賦予老百姓更多的發(fā)言權(quán)。
績效評估由誰來評?
績效評估服務(wù)于多種目標,必然涉及多樣化的利益相關(guān)者。因此,從主體角度看,績效評估應(yīng)該是多元主體組成的復(fù)合結(jié)構(gòu)。國際經(jīng)驗看,績效評估主體結(jié)構(gòu)平衡且相對穩(wěn)定,我國的實踐則具有“劍走偏鋒”的明顯特征,存在獨立封閉和激進民眾測評兩個極端。獨立封閉式評估即政府主導(dǎo)和缺乏公民參與,主要發(fā)生在前些年。激進民眾測評近幾年出現(xiàn),其形式就是“萬人評政府”、“萬人評政府部門”等活動,民眾測評占據(jù)很大比重,甚至成為政府績效評估的唯一形式。
績效評估的指標體系可以分為兩大類:“主觀指標”立足于個人的認知、態(tài)度和主觀感受,如感到安全的居民的比率、對警察工作的滿意度等;“客觀指標”則立足于經(jīng)驗觀察和記錄的成就和效果,如抓獲罪犯數(shù)量、犯罪率的降低等??茖W(xué)的績效評估應(yīng)該是主、客觀指標的合理平衡。“萬人評政府”意味著主觀指標成為評估的唯一形式,當(dāng)我們?yōu)榭冃гu估中公民參與的進步歡呼時,也要意識到主觀指標具有很多局限性。
第一,公眾作為評價主體存在能力的有限性。首先,對諸如消防、急救等特殊公共服務(wù)及機關(guān)內(nèi)部管理服務(wù)機構(gòu),絕大多數(shù)公民沒有親身體驗的機會,其評價難免隨意性。實踐中黨史研究會、市委或市政府辦公廳名列前茅,就是這一問題的反映。其次,對諸如醫(yī)療、金融市場監(jiān)管等復(fù)雜的服務(wù),公眾的判斷能力必然有限,可能并不知道他們的期望是什么,也不知道如何去界定服務(wù)質(zhì)量。第三,公民判斷難以擺脫自身立場做到公正客觀。法院判決再公正,打輸了官司多數(shù)可能不滿意。趕公交車時沒上去總覺得里面有空,擠一擠可以加一個人,一旦邁入馬上感覺滿員,希望關(guān)門,這種心理變化反映了同樣的問題。
第二,公民滿意度并不能完全反映服務(wù)的質(zhì)量。服務(wù)質(zhì)量和公民滿意度之間的關(guān)系相當(dāng)復(fù)雜。國外研究證明,只在服務(wù)質(zhì)量急劇下降或明顯提升兩種情況下,公民滿意度與服務(wù)質(zhì)量呈正相關(guān)關(guān)系,其他情況下兩者不相關(guān)。這意味著,服務(wù)質(zhì)量的小幅改進可能伴隨滿意度的下滑,服務(wù)質(zhì)量的小幅下滑可能伴隨滿意度的上升。
第三,公民滿意度的橫向比較價值相當(dāng)有限。滿意度評價具有相對性:滿意與否不存在完全客觀的標準,而主要取決于“期望質(zhì)量”與“感受質(zhì)量”之間的差距。舉例而言,A地公民長期為治安狀況所困擾因而期望值不高,暴力犯罪率降低幾個百分點可能導(dǎo)致較高的顧客滿意率;而B地長期治安狀況良好,暴力犯罪率上升幾個百分點會導(dǎo)致較低的治安滿意率。結(jié)果可能是,A地暴力犯罪率3%可能會有80%的滿意率,B地暴力犯罪率2%可能只有75%的滿意率,我們不能根據(jù)滿意率得出A地治安優(yōu)于B 地的結(jié)論。
第四,顧客滿意率不能回答權(quán)利公正問題。拿到了一套經(jīng)濟適用房的家庭可能滿意,但更困難的家庭沒有享受到經(jīng)適房,而他們往往不屬于顧客滿意度調(diào)查的對象,權(quán)利公正問題由此產(chǎn)生。當(dāng)然我們可以擴大調(diào)查范圍,但這又繞不開信息不對稱這個難題。
正是由于上述原因,英國內(nèi)閣辦公廳提出一個忠告:顧客滿意率取決于諸多因素,因而政府績效評估最好不要孤立使用這一指標。因此,對熱衷于“萬人評政府”的地方來說,一個忠告是警惕“過猶不及”!
績效評估結(jié)果該怎么用?
國際學(xué)術(shù)界推崇績效評估的“三D模式”,即診斷、發(fā)展和設(shè)計(diagnosis, development and design),突出評估結(jié)果的正面、建設(shè)性應(yīng)用。實踐看,發(fā)達國家的“責(zé)任與靈活性交易”就是一種制度化設(shè)計,通過授予高績效單位更大的管理自主權(quán),調(diào)動其提高績效的積極性。這里以英國地方政府的財務(wù)管理權(quán)為例加以說明。英國地方政府支出主要由兩部分構(gòu)成:地方稅與中央轉(zhuǎn)移支付。地方政府的績效評估分為ABCDE5個檔次。獲得A、B檔次的地方政府,享有自主決定地方稅水平的權(quán)力,同時中央轉(zhuǎn)移支付采取“一攬子撥款”的方式,其用途由地方政府自主決定。獲得較低績效檔次的地方政府,年度地方稅征收額度都要經(jīng)過中央的審批。至于中央轉(zhuǎn)移支付的撥付方式,對C、D兩檔地方政府采取“分項撥款”的方式,其用途有明確的規(guī)定和限制;對E檔地方政府則采取“分目撥款”方式,比分項撥款限制更細、更嚴。另外一種評估結(jié)果利用的策略是績效預(yù)算,其目的是打破傳統(tǒng)管理中“獎勵失敗”的做法,把績效水平和預(yù)算撥款有機聯(lián)系起來。有學(xué)者把這歸結(jié)為一句話:績效評估就是要“歡呼成功,原諒失敗”。
我國實踐中需要關(guān)注并避免績效評估結(jié)果利用的兩個極端:一是評估結(jié)果束之高閣,與干部任用、獎懲和資源配置相互脫節(jié);二是績效評估結(jié)果利用上急功近利,簡單化采取“一票否決”、“末位淘汰”等貌似激進,實則很不科學(xué)的做法。在我看來,第二種傾向特別值得警惕。
首先,績效評估質(zhì)量有待改進,評估結(jié)果的高調(diào)應(yīng)用缺乏基礎(chǔ)。不管采取什么形式的獎勵與懲罰,結(jié)果利用的根本依據(jù)是“績效”,這對績效評估的質(zhì)量提出一定的要求。我國的公共組織績效評估處于初級階段,績效目標的科學(xué)性和穩(wěn)定性不足,在評估的基本理念、實施原則和操作層面存在著諸多缺陷。實踐中存在低報目標更易獲得獎勵,“干得好不如說得好”,甚至數(shù)據(jù)水分等現(xiàn)象,就是評估質(zhì)量缺陷的例證。這說明,評估結(jié)果的高調(diào)應(yīng)用還缺乏基礎(chǔ),需要一個探索過程,即隨著績效評估質(zhì)量的提升,不斷加大結(jié)果利用的力度。
其次,著眼于處罰有違績效管理的新理念??冃Ч芾硎菑哪繕斯芾碇邪l(fā)展出來的,它與目標管理的一個重大區(qū)別就是“以共識為基礎(chǔ)”,強調(diào)溝通、協(xié)商、廣泛介入和授權(quán)。具體說:績效目標不是一個自上而下的命令和強加過程,而是上、下級平等對話與協(xié)商過程;作為一種契約,績效協(xié)議對上、下級有雙向約束,上級不能隨意干預(yù)或加碼,上級違反契約導(dǎo)致績效不佳不能處罰下級。“一票否決”項目據(jù)統(tǒng)計高達一百多,高壓線密布橫豎都是一死,其威懾力也就沒有了。一個明顯的道理要明白:著眼于懲罰的恐懼式管理只能制造“怨婦”,而怨婦是不可能持好家的。
第三,著眼于處罰已經(jīng)導(dǎo)致諸多不良后果。國際實踐表明,把獎懲作為評估結(jié)果利用的惟一形式會導(dǎo)致抵觸情緒,加劇弄虛作假和“玩游戲”的行為,形成“破壞性競爭”,抵消組織績效評估的效果。我國實踐中,高壓之下部門和官員往往靠杜撰假數(shù)據(jù)、假信息來應(yīng)付。我始終堅持一個觀點:當(dāng)某種不良行為非常普遍的時候,我們不能僅僅從個人身上找原因,更應(yīng)該做的是審視有關(guān)的制度。甘肅省幾個緝毒警察為擺脫末位排名,竟然設(shè)套陷害百姓,致使3個普通百姓成為“毒梟”并被判死刑(后被無罪釋放)的案例,更向我們敲了警鐘??冃гu估是為了提高政府績效,政府績效的核心是人民滿意或達到人民所期望的結(jié)果。如果績效評估導(dǎo)致了類似禍國殃民的犯罪行為,會令每個推動者汗顏,那還不如不搞。
第四,著眼于處罰導(dǎo)致公共資源的非優(yōu)配置。這有“利用效率低下”和“配置效率低下”兩種形式:對于那些被列為中心工作、一票否決的項目,許多官員往往不計成本、不惜代價以體現(xiàn)執(zhí)行力,導(dǎo)致資源利用效率低下,而且寅吃卯糧,效果不可持續(xù);多部門獨立實施導(dǎo)致的評估泛濫和碎片化,迫使被評估地方或單位“拆西墻補東墻”,什么工作領(lǐng)域接受評估,就向這一領(lǐng)域傾注更多的財政資源,以確保達標或創(chuàng)優(yōu),地方無法根據(jù)情況進行資源統(tǒng)籌分配,這意味著資源配置效率的低下。
因此,政府管理要創(chuàng)新,創(chuàng)新需要腳踏實地,績效評估不能著眼于轟動效應(yīng),更不能成為另一種形式的形象工程。
(作者系北京大學(xué)政治發(fā)展與政府管理研究所教授、博士生導(dǎo)師)