經濟學教科書經常假設制造商具有同質性效率是指產出與投入之比,用抽象的生產函數來描述其生產過程,并隱含地假設對于所有制造商來說,在給予相同數量的投入的情況下,他們將獲得相同的產出。 這與我們的生活經驗不符。 例如,如果兩個孩子摩擦粘土,給定相同大小的泥球,則粘土球的大小會不同; 如果兩個師傅打棉花,則各給十公斤棉花。 常見的是甲師傅生產八公斤被子,乙師傅生產被子。 1磅。
產出與投入之比為生產率(),實際產出與理想產出之比為效率()。 當然,不同廠家的效率也不一樣。 研究制造商效率確實有必要,但在主流經濟學中找不到答案。 需要一些“非主流”工具。 本文介紹的方法是隨機前沿模型(Model,SFM),或者說隨機前沿分析(SFA)。 。
如果你敢稱其為模型,那你必須有一個數學公式,如下: y=Xbeta+\ =vu
式中,y代表制造商的輸出,擾動項。 是一個復合擾動項,由兩部分組成。 第一部分v是常見的左右對稱隨機擾動項,y=Xbeta+v是我們常用的線性回歸模型; 第二部分 u 是不對稱的,不小于 0 隨機擾動項。
模型中的Xbeta+v稱為制造商的生產前沿。 所謂生產前沿描述的是在給定投入下能夠產生的最大產出水平,即理想產出。 顯然,生產前沿包含隨機項v,故稱為隨機前沿。 制造商的實際產量為y,實際產量與理想產量的差距為u,對應的效率為frac{y}{Xbeta+v}。
u的經濟意義是制造商的管理無效率、技術無效率、經濟無效率等,是指制造商本身可以控制的各種因素。 u越大,說明廠商的無效率越大,或者用人的話來說:效率越低。 當u=0時,制造商的實際產量為理想產量,此時效率值達到峰值,為1。v描述了制造商無法控制的各種因素,如運氣、天氣、機器效率、等等。這些因素影響著制造商的生產前沿。 v 的另一個重要組成部分是制造商輸出 y 的測量誤差。
關于隨機前沿模型更深入的介紹,可以參考本文第二篇參考資料,或者查看原文。
隨機前沿模型估計方法
假設 v 服從均值為 0、標準差 的正態分布,記為 vsim N(0, ^2),u 服從均值 0、標準差 的半正態分布,并在 0 處截斷正態分布,記為 usim N^+(0, ^2),u 和 v 相互獨立。 采用最大似然估計法來估計模型的待估計參數。
由于使用公式編輯器編寫大型數學公式非常耗時,因此本文將使用5手寫寫出大部分推導過程,然后以截圖的形式插入到文本中。
隨機前沿模型對數似然函數的推導過程
由上圖可知,隨機前沿模型的對數似然函數可表示為: ln{L}= -Nlnsigma-frac{1}{2sigma^2}sum_{i =1} ^N^2+sum_{i=1}^NPhi(-frac{\}{sigma})\
相應地,對數似然函數的一階導數可以寫為:
frac{ ln{L}}{ sigma^2}=-frac{N}{2sigma^2}+frac{1}{2sigma^4}sum_{i= 1}^N^2+frac{}{2sigma^3}sum_{i=1}^Nfrac{phi_i}{Phi_i}=0\ frac{ ln {L}}{ }=-frac{1}{sigma}sum_{i=1}^Nfrac{phi_i}{Phi_i}=0\ frac{\ln {L}}{\beta}=frac{1}{sigma^2}sum_{i=1}^Nx_i+frac{}{sigma}sum_{i=1}^ Nfrac{phi_i}{Phi_i}x_i=0
肉眼可見,這三個一階導數是復雜的非線性方程,無法給出參數的解析解。 一種常見的方法是使用集總最大似然估計( )進行估計。
將第二個方程代入第一個方程,則第一個方程最后一項為0,則sigma^2的最大似然估計量為hat{sigma}^2=frac{1}{N }sum_{i=1}^N^2=frac{1}{N}sum_{i=1}^N(y_i-x_i'beta)^2。 換句話說,如果我們能夠得到參數β的估計量,我們就可以直接利用這個公式給出σ^2的估計量。
beta' 乘以第三個方程,加上 乘以第二個方程,得到frac{1}{sigma^2}sum_{i=1}^N\beta'x_i+frac{ }{sigma} sum_{i=1}^Nfrac{phi_i}{Phi_i}y_i=0\
將此表達式與一階導數中的第三個方程結合起來,如果已知 sigma^2,則可以給出 和 β 的估計量。
實際估算過程如下:
使用普通最小二乘估計法給出 β 的估計量; 根據 β 的估計量計算 sigma^2 的估計量; 將 sigma^2 估計量代入聯立方程組,得到 和 beta 估計量; 可以根據新的 β 估計器計算新的 sigma^2 估計器。 如果參數估計量變化不大,則估計過程結束; 如果估計量的變化超過設定的容差,則重復2~4.隨機前沿模型的R語言代碼實現
大多數計量經濟模型都可以在R語言中找到相應的實現代碼。 本文利用該包對隨機前沿模型做了具體的估計。 由于找不到原文中的數據集,所以采用2003年中國各省份的GDP、勞動力投入、資本投資數據進行論證。 具體數據如下:
演示數據集
rm(list=ls())
## 載入必要的R語言包
library(frontier)
## 讀取原始數據
rawdata <- read.csv("rawdata.csv")
## 估計模型
result <- sfa(gdp~lab+cappri, data=rawdata)
## 查看回歸結果
print(summary(result))
回歸結果如下所示:
簡單隨機前沿模型估計結果
注意上圖中估計參數中的gamma為^2/sigma^2,代表非對稱擾動項的方差占復合擾動項方差的比例。 造成這種差異的原因很簡單,就是后續估計方法的估計策略的改進。
文獻綜述
該文件名為 and of。 該文獻首創了隨機前沿模型,并給出了最大似然法的估計策略。 但它沒有提供制造商效率的測量方法,僅適用于橫截面數據。 這些缺陷之中效率是指產出與投入之比,這也正是后來的文獻試圖彌補的。 這三位偉人為后來的很多學者創造了“飯碗”,很多人站在他們的肩膀上發表文章。
文章中的=/。 當^2to0時,表示^2toinfty或^2to0。 此時,對稱隨機擾動項在復合擾動項中“占主導地位”,非對稱隨機擾動項所占份額較小。 ,相信這些進入回歸的廠家效率值都比較高。 相反,如果 ^2toinfty ,則說明制造商存在一定的技術低效率。
R語言包的使用
在閱讀經典文學作品時,我常常感到困惑。 我費了好長時間才推導估算過程,但實際的估算代碼只需要一行。 我的努力不值得。 如果你只是用經典模型來研究問題,那么只需要學習一點簡單的代碼就足夠了。 問題是,如果你想擴展模型,或者嘗試實現更前沿的計量經濟模型估計策略,那么簡單的代碼是不夠的。
現在我們就利用R語言包來簡單實現上面提到的估計策略。 讀者可以參考該包的幫助文檔來了解如何使用該包。 我們的目標是加深對最大似然估計方法的理解,更好地學習R語言。
下面給出的代碼是一種粗暴的估計方法,沒有經過任何優化,但是編寫簡單,省時省力,并且在需要估計的參數不多的情況下運行速度非常快。 這是培養自信的良好起點。 未來的專欄可能會考慮使用一些優化算法。
## 清空當前工作空間
rm(list=ls())
## 載入需要的R語言包
library(maxLik)
## 讀取原始數據
rawdata <- read.csv("rawdata.csv")
## 寫出對數極大似然函數
logLikFun <- function(param){
const <- param[1] # 常數項
parlab <- param[2] # 勞動投入對應參數
parcap <- param[3] # 資本投入對應參數
parlambda <- param[4] # lambda
parsigmaSq <- param[5] # sigma square
epsilon <- rawdata$gdp - const - parlab * rawdata$lab - parcap * rawdata$cappri
sum(-0.5 * log(parsigmaSq) - 0.5/parsigmaSq*epsilon^2 +
pnorm(-epsilon*parlambda/sqrt(parsigmaSq), log.p = TRUE))
}
## 使用最小二乘估計法獲取極大似然估計初始值
ols <- lm(gdp~lab+cappri, data=rawdata)
initCoff <- coef(ols)
## 暴力估計
mle <- maxLik(logLik = logLikFun,
start = c(
const = initCoff["(Intercept)"],
parlab = initCoff["lab"],
parcap = initCoff["cappri"],
parlambda = 0.5,
parsigmaSq = sum(residuals(ols)^2)/(31-3)
))
## 打印回歸結果
print(summary(mle))
對應的估計結果見下圖
估計結果與之前的結果非常相似。 注意這里的估計結果給出的參數是代替之前的gamma。
參考文獻:《高級宏觀經濟學》(第四版)/(美國)Romer; 吳華斌、龔冠譯. 上海:上海財經大學出版社,2014。第 8 頁。效率和生產率分析導論/ 等。 王忠鈺譯. 第二版。 北京:中國人民大學出版社,2008年。第3頁。