有沒有比DEA(資料包絡分析)方法更好更先進的效率評估方法?
瀉藥,在經濟學中,技術效率是指在既定的投入下產出可增加的能力或在既定的產出下投入可減少的能力。
原文連結:
http://
tecdat。cn/?
p=23709
原文出處:
R語言實現隨機前沿分析SFA、資料包絡分析DEA、自由處置包分析FDH和BOOTSTRAP方法
常用度量技術效率的方法是生產前沿分析方法。所謂生產前沿是指在一定的技術水平下,各種比例投入所對應的最大產出集合。而生產前沿通常用生產函式表示。前沿分析方法根據是否已知生產函式的具體的形式分為引數方法和非引數方法,前者以隨機前沿分析(StochasticFrontierAnalysis,下文簡稱SFA)為代表,後者以資料包絡分析(DataEnvelopeAnalysis,下文簡稱DEA)為代表。
本文在R軟體中實現SFA、DEA與自由處置包分析FDH模型。
用R進行模擬
按照p=0。2的二項分佈,隨機生成一個大小為100的向量。
> x
plot(table(x), main = “frequency”)
其他分佈。泊松P(λ)(函式rpois)等。
2。 數字變數 按照高斯分佈N(μ=1,σ=1)隨機生成一個大小為100的向量。
> x hist(x, main = “”)
其他分佈。Uniform U[a,b](函式runif)等等。
模擬資料
輸出y和輸入x都是n=15的大小
真正的前沿是由函式定義的。
為了模擬資料:
1。 定義輸入的向量為x∼U[0,1]
2。 定義一個向量u∼N+(µ = 0。25, σ = 0。2)
3。 輸入的向量定義為
函式set。seed允許我們保持相同的模擬資料
> u = rtmvnorm(n = ns, mean = c(0。25), sigma = c(0。2),
+ lower = c(0))
> y = ybar/(1 + u)
資料的表示方法
模擬資料。
> plot(y ~ x
繪製真正的邊界。
> lines(
http://
t。fr
~ x。seq)
“真實前沿 ”效率測算
以產出為導向的測算。
輸入導向的方法:
Shepard 方法:
> lambda = y/sqrt(x)
> theta = y^2/x
> delta = 1/theta
可重複研究
> matable <- xtable(tab1[1:5, ], digits = 3, align = “l|ccc”,
+ caption = “”真實前沿效率測算“)
表:真實
前沿效率
隨機前沿
1。用函式lm調整一個線性模型,並保留迴歸線的係數β:y = α + βx
2。 找到能使(yi-yˆi)最大化的公司k,i=1,。。。,n。注意,公司k可以透過函式識別來手動找到和檢測
3。 計算α 0,使迴歸線y = α 0 + βx穿過企業k,並代表隨機前沿。
1。 OLS 模型
> res。lm <- lm(y ~ x)
2。 使用函式識別
> identify(x, y)
3。 找到α0
> alpha2 <- y[3] - beta。lm[2] *
+ x[3]
> plot(y ~ x, type = ”p“,
+ 1))
隨機前沿效率測算
讓我們定義f1 : x → α 0 + βx
> f1 = function(x) alpha2 + beta。lm[2] * x
> f1。inv = function(x) (x - alpha2)/beta。lm[2]
面向產出的方法。
面向輸入的方法:
Shepard 方法:
DEA - FDH 表示
手動檢測位於兩個邊界上的公司
> plot(y ~ x)
> lines(x[c(2, 9, 3, 4)], legend = c(”DEA“,
+ ”FDH“))
DEA-FDH效率前沿/衡量標準
讓我們考慮5號公司
1。 如果該公司在輸出方向上是有效的,它將位於前沿線的哪一部分? 在輸入方向上?
2。 利用這個估計前沿的位置,計算出效率的衡量標準
Naive Bootstrap
重複B次(用迴圈的方式)
1。用函式樣本在15個觀測值中取樣
2。計算前沿的新估計值
3。計算新的效率方法
4。 儲存結果,計算偏差, 方差, 置信區間
對真實資料的分析
資料集
在62個農場觀察到一個輸出變數和三個輸入變數
> plot(y ~ x1,pch = 16, col = ”blue“)
> abline(lm(y ~ x1, data), col = ”red“)
如何挑選瓷磚訣竅ss=”origin_image zh-lightbox-thumb“ width=”618“ data-original=”https://pic3。zhimg。com/v2-a8002b2697d322cb1ac44cee7c6e28d5_r。jpg“/>
散點圖3-d
> scatterplot3d(x1,
+ x2, y)
資料結構
p個輸入包含在一個p×n的矩陣中
> input <- t(cbind(spain$x1, spain$x2, spain$x3))
q個輸出包含在一個q×n的矩陣中
> output <- t(matrix(spain$y))
效率的衡量標準
計算 DEA 效率估計值
計算 FDH 效率估計值
計算m階效率估計值
計算非引數的條件和非條件的α-量化估計(預設情況下,α=0。95
> res <- rbind(dea, fdh, orderm,
+ res。hquan)
你可以使用函式order或sort來計算企業的排名,排名根據效率測算。
> plot(density(res。dea)
Bootstrap
函式boot實現了Simar和Wilson(1998)的bootstrap方法,用於估計Shepard(1970)輸入和輸出距離函式的置信區間。
> boot(input, output)
最受歡迎的見解
1。R語言多元Logistic邏輯迴歸 應用案例
2。面板平滑轉移回歸(PSTR)分析案例實現
3。matlab中的偏最小二乘迴歸(PLSR)和主成分迴歸(PCR)
4。R語言泊松Poisson迴歸模型分析案例
5。
R語言混合效應邏輯迴歸Logistic模型分析肺癌
6。r語言中對LASSO迴歸,Ridge嶺迴歸和Elastic Net模型實現
7。
R語言邏輯迴歸、Naive Bayes貝葉斯、決策樹、隨機森林演算法預測心臟病
8。python用線性迴歸預測股票價格
9。
R語言用邏輯迴歸、決策樹和隨機森林對信貸資料集進行分類預測