May 31, 2013

Phương pháp phân tích bao dữ liệu (DEA)

Dang Thanh Ngo, 


PHÂN TÍCH BAO DỮ LIỆU (1)

Hôm nay mở hàng blog bằng một bài viết ngắn về DEA vậy. Hiện tại tài liệu về DEA hầu hết đều bằng tiếng Anh*, nên hy vọng (loạt) bài viết này sẽ có thể có ích với một số người mới làm quen với lĩnh vực này (như mình hồi trước).

Tổng quan

DEA ra đời từ năm 1978 sau “sáng kiến” của Charnes, Cooper và Rhodes (CCR)**, tuy nhiên nó lại có xuất phát điểm từ trước đó hơn 20 năm. Năm 1957, Farrell*** đưa ra ý tưởng áp dụng đường giới hạn khả năng sản xuất (Production Possibility Frontier – PPF) làm tiêu chí đánh giá hiệu quả (tương đối) giữa các công ty trong cùng một ngành; theo đó các công ty đạt đến mức giới hạn sẽ được coi là hiệu quả (hơn) và các công ty không đạt đến đường PPF sẽ bị coi là kém hiệu quả (hơn các công ty kia). Phương pháp CCR (1978) sau đó áp dụng bài toán tối ưu hóa tuyến tính phi tham số (non-parametric linear optimization) để xây dựng đường PPF dựa trên số liệu đã biết về một nhóm các công ty nhất định (decision making unit – DMU) và tính toán điểm hiệu quả cho các công ty đó. Đến năm 1984, Banker, Charnes, và Cooper (BCC)**** cải tiến mô hình trên bằng cách đưa yếu tố lợi tức nhờ quy mô (returns to scale) vào tính toán, mang lại cái nhìn cụ thể hơn về tính hiệu quả của các DMU được phân tích. Từ đó đến nay, mô hình CCR và (chủ yếu là) BCC được áp dụng và phát triển một cách phổ biến trong phân tích hiệu quả (efficiency/performance) trong nhiều lĩnh vực khác nhau: ngân hàng, bảo hiểm, giáo dục, y tế,…
<Xem tiếp bài sau về Nguyên tắc tính toán và so sánh hiệu quả của các DMUs>
————————
* Tìm kiếm trên Google với cụm từ “phân tích bao dữ liệu” chỉ mang lại 706 kết quả – hôm nay 05/01/2011.
** Charnes, A., Cooper, W. W., & Rhodes, E. (1978). Measuring The Efficiency Of Decision Making Units. European Journal of Operational Research, 2, 429-444.
*** Farrell, M. J. (1957). The Measurement Of Productive Efficiency. Journal of the Royal Statistical Society, 120(3), 253-281.
**** Banker, R. D., Charnes, A., & Cooper, W. W. (1984). Some Models for Estimating Technical and Scale Inefficiencies in Data Envelopment Analysis.Management Science, 30(9), 1078-1092.

Intro to DEA (2)


Nguyên tắc tính toán và so sánh hiệu quả của các DMU
Hiệu quả, hiệu suất, năng suất, hay một số thứ hầm bà lằng tương tự như thế, được sử dụng để tính toán/so sánh đầu ra (outputs) thu được tương ứng với đầu vào (inputs) cho trước. Ví dụ như năng suất lao động có thể được tính bằng số sản phẩm/số lao động; tỉ suất lợi tức đo bằng lợi nhuận/vốn; v.v…
Tuy nhiên, trên thực tế một doanh nghiệp hay đơn vị sản xuất (DMU) thường sử dụng một tổ hợp các yếu tố đầu vào để thu được một loạt các yếu tố đầu ra (mô hình đa biến – multi-variables) và do đó, việc đánh giá hiệu quả của DMU đó thường phải dựa trên nhiều chỉ số hiệu quả khác nhau (đánh giá tổng hợp). Bởi vì các chỉ số hiệu quả này được xây dựng dựa trên nhiều yếu tố khác nhau về bản chất, thước đo (ví dụ như vốn và diện tích nhà xưởng), nên để đánh giá tổng hợp cho từng DMU và so sánh giữa các DMU đòi hỏi phải quy về cùng một thước đo là tiền tệ (quy ra thóc). Khó khăn ở đây là rất khó để xác định giá cả của TẤT CẢ các yếu tố đầu vào và đầu ra cần thiết để tính toán, và đặc biệt, với các yếu tố phản ánh chất lượng (qualitative variables) thì hầu như không thể xác định được giá cả. Vì vậy, cần phải xây dựng một mô hình xác định hiệu quả (tổng hợp) mà không liên quan đến yếu tố giá cả.
Hiệu quả tổng hợp áp dụng cho nhiều biến được tính toán dựa trên hiệu quả riêng lẻ (1 input & 1 output) như sau:
Hiệu quả riêng lẻ: EF = Output/Input
Hiệu quả tổng hợp: EFF = Total Outputs/Total Inputs
Nếu giả thiết một DMU sử dụng yếu tố đầu vào x để sản xuất n yếu tố đầu ra y với cách thức phối hợp các đầu vào và đầu ra nhất định theo hai bộ trọng số tương ứng v và u (u và v chính là tập hợp giá cả của các biến đầu vào và đầu ra, giả thiết là ta có đủ thông tin về giá), thì EFF có thể được tính như  sau:
EFF = (v1*x1 + v2*x2 + … + vm*xm)/(u1*y1 + u2*y2 + … + un*yn)
hay EFF = Σ vixi/Σ ujyji=1…m, j=1…n
Lưu ý: EFF tính được theo công thức trên là hiệu quả (tuyệt đối) của các DMU.
Áp dụng công thức trên ta có thể lần lượt tính toán hiệu quả của từng DMU (trên lí thuyết, mỗi DMU sẽ khác nhau về x và y; còn u, vm và n là giống nhau – thế mới so sánh được với nhau). Trong trường hợp không xác định được giá cả, có thể giả thiết rằng 1 biến đầu vào xi hoặc 1 biến đầu ra yj sẽ được gán cho 1 trọng số vi hoặc uj dựa theo mức độ quan trọng của biến đầu vào (đầu ra) đó đối với DMU đó (thực tế đây cũng là 1 dạng thể hiện thông tin của giá cả). Tuy nhiên, đến đây nảy sinh một vấn đề là mỗi DMU sẽ có đánh giá khác nhau về tầm quan trọng của từng biến đầu vào và đầu ra, do đó mỗi DMU bây giờ sẽ khác nhau cả về u, v, x, và y. Bài toán trở nên phức tạp hơn và cần có sự can thiệp của phương pháp DEA.

h1

Intro to DEA (end)

January 8, 2011
Tính EFF theo phương pháp DEA
Đến đây, lại phải nói qua về đường bao (biên) sản xuất – Production frontier (PF). Khái niệm này xuất phát từ khái niệm Đường giới hạn khả năng sản xuất (Production Possibilities Frontier – PPF*) khi cho rằng PPF là tập hợp của các điểm sản lượng (tiềm năng) TỐI ĐA mà một nền kinh tế có thể đạt được với một (số) đầu vào cho trước. Khi áp dụng vào tính toán hiệu quả của 1 ngành (hay nhóm DMU cần nghiên cứu) thì tập hợp tất cả các điểm HIỆU QUẢ tối đa sẽ tạo nên đường PF. Theo đó, các DMU nằm trên đường PF này sẽ có hiệu quả là 100%, các DMU khác sẽ có hiệu quả nhỏ hơn 100%. Đây là hiệu quả tương đối giữa các DMU với nhau, khác với hiệu quả tuyệt đối được xác định theo công thức ở phần 2. Tuy nhiên, công thức này cũng là cơ sở để xây dựng đường PF theo nguyên lý sau:
1. Vì PF là tập hợp của các điểm hiệu quả tối đa của các DMU, nên việc cần làm là phải xác định các hiệu quả tối đa này.
2. Công thức tính EFF ở phần trên cho thấy mỗi DMU sẽ có 1 bộ trọng số u,v tối ưu nhất để tối đa hóa điểm hiệu quả của mình, bây giờ việc cần làm là tìm ra (các) bộ trọng số u,v tối ưu cho các DMU. Điều này có thể thực hiện được bằng cách (lần lượt) giải bài toán tối ưu hóa (optimization) cho từng DMU theo công thức:
Max EFF (theo u,v)
trong điều kiện
EFF = Σ vixi/Σ ujyji=1…m, j=1…n
EFF <= 1 cho tất cả các DMU (kể cả DMU đang được xem xét).

3. Làm lần lượt như vậy với các DMU khác để tìm ra bộ trọng số tối ưu cũng như điểm hiệu quả tối đa cho từng DMU.
Với phương pháp tính toán như vậy, đường PF tìm được sẽ là đường hiệu quả tối ưu thực tế (best practical frontier) được xây dựng dựa trên số liệu đã có (gọi là thực tế vì nó là hàm optimization hoàn toàn có thể đạt được bằng cách thay đổi bộ trọng số u,v; khác với hàm hồi quy chỉ là dự tính – estimated). Đường PF này sẽ tạo thành 1 đường bao (biên) tối ưu, bên trong nó chính là các điểm thực tế (observed). Do vậy, phương pháp trên còn được gọi là phương pháp phân tích bao dữ liệu (Data Envelopment Analysis – DEA).
Ứng dụng của phương pháp phân tích bao dữ liệu DEA
1. DEA áp dụng được cả với các biến định tính (qualitative), do đó nó thường được ứng dụng để phân tích hiệu quả của các DMU hoạt động trong lĩnh vực xã hội như giáo dục, y tế, bảo hiểm,… và tất nhiên là cả trong lĩnh vực kinh tế như ngân hàng, chứng khoán, sản xuất kinh doanh.
2. Vì DEA được xây dựng dựa trên các điểm thực tế (observed data) nên nó có thể được áp dụng với các mẫu nghiên cứu (sample size) nhỏ, khác với phương pháp phân tích hồi quy thường yêu cầu cỡ mẫu lớn. Do vậy DEA thường được sử dụng để phân tích chuyên sâu theo khu vực, địa phương (region), chẳng hạn như phân tích hiệu quả của các nền kinh tế trong ASEAN, các phòng ban trong 1 doanh nghiệp, các ngân hàng lớn (không phải chi nhánh) trên địa bàn Hà Nội,…
3. Tuy nhiên, hạn chế của phương pháp này (so với phương pháp hồi quy) là nó không tính toán đến yếu tố sai số (error) hay nhiễu (noise), do đó trong DEA không tồn tại yếu tố mức ý nghĩa hay độ tin cậy (significant level). Đồng thời, điểm hiệu quả DEA là hiệu quả tương đối giữa các DMU với nhau, do đó nếu 1 DMU có điểm hiệu quả là 100% và nằm trên đường PF thì cũng KHÔNG có nghĩa là nó đã tối ưu trên thực tế (nó chỉ tối ưu HƠN các DMU khác trong phạm vi phân tích mà thôi). Vì vậy, DEA thường được thực hiện kết hợp với phân tích hồi quy trong một mô hình 2 bước (2-stages DEA) hay nhiều bước (multi-stages DEA) để làm tăng thêm tính thuyết phục của mô hình**.

PS1. Vì đây là Intro nên tôi chỉ giới thiệu chung về nguyên lý của phương pháp phân tích bao dữ liệu mà không đi sâu về mặt toán học hay các dạng cụ thể của phân tích DEA. Những ai muốn trao đổi hoặc tìm hiểu thêm về vấn đề này có thể email trực tiếp cho tôi về địa chỉ butzvn-a-còng-gmail-chấm-com.
PS2. Một số bài viết của tôi sử dụng DEA: http://ssrn.com/author=989383
Xem thêm tại http://vi.wikipedia.org/wiki/Kinh_tế_học
** Cá nhân tôi cho rằng hiện nay chúng ta quá bị ảnh hưởng bởi phân tích hồi quy, cứ mở mồm ra là hỏi phân tích có tin cậy không, mức ý nghĩa bao nhiêu, etc. Phương pháp DEA xây dựng đường PF hiệu quả (có thực, có thể đạt được trên thực tế) dựa trên số liệu (tất nhiên cũng có thực) của các DMU, do đó cũng có thể nói mức độ tin cậy của phương pháp này là 100% (vì DEA có “dự tính” – estimate – gì đâu mà có thể cho ra kết quả sai lệch được).

2 comments:

  1. E cung dang lam luan van thac si ve dea ngan hang nhung con nhieu dieu chua hieu ro dea va phan mem tinh toan. ko biet anh Vuong co the chia se them ve DEA ko?
    Co the lien lac voi anh qua so dt duoc ko? Em la Son, so dt: 0909.872.900
    Hy vong duoc anh chia se!

    ReplyDelete
  2. Trước hết cám ơn bạn đã quan tâm đến blog's của Tôi.
    Lúc trước Tôi có xem 1 bài nghiên cứu của 2 bạn Nguyễn Thanh Tùng và Đinh Thị Ngân có tựa đề là: Ứng dụng Phương pháp DEA trong đánh giá hiệu quả rủi ro của các NHTM CP VN 2008-2011. Vì Tôi không hiểu về DEA nên đã tìm trên mạng để đọc và vô tình tìm thấy được bài này, nhưng lại ko tìm thấy tên tác giả. Tôi xin lỗi tác giả bài này và đã chỉnh sửa lại.
    Tôi thường sử dụng SPSS, Eviews, và hiện tại đang nghiên cứu R và từ trước đến nay chưa từng sử dụng DEA nên không giúp được bạn nhiều. Nhưng đây là facebook và email của tác giả bài này, bạn có thể liên lạc để tìm hiểu kỹ thêm. https://www.facebook.com/ngodangthanh?ref=profile và ngodangthanh@gmail.com
    Bạn có thể tải bài nghiên cứu về DEA tại http://vepr.org.vn/533/news-detail/623228/su-kien-gan-day/seminar-nghien-cuu-kinh-te-va-chinh-sach-so-10.html hoặc http://papers.ssrn.com/sol3/cf_dev/AbsByAuth.cfm?per_id=989383
    Thân ái!

    ReplyDelete