GIS và thống kê không gian trong nghiên cứu cấu trúc không gian đô thị (Phần III)
Phần III – Mô hình hóa không gian đối với thị trường nhà ở tại Hà Nội
Tiếp theo phần I và II trước đây, Phần III của loạt bài viết này trình bày kết quả mô hình hóa không gian đối với thị trường nhà ở tại Hà Nội sử dụng công cụ Spatial Statistics của ArcGIS 10.2. Các yếu tố cấu thành lên giá cả nhà đất tại các khu vực khác nhau của Hà Nội theo lý thuyết SQTO (H.H. Phê & P. Wakely, 2000) được tiếp tục nghiên cứu qua mô hình hồi quy không gian GWR.
I. Mô hình hóa mối quan hệ không gian – phân tích hồi quy không gian
Nếu như các công cụ phân tích thống kê không gian (đã được trình bày tại Phần II của loạt bài này) tập trung vào giải đáp câu hỏi “where - ở đâu?” thì nhóm các công cụ mô hình hóa mối quan hệ không gian - phân tích hồi quy - giúp trả lời câu hỏi logic tiếp theo là “Why - tại sao?”. Phân tích hồi quy cho phép khám phá, kiểm tra và mô hình hóa các mối quan hệ không gian, và có thể giúp giải thích các yếu tố đằng sau các mô hình không gian quan sát được; phân tích hồi quy cũng có thể được sử dụng để dự đoán dựa trên mô hình xây dựng được từ tập dữ liệu mẫu (ESRI).
Có 3 kết quả chính được kỳ vọng khi thực hiện phân tích hồi quy không gian:
· Mô hình hóa các hiện tượng để hiểu rõ nhằm đề ra chính sách tác động hoặc ra quyết định hành động phù hợp. Mục tiêu cơ bản là để đo lường phạm vi mà những thay đổi trong một hoặc nhiều biến đồng thời có thể ảnh hưởng đến những thay đổi của những biến khác.
· Mô hình hóa các hiện tượng để dự đoán giá trị của hiện tượng đó tại những nơi khác hay vào thời điểm khác. Mục tiêu chính là xây dựng mô hình dự đoán phù hợp và chính xác.
· Cũng có thể sử dụng phân tích hồi quy để kiểm định giả thuyết: có hay không mối quan hệ nhân – quả giữa các biến nghiên cứu?...
Dữ liệu không gian có hai đặc tính khác biệt gồm:
(1) Các đối tượng địa lý thường có đặc tính tự tương quan về không gian (spatial autocorelation), tức là những đối tượng gần nhau có xu hướng tương tự nhau hơn là những đối tượng ở xa;
(2) Địa lý là yếu tố quan trọng, và thường thì các quá trình quan trọng trong mô hình là không cố định về không gian (spatial non-stationary), tức là các quá trình này diễn ra khác nhau ở các vùng khác nhau của khu vực nghiên cứu. Tính chất này của dữ liệu không gian có thể hiểu đơn giản là sự biến đổi theo vùng.
Các tính chất này của dữ liệu địa lý được gọi chung là tính phụ thuộc không gian (spatial dependence), hay nói đơn giản là sự biến đổi theo vị trí trong khu vực nghiên cứu của các quá trình được mô hình hóa. Các đặc tính này mang ý nghĩa thống kê là vi phạm các giả định / yêu cầu kinh điển của phân tích hồi quy và có thể làm cho các ước lượng của mô hình hồi quy truyền thống (phi không gian), như hồi quy OLS, không hiệu quả và/hoặc bị chệch. Các phương pháp hồi quy không gian đã được phát triển để phù hợp với hai đặc tính này của dữ liệu địa lý và hơn nữa, còn khai thác những đặc tính đặc biệt này của dữ liệu địa lý để nâng cao độ tin cậy của các mô hình về các mối quan hệ dữ liệu. Về cơ bản, hồi quy không gian xử lý các vấn đề trên bằng cách đưa yếu tố không gian trực tiếp vào trong mô hình tính toán. Một số phương pháp hồi quy không gian xử lý một cách hiệu quả vấn đề đầu tiên - về tự tương quan không gian (spatial autocorrelation); một số khác lại xử lý hiệu quả vấn đề thứ 2 – tính không cố định về không gian (spatial non-stationarity). Hiện tại, chưa có phương pháp hồi quy không gian nào là xử lý hiệu quả đồng thời cả 2 vấn đề trên.
Mục tiêu của hồi quy không gian là ước lượng mối quan hệ giữa biến đầu ra Y với một hoặc nhiều biến dự đoán X, có xem xét đến sự phụ thuộc về không gian giữa các quan sát. Một trong các kỹ thuật hồi quy không gian đang được sử dụng rộng rãi trên thế giới hiện nay là kỹ thuật hồi quy trọng số địa lý (Geographycally Weighted Regression – GWR). Trong khi mô hình hồi quy tuyến tính truyền thống OLS tạo ra một mô hình hồi quy cho tổng thể (hồi quy toàn cầu) thì GWR tạo ra các phương trình hồi quy riêng biệt cho từng đối tượng quan sát của tập dữ liệu (hồi quy địa phương), sử dụng các đối tượng lân cận trong một dải khoảng cách “bandwidth” xác định. Như đã nói ở trên, trong trường hợp dữ liệu phân tích thể hiện tính không cố định về không gian, tức là dữ liệu thay đổi phụ thuộc vào các khu vực địa lý khác nhau, thì mô hình hồi quy OLS xây dựng được có thể không hiệu quả và/hoặc bị chệch. Khi đó, kỹ thuật hồi quy GWR có thể sẽ là sự lựa chọn phù hợp thay thế, như sẽ được trình bày cụ thể trong phần kết quả phân tích hồi quy không gian giá nhà Hà Nội dưới đây.
Khi tiến hành phân tích GWR, hình dạng và kích thước của bandwidth có ảnh hưởng quyết định đến kết quả hồi quy, và chúng phụ thuộc vào các thiết lập đầu vào đối với các yếu tố như: kiểu cửa sổ lọc Kernel, phương pháp xác định bandwidth, dải bandwidth (nếu chọn kiểu cửa sổ lọc là FIXED), và số lượng các đối tượng lân cận được chọn.
II. Kết quả mô hình hóa không gian giá nhà Hà Nội 2014
Như đã được trình bày tại phần II của loạt bài này, bộ dữ liệu khảo sát giá nhà Hà Nội năm 2014 nằm trong khuôn khổ đề tài “Điều tra khảo sát thu thập số liệu và tính toán chỉ số giá bất động sản ứng dụng lý thuyết Vị thế - Chất lượng” của Bộ Xây dựng (Hoàng Hữu Phê & nnk, 2016). Bộ dữ liệu gồm gần 1000 hộ gia đình (chủ sở hữu các đơn vị nhà ở tư nhân) đã được thu thập, làm sạch và tích hợp vào CSDL GIS dưới dạng lớp dữ liệu điểm theo vị trí với các thông tin thuộc tính cơ bản về giá nhà (triệu đồng/m2), các đặc tính vật thể của nhà, đặc điểm vị trí của khu đất, các điều kiện xung quanh cũng như thông tin về sở thích, thị hiếu, thu nhập và trình độ học vấn của chủ hộ… Trên cơ sở lý thuyết SQTO về vị trí dân cư đô thị, đề tài đã nghiên cứu sự phân tầng và mô hình hóa thị trường nhà ở tại Hà Nội với mô hình hồi quy hedonic. Kết quả đã chỉ ra sự hiện diện rõ ràng của các phân khúc thị trường nhà ở tại Hà Nội như phân khúc không gian (theo các thông số địa lý), phân khúc theo mức chất lượng nhà ở, phân khúc theo chất lượng môi trường và phân khúc theo mức tài nguyên con người và mô hình hồi quy stepwise trong SPSS 20.x xác định các biến chính (có giá trị thống kê) ảnh hưởng đến giá nhà ở tại Hà Nội, bao gồm:
HPRICVND = Giá nhà (triệu đồng) – phân theo 5 mức giá
HPRICPSM = Giá nhà tính theo m2 (triệu đồng/m2)
GFA = Tổng diện tích sàn (m2)
PLOTAREA = Diện tích đất (m2)
CENTDISR = Khoảng cách thực tế đến trung tâm thành phố (Tháp Rùa) (m)
DISCENDI = Thời gian đi đến trung tâm quận/ huyện (phút)
PLUMBING = Chất lượng cấp nước sạch (tốt / trung bình / kém)
EDYEARS = Số năm đi học của chủ hộ (năm)…
2.1. Kết quả phân tích hồi quy hedonic
Sử dụng phần mềm ArcGIS Desktop 10.2 với mô hình hồi quy OLS cũng cho thấy được kết quả tương tự với giá nhà tại Hà Nội phụ thuộc vào các biến về chất lượng nhà ở (diện tích đất và diện tích sàn xây dựng) và vị trí không gian (khoảng cách đến các trung tâm đô thị) với các giá trị thống kê cho từng biến độc lập có ý nghĩa dưới đây. Về tổng thể, mô hình giải thích được khoảng 31% biến thiên trong giá nhà trên địa bàn Hà Nội (R2Adjusted = 0,31) và được kiểm định là có ý nghĩa thống kê (F-Statistic = 84,33; p < 0,00001).
Kiểm định yêu cầu về tính phân bố ngẫu nhiên độc lập của phần dư hồi quy OLS cho thấy điều kiện này không được thỏa mãn một cách có ý nghĩa thống kê với z-score = 13,23 và p-value < 0,00001 (Hình 1). Điều này làm giảm sự phù hợp và độ tin cậy của mô hình hồi quy OLS xây dựng được ở trên và cho thấy mô hình hồi quy OLS chưa đủ để lượng hóa một cách tin cậy thị trường nhà ở Hà Nội, đặc biệt do các đặc tính địa lý của các biến độc lập.
Hình 1. Kết quả kiểm định phần dư của mô hình OLS
Đặc tính địa lý của các biến độc lập đã được xác nhận bởi kết quả nghiên cứu cấu trúc không gian đô thị Hà Nội - chỉ ra sự phân bố tập trung theo cấu trúc đa cực vị thế đối với mật độ dân số, mật độ giao thông cũng như đối với các đặc tính xã hội môi trường như chất lượng cấp nước, trình độ học vấn… (xem Phần II).
2.2. Kết quả phân tích tính tự hồi quy không gian của giá nhà Hà Nội
Như diễn giải trên, thị trường nhà ở thường phản ảnh sự phân bố của cư dân đô thị với các đặc tính địa lý rất rõ rệt. Kết quả nội suy Kriging cho thấy sự phân bố theo cấu trúc đồng tâm của giá nhà (HPRICVND, HPRICPSM) quanh khu vực trung tâm thành phố với xuất hiện của 1 số trung tâm đô thị mới (tham khảo phần II). Sự phân bố không gian đối với các biến đặc điểm chính của nhà (PLOTAREA và GFA) lại cho thấy bức tranh khác với diện tích đất thường lớn ở khu vực ngoài trung tâm và diện tích sàn xây dựng ít thay đổi theo khu vực (Hình 2).
Hình 2. Bản đồ phân bố không gian giá nhà và các đặc điểm chính của nhà (sử dụng kriging)
Tuy nhiên, kết quả phân tích tính tự tương quan không gian (Spatial Autocorrelation) cho thấy giá trị z-score = 0,61 với p-value = 0,54 > 0,05 - chứng tỏ biến giá nhà ở tại Hà Nội (được khảo sát) có tính tự tương quan không gian thấp và không có ý nghĩa thống kê (Hình 3). Do chỉ số tự tương quan đo lường mức độ tương tự về giá nhà giữa các vị trí nhà ở gần nhau, kết quả trên cho thấy về tổng thể trong bộ mẫu khảo sát, giá nhà ở 1 vị trí ít bị ảnh hưởng có ý nghĩa thống kê bởi giá của nhà ở khu vực liền kề, hay nói cách khác là biến giá nhà có tính ngẫu nhiên độc lập so với khoảng cách vị trí nhỏ. Điều này kết hợp với tính tự tương quan cao của các biến độc lập (như mô tả trên và tại phần II) cho thấy mô hình hồi quy trọng số địa lý GWR có lẽ phù hợp hơn so với mô hình tự hồi quy không gian (spatial autoregression models).
Hình 3. Kết quả phân tích tính tự tương quan không gian của biến giá nhà
2.3. Kết quả phân tích hồi quy trọng số địa lý GWR
Sử dụng công cụ Geographically Weighted Regression của phần mềm ArcGIS Desktop 10.2, kết quả phân tích hồi quy trọng số địa lý GWR cho thấy có sự cải thiện đáng kể so với hồi quy OLS truyền thống - mô hình GWR giải thích được trên 54% biến thiên trong giá nhà trên địa bàn Hà Nội (R2Adjusted = 0,54 với chỉ số AIC = 14.140,64).
Hình 4. Kết quả kiểm định phần dư của mô hình GWR
Kết quả kiểm định yêu cầu về tính phân bố ngẫu nhiên độc lập của phần dư hồi quy GWR cho thấy điều kiện được thỏa mãn một cách có ý nghĩa thống kê với z-score = -0,31 và p-value = 0,76 > 0,05 (Hình 4).
Mô hình cũng được đánh giá theo chỉ số Conditional Number (CN) cho thấy giá trị chỉ số CN nằm trong khoảng từ 6,45 đến 29,64 chứng tỏ không có hiện tượng cộng tuyến (collinearity) trong các mô hình hồi quy địa phương GWR. Giá trị Local R2 của mô hình có tính phù hợp tốt hơn (trên 50%) ở phần lớn các khu vực của Hà Nội (Hình 5).
Hình 5. Kết quả đánh giá mô hình GWR theo CN và Local R2
So sánh sự phân bố không gian của giá nhà thực tế khảo sát và kết quả dự đoán bằng hồi quy GWR với giá nhà nội suy Kriging cho thấy có sự tương đồng (trùng hợp) tương đối tốt của cả 3 nhóm ở những khu vực giá cao, giá trung bình, cũng như khu vực giá thấp (tương ứng với dải màu từ đỏ cam - vàng – xanh trên Hình 6).
Hình 6. So sánh phân bố kết quả GWR (hình phải) và giá nhà khảo sát thực tế (hình trái) so với kriging
Giá nhà dự đoán theo mô hình GWR được tính cho từng vị trí khảo sát (Hình 5) là 1 hàm của các biến độc lập gồm vị trí tương đối (CENTDISR & DISCENDI) và đặc điểm chính của nhà (PLOTAREA & GFA). Hình 7 thể hiện sự đóng góp của các biến độc lập cấu thành lên giá nhà được phân bố biến thiên tại các khu vực khác nhau của Hà Nội.
Hình 7. Phân bố về sự quan trọng của các biến độc lập cấu thành lên giá nhà Hà Nội
Kết quả khẳng định về sự phân tầng không gian rõ rệt của thị trường nhà Hà Nội với hành vi của mô hình GWR (giá nhà được tạo nên dựa trên vị trí tương đối và chất lượng xây dựng nhà) biến đổi từ khu vực trung tâm ra ngoại thành. Tại khu vực trung tâm, dường như giá nhà ít phụ thuộc vào khoảng cách đến Tháp Rùa, trong khi tại các khu đô thị mới ven đô (ví dụ Mỹ Đình & Hà Đông), giá nhà giảm nhanh theo khoảng cách đến các trung tâm quận huyện (cực vị thế mới hình thành). Đối với khu vực trung tâm, giá nhà tăng nhanh theo diện tích đất (PLOTAREA), trong khi tại các khu đô thị mới ở rìa khu vực trung tâm, giá nhà phụ thuộc nhiều hơn vào chất lượng xây dựng nhà (GFA, Hình 7).
III. Kết luận và các bước nghiên cứu tiếp
Với kết quả thu được qua trình bày tại 3 phần của loạt bài này, việc kết hợp phương pháp thống kê không gian trên nền GIS (sử dụng bộ công cụ spatial statistics trong phần mềm ArcGIS for Desktop 10.2) đã giúp nghiên cứu cấu trúc không gian đô thị và mô hình hóa thị trường nhà tại Hà Nội. Các yếu tố đóng góp đáng kể cho sự biến động của giá nhà gồm vị trí và chất lượng xây dựng được đánh giá với mức độ quan trọng trong cấu thành lên giá nhà được xác định chi tiết cho các khu vực khác nhau trên địa bàn Hà Nội. Giải quyết các yêu cầu về cộng tuyến và tính tự tương quan không gian, mô hình GWR giúp cân nhắc đến tác động của các cực vị thế không gian mới xuất hiện tại Hà Nội và dự đoán tốt hơn giá nhà tại Hà Nội (so với mô hình OLS). Kết quả ban đầu đầy hứa hẹn này cũng chỉ ra những hướng nghiên cứu tiếp theo như mở rộng khu vực nghiên cứu, bổ sung bộ dữ liệu khảo sát, kết hợp với GIS nhằm tạo thêm các biến không gian về hạ tầng / môi trường sống đô thị và áp dụng thêm các kỹ thuật phân tích thống kê không gian nhằm hoàn thiện mô hình và tiến tới một hệ thống hỗ trợ việc ra quyết định trên nền GIS trong các chương trình phát triển nhà ở tại Hà Nội và các thành phố lớn khác ở Việt Nam.
Liên hệ với chúng tôi để biết thêm thông tin chi tiết và trao đổi về các kết quả nghiên cứu...
(Phạm Khánh Chi & Trần Hùng, Công ty Tư vấn GeoViệt, 2016)
Tài liệu tham khảo
1. Phe H. H. & Wakely P., 2000. Status, Quality and the Other Trade-off: Towards a New Theory of Urban Residential Location, Urban Studies, Vol. 37, No. 1, pp. 7-35, 2000.
2. Hoàng Hữu Phê & nnk, 2014. LÝ THUYẾT VỊ THẾ -CHẤT LƯỢNG VÀ CHÍNH SÁCH NHÀ Ở: Sự phân khúc của thị trường nhà ở tại Hà Nội và các thách thức phát triển. Hội thảo Khoa học quốc gia: “Kinh doanh bất động sản - Cơ hội và thách thức trong bối cảnh thị trường có dấu hiệu phục hồi”, Đại học Kinh tế Quốc dân, 11/2014.
3. Phe H. H. et. al., 2015. Status- Quality Trade-off Theory and Housing Policy: The segmentation of Hanoi City’s housing market and the development challenges. Paper presented for the RMIT Seminar Series.
4. Hoàng Hữu Phê & nnk, 2016. Báo cáo tổng hợp dự án “Điều tra khảo sát thu thập số liệu và tính toán chỉ số giá bất động sản ứng dụng lý thuyết vị thế - chất lượng”. Bộ Xây dựng, 2016.
5. Comber A., Phe H. H., Hung T., Chi P.K., 2016. Modelling hedonic house price in Hanoi: SQTO theory with localised regressions adapted for collinear effects. Paper submitted to Urban Studies.