【作者】
張業(yè)成a,?, 趙慧敏,?, 龍瀛,*
a ,b 清華大學建筑學院
c 清華大學建筑學院和恒隆房地產(chǎn)研究中心,教育部生態(tài)規(guī)劃與綠色建筑重點實驗室
?共同第一作者
通訊作者郵箱
ylong@tsinghua.edu.cn
原文鏈接
https://www.nature.com/articles/s41597-025-04730-5
內(nèi)容導讀
快速獲取三維(3D)建筑數(shù)據(jù),包括屋頂、高度和結(jié)構等幾何屬性,以及功能、質(zhì)量和年齡等指標屬性,對于準確的城市分析、模擬和政策更新至關重要。當前的建筑物數(shù)據(jù)集存在多維屬性時空覆蓋缺失。龍瀛課題組開發(fā)了一個用于大規(guī)模建筑建模的人工智能框架(圖1),提出了第一個國家規(guī)模的多屬性建筑物數(shù)據(jù)集CMAB,覆蓋了中國3667個實體城市,3100萬個建筑和236億m2的屋頂,在基于OCRNet的提取中F1值為89.93%,總計3630億m3的建筑存量?;诔鞘行姓燃壏诸愑柧毩藱C器學習模型,包含形態(tài)、區(qū)位和功能等特征。使用多源數(shù)據(jù),包括數(shù)10億張高分辨率遙感圖像和6000萬張街景圖像,通過深度學習、機器學習和多模態(tài)大模型為每棟建筑生成了屋頂、高度、結(jié)構、功能、風格、年齡和質(zhì)量屬性。準確性通過模型基準、現(xiàn)有的類似產(chǎn)品和人工檢查進行了驗證,準確率超過80%。數(shù)據(jù)集和結(jié)果對于全球可持續(xù)發(fā)展目標和城市規(guī)劃至關重要。
圖1 CMAB的整體建模框架
研究背景
在過去幾十年的城市化進程中,世界各地的城市經(jīng)歷了快速擴張,建筑物成為空間基本細胞單元,城市在三維形態(tài)和社會功能方面呈現(xiàn)出日益復雜的變化。通過構建數(shù)據(jù)集全面了解城市的精細三維物理和社會結(jié)構,對于研究城市化進程、城市能源、城市生態(tài)系統(tǒng)以及與碳排相關的政府決策至關重要。建筑屬性可以大致分為兩類:幾何屬性,包括建筑二維形態(tài)、高度、結(jié)構和方位;和指標屬性,包括功能、風格、年齡、質(zhì)量和空置。幾何屬性對于分析城市物理結(jié)構和規(guī)劃城市空間至關重要,而指標屬性是理解建筑性能和生命周期的關鍵。
一方面,由于以往數(shù)據(jù)的空間和時間分辨率不足、訓練樣本有限以及訓練成本高昂,三維城市形態(tài)信息由于測繪成本和技術限制一直難以大規(guī)模展開,尤其是在發(fā)展中國家。因為傳統(tǒng)航空測量經(jīng)濟成本高、時間長,使用開源數(shù)據(jù)快速提取三維建筑數(shù)據(jù)是未來的發(fā)展趨勢。另一方面,目前對城市結(jié)構的理解仍主要停留在物理層面,以現(xiàn)有的建筑屋頂和高度數(shù)據(jù)為代表,缺乏建筑物的綜合社會屬性,如功能、風格、年齡和質(zhì)量。據(jù)調(diào)查,CMAB是世界上第一個在建筑單體層面提供這些屬性的國家規(guī)模的尺度開放建筑物數(shù)據(jù)集。
圖2. 建筑屬性和數(shù)據(jù)來源可視化
主要解決問題
1. 空間抽樣策略
首先定義實體城市的邊界,以明確數(shù)據(jù)產(chǎn)品的提取范圍。根據(jù)中國的氣候區(qū)劃和行政城市級別選擇建筑樣本,并將所有建筑物按照其對應的行政級別分為五類。
圖3. 中國實體城市抽樣、行政等級分類與所用多源數(shù)據(jù)的空間完備性
圖4. 實體城市GES影像的時間分布
2. 構建指標體系,提取三維建筑
利用手工標注增強的屋頂樣本來訓練OCRNet模型,并采用空間聚合方法提取所有實體城市的建筑屋頂。在此基礎上,計算不同尺度下的建筑形態(tài)、密度和區(qū)位特征。針對每個行政級別的建筑,訓練合適的分區(qū)模型以完成三維建筑的提取。同時在建筑高度的指標體系上加入建筑功能特征。
圖5. 用于標注增強的高密度區(qū)域重采樣過程
圖6. 百度建筑數(shù)據(jù)集的統(tǒng)計與預處理
圖7. 用于高度和功能估計的建筑物特征構建
圖8. 建筑特征計算——以臨街和功能區(qū)位為例
3. 提取指標屬性
使用多源數(shù)據(jù)進一步提取不同尺度下的功能特征,生成功能特征。通過結(jié)合長時序不透水面和6000萬條街景圖像,通過空間匹配和目標檢測為每個建筑單體分配建筑年代和質(zhì)量。此外,建筑的結(jié)構、風格屬性通過微調(diào)CLIP多模態(tài)模型獲得。
圖9. 通過街景評估沿街建筑的質(zhì)量
圖10. 使用GAIA數(shù)據(jù)為建筑物添加建筑年齡
4. 數(shù)據(jù)驗證
對建筑的屋頂、高度和功能進行了模型評估和數(shù)據(jù)對比,并通過手工標注的街景數(shù)據(jù)集對建筑的高度、結(jié)構、功能、風格、質(zhì)量和年代進行了驗證。
圖11. 建筑物多屬性的人工驗證方法
成效分析
1. 數(shù)據(jù)產(chǎn)品整體介紹
該數(shù)據(jù)集可在Figshare網(wǎng)站:https://doi.org/10.6084/m9.figshare.27992417獲得。該產(chǎn)品按實體城市和行政區(qū)劃組織,并以標準GIS格式保存。每個建筑物屋頂被保存為由地理坐標系WGS1984下有限數(shù)量的點繪制的多邊形,包括建筑物屋頂、高度、結(jié)構、功能、年齡、風格和質(zhì)量作為建筑物屬性。
圖12. 北京多屬性建筑物數(shù)據(jù)集的可視化
2.建筑輪廓結(jié)果
評估基于一個驗證集,包含來自七個不同氣候區(qū)的城市中23,415個手動標注的建筑屋頂。結(jié)果顯示,建筑屋頂分割模型在相關數(shù)據(jù)集上的交并比(mIoU)、召回率(Recall)和精度(Precision)方面優(yōu)于現(xiàn)有研究。在補充了114,783個建筑單體的標注數(shù)據(jù)后,屋頂分割模型達到了91.59%的準確率,81.95%的 mIoU,89.93%的 F1 分數(shù),以及79.86%的 Kappa 系數(shù)。
3.建筑高度結(jié)果
通過可視化和高度分類和 GABLE 數(shù)據(jù)集進行了比較。GABLE 是一個通過光學影像識別中國所有建筑高度的產(chǎn)品,提供了 0-10、10-30、30-50、50-100、100-500 米高度區(qū)間的 RMSE 值。根據(jù)這些區(qū)間分類數(shù)據(jù)后發(fā)現(xiàn),在50米以下的區(qū)間內(nèi),表現(xiàn)出更低的 RMSE 值。根據(jù)使用的 Baidu 數(shù)據(jù)統(tǒng)計,98% 的建筑高度低于50米。另外,根據(jù)2020年中國人口普查,超過10層的住宅建筑(大致相當于建筑高度超過30米)僅占1%。
圖13. 與GABLE建筑高度的可視化與比較
圖14. 分區(qū)模型和組合模型的相對誤差和絕對誤差值表示的不確定性
4. 建筑功能結(jié)果
劃分模型的表現(xiàn)優(yōu)于組合模型,住宅功能識別的精度更高,F(xiàn)1 分數(shù)接近 0.90。而其他功能類別,如辦公樓的識別精度略低,F(xiàn)1 分數(shù)接近 0.80。相比之下,商業(yè)和公共服務功能的模型表現(xiàn)較差,F(xiàn)1 分數(shù)約為 0.5。使用街景數(shù)據(jù)對 2500 棟建筑的功能進行了人工驗證,發(fā)現(xiàn) 88% 的建筑功能分類是準確的。這表明方法能夠正確識別大多數(shù)建筑的功能用途。
圖15. 建筑功能模型的準確度
5.建筑質(zhì)量和年代結(jié)果
各種建筑質(zhì)量類別的識別準確率如下:“外立面損壞的建筑”(83.4%)、“非法/臨時建筑”(71.6%)、“涂鴉/非法廣告”(80.7%)、“門面差的商店”(89.8%)、“外立面不整潔的建筑”(79.9%)和“招牌差的商店”(84.6%)。建筑年代的準確性則依賴于 GAIA 數(shù)據(jù)的精度。GAIA 各年份的平均總體準確率高于 90%。利用安居客的住房交易數(shù)據(jù),其中包括 3771892 條房屋租賃,包含建筑年份和坐標信息。發(fā)現(xiàn)在省級層面上,住房交易數(shù)據(jù)中的建筑年代與估計值之間存在顯著正相關關系。與 GAIA 的建筑年代數(shù)據(jù)相比,結(jié)果顯示平均差異為 8.7 年,GAIA 的建筑年代通常比住房交易記錄的時間要早。使用街景通過人工審核對 2500 棟建筑的質(zhì)量和年代進行了手動標注,給建筑質(zhì)量問題分配了從 0 到 6 的嚴重程度評分。與現(xiàn)有結(jié)果進行相關性分析,得到了 R2 值為 0.78。關于建筑年代,將手動標注的建筑年代分為五個類別(1985、1990、2000、2010和 2018),并統(tǒng)計所識別的建筑年代是否符合觀察到的真實類別值,發(fā)現(xiàn) 82% 的建筑分類驗證是準確的。
6.建筑結(jié)構和風格結(jié)果
目前,大型多模態(tài)模型(LMMs)如 GPT-4o 等已經(jīng)顯著改變了機器學習應用建模的范式。測試并微調(diào)了CLIP 和 GPT-4o等模型。比較深度學習和大模型訓練成本、精度差異和識別效率,發(fā)現(xiàn)LMMs 在推斷建筑結(jié)構和風格方面表現(xiàn)良好(見圖 S9)。
圖16. 通過街景微調(diào)LMMs預測建筑物屬性的準確性
介紹
研究團隊介紹
論文共同第一作者為清華大學城市規(guī)劃系博士生張業(yè)成、博士生趙慧敏,清華大學龍瀛教授為通訊作者。研究由國家自然科學基金重大項目(項目號:62394335和62394331)、面上項目(城市收縮背景下城市空置的智能測度、機理認知與規(guī)劃設計響應研究,項目號:52178044)和能源基金會項目(項目號:G-2306-34815)資助。
同時,龍瀛課題組已發(fā)布的相關數(shù)據(jù)集“全球1公里網(wǎng)格人口數(shù)據(jù)集(2020-2100)”,關聯(lián)論文入選ESI高被引論文,論文共同第一作者為清華大學城市規(guī)劃系博士生王新宇,清華大學出站博士后、中國礦業(yè)大學講師孟祥鳳,清華大學龍瀛教授為通訊作者。該數(shù)據(jù)集覆蓋全球248個國家或地區(qū),其空間分辨率為30弧秒(約1公里),間隔時間為5年。數(shù)據(jù)集同5個社會經(jīng)濟共享路徑情景(Shared Socioeconomic Pathways, SSPs)相統(tǒng)一。通過與WorldPop數(shù)據(jù)集在省級層面和網(wǎng)格層面的比較得到驗證,可以作為各領域預測研究的輸入數(shù)據(jù)。成果于2022年9月在Scientific Data上以數(shù)據(jù)論文形式發(fā)布,目前數(shù)據(jù)瀏覽量超過14200次,下載量超過13400次。
文章URL:
建筑數(shù)據(jù):https://www.nature.com/articles/s41597-025-04730-5
人口數(shù)據(jù):https://www.nature.com/articles/s41597-022-01675-x
數(shù)據(jù)和代碼:
建筑數(shù)據(jù):https://doi.org/10.6084/m9.figshare.27992417
人口數(shù)據(jù):https://doi.org/10.6084/m9.figshare.19608594
聲明:本文系轉(zhuǎn)載自互聯(lián)網(wǎng),請讀者僅作參考,并自行核實相關內(nèi)容。若對該稿件內(nèi)容有任何疑問或質(zhì)疑,請立即與鐵甲網(wǎng)聯(lián)系,本網(wǎng)將迅速給您回應并做處理,再次感謝您的閱讀與關注。
不想錯過新鮮資訊?
微信"掃一掃"