2601.08464v1 Jan 13, 2026 cs.CV

CoMa: 비전-언어 모델을 활용한 맥락 기반 건물 배치 생성

CoMa: Contextual Massing Generation with Vision-Language Models

V. Khrulkov
V. Khrulkov
Citations: 3,369
h-index: 16
I. Oseledets
I. Oseledets
Citations: 611
h-index: 13
Evgenii Maslov
Evgenii Maslov
Citations: 3
h-index: 1
A. Volkova
A. Volkova
Citations: 4
h-index: 1
Anton Gusarov
Anton Gusarov
Citations: 5
h-index: 2
Andrey Kuznetsov
Andrey Kuznetsov
Citations: 64
h-index: 3

건축 및 도시 계획, 특히 건물 배치 단계는 복잡하며, 설계자의 직관과 수동 작업에 크게 의존합니다. 이를 해결하기 위해, 우리는 기능적 요구 사항과 부지 맥락을 기반으로 건물을 배치하는 자동화된 프레임워크를 제안합니다. 이러한 데이터 기반 방법론의 주요 장애물은 적절한 데이터셋의 부족이었습니다. 이에 따라, 우리는 CoMa-20K 데이터셋을 소개합니다. 이 데이터셋은 상세한 건물 배치 기하학 정보, 관련 경제적 및 프로그램 데이터, 그리고 기존 도시 맥락 내에서의 개발 부지에 대한 시각적 표현을 포함하는 종합적인 데이터셋입니다. 우리는 이 데이터셋을 사용하여 건물 배치 생성을 비전-언어 모델(VLMs)의 조건부 작업으로 정의하고, 파인튜닝된 모델과 대규모 제로샷 모델 모두를 평가했습니다. 실험 결과는 이 작업의 고유한 복잡성을 보여주는 동시에, VLMs가 맥락에 민감한 건물 배치 옵션을 생성할 수 있는 잠재력을 입증합니다. 이 데이터셋과 분석은 데이터 기반 건축 설계 분야의 기초적인 벤치마크를 확립하고, 향후 연구를 위한 중요한 기회를 강조합니다.

Original Abstract

The conceptual design phase in architecture and urban planning, particularly building massing, is complex and heavily reliant on designer intuition and manual effort. To address this, we propose an automated framework for generating building massing based on functional requirements and site context. A primary obstacle to such data-driven methods has been the lack of suitable datasets. Consequently, we introduce the CoMa-20K dataset, a comprehensive collection that includes detailed massing geometries, associated economical and programmatic data, and visual representations of the development site within its existing urban context. We benchmark this dataset by formulating massing generation as a conditional task for Vision-Language Models (VLMs), evaluating both fine-tuned and large zero-shot models. Our experiments reveal the inherent complexity of the task while demonstrating the potential of VLMs to produce context-sensitive massing options. The dataset and analysis establish a foundational benchmark and highlight significant opportunities for future research in data-driven architectural design.

0 Citations
0 Influential
8 Altmetric
40.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!