위성 이미지와 생성형 AI를 활용한 글로벌 도시 개발 비전 제시
Envisioning global urban development with satellite imagery and generative AI
도시 개발은 인류 역사에서 중요한 역할을 해왔으며, 수세기 동안 도시의 모습을 형성해 왔습니다. 그러나 기존 연구들은 주로 도시 개발을 예측하는 과제로 다루어 왔으며, 그 생성적인 특성을 제대로 반영하지 못했습니다. 이에 본 연구는 지속 가능한 글로벌 규모의 도시 개발을 시각화하기 위한 다중 모드 생성형 AI 프레임워크를 설계했습니다. 본 프레임워크는 프롬프트와 지리 공간 제어를 통합하여 전 세계 500대 대도시 지역에 대해 고품질, 다양하고 현실적인 도시 위성 이미지를 생성합니다. 사용자는 도시 개발 목표를 지정하여 이를 반영하는 새로운 이미지를 생성할 수 있으며, 텍스트 프롬프트와 지리 공간 제약을 통해 다양한 시나리오의 모습을 제어할 수 있습니다. 또한, 주변 환경으로부터 학습하여 도시 재개발 방안을 제시하는 데에도 활용될 수 있습니다. 시각적 합성뿐만 아니라, 본 연구는 도시 형태의 잠재적 표현을 인코딩하고 해석하여 글로벌 도시 간 학습을 가능하게 하며, 이를 통해 도시 환경의 스타일을 글로벌 공간 네트워크를 통해 성공적으로 전이할 수 있습니다. 이러한 잠재적 표현은 탄소 배출 예측과 같은 후속 예측 작업의 성능을 향상시킬 수도 있습니다. 또한, 인간 전문가의 평가 결과, 생성된 도시 이미지가 실제 도시 이미지와 유사한 수준임을 확인했습니다. 종합적으로, 본 연구는 혁신적인 도시 계획 접근 방식을 제시하며, 전 세계 도시를 위한 시나리오 기반 계획 프로세스를 지원합니다.
Urban development has been a defining force in human history, shaping cities for centuries. However, past studies mostly analyze such development as predictive tasks, failing to reflect its generative nature. Therefore, this study designs a multimodal generative AI framework to envision sustainable urban development at a global scale. By integrating prompts and geospatial controls, our framework can generate high-fidelity, diverse, and realistic urban satellite imagery across the 500 largest metropolitan areas worldwide. It enables users to specify urban development goals, creating new images that align with them while offering diverse scenarios whose appearance can be controlled with text prompts and geospatial constraints. It also facilitates urban redevelopment practices by learning from the surrounding environment. Beyond visual synthesis, we find that it encodes and interprets latent representations of urban form for global cross-city learning, successfully transferring styles of urban environments across a global spatial network. The latent representations can also enhance downstream prediction tasks such as carbon emission prediction. Further, human expert evaluation confirms that our generated urban images are comparable to real urban images. Overall, this study presents innovative approaches for accelerated urban planning and supports scenario-based planning processes for worldwide cities.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.