다단계 구조 모델링에서 대규모 언어 모델의 환각 현상을 줄이기 위한 새로운 멀티 에이전트 아키텍처
A Novel Multi-Agent Architecture to Reduce Hallucinations of Large Language Models in Multi-Step Structural Modeling
GPT 및 Gemini와 같은 대규모 언어 모델(LLM)은 문맥 이해 및 추론 능력에서 놀라운 성능을 보여주었습니다. 이러한 LLM의 강력한 성능은 인간 전문가의 지식에 의존하는 기존 작업을 자동화하는 데 활용하는 데 대한 관심이 높아지고 있습니다. 최근에는 LLM이 구조 분석 소프트웨어(예: OpenSees)를 사용하여 구조 모델을 구축하고 분석을 수행하는 지능형 에이전트에 통합되었습니다. 그러나 기존 LLM은 장기간의 연산 과정에서 빈번하게 발생하는 환각 현상과 오류 누적 때문에 다단계 구조 모델링에 어려움을 겪습니다. 이에 본 연구에서는 OpenSeesPy를 사용하여 구조 모델링 및 분석을 자동화하기 위한 새로운 멀티 에이전트 아키텍처를 제안합니다. 먼저, 문제 분석 및 모델링 계획 에이전트가 사용자 설명에서 핵심 매개변수를 추출하고 단계별 모델링 계획을 수립합니다. 노드 및 요소 에이전트는 병렬로 작동하여 프레임 기하학적 구조를 조립하고, 그 후에는 하중 할당 에이전트가 작동합니다. 생성된 기하학적 정보와 하중 정보는 코드 변환 에이전트에 의해 실행 가능한 OpenSeesPy 스크립트로 변환됩니다. 제안된 아키텍처는 20개의 프레임 문제를 대상으로 10회 반복 실험을 수행하여 평가했으며, 18개의 경우에서 100% 정확도를 달성하고 나머지 2개의 경우에서는 90%의 정확도를 보였습니다. 또한, 제안된 아키텍처는 계산 효율성을 크게 향상시키고 더 큰 구조 시스템에 대한 확장성을 입증했습니다.
Large language models (LLMs) such as GPT and Gemini have demonstrated remarkable capabilities in contextual understanding and reasoning. The strong performance of LLMs has sparked growing interest in leveraging them to automate tasks traditionally dependent on human expertise. Recently, LLMs have been integrated into intelligent agents capable of operating structural analysis software (e.g., OpenSees) to construct structural models and perform analyses. However, existing LLMs are limited in handling multi-step structural modeling due to frequent hallucinations and error accumulation during long-sequence operations. To this end, this study presents a novel multi-agent architecture to automate the structural modeling and analysis using OpenSeesPy. First, problem analysis and construction planning agents extract key parameters from user descriptions and formulate a stepwise modeling plan. Node and element agents then operate in parallel to assemble the frame geometry, followed by a load assignment agent. The resulting geometric and load information is translated into executable OpenSeesPy scripts by code translation agents. The proposed architecture is evaluated on a benchmark of 20 frame problems over ten repeated trials, achieving 100% accuracy in 18 cases and 90% in the remaining two. The architecture also significantly improves computational efficiency and demonstrates scalability to larger structural systems.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.