AI 원숭이는 반드시 포도를 얻는다 -- 신뢰할 수 있는 의사결정을 위한 구면 신경망
An AI Monkey Gets Grapes for Sure -- Sphere Neural Networks for Reliable Decision-Making
본 논문은 신경망 추론의 세 가지 방법론적 범주인 LLM 추론, 지도 학습 기반 추론, 명시적 모델 기반 추론을 비교한다. LLM은 여전히 신뢰도가 낮으며, 동물이 방대한 말뭉치 훈련 없이도 습득할 수 있는 간단한 의사결정조차 어려워한다. 우리는 선언적 삼단논법 추론(disjunctive syllogistic reasoning) 테스트를 통해 지도 학습을 이용한 추론이 명시적 모델 구성을 이용한 추론보다 효과적이지 않음을 보인다. 구체적으로, 고전적 삼단논법 추론에서 100.00% 정확도를 달성하도록 훈련된 오일러 넷(Euler Net)이 선언적 삼단논법 추론에서도 100.00% 정확도에 도달하도록 훈련될 수 있음을 보인다. 그러나 이렇게 재훈련된 오일러 넷은 심각한 치명적 망각(catastrophic forgetting) 현상을 겪어 이미 학습한 고전적 삼단논법 추론에서의 성능이 6.25%로 급락하며, 그 추론 능력 또한 패턴 수준에 국한된다. 이에 우리는 개념을 n차원 구 표면상의 원으로 임베딩하는 새로운 형태의 구면 신경망(Sphere Neural Networks)을 제안한다. 이 구면 신경망은 보수 원(complement circles)을 통해 부정 연산자를 표현할 수 있으며, 충족 불가능한 원형 배치를 형성하는 비논리적 진술을 걸러냄으로써 신뢰할 수 있는 의사결정을 수행한다. 우리는 구면 신경망이 고전적 삼단논법 추론의 엄밀성을 유지하면서도, 까다로운 선언적 삼단논법 추론을 포함한 16가지 삼단논법 추론 과제를 완벽하게 수행할 수 있음을 입증한다. 결론적으로, 우리는 명시적 모델 구성을 동반한 신경망 추론이 세 가지 신경망 추론 방법론 중 가장 신뢰할 수 있는 방식임을 확인한다.
This paper compares three methodological categories of neural reasoning: LLM reasoning, supervised learning-based reasoning, and explicit model-based reasoning. LLMs remain unreliable and struggle with simple decision-making that animals can master without extensive corpora training. Through disjunctive syllogistic reasoning testing, we show that reasoning via supervised learning is less appealing than reasoning via explicit model construction. Concretely, we show that an Euler Net trained to achieve 100.00% in classic syllogistic reasoning can be trained to reach 100.00% accuracy in disjunctive syllogistic reasoning. However, the retrained Euler Net suffers severely from catastrophic forgetting (its performance drops to 6.25% on already-learned classic syllogistic reasoning), and its reasoning competence is limited to the pattern level. We propose a new version of Sphere Neural Networks that embeds concepts as circles on the surface of an n-dimensional sphere. These Sphere Neural Networks enable the representation of the negation operator via complement circles and achieve reliable decision-making by filtering out illogical statements that form unsatisfiable circular configurations. We demonstrate that the Sphere Neural Network can master 16 syllogistic reasoning tasks, including rigorous disjunctive syllogistic reasoning, while preserving the rigour of classical syllogistic reasoning. We conclude that neural reasoning with explicit model construction is the most reliable among the three methodological categories of neural reasoning.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.