지역적 설명: 로컬 및 글로벌 변수 중요성 간의 연결
Regional Explanations: Bridging Local and Global Variable Importance
본 연구에서는 널리 사용되는 두 가지 로컬 설명 방법, 즉 로컬 섀플리 값(Local Shapley Values)과 LIME을 분석합니다. 이 방법들은 입력 변수 $x_i$가 특정 예측 $f(x_1, ext{...}, x_p)$에 기여하는 정도를 정량화하는 것을 목표로 합니다. 그러나 이상적인 조건에서도 정확한 계산과 독립적인 변수를 사용하더라도, 이 방법들이 로컬적으로 중요한 변수를 신뢰성 있게 감지하는 데 근본적인 한계가 있음을 확인했습니다. 우리는 견고한 로컬 설명 방법이 모델 출력에 영향을 미치지 않거나 (예: 선형 모델에서 계수가 0인 변수) 기능 관련 변수와 통계적 의존성을 나타내지 않는 변수에 중요도를 부여해서는 안 된다고 주장합니다. 우리는 로컬 섀플리 값과 LIME 모두가 이 기본적인 원칙을 위반한다는 것을 보여줍니다. 이를 해결하기 위해, 로컬 및 글로벌 설명 간의 격차를 해소하고 보다 정확한 설명을 제공하는 R-LOCO (Regional Leave Out COvariates)를 제안합니다. R-LOCO는 입력 공간을 유사한 변수 중요도 특성을 가진 영역으로 분할합니다. 그런 다음, 이 영역 내에서 글로벌 설명 방법을 적용하여, 각 인스턴스의 영역 멤버십을 기반으로 변수 기여도를 파생합니다. 이 접근 방식은 보다 신뢰할 수 있는 로컬 설명을 제공하는 동시에, 글로벌 방법에서 종종 손실되는 인스턴스별 세부 정보를 유지하고 로컬 설명의 불안정성을 방지합니다.
We analyze two widely used local attribution methods, Local Shapley Values and LIME, which aim to quantify the contribution of a feature value $x_i$ to a specific prediction $f(x_1, \dots, x_p)$. Despite their widespread use, we identify fundamental limitations in their ability to reliably detect locally important features, even under ideal conditions with exact computations and independent features. We argue that a sound local attribution method should not assign importance to features that neither influence the model output (e.g., features with zero coefficients in a linear model) nor exhibit statistical dependence with functionality-relevant features. We demonstrate that both Local SV and LIME violate this fundamental principle. To address this, we propose R-LOCO (Regional Leave Out COvariates), which bridges the gap between local and global explanations and provides more accurate attributions. R-LOCO segments the input space into regions with similar feature importance characteristics. It then applies global attribution methods within these regions, deriving an instance's feature contributions from its regional membership. This approach delivers more faithful local attributions while avoiding local explanation instability and preserving instance-specific detail often lost in global methods.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.