강력한 그린워싱 탐지를 위한 언어 모델 개선
Enhancing Language Models for Robust Greenwashing Detection
지속가능성 보고서는 ESG 평가에 매우 중요하지만, 그린워싱 및 모호한 주장은 종종 그 신뢰성을 저해합니다. 기존의 자연어 처리 모델은 이러한 관행에 대한 강건성이 부족하며, 일반적으로 표면적인 패턴에 의존하여 일반화 성능이 좋지 않습니다. 본 연구에서는 대조 학습과 순위 결정 목표를 결합하여 LLM의 잠재 공간을 구조화하는, 파라미터 효율적인 프레임워크를 제안합니다. 이를 통해 구체적인 행동과 모호한 주장 간의 미묘한 차이를 포착합니다. 제안하는 방법은 게이티드 특징 조절을 사용하여 공개 정보의 노이즈를 제거하고, MetaGradNorm을 활용하여 다중 목표 최적화를 안정화합니다. 다양한 범주에서의 실험 결과는 표준 모델보다 우수한 강건성을 보여주었으며, 동시에 표현의 엄격성과 일반화 능력 간의 균형 관계를 밝혀냈습니다.
Sustainability reports are critical for ESG assessment, yet greenwashing and vague claims often undermine their reliability. Existing NLP models lack robustness to these practices, typically relying on surface-level patterns that generalize poorly. We propose a parameter-efficient framework that structures LLM latent spaces by combining contrastive learning with an ordinal ranking objective to capture graded distinctions between concrete actions and ambiguous claims. Our approach incorporates gated feature modulation to filter disclosure noise and utilizes MetaGradNorm to stabilize multi-objective optimization. Experiments in cross-category settings demonstrate superior robustness over standard baselines while revealing a trade-off between representational rigidity and generalization.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.