2601.17826v1 Jan 25, 2026 cs.AI

RegGuard: 제약 규제 준수를 위한 AI 기반 검색 증강 어시스턴트

RegGuard: AI-Powered Retrieval-Enhanced Assistant for Pharmaceutical Regulatory Compliance

Xihan Bian
Xihan Bian
Citations: 13
h-index: 2
Siyuan Yang
Siyuan Yang
Citations: 45
h-index: 2
Jiayi Tang
Jiayi Tang
Citations: 92
h-index: 4

규제 업데이트의 빈도와 복잡성이 증가함에 따라 다국적 제약 회사들의 부담이 가중되고 있습니다. 규제 준수 팀은 여러 관할 구역, 형식 및 기관에 걸쳐 변화하는 규정을 해석해야 하며, 이는 종종 수동으로 이루어져 높은 비용과 오류 발생 위험을 수반합니다. 본 논문에서는 이질적인 규제 텍스트의 해석을 자동화하고 이를 내부 기업 정책과 일치시키도록 설계된 산업 규모의 AI 어시스턴트인 RegGuard를 소개합니다. 이 시스템은 보안 파이프라인을 통해 다양한 문서 소스를 수집하며, 두 가지 새로운 구성 요소를 통해 검색 및 생성 품질을 향상시킵니다. HiSACC(문맥적 청킹을 위한 계층적 의미 집계)는 긴 문서를 의미론적으로 일관된 단위로 분할하면서 불연속적인 섹션 간의 일관성을 유지합니다. ReLACE(재순위를 위한 규제 목록형 적응형 교차 인코더)는 오픈 소스 모델을 기반으로 구축된 도메인 적응형 교차 인코더로, 사용자 질의와 검색된 후보를 결합 모델링하여 순위 관련성을 개선합니다. 기업 환경에서의 평가 결과, RegGuard는 관련성, 근거 기반성, 문맥적 초점 측면에서 답변 품질을 향상시키는 동시에 환각(hallucination) 위험을 크게 완화하는 것으로 나타났습니다. 시스템 아키텍처는 감사 가능성과 추적 가능성을 위해 구축되었으며 출처 추적, 접근 제어, 증분 색인 기능을 특징으로 하여, 지속적으로 변화하는 문서 소스에 즉각적으로 반응할 수 있고 엄격한 규제 준수 요구가 있는 모든 도메인에 적합합니다.

Original Abstract

The increasing frequency and complexity of regulatory updates present a significant burden for multinational pharmaceutical companies. Compliance teams must interpret evolving rules across jurisdictions, formats, and agencies, often manually, at high cost and risk of error. We introduce RegGuard, an industrial-scale AI assistant designed to automate the interpretation of heterogeneous regulatory texts and align them with internal corporate policies. The system ingests heterogeneous document sources through a secure pipeline and enhances retrieval and generation quality with two novel components: HiSACC (Hierarchical Semantic Aggregation for Contextual Chunking) semantically segments long documents into coherent units while maintaining consistency across non-contiguous sections. ReLACE (Regulatory Listwise Adaptive Cross-Encoder for Reranking), a domain-adapted cross-encoder built on an open-source model, jointly models user queries and retrieved candidates to improve ranking relevance. Evaluations in enterprise settings demonstrate that RegGuard improves answer quality specifically in terms of relevance, groundedness, and contextual focus, while significantly mitigating hallucination risk. The system architecture is built for auditability and traceability, featuring provenance tracking, access control, and incremental indexing, making it highly responsive to evolving document sources and relevant for any domain with stringent compliance demands.

0 Citations
0 Influential
2 Altmetric
10.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!