SubQuad: 적응형 수용체 프레임워크에서 분포 균형 목적 함수를 활용한 준이차 복잡도 탈피 구조 추론
SubQuad: Near-Quadratic-Free Structure Inference with Distribution-Balanced Objectives in Adaptive Receptor framework
모집단 규모의 적응 면역 레퍼토리에 대한 비교 분석은 두 가지 실질적인 병목 현상으로 인해 어려움을 겪고 있다. 이는 쌍 간 친화도 평가에 소요되는 준이차적(near-quadratic) 비용과 임상적으로 중요한 소수 클론형을 가려버리는 데이터셋 불균형이다. 우리는 이러한 문제를 해결하기 위해 항원 인지형 준이차 미만(near-subquadratic) 검색을 GPU 가속 친화도 커널, 학습된 멀티모달 융합 및 공정성 제약 클러스터링과 결합한 엔드투엔드 파이프라인인 SubQuad를 소개한다. 이 시스템은 후보 비교 횟수를 대폭 줄이기 위해 콤팩트한 MinHash 사전 필터링을 사용하며, 쌍(pair) 단위로 보완적인 정렬 및 임베딩 채널에 적응형 가중치를 부여하는 미분 가능 게이팅 모듈과 희귀 항원 특이적 하위 그룹의 비례적 표현을 강제하는 자동 보정 루틴을 채택한다. 대규모 바이러스 및 종양 레퍼토리에서 SubQuad는 recall@k, 클러스터 순도, 하위 그룹 형평성을 유지하거나 향상시키는 동시에 처리량 및 최대 메모리 사용량에서 측정 가능한 개선을 달성한다. 인덱싱, 유사도 융합 및 형평성 인지 목적 함수를 공동으로 설계함으로써, SubQuad는 레퍼토리 마이닝을 비롯해 백신 표적 우선순위 지정 및 바이오마커 발견과 같은 하위 중개 연구를 위한 확장 가능하고 편향을 인지하는 플랫폼을 제공한다.
Comparative analysis of adaptive immune repertoires at population scale is hampered by two practical bottlenecks: the near-quadratic cost of pairwise affinity evaluations and dataset imbalances that obscure clinically important minority clonotypes. We introduce SubQuad, an end-to-end pipeline that addresses these challenges by combining antigen-aware, near-subquadratic retrieval with GPU-accelerated affinity kernels, learned multimodal fusion, and fairness-constrained clustering. The system employs compact MinHash prefiltering to sharply reduce candidate comparisons, a differentiable gating module that adaptively weights complementary alignment and embedding channels on a per-pair basis, and an automated calibration routine that enforces proportional representation of rare antigen-specific subgroups. On large viral and tumor repertoires SubQuad achieves measured gains in throughput and peak memory usage while preserving or improving recall@k, cluster purity, and subgroup equity. By co-designing indexing, similarity fusion, and equity-aware objectives, SubQuad offers a scalable, bias-aware platform for repertoire mining and downstream translational tasks such as vaccine target prioritization and biomarker discovery.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.