2602.17330v1 Feb 19, 2026 cs.LG

SubQuad: 적응형 수용체 프레임워크에서 분포 균형 목적 함수를 활용한 준이차 복잡도 탈피 구조 추론

SubQuad: Near-Quadratic-Free Structure Inference with Distribution-Balanced Objectives in Adaptive Receptor framework

Zijian Zhang
Zijian Zhang
Citations: 20
h-index: 2
Rong Fu
Rong Fu
Citations: 0
h-index: 0
Wenxin Zhang
Wenxin Zhang
Citations: 0
h-index: 0
Kun Liu
Kun Liu
Citations: 0
h-index: 0
Jie Wu
Jie Wu
Citations: 28
h-index: 2
Xianda Li
Xianda Li
Citations: 0
h-index: 0
Simon Fong
Simon Fong
Citations: 4
h-index: 1

모집단 규모의 적응 면역 레퍼토리에 대한 비교 분석은 두 가지 실질적인 병목 현상으로 인해 어려움을 겪고 있다. 이는 쌍 간 친화도 평가에 소요되는 준이차적(near-quadratic) 비용과 임상적으로 중요한 소수 클론형을 가려버리는 데이터셋 불균형이다. 우리는 이러한 문제를 해결하기 위해 항원 인지형 준이차 미만(near-subquadratic) 검색을 GPU 가속 친화도 커널, 학습된 멀티모달 융합 및 공정성 제약 클러스터링과 결합한 엔드투엔드 파이프라인인 SubQuad를 소개한다. 이 시스템은 후보 비교 횟수를 대폭 줄이기 위해 콤팩트한 MinHash 사전 필터링을 사용하며, 쌍(pair) 단위로 보완적인 정렬 및 임베딩 채널에 적응형 가중치를 부여하는 미분 가능 게이팅 모듈과 희귀 항원 특이적 하위 그룹의 비례적 표현을 강제하는 자동 보정 루틴을 채택한다. 대규모 바이러스 및 종양 레퍼토리에서 SubQuad는 recall@k, 클러스터 순도, 하위 그룹 형평성을 유지하거나 향상시키는 동시에 처리량 및 최대 메모리 사용량에서 측정 가능한 개선을 달성한다. 인덱싱, 유사도 융합 및 형평성 인지 목적 함수를 공동으로 설계함으로써, SubQuad는 레퍼토리 마이닝을 비롯해 백신 표적 우선순위 지정 및 바이오마커 발견과 같은 하위 중개 연구를 위한 확장 가능하고 편향을 인지하는 플랫폼을 제공한다.

Original Abstract

Comparative analysis of adaptive immune repertoires at population scale is hampered by two practical bottlenecks: the near-quadratic cost of pairwise affinity evaluations and dataset imbalances that obscure clinically important minority clonotypes. We introduce SubQuad, an end-to-end pipeline that addresses these challenges by combining antigen-aware, near-subquadratic retrieval with GPU-accelerated affinity kernels, learned multimodal fusion, and fairness-constrained clustering. The system employs compact MinHash prefiltering to sharply reduce candidate comparisons, a differentiable gating module that adaptively weights complementary alignment and embedding channels on a per-pair basis, and an automated calibration routine that enforces proportional representation of rare antigen-specific subgroups. On large viral and tumor repertoires SubQuad achieves measured gains in throughput and peak memory usage while preserving or improving recall@k, cluster purity, and subgroup equity. By co-designing indexing, similarity fusion, and equity-aware objectives, SubQuad offers a scalable, bias-aware platform for repertoire mining and downstream translational tasks such as vaccine target prioritization and biomarker discovery.

0 Citations
0 Influential
1 Altmetric
5.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!