2604.16896v1 Apr 18, 2026 q-bio.QM

ProtoCycle: 텍스트 기반 단백질 설계 위한 반사적 도구 지원 계획 시스템

ProtoCycle: Reflective Tool-Augmented Planning for Text-Guided Protein Design

Linfeng Zhang
Linfeng Zhang
Citations: 979
h-index: 10
Guolin Ke
Guolin Ke
Citations: 687
h-index: 12
Sihang Li
Sihang Li
Citations: 138
h-index: 7
Hanchen Xia
Hanchen Xia
Citations: 13
h-index: 2
Zhifeng Gao
Zhifeng Gao
Citations: 981
h-index: 11
Yutang Ge
Yutang Ge
Citations: 1
h-index: 1
Guojiang Zhao
Guojiang Zhao
Citations: 1
h-index: 1
Zheng Cheng
Zheng Cheng
Citations: 26
h-index: 2
Zifeng Zhao
Zifeng Zhao
Citations: 19
h-index: 1
Yuguang Wang
Yuguang Wang
Citations: 2
h-index: 1

자연어 기반 기능적 요구 사항을 만족하는 단백질을 설계하는 것은 단백질 공학의 핵심 목표입니다. 간단한 방법은 일반적인 명령어 튜닝된 대규모 언어 모델(LLM)을 직접적인 텍스트-시퀀스 생성기로 미세 조정하는 것인데, 이는 데이터와 계산 자원을 많이 필요로 합니다. 제한적인 지도 하에 LLM은 일관된 계획을 텍스트로 생성할 수 있지만, 이를 안정적으로 시퀀스로 구현하는 데 실패하는 경우가 많습니다. 이러한 계획-실행 간의 격차는 ProtoCycle을 동적인 프레임워크로 이끌었습니다. ProtoCycle은 단백질 설계를 위해 LLM을 사용하여 다단계, 피드백 기반 의사 결정 주기를 구동합니다. ProtoCycle은 LLM 기반의 계획 시스템과 인간 단백질 공학의 반복적인 워크플로우를 에뮬레이션하도록 설계된 경량화된 도구 환경을 결합하고, 도구 피드백에 대한 LLM 기반의 반성을 활용하여 계획을 수정합니다. 지도 학습된 경로와 온라인 강화 학습으로 훈련된 ProtoCycle은 뛰어난 자연어 정렬성을 유지하면서도 경쟁력 있는 접힘 가능성을 달성하며, 분석 결과 반성이 시퀀스 품질을 크게 향상시키는 것으로 나타났습니다.

Original Abstract

Designing proteins that satisfy natural language functional requirements is a central goal in protein engineering. A straightforward baseline is to fine-tune generic instruction-tuned LLMs as direct text-to-sequence generators, but this is data- and compute-hungry. With limited supervision, LLMs can produce coherent plans in text yet fail to reliably realize them as sequences. This plan-execute gap motivates ProtoCycle, an agentic framework for protein design that uses LLMs primarily to drive a multi-round, feedback-driven decision cycle. ProtoCycle couples an LLM planner with a lightweight tool environment designed to emulate the iterative workflow of human protein engineering and uses LLM-driven reflection on tool feedback to revise plans. Trained with supervised trajectories and online reinforcement learning, ProtoCycle achieves strong language alignment while maintaining competitive foldability, and ablations show that reflection substantially improves sequence quality.

0 Citations
0 Influential
6 Altmetric
30.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!