2601.00924v1 Jan 01, 2026 cs.LG

복잡성 기반 코드 임베딩

Complexity-based code embeddings

Rares Folea
Rares Folea
Citations: 6
h-index: 2
R. Iacob
R. Iacob
Citations: 122
h-index: 5
Emil Slusanschi
Emil Slusanschi
Citations: 52
h-index: 3
Traian Rebedea
Traian Rebedea
Citations: 1,811
h-index: 20

본 논문에서는 다양한 알고리즘의 소스 코드를 수치적 임베딩으로 변환하는 일반적인 방법을 제시합니다. 이 방법은 컴퓨터 프로그램의 동작을 다양한 입력에 대해 동적으로 분석하고, 분석된 지표에 맞춰 여러 가지 일반적인 복잡도 함수를 적용합니다. 제안된 알고리즘 임베딩은 r-복잡도를 기반으로 합니다. 제안된 코드 임베딩을 사용하여, 실제 코딩 대회에 제출된 소스 코드 조각으로 구성된 11개 클래스를 가진 멀티 라벨 데이터셋에서 평균 F1 점수가 향상된 XGBoost 알고리즘 구현을 제시합니다.

Original Abstract

This paper presents a generic method for transforming the source code of various algorithms to numerical embeddings, by dynamically analysing the behaviour of computer programs against different inputs and by tailoring multiple generic complexity functions for the analysed metrics. The used algorithms embeddings are based on r-Complexity . Using the proposed code embeddings, we present an implementation of the XGBoost algorithm that achieves an average F1-score on a multi-label dataset with 11 classes, built using real-world code snippets submitted for programming competitions on the Codeforces platform.

2 Citations
0 Influential
10 Altmetric
52.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!