2601.06425v1 Jan 10, 2026 cs.DC

HiDVFS: OpenMP DAG 워크로드에 대한 계층적 다중 에이전트 DVFS 스케줄러

HiDVFS: A Hierarchical Multi-Agent DVFS Scheduler for OpenMP DAG Workloads

Mohammad Pivezhandi
Mohammad Pivezhandi
Citations: 24
h-index: 3
Abusayeed M. Saifullah
Abusayeed M. Saifullah
Citations: 60
h-index: 5
Ali Jannesari
Ali Jannesari
Citations: 208
h-index: 6

멀티 코어 임베디드 시스템의 발전으로 인해 칩 온도와 기하급수적으로 관련된 누설 전력 소비가 동적 전력 소비를 초과했습니다. 에너지 효율적인 솔루션은 성능이 중요한 시나리오에서 과열을 완화하기 위해 동적 전압 및 주파수 스케일링(DVFS)을 사용하며, 소프트웨어 접근 방식은 전력 소비를 줄이기 위해 병렬 시스템에서 고 활용률 작업을 다양한 코어 구성에 병렬로 할당합니다. 그러나 기존 휴리스틱은 코어별 주파수 모니터링이 부족하여 불균등한 코어 활동으로 인한 과열 문제를 해결하지 못하며, 자세한 프로파일링 없이 작업 할당을 수행하면 불규칙한 실행 패턴을 간과하게 됩니다. 본 연구에서는 OpenMP DAG 워크로드를 대상으로 합니다. 단일 벤치마크 내에서 종종 공정 시간, 에너지 및 열 목표가 충돌하므로, 본 연구는 성능(공정 시간)을 우선시하고 에너지 및 열을 2차 결과로 보고합니다. 이러한 문제를 해결하기 위해, 본 연구에서는 병렬 시스템을 위한 계층적 다중 에이전트, 성능 기반 DVFS 스케줄러인 HiDVFS를 제안합니다. HiDVFS는 프로파일링 데이터, 코어 온도 및 공정 시간 우선 목표를 기반으로 작업 할당을 최적화합니다. HiDVFS는 세 가지 에이전트를 사용합니다. 첫 번째 에이전트는 프로파일링 데이터를 사용하여 코어와 주파수를 선택하고, 두 번째 에이전트는 온도 센서를 통해 코어 조합을 관리하며, 세 번째 에이전트는 리소스 충돌 시 작업 우선 순위를 설정합니다. 공정 시간을 중심으로 한 보상과 에너지 및 온도 제어 요소를 통해 미래 상태를 추정하고 샘플 효율성을 향상시킵니다. NVIDIA Jetson TX2에서 BOTS 스위트(9개의 벤치마크)를 사용하여 HiDVFS를 최첨단 접근 방식과 비교한 실험 결과, HiDVFS는 멀티 시드 검증(시드 42, 123, 456)을 통해 가장 우수한 성능을 보였습니다. 평균 공정 시간은 4.16초 플러스/마이너스 0.58초(L10)로, GearDVFS(14.32초 플러스/마이너스 2.61초)보다 3.44배 빠른 속도를 보였으며, 에너지 소비는 50.4% 감소(63.7 kJ vs 128.4 kJ)했습니다. 모든 BOTS 벤치마크에서 HiDVFS는 평균 3.95배의 속도 향상과 47.1%의 에너지 감소를 달성했습니다.

Original Abstract

With advancements in multicore embedded systems, leakage power, exponentially tied to chip temperature, has surpassed dynamic power consumption. Energy-aware solutions use dynamic voltage and frequency scaling (DVFS) to mitigate overheating in performance-intensive scenarios, while software approaches allocate high-utilization tasks across core configurations in parallel systems to reduce power. However, existing heuristics lack per-core frequency monitoring, failing to address overheating from uneven core activity, and task assignments without detailed profiling overlook irregular execution patterns. We target OpenMP DAG workloads. Because makespan, energy, and thermal goals often conflict within a single benchmark, this work prioritizes performance (makespan) while reporting energy and thermal as secondary outcomes. To overcome these issues, we propose HiDVFS (a hierarchical multi-agent, performance-aware DVFS scheduler) for parallel systems that optimizes task allocation based on profiling data, core temperatures, and makespan-first objectives. It employs three agents: one selects cores and frequencies using profiler data, another manages core combinations via temperature sensors, and a third sets task priorities during resource contention. A makespan-focused reward with energy and temperature regularizers estimates future states and enhances sample efficiency. Experiments on the NVIDIA Jetson TX2 using the BOTS suite (9 benchmarks) compare HiDVFS against state-of-the-art approaches. With multi-seed validation (seeds 42, 123, 456), HiDVFS achieves the best finetuned performance with 4.16 plus/minus 0.58s average makespan (L10), representing a 3.44x speedup over GearDVFS (14.32 plus/minus 2.61s) and 50.4% energy reduction (63.7 kJ vs 128.4 kJ). Across all BOTS benchmarks, HiDVFS achieves an average 3.95x speedup and 47.1% energy reduction.

3 Citations
0 Influential
3 Altmetric
18.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!