2602.01910v1 Feb 02, 2026 cs.AI

DomusFM: 스마트홈 센서 데이터를 위한 기반 모델

DomusFM: A Foundation Model for Smart-Home Sensor Data

Michele Fiori
Michele Fiori
Citations: 62
h-index: 5
Gabriele Civitarese
Gabriele Civitarese
Citations: 953
h-index: 17
Claudio Bettini
Claudio Bettini
Citations: 147
h-index: 6
Flora D. Salim
Flora D. Salim
Citations: 3
h-index: 1

스마트홈 센서 데이터는 헬스케어 모니터링 및 보조 기술을 포함한 여러 응용 분야에서 상당한 잠재력을 가지고 있습니다. 그러나 기존 접근 방식들은 치명적인 한계에 직면해 있습니다. 지도 학습 모델은 비현실적으로 방대한 양의 레이블링된 데이터를 필요로 합니다. 기존의 행동 인식용 기반 모델(Foundation Model)들은 관성 센서에만 초점을 맞추고 있어, 풍부한 의미적 연관성과 결합된 희소하고 이산적인 성격이라는 스마트홈 이진 센서 이벤트의 고유한 특성을 반영하지 못합니다. LLM 기반 접근 방식들이 이 영역에서 실험되었으나, 자연어 설명이나 프롬프팅의 필요성, 그리고 외부 서비스나 고가의 하드웨어에 의존해야 하는 문제 등을 여전히 안고 있어 프라이버시와 비용 문제로 인해 실제 환경에 적용하기 어렵습니다. 본 논문에서는 스마트홈 센서 데이터를 위해 특별히 설계되고 사전 학습된 최초의 기반 모델인 DomusFM을 소개합니다. DomusFM은 토큰 수준의 의미적 속성과 시퀀스 수준의 시간적 의존성을 모두 포착하기 위해 자기 지도 이중 대조 학습(self-supervised dual contrastive learning) 패러다임을 사용합니다. 경량 언어 모델의 의미적 임베딩과 시간적 패턴 및 이진 상태를 위한 특화된 인코더를 통합함으로써, DomusFM은 행동 및 이벤트 분석과 관련된 다양한 환경과 작업으로 전이 가능한 일반화된 표현을 학습합니다. 7개의 공공 스마트홈 데이터셋에 대한 교차 검증(Leave-one-dataset-out) 평가를 통해, DomusFM이 다양한 다운스트림 작업에서 최신 베이스라인 모델들을 능가하며, 파인 튜닝을 위한 레이블링된 훈련 데이터가 5%만 주어진 경우에도 우수한 성능을 달성함을 입증했습니다. 우리의 접근 방식은 실제 스마트홈 시스템을 위한 실질적인 배포 가능성을 유지하면서 데이터 부족 문제를 해결합니다.

Original Abstract

Smart-home sensor data holds significant potential for several applications, including healthcare monitoring and assistive technologies. Existing approaches, however, face critical limitations. Supervised models require impractical amounts of labeled data. Foundation models for activity recognition focus only on inertial sensors, failing to address the unique characteristics of smart-home binary sensor events: their sparse, discrete nature combined with rich semantic associations. LLM-based approaches, while tested in this domain, still raise several issues regarding the need for natural language descriptions or prompting, and reliance on either external services or expensive hardware, making them infeasible in real-life scenarios due to privacy and cost concerns. We introduce DomusFM, the first foundation model specifically designed and pretrained for smart-home sensor data. DomusFM employs a self-supervised dual contrastive learning paradigm to capture both token-level semantic attributes and sequence-level temporal dependencies. By integrating semantic embeddings from a lightweight language model and specialized encoders for temporal patterns and binary states, DomusFM learns generalizable representations that transfer across environments and tasks related to activity and event analysis. Through leave-one-dataset-out evaluation across seven public smart-home datasets, we demonstrate that DomusFM outperforms state-of-the-art baselines on different downstream tasks, achieving superior performance even with only 5% of labeled training data available for fine-tuning. Our approach addresses data scarcity while maintaining practical deployability for real-world smart-home systems.

0 Citations
0 Influential
8.5 Altmetric
42.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!