AI 에이전트를 소프트웨어 도메인별로 전문화할 때, 보통은 각 도메인마다 별도의 대형 모델을 배포해왔어. 이 arXiv 논문은 그 비용 문제를 다른 방식으로 풀어. 소형 컴퓨터 사용 에이전트(CUA)가 실패한 케이스를 자동으로 분류해서 약점을 찾고, 그 약점 중심으로 소형 모델을 도메인에 맞게 전문화하는 파이프라인이야.

아이디어는 단순해. 에이전트가 어디서 자주 틀리는지(weakness)를 3단계로 자동화해. 도메인별 실패 사례 수집 → 실패 패턴 클러스터링 → 타겟 도메인 튜닝 데이터 생성. 대형 모델 따로 배포하는 대신, 이미 있는 소형 오픈 모델을 도메인별로 점진적으로 강화하는 방식이야.

실용적인 이유가 있어. 지금 CUA 시장은 각 소프트웨어 도메인(웹 브라우저, 생산성 앱, 개발 도구 등)마다 전문 대형 모델을 따로 굴리기엔 비용이 너무 커. 소형 에이전트가 자동으로 전문화될 수 있다면, 특정 워크플로우에 특화된 에이전트를 훨씬 저렴하게 만들 수 있어.