무슨 일이 일어났나
GitHub이 2026년 4월 24일부터 Copilot Free·Pro·Pro+ 사용자의 상호작용 데이터를 기본으로 모델 학습에 쓰기 시작했어. 옵트아웃 방식이라 설정에서 끄면 되긴 하는데, 기본값 자체가 opt-in으로 뒤집혔다는 점이 달라진 부분이야. 학습 대상에는 수락한 코드 스니펫, 커서 주변 컨텍스트, 주석·문서, 파일 이름과 저장소 구조, Copilot 채팅 대화, 👍/👎 피드백까지 들어가.
왜 이게 일어났나
Copilot 사용자 데이터는 자연스러운 코딩 워크플로에서 나오는 실제 사용 패턴이라 학습 가치가 높거든. GitHub 입장에서는 같은 사용자가 무료로 쓰는 동안 모델을 개선할 데이터를 모으는 게 합리적 선택이야. 문제는 기여자 단위로만 옵트아웃이 가능하다는 점이야. 메인테이너가 본인 저장소에서 “내 코드는 학습에 쓰지 마”라고 일괄 끄는 저장소 단위 스위치는 없어. 기여자 한 명이라도 옵트아웃을 안 끈 채로 코드를 건드리면 그 변경분이 학습 데이터가 돼.
어떤 의미인가
오픈소스 메인테이너 일부는 이미 Forgejo·Codeberg·Gitea 같은 대체 호스팅으로 옮기는 중이야. 네덜란드 개발자 Jorijn Schrijvershof는 본인 코드와 신규 프로젝트를 Forgejo로 모두 이전했다고 공개했고, 일부는 자체 VPS에 Forgejo를 띄워서 운영해. 연 비용 약 200달러 수준이라 부담은 크지 않은데, 보안 패치·백업·CI 같은 운영 작업이 본인 몫으로 돌아와.
주의할 점
옮긴다고 이미 GitHub에 남은 옛 코드가 학습에서 빠지는 건 아니야. GitHub 답변에 따르면 archive 처리해도 한 번 들어간 데이터를 되돌리는 절차는 없거든. 그리고 협업하는 프로젝트에서 기여자 전원이 옵트아웃을 켜도록 강제할 방법이 사실상 없어. 본인 워크플로에서 어디까지 통제 가능한지를 먼저 정리하고, 그다음에 이전이 실질적 차이를 만드는지 따져보는 게 순서야.