이 뉴스의 요약은 어떻게 만들어졌나요?

원문 링크를 바탕으로 핵심 요약을 만들고 fact-check 및 신호 점검을 거쳐 게재됩니다.

팩트체크 기준은 무엇인가요?

근거 링크, 수치 점검, 문맥 정합성, 최신성으로 조합해 상태를 표시해.

LoRA 파인튜닝, 모델이 데이터를 통째로 외우는 임계점은 0.5

LoRA 파인튜닝이 학습 데이터를 토씨까지 외우는 순간을 수식으로 잡은 연구가 arXiv에 올라왔어. 다음 토큰 예측 확률이 0.5를 넘으면 그리디 디코딩에서 그 토큰을 그대로 복원한다는 거야. 손실 감소량이 유효 파라미터 수와 시퀀스 길이를 따라 멱법칙으로 움직인다는 '파라메트릭 메모리 법칙'도 함께 내놨어.

파인튜닝한 모델이 학습 데이터를 그대로 뱉은 적 있잖아

파인튜닝한 모델한테 뭘 물었더니 학습에 넣은 문장을 토씨 하나 안 틀리고 그대로 돌려준 적, 한 번쯤 있을 거야. 저작권 데이터나 개인정보가 그렇게 새면 곤란하지. 새로 나온 논문 How LoRA Remembers는 그 “통째로 외우는” 순간이 언제 생기는지를 수식으로 잡았어.

임계점은 예측 확률 0.5

핵심은 토큰 단위 상전이야. 모델이 다음 토큰을 맞힐 확률이 0.5를 넘으면, 그리디 디코딩에서 그 토큰을 정확히 복원해. 그 아래면 못 외운 상태고. 외우느냐 마느냐가 부드럽게 변하는 게 아니라 0.5를 경계로 딱 갈린다는 거야. 연구진은 여기에 더해 손실 감소량(ΔL)이 유효 파라미터 수와 시퀀스 길이를 따라 멱법칙으로 움직인다는 ‘파라메트릭 메모리 법칙’도 제시했어.

그래서 뭐가 달라지나

이게 실무에서 의미가 있는 건, 어떤 데이터를 LoRA로 학습시킬 때 그게 외워질지 말지를 미리 가늠할 축이 생긴다는 거야. 연구진은 이걸 거꾸로 쓴 MemFT라는 방법도 내놨어. 확률이 0.5에 못 미치는 토큰 쪽으로 학습 예산을 몰아줘서, 같은 비용으로 기억 정확도를 끌어올리는 식이야. 코드는 github.com/zjunlp/ParametricMemoryLaw에 공개하겠다고 했어.

주의할 점

아직 arXiv 프리프린트야. 2026년 5월 28일 올라온 진행 중 연구라 동료 평가도, 독립 재현도 아직 없어. 0.5라는 경계도 그리디 디코딩 기준이라, 샘플링 방식이 바뀌면 그대로 적용되는지는 따로 봐야 해. 코드도 공개 전이라 직접 돌려보긴 어렵고, 결론은 일단 참고만 하는 게 맞아.

태그

#lora#fine-tuning#llm#data-leakage#arxiv

포맷 v3 가이드 news 3.4.1

팩트 체크

통과 · 2026-05-30 KST

검증 생성: AI + 편집 검토 · 2026-05-30 상태: 통과

통과 원문 대조

arXiv 원문 abstract에서 핵심 주장, 임계 확률, 멱법칙, 코드 공개 계획을 직접 확인했어.

연구 주제: LoRA가 파인튜닝에서 기억 메커니즘으로 어떻게 작동하는지 분석한다고 abstract에 명시돼 있어.
임계점: 예측 확률 p > 0.5가 verbatim recall(토큰 그대로 복원)의 충분조건이라고 abstract에서 확인했어.
파라메트릭 메모리 법칙: 손실 감소량(ΔL)을 유효 파라미터 수와 시퀀스 길이에 잇는 멱법칙으로 abstract에 기술돼 있어.
MemFT: 임계 미만 토큰 쪽으로 학습 예산을 재배분하는 방법으로 abstract에 설명돼 있어.

통과 교차 검증 검증 출처 2

arXiv 원문과 저자 공개 코드 저장소 경로를 분리해서 봤어. 갓 올라온 프리프린트라 독립 보도는 아직 없어.

1차 출처 교차검증: arXiv abstract에서 제출일(2026-05-28), 임계 확률, 멱법칙 주장을 직접 확인했어.
독립 보조: 저자가 코드 공개처로 적은 github.com/zjunlp/ParametricMemoryLaw 경로를 확인했어(zjunlp = 저자 그룹 저장소).
한계: 웹 검색에서는 LoRA 기억 관련 인접 논문만 나오고, 이 논문을 독립적으로 다룬 보도나 재현은 아직 못 찾았어. claim을 '진행 중 연구'로 낮춰 적었어.

통과 수치 검증

본문 수치를 arXiv 원문 기준으로 확인했어.

0.5: 다음 토큰 예측 확률이 이 값을 넘으면 verbatim recall이 보장된다는 임계점으로 확인했어.
2026-05-28: arXiv 제출일로 확인했어.
Mechanism evidence: 외움 여부가 0.5를 경계로 갈리는 토큰 단위 상전이 구조를 abstract에서 확인했어.
Causal evidence: MemFT가 임계 미만 토큰으로 예산을 재배분해 기억 정확도·효율을 끌어올린다는 인과를 abstract에서 확인했어.

통과 비판 검토

프리프린트 한계와 결과 적용 범위를 같이 짚었어.

2026년 5월 28일 올라온 진행 중(Ongoing work) 프리프린트라 동료 평가도 독립 재현도 아직 없어.
0.5 임계는 그리디 디코딩 기준이야. 샘플링 방식이 바뀌면 그대로 적용되는지 따로 봐야 해.
코드가 아직 공개 전이라(공개 예정) 제3자가 직접 돌려 검증하긴 어려워.

단일 프리프린트, 동료 평가·독립 재현 없음 — 결론은 참고용으로 한정.

출처: arXiv — How LoRA Remembers? A Parametric Memory Law for LLM Finetuning , GitHub — zjunlp/ParametricMemoryLaw