AI 용어 사전은 어떻게 쓰면 좋나요?

뉴스나 프로젝트에서 모르는 AI 개념을 만났을 때 정의, 관련 모델, 출처 맥락을 빠르게 확인하는 용도로 쓰면 좋아.

AIKI 위키는 어떤 항목을 우선 정리하나요?

LLM, AI 에이전트, RAG, 모델 벤치마크, 오픈소스 프로젝트처럼 실제 뉴스와 제품 변화에 자주 등장하는 항목을 우선 정리해.

용어 설명은 계속 업데이트되나요?

새로운 뉴스와 프로젝트 데이터가 들어오면 언급 빈도, 최근성, 관련 링크를 기준으로 용어 항목을 보강해.

AI 용어 사전

너만 모르는 AI 용어

개념

GPU (그래픽 처리 장치)

GPU는 많은 계산을 병렬로 처리하는 프로세서야. AI에서는 학습과 추론의 행렬 연산, 메모리 대역폭, 전력 예산을 같이 결정하는 하드웨어 계층으로 읽어야 해.

개념 69회 언급

LLM (거대 언어 모델)

LLM은 엄청 많은 텍스트를 학습해서 다음 단어를 예측하는 방식으로 작동하는 거대 언어 모델이야. 채팅, 요약, 번역, 코드 생성 같은 작업이 여기서 나와.

개념 55회 언급

AI 인프라

좋은 모델보다 먼저 묻는 게 먼저야. AI는 전력·열·회복력이 받쳐줘야 오래 가.

개념 42회 언급

AI Agent (AI 에이전트)

AI Agent는 모델이 답만 내놓는 걸 넘어서, 목표를 받고 계획을 세우고 도구를 쓰며 여러 단계를 이어서 작업하게 만든 실행 구조야.

개념 42회 언급

Inference (추론)

Inference는 학습이 끝난 모델이 실제 입력을 받아 답을 만드는 실행 단계야. AI 서비스를 읽을 때 비용, 지연 시간, 처리량이 왜 계속 같이 언급되는지 이해하려면 이 개념부터 먼저 잡아두면 돼.

개념 40회 언급

SWE-Bench Pro(소프트웨어 엔지니어링 에이전트 벤치마크)

SWE-Bench Pro는 실제 개발 이슈를 풀듯이 구성한 긴 과제들을 공공/보류/상업 세트로 나눠 보는 벤치마크야. 공개 셋 점수만으로 실무 성능을 단정하지 말라는 구조를 보여줘.

개념 30회 언급

Open-weight(오픈 웨이트)

Open-weight는 학습이 끝난 모델 가중치를 내려받아 실행하거나 미세조정할 수 있게 공개한 상태를 말해. 다만 학습 코드, 데이터 정보, 재현 절차까지 열린 오픈소스 AI와는 다른 말이야.

개념 27회 언급

Reasoning Model (추론 모델)

추론형 모델은 답을 바로 내기보다 중간 사고 과정을 더 많이 쓰면서 어려운 문제를 풀도록 설계된 계열이야. 보통 속도보다 복잡한 문제 해결에 더 초점을 둬.

개념 26회 언급

Coding Agent(코딩 에이전트)

Coding Agent(코딩 에이전트)는 코드 질문에 답만 하는 도구가 아니라, 프로젝트 파일을 읽고 고치고 테스트나 명령 결과로 다음 행동을 정하는 개발용 AI 에이전트야.

개념 25회 언급

VRAM(비디오 메모리)

VRAM은 GPU가 모델 가중치, KV cache, 이미지 데이터를 빠르게 읽고 쓰는 전용 메모리야. 로컬 LLM에서는 모델 크기보다 먼저 확인할 예산표에 가까워.

개념 25회 언급

Context(컨텍스트)

Context는 모델이 이번 요청에서 참고하라고 받은 프롬프트, 이전 대화, 문서, 도구 결과 같은 작업 재료야.

개념 22회 언급

RAM (시스템 메모리)

RAM은 운영체제와 앱이 지금 쓰는 데이터를 올려 두는 빠른 임시 메모리야. 로컬 LLM에서는 VRAM 밖으로 밀린 모델 레이어와 CPU 추론 속도를 가르는 숫자야.

개념 22회 언급

Memory(메모리)

Memory는 에이전트가 이전 대화, 선호, 작업 결과를 저장했다가 다음 행동에 다시 쓰는 기억 구조야.

개념 18회 언급

Free(무료 플랜)

Free는 ChatGPT 가격표에서 결제 없이 시작하는 개인용 접근 티어야. 무료라는 말보다 한도와 빠진 기능을 먼저 봐야 해.

개념 15회 언급

Local LLM (로컬 LLM)

Local LLM은 모델을 클라우드 API 대신 내 PC나 서버에서 직접 돌리는 방식을 말해. 보통 오픈 웨이트 모델을 내려받아 Ollama, LM Studio, llama.cpp 같은 도구로 실행하는 흐름이 여기에 들어가.

개념 13회 언급

PDF(문서 형식)

PDF는 문서의 글자, 이미지, 표, 레이아웃을 한 파일에 고정해 교환하는 문서 형식이야. AI 문서 처리에서는 텍스트 추출, OCR, 페이지 이미지 검색 중 무엇을 써야 하는지 먼저 가르는 입력 형태로 봐야 해.

개념 13회 언급

AWS(아마존 웹 서비스)

AWS를 AI 기사에서 볼 때는 모델명이 아니라 Amazon의 클라우드 계정, 권한, 청구, 배포 경로로 읽어야 해. Bedrock과 보안 통제도 함께 따라와.

개념 12회 언급

Developer Tools(개발자 도구)

Developer Tools는 개발자가 코드를 만들고 실행하고 검증하고 배포하는 일을 줄여 주는 도구 묶음이야. AI 문맥에서는 편집기 추천만이 아니라 문서 서버, 터미널 에이전트, SDK, API 연결까지 같이 들어온다.

개념 12회 언급

Embedding (임베딩)

Embedding은 텍스트나 이미지 같은 데이터를 의미가 비슷할수록 가까워지게 만든 숫자 벡터 표현이야. 검색, 추천, 군집화, RAG의 검색 단계가 이 표현 품질에 크게 좌우돼.

개념 12회 언급

Token (토큰)

Token은 모델이 문장을 받아 계산할 때 쓰는 최소 처리 단위야. 기사에서 컨텍스트 길이, 최대 출력, 요금 숫자를 읽을 때는 글자 수가 아니라 토큰 기준인지 먼저 봐야 해.

개념 12회 언급

Apache 2.0(아파치 2.0 라이선스)

Apache 2.0(아파치 2.0 라이선스)은 코드나 모델 가중치를 고쳐 쓰고 배포할 수 있게 해 주는 permissive 오픈소스 라이선스예요. 다만 public domain처럼 아무 조건이 없는 건 아니고, LICENSE 유지, 변경 고지, NOTICE 전달 같은 배포 의무가 함께 따라와요.

개념 11회 언급

CUDA(쿠다)

CUDA는 NVIDIA GPU에서 병렬 계산 코드를 실행하게 해 주는 플랫폼이자 프로그래밍 모델이야. AI에서는 GPU가 있느냐보다 CUDA 경로와 라이브러리 호환성이 실제 속도와 배포 가능성을 가르는 경우가 많아.

개념 11회 언급

IDE (통합 개발 환경)

IDE는 코드 입력창 하나가 아니라 편집, 실행, 디버깅, 테스트를 한 작업면으로 묶는 개발 도구야. 작은 스크립트엔 과할 수 있지만, 여러 파일과 설정이 얽힌 프로젝트에선 왜 따로 부르는지 금방 체감돼.

개념 11회 언급

Instant(인스턴트)

Instant는 ChatGPT에서 빠른 기본 응답을 맡는 OpenAI의 모델 경로 이름이야. 2026년 5월 GPT-5.5 Instant가 GPT-5.3 Instant를 대체했어.

개념 11회 언급

Multimodal AI(멀티모달 AI)

Multimodal AI는 텍스트, 이미지, 음성, 영상처럼 다른 형식의 정보를 한 시스템 안에서 같이 받고 연결해 처리하는 AI를 뜻해. 특정 제품명보다 입력과 출력 범위가 넓어진 변화를 설명하는 말에 더 가까워.

개념 11회 언급

README (리드미)

리드미는 저장소 첫 화면에서 프로젝트 정체성, 시작 방법, 도움 받을 곳을 빠르게 확인하게 해 주는 안내 문서야. 길어질수록 본문보다 입구 역할에 집중해야 해.

개념 11회 언급

Reasoning Model (추론 모델)

Reasoning Model은 답을 바로 쓰기보다 더 긴 계산과 검토를 거쳐 복잡한 문제를 푸는 모델 계열이야. 빠른 채팅 모델과는 비용, 지연 시간, 검증 방식이 달라.

개념 11회 언급

안드로이드(Android)

안드로이드는 모바일 앱과 AI 기능이 기기 권한, 메시지, 브라우저, 입력 화면을 만나는 운영체제 층이야.

개념 10회 언급

Alibaba (알리바바)

Alibaba는 AI 기사에서 주로 Qwen 모델 계열과 Alibaba Cloud Model Studio를 함께 가리키는 벤더 이름이야. 앱 점유율보다 오픈 웨이트, API, 에이전트 도구 흐름을 나눠 읽어야 덜 헷갈려.

개념 10회 언급

Linux(리눅스)

Linux는 커널과 배포판 생태계를 함께 가리키는 오픈 소스 운영체제 계열이야. AI 인프라 문맥에서는 배포판, GPU 드라이버, CUDA 빌드 경로까지 묶어 읽어야 실제 성능 차이를 덜 잘못 보게 돼.

개념 10회 언급

MIT (MIT 라이선스)

MIT는 코드와 모델 가중치를 거의 제한 없이 복제·수정·재배포할 수 있게 두는 짧은 오픈소스 라이선스야. 다만 저작권 고지와 허가 문구를 같이 남겨야 하고, 모델 카드에 MIT가 붙었다고 데이터·상표·서비스 약관까지 자동으로 풀리는 건 아니야.

개념 10회 언급

p95(95번째 백분위 지연시간)

p95는 측정값의 95%가 그 값 이하에 들어오고 나머지 5%가 더 느린 경계값이야.

개념 10회 언급

Thinking (씽킹)

Thinking은 AI 제품에서 모델이 바로 답하지 않고 더 긴 추론 예산을 써서 답을 만들도록 하는 모드나 경로를 가리켜. 사람의 생각을 그대로 보여 준다는 뜻은 아니야.

개념 10회 언급

Apple (애플)

Apple은 iPhone, Mac, 자체 칩, Apple Intelligence를 한 공급자 안에서 묶는 회사야. AI 문맥에서는 기기 회사가 아니라 온디바이스 모델, 개발자 API, 프라이버시형 클라우드, 보안 협력까지 같이 보는 이름이야.

개념 9회 언급

Blackwell (NVIDIA GPU 아키텍처)

Blackwell은 NVIDIA가 Hopper 다음 세대로 내놓은 GPU 아키텍처야. B200·GB200·RTX PRO 같은 제품군에서 FP4, 2세대 Transformer Engine, 5세대 NVLink 같은 AI 인프라 조건을 묶어 부르는 이름으로 쓰여.

개념 9회 언급

CLI(명령줄 인터페이스)

CLI는 텍스트 명령으로 프로그램을 움직이는 인터페이스야. 반복 작업, 원격 운영, 자동화가 핵심인 순간엔 GUI보다 훨씬 강해.

개념 9회 언급

Flash(플래시)

Flash는 AI 모델 이름에서 빠른 응답, 낮은 지연 시간, 비용 효율 쪽에 놓인 모델 티어를 가리키는 라벨이야. Gemini Flash나 Qwen-Flash처럼 Pro·Max·Plus보다 가벼운 호출 경로를 읽을 때 먼저 보면 돼.

개념 9회 언급

GUI(그래픽 사용자 인터페이스)

GUI는 버튼, 패널, 목록처럼 화면 요소로 기능을 조작하는 인터페이스야. AI 코딩 도구 문맥에서는 모델 자체보다 그 모델 위에 덧씌운 작업 화면인지부터 가르는 게 먼저야.

개념 9회 언급

Microsoft (마이크로소프트)

Microsoft는 회사 이름이고 Azure·Microsoft 365·GitHub·Copilot은 그 회사가 파는 서로 다른 제품군이야. 이미 이 조합을 쓰는 팀이라면 AI를 살 때 계약, 계정, 배포를 한 공급자 축에서 같이 봐야 해.

개념 9회 언급

NVIDIA(엔비디아)

NVIDIA는 GPU, 서버 간 연결 기술, CUDA 생태계로 AI 데이터센터를 떠받치는 인프라 회사야. 모델 기사와 하드웨어 공급 기사와 소프트웨어 생태계 기사를 분리해서 읽게 도와줘.

개념 9회 언급

Plus(플러스)

Plus는 AI 제품에서 무료판보다 사용량과 새 기능 접근을 더 주는 개인용 유료 구독 티어 이름이야.

개념 9회 언급

PyPI (파이썬 패키지 인덱스)

PyPI는 파이썬 패키지를 배포하고 설치할 수 있게 만든 공개 저장소야.

개념 9회 언급

Python (파이썬)

파이썬은 읽기 쉬운 문법과 큰 패키지 생태계를 바탕으로 자동화, 데이터 분석, 웹 백엔드, AI 스크립트에 널리 쓰이는 범용 프로그래밍 언어야.

개념 9회 언급

TPU(텐서 처리 장치)

TPU는 텐서 계산에 특화된 AI 가속기예요. 8세대는 학습용 TPU 8t와 추론용 TPU 8i를 나눠 에이전트형 워크플로에서 병목을 줄이도록 만든 장치예요.

개념 9회 언급

Apple Silicon (애플 실리콘)

AI 기사에서 Apple Silicon이 나오면 CUDA GPU가 아니라 Apple SoC, 통합 메모리, Metal/MLX 런타임, 전력 제약을 함께 보는 로컬 추론 장비 신호로 읽어야 해.

개념 8회 언급

Bedrock(베드록)

Bedrock은 AI 문맥에서 대개 Amazon Bedrock을 줄여 부르는 말이고, 모델 이름이나 데이터센터 프로젝트 이름이 아니라 AWS의 모델·에이전트 운영 경로를 가리키는 경우가 많아.

개념 8회 언급

Business(비즈니스)

Business는 AI 제품 문맥에서 개인용 기능과 조직용 도입 조건 사이를 가르는 접근 라벨이야. 모델 이름이 아니라 플랜, 관리자 권한, 데이터 사용 범위, 업무용 기능 공개 대상을 확인하게 만드는 말에 가까워.

개념 8회 언급

Cloud (클라우드)

Cloud는 AI 모델과 에이전트를 직접 서버에 올리지 않고 관리형 인프라, 모델 API, 보안 정책 위에서 운영하게 해주는 실행 계층이야.

개념 8회 언급

DFlash (디플래시)

DFlash는 자동회귀 LLM의 다음 토큰 생성을 빠르게 하려고, 작은 블록 확산 draft 모델이 여러 후보 토큰을 한 번에 만들고 target 모델이 검증하는 추측 디코딩 방식이야.

개념 8회 언급

Enterprise(엔터프라이즈)

Enterprise는 AI 제품 문맥에서 개인용보다 조직 단위 도입, 보안, 권한, 계약 조건이 먼저 붙는 접근 범위를 가리키는 말이야. 모델 이름이 아니라 누가 어떤 관리 체계로 쓸 수 있는지를 가르는 표식에 가까워.

개념 8회 언급

GPT (생성형 사전학습 트랜스포머)

GPT는 OpenAI가 붙인 생성형 사전학습 트랜스포머 계열 이름이야. 서비스 이름처럼 들리지만, 원래는 큰 텍스트로 먼저 학습한 디코더형 모델 묶음을 가리키는 말에 더 가까워.

개념 8회 언급

Image Generation(이미지 생성)

이미지 생성은 텍스트 설명이나 참고 이미지를 바탕으로 새 이미지를 만들거나 기존 이미지를 고치는 생성형 AI 작업이야. 요즘은 한 번 뽑고 끝나는 기능보다 대화형 편집, 개인화, 워크플로 제어까지 묶여서 쓰이는 경우가 많아.

개념 8회 언급

INT4 (4비트 정수 정밀도)

INT4는 값을 4비트 정수와 스케일로 줄여 모델 가중치를 작게 저장하는 양자화 선택지야. LLM 추론에서는 보통 가중치 전용 압축으로 먼저 등장하고, FP4·BF16·INT8과 같은 말로 읽으면 설정을 잘못 잡기 쉬워.

개념 8회 언급

MiniMax(미니맥스)

MiniMax는 M2 텍스트 모델, Hailuo 비디오, Speech·Music 모델, MiniMax Agent, 개발자 API를 함께 운영하는 중국 AI 랩 겸 브랜드 이름이야. 그래서 M2.7 같은 개별 모델명보다 한 단계 위 이름으로 읽는 편이 맞아.

개념 8회 언급

NVLink(엔비디아 GPU 인터커넥트)

NVLink는 NVIDIA GPU 여러 장을 고대역폭 GPU-to-GPU 통신 경로로 묶는 인터커넥트야. AI 인프라에서는 GPU 개수보다 그 GPU들이 NVLink와 NVSwitch로 얼마나 자주, 얼마나 빠르게 데이터를 주고받는지까지 봐야 해.

개념 8회 언급

OCR (광학 문자 인식)

OCR은 이미지, 스캔 문서, PDF 안의 글자를 기계가 다룰 수 있는 텍스트와 위치 정보로 바꾸는 기술이야. 문서 자동화에서는 첫 입력 정리 단계이고, 멀티모달 검색에서는 직접 이미지 임베딩과 역할을 나눠 봐야 해.

개념 8회 언급

TechCrunch(테크크런치)

TechCrunch는 스타트업, 벤처, 앱, AI 제품 발표를 빠르게 보도하는 기술 매체야. AIKI에서는 모델이나 도구가 아니라 공식 발표를 시장 맥락으로 다시 읽을 때 확인하는 보도 출처로 보는 게 맞아.

개념 8회 언급

Windows(윈도우)

Windows는 Microsoft가 개발하는 개인용 PC 중심 운영체제 계열이야. AI 도구 문맥에서는 앱 하나보다 개발 환경, 드라이버, 터미널, WSL까지 묶인 실행 환경으로 읽는 편이 맞아.

개념 8회 언급

Workspace(워크스페이스)

AI 제품에서 Workspace는 파일, 앱 연결, 공유 권한, 메모리, 에이전트 실행을 한 계정이나 팀 안에서 관리하는 작업 경계야. 채팅 답변이 업무 파일과 조직 권한으로 넘어가는 순간부터 이 말이 중요해져.

개념 8회 언급

24GB GPU(24GB VRAM 카드)

24GB VRAM GPU는 로컬 LLM을 바로 올릴 수 있는 만능 기준이 아니라, 모델 크기와 양자화와 컨텍스트 길이를 먼저 가르는 판단선이야.

개념 7회 언급

Bloomberg(블룸버그)

Bloomberg는 AI 기사에서 제품 성능보다 전력, 공급망, 배포 채널, 시장 지출 같은 비즈니스 맥락을 먼저 보게 해 주는 취재 출처야.

개념 7회 언급

Edu(교육용 계정 라벨)

Edu는 ChatGPT 문맥에서 학교와 대학 같은 교육기관용 워크스페이스를 가리키는 접근 라벨이야. 새 기능이 Edu에 열린다고 하면 모델 이름보다 관리자 권한, 데이터 조건, 학생·교직원 배포 범위를 먼저 봐야 해.

개념 7회 언급

F32 (32비트 부동소수점)

F32는 32비트 부동소수점 정밀도 표기야. 모델 카드에서는 FP32·float32와 같은 축으로 읽되, BF16 같은 다른 tensor type과 같이 보이면 전체 가중치가 모두 F32라고 단정하면 안 돼.

개념 7회 언급

HumanEval(휴먼이밸)

HumanEval은 모델이 파이썬(Python) 함수 구현을 설명 주석(docstring)만 보고 만들어 내는지 재는 코드 생성 벤치마크야. 점수는 보통 pass@1, pass@10, pass@100처럼 테스트 통과율로 읽어.

개념 7회 언급

Mac(맥)

Mac은 Apple이 만드는 노트북·데스크톱 컴퓨터 플랫폼이야. 코딩 도구나 로컬 모델 문서에서는 앱 하나보다 터미널, 칩 아키텍처, 앱 배포 방식까지 묶인 실행 환경으로 읽는 편이 맞아.

개념 7회 언급

Max(맥스)

Max는 보통 Anthropic의 Claude 개인용 상위 유료 구독 등급을 뜻해. claude.ai에서 더 넓은 사용량과 기능 우선권을 주는 요금제라서, 기사에서 보이면 새 모델보다 구독 맥락부터 보는 편이 맞아.

개념 7회 언급

MMLU(엠엠엘유)

MMLU는 언어 모델이 57개 과목의 객관식 문제를 풀며 넓은 지식과 문제 해결력을 얼마나 보이는지 재는 벤치마크야.

개념 7회 언급

Mythos (마이토스)

Mythos는 Anthropic의 보안형 프리뷰 모델과 그 주변의 제한 접근 배포를 줄여 부르는 이름이야. 공개 챗봇보다 Glasswing 협력, 취약점 탐지, 접근 통제를 같이 봐야 해.

개념 7회 언급

Nemotron(네모트론)

Nemotron은 NVIDIA가 에이전트용 공개 모델, 합성 데이터셋, RAG·문서·음성·안전 모델을 한 묶음으로 부르는 AI 계열 이름이야.

개념 7회 언급

OAuth(권한 위임)

OAuth는 외부 앱이나 agent에게 비밀번호를 넘기지 않고 제한된 접근 권한을 주는 권한 위임 프로토콜이야. AI 도구에서는 API key 대신 사용자 OAuth, scope, token 보관 방식을 보는 기준이 돼.

개념 7회 언급

StartupFortune(스타트업포춘)

스타트업포춘은 Qwen3.6 27B FP8 단일 GPU 사례를 스타트업의 로컬 추론 경제성으로 해석한 2차 분석 출처로 읽어야 해.

개념 7회 언급

SwiGLU(스위글루)

SwiGLU는 Transformer의 feed-forward layer에서 두 선형 경로를 곱하고, 한쪽에 Swish를 쓰는 GLU 변형이야. attention이 아니라 FFN과 MoE 전문가 내부 계산을 이해할 때 자주 나오는 활성화 구조야.

개념 7회 언급

Teachers(교사용 ChatGPT)

Teachers는 일반 교사 집단보다 OpenAI의 ChatGPT for Teachers 맥락에서 읽어야 하는 말이야. 미국 K-12 교사용 무료 기간, 학교 단위 워크스페이스, 관리자 통제, 데이터 보호 조건을 같이 봐야 해.

개념 7회 언급

Tensor Core(텐서 코어)

Tensor Core는 NVIDIA GPU 안에서 행렬곱과 혼합 정밀도 계산을 빠르게 처리하는 전용 연산 블록이야. AI에서는 BF16, FP8, FP4 같은 정밀도 선택과 실제 처리량을 같이 볼 때 자주 나와.

개념 7회 언급

TypeScript(타입스크립트)

TypeScript는 JavaScript 위에 타입 문법과 정적 검사를 얹어 주는 언어야. 빌드 결과물은 JavaScript라서 브라우저와 Node.js 같은 기존 실행 환경으로 그대로 들어가.

개념 7회 언급

VentureBeat(벤처비트)

VentureBeat는 AI 회사의 공식 문서가 아니라, 모델 발표와 업계 반응을 기사와 AI Weekly 뉴스레터로 엮어 전달하는 미국 기술 매체야.

개념 7회 언급

YaRN (야른)

YaRN은 RoPE 기반 모델의 컨텍스트 창을 더 길게 쓰기 위한 위치 임베딩 스케일링 방법이야. 긴 문맥 숫자가 네이티브 한계인지, 런타임에서 켠 확장 설정인지 가를 때 먼저 봐야 해.

개념 7회 언급

A4B NVFP4(A4B 엔브이FP4)

A4B NVFP4는 A4B MoE 구조의 모델을 NVIDIA의 NVFP4 4비트 포맷으로 양자화해 배포한다는 조합 표현이야. 모델 구조의 계산량 신호와 가중치 저장 포맷을 한 번에 말할 때 쓰여.

개념 6회 언급

Amazon (아마존)

Amazon은 전자상거래 회사 이름이면서 AWS, Bedrock, Trainium, 물류 AI를 함께 운영하는 공급자야. AI 기사에서는 쇼핑몰보다 클라우드·전력·칩·에이전트 인프라 쪽으로 읽을 때가 많아.

개념 6회 언급

Attention (어텐션)

Attention은 새 모델 이름이 아니라, 모델이 문맥 안에서 어떤 토큰을 얼마나 참고할지 계산하는 내부 메커니즘이야. 현재 위치와 다른 위치들의 관련도를 점수로 만들고 그 비중을 섞어 다음 표현을 만든다는 점이 중요해.

개념 6회 언급

Azure(마이크로소프트 애저)

Azure는 Microsoft의 클라우드 플랫폼이야. AI 기사에서는 모델 이름이 아니라 배포, 계정, 보안, OpenAI 모델 접근 경로를 가르는 클라우드 축으로 읽어야 해.

개념 6회 언급

BrowseComp(브라우즈컴프)

BrowseComp는 웹을 오래 탐색해야 풀 수 있는 1,266개 짧은 정답형 문제로 브라우징 에이전트의 집요한 정보 찾기 능력을 재는 OpenAI 벤치마크야.

개념 6회 언급

E4B (이포비)

E4B는 Gemma 문서에서 작은 멀티모달 모델을 부를 때 쓰는 E 표기야. 총 4B 모델이라는 뜻은 아니고, 실제 돌릴 때 부담을 따로 읽어야 해.

개념 6회 언급

Fortune(포춘)

Fortune은 기업, 리더십, 기술, AI 정책을 비즈니스 관점으로 읽는 경제 매체야. AIKI에서는 모델이나 도구가 아니라, 공식 발표가 시장과 규제 논쟁에서 어떻게 해석됐는지 보는 출처로 다루면 돼.

개념 6회 언급

GDDR7(그래픽 DRAM 7세대)

그래픽 DRAM 7세대인 GDDR7은 GPU와 AI 가속기에서 VRAM 대역폭을 읽을 때 나오는 메모리 표기야. 로컬 LLM에서는 모델 이름이 아니라 가중치와 KV 캐시가 오가는 하드웨어 조건으로 봐야 해.

개념 6회 언급

Jackrong(허깅페이스 계정)

Jackrong은 Hugging Face에서 Qwen 기반 reasoning distillation 모델과 데이터셋을 올리는 커뮤니티 계정이야. Claude라는 이름이 붙은 체크포인트를 볼 때 공식 Anthropic 모델인지, 커뮤니티 파인튜닝 산물인지 가르는 단서가 돼.

개념 6회 언급

LiveCodeBench(라이브코드벤치)

LiveCodeBench는 LeetCode, AtCoder, Codeforces의 새 문제를 계속 모아 코드 LLM을 평가하는 오염 방지형 코딩 벤치마크야. pass@1 숫자는 리리즈(release) 버전과 기간 조건이 붙어야 제대로 읽을 수 있어.

개념 6회 언급

Mixture of Experts(전문가 혼합)

Mixture of Experts(MoE)는 하나의 거대한 계산 덩어리로 모든 입력을 처리하지 않고, 여러 전문가 모듈 가운데 일부만 골라 쓰는 모델 구조야. 그래서 새 모델 이름이라기보다 계산을 나누는 내부 설계 방식으로 이해하는 게 맞아.

개념 6회 언급

PrivateLink(프라이빗링크)

PrivateLink는 AWS VPC에서 Bedrock 같은 AWS 서비스나 다른 계정의 서비스로 사설 네트워크 경로를 만드는 기술이야. AI 인프라 기사에서는 모델 품질보다 네트워크와 감사 경계를 읽게 해 줘.

개념 6회 언급

Project Glasswing (프로젝트 글래스윙)

Glasswing은 Anthropic이 Claude Mythos Preview를 방어 보안 쪽 파트너에게 먼저 열어 핵심 소프트웨어 취약점을 찾게 한 제한 접근 이니셔티브야.

개념 6회 언급

SaaS(서비스형 소프트웨어)

SaaS는 서버 설치보다 계정, 권한, 데이터 경로, 제공자 운영 책임을 먼저 보게 만드는 클라우드 소프트웨어 모델이야.

개념 6회 언급

Search (검색)

Search는 질문을 웹 색인, 실시간 정보, AI 응답으로 보내 답과 링크, 때로는 후속 행동 후보까지 돌려주는 정보 탐색 방식이야.

개념 6회 언급

Sheets(시트)

Sheets는 AI 발표문에서 Google Sheets 같은 스프레드시트 작업 화면을 줄여 부르는 말이야. 특히 Gemini가 표, 대시보드, 누락 데이터, 파일 생성을 다루는 맥락에서 자주 나와.

개념 6회 언급

Standard (스탠더드)

Standard는 API 가격표나 처리 옵션에서 할인 배치나 우선 처리 옵션을 붙이지 않은 기본 실시간 처리 기준이야. 모델 품질 등급이 아니라 비용과 지연 시간을 비교할 때 쓰는 기준선에 가까워.

개념 6회 언급

Ultra(울트라)

Ultra는 Google AI Ultra를 줄여 부르는 말로, Google이 Gemini 앱과 여러 AI 제품의 상위 사용량과 일부 선공개 기능을 묶어 파는 개인용 구독 등급이야. 모델명이나 API 권한으로 읽으면 금방 헷갈려.

개념 6회 언급

VIBE-Pro(바이브 프로)

VIBE-Pro는 모델이 저장소 수준 제품 요구사항을 끝까지 구현하는지 보는 코드 생성 벤치마크야. M2.7 공개 문맥에서는 웹, 안드로이드, iOS, 시뮬레이션 작업을 묶어 보는 프로젝트 납품형 신호로 쓰였어.

개념 6회 언급

Word(워드 문서)

Word(워드 문서)는 AI가 만든 초안을 .docx처럼 다시 편집할 수 있는 문서 파일로 받는 선택지야.

개념 6회 언급

모델

모델은 입력을 받아 다음에 나오는 답을 계산해 내는 핵심 장치야. 같은 요청이어도 비용, 속도, 문맥 처리 방식이 달라져.

개념 5회 언급

Apache-2.0(아파치 2.0 표기)

Apache-2.0은 Apache License 2.0을 가리키는 라이선스 식별자야. AI 쪽에서는 Hugging Face 모델 카드의 `license` 값으로 자주 보여서, 오픈 모델 후보를 고를 때 첫 필터처럼 많이 읽어.

개념 5회 언급

ChatGPT Instant (챗지피티 인스턴트)

ChatGPT의 Instant 경로는 빠른 일상 대화와 짧은 업무 질문을 맡는 기본 모델 선택지야. 특정 API 모델명 하나가 아니라, 시점별 GPT Instant 버전과 API 별칭을 나눠 읽어야 해.

개념 5회 언급

E2B (이투비)

E2B는 Gemma 문서군에서 쓰는 E 표기야. 쉽게 말해 모델을 실제 기기에 올렸을 때 체감 부담을 어느 정도로 읽어야 하는지 알려 주는 숫자라고 보면 돼.

개념 5회 언급

Enterprise AI(엔터프라이즈 AI)

Enterprise AI는 조직이 AI를 개인 실험이 아니라 권한, 데이터, 배포, 비용, 관측까지 포함한 운영 체계로 쓰는 방식을 가리키는 개념이야.

개념 5회 언급

FP16 (반정밀도 부동소수점)

FP16은 16비트 부동소수점 형식으로, 모델 가중치와 연산 텐서를 FP32보다 가볍게 다루기 위한 정밀도 선택지야.

개념 5회 언급

FP4 (4비트 부동소수점 포맷)

FP4는 숫자 하나를 4비트 부동소수점으로 줄이는 정밀도 계열이야. Blackwell의 NVFP4나 DeepGEMM의 FP8 x FP4 경로처럼, 메모리와 GEMM 처리량을 줄일 수 있지만 스케일링과 품질 회귀 검증이 없으면 바로 켤 수 없어.

개념 5회 언급

FP8 양자화 가중치

Mixtral은 Mistral AI가 만든 sparse MoE 계열 오픈 웨이트 언어 모델이야.

모델

Stable Diffusion(스테이블 디퓨전)

Stable Diffusion은 Stability AI와 함께 자주 언급되는 이미지 생성 모델 계열이야.

모델

Veo (비오)

Veo (비오)는 Google DeepMind가 만든 영상 생성 모델이야. 텍스트 프롬프트로 장면을 만들고 최신 계열은 오디오까지 같이 합성해.

Nemotron-Personas-Korea (네모트론 페르소나스 코리아)

NVIDIA가 공개한 한국어 합성 페르소나 데이터셋이야. 한국 사용자에게 맞는 에이전트 grounding, system prompt persona layer, 학습·도메인 데이터 씨앗으로 읽는 편이 맞아.

데이터셋

PII-Masking-300k(피아이아이 마스킹 300K)

AI4Privacy가 Hugging Face에 공개한 개인정보 마스킹 데이터셋이자 벤치마크야. OpenAI Privacy Filter 같은 모델이 긴 텍스트에서 민감한 정보를 얼마나 잘 찾는지 재는 공개 기준으로 자주 인용돼.

Text to Speech(음성 합성)는 글을 사람이 말하듯 들리는 소리로 바꿔서 읽어주기와 음성 인터페이스를 만드는 기술이야.

기법

도구

Claude Code(클로드 코드)

Claude Code는 터미널에서 Claude 모델을 붙여 코드 수정·검토·정리까지 이어 가는 AI 코딩 어시스턴트야.

도구 61회 언급

SDK (소프트웨어 개발 키트)

API를 감싸는 개발자용 패키지 묶음으로, 인증·요청·응답 공통 동작을 한 번에 다루게 해주는 도구군이에요.

도구 42회 언급

LocalLLaMA (로컬라마)

LocalLLaMA는 LLM을 내 컴퓨터나 자체 서버에서 돌리는 사람들 이야기가 모이는 커뮤니티 이름이야. 특정 모델 하나를 가리키는 말이 아니라, 로컬 AI 운영 경험과 추천 스택이 흘러다니는 큰 정보 허브에 가까워.

도구 26회 언급

OpenAI(오픈에이아이)

OpenAI는 GPT, ChatGPT, Codex, Sora 같은 모델과 서비스를 만드는 회사이자 연구 조직이야. 모델 하나의 이름이 아니라 그 라인업을 만들고 배포하는 주체를 가리켜.

도구 24회 언급

Modal(모달)

Modal(모달)은 Python 코드와 의존성을 컨테이너처럼 감싸서 클라우드 CPU나 GPU에 서버리스로 올려 주는 AI 인프라 플랫폼이야. 모델을 만드는 도구라기보다 추론, 배치 작업, 학습 잡, 샌드박스 실행을 어디서 어떻게 굴릴지 정하는 운영 레이어에 가까워.

도구 11회 언급

GitHub (깃허브)

GitHub (깃허브)는 코드를 어디에 두고 누가 왜 바꿨는지까지 함께 관리하게 해주는 협업 중심 개발 플랫폼이야.

도구 10회 언급

Chat Completions(챗 컴플리션스)

챗 컴플리션스는 대화형 LLM 호출 인터페이스 이름이야. DeepSeek 같은 OpenAI 호환 API에서는 `/chat/completions` 엔드포인트를 뜻하고, `messages` 배열을 보내 답변, 스트리밍, JSON 출력, tool calls 같은 결과를 받는 경로로 읽는 편이 정확해.

도구 9회 언급

Excel(엑셀)

Excel은 Microsoft의 스프레드시트 도구야. AI 제품을 붙여 쓸 때는 단순 표 계산 앱이 아니라, 수식·셀·워크북을 모델이 읽고 수정 요청을 만드는 작업 화면으로 봐야 해.

도구 9회 언급

Gmail(지메일)

지메일은 Google의 이메일 도구야. AI 문맥에서는 단순 메일함보다, Gemini가 메일 요약·초안·검색·일정 생성을 수행하는 Workspace 안의 이메일 작업 화면으로 읽어야 정확해.

도구 9회 언급

KTransformers (케이트랜스포머스)

KTransformers는 MoE 모델을 CPU와 [GPU](/ko/wiki/gpu/)에 나눠 올려 [VRAM](/ko/wiki/vram/) 부담을 줄이려는 추론·파인튜닝 프레임워크야. vLLM이나 SGLang처럼 단순한 API 서버라기보다 expert 배치 전략까지 만지는 도구에 가까워.

도구 9회 언급

Docker(도커)

Docker는 앱과 실행 환경을 컨테이너 이미지로 묶어 같은 방식으로 실행하게 해 주는 컨테이너화 도구야. AI 자동화에서는 로컬 테스트, 셀프호스트 배포, 에이전트 샌드박스 경계를 볼 때 먼저 확인해야 해.

도구 8회 언급

GitHub Copilot (깃허브 코파일럿)

GitHub Copilot은 에디터 안에서 코드 문맥을 보고 다음 코드나 함수 초안을 제안하는 GitHub의 AI 코딩 도구야. 이름은 하나지만, 실제로는 자동완성 하나보다 넓게 개발 습관과 리뷰 흐름까지 건드리는 제품 축으로 보는 편이 맞아.

도구 8회 언급

llama.cpp (로컬 LLM 추론 엔진)

llama.cpp는 오픈 가중치 모델을 로컬 장비나 자체 인프라에서 직접 추론하게 해주는 실행 엔진이자 CLI·서버 도구 묶음이야. 모델 이름이라기보다 GGUF 포맷, 양자화, 하드웨어 백엔드, API 노출 방식을 실제 운영에 연결하는 층으로 보는 게 맞아.

도구 7회 언급

llama.cpp(로컬 LLM 런타임)

llama-cpp는 llama.cpp를 태그와 검색에서 적을 때 쓰는 표기야. 실제로는 GGUF 모델을 C/C++ 기반 엔진으로 로컬 PC, GPU 서버, llama-server API에 올려 추론하게 만드는 런타임을 가리켜.

도구 7회 언급

Slack(슬랙)

Slack은 채널, 메시지, 앱, 워크플로를 한 업무 대화 공간에 묶는 협업 도구야. AI 에이전트 문맥에서는 요청이 들어오고 결과가 돌아가는 실행 표면으로 봐야 정확해.

도구 7회 언급

CloudTrail(클라우드트레일)

CloudTrail은 AWS 계정 안에서 누가 어떤 API와 관리 작업을 했는지 이벤트로 남기는 감사 로그 서비스야.

도구 6회 언급

ModelScope(모델스코프)

ModelScope는 Alibaba 계열의 AI 모델 허브이자 Python SDK야. 단일 모델 이름이 아니라 공개 가중치 배포, 데이터셋, 온라인 체험, 로컬 실험 경로가 함께 붙는 배포 기반으로 보는 편이 맞아.

도구 6회 언급

Responses API(리스폰스 API)

Responses API는 OpenAI가 텍스트 생성, 이미지 입력, 상태 보존, 도구 실행을 한 응답 단위로 묶은 인터페이스야. 단발성 채팅 호출보다 에이전트형 앱과 자동화 흐름 설계에 더 가까운 쪽이야.

도구 6회 언급

Chat (대화형 AI 인터페이스)

Chat은 사람이 메시지를 보내고 LLM이 응답을 돌려주는 대화형 AI 사용 경로야. 웹 채팅 화면, Chat API, 모델 alias가 같은 말처럼 섞여 나올 때 먼저 분리해서 봐야 해.

도구 5회 언급

DGX B200(디지엑스 B200)

DGX B200은 NVIDIA Blackwell GPU 8개, 1,440GB 총 GPU 메모리, 5세대 NVLink를 묶은 데이터센터용 DGX 시스템이야.

도구 5회 언급

H100 (엔비디아 호퍼 GPU)

H100은 NVIDIA Hopper 세대의 데이터센터 GPU야. 80GB 메모리, FP8 Tensor Core, NVLink 같은 조건 때문에 LLM 추론·학습 기사에서 하드웨어 기준선으로 자주 쓰여.

도구 5회 언급

Model Garden(모델 가든)

Model Garden은 Google Cloud에서 Google 모델, 파트너 모델, 오픈 모델을 고르고 시험하고 배포하는 모델 카탈로그야. 새 모델 이름이 아니라 Vertex AI와 Agent Platform 안의 모델 선택·배포 진입점으로 읽어야 해.

도구 5회 언급

Alibaba Cloud API(알리바바 클라우드 API)

Alibaba Cloud API는 Alibaba Cloud Model Studio에서 Qwen 계열과 일부 서드파티 모델을 코드로 호출하는 개발 인터페이스야. Qwen Studio 같은 완성형 앱이 아니라, API 키와 베이스 URL, 모델 이름을 붙여 서비스 안에서 직접 운영하는 호출 경계로 읽는 편이 맞아.

도구 4회 언급

Alibaba Cloud Model Studio(알리바바 클라우드 모델 스튜디오)

Alibaba Cloud Model Studio는 Qwen 계열과 일부 서드파티 모델을 API, OpenAI 호환 엔드포인트, 지식 검색, 에이전트·워크플로 앱으로 묶은 Alibaba Cloud의 생성 AI 플랫폼이야.

도구 4회 언급

claude.ai(클로드 웹 앱)

claude.ai는 Anthropic이 Claude를 웹에서 쓰게 여는 소비자용 진입점이야. 모델 이름 하나라기보다 웹, 데스크톱, 모바일로 이어지는 Claude 앱 계정과 요금제, 사용 한도를 같이 읽어야 정확해.

도구 4회 언급

DGX Spark(디지엑스 스파크)

DGX Spark는 NVIDIA GB10 Grace Blackwell 슈퍼칩, 128GB 통합 메모리, FP4 기준 최대 1PFLOP를 데스크톱 크기에 묶은 개인용 AI 컴퓨터야.

도구 4회 언급

Google Drive(구글 드라이브)

Google Drive는 Google의 클라우드 파일 저장·공유 도구야. AI 문맥에서는 Gemini가 만든 파일을 내보내는 위치이자, 보관된 자료를 요약·검색·정리하는 협업 문맥으로 봐야 해.

도구 4회 언급

Microsoft Foundry(마이크로소프트 파운드리)

이 플랫폼은 Azure 위에서 모델, 에이전트, 도구, 관측, 거버넌스를 한 프로젝트 경계로 묶는 기업용 AI 앱·에이전트 작업대야.

도구 4회 언급

Model Studio API(모델 스튜디오 API)

Model Studio API는 Alibaba Cloud Model Studio 안에서 Qwen 계열과 일부 서드파티 모델을 코드로 호출하는 API 계층이야. 콘솔 전체나 Qwen Studio 같은 사용자용 앱이 아니라, API 키·리전별 base URL·모델 이름으로 서비스 요청을 보내는 운영 경계로 읽는 편이 맞아.

도구 4회 언급

Model Studio(모델 스튜디오)

Model Studio는 보통 Alibaba Cloud Model Studio를 줄여 부르는 말이야. Qwen API, OpenAI 호환 엔드포인트, 플레이그라운드, 에이전트·워크플로 콘솔까지 묶어 부를 때 많이 써.

도구 4회 언급

Ollama(올라마)

Ollama는 로컬 컴퓨터에서 언어 모델을 실행하고, 그 결과를 API로 꺼내 쓸 수 있게 해 주는 도구야. 채팅 앱이라기보다 로컬 모델 런타임과 호출 인터페이스를 같이 내주는 층에 가까워.

도구 4회 언급

OpenAI Chat Completion(오픈AI 챗 컴플리션)

이 항목은 Alibaba Cloud Model Studio에서 Qwen 모델을 OpenAI 호환 `/chat/completions` 엔드포인트로 부르는 경로야. 기존 OpenAI SDK 코드에서 API key, base URL, model 이름을 바꿔 붙이기 쉬운 대신, 대화 이력과 도구 실행 흐름은 호출 쪽에서 직접 챙겨야 해.

도구 4회 언급

OpenAI SDK(오픈에이아이 SDK)

OpenAI SDK는 OpenAI API를 Python, JavaScript, .NET, Java, Go에서 코드로 부르기 쉽게 감싼 공식 클라이언트 라이브러리 묶음이야. 같은 SDK가 OpenAI 호환 엔드포인트에도 자주 재사용돼서, API 자체와 SDK 자체를 구분해서 읽는 게 중요해.

도구 4회 언급

Qwen API(큐원 API)

Qwen API는 Alibaba Cloud Model Studio에서 Qwen 계열 모델을 코드로 호출하는 인터페이스야. Qwen Studio 같은 완성형 앱이 아니라 API 키, 리전별 base URL, 호출 방식 3가지를 골라 서비스와 연결하는 개발 경로로 보는 게 맞아.

도구 4회 언급

Qwen Studio(큐원 스튜디오)

Qwen Studio는 Alibaba Cloud가 qwen.ai에서 운영하는 대화형 AI 제품이야. Qwen 모델 계열 자체가 아니라, 웹·모바일·데스크톱에서 검색, 문서 읽기, 멀티모달 입력, 이미지·비디오 생성을 묶어 둔 작업 표면으로 읽는 편이 맞아.

도구 4회 언급

Raspberry Pi (라즈베리 파이)

Raspberry Pi는 CPU, 메모리, 포트를 한 장 보드에 올린 초소형 컴퓨터 제품군이야. 센서 제어부터 작은 서버와 엣지 AI 실험까지 적은 전력과 비용으로 시작하게 해 줘.

도구 4회 언급

Studio(스튜디오)

AI 도구 문맥에서 Studio는 대개 새 모델명이 아니라 개발자가 코드를 열고, 프롬프트를 시험하고, 터미널 작업을 이어 가는 작업 표면을 가리켜. 이 페이지는 Android Studio 안에서 Claude Code를 붙이는 흐름을 기준으로 Studio라는 말을 읽는 법을 잡아.

도구 4회 언급

VS Code(비주얼 스튜디오 코드)

VS Code는 Microsoft가 배포하는 확장형 코드 편집기야. Git, 터미널, 디버깅, 확장, 최근의 AI 에이전트까지 한 자리에 묶어서 개발 흐름 전체를 다루게 해.

도구 4회 언급

AI Studio (AI 스튜디오)

AI Studio는 Google이 Gemini 프롬프트를 바로 시험해 보라고 만든 브라우저 작업실이야. 모델 이름이 아니라 프롬프트 실험, 코드 내보내기, 빠른 설정 확인을 한곳에 묶은 개발자 도구로 이해하는 편이 맞아.

도구 3회 언급

Claude Desktop(클로드 데스크톱)

Anthropic의 Claude 데스크톱 앱은 macOS와 Windows에서 쓰는 설치형 클라이언트야. 모델 이름이 아니라 로컬 파일, 데스크톱 확장, MCP 연결, Cowork까지 만나는 실행 표면으로 봐야 해.

도구 3회 언급

Codex(코덱스)

Codex는 OpenAI의 코딩 작업 도구야. 코드 수정, 테스트, 리뷰, 자동화까지 이어져서 단순 추천 기능보다 팀의 개발 흐름을 다시 짜게 만드는 쪽에 더 가까워.

도구 3회 언급

Cursor(커서)

Cursor는 AI를 중심에 둔 코드 에디터 제품이야. 모델 이름이 아니라 편집기 이름이라서, 코드 탐색과 수정 제안과 에이전트 실행이 한 화면 안에서 이어져.

도구 3회 언급

DeepSeek API(딥시크 API)

DeepSeek API는 DeepSeek 모델 자체를 가리키지 않고, 요청을 받아서 어떤 모델을 부를지 연결해 주는 호출 통로야.

도구 3회 언급

Gemini API(제미니 API)

Gemini API는 Google 모델을 앱에서 호출할 때 쓰는 개발자용 인터페이스야. 채팅창 이름이라기보다 SDK와 HTTP 요청으로 멀티모달 입력, 구조화 출력, 도구 연결을 붙이는 접점에 가까워.

도구 3회 언급

Google Calendar(구글 캘린더)

구글 캘린더는 Google의 일정 관리 도구야. AI 문맥에서는 Gemini와 워크스페이스 에이전트가 회의 시간, 이메일 속 일정, 앱 권한을 다루는 실행 표면으로 읽어야 정확해.

도구 3회 언급

Google Docs(구글 문서)

Google Docs는 Google의 온라인 문서 편집 도구야. AI 문맥에서는 Gemini가 초안을 만들고 고치고, Gemini 앱 결과를 협업 문서로 넘기는 Workspace 표면으로 봐야 해.

도구 3회 언급

Google Search(구글 검색)

Google Search는 Google의 웹 검색 제품이야. 요즘 AI 문맥에서는 링크 목록만 보여 주는 검색창이 아니라, AI Overviews, AI Mode, Gemini grounding에 실시간 정보를 공급하는 검색 계층으로 같이 읽는 편이 맞아.

도구 3회 언급

Google Sheets(구글 시트)

Google Sheets는 브라우저와 모바일에서 같은 파일을 함께 편집하는 Google의 스프레드시트 도구야. 2026년에는 Gemini in Sheets 기능이 통합되면서 협업 문서와 AI 보조 흐름이 한 제품 안에서 더 강하게 합쳐지고 있어.

도구 3회 언급

Hugging Face(허깅 페이스)

Hugging Face는 모델 저장소, 배포 경로, 라이브러리, 커뮤니티가 한데 묶인 생태계에 가까워. 그래서 모델 하나의 이름으로 읽기보다, 팀이 모델을 찾고 공유하고 배포하는 기반으로 보는 편이 맞아.

도구 3회 언급

Jetson Thor(젯슨 토르)

Jetson Thor는 NVIDIA Blackwell 기반 로봇·엣지 AI 하드웨어 플랫폼이야. 데이터센터 GPU가 아니라 40W~130W 전력 범위에서 센서 처리와 로컬 추론을 묶는 Jetson 계열로 봐야 해.

도구 3회 언급

Kimi API(키미 API)

Kimi API는 Moonshot AI의 Kimi 모델을 앱과 서버에서 코드로 호출하는 개발 인터페이스야. Kimi 웹앱 이름이나 Kimi K2.6 같은 개별 모델명이 아니라, OpenAI 호환 요청 형식과 Kimi 전용 확장을 함께 쓰는 운영 경계에 더 가까워.

도구 3회 언급

Kimi Code(키미 코드)

Kimi Code는 Moonshot AI의 Kimi 멤버십에 포함된 에이전트형 코딩 도구야. 터미널, VS Code, 제3자 코딩 에이전트에서 쓰는 제품이라 Kimi K2.5 모델 자체와는 구분해서 봐야 해.

도구 3회 언급

Live API(라이브 API)

Live API는 Gemini를 음성·영상 스트림에 낮은 지연시간으로 붙이는 실시간 API야. 일반 Gemini 2.5 Flash나 Chat Completions처럼 요청 하나에 텍스트 답을 받는 경로가 아니라, WebSocket 세션에서 오디오·영상·텍스트를 계속 주고받는 방식으로 봐야 해.

도구 3회 언급

OpenClaw(오픈클로)

OpenClaw는 공식 API 대신 기존 AI 계정이나 구독을 비공식 클라이언트에 붙여 쓰게 만드는 연결 도구 계열이야.

도구 3회 언급

Perplexity (퍼플렉시티)

Perplexity는 웹 검색 결과와 출처를 묶어 답으로 정리해 주는 답변형 검색 제품이야. 모델 이름이라기보다 검색, 요약, 출처 제시를 한데 묶은 서비스로 보는 게 더 정확해.

도구 3회 언급

Agents SDK(에이전트 SDK)

Agents SDK는 OpenAI 모델로 에이전트 루프를 만들 때 도구 호출, 파일 작업, 샌드박스 실행, 추적을 코드로 묶어 주는 개발자용 SDK야.

도구 2회 언급

Amazon Bedrock(아마존 베드록)

Amazon Bedrock은 AWS에서 여러 회사의 기반 모델 호출, RAG, Guardrails, Agent 실행을 한 관리 계층에서 처리하는 생성형 AI 플랫폼이야.

도구 2회 언급

App Store(앱 스토어)

App Store는 Apple이 iPhone·iPad·Mac 앱을 배포하고 심사하는 스토어야. AI 기사에서는 모델 이름보다 배포 채널과 정책 병목을 읽는 단어로 보는 편이 맞아.

도구 2회 언급

Batch API(배치 API)

Batch API는 대량의 모델 요청을 비동기 작업으로 묶어 제출하고, 나중에 결과를 한꺼번에 받는 추론 인터페이스야. 즉시 응답보다 비용 절감, 높은 처리량, 야간 일괄 작업에 더 맞는 경로라고 보면 돼.

도구 2회 언급

claude --version (버전 조회)

Claude Code를 시작하기 전에 `claude --version`으로 버전 적합성을 먼저 확인하는 진입점 명령이에요.

도구 2회 언급

Claude Code Remote Control(클로드 코드 리모트 컨트롤)

Claude Code Remote Control은 로컬에서 실행 중인 Claude Code 세션을 claude.ai/code나 Claude 모바일 앱에서 이어서 조작하게 해 주는 원격 제어 기능이야.

도구 2회 언급

Claude Code v2.1.110(클로드 코드 2.1.110)

Claude Code v2.1.110은 2026년 4월 15일 공개된 Claude Code 릴리스야. `/tui fullscreen`, 모바일 푸시 알림 도구, 원격 제어 모바일·웹 명령 확대가 같이 들어온 버전으로 봐야 해.

도구 2회 언급

claude remote-control(클로드 리모트 컨트롤 명령)

Remote Control 서버 모드 명령은 Claude Code에서 원격 제어 서버를 띄우는 CLI 진입점이야. claude.ai/code나 Claude 모바일 앱이 로컬 세션을 조작하게 해.

도구 2회 언급

Cline(클라인)

Cline은 VS Code 계열 IDE 안에서 파일 수정, 명령 실행, 브라우저 작업까지 잇는 코딩 에이전트야.

도구 2회 언급

Codex CLI(코덱스 CLI)

Codex CLI는 OpenAI의 코딩 에이전트를 터미널에서 실행하는 도구야. 선택한 디렉터리의 파일 읽기, 수정, 명령 실행, `codex exec` 자동화, MCP 연결까지 보면서 도입 범위를 정해야 해.

도구 2회 언급

Gemini API File Search(제미니 API 파일 검색)

이 항목은 Gemini API 안에서 파일을 올리고, 인덱싱하고, 검색 결과를 모델 응답에 붙여 주는 관리형 RAG 도구야. 2026년 5월 업데이트 이후 텍스트와 이미지 검색, 커스텀 메타데이터, 페이지 단위 인용을 같이 봐야 해.

도구 2회 언급

Gemini Developer API(제미니 디벨로퍼 API)

Google의 API 키 기반 Gemini 직접 경로는 앱에서 Gemini 모델을 바로 호출하고 운영할 때 쓰는 개발자용 API 제품이야. 단일 모델명이 아니라 Gemini 2.5 Pro 같은 모델 선택, 구조화 출력, 도구 호출, 배치 처리를 함께 다루는 경로에 가깝지.

도구 2회 언급

Gemini Enterprise Agent Platform(제미니 엔터프라이즈 에이전트 플랫폼)

제미니 엔터프라이즈의 Agent Platform은 Google Cloud에서 AI 에이전트를 만들고, 실행하고, 권한과 로그까지 관리하는 엔터프라이즈용 운영 도구야. Gemini 모델 하나가 아니라 Vertex AI, Agent Studio, ADK, Runtime, Identity 같은 기능을 한데 묶는 경로로 읽어야 해.

도구 2회 언급

Kimi.com(키미닷컴)

Kimi.com은 Moonshot AI의 Kimi 모델을 웹에서 쓰는 소비자용 진입점이야. Kimi K2.5 같은 모델 이름, Kimi API, Kimi Code와 같은 말처럼 보이지만 실제로는 채팅·문서·슬라이드·시트·웹사이트·Agent Swarm 작업을 화면에서 실행하는 제품 표면에 가까워.

도구 2회 언급

llama-cli (로컬 LLM CLI)

llama-cli는 llama.cpp에 들어 있는 터미널 실행 파일이야. GGUF 모델을 로컬 파일이나 Hugging Face 저장소에서 불러와 바로 추론하고, 서버가 아니라 한 번의 CLI 실행으로 옵션을 확인할 때 써.

도구 2회 언급

llama-server(로컬 LLM 서빙 서버)

llama-server(로컬 LLM 서빙 서버)는 ggml-org의 `llama.cpp`에 들어 있는 HTTP 서버 실행 파일이야. GGUF 모델을 로컬이나 자체 GPU 서버에 올리고 OpenAI·Anthropic 호환 API로 요청을 처리하게 만드는 서빙 서버/API 레이어로 이해해야 해.

도구 2회 언급

MiMo Code (미모 코드)

MiMo Code는 장기 과업을 이어서 처리하는 오픈소스 코딩 에이전트 도구야.

도구 2회 언급

Qwen Code(큐원 코드)

Qwen Code는 QwenLM이 공개한 터미널용 오픈소스 코딩 에이전트야. `qwen` CLI, Node.js 20+, headless, 에디터 통합, SDK 경로, 2026-04-15 OAuth 종료, 로컬 모델 연결 주소 같은 운영 조건을 같이 봐야 도입 판단이 빨라져.

도구 2회 언급

Chroma(크로마)

Chroma(크로마)는 문서 임베딩과 메타데이터를 함께 저장해서 AI 앱의 retrieval를 바로 시작하게 도와주는 오픈소스 데이터 인프라야. RAG 프로토타입이나 코드 검색, 문서 검색처럼 벡터 검색을 빨리 붙여 볼 때 자주 등장해.

도구 1회 언급

codex -m gpt-5.4-mini (코덱스 5.4 미니 선택 명령)

이 표기는 Codex CLI에서 gpt-5.4-mini를 골라 새 코딩 세션을 시작하는 모델 선택 옵션이야. 빠른 보조 작업과 하위 에이전트에 맞는지, GPT-5.5나 GPT-5.4가 필요한지 나눠 봐야 해.

도구 1회 언급

Continue(컨티뉴)

Continue는 IDE 보조 경험과 저장소용 AI 체크 흐름을 함께 제공하는 오픈소스 코딩 도구 계열이야.

도구 1회 언급

LM Studio(엘엠 스튜디오)

LM Studio는 PC에서 로컬 LLM을 내려받아 실행하고 API처럼 열어 볼 수 있게 해 주는 데스크톱 앱이야.

도구 1회 언급

OpenRouter(오픈라우터)

OpenRouter는 여러 AI 모델 회사를 한 API 창구로 묶어 주는 라우팅 서비스야.

도구 1회 언급

Supabase(수파베이스)

Supabase(수파베이스)는 Postgres를 중심에 두고 인증, 스토리지, 실시간 기능까지 묶어 주는 백엔드 플랫폼이야. 앱 뒷단을 빨리 세우고 싶은 팀이 데이터 구조는 SQL답게 가져가고 싶을 때 특히 잘 맞아.

도구 1회 언급

vLLM(브이엘엘엠)

vLLM은 이미 있는 대규모 언어 모델을 빠르게 돌리고 서비스하기 위한 추론 엔진이자 서빙 계층이야. 모델 자체보다 운영 구조를 바꾸는 런타임 선택지에 더 가까운 편이야.

도구 1회 언급

Anthropic API(앤트로픽 API)

Anthropic API는 Claude를 제품 안에 붙일 때 생기는 호출 방식과 운영 책임을 가르는 개발 접점이야. 단순한 브랜드 이름이 아니라, 대화 상태와 도구 실행, 비용 추적을 서비스 코드가 어디까지 맡을지 정하는 기준이 돼.

도구

Claude Cowork(클로드 코워크)

Claude Cowork는 Claude Desktop에서 파일, 앱, 브라우저를 실제로 다루며 지식 업무를 끝까지 처리하는 에이전트형 작업 도구야.

도구

ComfyUI(컴피유아이)

ComfyUI(컴피유아이)는 이미지나 비디오 생성 파이프라인을 노드 그래프로 조립해서 실행하는 시각적 워크플로 도구야. 버튼 몇 개로 끝나는 생성 UI보다 과정 자체를 설계하고 다시 재현하고 싶은 사람한테 더 잘 맞아.

도구

FAISS (페이스)

FAISS는 Meta가 만드는 dense vector 유사도 검색 라이브러리야. 완성형 벡터 데이터베이스라기보다, 벡터 인덱스를 만들고 nearest neighbor 검색을 빠르게 돌리는 저수준 엔진 쪽에 더 가깝지.

도구

Google AI Studio(구글 AI 스튜디오)

Google AI Studio(구글 AI 스튜디오)는 Gemini를 브라우저에서 시험해 보고, 괜찮은 프롬프트를 바로 코드 호출로 이어 보는 실험 공간이야.

도구

Google DeepMind (구글 딥마인드)

Google DeepMind는 Gemini 같은 모델 하나의 이름이 아니라, 구글 안에서 AI 연구와 모델 개발을 이끄는 조직 이름이야. 기사나 문서에서 이 이름이 나오면 개별 모델 성능보다 연구 방향, 제품 묶음, 회사 전략을 함께 읽어야 할 때가 많아.

도구

MLflow(엠엘플로우)

MLflow는 실험 기록, 모델 버전, 평가 결과, 추적 데이터를 한 흐름으로 묶어 주는 오픈소스 AI 엔지니어링 플랫폼이야. 예전엔 실험 추적 도구 이미지가 강했지만 지금은 LLM과 에이전트 평가, 모니터링 쪽까지 범위를 넓히고 있어.

도구

n8n(엔에잇엔)

n8n은 앱, API, AI 단계를 노드로 엮어 반복 업무를 자동화하는 워크플로 도구야.

도구

OpenAI API(오픈에이아이 API)

OpenAI API는 OpenAI 플랫폼의 모델과 기능을 코드로 호출해 네 서비스 안에 붙이는 개발 인터페이스야. 모델 이름 하나가 아니라 인증, 호출 방식, 비용 통제, 장애 대응까지 묶인 운영 경계에 더 가까워.

도구

Pinecone (파인콘)

Pinecone은 임베딩을 저장하고 비슷한 항목을 빠르게 찾아주는 관리형 벡터 데이터베이스 서비스야. RAG나 시맨틱 검색을 붙일 때 직접 인프라를 짜지 않고 시작하기 좋다는 뜻으로 자주 언급돼.

도구

Qdrant (큐드런트)

Qdrant는 임베딩을 넣어 두는 단순 보관함이 아니라, 벡터 검색을 실제 서비스로 돌리기 위한 검색 엔진이자 데이터베이스야. 필터링, 하이브리드 검색, 운영 배포 선택지까지 포함한 retrieval 인프라로 이해하면 맞아.

도구

Replicate(레플리케이트)

Replicate는 오픈소스 AI 모델을 클라우드에서 실행하고 API로 불러 쓰게 해 주는 서비스야. 직접 GPU 서버를 꾸리지 않고도 이미지, 음성, 비전, 언어 모델을 빠르게 붙여 볼 때 많이 써.

도구

SGLang(에스지랭)

SGLang은 LLM과 멀티모달 모델을 낮은 지연과 높은 처리량으로 서빙하려고 만든 추론 프레임워크야. 이름만 보면 언어 도구 같지만 실제로는 GPU 자원을 더 효율적으로 쓰게 해 주는 서버 쪽 소프트웨어에 더 가까워.

도구

Tokenizer(토크나이저)

Tokenizer는 텍스트를 토큰으로 쪼개고 숫자 ID로 바꾸는 규칙과 도구를 말해.

도구

Triton Inference Server(트리톤 추론 서버)

Triton Inference Server는 여러 프레임워크로 만든 모델을 공통된 서버 형태로 배포하게 해 주는 추론 서버야. 모델을 하나 더 만드는 도구가 아니라, 이미 만든 모델을 운영 환경에서 안정적으로 서빙하는 계층이야.

도구

Vector Database (벡터 데이터베이스)

Vector Database는 문장, 이미지, 코드 같은 데이터를 임베딩 벡터로 저장하고, 입력과 의미상 가까운 항목을 빠르게 찾아주는 검색 중심 저장소야. RAG에서는 문서 조각을 넣어 두고 질문과 관련 있는 내용을 꺼내 오는 핵심 계층으로 많이 쓰여.

도구

Weaviate(위비에이트)

Weaviate(위비에이트)는 벡터와 원본 데이터를 함께 저장하면서 의미 검색을 해 주는 오픈소스 벡터 데이터베이스야. RAG나 추천, 검색 보강처럼 retrieval 품질이 중요한 앱에서 검색 계층 자체를 설계할 때 많이 거론돼.

도구

Weights & Biases(웨이츠 앤 바이어시스)

Weights & Biases는 모델 실험 로그와 평가 결과, 산출물을 한곳에 모아 비교하게 해 주는 AI 개발 플랫폼이야. 모델을 직접 학습시키는 엔진이라기보다 실험 기록과 협업 흐름을 붙잡아 두는 쪽에 더 가까워.

도구

Windsurf(윈드서프)

Windsurf는 AI를 편집기 한가운데에 넣어서 코딩 흐름을 이어 주려는 IDE 계열 도구야.

도구