Gemma 4를 내 컴퓨터에서 돌리고 Claude Code와 연결하기: LM Studio 헤드리스 CLI 활용법
## 로컬 LLM, 이제 터미널에서 바로 띄운다 구글이 최근 공개한 **Gemma 4**를 내 컴퓨터에서 직접 돌려보고 싶다면, 이제 꽤 편한 방법이 생겼어요. LM Studio가 새로 추가한 **헤드리스(headless) CLI** 기능을 사용...
LLM이 도대체 어떻게 작동하는 걸까? 직접 만들어보면 이해돼요 — GuppyLM 프로젝트
## GPT, Claude, Gemini… 다들 쓰는데, 원리는 알고 계신가요? 요즘 개발하면서 LLM(대규모 언어 모델)을 안 쓰는 사람이 거의 없죠. 코드 자동완성, 챗봇, 문서 요약까지. 그런데 막상 "LLM이 어떻게 동작해?"라고 물으면,...
8년간 만들고 싶었던 걸 AI와 함께 3개월 만에 완성한 이야기
## 혼자서는 엄두가 안 났던 프로젝트, AI가 판을 바꿨어요 Lalit Maganti라는 개발자가 아주 흥미로운 경험담을 공유했어요. 8년 동안 머릿속에만 있던 프로젝트를 AI 코딩 도구의 도움을 받아 단 3개월 만에 완성했다는 이야기인데요. 그 ...
LLM한테 "원시인처럼 말해"라고 시키면 토큰을 아낄 수 있다고?
## 이게 대체 무슨 프로젝트인가요 "Talk like caveman"이라는 이름의 GitHub 프로젝트가 등장했어요. 이름만 보면 장난 같지만, 실제로 담고 있는 아이디어는 꽤 흥미로워요. 핵심은 이거예요: LLM(대규모 언어 모델)에게 응답을...
테크 뉴스를 읽는 당신,
직접 만들어볼 준비 되셨나요?
17가지 수익 모델 실습 · 144+ 강의 · 자동화 소스코드 제공
Claude 에이전트 100개를 동시에 돌려서 테스트한다면? Imbue의 대규모 AI 에이전트 병렬 테스트 사례
## AI 에이전트가 실무에 들어오면 테스트는 어떻게 해야 할까요? AI 에이전트를 실제 업무에 투입하는 회사가 점점 늘고 있어요. 코드 리뷰, 버그 수정, PR 생성 같은 작업을 AI가 알아서 처리하게 만드는 거죠. 그런데 여기서 한 가지 큰 ...
GPU 한 대를 여러 개발자가 나눠 쓴다 — sllm으로 LLM 추론 비용 줄이기
## GPU 비용, 개발자의 영원한 고민 LLM(대규모 언어 모델)을 다뤄본 분이라면 공감하실 텐데요, GPU 비용이 정말 어마어마해요. OpenAI나 Anthropic의 API를 쓰면 토큰당 과금이 되니까 프로토타이핑할 때는 괜찮지만, 본격적으로 ...
AI 코딩 에이전트는 어떻게 만들어질까? 핵심 구성 요소 완전 해부
요즘 Cursor, GitHub Copilot, Claude Code 같은 AI 코딩 도구를 써보신 분 많으시죠? 코드를 짜달라고 하면 알아서 파일을 읽고, 수정하고, 심지어 터미널 명령어까지 실행하는 모습을 보면 "이거 어떻게 만든 거지?" 하는...
Claude Code가 리눅스 커널에 숨어있던 23년 된 취약점을 찾아냈다
## AI가 사람 대신 보안 취약점을 찾는 시대 리눅스 커널에 23년 동안 숨어있던 보안 취약점을 AI 코딩 도구가 발견했다는 소식이 전해졌어요. Anthropic의 AI 코딩 에이전트인 Claude Code를 활용해 코드를 분석하던 중, 수십 ...
코드 생성 AI, 스스로를 가르치면 더 똑똑해진다 — Self-Distillation 기법 해부
## 무슨 일이 있었나요? 코드를 생성하는 AI 모델을 더 잘 만들려면 보통 어떻게 할까요? 더 큰 모델을 쓰거나, 더 많은 데이터로 학습시키거나, 사람이 직접 피드백을 주는 RLHF 같은 복잡한 파이프라인을 돌리는 게 일반적이에요. 그런데 최근...
LLM도 감정을 '이해'할까? Anthropic이 밝혀낸 대형 언어 모델 속 감정 개념의 작동 원리
## 기계가 감정을 느끼는 건 아니지만, 뭔가 흥미로운 일이 벌어지고 있어요 Anthropic이 대형 언어 모델(LLM) 내부에서 감정 개념이 어떻게 표현되고 기능하는지를 분석한 연구를 공개했어요. 우리가 ChatGPT나 Claude 같은 AI에...
RAG를 버리고 가상 파일시스템을 도입했더니 AI 문서 어시스턴트가 완전히 달라졌다
## AI가 문서를 이해하는 방식, 근본부터 다시 생각하다 AI 기반 문서 어시스턴트를 만들어본 분이라면 RAG(Retrieval-Augmented Generation)라는 개념을 한 번쯤 들어보셨을 거예요. RAG는 쉽게 말하면 "AI가 대답하...
AI 코딩 도구로 API 연동 100개를 만들어보니 — Nango 팀이 배운 것들
## API 연동, 여전히 귀찮은 일이죠 API 연동이라는 게 겉보기엔 단순해 보여요. 문서 읽고, 엔드포인트 호출하고, 응답 파싱하면 끝이잖아요? 그런데 실제로 해보면 얘기가 달라지거든요. 인증 방식이 서비스마다 다르고, 페이지네이션(결과를 여...
Apfel: 맥에 이미 깔려 있는 AI를 꺼내 쓰는 무료 앱
## 내 맥 안에 잠자고 있는 AI가 있다? 혹시 알고 계셨나요? 여러분의 Mac에는 이미 꽤 괜찮은 AI 모델이 내장되어 있어요. Apple이 macOS에 탑재한 온디바이스 머신러닝 모델들이 있는데, 보통은 Siri나 시스템 기능 뒤에서 조용히...
Mac mini 하나로 Gemma 4 26B 로컬 AI 돌리기: Ollama 셋업 가이드
## 내 맥 미니에서 26B 파라미터 모델을 돌린다고? 요즘 AI 모델을 직접 내 컴퓨터에서 돌려보고 싶다는 분들이 정말 많아졌어요. ChatGPT나 Claude 같은 클라우드 서비스도 좋지만, 매달 구독료가 나가고, 내 데이터가 외부 서버를 거...
ctx: Rust로 만든 에이전틱 개발 환경(ADE), 코딩 에이전트의 다음 단계일까?
## AI 코딩 도구, 이제 '자율 에이전트'로 진화하고 있어요 요즘 개발할 때 AI 도움 안 받는 분 계신가요? GitHub Copilot이 코드 자동완성을 대중화한 이후로, Cursor, Windsurf, Claude Code 같은 도구들이 ...
AI 시대, 프로그래밍의 시작점이 바뀌고 있다
## 우리가 알던 프로그래밍이 달라지고 있어요 "프로그래밍"이라고 하면 뭐가 떠오르시나요? 빈 에디터를 열고, 한 줄 한 줄 코드를 타이핑하는 모습? 그런데 최근 몇 년 사이에 이 풍경이 빠르게 바뀌고 있어요. AI 코딩 어시스턴트가 등장하면서,...
Cursor 3 출시 — AI 코딩 에디터, 에이전트 중심으로 완전히 탈바꿈하다
## 무슨 일이 있었나요? AI 코딩 에디터로 개발자들 사이에서 폭발적인 인기를 끌고 있는 **Cursor**가 메이저 업데이트인 **Cursor 3**를 발표했어요. 이번 업데이트는 단순한 기능 추가가 아니라, 에디터의 핵심 철학 자체를 "AI...
Qwen3.6-Plus 공개 — 중국발 AI 에이전트 시대가 한 발짝 더 가까워졌어요
## 알리바바가 또 한 수를 던졌어요 알리바바 클라우드의 AI 연구팀이 Qwen(통의천문) 시리즈의 최신 모델인 Qwen3.6-Plus를 공개했어요. 이번 모델의 부제가 "Towards Real World Agents"인데요, 이름에서 알 수 있듯이...
AI가 체스를 정복했다고요? 인간 그랜드마스터들은 '예측불가능'이라는 무기를 꺼내 들었습니다
## 체스, 이미 끝난 게임이 아니었나요? 2017년 알파제로(AlphaZero)가 세계 최강 체스 엔진 스톡피시를 압도적으로 꺾었을 때, 많은 사람들이 "체스는 이제 AI가 풀어버린 게임"이라고 생각했어요. 실제로 요즘 체스 엔진의 실력은 인간 세...
StepFun 3.5 Flash: 비용 대비 성능 1위를 차지한 중국발 AI 모델의 등장
## 비용 대비 성능이라는 새로운 경쟁 기준 AI 모델을 고를 때 "어떤 모델이 가장 똑똑한가"만 따지던 시대는 지나가고 있어요. 이제는 **"같은 돈을 쓸 때 어떤 모델이 가장 좋은 결과를 내는가"**가 실무에서 훨씬 중요한 질문이 되고 있거든...