AMD ROCm, CUDA의 아성에 도전하다 — 지금 어디까지 왔을까?
## GPU 컴퓨팅의 절대 강자, CUDA AI와 딥러닝이 폭발적으로 성장하면서, GPU를 활용한 병렬 컴퓨팅은 이제 선택이 아니라 필수가 됐어요. 그런데 이 분야에서 NVIDIA의 CUDA는 거의 독점적인 위치를 차지하고 있거든요. CUDA가 뭐냐...
프론티어 모델의 시대는 끝나가고 있는 걸까? AI 발전 속도에 대한 냉정한 시선
## 계속 빨라지기만 할 줄 알았는데 GPT-3가 나왔을 때 세상이 놀랐고, GPT-4가 나왔을 때 또 한번 놀랐죠. 그래서 많은 사람들이 이 속도로 계속 가면 GPT-5, GPT-6은 얼마나 대단할까 기대했어요. 그런데 최근 들어 업계 안팎에서 조...
Anthropic, 프롬프트 캐시 TTL을 1시간에서 5분으로 조용히 축소 — API 비용에 미치는 영향은?
## 무슨 일이 있었나요? Claude API를 사용하는 개발자들에게 꽤 중요한 변경사항이 하나 발견됐어요. Anthropic이 지난 3월 6일에 **프롬프트 캐시(Prompt Cache)의 TTL(Time To Live)을 기존 1시간에서 5분...
Marimo Pair: AI 에이전트가 리액티브 노트북 안에서 직접 코드를 짜주는 세상
## 노트북 환경이 에이전트의 작업 공간이 된다면? 요즘 AI 코딩 에이전트 이야기가 끊이지 않죠. Cursor, Copilot, Devin 등 다양한 도구들이 나오고 있는데요, 대부분은 IDE나 터미널 환경에서 동작해요. 그런데 데이터 분석이나...
테크 뉴스를 읽는 당신,
직접 만들어볼 준비 되셨나요?
17가지 수익 모델 실습 · 144+ 강의 · 자동화 소스코드 제공
AI 코딩 에이전트, 코드 치기 전에 논문부터 읽히면 어떻게 될까?
## 코딩 에이전트의 한계, 느끼고 계시죠? 요즘 AI 코딩 에이전트가 정말 많아졌어요. Cursor, Copilot, Claude Code 같은 도구들이 코드를 대신 짜주고, 버그도 잡아주고, 리팩토링도 해주죠. 근데 쓰다 보면 한 가지 답답한...
KL 발산이 도대체 뭔데? 직관적으로 이해하는 6.5가지 방법
## 머신러닝 하다 보면 꼭 만나는 그 녀석 머신러닝을 공부하다 보면 손실 함수(loss function) 이야기가 빠지지 않잖아요. 그중에서도 **KL 발산(Kullback-Leibler Divergence)**이라는 개념은 정말 여기저기서 등...
ML의 미래는 '기묘함' 그 자체 — AI가 만드는 세상은 왜 이상해질 수밖에 없는가
## 무슨 이야기인가요? 분산 시스템 전문가로 유명한 **Kyle Kingsbury**(Aphyr)가 머신러닝과 AI의 미래에 대해 꽤 도발적인 글을 썼어요. 그의 핵심 주장은 이래요 — ML 시스템이 우리 생활 곳곳에 스며들수록, 세상은 점점 더 ...
178개 AI 모델의 '글쓰기 지문'을 분석했더니, 놀라운 유사성 지도가 나왔다
## AI 모델도 필체가 있다? 사람마다 글쓰기 스타일이 다르듯, AI 모델에도 고유한 '문체 지문'이 있다는 사실을 아시나요? rival.tips라는 리서치 팀이 무려 178개의 AI 모델을 대상으로 글쓰기 스타일을 분석하고, 서로 얼마나 비슷한지...
GPU 한 장으로 1000억 파라미터 LLM을 풀 정밀도 학습한다고? — MegaTrain 논문 해설
## GPU 한 장으로 초거대 모델을 학습시킨다? 대규모 언어 모델(LLM)을 학습시키려면 보통 수십~수백 대의 GPU가 필요해요. GPT-3 급(1750억 파라미터) 모델을 학습하려면 수천 개의 A100 GPU를 몇 달간 돌려야 하는 수준이죠....
256바이트로 보스전을 만들었다 — 극한의 사이즈코딩 세계
## 256바이트, 진짜 이게 전부 프로그래밍을 하다 보면 최적화에 대해 생각하게 되잖아요. 번들 사이즈를 줄이고, 메모리를 아끼고, 응답 속도를 높이고. 그런데 이걸 극단까지 밀어붙인 사람들이 있어요. 단 **256바이트** — 그러니까 영문 ...
2019년 "GPT-2는 너무 위험해서 공개 못 한다"던 OpenAI, 그 후 7년이 지났다
## 되돌아보는 AI 역사의 한 장면 2019년 2월, OpenAI가 흥미로운 발표를 했어요. 자신들이 만든 텍스트 생성 AI 모델 **GPT-2**가 "너무 위험해서" 전체 모델을 공개할 수 없다는 거였죠. 당시 GPT-2는 15억 개의 파라미...
AI 시대에 '안목'이 더 중요해진 이유 — 코드를 잘 짜는 것만으로는 부족해요
## 누구나 코드를 생성할 수 있는 시대가 왔어요 ChatGPT, Claude, Copilot 같은 AI 도구들이 코드를 뚝딱 만들어주는 시대가 됐잖아요. 이제 프롬프트 몇 줄이면 웬만한 함수는 바로 나오고, 심지어 전체 앱 구조까지 잡아주기도 ...
AI로 1만 장의 역사 사진을 지도 위에 되살리다 — OldNYC 프로젝트 이야기
## 오래된 사진 수만 장, 지도 위에 올리는 프로젝트가 있어요 OldNYC라는 프로젝트를 들어보신 적 있나요? 뉴욕 공공도서관(NYPL)이 소장하고 있는 수십 년 전 뉴욕 거리 사진들을 디지털화해서 지도 위에 핀으로 찍어주는 웹사이트인데요. 사...
Google, AI 에이전트 오케스트레이션 테스트베드 'Scion' 오픈소스로 공개
## AI 에이전트가 여러 개 동시에 일하려면? AI 에이전트 하나가 똑똑한 건 이제 놀랍지 않은 시대가 됐어요. 진짜 어려운 건 여러 에이전트를 동시에 돌리면서 서로 협력하게 만드는 거예요. 이메일 처리하는 에이전트, 일정 잡는 에이전트, 코드...
맥북에서 Gemma 4 멀티모달 모델을 파인튜닝하자 — Apple Silicon 전용 도구 등장
## 맥북으로 멀티모달 AI를 파인튜닝할 수 있게 됐어요 오픈소스 프로젝트 **Gemma 4 Multimodal Fine-Tuner**가 GitHub에 공개됐어요. 이름에서 알 수 있듯이, Google의 오픈소스 모델인 **Gemma 4의 멀티모...
중국 Zhipu AI의 GLM-5.1 — '긴 호흡의 작업'을 해내는 AI 에이전트를 향해
## Zhipu AI가 GLM-5.1을 공개했어요 중국의 AI 기업 **Zhipu AI**(智谱AI)가 자사 대규모 언어모델의 최신 버전인 **GLM-5.1**을 발표했어요. 이번 모델의 부제가 "Towards Long-Horizon Tasks", ...
GPU의 역사를 한눈에: 성능을 바꿔온 그래픽카드들을 데이터로 살펴보기
## 왜 지금 GPU 역사를 돌아봐야 할까요? 요즘 개발자라면 GPU라는 단어를 매일 접하게 되죠. AI 모델 훈련, 추론, 심지어 데이터베이스 가속까지 — GPU가 안 쓰이는 곳을 찾기가 더 어려운 시대예요. 그런데 이 GPU라는 물건이 어떻게...
샘 올트먼과 OpenAI — AI 시대의 권력 집중, 우리는 어디까지 신뢰할 수 있을까
## 한 사람의 손에 쥐어진 AI의 미래 뉴요커(The New Yorker)가 OpenAI CEO 샘 올트먼에 대한 심층 프로필 기사를 내놨어요. 제목부터 강렬한데요 — "샘 올트먼이 우리의 미래를 통제할 수도 있다. 그를 신뢰할 수 있는가?"라...
AI 에이전트에 '해마'를 달아주면? 생물학에서 영감 받은 메모리 시스템 Hippo
## 왜 AI 에이전트에게 기억력이 중요할까 AI 에이전트를 써본 분이라면 한 번쯤 이런 답답함을 느껴봤을 거예요. 분명 10분 전에 알려줬는데 또 같은 질문을 하고, 어제 나눈 대화 맥락은 까맣게 잊어버리는 거죠. 지금의 LLM 기반 에이전트 ...
Anthropic, Google·Broadcom과 손잡고 차세대 AI 컴퓨팅 인프라 구축에 나서다
## 무슨 일이 있었나요? AI 모델을 만드는 회사 Anthropic이 Google, 그리고 반도체 설계 전문 기업 Broadcom과 파트너십을 확대한다고 발표했어요. 핵심은 "차세대 컴퓨팅 인프라"를 함께 만들겠다는 건데요, 쉽게 말하면 AI ...