엔비디아 천하에서 Groq는 어떻게 계속 투자금을 끌어모을까 — 추론 전용칩 LPU 이야기
## AI 칩 = 엔비디아? 그 공식에 도전하는 회사 요즘 AI 얘기 나오면 칩은 무조건 엔비디아(NVIDIA) GPU잖아요. 학습이든 추론이든 다 엔비디아로 돌리는 게 거의 기본값이 됐죠. 그런데 여기에 정면으로 다른 길을 파고드는 회사가 있어...
마이크로소프트가 만드는 맥북 프로의 대항마, 엔비디아 GPU 품은 Surface Laptop Ultra
## 무슨 소식이냐면요 마이크로소프트가 Surface Laptop Ultra라는 새로운 노트북을 준비하고 있다는 이야기가 나왔어요. 핵심은 두 가지예요. 첫째, 이 노트북이 그동안 마이크로소프트가 "애플 맥북 프로를 정조준한 제품"으로는 처음으로...
Anthropic, SEC에 비공개 S-1 제출... 클로드 만든 회사의 상장이 다가오고 있어요
## 무슨 소식이냐면요 Claude(클로드)를 만든 회사 Anthropic이 미국 증권거래위원회(SEC)에 S-1 초안을 비공개로 제출했다고 공식 발표했어요. S-1이 뭐냐면, 미국에서 회사가 주식 시장에 상장하려고 할 때 제출해야 하는 등록 서...
엔비디아 RTX Spark, 책상 위에 올려놓는 AI 슈퍼컴퓨터의 시대가 열렸어요
## 무슨 일이 있었냐면요 엔비디아가 RTX Spark라는 작은 데스크톱 컴퓨터를 발표했어요. 그런데 이게 그냥 평범한 PC가 아니에요. 한 손에 들어올 정도로 작은 크기인데, 내부에는 그레이스 블랙웰(Grace Blackwell) 아키텍처 기반...
테크 뉴스를 읽는 당신,
직접 만들어볼 준비 되셨나요?
17가지 수익 모델 실습 · 144+ 강의 · 자동화 소스코드 제공
[심층분석] 터미널을 떠나 브라우저로: Hermes WebUI가 보여주는 자율 AI 에이전트의 새로운 사용 경험
## 서버에서 혼자 자라는 AI 에이전트, 이제 휴대폰으로도 만난다 요즘 개발자 커뮤니티를 둘러보면 'AI 에이전트(Agent)'라는 말이 정말 자주 등장하는데요. 이게 뭐냐면, 그냥 챗봇처럼 한 번 질문하고 한 번 답 받고 끝나는 게 아니라, ...
엔비디아 코스모스 3, '물리 AI'를 위한 월드 모델이 한 단계 더 진화했어요
## 로봇과 자율주행이 진짜 똑똑해지려면 필요한 것 요즘 AI 하면 챗GPT 같은 텍스트 모델이 가장 먼저 떠오르잖아요. 그런데 로봇이나 자율주행차처럼 실제 세계에서 움직이는 기계들한테는 또 다른 종류의 AI가 필요해요. 바로 "물리 AI(Physi...
스탠퍼드 CS336 - 언어 모델을 밑바닥부터 직접 만들어보는 강의
## LLM을 "쓰는" 시대에서 "만드는" 법을 배우는 시대로 ChatGPT, Claude, Gemini 같은 거대 언어 모델(LLM)을 쓰는 건 이제 누구나 할 수 있는 일이 됐어요. API 키 발급받고 `openai.chat.completio...
10년된 제온으로 충분하다 - 2016년 서버에서 Gemma 모델 돌리기
## H100 없어도 AI 할 수 있다는 이야기 요즘 AI 관련 기사를 보면 항상 "H100 GPU 수만 장 확보", "엔비디아 시가총액 3조 달러 돌파" 같은 어마어마한 숫자가 나와요. 그러다 보니 많은 개발자들이 "AI는 빅테크만 할 수 있는 영...
AI는 데이터만의 문제가 아니다, '포스트 트레이닝'이 진짜 본체다
## AI를 이해하려면 '데이터'에서 한 발 더 들어가야 해요 요즘 AI 윤리나 저작권 이야기를 들어보면 대부분 "AI는 데이터의 산물이다"라는 전제에서 출발해요. 어떤 데이터를 학습했느냐, 그 데이터가 정당하게 수집됐느냐, 편향은 없느냐 같은 ...
내 컴퓨터에서 돌아가는 AI 작업공간, Odysseus를 살펴봤어요
## 'AI 작업공간'을 내 손에 들이는 시대 ChatGPT, Claude, Gemini 같은 클라우드 AI 서비스를 쓰다 보면 한 번쯤은 이런 고민을 해보셨을 거예요. "내가 입력한 코드나 문서가 정말 안전하게 처리될까?", "인터넷이 끊기면 ...
1비트로 압축한 4B 이미지 생성 모델, 이젠 폰에서도 그림을 그린다
## 무슨 일이냐면 PrismML이라는 곳에서 "Bonsai Image 4B"라는 재밌는 모델을 공개했어요. 이름이 좀 특이하죠? **Bonsai(분재)**처럼 작게 다듬었다는 의미예요. 40억 개(4 Billion)의 파라미터를 가진 이미지 생...
그림으로 시작하는 미분기하학, 개발자가 수학을 다시 잡아야 하는 이유
## 갑자기 웬 미분기하학? 2017년에 arXiv에 올라온 "A pictorial introduction to differential geometry"라는 논문이 다시 회자되고 있어요. 제목 그대로 미분기하학(differential geomet...
사막 한가운데서 조개껍데기를 찾다 — 사우디 데이터센터에서 AI 학습이 멈춘 사연
## 사막에서 조개를 찾았다는 게 무슨 말이냐면 제목만 보면 무슨 시 같지만, 이건 한 엔지니어가 사우디아라비아 사막 한가운데에 있는 데이터센터에서 대규모 AI 학습 잡(job)을 돌리다가, 어느 날 GPU가 갑자기 모자라기 시작한 미스터리를 추...
30만 원으로 데이터센터 GPU를 게이밍 PC에 박았다, V100으로 로컬 LLM 돌리기 도전기
## 중고 시장에 풀린 '왕년의 슈퍼카' GPU 혹시 Nvidia V100이라는 GPU 들어보셨나요? 2017년에 발표된 당시 최고급 데이터센터용 GPU예요. 출시 당시엔 한 장에 1만 달러를 호가했고, 전 세계의 슈퍼컴퓨터와 AI 연구소를 채웠...
Cloudflare Turnstile가 WebGL을 강제하기 시작했다, 프라이버시는 어디로 가는가
## CAPTCHA의 진화, 그런데 부작용이 있어요 웹사이트 들어갈 때 '나는 로봇이 아닙니다' 체크박스 누르신 적 있죠? 요즘은 그것조차 안 누르고 그냥 잠깐 동그라미 돌면서 통과되는 경우도 많아졌어요. 그 뒤에 있는 기술 중 하나가 바로 **...
AI 시대에 진짜 해자는 결국 "도메인 지식"이었다는 이야기
## AI가 모든 걸 평준화한다는 착각 요즘 개발 업계에서 가장 자주 들리는 이야기가 "AI 때문에 코딩의 진입 장벽이 사라진다"는 거예요. ChatGPT나 Claude, Cursor 같은 도구들이 코드를 술술 써주니까, 기술 자체의 차별성이 점점 ...
뉴런 두 개로 자전거를 탈 수 있다? 신경망의 최소 단위를 탐구한 흥미로운 연구
## 사람도 어려운 자전거 타기를 인공 뉴런 두 개로 자전거 타기, 생각보다 어려운 운동이에요. 균형을 잡으면서 페달을 밟고 핸들 방향을 미세하게 조정해야 하는 복합적인 작업이거든요. 사람도 처음 배울 땐 며칠씩 넘어지면서 익히죠. 그런데 최근 ...
EY 캐나다 보고서에 가짜 인용 가득 - 컨설팅 회사도 AI 환각에 무너지다
## 4대 회계법인의 보고서에서 발견된 "존재하지 않는 출처" EY(Ernst & Young) 캐나다가 최근 발표한 사이버보안 보고서가 인터넷에서 큰 논란을 만들고 있어요. 문제는 보고서의 내용이 아니라 출처거든요. 보고서에 인용된 참고문헌과 통...
OpenRouter, 1억 1300만 달러 시리즈B 유치 — LLM API의 '환승역'이 거대해지고 있다
## 무슨 일이 있었나요 LLM API의 '통합 라우터' 역할을 하는 **OpenRouter**가 시리즈B 라운드에서 1억 1300만 달러(한화 약 1500억 원)를 투자받았다는 소식이 들려왔어요. AI 분야 투자 자체야 워낙 많지만, OpenR...
[심층분석] 토크나이저 없이 30개 언어를 말하는 AI - VoxCPM2가 TTS 판을 흔드는 이유
## 음성 합성, 드디어 '말맛'을 잡기 시작했어요 혹시 요즘 유튜브나 쇼츠에서 "이거 진짜 사람 목소리 아니야?" 싶은 AI 내레이션 들어보신 적 있나요? 불과 2~3년 전만 해도 AI 음성은 어딘가 어색했어요. 말끝이 뚝뚝 끊기거나, 감정이 ...