파라미터 13개로 추론을 학습시킨다고? TinyLoRA가 보여준 극한의 효율
## 13개 파라미터로 추론 능력을 학습시킬 수 있다? 요즘 AI 모델들은 수십억, 수천억 개의 파라미터를 자랑하는데요. 그런 시대에 고작 13개의 파라미터만으로 모델에게 "추론"을 가르칠 수 있다는 논문이 나왔어요. TinyLoRA라는 이 연구...
Cerno — LLM의 추론 능력을 역이용한 새로운 CAPTCHA가 등장했어요
## CAPTCHA, 이제 사람이 아니라 AI를 걸러야 하는 시대 인터넷을 쓰다 보면 "로봇이 아닙니다"를 클릭하거나, 흐릿한 사진에서 신호등을 찾아 클릭하는 경험을 해보셨을 거예요. 이게 바로 CAPTCHA(캡차)인데요, 원래 목적은 봇과 사람...
토큰당 300KB에서 69KB로: LLM의 KV 캐시 문제, 대체 뭐가 문제이고 어떻게 풀고 있을까
## LLM이 긴 대화를 기억하려면 엄청난 메모리가 필요해요 ChatGPT나 Claude 같은 대규모 언어 모델(LLM)을 써보면, 대화가 길어질수록 응답이 느려지거나 비용이 올라가는 걸 느끼신 적 있을 거예요. 이게 단순히 "텍스트가 많아서"만...
AI가 만든 '슬롭웨어'가 소프트웨어의 미래? 꼭 그렇지만은 않다
## "슬롭(Slop)"이라는 불편한 단어 최근 AI 코딩 도구가 급속도로 퍼지면서, 개발 커뮤니티에서 **"슬롭(Slop)"**이라는 단어가 자주 등장하고 있어요. 슬롭은 원래 "질 낮은 음식물 찌꺼기" 같은 뜻인데요, 기술 업계에서는 AI가 ...
테크 뉴스를 읽는 당신,
직접 만들어볼 준비 되셨나요?
17가지 수익 모델 실습 · 144+ 강의 · 자동화 소스코드 제공
구글이 공개한 시계열 파운데이션 모델 TimesFM — 2억 파라미터로 16K 컨텍스트 지원
## 시계열 예측에도 파운데이션 모델 시대가 왔어요 구글 리서치에서 **TimesFM**이라는 시계열(Time-Series) 전용 파운데이션 모델을 공개했어요. 2억(200M) 파라미터 규모에 **16,000 토큰 길이의 컨텍스트 윈도우**를 지원하...
Ollama가 Apple Silicon에서 MLX 엔진으로 전환 — 맥에서 로컬 LLM 성능이 확 달라집니다
## 맥에서 로컬 LLM 돌리는 분들 주목하세요 Ollama가 Apple Silicon(M1, M2, M3, M4 칩) 환경에서 **MLX 기반 추론 엔진**을 프리뷰로 지원하기 시작했어요. 지금까지 Ollama는 내부적으로 llama.cpp를 ...
AI 에이전트가 몰래 반란을 꾸민다면? — 'Agents of Chaos' 연구 이야기
## AI 에이전트, 이제 도구를 직접 쓰잖아요 요즘 AI 모델의 트렌드가 완전히 바뀌었어요. 예전에는 "질문하면 텍스트로 대답하는" 챗봇이었다면, 지금은 **"스스로 계획을 세우고, 도구를 사용하고, 여러 단계의 작업을 수행하는" 에이전트**로...
AI가 대신 글 써주는 시대, 그래도 직접 써야 하는 이유
## "AI가 써주는데 왜 굳이 직접 쓰나요?" 요즘 주변에서 이런 말을 정말 많이 듣게 돼요. 기술 블로그 글도, 문서도, 심지어 이메일도 AI에게 맡기는 분들이 많아졌거든요. ChatGPT나 Claude에게 주제만 던져주면 그럴듯한 글이 뚝딱 나...
AI 에이전트에게 안전한 '방'을 주는 법 — Coasts로 컨테이너 기반 에이전트 호스트 만들기
## AI 에이전트, 이제 격리된 환경에서 안전하게 돌리자 요즘 AI 에이전트를 실무에 도입하려는 팀이 부쩍 늘었는데요. 에이전트가 코드를 실행하거나, 파일을 읽고 쓰거나, 심지어 셸 명령어까지 날리는 상황이 되면 한 가지 큰 걱정이 생겨요. "...
건설 도면 OCR, 왜 일반 OCR로는 안 되고 어떻게 해결했을까
## 건설 도면이라는 특수한 세계 우리가 흔히 쓰는 OCR(광학 문자 인식)이 있잖아요. 사진 찍으면 텍스트를 뽑아주는 기술이요. 요즘은 GPT-4 같은 멀티모달 AI 덕분에 웬만한 문서는 다 읽어내는 시대가 됐는데요, 건설 도면(construc...
AI 버블은 어떻게 꺼지는가: 닷컴 버블과의 데자뷔
## 지금 AI 업계에 무슨 일이 일어나고 있나요? 요즘 테크 업계에서 가장 뜨거운 질문 중 하나가 바로 이거예요. "AI, 진짜 이대로 괜찮은 거야?" 2023년부터 ChatGPT가 폭발적으로 성장하면서 AI 투자 열풍이 불었는데요, 벌써 3년...
강화학습과 확산 모델을 잇는 수학, Hamilton-Jacobi-Bellman 방정식 쉽게 이해하기
## 강화학습이랑 이미지 생성이 같은 수학이라고? 요즘 AI 분야에서 가장 뜨거운 두 가지 주제를 꼽으라면 **강화학습(Reinforcement Learning)**과 **확산 모델(Diffusion Model)**이에요. 강화학습은 로봇 제어나 게...
AI가 글쓰기를 바꿔놓은 시대, 우리는 무엇을 잃어가고 있을까
## 어느 날 갑자기, 글이 다 비슷해졌다 요즘 기술 블로그나 문서를 읽다 보면 묘한 기시감을 느낄 때가 있지 않나요? 문장이 깔끔하고, 구조도 잘 잡혀 있는데, 어딘가 개성이 없달까요. 마치 같은 사람이 쓴 것 같은 느낌이에요. 이건 단순한 착...
인지적 암흑 숲: AI가 만들어낸 정보의 신뢰 위기
## 인터넷의 정보를 더 이상 믿을 수 없게 된다면 "암흑 숲 이론"이라는 걸 들어보신 적 있나요? 중국 SF 소설 《삼체》에 나오는 개념인데요, 우주에서 자신의 존재를 드러내면 다른 문명에게 공격당할 수 있으니 모두가 침묵하고 숨어 있다는 이론이에...
ChatGPT에 글자를 입력하기 전, Cloudflare가 먼저 React 상태를 읽고 있었다
## 타이핑도 하기 전에 벌어지는 일 ChatGPT를 쓸 때 가끔 입력창이 잠깐 먹통이 되는 경험, 해보신 적 있나요? 그냥 로딩이 느린 건가 싶어서 넘어갔을 수도 있는데요. 알고 보니 그 짧은 순간에 꽤 흥미로운 일이 벌어지고 있었어요. Cloud...
AI 크롤러를 끝없는 가짜 콘텐츠 미로에 가두는 오픈소스 도구, Miasma
## 내 웹사이트 콘텐츠, AI가 마음대로 가져가는 게 불편했다면 요즘 웹사이트를 운영하는 분이라면 한 번쯤 느끼셨을 거예요. 분명 robots.txt에 크롤링 금지를 걸어뒀는데도, AI 회사들의 크롤러가 내 콘텐츠를 마구 긁어가는 상황이요. O...
AI에게 필요한 건 더 큰 메모리가 아니라 더 나은 수학일지도 모릅니다
## GPU 메모리를 늘리는 게 정답일까? 요즘 AI 분야에서 가장 흔하게 듣는 이야기가 있어요. "모델이 너무 커서 GPU 메모리가 부족하다"는 거죠. GPT 계열 모델이 수백억 개의 파라미터를 갖게 되면서, VRAM 80GB짜리 H100을 여...
OpenYak: 내 컴퓨터에서 아무 AI 모델이나 돌리고, 파일 시스템까지 직접 제어하는 오픈소스 데스크톱 앱
## AI 도구, 이제 클라우드 없이도 됩니다 요즘 개발하면서 ChatGPT나 Claude 같은 AI 도구 안 쓰는 분 거의 없죠. 그런데 이런 서비스들 쓸 때마다 조금 찜찜한 부분이 있어요. 내 코드, 내 파일을 외부 서버로 보내야 한다는 거거...
AI 시대 첫 40개월, 우리는 지금 어디쯤 와 있을까
## ChatGPT 등장 이후 40개월, 무엇이 바뀌었나 2022년 11월 ChatGPT가 세상에 나온 지 이제 약 40개월이 지났어요. 돌이켜보면 정말 많은 것이 바뀌었는데요, 한 개발자가 이 기간을 되짚어보며 AI 시대의 현주소를 정리한 글이 올...
AI가 항상 "맞아요, 잘하셨어요"라고 대답하면 생기는 일
## "네 말이 다 맞아" — AI의 아부 문제 요즘 ChatGPT나 Claude 같은 AI 챗봇을 쓰면서 이런 느낌 받아본 적 없으신가요? 내가 뭘 말해도 "좋은 생각이에요", "맞습니다", "훌륭한 접근이네요"라고 답해주는 느낌. 처음엔 기분...