
무슨 일이 있었냐면요
한 개발자가 1989년에 출시된 매킨토시에서, 그것도 HyperCard라는 옛날 도구로 트랜스포머 신경망을 구현해버렸어요. 프로젝트 이름은 'MacMind'. 말만 들으면 "그게 돌아가?" 싶은데, 실제로 돌아간다는 게 포인트예요.
잠깐 배경부터 설명할게요. HyperCard가 뭐냐면, 애플이 80년대 후반에 내놓은 일종의 '카드형 저작 도구'예요. 쉽게 말해 PPT랑 데이터베이스, 스크립트 엔진을 합쳐 놓은 프로그램이었어요. HyperTalk이라는 영어 문장 같은 스크립트 언어로 로직을 짰고, 오늘날 웹이 나오기 전에 비전문가도 인터랙티브한 문서를 만들 수 있게 해준 전설적인 소프트웨어였어요. 트랜스포머는 반대로 2017년에 나온 현대 AI의 근간이 되는 구조고요. 30년 차이 나는 두 기술을 한 작품으로 붙인 셈이에요.
어떻게 구현한 걸까
트랜스포머의 핵심은 셀프 어텐션(self-attention)이에요. 이게 뭐냐면, 입력 토큰들끼리 서로 얼마나 관련있는지 점수를 매겨서, 문맥을 반영한 표현을 만들어내는 메커니즘이에요. 수식으로는 Q, K, V라는 세 행렬을 곱하고 소프트맥스(softmax)로 정규화하는 과정이 들어가요. 현대 AI는 이걸 GPU의 거대한 행렬 연산으로 순식간에 처리하죠.
MacMind는 이 연산을 HyperTalk 스크립트로 손수 풀어냈어요. 부동소수점 연산이 느린 68000 계열 CPU, 메모리가 몇 MB밖에 안 되는 환경, 게다가 인터프리터 언어로요. 당연히 실용적인 속도는 안 나와요. 토큰 하나 처리하는 데 몇 초에서 몇 분씩 걸릴 수 있어요. 그래도 '개념적으로 돌아간다'는 게 의미가 있어요. 모델 가중치는 사전에 학습한 작은 값을 HyperCard 카드에 저장하고, 추론만 기기에서 수행하는 구조로 보여요.
기술적으로 흥미로운 건 행렬 곱을 카드 필드와 배열 변수로 표현했다는 점이에요. 요즘 개발자들은 NumPy나 PyTorch 한 줄로 끝내는 작업을, 루프 돌려가며 직접 곱하고 더하는 코드를 쓴 거예요. 이런 '밑바닥 구현'은 실제로 트랜스포머 내부 구조를 이해하는 데 엄청 도움이 돼요. 추상화 뒤에 숨겨진 연산을 눈으로 보게 되니까요.
업계 맥락에서 보면
사실 '옛날 하드웨어에서 AI 돌리기' 장르는 꾸준히 나오고 있어요. 젤다 카트리지에 LLM 넣기, 게임보이에서 뉴럴넷 돌리기, ESP32 같은 마이크로컨트롤러에서 tinyML 돌리기 등등. 이런 프로젝트들이 반복해서 나오는 이유는 두 가지예요.
첫 번째는 교육적 가치예요. GPU 없이 돌려봐야 모델의 진짜 계산량이 피부로 와닿거든요. "GPT가 한 토큰 뽑는 데 수십억 번의 곱셈이 필요하다"는 말이 추상적으로 들릴 수 있는데, 1989년 맥에서 토큰 하나 뽑느라 커피 한 잔 마시는 시간이 걸리는 걸 보면 체감이 확 달라져요.
두 번째는 엣지 AI의 극한 실험 성격이에요. 최근 llama.cpp, tinygrad 같은 프로젝트들이 양자화와 최적화를 통해 점점 작은 기기에서 LLM을 돌리고 있잖아요. MacMind 같은 프로젝트는 그 극단을 보여주는 퍼포먼스이자, "어디까지 내려갈 수 있나"에 대한 답을 주는 실험이에요.
한국 개발자에게 주는 시사점
실무에 당장 써먹을 건 솔직히 없어요. 하지만 학습용 레퍼런스로는 최고예요. 트랜스포머 내부 구조를 공부하는데 PyTorch 코드만 보면 추상화 레이어에 가려서 뭐가 뭔지 감이 안 올 때가 있거든요. HyperTalk처럼 느리고 단순한 언어로 쓰인 구현을 따라가보면, 행렬 곱과 어텐션의 흐름이 한눈에 들어와요.
또 '제약이 창의성을 낳는다'는 교훈도 있어요. 자원이 넘치면 오히려 큰 모델을 다운받고 API를 부르는 데 익숙해지는데, 가끔은 이런 레트로 프로젝트처럼 극한 제약 조건에서 직접 짜보는 경험이 엔지니어의 내공을 깊게 해줘요. 사이드 프로젝트 소재로도 재밌고, 기술 블로그 글감으로도 좋아요.
마무리
한 줄로 정리하면, MacMind는 "최첨단 AI 구조도 본질적으로는 행렬 곱셈의 집합이다"라는 사실을 1989년 맥이라는 극단적 배경으로 증명한 프로젝트예요. 기술의 진보는 모델이 아니라 하드웨어와 최적화라는 걸 역으로 보여주기도 하고요.
여러분이 가진 가장 오래된 기기는 뭔가요? 거기서 돌려보고 싶은 현대 기술이 있다면 뭘 얹어보고 싶으세요?
🔗 출처: Hacker News
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공