오픈 가중치 LLM, 진짜 상용 모델을 따라잡았을까?

요즘 개발자들 사이에서 “이제 오픈 모델로도 충분하지 않냐”는 말이 자주 나와요. 불과 2~3년 전만 해도 GPT-4 같은 상용 모델과, 직접 내려받아 쓸 수 있는 모델 사이엔 누가 봐도 넘기 힘든 벽이 있었거든요. 그런데 그 격차가 요즘 들어 눈에 띄게 줄었다는 이야기가 곳곳에서 들립니다. 오늘은 이 “오픈 모델 vs 닫힌 모델”의 격차가 지금 어디쯤 와 있는지 차근차근 짚어볼게요.

먼저 용어부터, ‘오픈 가중치’가 뭐냐면

여기서 자주 헷갈리는 게 있어요. 흔히 “오픈 소스 모델”이라고 부르긴 하는데, 사실 정확한 표현은 오픈 가중치(open weights)거든요. 이게 뭐냐면, 모델이 학습으로 얻은 ‘가중치’라는 숫자 덩어리(쉽게 말하면 모델의 두뇌에 해당하는 파라미터)를 누구나 내려받아 자기 서버에 올려 돌릴 수 있게 공개한 거예요. 메타의 라마(Llama), 알리바바의 큐원(Qwen), 딥시크(DeepSeek), 미스트랄(Mistral) 같은 게 대표적이죠.

다만 ‘오픈 소스’랑은 좀 달라요. 진짜 오픈 소스라면 학습에 쓴 데이터와 코드까지 다 공개해야 하는데, 대부분의 오픈 가중치 모델은 “결과물(가중치)은 줄게, 근데 어떤 데이터로 어떻게 만들었는지는 비밀”인 경우가 많거든요. 반대편엔 닫힌 모델(closed)이 있어요. GPT, Claude, Gemini처럼 가중치를 절대 안 주고 API로만 빌려 쓰게 하는 방식이죠.

격차가 줄어든 게 체감되는 이유

예전엔 오픈 모델이 상용 최고 모델을 따라잡는 데 12개월에서 18개월쯤 걸린다고들 했어요. 상용 모델이 신기능을 내놓으면 한참 뒤에야 오픈 모델이 비슷한 수준에 도달하는 식이었죠. 그런데 지금은 이 시차가 훨씬 짧아졌어요. 딥시크나 큐원 같은 모델은 출시되자마자 각종 벤치마크(성능 측정 시험)에서 상용 최상위권 모델과 어깨를 나란히 하는 점수를 내고 있거든요.

특히 수학, 코딩, 추론처럼 정답이 명확한 영역에서 격차가 빠르게 좁혀졌어요. 이런 분야는 강화학습으로 모델을 빡세게 훈련시키기 좋아서, 데이터와 학습 기법만 잘 갖추면 오픈 진영도 금방 따라붙을 수 있거든요. 게다가 오픈 모델은 전 세계 연구자들이 달려들어 미세조정(파인튜닝)하고 개선하니까, 한 회사가 독점적으로 개발하는 닫힌 모델보다 발전 속도가 빠른 측면도 있어요.

그래도 닫힌 모델이 아직 앞서는 곳

물론 “이제 다 똑같다”고 말하긴 일러요. 닫힌 모델은 여전히 몇 가지에서 앞서가거든요. 우선 여러 단계를 스스로 판단하며 도구를 쓰는 에이전트(agent) 작업, 그리고 이미지·음성·영상을 한꺼번에 다루는 멀티모달 영역에서 상용 모델의 완성도가 더 높아요. 또 막상 실무에 붙여보면 ‘마지막 10%의 안정성’, 그러니까 까다로운 요청에도 흔들리지 않고 일관되게 답하는 다듬어진 느낌은 닫힌 모델 쪽이 아직 낫다는 평가가 많죠.

여기에 생태계도 무시 못 해요. 닫힌 모델은 API 한 줄이면 바로 쓰고 안정적인 인프라와 지원이 따라오거든요. 반면 오픈 모델은 직접 GPU 서버 깔고, 추론 엔진 세팅하고, 운영까지 책임져야 하니 손이 많이 가요.

업계 흐름에서 보면

이 격차 축소가 중요한 이유는 단순히 “오픈이 이겼다/졌다”의 문제가 아니라 선택지가 생겼다는 데 있어요. 예전엔 고성능이 필요하면 무조건 상용 API에 종속될 수밖에 없었는데, 이제는 “민감한 데이터는 우리 서버에서 오픈 모델로, 범용 작업은 상용 API로” 같은 하이브리드 전략이 현실적인 선택지가 된 거죠. 자체 호스팅(self-hosting) 솔루션을 제공하는 회사들이 늘어나는 것도 이런 흐름과 맞닿아 있어요.

한국 개발자에게는?

우리 입장에서 이건 꽤 반가운 소식이에요. 한국은 금융, 공공, 의료처럼 데이터를 외부로 못 내보내는 규제 산업이 많잖아요. 이런 곳에선 아무리 GPT가 좋아도 외부 API로 고객 데이터를 보내는 게 부담스럽거든요. 오픈 모델이 충분히 똑똑해졌다는 건, 회사 안에 모델을 두고 데이터 한 톨 밖으로 안 내보내면서도 쓸 만한 AI 기능을 붙일 수 있게 됐다는 뜻이에요.

비용 측면도 그래요. API 호출량이 많아지면 요금이 눈덩이처럼 불어나는데, 트래픽이 충분히 크다면 오픈 모델을 직접 돌리는 게 장기적으로 더 쌀 수 있거든요. 다만 GPU 비용과 운영 인력을 함께 계산해야 하니 “무조건 오픈이 싸다”는 아니에요. 본인 서비스의 규모와 데이터 민감도를 따져서 골라야죠.