Meta, 직원의 마우스 움직임과 키보드 입력까지 AI 학습에 쓴다

내 일하는 모습이 AI 학습 데이터가 된다면

로이터 보도에 따르면 Meta가 자사 직원들의 마우스 움직임, 키보드 입력, 화면 상호작용 패턴을 수집해서 AI 모델 학습에 사용하겠다고 밝혔어요. 그동안 AI 기업들이 공개 웹 데이터나 책, 논문을 긁어 모아서 학습시키는 건 익숙한 풍경이었죠. 그런데 이번엔 좀 달라요. 자기 회사 직원들이 업무하는 모든 과정 자체를 데이터로 만들겠다는 거거든요. 어떤 창을 언제 열어서 어디를 클릭하고, 어떤 순서로 타이핑했는지까지 전부요.

왜 이런 데이터가 필요할까

요즘 AI 업계의 화두는 에이전트(agent)예요. 그냥 질문에 답하는 챗봇을 넘어서, 실제로 컴퓨터를 조작해서 일을 대신 해주는 AI를 만드는 게 목표죠. 이미 Anthropic의 Computer Use, OpenAI의 Operator, Google의 Project Mariner 같은 제품이 나와 있어요. 이런 에이전트를 제대로 학습시키려면 "사람이 실제로 어떻게 업무를 처리하는가"에 대한 행동 데이터가 필요해요. 그냥 글이나 이미지만으로는 부족한 거죠.

예를 들어 "분기별 매출 보고서를 슬라이드로 만들어줘"라는 요청을 AI가 처리하려면, 사람이 엑셀에서 어떤 셀을 보고 어떤 그래프를 만들고 어떤 순서로 슬라이드에 붙이는지를 알아야 해요. Meta는 바로 이 업무 실행 과정의 미세한 흐름을 자사 직원들의 실제 업무에서 수집해서 학습 데이터로 쓰겠다는 전략이에요. 워크플로우 로깅, 스크린샷 캡처, 입력 이벤트 기록을 합쳐서 일종의 "작업 궤적(trajectory)" 데이터셋을 만드는 거죠.

프라이버시와 노동권 이슈

문제는 이게 직장 내 감시의 경계선을 크게 넘는다는 점이에요. 기존에도 많은 회사가 직원 PC에 모니터링 툴을 깔긴 했어요. 보안이나 컴플라이언스 이유로요. 하지만 그건 "문제 생겼을 때 들여다본다"는 전제였지, "평상시 모든 행동을 상품 학습에 쓴다"는 건 아니었거든요. Meta가 공개한 방향은 후자에 가까워요.

미국에서는 이미 Amazon 물류센터의 생산성 추적, UnitedHealth의 간호사 키스트로크 모니터링 같은 사례들이 노동계의 반발을 샀어요. EU에서는 GDPR과 최근의 AI Act가 이런 데이터 수집에 더 엄격한 기준을 적용해요. 특히 "고위험 AI 시스템"으로 분류되면 영향평가, 투명성 공시, 거부권 같은 요구사항이 따라붙어요. Meta 유럽 법인이 어떻게 대응할지가 관전 포인트예요.

더 근본적인 우려는 "내 노동이 나를 대체하는 AI를 학습시키는 데 쓰인다"는 구조예요. 작가들이 자기 글로 훈련된 AI에 일자리를 뺏기는 것과 비슷한 논리가 사무직에도 적용되는 거죠. 소프트웨어 엔지니어의 IDE 입력, 디자이너의 피그마 조작, 마케터의 문서 작성 과정이 모두 학습 데이터가 된다면, 그 AI가 완성됐을 때 누가 가장 먼저 영향을 받을까요?

업계의 유사 흐름

Microsoft의 Recall 기능이 작년에 비슷한 논란을 불러왔어요. 사용자 PC 화면을 5초마다 캡처해서 검색 가능한 타임라인을 만들어주는 기능이었는데, 보안 연구자들이 평문으로 저장되는 구조를 지적하면서 결국 옵트인 방식으로 바뀌었죠. Google도 Workspace 데이터를 Gemini 학습에 쓰는 문제로 논쟁이 있었고요. 이번 Meta 발표는 이 흐름의 가장 공격적인 버전이라고 볼 수 있어요.

반대로 Anthropic은 소비자 대화 데이터를 기본적으로 학습에 쓰지 않는 정책을 유지하고 있고, Apple은 온디바이스 처리와 Private Cloud Compute로 차별화하고 있어요. AI 업계가 데이터 확보 공격형과 프라이버시 방어형으로 두 갈래로 갈리는 흐름이 뚜렷해지고 있어요.

한국 개발자와 기업에 주는 시사점

한국 기업들도 이 이슈에서 자유롭지 않아요. 국내 빅테크가 내부 업무 자동화를 위해 자체 에이전트 모델을 만든다면, 자연스럽게 "직원 행동 데이터"를 학습 데이터로 삼고 싶어질 수밖에 없거든요. 이때 개인정보보호법상 근로자 동의를 어떻게 받을지, 노사 협의는 어떻게 할지, 수집 범위를 어디까지 제한할지가 실무 이슈가 돼요.

개발자 입장에서는 두 가지를 생각해볼 만해요. 첫째, 자기가 만드는 모니터링 기능이 의도치 않게 감시 인프라가 되지 않는지 점검하는 눈을 가져야 해요. APM, 사용자 행동 분석, 생산성 도구 같은 영역에서 수집과 저장의 경계가 흐려지기 쉽거든요. 둘째, 자신이 쓰는 도구가 내 작업을 학습에 쓰는지 확인해야 해요. 최근 AI 코딩 어시스턴트들이 "제로 데이터 리텐션" 옵션을 내놓는 것도 이런 맥락이에요.

마무리

에이전트 AI 시대의 데이터 확보 경쟁이 결국 직장 내 감시라는 민감한 영역까지 들어왔다는 신호예요. 여러분은 회사가 본인의 업무 과정을 AI 학습 데이터로 쓰겠다고 하면 어떻게 반응하시겠어요? 거부할 수 있는 옵션이 있어야 한다고 보세요, 아니면 고용 계약에 포함되면 당연히 받아들여야 한다고 보세요?

🔗 출처: Hacker News

이 글도 읽어보세요