AI 대형 모델에 라벨을 붙이는 소도시 청년들
- 핵심 관점: 이 글은 인공지능 산업의 번영 뒤에 숨겨진, 데이터 라벨링 산업이 '착취 공장'으로서의 잔혹한 현실을 폭로하며, 중국 중서부 현성부터 전 세계의 하층 노동자들이 기술 혁명 속에서 소외되고 착취당하며 결국 AI에 의해 대체되는 딜레마에 직면하는 모습을 묘사합니다.
- 핵심 요소:
- 산업 이전과 고용 현실: 산시성 다퉁 등 중서부 도시들이 데이터 라벨링 기지로 변모하여 수만 개의 지역 일자리를 창출했지만, 작업의 본질은 반복적이고 고압적인 도급 노동이며, 종사자들은 실물 경제에서 출로를 찾기 어려운 청년과 여성이 대부분입니다.
- 노동 강도와 보수 불균형: 데이터 라벨링 단가는 지난 몇 년간 90% 이상 폭락하여 1모(毛)에서 몇 푼으로 떨어졌으며, 노동자들은 미미한 수입을 유지하기 위해 고강도 작업을 강요받고, 엄격한 디지털 관리와 높은 오류 허용률 요구를 감내해야 합니다.
- 감정 노동의 소외: RLHF(인간 피드백 강화 학습) 단계에서 하층 라벨링원들은 복잡한 인간 감정을 양화하여 점수를 매겨 AI의 '공감 능력'을 훈련시켜야 하지만, 그들 자신은 기계적인 판단 속에서 감정이 고갈되고 인지적 공허함을 느끼게 됩니다.
- 지식 계층의 '접힘': 높은 진입 장벽을 가진 'AI 논리 트레이너' 등의 직위는 명문 대학 석사들을 유혹하지만, 그들의 작업 또한 불확실성과 비인간적 통제로 가득 차 있으며, 하층 라벨링원들과 함께 알고리즘 시스템 내에서 교체 가능한 '톱니바퀴'로 전락하고 있습니다.
- 착취 구조와 가치 박탈: 이 산업은 역피라미드형 아웃소싱 구조를 띠고 있으며, 테크 대기업들은 '클라우드 영주'로서 대부분의 가치를 착취합니다. 여러 계층을 거쳐 착취된 후 최종적으로 일선 노동자에게 돌아가는 보수는 극히 낮아 '데이터와 땀의 컨베이어 벨트'를 형성합니다.
- 기술에 역습당하는 위기: AI 자동화 라벨링 기술은 천 배의 효율로 인력을 대체하고 있어, 대기업의 아웃소싱 투자가 절벽처럼 감소하고 있습니다. 직접 AI를 '먹여 키운' 라벨링원 집단은 자신이 창조한 괴물에게 도태되는 궁극적인 딜레마에 직면해 있습니다.
원문 저자: Sleepy.md
산시성 다퉁시, 한때 석탄으로 반벽강산을 떠받쳤던 이 도시는 이제 온몸에 묻은 석탄 먼지를 털어내고 날카로운 곡괭이로 바꿔들어 또 다른 보이지 않는 광산을 향해 힘껏 내리치고 있다.
핑청구 진마오 국제 센터의 오피스 빌딩에는 더 이상 승강정도 없고 석탄 운반차도 없다. 그 자리를 대신한 것은 수천 개의 빽빽하게 늘어선 컴퓨터 작업대다. 상하이 룬쉰 윈중성구 빅데이터 스마트 서비스 기지는 몇 층 전체를 차지하고 있으며, 수천 명의 헤드폰을 낀 젊은 직원들이 스크린을 응시하며 클릭하고, 드래그하고, 영역을 선택하고 있다.
관계 당국의 데이터에 따르면, 2025년 11월 기준 다퉁시는 가동 중인 서버 74.5만 대를 보유하고 있으며, 69개의 콜센터 및 데이터 라벨링 기업을 유치해 3만 명 이상의 근거리 고용을 창출했고, 생산액은 7.5억 위안에 달한다. 이 디지털 광산에서, 종사자의 94%가 현지 호적을 가진 주민이다.
다퉁시만이 아니다. 국가 데이터국이 확정한 첫 번째 데이터 라벨링 기지 목록에는 산시성 융허현, 구이저우성 비제시, 윈난성 멍쯔시 등 중서부 지역의 현과 도시가 포함되어 있다. 융허현의 데이터 라벨링 기지에서는 직원의 80%가 여성이다. 그들은 대부분 농촌 출신의 엄마들이거나 적절한 일자리를 찾지 못한 귀향 청년들이다.
백 년 전, 영국의 맨체스터 방직 공장에는 토지를 잃은 농민들로 가득했다. 오늘날, 이 외진 현과 도시의 컴퓨터 스크린 앞에는 실물 경제에서 자리를 찾지 못한 젊은이들로 가득하다.
그들은 미래 지향적이면서도 극도로 원시적인 도급제 작업에 종사하고 있으며, 베이징, 선전, 실리콘밸리에 있는 인공 지능 거대 기업들을 위해 대규모 모델에 필수적인 데이터 사료를 생산하고 있다.
아무도 이게 문제가 있다고 생각하지 않는다.
황토 고원 위의 새로운 컨베이어 벨트
데이터 라벨링의 본질은 기계에게 세상을 가르치는 것이다.
자율 주행은 신호등과 보행자를 인식해야 하고, 대규모 모델은 무엇이 고양이고 무엇이 개인지 구분해야 한다. 기계 자체는 상식이 없기 때문에 인간이 먼저 사진 위에 상자를 그려 '이것이 보행자다'라고 알려줘야, 수천만 장의 사진을 삼킨 후 스스로 인식하는 법을 배울 수 있다.
이 일은 높은 학력을 필요로 하지 않는다. 오직 인내심과 끊임없이 클릭할 수 있는 집게손가락만 있으면 된다.
2017년 황금기에는 간단한 2D 상자 하나에 1모(약 0.1위안) 이상의 가격이 붙었고, 심지어 5모(약 0.5위안)의 고가를 제시하는 회사도 있었다. 손이 빠른 라벨러는 하루에 열 몇 시간 일하며 5~6백 위안을 벌 수 있었다. 현과 도시에서는 이는 절대적으로 고임금, 고급스러운 일자리였다.
그러나 대규모 모델이 진화하면서, 이 컨베이어 벨트의 잔혹한 면모가 드러나기 시작했다.
2023년이 되자, 간단한 이미지 라벨링의 단가는 3~4푼(0.03~0.04위안)으로 떨어졌고, 하락폭은 90%를 넘었다. 더 어려운 3D 포인트 클라우드 이미지라 해도, 빽빽한 점으로 구성되어 무수히 확대해야만 가장자리를 볼 수 있는 이미지에서, 라벨러는 3차원 공간에서 길이, 너비, 높이, 편각을 포함하는 입체 상자를 그려 차량이나 보행자를 틈 없이 감싸야 하는데, 이렇게 복잡한 3D 상자도 겨우 5푼(0.05위안)에 불과하다.

단가 폭락의 직접적인 결과는 노동 강도의 급증이다. 매월 2~3천 위안의 기본급을 꼭 붙잡기 위해, 라벨러들은 끊임없이, 계속해서 자신의 손속도를 높여야 한다.
이건 결코 편안한 화이트칼라 직업이 아니다. 많은 라벨링 기지에서 관리가 숨 막힐 정도로 엄격하여, 출근 중 전화를 받는 것이 허용되지 않고, 휴대폰은 반드시 보관함에 잠가야 한다. 시스템은 각 직원의 마우스 이동 궤적과 체류 시간을 정확히 기록하며, 만약 3분 이상 멈추면 백엔드의 경고가 채찍처럼 휘날릴 것이다.
더욱 정신이 나갈 지경인 것은 오류 허용률이다. 업계의 합격선은 일반적으로 95% 이상이며, 어떤 회사는 심지어 98%~99%를 요구한다. 이는 100개의 상자를 그릴 때 단 2개만 틀려도 전체 그림이 반려되어 수정을 요구받게 됨을 의미한다.
움짤은 프레임이 연결되어 있고, 차선 변경하는 차량은 가려질 수 있어 라벨러는 상상을 동원해 그것들을 하나하나 찾아내야 한다; 3D 포인트 클라우드 이미지에서는 10개 이상의 점을 가진 물체는 반드시 상자를 그려야 한다. 복잡한 주차 공간 프로젝트에서 선을 길게 그렸거나, 표시를 빠뜨렸다면, 품질 검사 때는 항상 문제점을 찾아낼 수 있다. 한 장의 그림이 네다섯 번씩 반려되는 것은 예사다. 마지막에 계산해 보면, 한 시간을 들인 노력에 대한 보상은 겨우 몇 푼에 불과하다.
후난성의 한 라벨러는 소셜 플랫폼에 자신의 정산 내역을 공개했는데, 하루 일을 마치고 그녀는 700개가 넘는 상자를 그렸고, 단가는 4푼, 총 수입은 30.2위안이었다.
이는 극도로 분열된 풍경이다.
한편으로는 기자회견장에서 화려한 모습의 테크 거물들이 AGI가 어떻게 인류를 해방시킬지 이야기하고 있고; 다른 한편으로는 황토 고원과 서남 대산맥의 현과 도시에서 젊은이들이 매일 8~10시간 동안 스크린을 죽어라 응시하며, 기계적으로 상자를 그리고, 수천 개, 수만 개, 심지어 밤에 꿈속에서도 손가락이 허공에 차선을 그리고 있다.
누군가 말한 바 있다, 인공 지능의 외관은 쌩쌩 지나가는 고급차지만, 문을 열어보면 안에는 백 명의 사람들이 자전거를 타고 이를 악물고 페달을 필사적으로 밟고 있다고.
아무도 이게 문제가 있다고 생각하지 않는다.
기계에게 '어떻게 사랑하는지' 가르치는 도급제 노동자
이미지 인식의 병목 현상이 뚫린 후, 대규모 모델은 더 깊은 진화를 맞이했고, 인간처럼 생각하고, 대화하며, 심지어 '공감 능력'을 보여주는 법을 배워야 했다.
이것이 대규모 모델 훈련에서 가장 핵심적이면서도 가장 비싼 단계인 RLHF(인간 피드백 기반 강화 학습)를 촉발시켰다.
간단히 말해, 실제 인간이 AI가 생성한 답변에 점수를 매겨, 어떤 답변이 더 나은지, 인간의 가치관과 감정적 선호에 더 부합하는지 알려주는 것이다.
ChatGPT가 '사람처럼' 보이는 이유는 바로 그 뒤에 수많은 RLHF 라벨러들이 수업을 하고 있기 때문이다.
크라우드소싱 플랫폼에서 이러한 라벨링 작업은 종종 명시적으로 가격이 책정된다: 단건당 3~7위안. 라벨러는 AI의 답변에 대해 극도로 주관적인 감정 점수를 매겨, 이 답변이 '따뜻한지', '공감 능력이 있는지', '사용자의 감정을 배려했는지'를 판단해야 한다.
현실의 진창에서 허덕이며 월 2~3천 위안의 급여를 받고, 심지어 자신의 감정도 돌볼 겨를이 없는 사회적 하층의 노동자가, 시스템에서 AI의 감정 교사이자 가치관 심판관 역할을 맡아야 한다.

그들은 따뜻함, 공감 능력과 같은 극도로 복잡하고 미묘한 인간의 감정을 억지로 부수어, 1에서 5까지의 차가운 점수로 양화해야 한다. 만약 그들의 점수가 시스템이 설정한 표준 답안과 일치하지 않으면, 정확도 미달로 판정되어 본래 미미한 도급제 임금에서 공제된다.
이는 인지적 공백화다. 인간의 복잡하고 미묘한 감정, 도덕성과 연민은 억지로 알고리즘의 깔때기 속으로 끌려 들어간다. 차가운 양화와 표준화된 눈금 속에서, 그것들은 마지막 남은 따뜻함까지 짜내진다. 당신이 스크린 속의 사이버 괴수가 이미 시를 쓰고 곡을 짓는 법을 배웠으며, 안부를 묻고, 심지어 다정다감한 외피를 걸쳤다고 감탄할 때; 스크린 밖, 본래 생생했던 그 인간들은 날이면 날마다의 기계적 판단 속에서 감정 없는 채점 기계로 퇴화해 간다.
이는 전체 산업 생태계에서 가장 은밀한 측면으로, 어떤 자금 조달 뉴스나 기술 백서에도 등장하지 않는다.
아무도 이게 문제가 있다고 생각하지 않는다.
985 대학 석사와 소도시 청년
하층의 상자 그리기 작업은 AI의 궤도에 짓밟히고 있으며, 이 사이버 컨베이어 벨트는 위쪽으로 확장되기 시작해 더 고차원적인 정신 노동을 삼키기 시작했다.
대규모 모델의 입맛이 변했다. 그것은 더 이상 단순한 상식을 씹어 삼키는 데 만족하지 않고, 인간의 전문 지식과 고급 논리를 삼켜야 한다.
각종 채용 플랫폼에서 '대규모 모델 논리 추론 라벨링', 'AI 인문학 훈련사'와 같은 특수한 아르바이트 광고가 자주 깜빡이기 시작했다. 이 아르바이트의 진입 장벽은 매우 높아, 종종 '985/211 대학 석사 이상 학력'을 요구하며, 법학, 의학, 철학, 문학 등 전문 분야를 다룬다.

많은 명문 대학원생들이 유혹을 받아 이 대기업들의 아웃소싱 그룹으로 몰려들었다. 그러나 그들은 곧 이것이 결코 편안한 정신 체조가 아니라 정신적 고문임을 발견했다.
정식으로 작업을 수주하기 전에, 그들은 수십 페이지에 달하는 채점 기준과 평가 기준 문서를 읽고, 두세 차례의 시범 라벨링을 거쳐야 한다. 기준에 도달한 후, 정식 라벨링에서 정확도가 평균 이하로 떨어지면 자격을 잃고 그룹 채팅에서 추방당한다.
가장 숨 막히는 점은 이 기준이 결코 고정되어 있지 않다는 것이다. 유사한 질문과 답변에 대해 동일한 사고 방식으로 점수를 매겨도 결과는 전혀 다를 수 있다. 이는 마치 영원히 끝나지 않고, 근본적으로 표준 답안이 없는 시험지를 푸는 것과 같다. 자기 노력이나 학습을 통해 정확도를 높일 수 없으며, 제자리에서 끊임없이 빙빙 돌며 정신력과 체력을 소모할 뿐이다.
이것이 바로 대규모 모델 시대의 새로운 형태의 착취 — 계층 접힘이다.
지식, 이 한때 장벽을 깨고 위로 올라가는 황금 사다리로 여겨졌던 것이, 이제는 알고리즘에 바쳐지는, 씹어 삼키기에 더욱 복잡한 디지털 사료로 전락했다. 알고리즘과 시스템의 절대적인 권력 앞에서, 상아탑의 985 대학 석사와 황토 고원의 소도시 청년은 가장 기묘한 동귀어진을 맞이했다.
그들은 함께 이 깊이를 알 수 없는 사이버 광산 구덩이로 떨어져, 광채를 빼앗기고 차이가 지워진 채, 모두 컨베이어 벨트 위의 값싸고 언제든지 교체 가능한 톱니바퀴로 변해버렸다.
해외에서도 마찬가지다. 2024년, 애플은 산디에이고의 121명 규모 AI 음성 라벨링 팀을 단칼에 잘라냈다. 이 직원들은 Siri의 다국어 처리 능력을 개선하는 일을 맡았으며, 그들은 한때 대기업 핵심 비즈니스의 변두리에 서 있다고 생각했지만, 순식간에 실업의 심연으로 추락했다.
테크 거물들의 눈에는, 현과 도시의 상자 그리는 아줌마든, 명문 대학 출신의 논리 훈련사든, 본질적으로 언제든지 교체 가능한 '소모품'이다.
아무도 이게 문제가 있다고 생각하지 않는다.
조 단위의 바벨탑, 몇 푼짜리 피땀으로 쌓아 올리다
중국 정보통신연구원이 발표한 데이터에 따르면, 2023년 중국 데이터 라벨링 시장 규모는 60.8억 위안에 달했으며, 2025년에는 200~300억 위안에 이를 것으로 예상된다. 예측에 따르면, 2030년이 되면 글로벌 데이터 라벨링 및 서비스 시장 매출액은 1171억 위안으로 폭등할 것이다.
이 숫자 뒤에는 OpenAI, 마이크


