BTC
ETH
HTX
SOL
BNB
Xem thị trường
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

Những thanh niên thị trấn dán nhãn cho mô hình AI lớn

区块律动BlockBeats
特邀专栏作者
2026-04-07 10:20
Bài viết này có khoảng 4567 từ, đọc toàn bộ bài viết mất khoảng 7 phút
Màu sắc nền của cuộc cách mạng công nghệ, mãi mãi là sự tiêu hao quy mô hóa của lao động giá rẻ.
Tóm tắt AI
Mở rộng
  • Quan điểm cốt lõi: Bài viết tiết lộ hiện thực tàn khốc đằng sau sự thịnh vượng của ngành công nghiệp trí tuệ nhân tạo, nơi ngành gán nhãn dữ liệu đóng vai trò như "nhà máy mồ hôi nước mắt", mô tả những người lao động cơ bản từ các huyện thị trung tây Trung Quốc đến phạm vi toàn cầu, bị tha hóa, bóc lột và cuối cùng đối mặt với tình thế khó khăn bị thay thế bởi AI trong cuộc cách mạng công nghệ.
  • Yếu tố then chốt:
    1. Chuyển dịch công nghiệp và thực tế việc làm: Các thành phố trung tây như Đại Đồng, Sơn Tây chuyển đổi thành căn cứ gán nhãn dữ liệu, thúc đẩy hàng chục nghìn việc làm địa phương, nhưng bản chất công việc là lao động tính theo sản phẩm lặp đi lặp lại, áp lực cao, người làm chủ yếu là thanh niên và phụ nữ khó tìm lối thoát trong nền kinh tế thực.
    2. Mất cân bằng giữa cường độ lao động và thù lao: Đơn giá gán nhãn dữ liệu trong vài năm qua đã giảm hơn 90%, từ hơn một hào xuống còn vài xu, người lao động buộc phải làm việc cường độ cao để duy trì thu nhập ít ỏi, đồng thời chịu đựng quản lý số hóa nghiêm ngặt và yêu cầu tỷ lệ dung sai cao.
    3. Sự tha hóa của lao động tình cảm: Trong khâu RLHF (Học tăng cường với phản hồi con người), nhân viên gán nhãn cơ sở cần lượng hóa và chấm điểm cảm xúc phức tạp của con người để huấn luyện "sự đồng cảm" của AI, nhưng bản thân họ lại cạn kiệt cảm xúc trong quá trình phán đoán máy móc, hình thành sự rỗng tuếch nhận thức.
    4. "Sự gấp khúc" của tầng lớp tri thức: Các vị trí có rào cản cao như "Huấn luyện viên logic AI" thu hút thạc sĩ từ các trường danh tiếng, nhưng công việc của họ cũng tràn ngập sự bất định và kiểm soát phi nhân tính, cùng với nhân viên gán nhãn cơ sở trở thành những "bánh răng" có thể thay thế trong hệ thống thuật toán.
    5. Cấu trúc bóc lột và tước đoạt giá trị: Ngành có cấu trúc thuê ngoài hình tháp ngược, các gã khổng lồ công nghệ với vai trò "lãnh chúa đám mây" chiếm đoạt phần lớn giá trị, qua nhiều tầng bóc lột, cuối cùng thù lao đến tay người lao động tuyến đầu cực thấp, hình thành "băng chuyền dữ liệu và mồ hôi nước mắt".
    6. Khủng hoảng bị công nghệ phản đòn: Công nghệ gán nhãn tự động bằng AI đang thay thế lao động thủ công với hiệu suất gấp nghìn lần, dẫn đến đầu tư thuê ngoài của các đại công ty giảm mạnh, nhóm nhân viên gán nhãn từng tự tay "nuôi dưỡng" AI đang đối mặt với tình thế khó khăn cuối cùng bị loại bỏ bởi chính con quái vật họ tạo ra.

Tác giả gốc: Sleepy.md

Datong, Sơn Tây, thành phố từng dựa vào than đá để chống đỡ nửa bầu trời, giờ đây rũ bỏ lớp bụi than dày đặc, đổi lấy một chiếc cuốc sắc bén, giáng mạnh xuống một mỏ vô hình khác.

Trong tòa nhà văn phòng tại Trung tâm Thương mại Quốc tế Jinmao, quận Bình Thành, không còn giếng thang máy, không còn xe chở than. Thay vào đó là hàng nghìn vị trí máy tính xếp sát nhau. Căn cứ Dịch vụ Thông minh Dữ liệu lớn Shanghai Runxun Yunzhongshenggu chiếm trọn vài tầng lầu, hàng nghìn nhân viên trẻ đeo tai nghe đang chăm chú nhìn màn hình, nhấp chuột, kéo thả, khoanh vùng.

Theo số liệu chính thức, tính đến tháng 11 năm 2025, thành phố Datong đã đưa vào vận hành 745.000 máy chủ, thu hút 69 doanh nghiệp dữ liệu chú thích và gọi điện, tạo việc làm tại chỗ cho hơn 30.000 lượt người, với giá trị sản xuất đạt 7,5 tỷ nhân dân tệ. Trong hầm mỏ kỹ thuật số này, 94% người lao động có hộ khẩu địa phương.

Không chỉ riêng Datong. Trong số các căn cứ chú thích dữ liệu đầu tiên được Cục Quản lý Dữ liệu Nhà nước xác định, các huyện thị trung tây như Vĩnh Hòa (Sơn Tây), Tất Tiết (Quý Châu), Mông Tự (Vân Nam) đều có tên. Tại căn cứ chú thích dữ liệu huyện Vĩnh Hòa, 80% nhân viên là nữ. Họ chủ yếu là các bà mẹ trẻ nông thôn, hoặc thanh niên trở về quê không tìm được công việc phù hợp.

Một trăm năm trước, các nhà máy dệt Manchester ở Anh chật kín nông dân mất đất. Còn ngày nay, trước màn hình máy tính ở những huyện thị xa xôi này, ngồi đầy những thanh niên trẻ không tìm được vị trí trong nền kinh tế thực.

Họ đang thực hiện một công việc tính lương theo sản phẩm vừa mang tính tương lai, lại vừa cực kỳ nguyên thủy, sản xuất thức ăn dữ liệu cần thiết cho các mô hình lớn của những gã khổng lồ AI ở Bắc Kinh, Thâm Quyến và Thung lũng Silicon xa xôi.

Không ai thấy điều này có vấn đề gì.

Dây chuyền sản xuất mới trên cao nguyên Hoàng Thổ

Bản chất của chú thích dữ liệu là dạy máy móc nhận biết thế giới.

Xe tự lái cần nhận ra đèn giao thông và người đi bộ, mô hình lớn cần phân biệt đâu là mèo, đâu là chó. Bản thân máy móc không có kiến thức thông thường, con người phải vẽ một khung trên hình ảnh trước, nói với nó "đây là người đi bộ", thì sau khi nuốt chửng hàng chục triệu bức ảnh, nó mới học được cách tự nhận diện.

Công việc này không yêu cầu trình độ học vấn cao, chỉ cần sự kiên nhẫn và một ngón trỏ có thể nhấp chuột không ngừng.

Vào thời kỳ hoàng kim năm 2017, một khung 2D đơn giản có giá lên tới hơn một hào, thậm chí có công ty trả giá cao tới 5 hào. Những người chú thích có tốc độ tay nhanh, làm việc hơn chục giờ một ngày, có thể kiếm được năm sáu trăm tệ. Ở cấp huyện, đây chắc chắn là một công việc lương cao, thể diện.

Nhưng khi mô hình lớn tiến hóa, mặt tàn khốc của dây chuyền sản xuất này bắt đầu lộ ra.

Đến năm 2023, đơn giá chú thích hình ảnh đơn giản đã bị đè xuống còn 3 đến 4 xu, giảm hơn 90%. Ngay cả với bản đồ điểm đám mây 3D khó hơn - những hình ảnh được cấu thành từ các điểm dày đặc, cần phóng to vô số lần mới thấy rõ đường viền - người chú thích cũng phải kéo ra một khung lập thể trong không gian ba chiều bao gồm chiều dài, chiều rộng, chiều cao và góc lệch, để bao bọc chính xác phương tiện hoặc người đi bộ. Mà một khung 3D phức tạp như vậy, cũng chỉ có 5 xu.

Hậu quả trực tiếp của việc đơn giá lao dốc là cường độ lao động tăng mạnh. Để cố bám trụ mức lương cơ bản hai ba nghìn tệ mỗi tháng, những người chú thích phải liên tục, không ngừng nâng cao tốc độ tay của mình.

Đây không phải là công việc văn phòng nhàn hạ chút nào. Ở nhiều căn cứ chú thích, quản lý khắt khe đến nghẹt thở, không được phép nghe điện thoại khi làm việc, điện thoại phải khóa trong tủ đồ. Hệ thống sẽ ghi chính xác lộ trình chuột và thời gian dừng của mỗi nhân viên, nếu dừng lại quá ba phút, cảnh báo từ hậu trường sẽ quất tới như roi.

Điều khiến người ta sụp đổ hơn là tỷ lệ dung sai. Điểm đạt ngành thường trên 95%, có công ty thậm chí yêu cầu 98%-99%. Điều này có nghĩa là, bạn kéo 100 khung, chỉ cần sai 2 cái, cả bức ảnh sẽ bị trả về sửa chữa.

Hình động được nối khung, xe đổi làn sẽ bị che khuất, người chú thích phải dựa vào liên tưởng để tìm từng cái ra; trong bản đồ điểm đám mây 3D, vật thể nào vượt quá 10 điểm đều phải vẽ khung. Một dự án chỗ đỗ xe phức tạp, đường vẽ dài, bỏ sót nhãn, khi kiểm tra chất lượng luôn có thể tìm ra lỗi. Một bức ảnh sửa đi sửa lại bốn năm lần là chuyện thường. Tính ra cuối cùng, bỏ ra một giờ đồng hồ, số tiền nhận được chỉ vài hào.

Một người chú thích ở Hồ Nam đã đăng hóa đơn thanh toán của mình lên mạng xã hội, sau một ngày làm việc, cô ấy đã kéo hơn 700 khung, đơn giá 4 xu, tổng thu nhập 30,2 tệ.

Đây là một cảnh tượng cực kỳ chia rẽ.

Một bên là những ông lớn công nghệ hào nhoáng trên sân khấu họp báo, nói về việc AGI sẽ giải phóng con người như thế nào; bên kia, là những thanh niên ở các huyện thị trên cao nguyên Hoàng Thổ và vùng núi Tây Nam, mỗi ngày dán mắt vào màn hình tám đến mười tiếng, kéo khung một cách máy móc, hàng nghìn, hàng vạn cái, thậm chí ban đêm mơ, ngón tay vẫn vẽ đường phân làn giữa không trung.

Có người từng nói, vẻ ngoài của trí tuệ nhân tạo là một chiếc xe sang đang lao vút qua, nhưng mở cửa xe ra bạn sẽ thấy, bên trong có một trăm người đang đạp xe đạp, nghiến răng đạp hết sức.

Không ai thấy điều này có vấn đề gì.

Công nhân tính lương sản phẩm dạy máy móc "cách yêu thương"

Khi điểm nghẽn nhận diện hình ảnh bị phá vỡ, mô hình lớn đón nhận sự tiến hóa sâu hơn, nó cần học cách suy nghĩ, đối thoại như con người, thậm chí thể hiện "sự đồng cảm".

Điều này đã thúc đẩy khâu cốt lõi và đắt đỏ nhất trong huấn luyện mô hình lớn - RLHF (Học tăng cường dựa trên phản hồi con người).

Nói đơn giản, là để người thật chấm điểm câu trả lời do AI tạo ra, nói với nó câu trả lời nào tốt hơn, phù hợp hơn với giá trị và sở thích tình cảm của con người.

Lý do ChatGPT trông "giống người" là vì có vô số người chú thích RLHF đang dạy nó ở phía sau.

Trên các nền tảng crowdsourcing, loại nhiệm vụ chú thích này thường được niêm yết giá rõ ràng: phí đơn lẻ từ 3 đến 7 tệ. Người chú thích cần chấm điểm tình cảm cực kỳ chủ quan cho câu trả lời của AI, để đánh giá xem câu trả lời này có "ấm áp" không, có "đồng cảm" không, có "quan tâm đến cảm xúc người dùng" không.

Một người lao động đáy xã hội với mức lương hai ba nghìn tệ mỗi tháng, mệt mỏi chạy theo vũng lầy hiện thực, thậm chí không có thời gian quan tâm đến cảm xúc của chính mình, lại phải đóng vai trò cố vấn tình cảm và trọng tài giá trị cho AI trong hệ thống.

Họ cần phải ép những cảm xúc con người cực kỳ phức tạp, tinh tế như sự ấm áp, đồng cảm, nghiền nát chúng, lượng hóa thành điểm số lạnh lùng từ 1 đến 5. Nếu điểm số của họ không khớp với đáp án tiêu chuẩn do hệ thống đặt ra, họ sẽ bị đánh giá là tỷ lệ chính xác không đạt, từ đó bị khấu trừ tiền lương tính theo sản phẩm vốn đã ít ỏi.

Đây là một sự rút rỗng nhận thức. Những cảm xúc, đạo đức và lòng trắc ẩn phức tạp, sâu kín của con người, đang bị kéo mạnh vào phễu của thuật toán. Trong thang đo lượng hóa và tiêu chuẩn hóa lạnh lùng, chúng bị vắt kiệt chút hơi ấm cuối cùng. Khi bạn kinh ngạc trước con quái vật cyber trên màn hình đã học được viết thơ soạn nhạc, hỏi han ấm áp, thậm chí khoác lên lớp da đa sầu đa cảm; thì bên ngoài màn hình, đám người vốn sống động đó, lại trong những phán đoán máy móc ngày qua ngày, thoái hóa thành cỗ máy chấm điểm không cảm xúc.

Đây là mặt kín đáo nhất của toàn bộ chuỗi công nghiệp, không bao giờ xuất hiện trong bất kỳ tin tức gọi vốn hay sách trắng kỹ thuật nào.

Không ai thấy điều này có vấn đề gì.

Thạc sĩ 985 và thanh niên thị trấn nhỏ

Công việc kéo khung cấp thấp đang bị xích của AI nghiền nát, dây chuyền sản xuất cyber này bắt đầu lan lên cao, bắt đầu nuốt chửng lao động trí óc cấp cao hơn.

Khẩu vị của mô hình lớn đã thay đổi. Nó không còn hài lòng với việc nhai nát kiến thức thông thường đơn giản, nó cần nuốt chửng kiến thức chuyên môn và logic cao cấp của con người.

Các nền tảng tuyển dụng lớn bắt đầu nhấp nháy thường xuyên một loại công việc bán thời gian đặc biệt, như "Chú thích suy luận logic mô hình lớn", "Huấn luyện viên nhân văn AI". Ngưỡng vào của công việc bán thời gian này cực cao, thường yêu cầu "trình độ thạc sĩ 985/211 trở lên", liên quan đến các lĩnh vực chuyên môn như luật, y học, triết học, văn học.

Nhiều nghiên cứu sinh trường danh tiếng bị thu hút, đổ xô vào các nhóm outsourcing của các đại công ty này. Nhưng họ nhanh chóng phát hiện, đây không phải là bài thể dục trí óc nhẹ nhàng, mà là một sự tra tấn tinh thần.

Trước khi chính thức nhận đơn, họ phải đọc tài liệu tiêu chí chấm điểm và đánh giá dài hàng chục trang, thực hiện hai đến ba vòng thử chú thích. Sau khi đạt chuẩn, trong quá trình chú thích chính thức, nếu tỷ lệ chính xác thấp hơn mức trung bình, họ sẽ mất tư cách, bị đá khỏi nhóm chat.

Điều khiến người ta nghẹt thở nhất là những tiêu chuẩn này hoàn toàn không cố định. Đối mặt với câu hỏi và câu trả lời tương tự, dùng cùng cách suy nghĩ để chấm điểm, kết qu

công nghệ
AI
Chào mừng tham gia cộng đồng chính thức của Odaily
Nhóm đăng ký
https://t.me/Odaily_News
Nhóm trò chuyện
https://t.me/Odaily_GoldenApe
Tài khoản chính thức
https://twitter.com/OdailyChina
Nhóm trò chuyện
https://t.me/Odaily_CryptoPunk
Tìm kiếm
Mục lục bài viết
Tải ứng dụng Odaily Nhật Báo Hành Tinh
Hãy để một số người hiểu Web3.0 trước
IOS
Android