Một phụ nữ đứng trước máy ảnh, chụp bức ảnh với phần đầu, đôi mắt và mũi và từ từ xoay sang bên. Nhiều người làng khác đang chờ đến lượt. Một số người nói họ đã ba, bốn lần đến để chụp ảnh khuôn mặt.
Theo Reuters, dự án này đã làm xáo động cả ngôi làng Trung Quốc, thường im ắng đến mức buồn ngủ. Dự án đang thu thập tài liệu để đào tạo phần mềm AI phân biệt các đặc điểm trên khuôn mặt thật và hình ảnh tĩnh.
Liu Yangfeng, Giám đốc điều hành công ty Qianji Data Co Ltd, chuyên thu thập và dán nhãn dữ liệu cho một số công ty công nghệ lớn nhất của Trung Quốc, nói rằng dự án thu thập khuôn mặt của hàng chục ngàn người sống trong khu vực này.
"Chúng tôi đang tạo ra nhiều bộ dữ liệu để phục vụ nhiều công ty thuật toán AI, những dữ liệu này có thể phục vụ phát triển trí tuệ nhân tạo ở Trung Quốc", ông Liu nói, từ chối tiết lộ tên khách hàng.
Nhân viên đang làm công việc ghi nhãn dữ liệu trên màn hình máy tính để phục vụ phát triển trí tuệ nhân tạo (AI) và công nghệ máy học, tại công ty Qian Ji Data Co ở quận Jia, tỉnh Hà Nam, Trung Quốc. Ảnh: Reuters
Nhu cầu thu thập dữ liệu để đào tạo các thuật toán AI đang bùng nổ, tạo ra một ngành công nghiệp toàn cầu mới, chuyên thu thập các thông tin như hình ảnh và video, sau đó dán nhãn để máy móc hiểu rằng chúng đang nhìn thấy những gì.
Các công ty sẽ đưa cho người dùng một số tiền nhỏ để đổi lấy hình ảnh khuôn mặt. Cognilytica, một công ty nghiên cứu của Mỹ chuyên về AI, ước tính thị trường toàn cầu cho ngành công nghiệp chú thích dữ liệu liên quan đến máy học đã tăng 66% lên 500 triệu USD vào năm 2018 và dự kiến sẽ tăng gấp đôi vào năm 2023. Tuy nhiên, một số người trong ngành cho biết chi tiết công việc nhiều khi không được tiết lộ, vì thế các ước tính đôi khi không chính xác.
Luật bảo vệ riêng tư yếu kém, chi phí lao động rẻ mạt
Trung Quốc nổi lên là một trung tâm quan trọng trong thu thập và gắn nhãn dữ liệu nhờ nhu cầu khủng của ngành trí tuệ nhân tạo đang phát triển và được chính quyền hỗ trợ, coi AI là động lực tăng trưởng kinh tế và là công cụ để kiểm soát xã hội.
Rất nhiều công ty đã đầu tư lớn vào một lĩnh vực của AI, được gọi là học máy, vốn là cốt lõi của công nghệ nhận dạng khuôn mặt và các hệ thống khác dựa trên việc tìm kiếm các mẫu trong dữ liệu. Những công ty này bao gồm gã khổng lồ công nghệ Alibaba, Tencent, Baidu cũng như các công ty trẻ như chuyên gia AI SenseTime Group Ltd và công ty nhận dạng giọng nói Iflytek Co Ltd.
Kết quả là các sản phẩm và dịch vụ AI ở Trung Quốc vô cùng phổ biến, từ hệ thống thanh toán dựa trên nhận dạng khuôn mặt đến giám sát tự động và thậm chí cả AI viết tin tức. Người tiêu dùng Trung Quốc chủ yếu cảm thấy các công nghệ này rất mới lạ và "có vẻ là của tương lai".
Luật bảo mật dữ liệu yếu và lao động giá rẻ là một lợi thế cạnh tranh của Trung Quốc khi nước này đua trở thành số 1 thế giới về AI. Dân làng Hà Nam vui vẻ đi chụp ảnh chỉ để lấy một tách trà, hoặc chiếc ấm đun nước.
Người dân đang xếp hàng chờ để chụp ảnh
Phục vụ cả khách hàng nước ngoài
Basic Downloader, công ty có trụ sở tại Bắc Kinh, chuyên làm công việc dán nhãn dữ liệu, tự hào cho biết họ có cả khách hàng trong và ngoài nước.
Trong một chuyến thăm gần đây tới các văn phòng ở Bắc Kinh, một số nhân viên đã dán nhãn hình ảnh những người đang buồn ngủ, nhằm phục vụ cho dự án lái xe tự trị để xác định những người lái xe có thể ngủ gật.
Theo Giám đốc điều hành Basic Downloader Du Lin, thuê nhân công làm việc gắn nhãn dữ liệu này tại Trung Quốc rẻ hơn so với việc sử dụng các thị trường dịch vụ đám đông phương Tây.
Người lao động kiếm được khoảng 100 nhân dân tệ (14,50 USD) mỗi ngày cho công việc gắn nhãn dữ liệu trên ảnh của người dân, cảnh quay giám sát và hình ảnh đường phố.
Công việc gắn nhãn dữ liệu này giúp giải quyết phần nào nạn thất nghiệp cho khu vực nông thôn, nhưng những lợi ích đó có thể "ngắn hạn" khi công nghệ AI đã đủ tốt, đủ cải thiện để thực hiện các nhiệm vụ của nó.
"Chúng tôi nghĩ rằng ngành công nghiệp này sẽ vẫn tồn tại trong ba đến năm năm nữa. Nó có thể không phải là một nghề nghiệp lâu dài - chúng ta chỉ có thể nghĩ về kế hoạch năm năm", ông Liu, CEO của Qianji nói.
Hoàng Lan