Thuật toán YouTube vẫn hướng người xem vào nội dung độc hại
Hơn 71% video bị cắm cờ bởi nhóm tình nguyện viên vẫn được đề xuất bởi YouTube, theo một nghiên cứu mới đây của Mozilla (cha đẻ trình duyệt Firefox).
Tổ chức phần mềm phi lợi nhuận Mozilla Foundation mới đây đã phát hiện ra rằng thuật toán đề xuất của YouTube vẫn hướng người xem trực tiếp vào các video tin giả và nội dung gợi dục, dù rằng 71% số video đó đã bị người tham gia phản đối bằng cách cắm cờ.
Cắm cờ là một hình thức báo cáo (report) để người dùng thông báo cho YouTube biết video đó chứa nội dung vi phạm chính sách.
Nghiên cứu mới này tiếp tục giáng một đòn mạnh vào các nền tảng như YouTube, Facebook hay Twitter. Những năm gần đây, các nền tảng mạng xã hội khuyến khích người dùng chia sẻ thông tin nhiều hơn nữa, nhưng đang phải đối mặt với pháp luật và áp lực dư luận khi để tin giả, nội dung độc hại tràn lan mà không có sự kiểm duyệt gắt gao.
Với YouTube, nó cho thấy nhiều lỗ hổng trong việc gợi ý người xem video có nhiều lượt xem thay vì nội dung có ý nghĩa.
Trong nghiên cứu của Mozilla, 37.000 tình nguyện viên đã sử dụng tiện ích mở rộng để đo đạc tần suất sử dụng YouTube trong 10 tháng liên tục kết thúc vào tháng 5/2021. Khi người tham gia cắm cờ một video, tiện ích mở rộng sẽ biết được video đó đã được đề xuất cho người xem hay người xem chủ động mở nó lên.
Các video bị cắm cờ nổi bật có phiên bản ‘người lớn’ của phim hoạt hình Toy Story và video giả mạo Bill Gates thuê sinh viên đếm phiếu bầu. YouTube sau đó đã gỡ bỏ 200 video mà người tham gia cắm cờ, nhưng tổng cộng vẫn có 160 triệu lượt xem trước khi bị gỡ, theo Mozilla.
Phát ngôn viên của YouTube cho biết đã giảm đề xuất của các nội dung độc hại xuống dưới 1% và nền tảng tạo ra 30 thay đổi so với năm trước để xử lý các vấn đề. Vị đại diện này cũng cho biết hệ thống AI có khả năng phát hiện 94% video vi phạm chính sách và gỡ bỏ phần lớn chúng trước khi đạt được 10 lượt xem.
Thuật toán đề xuất của YouTube giúp tạo ra hơn 2/3 trong số 1 tỷ giờ xem mỗi ngày, từ đó kiếm được doanh thu 19,7 tỷ USD trong năm ngoái. Khoảng 720.000 giờ xem được tải lên mỗi ngày là không được giám sát bởi con người như một phần để giảm tải chi phí.
Người đứng đầu nghiên cứu này bà Brandi Geurkink cho biết người tham gia hiếm khi được gợi ý video mà họ tìm kiếm, thay vào đó thuật toán đề xuất toàn những thứ họ không muốn xem.
Nghiên cứu cũng chỉ ra rằng 60% các video được đề xuất lại (sau khi đã bị cắm cờ) đều không phải ở các nước nói tiếng Anh mà chủ yếu ở Brazil, Đức và Pháp. Trong đó, hơn 20% số video bị cắm cờ được phân loại ở mục sai thông tin, 10% là ngôn ngữ thù hận và 7% là nội dung gợi dục.
Đáp lại, YouTube luôn từ chối cung cấp thông tin về thuật toán đề xuất và coi đấy là tài sản riêng của công ty./.