Reddit khóa dữ liệu công cộng trong chính sách nội dung mới, yêu cầu sử dụng bây giờ cần một hợp đồng

Vào thứ Năm, Reddit đang triển khai một chính sách mới nhằm cân đối mong muốn cấp phép dữ liệu của mình cho các công ty công nghệ lớn, như Google, và bảo vệ quyền riêng tư của người dùng. Chính sách "Nội dung Công cộng" vừa được công bố sẽ được thêm vào chính sách bảo mật và chính sách nội dung hiện có của Reddit để hướng dẫn cách dữ liệu của Reddit được truy cập và sử dụng bởi các đối tác thương mại và các đối tác khác. Liên quan đến điều này, công ty cũng đã thông báo về một subreddit dành riêng cho các nhà nghiên cứu làm việc với dữ liệu của Reddit.

Thông báo đến ngay sau khi Reddit ra mắt trên thị trường chứng khoán, trong đó công ty định vị mình để tăng doanh thu không chỉ từ quảng cáo chạy trên nền tảng của mình và việc sử dụng API bởi các nhà phát triển mà còn từ bộ dữ liệu của mình. Công ty trong tài liệu mô tả IPO của mình cho biết đã kiếm được 203 triệu đô la thông qua các thỏa thuận cấp phép dữ liệu và mong đợi con số này sẽ tăng theo thời gian.

Mặc dù Reddit lịch sử không từ chối truy cập dữ liệu của mình cho mục đích đào tạo trí tuệ nhân tạo, nhưng năm ngoái đã thay đổi hướng. Giám đốc điều hành Reddit Steve Huffman cho biết với The New York Times rằng không còn lý do gì để Reddit tiếp tục cung cấp “tất cả giá trị đó cho một số công ty lớn nhất thế giới mà không lấy phí,” truyền đạt kế hoạch của công ty để chuyển sang không gian cấp phép dữ liệu.

Với những nỗ lực hiện đã được triển khai, Chính sách Nội dung Công cộng mới sẽ khóa truy cập vào dữ liệu của Reddit mà không cần hợp đồng. (Reddit nói rằng họ không thêm các hạn chế mới, chỉ công khai chính sách họ đã áp dụng nội bộ trong một thời gian dài.)

"Rất tiếc, chúng tôi thấy ngày càng có nhiều thực thể thương mại sử dụng truy cập trái phép hoặc lạm dụng truy cập được ủy quyền để thu thập dữ liệu công cộng theo số lượng lớn, bao gồm nội dung công cộng của Reddit," Reddit viết trên blog của mình. "Xấu hơn nữa, các thực thể này cảm thấy họ không có hạn chế nào trong việc sử dụng dữ liệu đó, và họ làm như vậy mà không để ý đến quyền lợi hoặc quyền riêng tư của người dùng, bỏ qua yêu cầu hợp lý về luật pháp, an toàn và loại bỏ người dùng. Trong khi chúng tôi sẽ tiếp tục nỗ lực để chặn các hành động xấu hám biết, chúng tôi cần phải làm nhiều hơn để hạn chế truy cập vào nội dung công cộng của Reddit ở quy mô cho các thực thể đáng tin cậy đã đồng ý tuân thủ chính sách của chúng tôi. Nhưng chúng ta cũng cần tiếp tục đảm bảo rằng người dùng, quản trị viên, nhà nghiên cứu và các thực thể khái niệm, không thương mại có quyền truy cập."

Ưu tiên, quảng cáo được hướng dẫn đến một API quảng cáo để quản lý chiến dịch và theo dõi hiệu suất của họ.

Do công ty về cơ bản chỉ là một trang web lớn, có thể tìm thấy bởi các công cụ tìm kiếm, chính sách mới này nhằm mục đích khóa dữ liệu của Reddit khỏi bất kỳ thu thập trái phép nào trong khi vẫn tôn trọng quyền lợi của người dùng.

Ví dụ, Reddit nói rằng các đối tác của họ sẽ phải tải lên quyết định của người dùng để xóa nội dung của họ. Vì vậy, nếu người dùng không muốn bài đăng cá nhân của họ trở thành dữ liệu cho các động cơ trí tuệ nhân tạo trong tương lai, họ có thể chọn ra khỏi. Các đối tác cũng bị hạn chế bởi chính sách mới từ việc sử dụng nội dung của Reddit để xác định cá nhân hoặc thông tin cá nhân của họ, bao gồm việc mục tiêu quảng cáo. Các đối tác cũng không thể sử dụng nội dung của Reddit để gửi rác hoặc quấy rối người dùng của nó hoặc để tiến hành "kiểm tra tiền án, nhận dạng khuôn mặt, giám sát của chính phủ, hoặc giúp cấp quyền cho cảnh sát làm bất kỳ điều gì ở trên."

Chính sách này cũng hạn chế truy cập vào phương tiện người lớn và làm rõ rằng Reddit sẽ không bán thông tin cá nhân của người dùng. Công ty cũng lưu ý rằng họ sẽ không bao giờ cấp phép nội dung không công khai như tin nhắn riêng tư hoặc thông tin tài khoản không công khai, như email của người dùng hoặc lịch sử duyệt, ngoài những điều khác.

Để giúp các nhà nghiên cứu muốn sử dụng dữ liệu của Reddit cho các mục đích không thương mại, công ty đã tạo ra một subreddit mới, r/reddit4researchers. Công ty cho biết họ đang hợp tác với OpenMined để cũng phát triển chương trình hướng dẫn và phát triển mối hợp tác của nhà nghiên cứu với Reddit.