Apple chi tiết cách họ dự định cải thiện các mô hình AI bằng cách phân tích dữ liệu người dùng một cách riêng tư

Sau khi nhận được chỉ trích về hiệu suất không ấn tượng của các sản phẩm AI của mình, đặc biệt là trong các lĩnh vực như tóm tắt thông báo, Apple vào thứ Hai đã chi tiết cách họ đang cố gắng cải thiện các mô hình AI của mình bằng cách phân tích dữ liệu người dùng một cách riêng tư với sự hỗ trợ của dữ liệu tổng hợp.

Sử dụng phương pháp gọi là “differential privacy,” công ty cho biết họ sẽ trước tiên tạo ra dữ liệu tổng hợp và sau đó thu thập dữ liệu từ các thiết bị của người dùng (nếu họ đã chọn tham gia chia sẻ dữ liệu analytics thiết bị với Apple) với các đoạn của dữ liệu tổng hợp đã tạo ra để so sánh độ chính xác của các mô hình của mình, và sau đó cải thiện chúng.

“Dữ liệu tổng hợp được tạo ra để mô phỏng định dạng và các thuộc tính quan trọng của dữ liệu người dùng, nhưng không chứa bất kỳ nội dung do người dùng tạo ra nào,” công ty viết trong một bài đăng trên blog. “Để chọn lọc một bộ dữ liệu tổng hợp đại diện, chúng tôi bắt đầu bằng việc tạo ra một bộ dữ liệu tổng hợp lớn về các thông điệp về nhiều chủ đề […] Sau đó, chúng tôi rút ra một biểu diễn, gọi là một embedding, của mỗi tin tức tổng hợp mà nắm bắt một số chiều quan trọng của thông điệp như ngôn ngữ, chủ đề và độ dài.”

Công ty cho biết những embedding này sau đó được gửi đến một số thiết bị người dùng đã chọn tham gia vào Device Analytics, và các thiết bị sau đó so sánh chúng với mẫu email để thông báo cho Apple những embedding nào chính xác nhất.

Công ty cho biết họ đang sử dụng phương pháp này để cải thiện các mô hình Genmoji của mình, và trong tương lai sẽ sử dụng dữ liệu tổng hợp cho Image Playground, Image Wand, Memories Creation và Writing Tools cũng như Visual Intelligence. Apple nói họ cũng sẽ thu thập dữ liệu từ người dùng đã chọn tham gia chia sẻ dữ liệu analytics thiết bị với dữ liệu tổng hợp để cải thiện bản tóm tắt email.