Meta ra mắt chương trình mới để cải thiện trí tuệ nhân tạo trong nói và dịch

Meta đang ra mắt chương trình mới phối hợp với UNESCO để thu thập các bản ghi âm và bản dịch mà công ty cho biết sẽ giúp phát triển trí tuệ nhân tạo công khai trong tương lai.

Chương trình, gọi là Chương trình Đối tác Công nghệ Ngôn ngữ, đang tìm kiếm các đối tác có thể đóng góp hơn 10 giờ bản ghi âm với bản dịch, lượng lớn văn bản viết và các bộ câu đã dịch sang "nhiều ngôn ngữ khác nhau". Theo Meta, các đối tác sẽ làm việc với các nhóm trí tuệ nhân tạo của công ty để tích hợp các ngôn ngữ này vào các mô hình nhận dạng và dịch nói của trí tuệ nhân tạo, sau khi hoàn thiện chúng sẽ được công bố mã nguồn mở.

Các đối tác cho đến nay bao gồm chính phủ Nunavut, một vùng lãnh thổ có dân số thưa phía Bắc Canada. Một số cư dân của Nunavut nói các ngôn ngữ Inuit được gọi chung là Inuktut.

"Nỗ lực của chúng tôi đặc biệt tập trung vào các ngôn ngữ phục vụ kém, để hỗ trợ công việc của UNESCO," Meta viết trong một bài đăng trên blog được cung cấp cho TechCrunch. "Cuối cùng, mục tiêu của chúng tôi là tạo ra các hệ thống thông minh có thể hiểu và đáp ứng nhu cầu con người phức tạp, bất kể ngôn ngữ hoặc nền văn hóa."

Bổ sung cho chương trình mới, Meta nói rằng họ đang phát hành một tiêu chuẩn dịch máy nguồn mở để đánh giá hiệu suất của các mô hình dịch ngôn ngữ. Tiêu chuẩn này, gồm các câu được soạn bởi các nhà ngôn ngữ học, hỗ trợ bảy ngôn ngữ và có thể truy cập - và đóng góp - từ nền tảng phát triển trí tuệ nhân tạo Hugging Face.

Meta đang đặt cả hai sáng kiến này dưới cái nhìn từ thiện. Nhưng công ty sẽ hưởng lợi từ việc nâng cấp các mô hình nhận dạng giọng nói và dịch nói.

Meta tiếp tục mở rộng số ngôn ngữ mà trợ lý của họ dựa trên trí tuệ nhân tạo hỗ trợ, Meta AI, và thử nghiệm các tính năng như dịch tự động cho người sáng tạo. Tháng Chín vừa qua, Meta thông báo rằng họ sẽ bắt đầu thử nghiệm một công cụ để dịch giọng trong Instagram Reels, cho phép người sáng tạo lồng tiếng giọng nói của mình và tự đồng hóa giọng môi tự động.

Cách Meta xử lý nội dung bằng các ngôn ngữ khác tiếng Anh trên các nền tảng của họ đã bị chỉ trích nhiều. Theo một báo cáo, Facebook để lại gần 70% thông tin sai lầm về COVID bằng tiếng Ý và Tây Ban Nha không bị gắn cờ so với chỉ 29% thông tin sai tương tự bằng tiếng Anh. Và các tài liệu rò rỉ từ công ty tiết lộ rằng bài viết bằng tiếng Ả Rập thường bị gắn cờ sai là bài viết chủ nghĩa thù ghét.

Meta đã nói rằng họ đang tiến hành các bước để cải thiện công nghệ dịch và kiểm duyệt của họ.