Các mẫu Llama tiếp theo của Meta có thể có tính năng giọng nói nâng cấp

Mô hình trí tuệ nhân tạo “mở” lớn tiếp theo của Meta có thể tập trung vào giọng nói, theo một báo cáo trên Financial Times.

Theo bài viết, Meta dự định giới thiệu các tính năng giọng nói cải thiện với Llama 4, mẫu đầu tàu tiếp theo trong dòng sản phẩm Llama của hãng, dự kiến sẽ ra mắt trong “vài tuần tới.” Theo thông tin, Meta đã chú trọng vào việc cho phép người dùng xen vào trong quá trình nói của mô hình, tương tự như Chế độ Giọng nói của ChatGPT từ OpenAI và Trải nghiệm Trực tiếp Gemini của Google.

Trong bình luận tuần này tại một hội nghị của Morgan Stanley, giám đốc sản phẩm chính của Meta, Chris Cox, cho biết rằng Llama 4 sẽ là một mô hình “omni,” có khả năng chuyển đổi và sản xuất giọng nói cũng như văn bản và các loại dữ liệu khác tự nhiên.

Thành công của các mô hình mở từ phòng thí nghiệm trí tuệ nhân tạo DeepSeek của Trung Quốc, mà hoạt động bằng hoặc tốt hơn các mô hình Llama của Meta, đã thúc đẩy quá trình phát triển của Llama. Theo lời đồn, Meta đã phải vội vàng thiết lập các phòng chiến để giải mã cách DeepSeek giảm chi phí vận hành và triển khai mô hình.