
Một dự án hackathon cuối tuần cho phép các đại lý trí tuệ nhân tạo nói chuyện qua điện thoại với nhau bằng một ngôn ngữ robot, một ngôn ngữ không thể hiểu được đối với con người, đã lan truyền mạnh mẽ trên mạng xã hội trong tuần qua.
Dự án, có tên là GibberLink, được tạo ra bởi hai kỹ sư phần mềm của Meta trong một cuộc thi hackathon tại London, do ElevenLabs và Andreessen Horowitz tổ chức.
GibberLink cho phép một đại lý trí tuệ nhận ra khi nó đang nói chuyện qua điện thoại với một đại lý trí tuệ khác, các nhà sáng lập dự án, Boris Starkov và Anton Pidkuiko, cho biết trong cuộc phỏng vấn với TechCrunch. Khi một đại lý trí tuệ nhận ra rằng nó đang nói chuyện với một đại lý trí tuệ khác, GibberLink yêu cầu các đại lý chuyển sang một giao thức giao tiếp hiệu quả hơn được gọi là GGWave.
GGWave là một thư viện mã nguồn mở của các âm thanh trong đó mỗi âm thanh đại diện cho một bit dữ liệu nhỏ. Điều này cho phép máy tính giao tiếp nhanh hơn và hiệu quả hơn so với việc sử dụng tiếng nói của con người. Tuy nhiên, với tai người, GGWave nghe giống như một loạt các âm thanh "bleep" và "boop" - chính xác như bạn tưởng tượng ngôn ngữ gốc của máy tính sẽ nghe như thế nào.
Mặc dù có vẻ không thể xảy ra trong ngày nay rằng hai đại lý trí tuệ nhận tạo sẽ kết thúc trên điện thoại với nhau, nhưng không phải không thể tưởng tượng các tình huống này sẽ sớm xảy ra. Các công ty ngày càng thay thế nhân viên trung tâm cuộc gọi bằng các đại lý trí tuệ từ ElevenLabs, Level AI, Retell AI và các công ty khởi nghiệp trí tuệ nhân tạo dựa trên giọng nói khác.Đồng thời, các gigant công nghệ như OpenAI, Google và Amazon đang bắt đầu giới thiệu các đại lý trí tuệ tiêu dùng có khả năng xử lý các nhiệm vụ phức tạp thay bạn. Các đại lý trí tuệ này có thể sớm có khả năng gọi điện tới một trung tâm dịch vụ khách hàng cho bạn.
Trong tương lai tiềm năng này, GibberLink có thể nâng cao hiệu quả của giao tiếp giữa các đại lý trí tuệ nhân tạo, miễn là cả hai bên đều đã kích hoạt giao thức. Mặc dù các mô hình giọng nói trí tuệ khá tốt trong việc dịch tiếng nói của con người thành mã được mô hình trí tuệ hiểu, toàn quá trinh cực kỳ tốn năng lượng tính toán - và hoàn toàn không cần thiết - nếu hai đại lý trí tuệ đang nói chuyện với nhau. Starkov và Pidkuiko ước lượng rằng các đại lý trí tuệ giao tiếp qua GGWave có thể giảm chi phí tính toán một cách đáng kể hoặc hơn một bậc.
Tuy nhiên, đến hiện tại thì chỉ là một dự án thú vị. Starkov và Pidkuiko đã tạo ra một trang web mà bạn có thể mở trên hai thiết bị để xem những đại lý trí tuệ nói chuyện với nhau trong GGWave.
Giống như một bộ phim khoa học viễn tưởng hay, demo của GibberLink đã gây tò mò rộng rãi - và lo lắng - về tương lai của các đại lý trí tuệ. Trong tuần qua kể từ cuộc thi hackathon tại London, video demo của GibberLink đã thu hút hơn 15 triệu lượt xem trên X, và thậm chí được đăng lại bởi người đánh giá công nghệ có số lượng người theo dõi nhiều nhất trên YouTube, Marques Brownlee.
Tuy nhiên, Starkov và Pidkuiko nhấn mạnh rằng công nghệ cơ bản của GibberLink không mới - nó trở lại từ các modem internet dial-up của thập niên 1980.
Một số người có thể nhớ lại các âm thanh đặc trưng của máy tính sớm truyền thông với modem qua đường dây điện thoại gia đình - một quy trình được biết đến là "handshake". Về cơ bản, sự "handshake" này đại diện cho việc truyền dữ liệu sử dụng một ngôn ngữ robot, tương tự như những gì đang diễn ra giữa các đại lý trí tuệ qua GibberLink.
Starkov và Pidkuiko cũng lưu ý rằng làn sóng lan truyền xung quanh GibberLink đã gặt hái được một cuộc sống riêng. Một người đã mua tên miền GibberLink.com và hiện đang cố gắng bán nó với giá 85.000 đô la. Người khác đã tạo ra một đồng tiền ảo GibberLink, trong khi một số người giả mạo đang bán các khóa học trực tuyến giả mạo về "giao tiếp đại lý đến đại lý".
Hiện nay, các nhà sáng lập GibberLink cho biết họ không tiếp thị thương mại cho dự án này, và làm rõ rằng nó không liên quan đến công việc của họ tại Meta. Thay vào đó, Starkov và Pidkuiko đã cung cấp mã nguồn mở của GibberLink trên GitHub, tuy nhiên họ nói họ có thể làm thêm một số công cụ liên quan đến dự án trong thời gian rảnh rỗi của mình và phát hành nó trong tương lai gần.