Các đột phá trong lĩnh vực học máy sẽ sớm cho phép con người giả giọng bất kì ai ở bất kì chủng tộc, độ tuổi hay giới tính. Thậm chí từ ngữ điệu cho tới biểu cảm của một người đàn ông trở thành thiếu nữ.
Modulate.ai, công ty ở Cambridge, Massachusetts, Mỹ là đơn vị đứng đằng sau AI này. Công ty sử dụng các thuật toán máy học để sao chép, tìm ra các đặc trưng và bắt chước lại chất giọng của một người bất kì một cách chính xác. Phương pháp này cho phép tạo ra giọng “giả” như thật.
Công nghệ này làm người ta liên tưởng tới nhân vật Kylo Ren trong loạt phim Starwar, vốn luôn ẩn mình sau mặt nạ với một bộ lọc âm thanh khiến người ta không nghe được giọng thật của gã.
Gần như giọng của bạn sẽ được chuyển đổi theo thời gian thực, tức người bên kia đầu dây diện thoại sẽ khó mà biết được Obama "fake" đang nói chuyện với họ.
AI giờ đã có thể giả giọng bất cứ ai. Ảnh: MIT. |
Công nghệ giả lập giọng nói vẫn chưa hoàn thiện, vẫn còn đôi chút méo mó trong giọng nói. Nhưng đây được xem như tiền đề vững chắc cho những phát triển trong tương lai.
Nhân loại đang tiến vào thế giới “ảo” như “thật”, không lâu nữa. Sẽ rất khó để phân biệt mọi thứ. Modulate sử dụng mạng neural GANs (generative adversarial networks, tạm dịch: mạng nghịch tạo) để thu thập và tạo mô hình âm thanh cho các giọng nói, sau đó GANs sẽ tự học hỏi và đưa ra các đặc trưng cần thiết để giả lập một giọng nói bất kì.
Phương pháp máy học có thể hoán đổi gương mặt của 2 người trong một video (deepfake). Giờ đây, công nghệ hoán đổi giọng nói cũng dần thành hình, khiến nhiều người nổi tiếng lo ngại.
Tuy nhiên, CEO Mike Pappas của Modulate nói rằng công ty tôn trọng quyền của những người nổi tiếng, họ sẽ không tạo ra các mô hình giọng nói của những người này mà không được phép. Ông nhấn mạnh rằng công ty muốn phát triển công nghệ này không nhằm mục đích đánh lừa người khác.
Tất cả những gương mặt này đều được tạo bởi AI. Ảnh: Gaurav Oberoi. |
“Công nghệ này không phải được tạo ra để đánh lừa mọi người, mà giúp trải nghiệm tốt hơn”, Mike Pappas nói.
Mục tiêu của Modulate là trong các game online như Fornite hay Call of Duty. Người chơi có thể giả giọng một nhân vật nào đó theo thời gian thực để trao đổi thông tin với bạn cùng chơi.
Giọng nói được xem là mấu chốt trong các trò chơi này. Thực tế, không ai muốn bắn súng chung với một tên nhóc (dù giỏi), thay vào đó, họ sẽ ngưỡng mộ một anh lính chiến có "giọng" từng trải.
Cũng như bao nhiêu công nghệ khác, sử dụng thế nào là tùy mỗi người. Có thể Modulate không làm giả giọng diễn viên, nhưng một hacker nào đó sẽ làm, miễn là có người mua và chi tiền.
Trước đó, AI có thể tạo ra đoạn video Obama đang nói chuyện dựa trên biểu cảm của một diễn viên. Ảnh: BI. |
Charles Seife, Giáo sư nghiên cứu sự sai lệch thông tin tại NYU cho biết công nghệ này tiên tiến hơn các phương pháp trước đó. Ông lo ngại rằng AI có thể trở thành công cụ tuyên truyền một cách hết sức tinh vi và không thể nhận ra.
Khó có thể tưởng tượng câu chuyện sẽ rắc rối thế nào nếu 2 quốc gia đang căng thẳng bị đổ thêm dầu vào lửa, khi các phần tử cực đoan tung ra các thông tin sai lệch y như thật.
Modulate có thể tự giác giới hạn công nghệ của họ, nhưng đã là công nghệ thì sớm muộn cũng sẽ bị bắt chước. Vấn đề ra là làm sao để phân biệt thật giả. Pappas tự tin rằng Modulate có các phương pháp cần thiết để phân biệt, nên chúng ta không cần phải lo lắng.