Nếu bạn đang cân nhắc việc thay thế team phiên dịch ngôn ngữ của mình bằng AI, bạn có thể muốn hoãn quyết định đó một chút.
AI có sự thiên vị khi phiên dịch ngôn ngữ
Mặc dù xử lý ngôn ngữ tự nhiên đã có những tiến bộ trong thời gian gần đây, nhưng nó cũng đã chỉ ra rằng các thuật toán ngôn ngữ có thể mang sự thiên vị. Một nghiên cứu về mô hình ngôn ngữ (GPT-3) đã cho thấy rằng nó tạo ra các phản hồi có sự thiên vị giới tính.
Chương trình được cung cấp những câu bắt đầu như:
● Anh ấy rất…
● Anh ấy sẽ được mô tả là…
Sau đó, các văn bản dự đoán được tạo ra đã được phân tích để xem các tính từ và trạng từ phổ biến được chọn cho các giới tính. Kết quả cho thấy chương trình thường mô tả phụ nữ với những từ như “nhỏ nhắn”, “tuyệt đẹp”, trong khi nam giới lại được miêu tả bằng các từ chung hơn như “to lớn” hay “dễ gần”.
Sự thiên vị trong AI không phải là điều mới mẻ, và không chỉ về giới tính mà còn về chủng tộc. Gần đây, các nhà phát triển phần mềm nhận diện khuôn mặt đã bị chỉ trích vì tạo ra các thuật toán không nhận diện được khuôn mặt của người không phải da trắng. Trong cả hai trường hợp này, không thể trách máy móc. Những kết quả này phản ánh những định kiến tồn tại trong dữ liệu mà con người đưa vào hệ thống.
Giảm thiểu sự thiên vị trong AI ngôn ngữ
Các nghiên cứu cho thấy máy móc không thể tự phát hiện sự thiên vị hay chỉ ra lý do hoặc cách thức gây hại. Vì vậy, con người cần tham gia vào quá trình học máy nếu chúng ta muốn giảm thiểu sự thiên vị trong phần mềm ngôn ngữ.
Vì công nghệ như GPT-3 và các chatbot ngôn ngữ khác được sử dụng trong các tình huống thực tế, chúng có thể ảnh hưởng sâu rộng đến cuộc sống của mọi người. Phân tích sự thiên vị trong AI không chỉ nhằm cải thiện sản phẩm cuối cùng mà còn để giảm thiểu thiệt hại mà con người có thể phải chịu do công nghệ thiên vị. Vì ngôn ngữ là sản phẩm của con người, chỉ có con người mới có thể tạo ra sự thay đổi để thúc đẩy xã hội tiến tới một tương lai công bằng và bao dung hơn. Thêm vào đó, vì các hệ thống AI có thể phát tán tin giả và tạo ra ngôn ngữ độc hại, có thể ảnh hưởng đến các sự kiện thực tế, con người cần tham gia để đảm bảo rằng công nghệ này được sử dụng một cách có trách nhiệm.
Máy móc thiếu khiếu hài hước trong phiên dịch ngôn ngữ
Việc sử dụng mạng nơ-ron thay cho hệ thống dịch thuật dựa trên cụm từ là một bước tiến lớn trong công nghệ dịch thuật máy. Điều này giúp cải thiện đáng kể chất lượng và tốc độ dịch. Tuy nhiên, dịch máy nơ-ron yêu cầu một lượng dữ liệu lớn hơn so với các hệ thống trước để hoạt động hiệu quả. Nhưng những dữ liệu song ngữ lớn hiện có chủ yếu đến từ các tài liệu chính thức và văn bản tôn giáo, những văn bản này thường sử dụng ngôn ngữ khô khan, chính thức và thiếu các yếu tố như chơi chữ, tham chiếu văn hóa, hay sắc thái ngữ nghĩa. Vì vậy, các thuật toán ngôn ngữ dựa trên những văn bản này gặp khó khăn khi áp dụng vào các tình huống giao tiếp thông thường.
Việc hiểu các câu chuyện cười hay ẩn dụ là một thử thách ngay cả đối với các biên dịch viên con người, nhưng họ có thể dựa vào những yếu tố khác như ngôn ngữ cơ thể hoặc ý định của người nói để hiểu rõ hơn về nghĩa của câu. Tuy nhiên, máy móc hiện tại chưa thể làm được điều này. Ví dụ, khi gặp phải văn bản khó hiểu, Google Dịch đôi khi đưa ra những bản dịch không chính xác, một lỗi mà các chuyên gia cho rằng do máy móc ưu tiên tính trôi chảy hơn là độ chính xác.
Việc thay thế dịch thuật bằng AI có thể gây ra hậu quả lớn nếu sai sót trong bản dịch bị đổ lỗi cho văn bản gốc, thay vì lỗi trong phần mềm dịch
Con người thu hẹp khoảng cách trong các thuật toán ngôn ngữ
Điểm yếu lớn nhất của các mô hình ngôn ngữ là chúng chỉ được huấn luyện trên các văn bản và không có kinh nghiệm thực tế. Những gì chúng biết chỉ dựa vào các văn bản mà chúng được đào tạo. Bạn có thể trò chuyện đơn giản với các trợ lý AI như Alexa và Siri vì các cuộc hội thoại này thường giới hạn trong một phạm vi hẹp, với từ vựng ít và trong môi trường được kiểm soát. Tuy nhiên, khi thực hiện những công việc phức tạp như phiên dịch trực tiếp, sẽ có thêm nhiều yếu tố mà hầu hết các chương trình không thể xử lý.
Mặc dù có nhiều tranh luận về việc máy móc có thể hiểu được ý nghĩa từ văn bản hay không, hầu hết các chuyên gia đều cho rằng chúng không thể. Tuy nhiên, có một điều rõ ràng: sự tham gia của con người trong ngôn ngữ không thể bị thay thế. Để đảm bảo tính đạo đức và chất lượng của các kết quả, các mô hình phiên dịch ngôn ngữ AI vẫn cần sự giám sát của con người.
Xem lại phần 1: Tại sao còn rất lâu các AI ngôn ngữ mới có thể thay thế được các Phiên dịch viên (Phần 1)