كشفت شركة جوجل عن إتاحة الاستماع والتحدث والترجمة بتقنية الذكاء الاصطناعي عبر النموذج اللغوي الجديد AudioPaLM ، الذي يعتمد على نقاط القوة في نموذجي PaLM-2 و AudioLM.

ويعتبر نموذج PaLM-2 أحد نماذج اللغة الكبيرة LLMs لفهم ومحاكاة وتوليد النصوص بدقة عالية وسرعة كبيرة، فيما يُعنى نموذج AudioLM بالصوتيات مثل الحفاظ على هوية المتحدث ونبرة الصوت، ليكونا سوياً نموذجاً قادراً على التحدث والترجمة.

كما يتيح AudioPaLM الترجمة الصوتية من لغة إلى أخرى مع الحفاظ على نبرة الصوت، والتقاط الأصوات أو الأوامر المنطوقة وإعادة إنتاجها بلغات أخرى مختلفة، كما يمكنه التعرّف على الأصوات وترجمتها إلى نصوص.