یک تکنولوژی نوآورانه از شرکت مایکروسافت به نام VASA-1، قادر است تصاویر را به ویدیوهای واقعگرایانه تبدیل کند، که به طور زیبا حرکات و گفتگوهای انسانی را نشان میدهد. این هوش مصنوعی میتواند حرکات لب را با صداهای متناسب هماهنگ کرده و علاوه بر این، احساسات و انواع حرکات چهره را نیز به شکل واقعگرایانه در ویدیو ثبت کند.
با وضوحی به اندازه ۵۱۲ در ۵۱۲ پیکسل و نرخ فریم ۴۵ در ثانیه، این تکنولوژی قادر است ویدیوهایی با کیفیت بالا از چهرهها تولید کند، که به طور بسیار طبیعی به نظر میرسند و همسان با حرکات صحبت کننده هماهنگ شدهاند.
اما استفادههای احتمالی این تکنولوژی نه تنها به مفید بودن محدود نیستند، بلکه میتوانند نگرانیهایی را دربارهی ایجاد ویدیوهای دیپفیک بسیار واقعگرایانه به وجود بیاورند.
مایکروسافت از این تکنولوژی بهعنوان یک پروژه تحقیقاتی یاد میکند و ضمانت میدهد که از آن به منظور ایجاد محتوای مضر یا گمراهکننده استفاده نخواهد شد. همچنین، شرکت قول میدهد که تا زمانی که مقررات مناسبی برای کنترل استفاده از این تکنولوژی وجود نداشته باشد، به صورت عمومی آن را منتشر نخواهد کرد.
مایکروسافت با اظهارات خود از ضرورت تنظیم قوانین و مقرراتی قوی برای استفاده از این تکنولوژی یاد میکند تا بتواند مخاطرات آن را کاهش دهد و به کاربران اطمینان دهد که از آن به درستی استفاده میشود.