سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
جستجو
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تحول تماس تصویری با هوش مصنوعی Character.AI؛ معرفی مدل جدید ویدئویی مبتنی بر صدا

Character.AI پژوهشی را که روی ویدئوی مولد انجام داده، به اشتراک گذاشته است. این شرکت مدل جدیدی به نام TalkingMachines توسعه داده که نوعی مدل انتشار خودرگرسیو (autoregressive diffusion) است و می‌تواند تنها با داشتن یک تصویر و یک سیگنال صوتی، ویدیوی شخصیت‌های هوش مصنوعی را به صورت بلادرنگ و با حرکت‌های هماهنگ با صدا تولید کند. با این فناوری، شرکت Character.AI یک قدم به تعاملات تصویری شبیه FaceTime با شخصیت‌های هوش مصنوعی نزدیک‌تر شده است.

مهم است بدانید که این فناوری فعلاً در مرحله پژوهش قرار دارد. یک مقاله علمی و دموهای ویدیویی از آن منتشر شده‌اند، اما هنوز امکان استفاده از این قابلیت در اپلیکیشن Character.AI وجود ندارد.

 

تحول تماس تصویری با هوش مصنوعی Character.AI؛ معرفی مدل جدید ویدئویی مبتنی بر صدا

 

اگر این فناوری روزی وارد اپلیکیشن Character.AI شود، به کاربران اجازه می‌دهد نقش‌آفرینی‌های تعاملی‌تر و واقعی‌تری با هوش مصنوعی داشته باشند، داستان‌پردازی تعاملی را تجربه کنند و دنیای بصری خود را بسازند.

مدل جدید TalkingMachines بر پایه فناوری‌ای به نام Diffusion Transformer (DiT) ساخته شده است؛ این فناوری در اصل مانند یک هنرمند عمل می‌کند که می‌تواند از نویز تصادفی، تصاویر دقیق و باجزئیات تولید کند و تصویر را تا رسیدن به حالت مطلوب اصلاح کند. کاری که Character.AI انجام داده، این است که این روند را فوق‌العاده سریع کرده تا حس بلادرنگ بودن ایجاد شود.

برای دستیابی به این پیشرفت‌ها، TalkingMachines از چندین تکنیک کلیدی استفاده می‌کند، از جمله: Flow-Matched Diffusion، Audio-Driven Cross Attention، Sparse Causal Attention و Asymmetric Distillation.

تکنیک Flow-Matched Diffusion روی حرکات مختلف، از حالات جزئی چهره تا ژست‌های بزرگ‌تر آموزش دیده است تا حرکت شخصیت‌های هوش مصنوعی طبیعی‌تر به نظر برسد. کار جالب‌تر را تکنیک Audio-Driven Cross Attention انجام می‌دهد؛ این روش به هوش مصنوعی کمک می‌کند نه فقط کلمات، بلکه ریتم، مکث‌ها و تکیه‌های صدا را درک کند و آن‌ها را به حرکت دقیق دهان، تکان دادن سر و پلک زدن تبدیل کند.

با استفاده از Sparse Causal Attention، Character.AI می‌تواند فریم‌های ویدئو را با هزینه کمتر و کارایی بیشتر پردازش کند و با Asymmetric Distillation، تولید ویدئوها به صورت بلادرنگ انجام می‌شود تا شبیه تماس تصویری FaceTime به نظر برسد.

Character.AI تأکید می‌کند که این پیشرفت فقط به انیمیشن صورت محدود نمی‌شود. این شرکت می‌گوید این یک گام به سوی شخصیت‌های هوش مصنوعی صوتی-تصویری تعاملی است که می‌توانید به‌صورت لحظه‌ای با آن‌ها ارتباط برقرار کنید. این مدل از سبک‌های مختلفی پشتیبانی می‌کند؛ از انسان‌های فوتورئال، انیمه، تا آواتارهای سه‌بعدی و امکان استریم با فازهای گوش دادن و صحبت کردن طبیعی را فراهم می‌کند.

این قابلیت هنوز برای استفاده در اپلیکیشن آماده نیست و Character.AI می‌گوید این فناوری فعلاً در حال پژوهش است. اگر این شرکت آن را عرضه کند، قطعاً یکی از اولین شرکت‌هایی خواهد بود که به این موفقیت رسیده و این دستاورد نقطه عطف مهمی در رقابت هوش مصنوعی به شمار می‌رود.

نظرتان را ثبت کنید کد خبر: 53271 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/04/14 تعداد مشاهده: 3855
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
آموزش نقاشی کودکان

آموزش نقاشی کودکان

آموزش نقاشی

Dracula 4 - Shadow of the Dragon - Casual_Edition

Dracula 4 - Shadow of the Dragon - Casual_Edition

دراکولا 4 - سایه اژدها

Five Nights at Freddy's: Into the Pit + Updates

Five Nights at Freddy's: Into the Pit + Updates

پنج شب با فردی

مجله تخصصی برای علاقه مندان به هوانوردی داخلی و نظامی و تمرینات

مجله تخصصی برای علاقه مندان به هوانوردی داخلی و نظامی و تمرینات

مجله Scramble Magazine دسامبر 2020

PSB - Private SMS MMS Calls 3.6 b.50 for Android

PSB - Private SMS MMS Calls 3.6 b.50 for Android

تماس و پیام خصوصی

3 جلسه شخصیت امام علی علیه السلام از حجت الاسلام والمسلمین رفیعی

3 جلسه شخصیت امام علی علیه السلام از حجت الاسلام والمسلمین رفیعی

حاج آقا رفیعی با موضوع شخصیت امام علی علیه السلام

Football Club Simulator

Football Club Simulator

شبیه‌ساز مدیریت باشگاه فوتبال

Stardock WindowBlinds 11.07

Stardock WindowBlinds 11.07

زیباساز و تغییر پوسته ویندوز

Spider-Man: Into the Spider-Verse

Spider-Man: Into the Spider-Verse

انیمیشن مرد عنکبوتی

سخنرانی حجت الاسلام پناهیان با موضوع ضرورت زیارت اربعین

سخنرانی حجت الاسلام پناهیان با موضوع ضرورت زیارت اربعین

سخنرانی ضرورت زیارت اربعین پناهیان

آموزش VBA در MS office

آموزش VBA در MS office

ویژوال بیسیک در ام اس آفیس

Pro Basketball Manager 2016

Pro Basketball Manager 2016

مدیریت بسکتبال 2016

Harry Potter and the Prisoner of Azkaban

Harry Potter and the Prisoner of Azkaban

هری پاتر 3

آموزش ساخت DLL در Visual C#.net 2010

آموزش ساخت DLL در Visual C#.net 2010

آموزش ساخت دی ال ال در ویژوال سی شارپ

Kalimba

Kalimba

اکشن فکری

نمونه سئوالات نوسازی و دگرگونی سیاسی

نمونه سئوالات نوسازی و دگرگونی سیاسی

نوسازی و دگرگونی سیاسی

خلاصه روان شناسی عمومی اثر اتکینسون

خلاصه روان شناسی عمومی اثر اتکینسون

روان شناسی عمومی اثر اتکینسون

Movavi Video Editor Plus 2025 25.3.0 / macOS

Movavi Video Editor Plus 2025 25.3.0 / macOS

ویرایش ویدئو موواوی ویدئو ادیتور

GO Launcher EX Notification 2.8 for Android +2.0

GO Launcher EX Notification 2.8 for Android +2.0

پلاگین اطلاع رسانی لانچر GO Launcher

Nature's Misfits

Nature's Misfits

مستند حیات وحش

MiniTool Power Data Recovery 12.6 Business Technician + WinPE ISO

MiniTool Power Data Recovery 12.6 Business Technician + WinPE ISO

بازیابی فایل های پاک شده

تلاوت مجلسی استاد محمد صدیق المنشاوی سوره مبارکه نصر

تلاوت مجلسی استاد محمد صدیق المنشاوی سوره مبارکه نصر

تلاوت محمد صدیق المنشاوی سوره نصر

Steganos Privacy Suite 21.1.0 Rev 12679

Steganos Privacy Suite 21.1.0 Rev 12679

محافظت از اطلاعات ویندوز

گلچین بهترین مداحی حاج سید مهدی میرداماد

گلچین بهترین مداحی حاج سید مهدی میرداماد

مداحی حاج سید مهدی میرداماد

Police Simulator 2

Police Simulator 2

شبیه ساز پلیس 2

Elden Ring Nightreign + Updates

Elden Ring Nightreign + Updates

الدن رینگ نایترین

نیاز های معنوی در عصر حاضر

نیاز های معنوی در عصر حاضر

معرفی عرفان اسلامی از نگاه قرآن

آموزش  نرم افزار AutoRun Pro Enterprise

آموزش نرم افزار AutoRun Pro Enterprise

آموزش اتوران پرو اینترپرایس

مداحی میثم مطیعی سال 98

مداحی میثم مطیعی سال 98

محرم شب اول تا شام غریبان مطیعی

سخنرانی شهید مطهری با موضوع نکاتی درباره مطالب خرافی عدد ۱۳

سخنرانی شهید مطهری با موضوع نکاتی درباره مطالب خرافی عدد ۱۳

نکاتی درباره مطالب خرافی عدد ۱۳ شهید مرتضی مطهری

ملا نصرالدین شخصیتی داستانی و بذله‌گو

ملا نصرالدین شخصیتی داستانی و بذله‌گو

داستان‌های لطیفه‌آمیز ملا نصرالدین

Toro

Toro

شبیه‌ساز گاوبازی

جاذبه های گردشگری تایلند

جاذبه های گردشگری تایلند

راهنمای گردشگری کشور تایلند

فیلم کامل نخستین مصاحبه مطبوعاتی سردار سرلشکر حاج قاسم سلیمانی

فیلم کامل نخستین مصاحبه مطبوعاتی سردار سرلشکر حاج قاسم سلیمانی

مصاحبه سردار قاسم سلیمانی

Oracle Database 12c Release 2 Build 12.2.0.1.0 x64

Oracle Database 12c Release 2 Build 12.2.0.1.0 x64

قوی ترین و عظیم ترین نرم افزار پایگاه داده (نسخه تحت ویندوز)

Video Compress 5.0.1 for Android +4.0

Video Compress 5.0.1 for Android +4.0

فشرده سازی ویدیو

Lynda - Photography 101 - Shooting in Low Light

Lynda - Photography 101 - Shooting in Low Light

فیلم آموزش عکس‌برداری در نور کم

انواع حملات به شبکه های کامپیوتری

انواع حملات به شبکه های کامپیوتری

ایمن سازی شبکه های کامپیوتری

NCSS Pro 2021 21.0.3 / PASS Pro 2021 21.0.3

NCSS Pro 2021 21.0.3 / PASS Pro 2021 21.0.3

نرم افزار تجزیه و تحلیل آمار

aniPet Aquarium Live Wallpaper 2.5.2 for Android +2.1

aniPet Aquarium Live Wallpaper 2.5.2 for Android +2.1

ماهیهای دریا

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!