سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
جستجو
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تحول تماس تصویری با هوش مصنوعی Character.AI؛ معرفی مدل جدید ویدئویی مبتنی بر صدا

Character.AI پژوهشی را که روی ویدئوی مولد انجام داده، به اشتراک گذاشته است. این شرکت مدل جدیدی به نام TalkingMachines توسعه داده که نوعی مدل انتشار خودرگرسیو (autoregressive diffusion) است و می‌تواند تنها با داشتن یک تصویر و یک سیگنال صوتی، ویدیوی شخصیت‌های هوش مصنوعی را به صورت بلادرنگ و با حرکت‌های هماهنگ با صدا تولید کند. با این فناوری، شرکت Character.AI یک قدم به تعاملات تصویری شبیه FaceTime با شخصیت‌های هوش مصنوعی نزدیک‌تر شده است.

مهم است بدانید که این فناوری فعلاً در مرحله پژوهش قرار دارد. یک مقاله علمی و دموهای ویدیویی از آن منتشر شده‌اند، اما هنوز امکان استفاده از این قابلیت در اپلیکیشن Character.AI وجود ندارد.

 

تحول تماس تصویری با هوش مصنوعی Character.AI؛ معرفی مدل جدید ویدئویی مبتنی بر صدا

 

اگر این فناوری روزی وارد اپلیکیشن Character.AI شود، به کاربران اجازه می‌دهد نقش‌آفرینی‌های تعاملی‌تر و واقعی‌تری با هوش مصنوعی داشته باشند، داستان‌پردازی تعاملی را تجربه کنند و دنیای بصری خود را بسازند.

مدل جدید TalkingMachines بر پایه فناوری‌ای به نام Diffusion Transformer (DiT) ساخته شده است؛ این فناوری در اصل مانند یک هنرمند عمل می‌کند که می‌تواند از نویز تصادفی، تصاویر دقیق و باجزئیات تولید کند و تصویر را تا رسیدن به حالت مطلوب اصلاح کند. کاری که Character.AI انجام داده، این است که این روند را فوق‌العاده سریع کرده تا حس بلادرنگ بودن ایجاد شود.

برای دستیابی به این پیشرفت‌ها، TalkingMachines از چندین تکنیک کلیدی استفاده می‌کند، از جمله: Flow-Matched Diffusion، Audio-Driven Cross Attention، Sparse Causal Attention و Asymmetric Distillation.

تکنیک Flow-Matched Diffusion روی حرکات مختلف، از حالات جزئی چهره تا ژست‌های بزرگ‌تر آموزش دیده است تا حرکت شخصیت‌های هوش مصنوعی طبیعی‌تر به نظر برسد. کار جالب‌تر را تکنیک Audio-Driven Cross Attention انجام می‌دهد؛ این روش به هوش مصنوعی کمک می‌کند نه فقط کلمات، بلکه ریتم، مکث‌ها و تکیه‌های صدا را درک کند و آن‌ها را به حرکت دقیق دهان، تکان دادن سر و پلک زدن تبدیل کند.

با استفاده از Sparse Causal Attention، Character.AI می‌تواند فریم‌های ویدئو را با هزینه کمتر و کارایی بیشتر پردازش کند و با Asymmetric Distillation، تولید ویدئوها به صورت بلادرنگ انجام می‌شود تا شبیه تماس تصویری FaceTime به نظر برسد.

Character.AI تأکید می‌کند که این پیشرفت فقط به انیمیشن صورت محدود نمی‌شود. این شرکت می‌گوید این یک گام به سوی شخصیت‌های هوش مصنوعی صوتی-تصویری تعاملی است که می‌توانید به‌صورت لحظه‌ای با آن‌ها ارتباط برقرار کنید. این مدل از سبک‌های مختلفی پشتیبانی می‌کند؛ از انسان‌های فوتورئال، انیمه، تا آواتارهای سه‌بعدی و امکان استریم با فازهای گوش دادن و صحبت کردن طبیعی را فراهم می‌کند.

این قابلیت هنوز برای استفاده در اپلیکیشن آماده نیست و Character.AI می‌گوید این فناوری فعلاً در حال پژوهش است. اگر این شرکت آن را عرضه کند، قطعاً یکی از اولین شرکت‌هایی خواهد بود که به این موفقیت رسیده و این دستاورد نقطه عطف مهمی در رقابت هوش مصنوعی به شمار می‌رود.

نظرتان را ثبت کنید کد خبر: 53271 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/04/14 تعداد مشاهده: 2558
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
Frozen Drift Race

Frozen Drift Race

ماشین مسابقه ای

Stellarium 25.2 (x64)

Stellarium 25.2 (x64)

ستاره شناسی

NetX PRO 8.6.5.0 for Android +4.1

NetX PRO 8.6.5.0 for Android +4.1

مدیریت شبکه وای فای

زلال معرفت ( مشاوره آنلاین ) نسخه 29 برای اندروید 2.2+

زلال معرفت ( مشاوره آنلاین ) نسخه 29 برای اندروید 2.2+

پاسخگوی آنلاین به سوالات شرعی و اعتقادی

مستند اشو گوروی ثروتمندان

مستند اشو گوروی ثروتمندان

مستند اشو

Windows 7 USB DVD Download Tool 1.0.30.0

Windows 7 USB DVD Download Tool 1.0.30.0

نرم افزار شرکت مایکروسافت برای رایت و فلش بوت ویندوز 7 و 8

ai.type Keyboard Plus + Emoji 9.6.2.0 for Android +4.0

ai.type Keyboard Plus + Emoji 9.6.2.0 for Android +4.0

کیبورد فارسی

The Godfather Movie Soundtracks (Music Album)

The Godfather Movie Soundtracks (Music Album)

موسیقی فیلم پدرخوانده

CyberLink YouCam Deluxe 10.1.4203.0

CyberLink YouCam Deluxe 10.1.4203.0

یوکم مدیریت دوربین و وب کم

JetBrains ReSharper Ultimate 2024.1.3 / 2023.2 / 2022.3 / 2021.3.4

JetBrains ReSharper Ultimate 2024.1.3 / 2023.2 / 2022.3 / 2021.3.4

جت برینز ریشارپر

GIF Camera 2.0.1 for Android +2.3

GIF Camera 2.0.1 for Android +2.3

ساخت تصاویر متحرکت (GIF)

Child of Light + Update v1.0.31711

Child of Light + Update v1.0.31711

فرزند نور

Strategy and Tactics Dark Ages

Strategy and Tactics Dark Ages

استراتژیک نوبتی

As Dusk Falls

As Dusk Falls

ماجراجویی برای کامپیوتر

سخنرانی حجت الاسلام حکیمیان با موضوع وحدت حوزه و دانشگاه

سخنرانی حجت الاسلام حکیمیان با موضوع وحدت حوزه و دانشگاه

سخنرانی وحدت حوزه و دانشگاه با حاج آقا حکیمیان

Car Mechanic Simulator Hot Rod Custom Cars

Car Mechanic Simulator Hot Rod Custom Cars

شبیه ساز تعمیرات ماشین

3D Hunting 2010

3D Hunting 2010

شکار حیوانات 2010

سخنرانی حجت الاسلام حسینی اراکی درباره استقامت در تحمل بلاها در راه خدا

سخنرانی حجت الاسلام حسینی اراکی درباره استقامت در تحمل بلاها در راه خدا

سخنرانی حجت الاسلام حسینی اراکی استقامت در تحمل بلاها در راه خدا

TouchPal Emoji Keyboard 7.0.9.1 for Android +4.0

TouchPal Emoji Keyboard 7.0.9.1 for Android +4.0

کیبورد تاچ پال

Dolphin Browser 12.4.0 for Android +2.3

Dolphin Browser 12.4.0 for Android +2.3

مرورگر دلفین

آموزش ایجاد Sitemap

آموزش ایجاد Sitemap

ایجاد سایت مپ

Autorun Organizer 6.0

Autorun Organizer 6.0

بهینه سازی ویندوز

سخنرانی حجت الاسلام رضا استادی با موضوع دلایل امامت امام علی (علیه السلام) بعد از غدیر

سخنرانی حجت الاسلام رضا استادی با موضوع دلایل امامت امام علی (علیه السلام) بعد از غدیر

سخنرانی دلایل امامت امام علی (علیه السلام) بعد از غدیر با رضا استادی

Mahjong Deluxe HD 1.1.18 / 2 v1.0.7 for Android +2.2

Mahjong Deluxe HD 1.1.18 / 2 v1.0.7 for Android +2.2

پازل چینی و بسیار معروف ماهجونگ

PowerISO 9.1 Full + Portable

PowerISO 9.1 Full + Portable

درایو مجازی و ساخت ایمیج

Ultra Off-Road Simulator 2019: Alaska

Ultra Off-Road Simulator 2019: Alaska

ماشین سواری برای کامپیوتر

Google Messages 20250603 For Android +8.0

Google Messages 20250603 For Android +8.0

گوگل مسج

Macrorit Data Wiper 7.1.0

Macrorit Data Wiper 7.1.0

پاک کردن اطلاعات هارد

سخنرانی دکتر ناصر رفیعی با موضوع فرار از مسئولیت

سخنرانی دکتر ناصر رفیعی با موضوع فرار از مسئولیت

سخنرانی فرار از مسئولیت با ناصر رفیعی

Archos Video Player 10.2.20180303.2237 /  All Codecs Plugin 3.3 for Android +4.2

Archos Video Player 10.2.20180303.2237 / All Codecs Plugin 3.3 for Android +4.2

پلیر پخش تصویر قدرتمند

Audio Evolution Mobile Studio 4.6.6 for Android +2.3

Audio Evolution Mobile Studio 4.6.6 for Android +2.3

ضبط صدای نامحدود

UCam Ultra Camera Pro 6.1.7.012417 for Android +2.2

UCam Ultra Camera Pro 6.1.7.012417 for Android +2.2

برنامه فیلمبرداری یو کم

CBT Nuggets - VMware vSphere 6 _ VCP6-DCV

CBT Nuggets - VMware vSphere 6 _ VCP6-DCV

فیلم آموزش VMware vSphere 6 – مرتبط با گواهینامه‌ی VCP6-DCV

مجله تخصصی صنعت فیلمسازی، تلویزیون و سرگرمی و ...

مجله تخصصی صنعت فیلمسازی، تلویزیون و سرگرمی و ...

مجله The Week UK فوریه 6 ؛ 2021

Star Size Comparison

Star Size Comparison

مقایسه اندازه ستارگان

Microsoft Visual C++ 2015-2022 Redistributable 14.44.35211 + AIO 2025.05.14

Microsoft Visual C++ 2015-2022 Redistributable 14.44.35211 + AIO 2025.05.14

ویژوال سی

Realod - Target Down

Realod - Target Down

خشاب پر - سرنگونی هدف

SuperStars V8 Racing

SuperStars V8 Racing

مسابقه ی ماشین های 8 سیلندر

حکمت الهی و آیین و مکتب رحمت اسلام از حجت الاسلام والمسلمین کاظم صدیقی

حکمت الهی و آیین و مکتب رحمت اسلام از حجت الاسلام والمسلمین کاظم صدیقی

حاج آقا کاظم صدیقی با موضوع حکمت الهی و آیین و مکتب رحمت اسلام

Smile Sokoban 1.1 for Android

Smile Sokoban 1.1 for Android

بازی معروف سوکوبان

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!