سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
جستجو
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

در ماه‌های اخیر، OpenAI چندین ابزار جدید از جمله Operator، Deep Research، Computer-Using Agents و Responses API را منتشر کرده که بر روی عامل‌های متنی متمرکز بوده‌اند. امروز، OpenAI مدل‌های جدید تبدیل گفتار به متن و متن به گفتار را در API خود اعلام کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی قدرتمندتر، قابل شخصی‌سازی‌تر و بیانگرتر از همیشه بسازند.

 

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

 

مدل‌های جدید تبدیل گفتار به متن OpenAI، gpt-4o-transcribe و gpt-4o-mini-transcribe، بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود OpenAI ارائه می‌دهند. این پیشرفت‌ها از طریق یادگیری تقویتی و آموزش میانی گسترده با استفاده از مجموعه داده‌های صوتی متنوع و با کیفیت بالا به دست آمده است.

OpenAI ادعا می‌کند که این مدل‌های صوتی جدید می‌توانند ظرافت‌های گفتار را بهتر درک کنند، تشخیص‌های نادرست را کاهش دهند و قابلیت اطمینان رونویسی را حتی زمانی که صدای ورودی شامل لهجه‌ها، محیط‌های پر سر و صدا و سرعت‌های مختلف گفتار است، بهبود بخشند.

gpt-4o-mini-tts جدیدترین مدل تبدیل متن به گفتار است که قابلیت هدایت بهبود یافته‌ای را ارائه می‌دهد. توسعه‌دهندگان اکنون می‌توانند به مدل دستور دهند که چگونه محتوای متن را تلفظ کند. با این حال، فعلاً مدل تبدیل متن به گفتار به صداهای مصنوعی از پیش تعیین شده محدود است.

هزینه‌های مدل‌ها به شرح زیر است: مدل gpt-4o-transcribe: ۶ دلار برای هر میلیون توکن صوتی ورودی، ۲.۵۰ دلار برای هر میلیون توکن متنی ورودی و ۱۰ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-transcribe: ۳ دلار برای هر میلیون توکن صوتی ورودی، ۱.۲۵ دلار برای هر میلیون توکن متنی ورودی و ۵ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-tts: ۰.۶۰ دلار برای هر میلیون توکن متنی ورودی و ۱۲ دلار برای هر میلیون توکن صوتی خروجی

 

این هزینه‌ها به صورت دقیقه‌ای به شرح زیر محاسبه می‌شود:

  • gpt-4o-transcribe: حدود ۰.۶ سنت در دقیقه
  • gpt-4o-mini-transcribe: حدود ۰.۳ سنت در دقیقه
  • gpt-4o-mini-tts: حدود ۱.۵ سنت در دقیقه

تیم OpenAI درباره این مدل‌های صوتی جدید نوشت: “در آینده، ما قصد داریم به سرمایه‌گذاری در بهبود هوشمندی و دقت مدل‌های صوتی خود ادامه دهیم و راه‌هایی را برای اجازه دادن به توسعه‌دهندگان برای آوردن صداهای سفارشی خود جهت ساخت تجربیات شخصی‌سازی شده‌تر، به روش‌هایی که با استانداردهای ایمنی ما مطابقت دارند، بررسی کنیم.”

این مدل‌های صوتی جدید اکنون از طریق APIها برای همه توسعه‌دهندگان در دسترس هستند. OpenAI همچنین یک ادغام با Agents SDK را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد به راحتی عامل‌های صوتی بسازند. برای تجربیات گفتار به گفتار با تأخیر کم، OpenAI استفاده از Realtime API را توصیه می‌کند.

نظرتان را ثبت کنید کد خبر: 52463 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/03 تعداد مشاهده: 2591
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
آموزش و مثال های مفید برای ADAMS

آموزش و مثال های مفید برای ADAMS

آموزش ادامس

آموزش انواع سالاد و غذاهای حاضری

آموزش انواع سالاد و غذاهای حاضری

انواع ساندویچ و رستوران های فست فودی

آموزش تصویری ترفندهای Yahoo Messenger

آموزش تصویری ترفندهای Yahoo Messenger

آموزش یاهو مسنجر

Ghost of a Tale

Ghost of a Tale

اکشن و ماجرایی

Religious stories-collections

Religious stories-collections

با معصومین(ع)

PureSync 7.2.2

PureSync 7.2.2

پشتیبان گیری و همگام‌ سازی فایل ها

مداحی حاج عبدالرضا هلالی سال 96

مداحی حاج عبدالرضا هلالی سال 96

محرم شب اول تا شام غریبان هلالی

سخنرانی حجت الاسلام صادقی واعظ با موضوع ثبات قدم

سخنرانی حجت الاسلام صادقی واعظ با موضوع ثبات قدم

حاج آقا صادقی واعظ با موضوع ثبات قدم

گلچین مداحی های شهادت حضرت زهرا س

گلچین مداحی های شهادت حضرت زهرا س

مداحی شهادت حضرت فاطمه س

شبکه اجتماعی ویراستی نسخه 7.2.0 برای اندروید 5.1+

شبکه اجتماعی ویراستی نسخه 7.2.0 برای اندروید 5.1+

ویراستی

Wise Folder Hider Pro 5.0.9.239

Wise Folder Hider Pro 5.0.9.239

مخفی کردن فایل ها و پوشه ها

In Space We Brawl

In Space We Brawl

جنجال در فضا

Windows 11 25H2 Build 26200.6584 RTM MSDN VL September 2025

Windows 11 25H2 Build 26200.6584 RTM MSDN VL September 2025

ویندوز 11

آموزش نرم افزار LabVIEW

آموزش نرم افزار LabVIEW

آموزش نرم افزار لب ویو

مجله تخصصی بررسی و تحلیل مسائل روز

مجله تخصصی بررسی و تحلیل مسائل روز

مجله The Nation فوریه 22 ؛ 2021

Avengers: Infinity War 2018

Avengers: Infinity War 2018

اونجرز 2018

آموزش نرم افزار لینگو

آموزش نرم افزار لینگو

آشنایی با LINGO برای حل مسائل بهینه سازی در دانشگاه ، صنعت و تجارت

مجله تخصصی سنگاپور که در آن شیوه زندگی و نوع خورد و خوراک و اداب مسافرت و ...

مجله تخصصی سنگاپور که در آن شیوه زندگی و نوع خورد و خوراک و اداب مسافرت و ...

مجله Singapore Tatler ژانویه 2021

سخنرانی حجت الاسلام میرهاشم حسینی درباره بهترین بنده‌هاى خدا در لسان امام رضا (ع)

سخنرانی حجت الاسلام میرهاشم حسینی درباره بهترین بنده‌هاى خدا در لسان امام رضا (ع)

سخنرانی میرهاشم حسینی بهترین بنده‌هاى خدا در لسان امام رضا (ع)

زکات نسخه 5.0 برای اندروید 2.2+

زکات نسخه 5.0 برای اندروید 2.2+

برنامه ای جامع در زمینه ی زکات برای اندروید

Autodesk Advance Steel 2026 (x64)

Autodesk Advance Steel 2026 (x64)

طراحی سازه فولادی

The Calling

The Calling

فیلم جنایی

Notification Bubbles 4.8.1 for Android +2.3

Notification Bubbles 4.8.1 for Android +2.3

حباب های اطلاع رسان

تحلیل انقلاب های اجتماعی

تحلیل انقلاب های اجتماعی

Governments and Social Revolutions

3 جلسه دعا و نیایش  از حجت الاسلام والمسلمین رفیعی

3 جلسه دعا و نیایش از حجت الاسلام والمسلمین رفیعی

حاج آقا رفیعی با موضوع دعا و نیایش

Lessons from Past Presidents by Doris Kearns Goodwin

Lessons from Past Presidents by Doris Kearns Goodwin

درسهایی از رئیس جمهورهای قبلی

Photo Director Premium 19.7.4 for Android +4.1

Photo Director Premium 19.7.4 for Android +4.1

ویرایش حرفه ای تصاویر

راهکار کاربردی و تکنیک عملی برای مدیریت ترس از سخنرانی و صحبت کردن در جمع

راهکار کاربردی و تکنیک عملی برای مدیریت ترس از سخنرانی و صحبت کردن در جمع

مرگ یا صحبت کردن در جمع مسئله این است

شهادت، انتخاب آگاهانه امام حسین (ع) از حجت الاسلام والمسلمین علی نظری منفرد

شهادت، انتخاب آگاهانه امام حسین (ع) از حجت الاسلام والمسلمین علی نظری منفرد

حاج آقا علی نظری منفرد با موضوع شهادت، انتخاب آگاهانه امام حسین (ع)

Assetto Corsa Competizione v1.10.3 H1

Assetto Corsa Competizione v1.10.3 H1

استو کورسا

Microsoft Windows Server 2016

Microsoft Windows Server 2016

ویندوز سرور 2016

آشنایی با تحلیل آماری

آشنایی با تحلیل آماری

نرم افزار آماری spss

SU Podium 2014  v2.18.930 Win x64-x86 / 2.5.002 Plus Mac

SU Podium 2014 v2.18.930 Win x64-x86 / 2.5.002 Plus Mac

پلاگین رندر گرفتن از SketchUp

Vault-Hide SMS, Pics & Videos Premium 6.9.11.82.22 for Android +2.3

Vault-Hide SMS, Pics & Videos Premium 6.9.11.82.22 for Android +2.3

رمزگذاری فایل ها

Adobe Substance 3D Stager 3.1.5

Adobe Substance 3D Stager 3.1.5

طراحی صحنه

Cumulative Update for Windows 11 25H2 26200.6899 KB5066835 April 2025

Cumulative Update for Windows 11 25H2 26200.6899 KB5066835 April 2025

آپدیت آفلاین ویندوز 11

سخنرانی حجت الاسلام مقری با موضوع عالم محضر خداست

سخنرانی حجت الاسلام مقری با موضوع عالم محضر خداست

حاج آقا مقری با موضوععالم محضر خداست

ابر و کوچه فریدون مشیری

ابر و کوچه فریدون مشیری

مجموعه اشعار زیبا از فریدون مشیری

Linux Predator-OS 3.5 (01-01-2025)

Linux Predator-OS 3.5 (01-01-2025)

پریدیتور توزیع لینوکس

Gilisoft Copy Protect 8.2

Gilisoft Copy Protect 8.2

غیر قابل کپی کردن فایل ها

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!