سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
جستجو
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

در ماه‌های اخیر، OpenAI چندین ابزار جدید از جمله Operator، Deep Research، Computer-Using Agents و Responses API را منتشر کرده که بر روی عامل‌های متنی متمرکز بوده‌اند. امروز، OpenAI مدل‌های جدید تبدیل گفتار به متن و متن به گفتار را در API خود اعلام کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی قدرتمندتر، قابل شخصی‌سازی‌تر و بیانگرتر از همیشه بسازند.

 

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

 

مدل‌های جدید تبدیل گفتار به متن OpenAI، gpt-4o-transcribe و gpt-4o-mini-transcribe، بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود OpenAI ارائه می‌دهند. این پیشرفت‌ها از طریق یادگیری تقویتی و آموزش میانی گسترده با استفاده از مجموعه داده‌های صوتی متنوع و با کیفیت بالا به دست آمده است.

OpenAI ادعا می‌کند که این مدل‌های صوتی جدید می‌توانند ظرافت‌های گفتار را بهتر درک کنند، تشخیص‌های نادرست را کاهش دهند و قابلیت اطمینان رونویسی را حتی زمانی که صدای ورودی شامل لهجه‌ها، محیط‌های پر سر و صدا و سرعت‌های مختلف گفتار است، بهبود بخشند.

gpt-4o-mini-tts جدیدترین مدل تبدیل متن به گفتار است که قابلیت هدایت بهبود یافته‌ای را ارائه می‌دهد. توسعه‌دهندگان اکنون می‌توانند به مدل دستور دهند که چگونه محتوای متن را تلفظ کند. با این حال، فعلاً مدل تبدیل متن به گفتار به صداهای مصنوعی از پیش تعیین شده محدود است.

هزینه‌های مدل‌ها به شرح زیر است: مدل gpt-4o-transcribe: ۶ دلار برای هر میلیون توکن صوتی ورودی، ۲.۵۰ دلار برای هر میلیون توکن متنی ورودی و ۱۰ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-transcribe: ۳ دلار برای هر میلیون توکن صوتی ورودی، ۱.۲۵ دلار برای هر میلیون توکن متنی ورودی و ۵ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-tts: ۰.۶۰ دلار برای هر میلیون توکن متنی ورودی و ۱۲ دلار برای هر میلیون توکن صوتی خروجی

 

این هزینه‌ها به صورت دقیقه‌ای به شرح زیر محاسبه می‌شود:

  • gpt-4o-transcribe: حدود ۰.۶ سنت در دقیقه
  • gpt-4o-mini-transcribe: حدود ۰.۳ سنت در دقیقه
  • gpt-4o-mini-tts: حدود ۱.۵ سنت در دقیقه

تیم OpenAI درباره این مدل‌های صوتی جدید نوشت: “در آینده، ما قصد داریم به سرمایه‌گذاری در بهبود هوشمندی و دقت مدل‌های صوتی خود ادامه دهیم و راه‌هایی را برای اجازه دادن به توسعه‌دهندگان برای آوردن صداهای سفارشی خود جهت ساخت تجربیات شخصی‌سازی شده‌تر، به روش‌هایی که با استانداردهای ایمنی ما مطابقت دارند، بررسی کنیم.”

این مدل‌های صوتی جدید اکنون از طریق APIها برای همه توسعه‌دهندگان در دسترس هستند. OpenAI همچنین یک ادغام با Agents SDK را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد به راحتی عامل‌های صوتی بسازند. برای تجربیات گفتار به گفتار با تأخیر کم، OpenAI استفاده از Realtime API را توصیه می‌کند.

نظرتان را ثبت کنید کد خبر: 52463 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/03 تعداد مشاهده: 2421
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
Surgeon Simulator - Anniversary Edition Content

Surgeon Simulator - Anniversary Edition Content

شبیه ساز جراحی

Mp3Quran 1.1 for Android

Mp3Quran 1.1 for Android

نرم افزار ترتیل 167 قاری

Bus Simulator 18 + Updates

Bus Simulator 18 + Updates

شبیه ساز اتوبوس

مداحی حاج محمد باقر منصوری سال 96

مداحی حاج محمد باقر منصوری سال 96

محرم شب اول تا شام غریبان منصوری

آموزش کامل Corel Video Studio X5

آموزش کامل Corel Video Studio X5

آشنایی با نرم افزار کورل ویدئو استادیو ایکس 5

!Monster Loves You

!Monster Loves You

هیولا شما را دوست دارد

101 نکته کاربردی در تکنولوژی اطلاعات (IT)

101 نکته کاربردی در تکنولوژی اطلاعات (IT)

نکته هایی پرکاربرد در فناوری اطلاعات

Folder Colorizer 2 v4.1.4

Folder Colorizer 2 v4.1.4

تغییر رنگ فولدرها

آموزش میکروکنترلر AVR

آموزش میکروکنترلر AVR

آموزش میکروکنترلر ای وی آر

Dodol Keyboard 1.86 for Android +2.2

Dodol Keyboard 1.86 for Android +2.2

کیبرد جدید محصول شرکت Dodol

SuperStars V8 Racing

SuperStars V8 Racing

مسابقه ی ماشین های 8 سیلندر

سخنرانی حجت الاسلام ناصر رفیعی با موضوع دینداری هزینه دارد

سخنرانی حجت الاسلام ناصر رفیعی با موضوع دینداری هزینه دارد

سخنرانی دینداری هزینه دارد با ناصر رفیعی

NetGuard Pro - no-root firewall 2.332 for Android +5.1

NetGuard Pro - no-root firewall 2.332 for Android +5.1

فایروال نت گارد

مداحی کربلایی هلالی سال 98

مداحی کربلایی هلالی سال 98

محرم شب اول تا شام غریبان هلالی

SwishMax & ActionScript2

SwishMax & ActionScript2

آموزش swish

Where is my Heart

Where is my Heart

قلب من کجاست

Eidolon

Eidolon

تصویر خیالی

Udemy - Mastering Thymeleaf with Spring Boot

Udemy - Mastering Thymeleaf with Spring Boot

آموزش استفاده از تایم‌لیف در اسپرینگ بوت

Wise Force Deleter 1.5.3.54

Wise Force Deleter 1.5.3.54

حذف فایلهای غیر قابل حذف

کتاب آموزش آدوبی دایرکتور

کتاب آموزش آدوبی دایرکتور

آدوبی دایرکتور

Portable ESET Endpoint Antivirus 5.0.2229.1 (Update 10300) 2014-08-23

Portable ESET Endpoint Antivirus 5.0.2229.1 (Update 10300) 2014-08-23

نود 32 پرتابل 5

ModiFace Photo Editor 1.6 for Adnroid +4.0

ModiFace Photo Editor 1.6 for Adnroid +4.0

چهره خود را طراحی کنید

Acunetix Web Vulnerability Scanner 13.0.201126145

Acunetix Web Vulnerability Scanner 13.0.201126145

اکانتیکس اسکن امنیتی سایت

روزنامه ملا جلال منجم

روزنامه ملا جلال منجم

وقایع دربار شاه عباس صفوی

Where is My Water? 2 v2.1.8.3  for Android +4.0

Where is My Water? 2 v2.1.8.3 for Android +4.0

بازی حمام تمساح

دختران بهشتی(آموزش حجاب) 2.07 برای اندروید 4.3+

دختران بهشتی(آموزش حجاب) 2.07 برای اندروید 4.3+

دختران بهشتی

Skype 8.138.0.213 Win/Mac/Linux + Portable

Skype 8.138.0.213 Win/Mac/Linux + Portable

اسکایپ

Tutsplus - Vimeo for Pro Users

Tutsplus - Vimeo for Pro Users

فیلم آموزش استفاده از قابلیت‌ها و امکانات حرفه‌ای سایت ویمیو

کالبدشناسی یا آناتومی

کالبدشناسی یا آناتومی

ساختار و شیوهٔ کار بدن جانداران

Agatha Christie - The ABC Murders

Agatha Christie - The ABC Murders

پوآرو

Gauntlet + Update v1.1 + Update 1.02

Gauntlet + Update v1.1 + Update 1.02

دعوت به مبارزه

تشکیل حکومت شیعی

تشکیل حکومت شیعی

عصر صفوی

Doctor Who Infinity + The Lady of the Lake DLC

Doctor Who Infinity + The Lady of the Lake DLC

دکتر هو

Relativity Wars - A Science Space RTS

Relativity Wars - A Science Space RTS

جنگ‌های نسبیت | نسخه‌ی جدید و کامل

Rons WebLynx Pro 2024.2.3.844

Rons WebLynx Pro 2024.2.3.844

مدیریت بوکمارک ها

Digital Tutors – 2D Racing Game Series in Unity - Volume 1-2-3-4-5

Digital Tutors – 2D Racing Game Series in Unity - Volume 1-2-3-4-5

فیلم آموزش ساخت بازی دوبعدی مسابقه ای - بخش 1 ، 2 ، 3 ، 4 و 5

سخنرانی های حجت الاسلام دهنوی راجع قبل از بارداری تا دوران جوانی

سخنرانی های حجت الاسلام دهنوی راجع قبل از بارداری تا دوران جوانی

سخنرانی استاد دهنوی پیرامون تربیت فرزند

معارف زیارت عاشورا از حجت الاسلام والمسلمین سیدمحمدمهدی میرباقری - 2 جلسه

معارف زیارت عاشورا از حجت الاسلام والمسلمین سیدمحمدمهدی میرباقری - 2 جلسه

حاج آقا سیدمحمدمهدی میرباقری با موضوع معارف زیارت عاشورا

The Gardens Between

The Gardens Between

در میان باغ‌ها

Amnesia A Machine For Pigs + Update 1-2

Amnesia A Machine For Pigs + Update 1-2

فراموشی - دستگاهی ویژه‌ی خوک‌ها

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!