هوش مصنوعی

انقلاب جدید OpenAI: نسل بعدی هوش مصنوعی در تولید تصاویر با GPT-4o معرفی شد

قابلیت پیشرفته و مورد انتظار تولید تصویر هوش مصنوعی OpenAI اکنون در دسترس است. به جای استفاده از یک مدل جداگانه مانند Dall-E برای تولید تصویر، مولد تصویر پیشرفته جدید اکنون بخشی از GPT-4o است.

چندین مدل تولید تصویر هوش مصنوعی در بازار وجود دارد که می‌توانند صحنه‌های خیره‌کننده و فراواقعی ایجاد کنند. با این حال، همه آنها در ایجاد تصاویر شامل متن، لوگوها و سایر موارد رایج مورد استفاده در زندگی روزمره با مشکل مواجه هستند.

OpenAI ادعا می‌کند که این نسل جدید تولید تصویر GPT-4o می‌تواند این کاستی‌ها را با بهره‌گیری از پایگاه دانش و متن گفتگو برطرف کند و متن‌ها را به طور دقیق رندر کرده و دستورات را به طور دقیق دنبال کند. این مدل جدید همچنین به کاربران اجازه می‌دهد تصاویر آپلود شده را اصلاح کنند یا با استفاده از تصویر آپلود شده به عنوان الهام بصری، تصاویر جدیدی ایجاد کنند.

این مدل جدید تولید تصویر GPT-4o اکنون برای تمام کاربران ChatGPT Plus، Pro، Team و رایگان در حال راه‌اندازی است. از آنجایی که این مدل جدید به مولد تصویر پیش‌فرض در ChatGPT تبدیل خواهد شد، کاربران می‌توانند بدون نیاز به انتخاب اضافی قبل از دستور خود، از آن لذت ببرند. کاربران همچنین می‌توانند با تعیین نسبت ابعاد، رنگ‌های دقیق با استفاده از کدهای هگز، یا پس‌زمینه شفاف، تصاویر خود را سفارشی کنند. OpenAI همچنین این مدل جدید را در هفته‌های آینده برای کاربران ChatGPT Enterprise و Edu عرضه خواهد کرد.

این مدل جدید همچنین می‌تواند از طریق Sora برای ایجاد تصاویر و از طریق DALL·E GPT اختصاصی در دسترس باشد. برای توسعه‌دهندگان، تولید تصویر با API مدل GPT-4o در هفته‌های آینده راه‌اندازی خواهد شد.

این مدل همچنین محدودیت‌هایی دارد. اول، از آنجا که مدل تصاویر دقیق‌تری ایجاد می‌کند، زمان تولید ممکن است تا یک دقیقه طول بکشد. در زمان راه‌اندازی محدودیت‌های زیر را دارد که OpenAI در هفته‌ها و ماه‌های آینده آنها را برطرف خواهد کرد:

• گاهی اوقات ممکن است تصاویر طولانی‌تر، مانند پوسترها را، به خصوص در نزدیکی پایین، بیش از حد برش دهد. • تولید تصویر همچنین می‌تواند در دستورات با متن کم، اطلاعات نادرست تولید کند. • هنگام تولید تصاویری که به پایگاه دانش آن متکی هستند، ممکن است در رندر دقیق بیش از 10-20 مفهوم متمایز در یک زمان، مانند یک جدول تناوبی کامل، مشکل داشته باشد. • مدل گاهی در رندر زبان‌های غیرلاتین مشکل دارد و کاراکترها می‌توانند نادرست یا توهمی باشند، به خصوص با پیچیدگی بیشتر. • درخواست‌های ویرایش بخش‌های خاصی از یک تصویر تولید شده، مانند اشتباهات تایپی، همیشه مؤثر نیست و ممکن است بخش‌های دیگر تصویر را به روشی که درخواست نشده تغییر دهد یا خطاهای بیشتری ایجاد کند. • مشخص شده که مدل در هنگام درخواست رندر اطلاعات دقیق در اندازه بسیار کوچک با مشکل مواجه می‌شود.

تمام تصاویر تولید شده با استفاده از این مدل جدید با متادیتای C2PA همراه خواهند بود و ابزار داخلی OpenAI می‌تواند تأیید کند که آیا یک تصویر با استفاده از این مدل تولید شده است یا خیر.

علی‌رغم محدودیت‌های فعلی، مدل جدید GPT-4o قول می‌دهد که قابلیت‌های ایجاد تصویر دقیق‌تر و قابل سفارشی‌سازی بیشتری را برای کاربران فراهم کند. همانطور که OpenAI به پالایش مدل ادامه می‌دهد، می‌توانیم انتظار بهبود بیشتر در عملکرد و قابلیت اطمینان آن را داشته باشیم.

نظرتان را ثبت کنید کد خبر: 52488 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/06 تعداد مشاهده: 2918

اخبار مرتبط با این خبر

سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

انی دسک نرم‌افزار کنترل از راه دور کامپیوتر

ادوب اکروبات ریدر

مجازی ساز وی ام ویر

اینترنت دانلود منیجر

گوگل کروم

دات نت فریم ورک

آفیس 2021

فایرفاکس مرورگر اینترنتی

مرورگر اینترنتی اپرا

پخش فیلم و صدا کالایت

ویندوز 11

نمایش پی دی اف

فوتوشاپ

ویندوز 10

فعالساز ویندوز و آفیس

پات پلیر

سی کیلینر

وین رار

آپدیت آفلاین نود 32

بازیابی اطلاعات

الترا ایزو ویرایش فایل ISO

درایور پک سولوشن

ویندوز 7 آلتیمیت

نود 32 اندپوینت آنتی ویروس 5

هوش مصنوعی

انقلاب جدید OpenAI: نسل بعدی هوش مصنوعی در تولید تصاویر با GPT-4o معرفی شد

تولید تصاویر دکتر مارتین لوتر کینگ متوقف شد؛ یکی از جنجالی‌ترین محدودیت‌های هوش مصنوعی!

هوش مصنوعی

مایکروسافت Copilot حالا می‌تواند همه فایل‌های شما در گوگل و آفیس را یکجا بخواند و تبدیل کند!

هوش مصنوعی

Gemini در Chrome: دستیار هوش مصنوعی گوگل که همه کارهای شما را زیر نظر می‌گیرد!

هوش مصنوعی

یک انقلاب جدید در ChatGPT؛ دستیار هوشمند شما حالا پیش‌بینی می‌کند!

هوش مصنوعی

معرفی مدل جدید GPT-5-Codex: انقلابی در کدنویسی هوش مصنوعی

هوش مصنوعی

نصب خودکار اپلیکیشن Microsoft 365 Copilot بر روی ویندوز: شروع از اکتبر 2025

هوش مصنوعی

CSI ETABS Ultimate 22.7.0.4095 / 21.2.0 / 19.1.0 / 18.1.1 / 17.0.1 / CSI Detail 20.0.0 / CSI Detailing 2.0

طراحی سازه های ساختمانی ایتبس

1001Jigsaw - Earth Chronicles 4

هزار و یک پازل - تاریخچه‌ی زمین 4

Truck & Logistics Simulator

شبیه ساز کامیون سواری و حمل و نقل برای کامپیوتر

Easy Gamer Utility PRO 1.3.87

حل مشکلات بازی‌ها در ویندوز

ترانه تیتراژ آخر ماه عسل 1396

آهنگ سینا شعبانخانی ماه عسل 96

Draugen + Update v1.1

دراگن

همراه بانک گردشگری نسخه 11.4.0 اندروید

نرم افزار پرداخت از طریق همراه بانک گردشگری

مجموعه فیلم‌های آموزش کامل لاراول Laravel - به زبان فارسی

آموزش لاراول

Pink Floyd - The Dark Side of the Moon

آهنگ های پینک فلوید

Fishdom Frosty Splash

حل پازل جهت ارتقا آکواریوم

سیستم عامل لینوکس را خوب یاد بگیریم

آموزش ابونتو

رسیدن به خواسته‌ها

زندگی رؤیایی

Zen Browser 1.16.3b

مرورگر

Killer Queen Black

بهترین بازی های دنیا

Part of the Undergraduate Topics in Computer Science book series

مبانی زبان برنامه نویسی

eFootball 2026

ای فوتبال 2026

BoothStache 1.7 for Android +2.3

برای خود سبیل بگذارید!

گلچین بهترین مداحی کربلایی جواد مقدم

مداحی کربلایی جواد مقدم

مداحی کربلایی حمید علیمی سال 99

مداحی کربلایی حمید علیمی سال 99

Private Gallery 2.8.340 for Android +2.3

مخفی کردن تصاویر و ویدئوها

Mad Riders

SoftGozar.com
1387-1404 | کلیه حقوق سایت متعلق به سافت گذر می باشد