یکی از بزرگترین بحث های داغ در مورد استفاده روزافزون از هوش مصنوعی تولید کننده این است که شرکت هایی که این مدل های هوش مصنوعی را آموزش می دهند، ممکن است از داده های تحت مالکیت وب که توسط سازندگان محتوا کپی رایت شده است، استفاده کنند. این موضوع منجر به طرح تعدادی شکایت علیه شرکت های هوش مصنوعی تولید کننده، از جمله مایکروسافت، توسط روزنامه ها، نویسندگان و سایر شرکت های رسانه ای شده است که ادعا می کنند Copilot، ChatGPT و سایر مدل های زبان بزرگ (LLMs) با داده هایی آموزش داده می شوند که حق دسترسی به آنها را ندارند.
این هفته، مصطفی سلیمان، مدیرعامل جدید بخش هوش مصنوعی مایکروسافت، در طول جشنواره ایده های اسپن مصاحبه شد. این مصاحبه که توسط اندرو راس سورکین از سی ان بی سی انجام شد، در صفحه یوتیوب ان بی سی نیوز منتشر شد.
سورکین از سلیمان در مورد موضوع هوش مصنوعی تولید کننده که داده ها را از وب می گیرد سوال کرد و اینکه آیا این مدل ها به گفته سورکین "دزدی مؤثر مالکیت فکری جهان توسط شرکت های هوش مصنوعی" را انجام داده اند.
ممکن است پاسخ سلیمان چیزی نباشد که سازندگان محتوای وب محور بخواهند بشنوند. او گفت: با احترام به محتوایی که از دهه ۹۰ در وب باز قرار دارد، قرارداد اجتماعی این محتوا از آن زمان این بوده است که استفاده منصفانه باشد. هر کسی می تواند آن را کپی کند، با آن چیزی بسازد و آن را بازتولید کند. این "نرم افزار رایگان" بوده است، این درک رایج بوده است. یک دسته جداگانه وجود دارد که در آن یک وب سایت، ناشر یا سازمان خبری به صراحت گفته است که برای هیچ دلیلی به جز فهرست بندی من که مردم بتوانند این محتوا را پیدا کنند، مرا خزش یا خراش ندهید. این یک منطقه خاکستری است و فکر می کنم راه خود را در دادگاه ها طی خواهد کرد.
به نظر می رسد پاسخ سلیمان نشان می دهد که مایکروسافت و شاید سایر شرکت های هوش مصنوعی تولید کننده، بر این باورند که تقریباً از همه چیز در اینترنت می توان برای آموزش مدل های خود استفاده کرد و این شرکت ها مجبور نیستند به سازندگان آن محتوا غرامت بدهند. این ادعا به احتمال زیاد در ماه ها و سال های آینده باعث ایجاد مشکلات حقوقی بیشتری خواهد شد.