Компания OpenAI использовала алгоритм транскрипции текста Whisper, чтобы расшифровывать более миллиона часов видео с YouTube для обучения своей новейшей модели языковой модели GPT-4.По данным The New York Times, у OpenAI закончились качественные данные для обучения еще в 2021 году.
Чтобы решить эту проблему, компания разработала собственную модель Whisper специально для расшифровки видео, подкастов и аудиокниг.The Times утверждает, что президент OpenAI Грег Брокман (Greg Brockman) лично участвовал в сборе роликов с YouTube.Представитель компании заявил, что они используют различные источники данных, включая общедоступные и полученные по партнерским соглашениям.
Google, владелец YouTube, заявил, что условия использования платформы запрещают несанкционированный сбор или загрузку контента.
Читать на gagadget.com