Во вторник компания xAI Илона Маска, занимающаяся разработкой искусственного интеллекта, объявил бета-релиз двух новых языковых моделей, Grok-2 и Grok-2 mini, доступных подписчикам его социальной медиа-платформы X (ранее Twitter). Модели также связаны с недавно выпущенным Поток модель синтеза изображений, которая позволяет пользователям X создавать практически не подвергающиеся цензуре фотореалистичные изображения, которыми можно делиться на сайте.
«Flux, доступный через Grok, — это превосходный генератор текста в изображения, но он также отлично подходит для создания поддельных фотографий реальных мест и людей и отправки их прямо в Twitter», написал Постоянный комментатор ИИ Итан Моллик на X. «Кто-нибудь знает, ставят ли они на них какие-либо водяные знаки? Это была бы хорошая идея».
В отчете, опубликованном ранее сегодня, The Verge отмеченный что возможности генерации изображений Grok, по всей видимости, имеют минимальные гарантии, что позволяет пользователям создавать потенциально спорный контент. Согласно их тестированию, Grok создавал изображения, изображающие политических деятелей в компрометирующих ситуациях, персонажей, защищенных авторским правом, и сцены насилия по запросу.
The Verge обнаружил, что хотя Grok утверждает, что имеет определенные ограничения, такие как избегание порнографического или чрезмерно жестокого контента, эти правила кажутся непоследовательными на практике. В отличие от других крупных генераторов изображений на основе ИИ, Grok, похоже, не отказывается от подсказок с участием реальных людей и не добавляет идентифицирующие водяные знаки к своим выводам.
Учитывая то, что люди генерируют на данный момент, включая изображения Дональда Трампа и Камалы Харрис целоваться или давая большой палец вверх на пути к Башням-Близнецам в очевидной атаке 11 сентября — неограниченные выходы могут не продлиться долго. Но опять же, у Илона Маска есть сделал большое дело из «свободы слова» на его платформе, так что, возможно, эта возможность сохранится (до тех пор, пока кто-то не подаст иск о клевете или нарушении авторских прав).
Люди, использующие генератор изображений Grok для шока, поднимают старый вопрос в области ИИ: должно ли злоупотребление генератором изображений ИИ быть ответственностью человека, создавшего подсказку, организации, создавшей модель ИИ, или платформы, на которой размещены изображения? Пока нет четкого консенсуса, и ситуация еще не решена юридически, хотя новый предложенный закон США под названием Акт «НЕТ ПОДДЕЛКАМ» предположительно, X будет нести ответственность за создание реалистичных поддельных изображений.
С Grok-2 потолок GPT-4 все еще сохраняется
Взгляд за рамки изображений, в пресс-релизе блогxAI утверждает, что Grok-2 и Grok-2 mini представляют собой значительные достижения в возможностях, причем Grok-2 якобы превосходит некоторых ведущих конкурентов в недавних тестах и том, что мы называем «vibemarks». Всегда разумно подходить к этим заявлениям с долей скептицизма, но, похоже, что «класс GPT-4» языковых моделей ИИ (те, которые имеют возможности, схожие с возможностями модели OpenAI) стал больше, но барьер GPT-4 еще не разгромлен.
«Сейчас существует пять моделей класса GPT-4: GPT-4o, Claude 3.5, Gemini 1.5, Llama 3.1 и теперь Grok 2», написал Итан Моллик о X. «Все лаборатории говорят, что есть место для дальнейших гигантских улучшений, но мы не видели ни одной модели, которая действительно превзошла бы GPT-4… пока».
xAI сообщает, что недавно представила раннюю версию Grok-2 на LMSYS Chatbot Arena под названием «sus-column-r», где, как сообщается, она достигла более высокого общего балла Эло, чем такие модели, как Claude 3.5 Sonnet и GPT-4 Turbo. Chatbot Arena — популярный сайт субъективной оценки вибрации для моделей ИИ, но недавно он стал предметом споров, когда люди не согласились причем GPT-4o mini от OpenAI занял столь высокое место в рейтинге.
По данным xAI, обе новые модели Grok демонстрируют улучшения по сравнению с предыдущей моделью Grok-1.5 в таких областях, как научные знания на уровне выпускников, общие знания и решение математических задач в тестах, которые аналогично оказался спорнымКомпания также подчеркнула эффективность Grok-2 при выполнении визуальных задач, заявив о передовых результатах в визуальном математическом мышлении и ответах на вопросы на основе документов.
Модели теперь доступны подписчикам X Premium и Premium+ через обновленный интерфейс приложения. В отличие от некоторых своих конкурентов в открытом пространстве весов, xAI не выпускает веса моделей для загрузки или независимой проверки. Этот закрытый подход резко контрастирует с недавними шагами Meta, которая недавно выпустила свой Лама 3.1 405Б модель, которую любой желающий может загрузить и запустить локально.
xAI планирует выпустить обе модели через корпоративный API в конце этого месяца. Компания заявляет, что этот API будет включать в себя возможности развертывания в нескольких регионах и меры безопасности, такие как обязательная многофакторная аутентификация. Подробности о ценах, ограничениях на использование или политиках обработки данных пока не были объявлены.
Если не брать в расчет генерацию фотореалистичных изображений, то, возможно, Grok-2 самая большая ответственность является его глубокой ссылкой на X, что дает ему тенденцию извлекать неточную информацию из твитов. Это немного похоже на то, как если бы у вас был друг, который настаивал на проверке сайта социальной сети, прежде чем ответить на любой из ваших вопросов, даже если это не было особенно важно.
Как отметил Моллик на X, эта тесная связь может раздражать: «Сейчас у меня есть доступ только к Grok 2 mini, и он кажется надежной моделью, но часто кажется, что его ТРЯПКА подключение к Twitter, он написал«Модель получает результаты из Twitter, которые кажутся не имеющими отношения к теме, а затем отчаянно пытается связать их во что-то связное».