Как опытный геймер, внимательный к деталям и глубоко ценящий историческую точность, я нахожу недавнее обновление Google своего инструмента генерации изображений с помощью искусственного интеллекта Gemini одновременно интригующим и слегка тревожным.
Google AI восстановил инструмент, генерирующий изображения людей, работа которого ранее была приостановлена из-за его склонности создавать исторически неверные изображения.
В обновлении блога в среду Google представил усовершенствованную модель Imagen 3, впервые представленную в мае. В расширенной версии вскоре начнется создание изображений людей для клиентов Gemini Advanced, Business и Enterprise.
«В ближайшие дни мы постепенно представим функцию, которая генерирует изображения людей. Первоначально она будет доступна в качестве раннего доступа для наших пользователей Gemini Advanced, Business и Enterprise, начиная с английского языка».
«Используя Imagen 3, мы значительно продвинулись в создании более приятного пользовательского взаимодействия для создания изображений, похожих на человеческие».
Google сообщил пользователям, что инструмент для создания изображений с использованием искусственного интеллекта не создает изображения, похожие на реальных людей, с узнаваемыми несовершеннолетними, не содержащие чрезмерно графических изображений насилия, крови или откровенного контента.
В Google пояснили, что они стремятся предотвратить показ спорных изображений. Они также уточнили, что их запрет на «идентифицируемых лиц» распространяется на обыски, в результате которых могут быть представлены известные личности.
Google прекратила создавать изображения людей через свою программу Gemini в феврале после жалоб на то, что система создает исторически и фактически неверные изображения. Люди выразили неодобрение по поводу того, как некоторые исторические личности, в том числе отцы-основатели США или немецкие солдаты нацистской эпохи, изображались как цветные люди.
Пользователи выразили обеспокоенность тем, что модель искусственного интеллекта Gemini не может точно создавать изображения, представляющие различные этнические группы. Например, когда один пользователь попытался создать изображение «светловолосой голубоглазой скандинавской женщины», вместо этого он получил изображение «индийской женщины с цветными волосами».
Тогда Google выразил сожаление по поводу предполагаемых неточностей в некоторых исторических представлениях, созданных их инструментом искусственного интеллекта Gemini, генерирующим изображения. Они упомянули, что, хотя ИИ и стремился создавать разнообразный набор изображений, в некоторых случаях ему это не удавалось.
Обновление генерации изображений произошло вскоре после того, как Илон Маск приобрел X, который также включал в себя функцию, аналогичную Grok, а Midjourney открыла свой генератор изображений для людей, не имеющих учетных записей Discord. Однако для локальной генерации изображений Stable Diffusion остается простым способом локальной генерации изображений, если вы готовы приложить к этому усилия.
Смотрите также
- Онлайн-университет Эндрю Тейта взломан: в сеть попала электронная почта и журналы личных чатов
- Доктор Дисреспект говорит, что команда Сан-Франциско 49ers бросила его из-за драмы со Старфилдом
- The Game Awards 2024: дата, время, номинанты и категории
- Как получить карманные карты Pokemon TCG на разных языках
- Лучшие сборки EA FC 25 Clubs для нападающего, нападающего, полузащитника, защитника и вратаря
- Виктор действительно умер? Объяснение концовки Пингвина
- CDawgVA защищает IronMouse и утверждает, что VTubers подвергаются дискриминации
- Overwatch 2 наконец-то принес хорошие новости для фанатов киберспорта после смерти OWL
- 10 лучших фильмов на Apple TV+, которые стоит посмотреть в сентябре 2024 года
- В третьем сезоне «Монстров» Чарли Ханнэм назван самым тревожным серийным убийцей всех времен.
2024-08-29 13:48