Сегодня Meta представила SeamlessM4T, первую универсальную мультимодальную и многоязычную модель перевода с использованием ИИ, которая позволяет пользователям общаться, не замечая языковых барьеров. SeamlessM4T на данный момент доступна исследователям и разработчикам под соответствующей лицензией. Также опубликованы метаданные SeamlessAlign, крупнейшего открытого набора данных для мультимодального перевода, включающего 270 000 часов изученной речи.
Создание универсального языкового переводчика, подобного вымышленной «Вавилонской рыбке» из романов Дугласа Адамса «Автостопом по Галактике», является непростой задачей, а существующие системы преобразования речи в речь и речи в текст охватывают лишь небольшую часть языков мира. SeamlessM4T основана на достижениях исследователей всего мира за многие годы в стремлении создать универсальный переводчик. По сравнению с подходами, использующими отдельные модели, единый системный подход SeamlessM4T уменьшает количество ошибок и задержек, повышая эффективность и качество процесса перевода.
SeamlessM4T
В прошлом году разработчики Meta выпустили No Language Left Behind (NLLB), модель машинного перевода текста в текст, которая поддерживает 200 языков и с тех пор интегрирована в Википедию в качестве одного из поставщиков услуг перевода. Ранее они продемонстрировали универсальный переводчик речи, который стал первой системой прямого преобразования речи в речь для южноминьского языка (диалект китайского). Ещё один языковой проект Meta — Massively Multilingual Speech, система по распознаванию, идентификации и синтезу речи на более чем 1100 языках.
SeamlessM4T опирается на результаты всех этих проектов, обеспечивая многоязычный и мультимодальный перевод на основе единой модели, построенной на широком спектре устных источников данных с самыми современными результатами. SeamlessM4T поддерживает:
Распознавание речи почти на 100 языках;
Преобразование речи в текст почти для 100 языков ввода и вывода;
Преобразование речи в речь, поддержка почти 100 языков ввода и 36 (включая английский и русский) языков вывода;
Текстовый перевод почти на 100 языков;
Преобразование текста в речь, поддержка почти 100 языков ввода и 35 (включая английский и русский) языков вывода.
SeamlessM4T — очередной шаг в усилиях исследователей по созданию технологии на базе ИИ, которая поможет соединять людей, говорящих на разных языках. Узнать больше о SeamlessM4T можно в блоге Meta AI.
Веб-интерфейс чат-бота с искусственным интеллектом ChatGPT перестал открываться по адресу ai.com. Теперь этот адрес ведёт на сайт конкурирующей компании — запущенного Илоном Маском (Elon Musk) стартапа xAI.
В феврале компания OpenAI, видимо, купила доменное имя ai.com: переход по этому адресу начал открывать веб-интерфейс ChatGPT, хотя никаких анонсов об этом не последовало. Похоже, теперь домен сменил своего владельца — им стал некогда стоявший у истоков OpenAI миллиардер Илон Маск, который впоследствии покинул компанию, а недавно запустил собственный стартап xAI.
Новая компания специализируется на технологиях искусственного интеллекта, а создана она, чтобы «разобраться в истинной природе Вселенной». Теперь ввод ai.com в адресную строку браузера направляет на сайт x.ai, хотя одноимённая компания пока не отметилась значимыми достижениями в своей области.
Двухбуквенные домены в зоне .com — большая редкость и недешёвое удовольствие, особенно если две эти буквы имеют какое-то особое значение. В прошлом году доменное имя it.com было продано за $3,8 млн, и едва ли ai.com обошёлся дешевле, если учесть теперешний ажиотаж в отношении технологий искусственного интеллекта.
Настоящий владелец доменного имени остаётся неизвестным, OpenAI и Илон Маск комментариев по данному вопросу не предоставили.
OpenAI запустила бета-тестирование функции «Пользовательские инструкции» (Custom Instructions), с помощью которой пользователь может сообщить чат-боту сведения о себе и определить настройки сервиса, пишет The Verge. Функция доступна с сегодняшнего дня по подписке для участников программы ChatGPT Plus во всех странах, кроме Великобритании и ЕС.
Новая функция позволит устранить необходимость в постоянной преамбуле к вопросам, задаваемым чат-боту. Вместо того чтобы формировать длинный вопрос для ChatGPT со всем необходимым контекстом и информацией, можно просто добавить этот контекст и информацию в свои пользовательские инструкции, чтобы не повторять их каждый раз. Например, если вы сообщите системе, что преподаёте в третьем классе, ответы на запросы будут адаптироваться ИИ-ботом с учётом нужной возрастной группы учащихся.
Настройки пользовательских инструкций подчиняются тем же правилам, что и сам ИИ-бот, поэтому попытки спровоцировать его неэтичное или неприемлемое поведение будут безрезультатными. ChatGPT также удаляет личную информацию, которая может быть использована для идентификации пользователя.
Следует отметить, что OpenAI представляет новую функцию как способ упростить составление запросов, а не как первый шаг к всеобъемлющему личному помощнику на основе ИИ.
На YouTube появился канал со стримами «Смешариков», реплики и голос которых генерирует нейросеть. Он называется «Нейрошарики».
Персонажи популярного мультфильма разыгрывают небольшие сценки по темам, которые задают зрители. Встречаются такие, как «Крош решил вступить в ЧВК Вагнера» или тот же Крош «решил захватить Польшу». В первом случае кролик Крош говорит о том, что вступил в группу Вагнера, поскольку хотел почувствовать себя героем, в то время как Ежик пытается доказать собеседнику, что это «серьезная военная организация». Во втором случае кролик осознал, «что у него огромные амбиции» и он хочет править «не только смешариками, но и всей Польшей». Ежик парирует тем, что смешарики — мирные существа, которым не нужны «власть и захваты», но Крош утверждает, что это будет «эпическое приключение».
Как утверждают создатели стрима, они — «небольшая группа подростков, которым пришла идея сделать адаптацию» аналогичного нейросетевого шоу на основе персонажей «Губки Боба», транслирующегося на платформе Discord. Стрим «Нейрошариков» в котором упоминался ЧВК Вагнера, был очень быстро заблокирован на YouTube.
Одним из первых подобных нейрошоу была трансляция на Twitch, в которой персонажи ситкома «Сайнфелд» разыгрывали сгенерированные с помощью искусственного интеллекта сценки. Она была закрыта после того, как ИИ сгенерировал реплику одного из виртуальных персонажей о трансгендерных людях. Тот сказал, что «подумывает пошутить о том, что трансгендерность — это психическое заболевание, или о том, что все либералы — втайне геи, или о том, что трансгендеры секретно управляют обществом». «Но никто не смеется, поэтому я заканчиваю», — резюмировал персонаж.
Ответственный за ИИ-генератор изображений Stable Diffusion стартап Stability AI представил сервис Stable Doodle, способный превращать эскизы в полноценные детализированные изображения.
Платформой для сервиса Stable Doodle стала модель Stable Diffusion XL — она анализирует контуры эскиза и генерирует его «визуально приятное» художественное воплощение. Испытать новый инструмент можно на платформе ClipDrop, которую Stability AI в минувшем марте приобрела вместе со стартапом Init ML, созданным бывшими работниками Google. Разработчик признал, что это не первый инструмент, предлагающий создание детализированных художественных изображений по примитивным эскизам, но отметил, что Stable Doodle работает быстрее аналогов и обеспечивает более качественный результат.
Stable Doodle
Ещё одним компонентом, обеспечивающим работу инструмента, стал модуль T2I-Adapter, который анализирует входящее изображение и транслирует результат на генеративную ИИ-модель. В качестве дополнительного средства Stable Doodle позволяет оставить текстовое описание для исходного эскиза. Stable Diffusion XL также позволяет выбирать стиль изображения на выходе: «Фотография», «Аниме», «Оригами», «Трёхмерная модель» — всего 14 вариантов.
В Stability AI рассказали, что Stable Doodle окажется полезным инструментом для дизайнеров или иллюстраторов и поможет им сэкономить время. При этом в компании предупредили, что качество изображения на выходе зависит от числа деталей на исходном эскизе, информативности подсказки и сложности поставленной задачи.
Команда шеф-поваров и дегустаторов из сервиса веганской еды World Of Vegan протестировала ИИ бот ChatGPT на предмет приготовления блюд этой кухни. Результаты, по словам одного из шеф-поваров, оказались «смешно жалкими».
Боту поставили задачу приготовить 100 веганских блюд для свиданий, десерты, весенние блюда. В итоге 99 блюд были приготовлены просто неадекватно — ни по виду, ни по вкусу есть это оказалось невозможно. Только одно блюдо было признано удавшимся, но и к нему у поваров были претензии.
В целом ChatGPT действовал стандартно: собрал и обобщил информацию из разных источников и на основании сформированных данных выдал «ответ». То есть алгоритмы делали всё чётко по предложенным в Сети рецептам, но, разумеется, без оценки, которую проводит повар во время приготовления, оценивая блюдо по запаху, вкусу, внешнему виду и т.д.
На подобный анализ, хотя и такая информация есть в Интернете, искусственный интеллект, «изменяющий миры», оказался банально неспособен. Хотя обычные роботы, запрограммированные на помощь повару, вполне справляются с этой задачей.
«Я представляю, что специально программированные роботы могут легко приготовить блюда на уровне шеф-повара со звездой Мишлен. Однако, когда дело доходит до создания благоразумных, а тем более инновационных и вкусных рецептов, эта технология оказалась слишком незрелой в своём развитии, чтобы последовательно достигать желаемых результатов», — заявила основатель и генеральный директор World of Vegan Мишель Цэн Гизмодо.
«Алиса научилась не терять нить разговора — она запоминает ваши предыдущие реплики и отвечает на уточняющие вопросы. Совсем как реальный собеседник. Например, можно вместе составить бизнес-план, сравнить все «за» и «против» покупки машины или подготовиться к собеседованию», — говорится в сообщении «Яндекса».
Теперь YandexGPT запоминает, о чем Алису спрашивали в прошлых сообщениях, поэтому может отвечать на уточняющие вопросы.
В России более вероятно законодательное регулирование работы чат-бота с искусственным интеллектом ChatGPT, чем его полный запрет на территории страны. Об этом «Газете.Ru» рассказал адвокат, председатель совета московской коллегии адвокатов »Андреев, Бодров, Гузенко и Партнеры» Андрей Андреев.
«Полный запрет ChatGPT вряд ли возможен. Могут быть приняты законы и правила, которые будут регулировать использование этой технологии в стране. Мониторинг содержания, контроль за распространением незаконной информации и использованием технологии в некоторых сферах деятельности — например, образовании. Вспомним скандал со студентом РГГУ, написавшим дипломную работу при помощи ИИ», — отметил он.
По словам Андреева, ChatGPT — это технология, а не конкретный сайт или приложение, что делает ее сложной для запрета.
«Есть официальный сайт OpenAI, но разработчик и так заблокировал российских пользователей, и воспользоваться чат-ботом без ухищрений вроде покупки иностранного номера и смены IP-адреса при помощи VPN не получится», — пояснил юрист.
Он также указал на то, что помимо сайта существует множество клонов ChatGPT в виде ботов в социальных сетях, избавиться от которых не представляется возможным. «Заблокируй один, взамен него будет создано десять», — заключил Андреев.
В марте инсайдер adurovleaks сообщал, что в мессенджере Telegram появится официальный бот со встроенной нейросетью ChatGPT. При этом запускать чат-бота в мессенджере смогут лишь пользователи платной подписки Telegram Premium.
Помогут сэкономить время и найти новые способы решения различных задач.
Что такое плагины для ChatGPT и как их подключить
Плагины ChatGPT — это дополнительные программные компоненты, которые можно подключить к чат‑боту для расширения его возможностей. Представляют собой модули, которые могут быть интегрированы под конкретные задачи, в том числе электронную коммерцию, поиск информации, развлечения, образование и многое другое.
На данный момент в магазине плагинов ChatGPT есть около 90 расширений. Наверняка их количество будет постоянно увеличиваться, когда разработчики разберутся во всех тонкостях написания таких дополнений для платформы OpenAI.
Добавить плагины в чат достаточно просто. Но эта возможность сейчас открыта только для владельцев подписки ChatGPT Plus, за которую необходимо платить 20 долларов в месяц.
Если вам удалось подключить расширенный тариф ChatGPT, действуйте так:
Откройте главную страницу с чат‑ботом. В левом нижнем углу экрана нажмите Settings («Настройки») → Beta features («Бета‑функции»). В открывшемся меню активируйте Web browsing («Использование интернета») и Plugins («Плагины»).
Далее создайте в ChatGPT новый чат.
Переключите модель ChatGPT на свежую GPT‑4.
В выпадающем меню укажите Plugins → Plugin store («Магазин плагинов»).
Выберите расширение для ChatGPT, которое вы хотите подключить. Пока действует ограничение в три варианта для одного чата.
В новом чате вам достаточно будет задать вопрос, который будет упоминать и задействовать установленные программы. В данном случае результаты выдачи зависят от качества исполнения плагина, а не только от самого ChatGPT.
Стоит отметить, что сейчас система плагинов для ChatGPT находится на стадии бета‑тестирования. Экосистема ещё не отлажена до финальной версии, поэтому в связке с расширениями чат‑бот может выдавать ошибочные результаты или не срабатывать. Кроме того, OpenAI пока не добавила удобный поиск по магазину с дополнениями.
Какие плагины для ChatGPT могут быть полезны
Browsing
Browsing Plugin — это дополнительный ассистент, способный просматривать интернет. С помощью этого плагина ChatGPT получает доступ к самой последней и точной информации, чтобы отвечать на вопросы, которые раньше были за пределами его ограниченной 2021 годом базы знаний.
ChatGPT использует API Bing от Microsoft и дополнительные алгоритмы безопасности для поиска правдивой информации. Бот показывает сайты, на которые ссылается, когда генерирует ответы. Это позволяет проверить точность результатов.
Code Interpreter
Code Interpreter использует Python и работает в изолированной среде выполнения. При применении этого плагина код запускается в постоянной сессии, которая остаётся активной в течение всей переписки в чате с ботом. Расширение поддерживает даже загрузку файлов в текущую рабочую область.
Плагин поможет новичкам заметно ускорить процесс написания и оптимизации кода. Code Interpreter пригодится для решения математических задач, анализа данных, визуализации и преобразования форматов файлов.
Retrieval
Retrieval — это расширение с открытым исходным кодом, которое разработчики могут запустить на собственной системе, а затем зарегистрировать в ChatGPT. Плагин позволяет взаимодействовать с базами данных (Milvus, Qdrant, Redis, Weaviate, Zilliz) для индексации и поиска документов. Источники информации можно синхронизировать со своей базой данных.
Плагин поможет находить релевантные фрагменты документов из пользовательских источников по запросу к чат‑боту. Это могут быть, например, файлы, заметки, электронные письма или открытая документация организации. В данном случае чат‑бот будет выступать в роли поисковой системы.
Чтобы попробовать этот плагин, нужно иметь права на использование контента, который необходимо индексировать для поиска.
Wolfram
Плагин Wolfram для ChatGPT совмещает генерирование текста языковой моделью с вычислительной системой Wolfram. Это помогает находить точные данные и решать сложные задачи в различных сферах.
Через это расширение чат‑бот может связываться с Wolfram для ответа на вопросы, например, по математике. После обработки обращения ChatGPT выдаёт результаты расчётов и описание решения.
С помощью такого дуэта получится не только находить уже проверенные данные, но и выполнять нетривиальные вычисления. Wolfram может выдавать визуализации к задачам, созданные другими пользователями.
Zapier
Плагин от Zapier для ChatGPT позволяет связывать между собой около 5 000 приложений и сервисов. При этом взаимодействовать с ними можно прямо через интерфейс чат‑бота. С помощью расширения получится автоматизировать различные задачи, давая команды ChatGPT. Это позволит сэкономить много времени в рабочем процессе.
К примеру, можно попросить ChatGPT найти контакты пользователей в CRM и обновить их напрямую или добавить строки в таблицу и отправить их в виде сообщения в рабочий мессенджер. Кроме того, получится добавлять новые события в календарь.
Link Reader
Этот плагин позволяет читать содержимое страниц или файлов по указанным ссылкам. Вы отправляете ссылку на сайт, PDF‑документ, изображение или другой подобный источник, а чат‑бот проводит анализ. После этого можно задавать вопросы по собранным данным, на которые ChatGPT ответит с подробностями. Также с помощью Link Reader сервис предоставит краткую сводку — например, по научной статье или отчёту.
There’s an AI For That
Этот плагин помогает находить и использовать инструменты на основе нейросетей под большое количество рабочих или персональных задач. Так, сервис быстро подберёт вам конвертеры файлов, редакторы для видео и многое другое. Достаточно указать свои требования в запросе, а в ответ вы получите список со ссылками и кратким описанием к каждому пункту.
Show Me
Show Me позволяет быстро создавать в ChatGPT диаграммы всех распространённых типов. С помощью плагина получится быстро визуализировать план работы или популярную концепцию. С этим расширением чат‑бот также способен выводить изображения, графики, карты и схемы.
Для генерирования иллюстраций по запросам плагин подключается к различным сервисам: Google Images, Google Maps, Draw.io и другим.
Chess
Полезный плагин для любителей шахмат позволяет играть прямо в чате с ботом. Расширение помогает развивать мышление, практиковаться и улучшать игровые навыки во время соревнований с нейросетью.
ChatGPT может быть достаточно сложным соперником, хотя он не только обыграет вас, но и ответит на вопросы по различным ходам и стратегиям.
AskYourPDF
AskYourPDF — плагин для анализа и поиска информации по PDF‑файлам. Для использования нужно ввести ссылку на документ, который система загрузит, просканирует и проиндексирует. После обработки вы сможете достаточно быстро находить интересующие вас данные из текста и собирать списки с подробностями.
Помните, что загруженные файлы могут оказаться в открытом доступе или у третьих лиц. Так что не стоит использовать этот инструмент для работы с секретными документами и персональной информацией.
Еще в феврале Опера объявленный планирует внедрить возможности генеративного ИИ в свой веб-браузер. Теперь это стало реальностью, поскольку компания запустила интеграцию боковой панели как для ChatGPT, так и для ChatSonic, а также еще одну интересную функцию, называемую интеллектуальными подсказками AI.
Если пользователи хотят проверить эти новые функции, им необходимо обновить свой браузер и перейти к Easy Setup, чтобы включить опцию «AI Prompts» внизу. Для тех, кто использует браузер Opera GX для игр, в настройках браузера также должна быть включена опция «Ранняя пташка».
Как только вы активируете AI Prompts, вы увидите кнопку чат-бота на боковой панели. Просто нажмите на нее, чтобы запустить чат-бота в браузере. Имейте в виду, что вам все равно придется войти в систему, чтобы использовать параметры AI. Кроме того, в браузере появилась совершенно новая функция — контекстные подсказки ИИ, которые появляются, когда вы выделяете текст на веб-сайте.
Предоставленные подсказки предлагают различные варианты использования чат-ботов в сочетании с текстом страницы. Некоторые примеры включают преобразование части текста в мыльную оперу или футбольный комментарий и использование предоставленной информации для создания вопросов викторины. Имейте в виду, что зеленые подсказки основаны на ChatGPT, тогда как фиолетовые подсказки используют сервис ChatSonic.
Opera объявила о первом этапе своего плана Browser AI, который включает в себя уникальные функции. Вскоре компания планирует перейти на второй этап — свой браузерный ИИ-движок на основе GPT. С ростом популярности ChatGPT многие технологические компании спешат запустить свои продукты на основе ИИ. Microsoft, давний сторонник OpenAI, недавно представила Bing Chat AI и Edge. Copilot инструменты. Сходным образом, Baidu представила своего бота ERNIE, а Google сделал своего чат-бота Bard доступным в США и Великобритании. Объявление Opera является захватывающим, поскольку оно показывает, что даже небольшие компании стремятся участвовать в гонке ИИ и зарекомендовать себя как можно раньше.