Искусственный интеллект

  • Готовьтесь к GPT-5: OpenAI раскрыла планы развития

    Готовьтесь к GPT-5: OpenAI раскрыла планы развития

    Генеральный директор OpenAI Сэм Альтман анонсировал планы по выпуску новых моделей GPT-4.5 и GPT-5.

    Компания намерена упростить выбор моделей и создать более интегрированную систему. Об этом сообщает Ведомости.

    Что нового в GPT-4.5 и GPT-5?

    GPT-4.5, получившая название Orion, станет последней моделью без механизма цепочки рассуждений. OpenAI намерена объединить серии o и GPT, создав систему, способную адаптироваться к различным задачам.

    Ограниченный доступ и развитие ИИ-чипов

    По данным The Verge, Orion изначально будет доступен только партнерам OpenAI. Кроме того, компания разрабатывает собственные ИИ-чипы для снижения зависимости от Nvidia. Производство планируется на мощностях TSMC.

    Конкуренция с Китаем

    Тем временем китайская компания DeepSeek уже выпустила модель R1, которая, по заявлениям разработчиков, превосходит конкурентов по ряду показателей и дешевле в производстве.

  • Китайский робот, который ходит как человек, поступает в продажу

    Китайский робот, который ходит как человек, поступает в продажу

    Китайская компания EngineAI представила модель компактного человекоподобного робота PM01, сообщает N+1.

    Главной особенностью этой модели стала походка, максимально приближенная к человеческой. Робот при ходьбе полностью распрямляет колени, что делает его движения естественными, но требует сложной системы управления для удержания равновесия.

    PM01 имеет высоту 138 см, массу 40 кг и выполнен из алюминиевого сплава. Он оснащён интерактивным сенсорным дисплеем на груди, захватами с противопоставленными большими пальцами и способен поворачивать корпус на 320 градусов. Нейросетевые алгоритмы управления позволяют роботу обучаться новым навыкам с помощью метода обучения с подкреплением.

    За обработку данных отвечают процессор Intel N97 и компьютер NVIDIA Jetson Orin. Встроенные камеры и микрофоны обеспечивают восприятие окружающей среды, а быстросъёмная батарея позволяет легко заменять источник питания. Максимальная скорость робота составляет 2 метра в секунду.

    Компания уже начала принимать заказы: до 31 марта 2025 года PM01 будет доступен по цене 12 тысяч долларов США. Робот предназначен для применения в исследовательских и образовательных целях, а также в бизнесе.

    Основным конкурентом PM01 считается робот G1 от Unitree Robotics, который имеет схожие характеристики и уже выпускается серийно. В ответ на релиз EngineAI, Unitree продемонстрировала, что её робот также способен ходить с выпрямлением ног, приближаясь к естественной походке.

  • «Мусорный ИИ»: как разработчики защищаются от ложных отчетов

    «Мусорный ИИ»: как разработчики защищаются от ложных отчетов

    Как сообщает CNews, разработчики ПО с открытым исходным кодом столкнулись с проблемой: нейросети генерируют ложные отчеты об ошибках, которые выглядят правдоподобно, но требуют времени для проверки.

    Специалисты отмечают, что такая тенденция создаёт «новую эру некачественных отчетов по безопасности».

    Эксперт Python Software Foundation Сет Ларсон призвал багхантеров избегать использования ИИ, так как это лишь увеличивает нагрузку на разработчиков. Аналогичная проблема отмечена в проекте Curl, где мейнтейнеры тратят время на опровержение ложных отчетов.

    Волонтеры, поддерживающие Open Source, подчеркивают необходимость фундаментальных изменений, включая привлечение финансирования и вовлечение большего числа доверенных участников. Пока же разработчики просят не использовать нейросети без проверки отчетов человеком.

  • Видео по тексту за $20: OpenAI добавила Sora в подписки

    Видео по тексту за $20: OpenAI добавила Sora в подписки

    Как сообщает Kanobu, компания OpenAI официально запустила Sora Turbo — улучшенную модель искусственного интеллекта для создания видео по текстовым запросам.

    Теперь доступ к генератору видео предоставляется подписчикам ChatGPT Plus ($20 в месяц) и ChatGPT Pro ($200 в месяц).

    Подписчики Plus могут создавать до 50 видео в месяц с разрешением 720p и длительностью до пяти секунд, а пользователи Pro — до 500 видео в формате 1080p и продолжительностью до 20 секунд. Также в подписке Pro доступна загрузка роликов без водяного знака. Функционал Sora включает генерацию видео по тексту, преобразование изображений в анимации и создание циклических роликов.

    Сервис недоступен в некоторых регионах, включая Россию, ЕС, Швейцарию и Великобританию. OpenAI внедрила меры для предотвращения злоупотреблений, запретив создание материалов, связанных с насилием, ненавистью или использованием образов знаменитостей.

    Запуск Sora — часть программы «12 Days of OpenAI». Ранее инструмент тестировали художники, дизайнеры и режиссёры. Новый релиз подчеркивает стремление OpenAI расширить доступ к своим передовым технологиям.

  • Microsoft добавила невидимые водяные знаки на изображения DALL-E

    Microsoft добавила невидимые водяные знаки на изображения DALL-E

    Microsoft внедрила невидимые водяные знаки на изображения DALL-E

    Как сообщает Habr, Microsoft представила новую функцию невидимых водяных знаков в сервисе Azure OpenAI для изображений, созданных с помощью DALL-E. Эта мера направлена на повышение защиты и прозрачности изображений, создаваемых искусственным интеллектом.

    Как работает система водяных знаков

    Водяные знаки не видны невооруженным глазом, но могут быть обнаружены с помощью специальных инструментов. Интересно, что даже при изменении размера или обрезке изображения, водяной знак сохраняется. Система содержит информацию о происхождении изображения, включая:

    • поле description с отметкой «AI Generated Image», подтверждающей создание изображения с помощью ИИ;
    • поле softwareAgent со значением «Azure OpenAI DALL-E», указывающее, что изображение создано в Azure OpenAI Service;
    • временную метку when, указывающую на дату и время создания.

    Расширение использования водяных знаков

    Это не первый случай, когда Microsoft интегрирует водяные знаки в свои продукты. В прошлом году аналогичная технология была внедрена для голосов, созданных с помощью Azure AI Speech, чтобы определить, синтезирована ли речь искусственным интеллектом.

  • OpenAI расширяет планы по созданию инфраструктуры

    OpenAI расширяет планы по созданию инфраструктуры

    CEO OpenAI Сэм Альтман разрабатывает амбициозный проект по созданию инфраструктуры для искусственного интеллекта стоимостью в десятки миллиардов долларов, сообщает ForkLog.

    Компания планирует построить дата-центры, увеличить мощности и запустить производство чипов и полупроводников для работы нейросетей. Среди потенциальных инвесторов — партнеры из Канады, Японии, Кореи и ОАЭ, а также Microsoft.

    Переговоры ведутся не только с инвесторами, но и с правительством США. Альтман утверждает, что инициатива позволит США усилить геополитическое преимущество в сфере искусственного интеллекта, создавая многонациональные коалиции для конкуренции с китайской инфраструктурой. Параллельно компания стремится привлечь от $5 трлн до $7 трлн для финансирования этих целей.

    OpenAI также разрабатывает новые ИИ-модели, включая GPT Next, которая, по заявлению представителя компании в Японии Тадао Нагасаки, будет в 100 раз мощнее предыдущих моделей. Компания работает над проектами Strawberry и Orion, направленными на улучшение рассуждений ИИ и мультимодальные возможности для понимания и генерации языка, которые могут заменить GPT-4.

  • Временный доступ: нейросеть Midjourney открыла бесплатные возможности для создания изображений

    Временный доступ: нейросеть Midjourney открыла бесплатные возможности для создания изображений

    Разработчики популярной нейросети Midjourney, специализирующейся на генерации изображений, предложили пользователям временный бесплатный доступ к веб-версии платформы. Как сообщает Мел, каждый желающий может создать до 25 уникальных иллюстраций с помощью этого ИИ-генератора.

    В новой версии пользователи могут отправлять запросы на создание изображений через раздел Create, где также доступны настройки для точной настройки параметров изображения и выбора скорости генерации. По каждому запросу Midjourney генерирует четыре изображения, каждое из которых можно дополнительно редактировать и сохранять.

    Для доступа к веб-версии необходимо зарегистрироваться на официальном сайте Midjourney. После исчерпания лимита в 25 изображений можно создать новый аккаунт и продолжить работу, пока бесплатный доступ остается активным.

  • Австралийский журнал заменил сотрудников на ИИ

    Австралийский журнал заменил сотрудников на ИИ

    Австралийский журнал Cosmos Magazine внезапно уволил всех своих авторов, заменив их на искусственный интеллект, что вызвало волну возмущения среди бывших сотрудников и читателей, сообщает CNews.

    Увольнения произошли в начале 2024 года без предварительного уведомления, и вскоре выяснилось, что статьи, которые продолжали публиковаться на сайте, создавались ИИ, обученным на контенте тех же авторов, которых заменили.

    По словам одного из бывших авторов, его работа началась как «счастливые и прибыльные отношения» с журналом, но неожиданно прервалась после того, как он отправил очередной текст на публикацию. Оказалось, что журнал получил грант на разработку специализированного ИИ, который теперь генерирует контент, используя ранее опубликованные статьи уволенных сотрудников. Это решение было принято исключительно руководством журнала и скрыто от остальных сотрудников.

    Критике подверглись и сами владельцы журнала, и использование ИИ в журналистике. В интервью The Register бывший автор отметил: «Меня не просто уволили и заменили роботом. Этот робот был запрограммирован стать моим суррогатом». Бывшие сотрудники и соучредители осудили этот шаг, а также недовольны организации, предоставившей грант.

  • OpenAI Представила Новую Поисковую Систему SearchGPT

    OpenAI Представила Новую Поисковую Систему SearchGPT

    OpenAI анонсировала запуск тестовой версии своего нового поискового движка SearchGPT, который обещает изменить рынок онлайн-поиска и бросить вызов доминированию Google. Об этом сообщает Hightech.fm.

    SearchGPT предназначен для предоставления быстрых и точных ответов с указанием источников, что делает его более прозрачным и надежным инструментом для поиска информации. Интегрированная в ChatGPT, эта система позволяет пользователям вести диалог с искусственным интеллектом и задавать последующие вопросы для получения более подробных ответов. По данным International Business Times UK, эта функция делает SearchGPT уникальной на рынке.

    Одной из ключевых особенностей SearchGPT является поддержка текстового и графического поиска, а также различных виджетов для погоды, калькуляторов, спортивных результатов и финансовых данных. Система способна резюмировать веб-страницы, ограничивая вывод информации до 300 символов, что помогает избежать использования неавторизованного контента, передает THE DECODER.

    OpenAI заключила соглашения с крупными издателями, такими как News Corp и The Atlantic, что позволит SearchGPT использовать их контент для ответов на запросы пользователей. Это обеспечивает высокое качество и достоверность предоставляемой информации. FavTutor отмечает, что такой подход может существенно изменить ландшафт поисковых технологий.

    Запуск SearchGPT является частью более широкой стратегии OpenAI по созданию интегрированной поисковой и ИИ-системы. Эта система не только предоставляет информацию, но и помогает пользователям находить и использовать её наиболее эффективным способом. Это может предоставить пользователям новый инструмент для работы с информацией в реальном времени и изменить рынок поисковых технологий.

  • Т-Банк представил передовую русскоязычную языковую модель T-lite

    Т-Банк представил передовую русскоязычную языковую модель T-lite

    Центр искусственного интеллекта Т-Банка представил свою новейшую разработку — большую языковую модель T-lite, которая предназначена для решения бизнес-задач на русском языке. Как сообщает Hi-Tech Mail.ru, модель была анонсирована на первой конференции Т-Банка по машинному обучению Turbo ML Conf.

    Модель T-lite, имеющая 8 миллиардов параметров, показала выдающиеся результаты на индустриальных и внутренних бенчмарках, превосходя зарубежные аналоги, такие как Chat-GPT 3.5 и Llama-3-8B-Instruct. Особенностью модели является ее высокая эффективность: она была создана с использованием всего 3% вычислительных ресурсов, обычно требуемых для подобных моделей.

    T-lite является мощным инструментом для создания LLM-приложений, которые могут использоваться без передачи данных третьим лицам. Модель позволяет разрабатывать ассистентов поддержки, интеллектуальные поисковые системы и инструменты для анализа и обобщения больших объемов текста. Благодаря своей эффективности, T-lite обеспечивает качество, сопоставимое с моделями размером 20 миллиардов параметров, оставаясь при этом экономически выгодной.

    T-lite входит в семейство языковых моделей Gen-T, разработанных Т-Банком для решения специализированных задач. Эти модели отличаются высокой адаптивностью и оптимальным соотношением мощности и качества. Разработка собственного семейства языковых моделей стала необходимостью, так как существующие решения не покрывают всех задач и не являются оптимальными для компании.