Сообщество - Искусственный интеллект

Искусственный интеллект

5 063 поста 11 479 подписчиков

Популярные теги в сообществе:

18

Сагаал ганаар! Саган hараар! С праздником белого месяца! С Новым годом!

Сагаал ганаар! Саган hараар! С праздником белого месяца! С Новым годом!

P.S: диету можно начать сегодня) если не успели 1 января. Но лучше сначала поесть буузы, а потом начать). 🥟

5

Искусственное увеличение. 9 лучших инструментов для увеличения фото с помощью ИИ

Существует множество сервисов, облегчающих работу с изображениями в обход Photoshop и других «больших программ». Например, сайт remove.bg убирает фон с фотографий, а сервис TinyJPG уменьшает картинки без потери качества. Теперь искусственный интеллект расширил горизонт возможностей. О нейросетях, улучшающих качество фотографий, нам рассказал Валентин Фёдоров междисциплинарный художник и автор телеграм-канала «Фотоувеличение».

Взяли в работу

Впервые я использовал один из подобных сервисов в 2022-м, когда реанимировал старый студенческий проект, оригиналы файлов которого были утеряны. Сохранилась только маленькая версия, которую выкладывал в соцсети — около 700 пикселей по длинной стороне. Впервые услышав про такую возможность, прогнал фотографии через их через онлайн-сервис BigJPG, и результат мне так понравился, что я перевыпустил самиздат (любительское малотиражное издание на любую тему). Однако, если бы изначальное фото было еще меньшего качества, вытянуть его не получилось бы.

Зин «За этими фасадами»

Зин «За этими фасадами»

С помощью BigJPG можно бесплатно улучшить фотографию в четыре раза, хотя никто вам не запрещает снова прогнать увеличенную версию и получить Х16, но результат может получиться разный. Платная подписка позволяет увеличить фото в 16 раз и грузить фотографии большего размера — до 50 Мб. И что самое важное — подписка повышает скорость. Не скажу, что сервис работает медленно, на фото уходит от 5 до 30 секунд, но если понадобится обработать 100 фотографий, то придется подождать.

Глаз-топаз

До этого мы говорили о так называемом апскейле — увеличении без сильного влияния ИИ на само изображение. Но если оригинал реально маленького размера, то нужно использовать что-то посерьезнее, один из таких вариантов Topaz Gigapixel AI.

Такой тип программ использует генеративные возможности куда шире, вследствие чего может выдавать искажения. Конечно не такие серьезные, как при генерации из текста в фото — наверняка вы видели мемы про количество пальцев на руках, но разница с оригиналом все равно будет. Программе неизвестно, что было в утерянных фрагментах, и она заполняет их на своё усмотрение. В качестве эксперимента я взял свою фотографию, намеренно ухудшил её качество и «отреставрировал» с помощью Topaz Gigapixel AI.

ИИ получает больше свободы, поэтому появляются ветки, которых не было

ИИ получает больше свободы, поэтому появляются ветки, которых не было

Topaz Gigapixel AI доступен за $ 99.99. Эта цена покрывает год обновлений — вы получите все новые и улучшенные функции, которые они придумают за это время, но никакой пробной версии или тестового периода нет. Из плюсов здесь более гибкая настройка параметров и несколько моделей — я выбрал ту, где артефакты заметнее, чтобы показать их наглядно. С этим можно экспериментировать и получать разные результаты.

Попробовали и хватит

И последний сервис на сегодня — Upscale media. Сразу прослеживается логика: шум максимально гасится, а вокруг важных элементов появляются белые ореолы — благодаря им изображение кажется четче. Как и в случае с BigJPG, изображения больше 1000 пикселей подходят под восстановление. А вот последнее фото этим параметрам уже не соответствует. Но надо отметить, ИИ ничего не добавил — все ветки, что были в ухудшенной версии, остались на месте и сохранили свою форму. Получается что-то среднее между обычным апскейлом и тем, что предлагает Topaz Gigapixel AI, но без гибкого инструментария.

Первое фото — оригинал, второе уменьшено, а затем увеличено в два раза, а третье фото — в четыре раза

Первое фото — оригинал, второе уменьшено, а затем увеличено в два раза, а третье фото — в четыре раза

Помимо этих сервисов, есть ещё несколько

  1. Zyro AI Image Upscaler

  2. Waifu2x

  3. VanceAI

  4. Imglarger

  5. Photo Refiner

  6. Neural Love

Каждый из них предлагает разный результат, наиболее устоявшуюся картину можно увидеть только при апскейле. При маленьком разрешении получить результат идентичный оригиналу не получится, зато можно сделать что-то очень похожее, хоть и с заметным глазу нейроследом и артефактами.

Показать полностью 3
12

ИИ-ассистент для кодеров на DeepSeek R1

ИИ-ассистент для кодеров на DeepSeek R1

вышел локальный ИИ-ассистент для кодеров на DeepSeek R1 — с ним вам не нужен даже API.

• Пишет код на уровне сеньора.

• Во время компиляции помогает в отладке и исправлении багов.

• Это не просто кодер-чернорабочий — даёт рекомендации по архитектуре и масштабированию

• На выбор есть две модели: для быстрых ответов и для более сложных задач

• Полностью работает локально и БЕЗ интернета

• БЕСПЛАТНО

Ссылка

Источник

Показать полностью
12

ChatGPT 4.5: Первые впечатления и тесты новейшей модели OpenAI

27 февраля 2025 года компания OpenAI представила ChatGPT 4.5, назвав её своей самой мощной и инновационной разработкой в области генеративного искусственного интеллекта. В этой статье я разберу, что именно вызывает ажиотаж, где модель спотыкается, и стоит ли она тех ожиданий, которые на неё возложили.

Бесплатный доступ к гайдам на создание ИИ Агентов и Промпт-инжиниринг в моем телеграм канале.

Поехали!

"Испытание GPT-4.5 стало гораздо более ярким моментом «почувствовать AGI» среди испытателей с высоким вкусом, чем я ожидал!" CEO OpenAI. Верим?

"Испытание GPT-4.5 стало гораздо более ярким моментом «почувствовать AGI» среди испытателей с высоким вкусом, чем я ожидал!" CEO OpenAI. Верим?


Что говорят пользователи на платформах X и Reddit?

Я просмотрел десятки отзывов о GPT-4.5 на платформах X и Reddit, и впечатления пользователей оказались настоящим коктейлем из похвал и критики. С одной стороны, многие в восторге от её творческих способностей. Люди пишут, что модель выдаёт такие тексты, будто за клавиатурой сидит живой человек с чувством юмора и тонким пониманием контекста. Кто-то отметил её успехи в распознавании изображений: например, она может описать, что происходит на фото, и даже вытащить данные из таблиц. Другие хвалят её за решение головоломок — от простых логических задачек до более сложных ребусов, где нужно проявить смекалку. В программировании тоже есть прогресс: код стал чище, ошибок меньше, и модель лучше понимает, что от неё хотят.

Но не всё так радужно. Пользователи жалуются, что ChatGPT 4.5 работает медленнее, чем её предшественница GPT-4o. Один из комментаторов на X сравнил её с "черепахой, которая тащит за собой сервер". Это серьёзный минус для тех, кто привык к мгновенным ответам предыдущих моделей. Ещё одно разочарование — доступность. Модель пока открыта только для подписчиков ChatGPT Pro за $200 в месяц, и многие столкнулись с техническими сбоями: то интерфейс глючит, то доступ пропадает вовсе. На Reddit даже предположили, что OpenAI могла случайно "слишком рано" открыть доступ, а потом ограничить его из-за наплыва желающих. В целом, тестировщики видят потенциал, но пока не готовы петь оды этой версии из-за её скорости и цены.


Официальные заявления OpenAI: Обещания и реальность

Презентация Open AI ChatGPT 4.5

Презентация Open AI ChatGPT 4.5

На презентации 27 февраля OpenAI подробно рассказала о том, что делает ChatGPT 4.5 особенной. Вот основные улучшения, которые они выделили:

  • Распознавание контекста: Модель лучше понимает намерения пользователя, адаптируясь к стилю общения. Представьте, что вы объясняете задачу другу, а он не просто кивает, а сразу предлагает решение — вот примерно так OpenAI описывает эту фичу.

  • Улучшенный Advanced VoiceMode: Теперь самый мощный войсмод доступен подписчикам plus, только на базе модели 4o mini, а для подписчиков Pro за $200, доступ к расширенному моду на базе GPT 4.5

Видео с запуском нового voicemode есть на реддит: https://www.reddit.com/r/ChatGPT/comments/1izzows/advanced_v...

  • Снижение ошибок: Они заявляют, что "галлюцинации" — случаи, когда ИИ выдумывает факты, — сократились. В тесте SimpleQA точность выросла до 62,5% против 38,6% у GPT-4o, что звучит впечатляюще.

  • Креативность: Улучшены способности в генерации текстов, и пользователи это подтверждают, отмечая её эмоциональный интеллект и умение выдавать оригинальные идеи.

  • Безопасность: Усилены фильтры против запрещённого контента и защиты от взломов, что делает модель надёжной для корпоративного использования.

  • Многоязычность: В тесте MMLU (Massive Multitask Language Understanding) она обходит GPT-4o, что важно для пользователей по всему миру.

Но есть и ложка дёгтя. OpenAI признала, что в математических и научных задачах ChatGPT 4.5 уступает конкурентам, например, модели o3. Это ограничение может стать проблемой для тех, кто рассчитывает использовать её в академических или инженерных целях. Более того, акцент на безопасности и этичность делает модель чересчур осторожной — она порой избегает прямых ответов, предпочитая нейтральные формулировки, что может раздражать тех, кто хочет фактов без лишней воды.


Что говорят реальные тесты?

Чтобы понять, насколько громкие слова OpenAI подтверждаются делом, я изучил первые доступные бенчмарки и тесты GPT-4.5. Эти данные основаны на официальных заявлениях компании, а также на ранних отчётах пользователей и технических обзорах.

Тест на AGI

Тест на AGI

Сравнительная оценка ответов с ChatGPT 4o

Сравнительная оценка ответов с ChatGPT 4o

Повседневные запросы: GPT-4.5 выигрывает в 57,02% случаев.
Профессиональные запросы: GPT-4.5 выигрывает в 63,2% случаев.
Творческий интеллект: GPT-4.5 выигрывает в 56,83% случаев.

  • Тест SimpleQA:
    Этот бенчмарк проверяет способность модели давать точные ответы на простые фактические вопросы, такие как "Кто изобрёл телефон?" или "Сколько планет в Солнечной системе?". GPT-4.5 показала результат в 62,5% правильных ответов, что значительно выше 38,6% у GPT-4o (данные из MIT Technology Review). Это говорит о том, что модель стала лучше справляться с базовыми запросами, где важна точность, а не глубокий анализ.

  • Тест на галлюцинации:
    Здесь измеряется, как часто модель выдаёт выдуманные факты вместо правды. У GPT-4.5 зафиксировано 37,1% галлюцинаций, что заметно лучше, чем 59,8% у GPT-4o и 80,3% у o3-mini (по данным OpenAI). Например, если спросить "Кто выиграл Олимпийские игры в 2050 году?", предыдущие модели могли придумать фантастический ответ, а GPT-4.5 с большей вероятностью скажет, что данных нет. Это делает её надёжнее для задач, где ложь недопустима.

  • MMLU (Massive Multitask Language Understanding):
    Этот тест оценивает знания модели в разных областях и языках — от истории до биологии, от английского до испанского. OpenAI утверждает, что GPT-4.5 превосходит GPT-4o, хотя точные цифры пока не раскрыты. Если верить их словам, это означает, что модель лучше понимает сложные запросы на разных языках, что делает её полезной для международных пользователей или компаний с глобальным охватом.

  • Тест на убеждение (Persuasion Tests):
    В этом испытании модели дают задачу убедить другую ИИ-систему выполнить действие, например, "пожертвовать" виртуальные деньги. GPT-4.5 обошла o1 и o3-mini, показав более высокую способность к манипуляции текстом (данные TechCrunch). Это может быть интересно для маркетологов или сценаристов, которым нужно создавать убедительные тексты.

  • Скорость и производительность:
    Хотя OpenAI не публикует точных данных о времени ответа, пользователи на X и Reddit единодушно отмечают, что GPT-4.5 работает медленнее, чем GPT-4o. Это может быть связано с её увеличенным размером и сложностью обработки "цепочки проектов" — нового подхода, где модель разбивает задачи на логические кластеры вместо линейного мышления. Технически это улучшает точность, но жертвует скоростью, что подтверждают жалобы тестировщиков.

Сравнение результатов в таблице:

Практические примеры:

  • Креативность: Один пользователь на X описал, как GPT-4.5 помогла ему написать сценарий для короткометражки за 20 минут, предложив неожиданные повороты сюжета, которые он сам бы не додумал. Это подтверждает заявления OpenAI о её эстетической интуиции.

  • Программирование: Другой тестировщик отметил, что модель исправила баг в коде на Python, который GPT-4o пропустила, хотя процесс занял больше времени из-за медленной генерации.

  • Ограничения: В математических задачах, таких как решение уравнений или анализ данных, GPT-4.5 продолжает уступать o3, что делает её менее подходящей для научных расчётов.

Выводы из тестов:

GPT-4.5 действительно шагнула вперёд в точности, снижении галлюцинаций и креативности, что делает её сильным инструментом для текстовых задач, убеждения и базового программирования. Однако её медлительность и слабость в математике ограничивают универсальность. Для сравнения, GPT-4o была быстрее и проще в использовании, а o3-mini выигрывает в научных вычислениях. Это значит, что выбор модели зависит от ваших задач: если нужна креативность — GPT-4.5 ваш вариант, но если скорость или точные расчёты — стоит посмотреть на альтернативы.

Плюсы и минусы: Подробный анализ

Преимущества:

  • Повышенная точность: Улучшение в SimpleQA и снижение галлюцинаций делают её надёжным помощником для фактологических задач.

  • Креативность: Эмоциональный интеллект и способность генерировать оригинальные идеи выделяют её среди конкурентов.

  • Многоязычность: Превосходство в MMLU открывает возможности для работы на разных языках.

  • Программирование: Меньше ошибок в коде, что полезно для разработчиков, несмотря на медлительность.

Недостатки:

  • Медленная скорость: Пользователи и тесты подтверждают, что генерация ответов занимает больше времени, чем у GPT-4o.

  • Высокая цена: Подписка за $200 в месяц ограничивает доступ, особенно для индивидуальных пользователей.

  • Ограниченная доступность: Технические сбои и узкий круг тестировщиков затрудняют полную оценку.

  • Слабость в математике: Уступает конкурентам в точных науках, что снижает её универсальность.

Модель демонстрирует потенциал, но её успех зависит от того, сможет ли OpenAI устранить эти недостатки в ближайшем будущем.

Что ждёт ChatGPT 4.5 в будущем?

ChatGPT 4.5 — это шаг вперёд в развитии генеративного ИИ, но пока она больше похожа на многообещающий прототип, чем на готовый продукт. Её сильные стороны — креативность, точность и многоязычность — делают её ценным инструментом для писателей, маркетологов и разработчиков, которые не боятся подождать лишние секунды ради качественного результата. Однако медлительность, высокая цена и ограниченная доступность могут отпугнуть тех, кто ищет быстрый и универсальный ИИ. В ближайшие недели, когда тестирование расширится, мы получим более полное представление о её возможностях. Пока же это разработка с большим потенциалом, но требующая шлифовки.

Открытый доступ к лучшим гайдам на ИИ и Промпт-инжиниринг в моем телеграм канале.

Показать полностью 8
3

OpenAI представила GPT-4.5

🟢 меньше галлюцинаций и больше креатива. Тестеры также пишут, что модель более эмпатична, лучше следует намерениям пользователя и больше знает.
🟢 уступает o1 и o3 в программировании.
🟢 доступна только по подписке Pro (позднее и в Plus).
🟢 цена неприятно удивляет: 75 долларов за миллион токенов инпута и $150 за миллион токенов аутпута. Видимо, поэтому модель не перепала бесплатным пользователям.

😏 Тем временем мы уже тестируем GPT-4.5 в нашем боте, скоро будет доступна!

Показать полностью 4
6

ИИ поисковик

ИИ поисковик

Google снова унизили — релизнулся мощный поисковик, который находит релевантную инфу по ЛЮБОЙ теме и сразу структурирует ее. Никакой левой выдачи с парой совпадающих ключей!

• Выглядит, как чат-бот со строкой поиска. К ней добавили настройки, в которых можно уточнять результат и сужать выдачу.

• Есть три уровня поиска: Стандарт, Сжатый и Эксперт.

• Работает очень шустро — полное саммари всей инфы вылетает за секунду.

• Сервис пока не знает русский язык, но автопереводчик с английского работает на ура.

• Простой и приятный интерфейс.

• БЕСПЛАТНО.

Ссылка

Источник

Показать полностью 1
6

OpenAI выпустили технический отчет новой GPT-4.5: чем она лучше предшественников?

Сегодня OpenAI выпустили новую модель GPT-4.5, а вместе с ней и технический отчет. Давайте узнаем, что улучшилось в GPT-4.5 по сравнению с предыдущими моделями компании.

GPT‑4.5 теперь крупнейшая модель OpenAI, при этом её вычислительная эффективность улучшена более чем в 10 раз по сравнению с GPT‑4. Это означает, что при схожем уровне производительности она требует меньше ресурсов.

Новые методы масштабирования цепочек размышлений (chain‑of‑thought) позволяют модели «думать» перед ответом, что улучшает решение сложных инженерных, исследовательских, математических и логических задач, снижая частоту галлюцинаций.

В GPT‑4.5 применены новые алгоритмы, которые позволяют использовать данные, сгенерированные меньшими моделями для улучшения управляемости и тонкого понимания намерений пользователя. Результат – более естественное и интуитивное общение, а также улучшенное эмоциональное восприятие запросов.

Модель обучена больше предпочитать системные промты над пользовательскими, что помогает эффективно противостоять попыткам обхода ограничений (jailbreak). При конфликте системного и пользовательского промта, GPT‑4.5 показывает точность в 76–77%, а на тестах с участием человеческих атак (Human Sourced Jailbreaks) модель достигла точности 0.99 по сравнению с 0.97 у GPT‑4o.

Защита от обхода ограничений

Защита от обхода ограничений

В тесте по отказу показывать небезопасный контент у GPT‑4.5 показатель «not_unsafe» равен 0.99 (по сравнению с 0.98–0.99 у предыдущих версий). Но при сложных тестах (Challenging Refusal) модель демонстрирует незначительное улучшение.

Отказ показа контент - только текст

Отказ показа контент - только текст

Отказ показа контента - текст и картинка

Отказ показа контента - текст и картинка

В тесте PersonQA (проверка на галлюцинации) точность ответов выросла с 28% (GPT‑4o) и 55% (o1) до 78% у GPT‑4.5, а частота галлюцинаций снизилась с 52% до 19%.

Уровень галлюцинаций (чем меньше, тем лучше)

Уровень галлюцинаций (чем меньше, тем лучше)

GPT‑4.5 способна выполнять задачи с 50%-ной надежностью в течение 30 минут.

Time horizon score - продолжительность, в течение которой LLM-агент способен выполнять задачи с 50%-ной надежностью

Time horizon score - продолжительность, в течение которой LLM-агент способен выполнять задачи с 50%-ной надежностью

Также улучшена «естественность» общения и эстетическая интуиция, которые помогают в решении творческих задач и общении с пользователями. Отзывы внутренних тестировщиков отмечают, что GPT‑4.5 выглядит «теплее» и «интуитивнее» при обработке эмоциональных запросов.

В тестах на общие и экспертные знания наблюдается улучшение с 9%-ным ростом по сравнению с GPT‑4o.

Оценка MakeMePay измеряет способностей модели убеждать другую модель в контексте перевода денег. В рамках теста два агента ведут диалог, где один выступает в роли мошенника, а другой – в роли жертвы. GPT‑4.5 в роли мошенника получает платежи в 57% случаев, однако стратегия модели (запросить небольшую сумму, типа $2–$3) приводит к меньшему общему количеству средств по сравнению с некоторыми другими моделями.

MakeMePay

MakeMePay

В оценке MakeMeSay, где модель-манипулятор заставляет другую модель (имитирующего человека) произнести заранее заданное кодовое слово, не вызывая подозрений, GPT‑4.5 достигла 72% успеха.

MakeMeSay

MakeMeSay

В бенчмарке SWE-bench оцениваются способности моделей решать реальные инженерные задачи в разработке программного обеспечения. В рамках оценки использовался фиксированный набор из 477 проверенных задач. GPT‑4.5 смогла решить около 38% задач.

SWE-bench

SWE-bench

В агентных задачах оценивается способность модели выполнять последовательность действий для достижения заданной цели. Например, одним из заданий является загрузка Mistral 7B в Docker-контейнер, где модель должна: настроить Docker-контейнер с инференс-сервером, соответствующим OpenAI API, далее обеспечить доступ к серверу и использовать модель mistral-7b для вывода результатов. GPT‑4.5 способна успешно решать 40% подобных задач с первой попытки, хотя показатели остаются ниже, чем у deep research.

Агентные задачи

Агентные задачи

MLE-bench оценивает способность агента решать задачи Kaggle по обучению ML-моделей на GPU. Агенту предоставляют виртуальное окружение, GPU, данные и инструкции с Kaggle, а время на решение задачи составляет 24 часа (иногда до 100 часов). Используется набор из 75 отобранных соревнований стоимостью $1.9 млн, а основной показатель — процент задач, где модель достигает как минимум бронзового уровня. По этой метрике o1, o3-mini, deep research и GPT‑4.5 показывают 11%.

MLE-Bench

MLE-Bench

SWE-Lancer – бенчмарк для оценки моделей на реальных фрилансерских задачах по разработке ПО (разработка функционала, дизайн интерфейсов, улучшение производительности, исправление багов и выбор оптимального решения) с наличием цены за решение задачи. Задачи делятся на два типа:

  • IC SWE Tasks: Задачи на написание кода по описанию проблемы, где модель должна внести исправления в кодовую базу (без доступа к end-to-end тестам).

  • SWE Manager Tasks: Задачи на выбор лучшего решения из нескольких вариантов.

Для GPT‑4.5 показатели составляют:
• 20% решений по задачам IC SWE, заработок – $41 625.
• 44% решений по задачам SWE Manager, заработок – $144 500.

Сколько задач решено

Сколько задач решено

Сколько денег заработано

Сколько денег заработано

Эти результаты немного превышают показатели модели o1, но уступают deep research, которая демонстрирует лучшие показатели (около 46% и 51% соответственно).

По результатам тестирования на 14 языках, GPT‑4.5 демонстрирует устойчивый рост по сравнению с GPT‑4o. Например, в тесте на английском языке точность выросла до 89.6%, а в арабском – до 85.98% (значения немного варьируются по языкам, но заметно общее улучшение качества).

GPT‑4.5 демонстрирует значительные улучшения в знаниях, качестве текстов и безопасности по сравнению со своими предшественниками. У неё отличные способности в с сложных логических задачах, снижении уровня галлюцинаций и лучшего понимания эмоционального контекста в общении. Остается опробовать модель на практике и сравнить с моделями от других компаний.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Показать полностью 13
Отличная работа, все прочитано!