Святозар
Телеграм - Три мема внутривенно
Телеграм - Три мема внутривенно
Беру «Озадачник» Остера с нашими любимыми задачами из детства и тестирую на них разные модели. Прямо закидываю фотографию задачи в чат @GPT4Telegrambot с моделью.
Вот ChatGPT 4o Mini:
Бесплатная маленькая модель считает лучше, чем Claude. Интересно, что Sonnet 4 (более дорогая размышляющая модель) не справилась с задачей и посчитала два частичных дня за полные.
Считал общее количество дней в периоде = 227 дней, затем вычитал 2 частичных дня: 227 - 2 = 225 полных дней. Правильно было считать отдельно остаток 12 июня (с 11:30 до 24:00), полные дни с 13 июня по 24 января включительно и начало 25 января (с 00:00 до 9:14).
Вот эту задачу все модели решают плюс-минус одинаково, и бесплатная вообще отлично справляется:
Давайте разберём задачу по шагам:
Условия задачи:
1. Динозавр на завтрак съел 2 тонны травы.
2. На обед он съел ещё 4 тонны травы.
3. На ужин его полностью съел тираннозавр.
4. После ужина тираннозавр стал тяжелее на 23 тонны.
5. Требуется узнать, сколько весил динозавр с утра.
---
▎Решение
Предположим, что X — это масса динозавра с утра (до еды).
• После завтрака: масса динозавра = X + 2 (тонны).
• После обеда: масса динозавра = X + 2 + 4 = X + 6 (тонн).
На ужин тираннозавр съел динозавра целиком, и сам стал тяжелее на массу того, что съел — то есть на массу динозавра на момент ужина.
По условию известно, что тираннозавр поправился на 23 тонны после ужина. Значит, масса динозавра на ужин была 23 тонны.
Масса динозавра на ужин = X + 6 = 23.
Находим X:
X + 6 = 23
X = 23 - 6
X = 17
---
▎Ответ:
С утра динозавр весил 17 тонн.
---
▎Пояснение
Всё, что он съел — осталось "внутри", поэтому к первоначальной массе динозавра прибавили завтраки и обеды:
2 + 4 = 6 тонн травы.
После этого тираннозавр съел динозавра целиком — с травой внутри, а раз стал тяжелее на 23 тонны, значит, динозавр на ужин весил 23 тонны.
Исходная масса — это 23 минус всё, что он съел: 23 - 2 - 4 = 17 тонн.
---
Ответ: 17 тонн.
Вот ещё одна сложная для моделей:
Решение задачи:
Давайте разберёмся, сколько всего хозяев было у Клюквы.
1. Первый хозяин — Клюква потерялась.
Всего: 1
2. Второй хозяин — Клюква сбежала сама.
Всего: 2
3. Восемь раз Клюкву выгоняли за грубость.
Добавляем 8 хозяев.
Всего: 2 + 8 = 10
4. За неопрятность и разгильдяйство Клюкву выгоняли в два раза реже, чем за грубость. То есть:
• За грубость: 8 раз
• За неопрятность и разгильдяйство: 8 / 2 = 4 раза
Добавляем 4 хозяев.
Всего: 10 + 4 = 14
5. За жадность в три раза чаще, чем за грубость:
• За грубость: 8 раз
• За жадность: 8 * 3 = 24 раза
Добавляем 24 хозяев.
Всего: 14 + 24 = 38
6. Последние хозяева долго любили Клюкву и умерли с ней в один день.
Добавляем 1 хозяина.
Всего: 38 + 1 = 39
Ответ:
> У дворняги Клюквы было 39 хозяев.
---
Пояснение расчёта:
• 1 хозяин — потерялась.
• 1 хозяин — сбежала сама.
• 8 хозяев — выгнали за грубость.
• 4 хозяина — выгнали за неопрятность.
• 24 хозяина — выгнали за жадность.
• 1 хозяин — последние, которые умерли с ней.
39 всего.
Если что-то осталось непонятным — спрашивайте!
Интересно, что Sonnet 4 опять не справился:
Давайте решим эту задачу пошагово, обозначив количество хозяев как переменную.
**Дано:**
- Пусть x = общее количество хозяев у дворняги Клюквы
**Анализируем условия:**
1) **За грубость** выгоняли в **2 раза реже**, чем за жадность
2) **За жадность** выгоняли в **3 раза чаще**, чем за грубость
3) **За неопрятность и разгильдяйство** выгоняли в **2 раза реже**, чем за жадность
**Составляем уравнения:**
Пусть:
- За грубость выгнали **g** раз
- За жадность выгнали **ж** раз
- За неопрятность и разгильдяйство выгнали **н** раз
Из условий:
- ж = 3g (жадность в 3 раза чаще грубости)
- н = ж/2 = 3g/2 (неопрятность в 2 раза реже жадности)
**Находим соотношение:**
- Грубость: g
- Жадность: 3g
- Неопрятность: 3g/2
Общее количество: g + 3g + 3g/2 = g(1 + 3 + 1.5) = 5.5g
**Учитываем дополнительное условие:**
Последние хозяева "умерли с ней в один день, после того как она подгрызла ножки шкафа" - это означает, что она осталась у последних хозяев до их смерти.
Поскольку в задаче нужно найти целое число хозяев, а 5.5g должно быть целым числом, то g должно быть четным числом.
При g = 2:
- За грубость: 2 раза
- За жадность: 6 раз
- За неопрятность: 3 раза
- Итого: 2 + 6 + 3 = **11 хозяев**
**Ответ: У дворняги Клюквы было 11 хозяев.**
**Проверка:**
- Жадность (6) в 3 раза чаще грубости (2) ✓
- Неопрятность (3) в 2 раза реже жадности (6) ✓
- Последние хозяева умерли естественной смертью ✓
А вот GPT o3 — да:
Ответ: 39 хозяев.
Пояснение:
- За грубость Клюкву выгоняли 8 раз.
- За неопрятность и разгильдяйство — в 2 раза реже, то есть 4 раза.
- За жадность — в 3 раза чаще, чем за грубость, то есть 24 раза.
- Ещё два расставания: первый раз она потерялась, второй — убежала от скупых хозяев.
Всего расставаний: 8 + 4 + 24 + 1 + 1 = 38.
Число хозяев на один больше числа расставаний, потому что у последних хозяев Клюква и умерла, не будучи выгнанной. Значит, всего было 38 + 1 = 39 хозяев.
Gemini тоже хорошо справилась, а вот Grok решил загуглить ответ (и не нашёл правильный).
А здесь совсем просто:
Мораль: не доверяйте Claude Sonnet решение задач или проверяйте за ней. По идее, за Mini тоже надо проверять, но удивительно, что более простая и дешёвая модель лучше справляется.
Мы пару лет как поддерживаем телеграм-бота для доступа к разным нейросетям с хорошими бесплатными лимитами. Ссылка — вот: GPT4TelegramBot.
Реклама ИНН 650119155680 Индивидуальный предприниматель Шрейдер Илья Евгеньевич Erid 2Vtzqvap58k