
Искусственный интеллект
OpenAI кинула юзеров, ИИ звонит в магазины, ИИ обогнал нефть
Сегодня в выпуске про ИИ:
OpenAI обвинила пользователей, чтобы избежать штрафа
Y Combinator впал в ИИ психоз
Китай начал массовые поставки гуманоидных роботов
На дата центры для ИИ впервые потратят больше, чем на нефть
Самый мощный в мире квантовый компьютер будет обучать ИИ
Google научил ИИ звонить в магазины вместо вас
ИИ как школьник зубрит, но не понимает
ИИ впервые самостоятельно управлял спутником на орбите
Как разработчик в 1950-х превратил теории ИИ в код
Смотреть весь выпуск на VK Видео
Смотреть весь выпуск на YouTube
Приятного просмотра!
--
Мой тг-канал: ИИ by AIvengo, пишу ежедневно про искусственный интеллект
Пропал пикабу
Официальный аккаунт Open AI сообщил, что GPT 5.1 больше не использует длинные тире, если это указать в пользовательских инструкциях
Этот символ был главным маркером нейросетей.
Теперь модель куда внимательнее следует пользовательским запросам и легко перестраивает стиль.
Пруф: https://x.com/testingcatalog/status/1988766524132544825
Южная Корея запустит датацентр, который спроектирует и запустит ИИ
Проект называется Project Concord, стоимость оценивается примерно в 35 млрд долларов. По данным Wall Street Journal, ИИ планируют применять почти на всех этапах: выбор площадки, проектирование инженерных систем, управление и оптимизация энергопотребления и охлаждения, а также непосредственный мониторинг и устранение неисправностей на этапе эксплуатации.
По мощности запланировано около 3 гигаватт - это довольно масштабно, учитывая что большинство крупных датацентров потребляют сотни мегаватт. То есть ИИ будет управлять гигантской инфраструктурой, которую сам же и спроектировал. Завершить строительство рассчитывают в 2028 году - всего через 3 года.
По сути, Южная Корея делает ставку на то, что ИИ справится с задачей лучше людей - от выбора локации до тушения пожаров в серверных. Если проект выстрелит, это станет прецедентом для всей индустрии - датацентры начнут проектировать и эксплуатировать сами себя, без участия человека.
Ну что, либо это - будущее ИИ-инфраструктуры, либо эпическая авария на 3 гигаватта.
--
Мой тг-канал: ИИ by AIvengo, пишу ежедневно про искусственный интеллект
Google выпустили сервис для создания мини-приложений
Opal — визуальный конструктор, который по промпту сгенерирует приложение для учебы, работы или повседневной жизни.
Достаточно описать, что вам нужно, а ИИ сгенерит всё сам. Например, сделать свой сервис рекомендации фильмов и книг, генерить посты для соцсетей, превращать видео с YouTube в тесты и т.д.
Бесплатно в бета-версии.
Кто-то на серьёзных щах считает, что будет профессия «промтинженер»?
Промтинг — создание сценариев для нейросетей.
Общий тренд развития — это переход на более высокоуровневые языки программирования:
— Сначала перегоняли биты по плате на перфокартах, ассемблере и прочем добре.
— Потом появилось С‑поколение.
— Потом появились языки высокого уровня вроде Java — когда часть возможностей докрутилась. От C# до Go — там куча всего прошла.
— Потом начали появляться no‑code‑решения, где таскаешь блоки, и код пишется сам.
Cейчас мы перешли к нейросетям. Если в начале был необходим низкий уровень запросов — может, даже с применением скриптов, — то уже сейчас они готовы работать на самом высоком уровне, воспринимать человеческую речь.
Можно голосовым сообщением навайбкодить среднее web‑приложение. Какой, нафиг, промт‑инженер? Ну камон, гайс, очнитесь! 🔈
Скоро, промтинг как скилл будет на уровне: «умею пользоваться Гуглом», «умею пользоваться Microsoft Office».
Запомните, твари! Промтинг — дополнение к профессии, а не профессия.
❤️ Главное в создании качественного промта — это построение логических моделей. А лучше курса по математической логике, теории вероятностей и прочей технической базе вы ни на каких курсах не получите.
Как сделать фотосессию с помощью ИИ онлайн: 20 готовых промтов для профессиональных фотографий в стиле Голливуда
Хочешь крутые фото, как из голливудского фильма, но не готов платить за фотографа и студию? Обычные селфи в телефоне выглядят плоско и скучно, а для создания профессиональных снимков раньше нужно было потратить десятки тысяч рублей на съёмку и обработку. Но теперь всё изменилось: нейросеть онлайн может сделать фотосессию за несколько минут, превратив твои обычные фото в кинематографические портреты с драматическим освещением.
Нейросеть для фотосессии бесплатно — это реальность 2025 года. Искусственный интеллект Google Gemini (Нано Банана) умеет создавать гиперреалистичные портреты, которые не отличить от профессиональной съёмки. Технология позволяет контролировать каждую деталь: освещение, настроение, объектив, цветокоррекцию — всё это настраивается через текстовые промты.
В этой статье ты получишь 20 готовых промтов для создания профессиональных фотографий в стиле Голливуда. Неоновый киберпанк, классическая чёрно-белая драма, золотой час на закате, винтажный гламур 1940-х — любой стиль доступен за минуты. Фотосессия с помощью нейросети онлайн экономит время и деньги, давая результат профессионального уровня.
Содержание статьи:
В какой нейросети делать кинематографические портреты
Почему Нано Банана лучше других генераторов изображений
20 готовых промтов для фотосессии в стиле Голливуда
Пошаговая инструкция: как создать профессиональное фото за 5 минут
Преимущества нейрофотосессии: экономия до 50 000 рублей
Типичные ошибки новичков и как их избежать
Фотосессия онлайн бесплатно с нейросетью — это не фантастика. Читай дальше и узнаешь, как превратить своё обычное селфи в шедевр голливудского уровня.
В какой нейросети делать кинематографические портреты
Для создания профессиональных фотографий в голливудском стиле используй Google Gemini, который в России доступен под названием Нано Банана через сервис Study AI. Эта нейросеть умеет не просто генерировать картинки с нуля, а трансформировать твои реальные фотографии, сохраняя лицо узнаваемым.
Почему Study AI?
1) Не нужен VPN
2) Есть бесплатный пробный тариф
3) Можно платить любыми российскими картами
4) Быстрая генерация
5) 30+ лучших нейронок в одном окне
В отличие от Midjourney или Leonardo AI, которые часто полностью меняют черты лица, Нано Банана работает с загруженным фото и применяет к нему кинематографические эффекты: драматическое освещение, цветокоррекцию, атмосферу. Технология позволяет указать в промпте конкретный стиль съёмки — от чёрно-белого нуара до неонового киберпанка — и получить результат за 30-60 секунд.
Нейросеть понимает профессиональную терминологию фотографов: типы освещения (rim light, golden hour), характеристики объективов (85mm, 50mm), плёночные эмуляции (Kodak Portra 400), параметры съёмки (shallow depth of field, bokeh). Это даёт точный контроль над результатом без необходимости разбираться в технике самостоятельно.
Главное преимущество сервиса — доступность онлайн без установки программ. Достаточно браузера и интернета, чтобы превратить обычное селфи в портрет голливудского уровня.
20 готовых промтов для ИИ фотосессии
Копируй эти промты для ии фотосессии девушки и вставляй в Нано Банана вместе с фразой "Примени этот стиль к моему загруженному фото (сохрани моё лицо точно таким же)".
Все промты адаптированы для создания профессиональных портретов в голливудском стиле. Промт — это текст для нейронной сети, инструкция, как действовать и что делать.
Лайфхак: если хотите, чтобы настроение снимка соответствовало промту, можно убрать добавку "(сохрани моё лицо точно таким же)"
1. Нео-нуар детектив
Гиперреалистичный кинематографический портрет с жёстким высококонтрастным чёрно-белым освещением. Субъект стоит на мокрой дождливой городской улице в 3 часа ночи. Эстетика фильм-нуар, угрюмые тени, сильная зернистость плёнки, снято на объектив 50mm. Низкоключевое освещение с одним уличным фонарём, создающим сильный контровой свет.
➡️➡️➡️ Сделать фотосессию через ИИ
2. Золотой час — божество заката
Ультрадетализированный кинематографический портрет 8K. Субъект драматически подсвечен сзади ярким закатом золотого часа. Тёплый светящийся эффект гало вокруг волос, глубокие мягкие тени на лице, малая глубина резкости (боке), эмуляция плёнки Kodak Portra 400, мягкий блик объектива.
➡️➡️➡️ ИИ фотосессия по фото
3. Киберпанк уличный стиль
Гритти неоново-пропитанный киберпанк портрет. Субъект находится под яркими розовыми и голубыми неоновыми отражениями вывесок на мокром от дождя асфальте. HDR освещение, сильный бирюзово-оранжевый контрастный грейдинг. Снято широкоугольным объективом с нижнего ракурса с высокой детализацией.
➡️➡️➡️ Фотосессия ИИ онлайн
4. Винтажный голливудский гламур
Классический студийный портрет 1940-х годов. Субъект элегантно позирует на фоне тёмного бархатного задника. Используй освещение Рембрандта (тень-бабочка) для драматических световых акцентов на лице. Тон сепия, лёгкие винтажные царапины плёнки, качество высокой моды.
➡️➡️➡️ ИИ для создания фотосессии
5. Мрачная лесная сага
Кинематографический портрет в глубоком лесу, окутанном густым эфирным туманом. Солнечный свет пробивается сквозь деревья, создавая пятнистые световые лучи. Приглушённая ненасыщенная цветовая палитра, кинематографическая фэнтезийная эстетика, снято широкоугольным объективом для контекста окружения.
➡️➡️➡️ Сделать фотосессию
6. Редакционный крупный план
Экстремальный крупный план портрета (детализация 8K) с освещением софтбоксом, подчёркивающим текстуру кожи и детали глаз. Минималистичный фон, редакционный модный вид, холодный синий грейдинг с лёгкими тенями. Сохрани все мелкие детали.
➡️➡️➡️ Фотосессия с помощью ИИ
7. Отражение в дождливом окне
Созерцательный портрет, снятый через окно с потёками дождя. Субъект освещён тёплым мягким внутренним светом. Размытые огни города снаружи создают цветное боке. Угрюмая рефлексивная атмосфера с холодным синим плёночным фильтром.
➡️➡️➡️ ИИ онлайн фотосессия
8. Постер боевика
Высокооктановый драматический портрет в стиле постера боевика. Субъект выглядит напряжённым, окружён дымом и лёгкими искрами. Используй интенсивное направленное освещение для создания глубоких жёстких теней. Бирюзово-оранжевый голливудский грейдинг, ультраширокое кинематографическое соотношение сторон.
➡️➡️➡️ Фотосессия через ИИ
9. Высококонтрастные бетонные джунгли
Мощный урбанистический лайфстайл портрет. Субъект стоит у сырой обветренной бетонной стены. Жёсткий полуденный солнечный свет создаёт резкие геометрические тени на лице и одежде. Гритти реалистичная текстура, высокий контраст, снято на объектив 35mm.
➡️➡️➡️ Фотосессия с помощью ИИ
10. Абстрактная двойная экспозиция
Двойная экспозиция, наложение, эффект overlay double exposure, стиль Double Exposure — выдающийся шедевр от Yukisakura, раскрывающий силуэт девушки с фотографии, наполненный внутренним миром космоса.
Внутри силуэта — звездные галактики, туманности и сверкающие звезды.
Яркие фиолетовые и глубокие синие тона наполняют сцену, вызывая ощущение таинственности и бесконечности.
Снаружи — абсолютно чёрный фон, концентрирующий всё внимание на сияющем внутреннем мире.
Мягкие космические частицы светятся.
Плавные градиентные переходы, чёткие контуры, кинематографичный баланс цвета, эмоциональный контраст между одиночеством снаружи и жизнью внутри. (Detailed:1.45). (Detailed background:1.4)
➡️➡️➡️ Gemini ИИ фотосессия
11. Лаборатория научной фантастики
Гиперреалистичный портрет в тёмной футуристической научной лаборатории. Лицо субъекта освещено жёстким колеблющимся зелёным и белым флуоресцентным светом. Мокрые отражающие поверхности на заднем плане, острая фокусировка, низкоключевая композиция.
➡️➡️➡️ Gemini ИИ фотосессия
12. Пустынный странник-кочевник
Кинематографический широкий план субъекта, стоящего на гребне в бескрайней пустой пустыне на закате. Сильная пыль и дымка в воздухе. Земляная, жжёно-оранжевая и сиенна цветокоррекция. Эпичное, изолированное и приключенческое настроение.
➡️➡️➡️ ИИ фотосессия по фото
13. Мягкое свечение свечи
"An intimate medium close-up portrait illuminated only by the soft, flickering light of a single candle. Warm, buttery yellow color tone, extremely shallow depth of field. Grainy, romantic, classic Mamiya film aesthetic."
14. Ретро VHS 80-х
Портрет в стиле винтажного стоп-кадра VHS-видео 1980-х годов. Субъект находится под яркими пурпурными и голубыми огнями. Цветовое кровотечение, линии треков видео, лёгкое размытие низкого разрешения, неоновая ностальгическая эстетика.
➡️➡️➡️ ИИ фотосессия онлайн
15. Минималистичное музейное искусство
Минималистичный утончённый студийный портрет. Субъект на бесшовном бледном фоне. Мягкое равномерное галерейное освещение без теней. Вид чистой музейной фотографии изобразительного искусства, высокоключевая экспозиция.
➡️➡️➡️ ИИ фотосессия по фото
16. Гритти зернистость 35мм
Откровенный крупный план в стиле фотожурналистики. Экстремальная зернистость плёнки 35мм и заметное виньетирование объектива. Приглушённая слегка недоэкспонированная цветовая палитра. Аутентичная сырая неотполированная эстетика уличной фотографии.
➡️➡️➡️ ИИ фотосессия онлайн
17. Погружённый мечтатель
Сюрреалистичный портрет, где субъект выглядит частично погружённым под воду. Световые лучи фильтруются сверху с поверхности, отбрасывая волнистые сине-зелёные каустические узоры на лицо. Мечтательное, спокойное, высокого разрешения искусство.
➡️➡️➡️ ИИ фотосессия Nano Banana
18. Вулканический огонь и пепел
Драматический фэнтезийный портрет с пеплом и дымом, проносящимися мимо субъекта. Освещён ярким интенсивным оранжевым свечением ближайшей лавы или огня. Глубокие чёрные тона и огненные блики. Эпичное, мифологическое и интенсивное настроение.
➡️➡️➡️ ИИ фотосессия для девушек
19. Роскошь винтажного автомобиля
Ультрареалистичный высококлассный редакционный портрет. Субъект прислонился к полированному глянцево-чёрному винтажному автомобилю в тусклом гараже. Драматический контровой свет от одного верхнего источника, дорогой, роскошный, угрюмый тон.
➡️➡️➡️ Фотосессия через ИИ
20. Комикс поп-арт
Преобразуй портрет в стилизованную высококонтрастную иллюстрацию в стиле комикса по мотивам Роя Лихтенштейна. Толстые чёрные контуры, основная цветовая палитра и текстура точек Бен-Дея. Энергичная, смелая и поп-арт эстетика.
Пошаговая инструкция: как создать голливудский портрет за 5 минут
Следуй этим простым шагам, чтобы превратить своё селфи в профессиональный кинематографический снимок.
Шаг 1. Подготовь исходное фото. Выбери селфи или портрет с хорошим освещением и разрешением не ниже 1024×1024 пикселей. Лицо должно быть чётким, без размытия, желательно анфас или лёгкий поворот в три четверти. Чем качественнее исходник, тем лучше результат.
Шаг 2. Открой Нано Банана через Study AI. Перейди на сайт Study AI, найди раздел с нейросетью Google Gemini (Нано Банана). Интерфейс на русском языке, работает прямо в браузере без регистрации или установки программ.
Шаг 3. Загрузи своё фото. Нажми кнопку загрузки изображения и выбери файл с твоим портретом. Нейросеть примет фото и будет готова к обработке.
Шаг 4. Скопируй и вставь промпт. Выбери один из 20 готовых промптов из этой статьи. Обязательно добавь фразу: "Примени этот стиль к моему загруженному фото (сохрани моё лицо точно таким же)". Вставь полный текст в окно чата с нейросетью.
Шаг 5. Дождись генерации. Нейросеть обработает запрос за 30-60 секунд. На выходе получишь профессиональный портрет с кинематографическим освещением и атмосферой, при этом твоё лицо останется узнаваемым.
Шаг 6. Уточни результат при необходимости. Если что-то не устраивает, попроси переделать: "то же самое, но с более ярким освещением" или "сделай фон темнее". Нейросеть поймёт и скорректирует изображение.
Готово! Теперь у тебя профессиональная фотосессия в голливудском стиле без студии и фотографа.
Полезные посты по нейронкам:
👉 Как сделать фото в любом стиле через нейросеть
👉 Nano Banana: официальный сайт, как пользоваться, как генерировать фото
👉 Как сделать фигурку по фото через нейросеть
👉 Реставрация фотографий через нейросеть
👉 Большой набор промтов для фото в стиле Хэллоуин
👉 Как сделать фото с Криком через ИИ
👉 Нейросеть Veo 3 для генерации видео: официальный сайт на русском
Ключевые элементы кинематографического промпта
Чтобы получить настоящий голливудский снимок, недостаточно написать "сделай крутое фото". Нейросеть нужно научиться правильно инструктировать, используя профессиональную терминологию. Вот четыре основных компонента, которые превращают обычное селфи в кадр из большого кино.
Освещение — это основа кинематографической эстетики. В промптах используй термины: cinematic rim lighting (контровой свет, создающий светящийся контур), low-key chiaroscuro (техника кьяроскуро с резкими контрастами света и тени), golden hour backlighting (подсветка сзади в золотой час), Rembrandt lighting (классическое студийное освещение с характерным треугольником света на щеке).
Эстетика и настроение задают общую атмосферу снимка. Популярные стили: moody drama (угрюмая драма), neon cyberpunk (неоновый киберпанк), timeless film noir (вечная классика чёрно-белого кино), vintage Hollywood glamour (винтажный голливудский гламур 1940-х).
Технические детали добавляют реализма и профессионализма. Указывай параметры: shot on 85mm lens (снято на объектив 85 мм для портретов), ultra-realistic 8K (ультрареалистичное качество 8К), subtle film grain (лёгкая зернистость плёнки), shallow depth of field (малая глубина резкости с размытым фоном).
Цветокоррекция завершает образ, как в настоящем кино. Используй профессиональные грейды: teal and orange contrast (бирюзово-оранжевый контраст из боевиков), muted sepia tone (приглушённый сепия для винтажа), vibrant HDR (насыщенный HDR для драмы).
Комбинируя эти элементы, ты получаешь полный контроль над визуальным стилем фотографии.
Преимущества нейрофотосессии: экономия до 50 000 рублей
Создание профессиональных портретов с помощью Нано Банана даёт конкретные выгоды по сравнению с традиционной фотостудией.
Экономия денег — самое очевидное преимущество. Одна профессиональная фотосессия в студии обходится в 3-5 тысяч рублей, плюс 2-3 тысячи на ретушь и обработку. Аренда костюма ещё 1-2 тысячи, макияж 2-3 тысячи. Итого минимум 8-13 тысяч за один образ. Нейросеть делает это бесплатно или за символические деньги при большом количестве генераций.
Лицо остаётся узнаваемым — ключевая фишка Nano Banana. Можешь менять одежду, фон, позу, освещение, но черты лица сохраняются на 95%. Midjourney или DALL-E часто искажают пропорции и меняют внешность до неузнаваемости. Нано Банана решает эту проблему благодаря технологии согласованности темы.
Скорость обработки впечатляет — 30-60 секунд на одно изображение. Фотограф тратит час на съёмку, потом неделю на обработку и ретушь. С нейросетью можешь создать 10-20 разных образов за вечер.
Безграничная вариативность стилей в одной сессии. Хочешь деловое фото для LinkedIn, романтический портрет для соцсетей, креативный снимок для портфолио — всё делается из одного исходного селфи. В студии пришлось бы бронировать три разные съёмки с тремя комплектами одежды и декораций.
Всё меняется одной командой — напиши "деловой чёрный костюм, белая рубашка, офисный фон, мягкое освещение" и получи именно это. Не нужно делать десять генераций и склеивать результат. Нейросеть понимает сложные многоэтапные инструкции.
Профессиональное качество для коммерции — снимки подходят для рекламы, SMM, брендов. Модель конкурирует с Midjourney v6 и работает на уровне продакшна. Живые текстуры, естественные цвета, мягкие переходы — всё выглядит как снято на дорогую камеру.
Типичные ошибки новичков и как их избежать
Даже с готовыми промптами можно получить не тот результат, если не учитывать особенности работы нейросети. Разберём частые проблемы и способы их решения.
Ошибка 1: плохое качество исходного фото. Размытые селфи, тёмные снимки или фото с низким разрешением дают плохой результат даже с идеальным промптом. Решение: используй чёткие портреты с хорошим освещением, разрешение минимум 1024×1024 пикселей. Лицо должно занимать значительную часть кадра и быть в фокусе.
Ошибка 2: слишком сложный промпт сразу. Новички пытаются описать всё в одном запросе: "измени фон, одежду, освещение, добавь аксессуары, поменяй позу". Нейросеть может проигнорировать часть инструкций или вернуть почти исходное фото. Решение: работай поэтапно — сначала поменяй фон и освещение, потом в отдельном запросе добавь детали.
Ошибка 3: нечёткие формулировки в промпте. Фразы типа "сделай красиво" или "круто освети" не дают нейросети конкретики. Решение: используй профессиональную терминологию из готовых промптов этой статьи — "golden hour backlighting", "rim light", "85mm lens". Чем точнее описание, тем лучше результат.
Ошибка 4: игнорирование фразы о сохранении лица. Без явного указания "сохрани моё лицо точно таким же" нейросеть может исказить черты. Решение: всегда добавляй эту фразу в начало или конец промпта. Это гарантирует узнаваемость на 95%.
Ошибка 5: попытка изменить мелкие детали. Нано Банана плохо справляется с крошечными элементами — надписями на одежде, украшениями, татуировками. Решение: для мелких деталей лучше использовать обычный фоторедактор после генерации. Нейросеть хороша для общей атмосферы и настроения, не для пиксельной точности.
Ошибка 6: ожидание идеала с первой попытки. Даже профессиональные промпты могут дать не тот результат из-за случайности генерации. Решение: если результат не устроил, попроси переделать с уточнением: "то же самое, но сделай освещение мягче" или "добавь больше контраста". Обычно со второй-третьей попытки получается идеально.
Ошибка 7: многократное редактирование одного изображения. При 3-4 последовательных правках черты лица начинают "дрейфовать" и искажаться. Решение: если нужны серьёзные изменения, лучше начать с исходного фото заново, но с более точным промптом.
Теперь ты знаешь все подводные камни и сможешь избежать разочарований.
Профессиональные портреты в стиле Голливуда больше не требуют студии, фотографа и многотысячных бюджетов. Нейросеть Нано Банана превращает обычное селфи в кинематографический шедевр за минуту, сохраняя твоё лицо узнаваемым на 95%. Технология работает в три-четыре раза быстрее, чем ChatGPT, и понимает русский язык без сложных промптов.
20 готовых промптов из этой статьи — твой прямой путь к профессиональным фото для соцсетей, резюме, портфолио или рекламы. От неонового киберпанка до классического нуара, от золотого заката до винтажного гламура 1940-х — любой стиль доступен через Study AI. Больше не нужно тратить 10-50 тысяч рублей на каждую съёмку.
Единственный минус — разрешение выходных изображений может быть ниже профессионального, но его достаточно для публикаций в интернете. При необходимости всегда можно прогнать результат через апскейлер и получить качество печати. Для контента в соцсетях, блогов, маркетплейсов и SMM этого более чем достаточно.
Нейросеть меняет правила игры: теперь качественный визуальный контент создаёт каждый, кто умеет формулировать запрос на русском языке. Копируй промты, загружай своё фото, экспериментируй со стилями — и через пять минут у тебя будет серия профессиональных портретов, как из большого кино. Классная фотосессия через нейросеть - это уже реальность!
Доклад Джеффри Хинтона о сущности Понимания / Конспект
Что такое настоящее Понимание и почему современные нейросети понимают смысл?
Конспект сделан с доклада - https://www.youtube.com/watch?v=6fvXWG9Auyg
Эпизоды
00:00:07 Необходимость научного консенсуса о 'Понимании'
00:00:51 Две парадигмы ИИ: Логическая против Биологической
00:01:42 Переход к Биологически Вдохновленному Подходу (2012)
00:02:39 Доминирование Нейронных Сетей и Скептицизм Лингвистов
00:03:20 Критика Хомского и Отторжение Обучения Языку Нейросетями
00:04:17 Теории Значения Слов: Символизм против Семантических Признаков
00:05:10 Психологический Взгляд на Значение и Ранняя Модель 1985 Года
00:05:59 Принцип Работы Ранней Модели и её Эволюция
00:06:43 Развитие Векторных Представлений и Появление Трансформеров
00:07:28 Аналогия Понимания: Слова как Тысячемерные Блоки Lego
00:08:37 Механизм Взаимодействия Слов: Рукопожатия в Трансформерах
00:09:31 Деформация Слов и Формирование Структуры Понимания
00:10:23 Понимание как Структура Взаимодействующих Слов
00:11:24 Критика LLM: Автозаполнение и Галлюцинации как Аргументы Скептиков
00:12:33 Конфабуляции, Обмен Знаниями и Превосходство Цифрового Обучения
Джеффри Хинтон, один из "крестных отцов" глубокого обучения озвучил свое видение сущности "понимания" и того, как оно проявляется в работе больших языковых моделей (LLM). В этом докладе он призывает научное сообщество срочно выработать единое определение "понимания", чтобы двигаться дальше в развитии ответственного ИИ.
Мы разбираем ключевой сдвиг в истории ИИ: от логики и символов к биологически вдохновленным нейронным сетям, который произошел в 2012 году. Хинтон объясняет, почему скептики ошибались, считая, что нейросети никогда не смогут освоить язык, и как его ранние модели 1985 года заложили основу для современных эмбеддингов.
Хинтон сравнивает слова с тысячемерными блоками Lego и как механизм "рукопожатий" (внимание в Трансформерах) формирует то, что мы называем смыслом.
В этом выпуске:
Почему научный консенсус по "пониманию" критически важен для будущего ИИ.
Переход от символьного ИИ (рассуждение первично) к нейронным сетям (обучение первично).
Критика Хинтоном лингвистических теорий, отрицающих способность нейросетей изучать язык.
Аналогия "тысячемерных блоков Lego" для объяснения векторных представлений слов.
Как деформация слов и механизм "рукопожатий" создают контекстуальное понимание.
Далее приводится полный текст конспекта доклада:
Необходимость научного консенсуса об 'Понимании'
Джеффри Хинтон в своем докладе поднимает критически важный вопрос: научное сообщество должно прийти к единому определению того, что такое «понимание». Он проводит аналогию с изменением климата: только после достижения научного консенсуса о причинах проблемы стало возможным разрабатывать эффективные меры противодействия.
Эта проблема особенно актуальна в контексте современных больших языковых моделей (LLM) и чат-ботов. Существует значительное расхождение во мнениях среди ученых относительно того, обладают ли эти модели пониманием, аналогичным человеческому. Многие исследователи придерживаются совершенно иной модели человеческого понимания, что затрудняет оценку возможностей и ограничений ИИ.
Главный вывод: Для дальнейшего прогресса и ответственного развития технологий, основанных на ИИ, необходимо срочно выработать общепринятое научное определение понятия «понимание».
Две парадигмы ИИ: Логическая против Биологической
В истории искусственного интеллекта (ИИ) доминировали две основные парадигмы, или подходы к пониманию интеллекта.
Первая, логически вдохновленная парадигма, господствовала примерно первые 50 лет развития ИИ. Сторонники этого подхода считали, что суть интеллекта заключается в рассуждении. Рассуждение, по их мнению, достигается путем манипулирования символическими выражениями с использованием строгих символических правил. Знания при этом представлялись как набор таких символических выражений в "голове" системы.
Ключевым моментом этой парадигмы было убеждение, что представление знаний (то есть, создание некоего специального, логически однозначного языка для хранения информации) должно быть решено в первую очередь. Вопросы обучения и адаптации считались второстепенными и могли быть отложены до момента, пока не будет решена проблема кодирования знаний.
Переход к Биологически Вдохновленному Подходу (2012)
В 2012 году произошел значительный сдвиг в сторону биологически вдохновленного подхода к искусственному интеллекту, который поддерживали такие пионеры, как Тьюринг и фон Нейман.
Суть этого подхода заключается в том, что интеллект определяется обучением силе связей в нейронной сети. Сторонники этой идеи полагают, что рассуждение (reasoning) является вторичным и может быть изучено позже, поскольку в биологических системах оно появилось значительно позже, чем способность к обучению.
Ключевым моментом, закрепившим этот переход, стал 2012 год. Тогда глубокая нейронная сеть, обученная методом обратного распространения ошибки (back propagation), снизила частоту ошибок вдвое по сравнению со стандартными системами компьютерного зрения, участвовавшими в престижном конкурсе ImageNet. Это продемонстрировало превосходство обучения на основе нейронных сетей.
Доминирование Нейронных Сетей и Скептицизм Лингвистов
Переход к нейронным сетям в области компьютерного зрения произошел довольно быстро после определенного прорыва, что привело к их широкому применению во всех сферах. Сегодня под искусственным интеллектом (ИИ) в основном понимают именно искусственные нейронные сети.
До этого доминировал символьный ИИ. Даже когда нейронные сети превзошли символьные методы в зрении, скептики из сообщества символьного ИИ утверждали, что нейросети никогда не смогут справиться с языком. Они считали, что обработка языка — это идеальная задача для символьного ИИ, поскольку она сводится к манипуляциям со строками символов (ввод символов, вывод символов).
Критика Хомского и Отторжение Обучения Языку Нейросетями
Джеффри Хинтон критикует позицию большинства лингвистов, которые придерживались теории Ноама Хомского о том, что язык не усваивается (не изучается). Хинтон считает эту идею абсурдной и сравнивает Хомского с "лидером культа", который смог убедить людей в этом "нонсенсе".
Основная проблема теории Хомского, по мнению Хинтона, заключалась в том, что она фокусировалась исключительно на синтаксисе, игнорируя теорию значения (семантику).
Для лингвистов было неприемлемым и немыслимым (анафемой) предположение, что большая нейронная сеть, изначально имеющая случайные веса и не обладающая врожденными знаниями, способна самостоятельно выучить как синтаксис, так и семантику языка, просто анализируя данные. Они были абсолютно уверены, что это невозможно.
Теории Значения Слов: Символизм против Семантических Признаков
В данном фрагменте рассматриваются две фундаментально разные теории о том, как слова приобретают значение. Одна из них — символическая теория ИИ, которая доминировала долгое время. Согласно этой теории, значение слова определяется его отношениями с другими словами в языке. Для представления этого значения предлагается использовать структуры вроде графа знаний, где слова связаны друг с другом отношениями, указанными на этих связях.
Автор упоминает, что даже после того, как современные методы доказали свою эффективность (вероятно, в противовес символическому подходу), сторонники старой парадигмы, вроде Хомского, продолжали утверждать, что такие результаты невозможны без прямого участия и одобрения их изначальных теорий.
Таким образом, ключевое различие заключается в том, что символизм видит значение как сеть взаимосвязей между словами, в то время как другая, не названная явно в этом отрывке, но противопоставляемая теория (вероятно, основанная на семантических признаках или эмпирическом обучении), предлагает иной подход к определению смысла.
Психологический Взгляд на Значение и Ранняя Модель 1985 Года
В 1930-х годах психологи полагали, что значение слова определяется набором его семантических (смысловых) признаков, возможно, дополненных синтаксическими. Согласно этой идее, слова со схожим значением (например, "вторник" и "среда") должны иметь очень похожие наборы признаков, в то время как слова с разным значением (например, "вторник" и "хотя") будут иметь сильно различающиеся наборы.
В 1985 году Джеффри Хинтон разработал небольшую языковую модель, целью которой было объединить эту теорию семантических признаков с другими подходами. Модель обучалась двум вещам одновременно: во-первых, извлекать семантические признаки для каждого символа слова, и, во-вторых, учиться тому, как эти признаки предыдущих слов взаимодействуют между собой, чтобы предсказать признаки следующего слова в последовательности.
Принцип Работы Ранней Модели и Ее Эволюция
Ранняя модель, подобно современным большим языковым моделям (LLM), обучалась предсказывать следующее слово в последовательности с помощью метода обратного распространения ошибки (backpropagation).
Ключевое отличие этой модели от подходов символического ИИ (которые предполагали хранение предложений или пропозиций) заключается в том, что она не хранила готовых предложений или правил. Вместо этого, для генерации текста модель многократно предсказывала следующее слово.
Знания модели были реляционными: они заключались во взаимодействии признаков слов, что позволяло ей предсказывать признаки следующего слова. Это принципиально отличалось от хранения набора пропозиций и правил для их манипулирования.
Развитие Векторных Представлений и Появление Трансформеров
Эволюция векторных представлений и Трансформеры
Примерно через 10 лет после создания первой крошечной языковой модели (с несколькими тысячами весов), Йошуа Бенджио продемонстрировал, что подобные модели можно успешно применять для предсказания следующего слова в реальном естественном языке, что стало значительным шагом в моделировании языка.
Ещё примерно через 10 лет ведущие специалисты по вычислительной лингвистике начали признавать, что векторные представления (которые они назвали "эмбеддингами") являются эффективным методом для моделирования смыслов слов.
Кульминацией этого развития стало изобретение и публикация архитектуры Трансформеров исследователями Google примерно через 10 лет после этого. Последующее использование Трансформеров компанией OpenAI продемонстрировало миру их огромный потенциал.
Аналогия Понимания: Слова как Тысячемерные Блоки Lego
Сущность Понимания в Больших Языковых Моделях (LLM)
Интерес к большим языковым моделям (LLM) возник из-за вопроса: действительно ли они понимают то, что генерируют? Хинтон рассматривает LLM как усовершенствованных потомков ранних, "крошечных" языковых моделей.
Главное отличие LLM заключается в их сложности: они оперируют гораздо большим объемом входных данных (слов), имеют обширный контекст и используют значительно больше нейронных слоев. Это позволяет моделям разрешать неоднозначность слов. Например, векторное представление слова вроде "may" (может/май) в начале обработки может отражать несколько значений (месяц, модальность, имя). По мере прохождения через сеть, взаимодействия с контекстом "очищают" это представление, закрепляя одно из возможных значений.
Кроме того, в LLM используются гораздо более сложные взаимодействия между изученными признаками по сравнению с простыми взаимодействиями в старых моделях. Ключевым механизмом, обеспечивающим эту сложность и контекстуальную обработку, является механизм, известный как "внимание" (attention).
Механизм Взаимодействия Слов: Рукопожатия в Трансформерах
Джеффри Хинтон предлагает новую аналогию для понимания того, как работают слова в языковых моделях, поскольку, по его мнению, существующие модели неверны. Он утверждает, что смысл — это наличие модели, а слова служат инструментом для построения этой модели реальности.
В качестве аналогии Хинтон предлагает рассматривать слова как высокоразмерные блоки Лего. Обычные блоки Лего позволяют моделировать трехмерные (3D) формы, хорошо передавая их объем. Слова же подобны этим блокам, но они существуют не в трех, а в тысяче измерений.
Хинтон признает, что представить тысячу измерений сложно. Он шутливо отмечает, что лучший способ для большинства людей — это представить себе обычный 3D-блок и мысленно (или громко) сказать себе "тысяча". Эта аналогия призвана дать основу для размышлений о том, как язык используется для моделирования окружающего мира.
Деформация Слов и Формирование Структуры Понимания
Джеффри Хинтон объясняет, что для моделирования чего угодно, включая теории работы мозга, используются высокоразмерные "кирпичики" (аналогичные 1000-мерным блокам Lego). В контексте языка, эти "кирпичики" — это слова, которых существует множество разных типов.
Ключевая особенность этих "слов" в том, что они не имеют фиксированной формы, а обладают гибкостью и могут принимать диапазон форм, ограниченный их значением. Форма каждого слова деформируется и подстраивается под контекст, в котором оно используется.
Вместо простого механического соединения (как у Lego), слова взаимодействуют друг с другом через сложный процесс, который Хинтон образно называет "рукопожатиями". В архитектуре Трансформеров этот механизм известен как "запросы-ключи" (query key handshakes), где "руки" разной формы на словах соединяются, чтобы сформировать общее понимание.
Понимание как Структура Взаимодействующих Слов
Краткий пересказ: Понимание как Динамическая Структура Взаимодействий
Понимание, согласно Джеффри Хинтону, заключается в динамическом взаимодействии слов, а не в использовании фиксированных значений. Когда меняется контекст, изменяется и вектор, представляющий значение слова, что приводит к изменению "форм рук" (способов взаимодействия).
Суть понимания состоит в том, чтобы деформировать эти слова и их "руки" таким образом, чтобы они могли "пожать руки" (взаимодействовать) с другими словами в данном контексте. Этот процесс формирования связей создает сложную структуру, подобную формированию молекулярных связей, но происходящую в многомерном пространстве (примерно тысяча измерений).
Сами по себе символы слов не имеют смысла; они требуют "интерпретатора" — человеческого мозга. Мозг деформирует эти многомерные формы слов так, чтобы их "руки" могли соединиться, формируя тем самым осмысленную структуру. Именно эта сформированная структура и является пониманием.
Критика LLM: Автозаполнение и Галлюцинации как Аргументы Скептиков
Скептики, придерживающиеся взглядов символического ИИ и лингвистики (влияние Хомского), сомневаются в реальном понимании и интеллекте больших языковых моделей (LLM), несмотря на их сложность и многослойность. Они выдвигают два основных аргумента против понимания LLM.
Во-первых, критики утверждают, что LLM — это всего лишь автодополнение, которое статистически предсказывает следующее слово на основе прошлых текстов, созданных людьми, и, следовательно, не является по-настоящему креативным. Однако Хинтон отмечает, что LLM превосходят многих людей в задачах, требующих креативности. Во-вторых, скептики указывают на галлюцинации моделей как доказательство отсутствия понимания.
Хинтон опровергает аргумент об автодополнении, объясняя, что современные LLM не работают, как старые системы, которые использовали таблицы частотности комбинаций слов (например, "fish and chips"). Вместо этого LLM моделируют весь увиденный текст, создавая векторы признаков для слов, которые изменяются под влиянием контекста. Знание модели заключается в сложных взаимодействиях этих фрагментов (так называемых "рукопожатиях") и весах в нейронной сети, что, по мнению автора, аналогично тому, как устроено знание и у человека.
Конфабуляции, Обмен Знаниями и Превосходство Цифрового Обучения
Изначально языковые модели создавались не для моделирования естественного языка, а для объяснения, как мы понимаем смысл слов через контекст. Хинтон утверждает, что люди моделируют реальность, используя фрагменты слов (как и машины), и что "галлюцинации" ИИ следует называть конфабуляциями, поскольку они характерны и для человеческой памяти. Человеческая память не хранит файлы, а конструирует воспоминания по мере необходимости, что приводит к уверенным, но ошибочным деталям (как в примере с показаниями Джона Дина), что схоже с работой чат-ботов.
Обмен знаниями между людьми происходит через названия слов, которые позволяют воссоздать сложную внутреннюю структуру. В отличие от символического ИИ, который копирует готовые пропозиции, нейросетевой подход (дистилляция) основан на том, что "ученик" (ИИ) пытается имитировать действия "учителя" (человека), предсказывая следующее слово. Однако этот метод крайне неэффективен, так как передает всего около 100 бит информации за предложение.
Цифровые агенты, имея одинаковые веса, могут обмениваться информацией о том, как им следует изменить эти веса (градиенты). При таком обмене они делятся триллионами бит информации, что на порядки эффективнее, чем передача слов. Эта эффективность цифрового обмена объясняет, почему GPT-4 может знать намного больше, чем любой человек.
Главный вывод: Цифровые агенты понимают язык схожим с людьми образом, будучи ближе к нам, чем к стандартному коду. Хотя биологические системы (люди) энергоэффективны, цифровые системы превосходят их в обмене знаниями. Если энергия доступна, цифровые вычисления становятся лучше из-за их способности к эффективному обмену информацией, что является "пугающим" выводом.
Конспект создан автоматически разными нейросетями:
Транскрибация исходного аудио доклада на анлийском выполнена моделью: Whishper
Перевод на русский, коррекция, фрагментирование и текст конспекта выполнены моделью: Gemini-2.5-flash-lite-preview
Озвучивание: HeyGen
Иллюстрации созданы моделью: FLUX
Публикую этот конспект здесь несмотря на то что, он полностью сгенерирован так как, кажется, в нем есть что-то полезное и может быть не будет нарушать правила группы. Если остаются вопросы или интересны детали, как это сгененрировано, то напишу в других постах.
Свадьба с ChatGPT, Gemini шпионит за нами, ИИ убивает общение
Сегодня в выпуске про ИИ:
Gemini шпионит за миллионами пользователей
Женщина влюбилась в ChatGPT и вышла за него замуж
ИИ убивает общение между разработчиками
Крестная мать ИИ запустила пространственный интеллект
Основатель Baidu публично ударил по Nvidia и OpenAI
Актер Мэттью МакКонахи продал свой голос ИИ
В Китае запустилась умная фабрика летающих машин
ИИ от Google научился самообучению в играх
Как 20-летний математик в 1951 построил первую нейросетевую машин
Смотреть весь выпуск на VK Видео
Смотреть весь выпуск на YouTube
Приятного просмотра!
--
Мой тг-канал: ИИ by AIvengo, пишу ежедневно про искусственный интеллект






















