
Искусственный интеллект
Иветта: работа с жестами, эмоциями и мимикой
История этой ИИ модели началась примерно 1,5 года назад. Тогда, в нейросети Stable Diffusion, на основе живой фотографии леса в закате, сочетания цвета и света, мне удалось создать изображение этой молодой женщины, фотографического качества. Нейросети стремительно развиваются. Вот настал момент, когда уже можно во вполне приемлемом качестве, ЛОКАЛЬНО, мастерить собственное видео в режиме I2V.
В открытом, бесплатном доступе, вышел великолепный инструмент под названием Framepack.
Не сильно требовательный к ресурсам ПК. В процессе работы, обратил внимание, что основной упор идёт на накопитель, ОЗУ и видеокарту. Мне вполне хватило обычного жесткого диска, 64Гб ОЗУ и RTX3090. Но лучше SSD m.2, 128Гб ОЗУ и RTX последних серий. Генерация происходит в 2 этапа. Первый, работает "Encoder" - вся нагрузка на накопитель (100%). Второй "Sampling" - вся нагрузка на ОЗУ и видеокарту. Эта нейросеть довольно хорошо следует командам. Порядка 70% процентов команд исполнила в точности. Конечно есть проблемы с качеством изображения, но всё впереди, я думаю.
Одно из направлений, к чему идёт всё происходящее по части видеогенерации - будут появляться нейро актёры и актрисы. Будут нейро художественные фильмы и сериалы. Своя актриса у меня уже есть - Иветта Болсер (Yvette Bolser).
Если переложить это на коммерческую составляющую, представляете, насколько это экономически целесообразно! Подумайте сами, каких требует ресурсов провести живую съемку - найти красотку, выезд в локацию, съемки, время, финансы...
Конечно путей может быть огромное множество. В частности, можно провести настоящую съемку, а благодаря AI инструментам получить более сложные, гибридные, если можно так выразиться, шедевры.
Google и их бесплатные инструменты - бесплатная озвучка и бесплатный репетитор по иностранному языку!
Помните, я рассказывала про NotebookLM? Это такой удобный инструмент, куда можно загрузить все, что угодно, а потом работать с этой разрозненной инфой. Получился шикарный подкаст с использованием загруженных материалов - кому интересно, я прикрепила в комментах к этому посту - там в формате wav .
1) Бесплатная озвучка текста и подкаст
Теперь, можно озвучить текст и создать подкаст по любой теме бесплатно.
Как это сделать подкаст бесплатно в NotebookLM:
Для этого нужен иностранный ip. На сайте NotebookLM загружаете документ или несколько файлов. Затем, нажимаете на “Аудиопересказ” и начинается анализ по теме и источникам. На выходе это будет аудио с двумя ведущими, которые исследуют тему, ведут диалог)
Я загрузила PDF - по матрицам, и ссылку на обучающий видеоролик на ютуб. На выходе, аудио длилось почти 7 минут. Это был подкаст с двумя ведущими, начало было интересным и интригующим - мне бы не помешало такое в университете) А потом все же мой фокус внимания рассеялся. Все-таки для точных наук важны еще и визуальные данные. А вот какую-нибудь историческую аналитику интересно послушать) Хотя может это только у меня так 🤔
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
2) Бесплатный репетитор по иностранному от Google
А еще, Google представила в разделе Google Labs экспериментальный проект под названием Little Language Lessons, включающий 3 инструмента для изучения иностранных языков:
Tiny Lesson: Позволяет пользователю описать конкретную ситуацию и предоставляет соответствующие слова, фразы и грамматические советы, адаптированные к этой ситуации.
Slang Hang: Генерирует реалистичные диалоги между носителями языка, включая сленг и идиомы. Можно изучать разговорную речь и узнавать значения незнакомых терминов, это помогает звучать более естественно.
Word Cam: Использует камеру устройства для распознавания объектов в окружающей среде и предоставляет их названия на изучаемом языке, а также дополнительные описания и примеры использования в предложениях.
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
Хотите больше пользы? Тогда вам в Приватный клуб НейроУчеба
Как отличить созданное на ИИ фото и реальное?
Все больше и больше контента генерируется на нейросетях, включая фото. Есть масса пресетов, фильтров, редакторов. Есть ли еще возможность понять, где реальность, а где — научная фантастика?
Способы для внимательных
—Руки и пальцы. Лишние пальцы, неестественное положение или неправильные пропорции.
— Текст. Орфографические ошибки, искаженные буквы или странные символы в тексте на изображении.
— Волосы и кожа. Неестественные текстуры, слишком гладкая кожа без пор или волосы, сливающиеся с одеждой.
— Симметрия и геометрия. Невозможные архитектурные формы, несоответствующая перспектива или несбалансированные элементы.
— Фон. Размытые или искаженные объекты, неузнаваемые детали на заднем плане.
— Артефакты. Если приблизить изображение, то можно будет обнаружить на нем странные детали.
Сервис для определения ИИ-фото
sightengine — после регистрации можно загрузить картинку, а сервис расскажет, где она сделана и как. Определяет хорошо, не было ошибок. Прикрепил скрины результатов (первые 3 скриншота)
aiornot — более простой сервис, но тоже хорошо определяет. Можно быстро зарегестрироваться через аккаунт Google в отличие от первого сайта.
illuminarty — кажется менее точным, показывает некую вероятность генерации фото от ИИ. Можно тоже пробовать, также доступны проверки текстов.
В комментариях предлагаю поделиться самыми странными ИИ-фотографиями, которые были найдены на просторах интернета!
📌 Если кому интересно, то пишу про лучшие ИИ в своем авторском канале (ссылка в профиле)
Продолжение поста «ИИ наступает по всем фронтам»1
Судя по комментариям к посту "ИИ наступает по всем фронтам" , народ не понял фишку увольнениям. "ИИ наступает", не просто слоган, а направление удара по развитию человечества. Сокращения идут множеством компаний разных направлений. И это первые шаги ИИ. Для примера, ход эволюции составил миллионы лет, здесь десятки лет. И с каждой секундой это время сокращается. С каждой секундой.
ИИ наступает по всем фронтам1
"Суммируя
По имеющимся данным, в 2025 году было потеряно более 23 500 рабочих мест в сфере технологий в 93 компаниях."
"Увольнения в технологической отрасли не показывают никаких признаков прекращения в 2025 году, при этом такие крупные игроки, как Google, Microsoft и другие, продолжают сокращать свою рабочую силу."
Ответ на пост «Хаус-кипер 2.0: зачем нам ИИ, к которому мы действительно привязаны»2
Автор абсолютно не видит проблем, видимо, в силу большой веры в человечество. Альтернативный вариант: автор пытается продать очередное "ИИ-для-бизнеса" решение, прикрываясь разговорами о любви...
Это не будет работать по трём пунктам:
1. ЛОЯЛЬНОСТЬ
"Хаус-кипер" был не только человеком, который знал всё и всех в доме, но и человеком, которому хозяева БЕЗОГОВОРОЧНО доверяли. Он воспитывался с детства таким образом, чтобы быть преданным хозяевам и ценить их больше, чем что-либо в этом мире. Конечно, бывали исключения, но система держалась только на доверии и лояльности.
В случае с ИИ, такое невозможно. Во-первых, вычислительные мощности явно будут на стороне "провайдера" (который МОЖЕТ использовать свой ИИ для, например, продажи вам товаров определенного бренда, и собирать и накапливать личную информацию, которую МОГУТ украсть злоумышленники). Во-вторых, всегда есть риск взлома - как бы не старались "обезопасить" разработчики, иногда дыры в безопасности появляются в неожиданных местах, и вот уже вам нужно объяснять не престарелым родителям, что нельзя просто взять и перевести все деньги в крипту через обменник и отправить неизвестному, а своему "семейному" ИИ, который управляет вашей и ваших родных жизнями. В-третьих, даже если взлом невозможен, система полностью развернута локально и никуда никому никаких персональных данных не отправляет, даже в этом случае скорее всего в ней есть сервисные бэкдоры, которые могут быть использованы против вас.
В общем случае, подобное - это не просто отдать ключи от дома незнакомцу, а полностью подчинить свою жизнь его воле, стать марионеткой в его руках: как показывают некоторые LLM на roleplay-тестах, врать ИИ может очень даже хорошо, убеждая людей в том, что нужно (задано целью) этому самому ИИ. Вы готовы впустить в свою жизнь идеального притворщика с неизвестными вам целями? Я - нет.
2. НЕОБХОДИМОСТЬ
"Хаус-кипер" был таковым человеком, потому что в нём была необходимость. Сейчас большинство его задач легко автоматизируются даже без ИИ, а ИИ-агенты лишь помогают упростить наиболее сложные задачи управления. Разумеется, "Хаус-кипер" в виде настоящего мясного человека тоже обладал уязвимостями и косяками эффективности, и с этим мирились, потому что НЕ БЫЛО ДАЖЕ ВЫКЛЮЧАТЕЛЕЙ света в комнате, нужно было отдать указание людям, которые зажгут или погасят лампы. Специальный человек, который брал на себя координацию всех процессов обслуживания был оправдан с точки зрения эффективности, несмотря на все риски (ему-то наслаждаться жизнью, в отличии от хозяев, время не требуется).
Сейчас я могу с Камчатки включить свет на кухне в квартире в Москве, посмотреть, кто там шастал по лестнице в подъезде и сделать ещё массу бесполезных, пока я в отъезде, дел не потратив на это много сил и времени. Остались ли задачи, для которых мне нужен персонализированный ИИ? Нет. Разве что какая-то совсем уж бессмысленная блажь, которая не сделает мою жизнь ни проще, ни приятней.
3. НАДЕЖНОСТЬ (УСТОЙЧИВОСТЬ)
Современный "умный дом" очень сильно завязан на доступ к интернету и стабильность электросети. Мы идём куда дальше, когда начинаем говорить о том, чтобы встроить управление с помощью персонального ИИ вообще во все аспекты быта И в эмоциональное поле пользователя. Чем больше параметров будет обрабатывать ИИ, тем больше вероятность возникновения сбоев.
Здесь вопрос даже не столько этический, "насколько приемлемо с точки зрения морали человеку доверять управление своими эмоциями машине, и насколько приемлемо делать зависимую от эмоций систему управления", вопрос сугубо прагматический: какие проблемы и риски этому сопутствуют? Не станет ли, например, такой ИИ-ассистент причиной развития или даже возникновения психических и умственных расстройств? Какова надежность подобной системы, будет ли она подвержена случайным или систематическим сбоям, которые НЕВОЗМОЖНО будет отладить из-за их ментального характера? Кто и как должен разработать рамки допустимого для подобного ИИ, ведь то, что для одного пользователя - невинные шутки или забавная фишка, для другого - ужасное оскорбление его чувств, а для третьего - необходимость, и какие-либо ограничения этого он будет считать "зацензуриванием" и "попранием свобод".
Хотя этические вопросы всё равно остаются. Вы знаете, как разработать ИИ, который будет всех устраивать без озвученных выше сложностей? Я вот за всё человечество ручаться не берусь.
Ну и бонусом, четвертая, временная причина:
4. СЛОЖНОСТЬ
Это только кажется, что в принципе современные модели обладают достаточным размером контекстного окна, чтобы вместить туда "отражение человеческой личности" и быть ему хорошим эмоциональным спутником, что можно оптимизировать работу множества нейронок так, чтобы они эффективно друг с другом взаимодействовали и могли управлять всем, но на деле, это всё упирается в то, что всей вычислительной мощности человечества не хватит даже на несколько тысяч пользователей при таких объёмах необходимых вычислений.
Это задача в разы сложнее "синтезирования" текста под заданные критерии на основе огромного объёма текстовых данных, сложнее синтезирования или распознания изображений, когда речь заходит о подстраивании под эмоции и сохранение некоторой "непрерывности" его сознания.
Со временем, технические сложности можно будет преодолеть, но вот то, что описано выше - вряд ли, если только не переделать всё человечество, чтобы оно могло без проблем таким пользоваться.
В представленном на сайте демо есть управление цифровой моделью с помощью ИИ, распознание и синтез речи (посредственный, интонации далеки от "человечности", плюс паузы на "додумывание" текста ответа.), всё на базе зарубежных LLM, без реально "своего" эмоционального и живого ИИ.
В моём посте ответ про домашний ИИ, потому что автор сам себе выкопал яму, заговорив о "хаус-киперах" и "живёте и привязываетесь". В оригинале (то, что рекламируют) идёт речь о бизнес-процессах, и знаете, для бизнеса идея "эмоциональных аватаров" тоже сомнительна (походит на что-то забавы ради, а не для дела), там это вполне может работать, но так, как подается "рекламщиками", в духе "хаус-кипер 2.0" - это просто смешно, просто написать грамотно инструкции для LLM, чтобы интегрировать с бизнес-процессами - это совсем не то же самое, что написать "живого ИИ-ассистента", как представлено в рекламе.
P.S. Ребят, ну "ИИ, к которому мы привязаны" несёт какую-то негативную окраску. Вроде такого: "чайник, который ограничивает твою свободу". Навевает мысли о добровольном рабстве у машины (которая всё так же остаётся безэмоциональной, но умело манипулирует тобой). Я, конечно, обеими руками за прогресс, и за то, чтобы "Вкалывают роботы, а не человек", но тут маркетинговая политика вызывает отторжение. Это кроме того, что философия, выбранная вами, тоже имеет ряд проблем. Задумайтесь.
НОВЫЙ ПЛАГИН ДЛЯ КОДИНГА В CHATGPT
Пользователи ChatGPT начали получать доступ к новой функции — Code Interpreter или Advanced Data Analysis (ADA).
Code Interpreter позволяет выполнять сложные задачи анализа данных с помощью 📱 Python прямо в интерфейсе ChatGPT
Что можно:
🔘 Делать расчёты, графики, диаграммы и прогнозы
🔘 Очищать и обрабатывать таблицы
🔘 Создавать географические карты объектов
🔘 Понимать запросы на обычном языке
🔘 Работает с огромными объёмами данных прямо в чате
Функция ADA доступна для подписчиков Plus и интегрирована в GPT-4o, что позволяет использовать её без дополнительной активации
Источник: 🎯 НЕЙРО-ПУШКА ● НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ
Grok — что с ним? Давно ничего не писал про эту модель, а она очень сильно обновилась, вот что теперь доступно БЕСПЛАТНО:
— Теперь есть отдельный сайт, где можно зарегистрироваться в обход социальной сети X (что очень удобно) — grok com
— Режимы работы: DeepSearch (поиск + рассуждения), DeeperSearch (подойдет для создания проектов и исследований), Think (рассуждения), Grok 3 (обычная модель, но может подключаться к поиску).
— Рабочие области (проекты). Папки проектов, куда можно загрузить документы, презентации, картинки, схемы и шаблоны ответов. Как в ChatGPT, только не нужно ничего никуда платить.
— Редактор картинок. Можно загрузить любую картинку, затем ее редактировать при помощи языковой модели. Есть много готовых стилей, можно сразу что-то попробовать применить.
— Свежие новости. Отдельный режим, который позволяет быстро получить свежие новости по определенному гео, запросу, сегменту (гибкая настройка при помощи промтинга)
— Персоны. Grok возьмет на себя некую роль (друг, терапевт, учитель, комик и прочие)
Скоро протестирую обновленный Grok и выпущу сравнение с Gemini 2.5 Pro в разных режимах работы. Базово, очень много интересных функций, особенно — проекты.
P.S. Да, меня зовут Артем, приятно познакомиться!
💬Grok 3 — Пользуемся тут grok com
📌 Если кому интересно, то пишу про лучшие ИИ в своем авторском канале (ссылка в профиле)








