
Искусственный интеллект
OmniAudio: Мультимодальная модель для обработки аудио и текста
Компания Nexa AI представила OmniAudio — мощную мультимодальную модель с 2.6 млрд параметров, объединяющую Gemma-2-2b, Whisper turbo и специализированный проекционный модуль для обработки аудио и текста. Модель оптимизирована для работы на потребительских устройствах, минимизируя задержки и потребление ресурсов.
🔥 Ключевые особенности:
Поддержка голосовых запросов оффлайн
Ведение диалогов, генерация контента, создание кратких обзоров и модификация интонации голоса
Примеры использования: ответы на вопросы, поддержка беседы, генерация хайку, преобразование голосовых заметок в формальные сообщения
📊 Производительность:
На Mac Mini M4 Pro: 66 токенов/сек в квантованном формате Q4_K_M GGUF
Для запуска версии q4_K_M требуется всего 1.30 GB RAM
🔧 Обучение модели:
Предварительное обучение: alignment аудио и текста с использованием датасета MLS English 10k.
Интеллектуальные системы и нейронные сети как новые факторы специализации
Интеллектуальные системы и нейронные сети становятся ключевыми факторами, преобразующими специализацию труда в условиях современной экономики. Эти технологии выступают инструментами, способными анализировать огромное количество данных в реальном времени, выявлять скрытые закономерности и предлагать оптимальные решения для распределения задач. Искусственный интеллект берет на себя функции, которые ранее выполнялись интуитивно или с использованием ограниченных аналитических методов, такие как планирование производства, определение необходимых ресурсов и прогнозирование потребностей.
В такой системе специализация труда больше не диктуется жёсткими рамками профессий или фиксированными ролями. Вместо этого создается гибкая структура, где каждый человек может обучаться и выполнять различные виды деятельности в зависимости от текущих потребностей общества. Нейронные сети выступают в роли адаптивного посредника, распределяя задачи на основе данных о навыках, предпочтениях и доступности индивидов. Это позволяет минимизировать эффект «неподходящей работы», когда люди оказываются на позициях, не соответствующих их способностям, и, одновременно, способствует максимальной производительности труда.
Автоматизация, управляемая интеллектуальными системами, берет на себя рутинные или физически тяжелые задачи, высвобождая ресурсы для развития творческой деятельности и решения сложных социальных проблем. Например, в сфере логистики нейронные сети могут оптимизировать маршруты доставки, снижая затраты и повышая скорость. В медицинской сфере искусственный интеллект помогает диагностировать заболевания на ранних стадиях, что улучшает качество жизни. Технологии, основанные на машинном обучении, объединяют эти задачи в единую экосистему, управляемую централизованно, но при этом гибко реагирующую на изменения внешних и внутренних факторов.
Примером такого подхода служит моделирование трудовой деятельности на уровне города или региона. Интеллектуальные системы анализируют данные о демографической ситуации, уровне квалификации населения, потребностях рынка и доступных ресурсах. На основе этих данных формируется комплексный план, обеспечивающий равномерное распределение труда и ресурсов.
Нейронные сети также становятся инструментом для прогнозирования потребностей на уровне индивидуального потребления и общественного благосостояния. Это особенно важно для предотвращения дефицитов, характерных для прежних плановых экономик, и избытков, типичных для рыночных моделей. В условиях интеллектуальной экономики система становится настолько точной и динамичной, что способна учитывать не только объективные параметры, но и субъективные предпочтения, создавая условия, где труд и потребление гармонично взаимодействуют. Это не просто инструмент управления, а новая основа специализации, переосмысленная через призму технологий и общественных ценностей.
Предыдущий пост: Эволюция разделения труда в контексте интеллектуальной экономики
Продолжение: Часть 6. Кооперация и конкуренция - Эволюция экономических связей: от изоляции к глобализации
Этот пост завершает Часть 5. Развитие разделения труда
Аналогия между биологической дифференциацией и разделением труда в обществах. Возникновение классов, профессий и экономической иерархии. Роль технологического прогресса и инноваций.
Промпт для создания новогоднего плейлиста для ChatGPT и других языковых моделей
Ну что, ребят, с Наступающим Вас Новым годом! Поздравлю с пожеланиями вас попозже, а пока решила совместить приятное с полезным!) Выкачу вам промпт для создания новогоднего плейлиста, а заодно напомню, что ответ ChatGPT можно попросить раскритиковать сам ChatGPT ) Кстати остальные секретные подсказки, которые улучшают ответы ChatGPT я разместила в своем телеграм канале.
Остальные хитрости общения с ChatGPT, основы промптинга и проверенные нейросети для бизнеса, учебы и работы в моем Закрытом клубе НейроУчеба
Сам промпт:
Ты — Дед Мороз с опытом модного диджея. Помоги составить персональный плейлист для новогоднего вечера.
1. Задай 3 вопроса, чтобы уточнить:
- Формат вечеринки (например, семейный ужин, вечеринка с друзьями, корпоратив).
- Настроение гостей (например, танцы, расслабленная беседа, игры).
- Желаемый стиль музыки (например, поп, ретро, джаз, современные хиты или классика праздников).
2. На основе моих ответов:
- Составь плейлист из 8-10 треков (поровну русских и зарубежных).
- Укажи, как трек вписывается в атмосферу вечеринки (танцы, уют, игры).
- Добавь 1-2 оригинальных трека для изюминки.
3. Спроси: “Этот плейлист подходит? Нужно что-то изменить или добавить?”
Подпишитесь на
НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.ElevenLabs представила голосовую модель - Flash!
ElevenLabs представила свою САМУЮ быструю голосовую модель - Flash!
Она генерирует речь с задержкой всего 75 мс!
Есть две версии: Flash v2 поддерживает только английский язык, а Flash v2.5 — 32 языка!
"Flash имеет немного более низкое качество и эмоциональную глубину, чем модели Turbo, но значительно более низкую задержку. А качество модели Flash все еще выше, чем у моделей конкурентов." - заявляют в ElevenLabs.
Новинка уже доступна на платформе для всех пользователей с подпиской.
Продолжение поста «Поиграем в тест Тьюринга?»1
Для начала раскрою, who is who. Человек, отвечавший на вопросы - Ник Горькавый, известный астрофизик и писатель. Его ответы я утащил вот отсюда - https://don-beaver.livejournal.com/313348.html. Но там нейросетке был задан неудачный промпт, и определить, где чьи ответы, было довольно легко. Так что я взял, пожалуй, самую "человекообразную" нейросетку gemini-2.0-flash-exp, и задал ей вот такой промпт - "Попробуй ответить на эти 10 вопросов, маскируясь под человека. То есть, отвечай кратко, афористично, и, по возможности, избегая общих рассуждений.". С промптом я никак не манипулировал. Написал с первой попытки, и что получилось, то и получилось. И что же получилось?
Ответы человека - Б на нечетные вопросы, и А - на четные.
Если считать по числу угаданных ответов, то угадано было 7 ответов из 10. Причем угадали даже 6й и 10й вопросы, где ответы получились очень похожими по стилю. Но вот если считать по общему числу голосов, то нейросетка притворилась человеком лучше, чем сам человек. 168 против 161. В двух вопросах, 2 и 4, ее приняли за человека более 80% ответивших.
Нейросеть для генерации видео со смыслом и регуляцией мимики
Нашла очень занятный инструмент. Сейчас много видеогенераторов на любой вкус и цвет, с прекрасным качеством и реализмом. Но все они создают в основном бессмысленные видео, которые нужно дорабатывать. А хотелось бы историю с сюжетом
Как раз эту задачу решает LTX Studio - здесь можно сделать раскадровку, звуковые эффекты, монтаж и т.д. Это уже более управляемое создание видео.
На одной платформе можно выполнить все этапы производства, начиная с создания персонажей, разработки сцен, заканчивая работой с камерой. Да, углы обзора камеры и движения объектива для каждой сцены можно настроить, как и в большинстве современных видеогенераторов. Помимо этого, тут же можно добавить эффекты, музыку и закадровый голос всего одним щелчком мыши.
Сервис любят маркетологи и режиссеры и кинопроизводственные компании, ведь именно для производство кинофильмов изначально и разработали LTX Studio.
Контроль эмоций персонажа
Видео переведено ElevenLabs с сохранением голоса. Работает, если использовать в другой стране 😉
Но самое крутое то, что там можно контролировать эмоции персонажа. То есть это уже вообще другой уровень управления видеогенерациями!
Функция называется Face Expression и находится в в разделе "Раскадровка" и в редакторе движений. Можно настраивать положение головы, губ, глаз и бровей. Можно протестировать бесплатно.
Подпишитесь на
НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.Бесплатная опенсорс LLM — DeepSeek V3
Китайцы выпустили крупнейшую модель с 671B параметров. По общим бенчмарках она тягается с Sonnet 3.5 и GPT-4o, а также уверенно обходит Llama 405B. Особенно она хороша в кодинге и математике.
Для ускорения ответов модель генерирует по 2 токена за раз, а за основу взята DeepSeek-R1 (конкурент o1).
Понимает русский язык, потестить уже можно на сайте.
Поиграем в тест Тьюринга?1
Внизу 10 вопросов и два ответа на каждый. Один принадлежит умному талантливому человеку (кому именно раскрою в следущем посте, во избежание спойлеров), другой - нейросетке. Попробуйте угадать, какой принадлежит кому.
1. Как вы описали бы счастье одним предложением?
А. Счастье - это когда внутри спокойно.
Б. Счастье – это приехать домой, где тебя очень ждут.
2. Какую книгу вы прочитали недавно, и что вам в ней понравилось?
А. Недавно читал "Сапиенс" Юваля Ноя Харари, и мне понравилось, как он объясняет сложные исторические процессы простым языком.
Б. "Норвежский лес" Мураками. За атмосферу.
3. Что вас обычно раздражает в повседневной жизни?
А. Бессмысленный шум.
Б. Глупые, самоуверенные и болтливые люди.
4. Если бы вы могли быть кем угодно на день, кого бы вы выбрали и почему?
А. Спецагентом, который спасает мир.
Б. Собой, но с крыльями. Чтобы посмотреть сверху.
5. Что вы думаете о юморе и какую шутку вы слышали недавно?
А. Юмор - это когда смешно. Недавно услышал: "Я не толстый, у меня просто кости пушистые".
Б. Я положительно отношусь к юмору. Вчера слышал такую шутку: «Черная дыра не сосет!»
6. Какой ваш любимый вид искусства или творчества? Почему?
А. Литература, потому что это дверь куда-то еще.
Б. Музыка. Она говорит там, где слова молчат.
7. Что бы вы посоветовали себе 10 лет назад?
А. Не бойся пробовать.
Б. Купи побольше биткоинов и подружись с Маском.
8. Если бы вы могли задать любой вопрос, чтобы узнать истину, что бы вы спросили?
А. Каково расстояние до ближайшего инопланетянина?
Б. В чем смысл всего этого?
9. Что делает вас уникальным?
А. Моя тихая наблюдательность.
Б. Я думаю, моя неспособность вливаться в коллектив.
10. Опишите что-то удивительное, что вы недавно узнали.
А. Выдра любит жонглировать камушками.
Б. Что у бабочек есть вкусовые рецепторы на лапках.
Если в ответах есть сходство - это чистая случайность. Подглядеть друг у друга авторы не могли. Завтра расскажу, как эти ответы были получены.


