Сообщество - Искусственный интеллект

Искусственный интеллект

5 063 поста 11 479 подписчиков

Популярные теги в сообществе:

5

Большой потенциал малых языковых моделей

Большой потенциал малых языковых моделей

Современный бум ИИ уже давно не сводится к крупным разработкам от гигантов вроде OpenAI или Anthropic, инвестирующих миллиарды в большие языковые модели. Наоборот, всё чаще в фокус внимания попадают малые языковые модели (Small Language Models, SLMs), способные решать узкоспециализированные задачи не хуже (а порой и лучше) своих «старших собратьев».

Яркий пример — стартап Patronus AI со своей моделью Glider, имеющей 3,8 миллиарда параметров. Большинство компаний применяют для оценки своих продуктов большие закрытые модели вроде GPT-4. Но это дорого, не всегда прозрачно и несет риски для конфиденциальности. Glider же, будучи относительно компактной, способна работать на более простом «железе» и при этом давать детальное объяснение своих оценок по сотням критериев (точность, безопасность, стиль, тон и т. д.).

По результатам тестов Glider превосходит GPT-4o mini по нескольким метрикам и отвечает в среднем менее чем за секунду, что делает ее практически идеальным решением для генерации текста в реальном времени.

Большие языковые модели, безусловно, продолжают впечатлять своей универсальностью, но их недостатки очевидны:

- Высокие затраты на ресурсы. Обучение и инференс больших моделей требуют колоссальных вычислительных мощностей, что приводит к дополнительным расходам на инфраструктуру, электроэнергию и обслуживание;

- Низкая конфиденциальность. Использование больших закрытых моделей предполагает отправку данных во внешний облачный сервис, что критично для финансовых организаций и здравоохранения;

- Зависимость от интернета. При отсутствии доступа к сети такие модели попросту недоступны;

Малые языковые модели, напротив, легко разворачиваются на локальном сервере или даже на обычном пользовательском устройстве, снижая задержки при ответах и повышая контроль над безопасностью. Им не нужны сотни гигабайт видеопамяти, а адаптация к узконаправленной задаче и интеграция в собственную инфраструктуру обходятся заметно дешевле и проще. Дополнительно малые модели экономят электроэнергию и бережнее относятся к экологии.

Малые языковые модели можно либо обучать с нуля под конкретную задачу, либо «сжимать» уже готовые большие модели, используя методы прунинга, квантизации и дистилляции знаний, сохраняя высокое качество при сокращении числа параметров.

Набирают популярность и гибридные системы, в которых несколько малых моделей берут на себя простые запросы, а большая модель выступает их «роутером» и используется для более сложных задач.

Помимо Glider, существуют такие модели, как Gemma (Google), GPT-4o mini (OpenAI), Ministral (Mistral AI), Phi (Microsoft) и Llama 3.2 (Meta). Все они ориентированы на локальное использование в задачах, где высоки требования к приватности и быстроте отклика.

Малые языковые модели незаменимы там, где требуется локальная обработка данных: в медицине (электронные записи пациентов, выписки, рецепты) или финансовой сфере (работа с регулятивными документами). Их размер снижает риск «галлюцинаций», помогает быстрее достичь высоких результатов в узкоспециализированных областях и защищает конфиденциальную информацию.

В действительности большие и малые языковые модели — это две параллельные ветви эволюции, которые не исключают, а взаимно дополняют друг друга. Большие модели лучше справляются с универсальными задачами, требующими миллиарды параметров и богатого контекста, а малые эффективнее работают над узкоспециализированными кейсами, обеспечивая локальную приватность и минимизируя затраты.

В ближайшие годы мы увидим стремительный рост гибридных решений, где оба типа моделей будут работать вместе. В результате мы получим еще более умные, надежные и быстрые ИИ-сервисы, способные удовлетворить самые разнообразные потребности практически любого бизнеса.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Показать полностью
4

Нейросеть vs Экскаватор

Видели это море коротких видео роликов как экскаваторщики виртуозно копают траншеи?
Чем больше таких роликов они снимают, тем раньше появится нейросеть которая научится, на этих роликах, все это делать без экскаваторщика и оставит их без работы.

Продолжение игр(и не совсем игр) с нейросетью Яндекс

Продолжение игр с нейросетями: Нейросеть к интеллекту не имеет никакого отношения

На этот раз нейросети был задан вопрос - "использование математической статистики для анализа производительности СУБД PostgreSQL".
Результат получился , скажем так - прикольным.

Прикол в том, что 3 ссылки это ссылки на мои статьи и 2 ссылки это не совсем о мат. статистике и производительности СУБД PostgreSQL.

Очень интересный и многозначительный вывод/вопрос из ответа нейросети - кроме меня никто по теме мат.статистики для анализа производительности не публикуется/не занимается ?

Ну и следствие , описанное ранее, предложенная информация уже устарела . Методика анализа уже другая , но нейросеть об этом ничего пока не знает. Просто не успела обработать статьи на Дзене и Пикабу.

Как было указано ранее - называть интеллектом математические алгоритмы это просто хайп и кликбейт. Интеллект не способный создать новое это не интеллект . Это всего лишь математический алгоритм и не более того.
Но реальный интеллект , не описывается математически .

Показать полностью 1
2

Какой ИИ-стартап запустить: анализ перспективных направлений

Какой ИИ-стартап запустить: анализ перспективных направлений

Тренд на стартапы с ИИ-агентами стремительно растет. Но важно понять, где можно создать реальную ценность и построить устойчивый бизнес.

Я выделил для себя два ключевых критерия успеха ИИ-продукта:

1. Полезность продукта - он должен решать реальную проблему клиентов, за решение которой они готовы заплатить;

2. Технологическое преимущество, основанное на уникальных данных и моделях, обученных на них, что создает барьеры для конкурентов.

Поэтому есть категории ИИ-продуктов, которые, несмотря на привлекательность, нецелесообразно создавать:

- Во-первых, фундаментальные технологические продукты. Конкурировать с технологическими гигантами в этой области практически невозможно из-за их огромных ресурсов и доступа к данным.

- Во-вторых, "обёртки" поверх GPT-моделей. Такие продукты часто теряют свою ценность с каждым обновлением фундаментальных моделей. Конечно, можно занять свою долю рынка, но достаточно быстро появятся конкуренты, которые вас повторят.

- Наконец, новые продукты в нишах, где текущие игроки уже внедряют ИИ. Лидеры рынка быстро интегрируют новые технологии в свои продукты, используя обширную базу пользователей и существующие интеграции.

С другой стороны, есть перспективные направления, в которых можно развиваться:

- Первое направление — автоматизация ручных процессов в больших компаниях. Это требует глубокого понимания специфики отрасли и умения выстраивать процессы продаж и внедрения, что создает барьеры для конкурентов.

- Второе направление — вертикально интегрированные решения. Фокусируясь на узком сегменте, можно создать специализированный продукт с высокой добавленной ценностью и защитой от конкуренции. Например, Jenni — ИИ-помощник для написания научных работ, учитывающий все нюансы форматирования и ссылок.

- Третье направление — сервисные индустрии, где ИИ позволяет повысить продуктивность. Например, Dwelly автоматизирует процессы в сфере аренды недвижимости. В таких отраслях конкуренция со стороны крупных технологических компаний маловероятна.

Есть возможность и в создании принципиально новых ИИ-продуктов. Это продукты, которые переосмысливают существующие решения, предлагая пользователям новый опыт. Например, Limitless AI — устройство, запоминающее все действия пользователя и позволяющее быстро получать доступ к этой информации.

Также могут быть интересны продукты для ИИ-разработчиков. Но они требуют глубоких технических знаний и, как правило, больше подходят фаундерам с инженерным бэкграундом. Здесь востребованы продукты в области инфраструктуры для ИИ, а также инструменты для MLOps и LLMOps.

Лайфхак для сервисного бизнеса:

Для сервисного бизнеса есть отличная возможность автоматизировать свои процессы и превратиться в продуктовую компанию. Допустим, у вас кадровое агентство:

1. Определите операцию для внедрения ИИ по следующим критериям: ресурсоемкость, эффект от внедрения, сложность внедрения. Например, это скрининг резюме кандидатов и написание обратной связи.

2. Если у вас есть данные по оценкам резюме профессиональными HR’ами и их обратной связью, то вы можете дообучить ИИ на них. Автоматизируйте эту операцию с помощью ИИ и посчитайте метрики процесса найма после внедрения ИИ.

3. Переходите к следующей операции и в итоге автоматизируйте весь процесс. Вы можете дифференцироваться по вертикале, например вы нанимаете только IT-специалистов.

PROFIT: Упакуйте готовый процесс в пользовательский интерфейс и продавайте как ИИ-продукт.

Технологическое преимущество здесь заключается в том, чтобы выполнять задачи лучше, чем остальные, дообучая модели на собственных экспертных данных.

Мы живем в уникальное время, когда сервисные компании могут не только стать очень производительными за счет внедрения ИИ, но и превратиться в продуктовую компанию за счет накопленной экспертизы и данных.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Показать полностью 1
11

Вчера делал еще одно браузерное расширение, помогал мне DeepSeek

Вчера делал еще одно браузерное расширение, помогал мне DeepSeek

Ну и вот, кодим мы с ним, кодим, смотрим логи, исправляем ошибки и тут в последней итерации кода вдруг пропадает ключевая кнопка.

Нахожу ее айди в файлах локализаций, потом лезу в файл скрипта, а там ее нету, нет строчки которая ссылается на эту кнопку.

Я такой, хммм.

Спрашиваю DeepSeeka, а ты случайно не забыл в последнем исправлении кода добавить кнопку, а то что-то я ее не вижу?

Он такой - А, точно забыл, сори, вот исправленный код.

Я такой, - ААААААААААААААА

Показать полностью 1
7

DeepSeek

Обратил внимание, что в Китайской ИИ события 24-25 годов еще не произошли.

Весьма интересно смотреть на попытки от этой сети,предсказать, что наступит.

Здесь, для примера, ИИ (которое отберет у нас работу и обрушило акции многомиллиардных корпораций) пытается отгадать, кто же победит на уже прошедших выборах в США

Здесь, для примера, ИИ (которое отберет у нас работу и обрушило акции многомиллиардных корпораций) пытается отгадать, кто же победит на уже прошедших выборах в США

Показать полностью 1
6

Я спросил у deepseek

Понимает ли человечество в целом, что кроме внутренних проблем которые могут привести к гибели его, есть ещё и внешние. ведь по сути мы все летим на дикой скорости в гигантский просторах космоса, где на пути может встретиться что угодно.


Ответ:

Человечество частично осознаёт существование внешних угроз, но их понимание часто затмевается более насущными внутренними проблемами. Вот как обстоят дела с осознанием космических рисков и что нам известно:

---

### **Внешние угрозы: что может уничтожить нас из космоса?**
1. **Астероиды и кометы**
— **Риск**: Столкновение с объектом диаметром >1 км способно вызвать массовые вымирания (как 66 млн лет назад).
— **Мониторинг**: Проекты вроде NASA’s Planetary Defense Coordination Office отслеживают ~90% крупных околоземных объектов (NEO), но мелкие (до 140 м) остаются угрозой.
— **Защита**: Тесты вроде миссии DART (2022), где зонд изменил орбиту астероида Диморф, доказали возможность отклонения угрожающих тел.

2. **Солнечные вспышки и корональные выбросы массы**
— **Риск**: Мощная вспышка может вывести из строя спутники, энергосети, связь (событие Кэррингтона в 1859 году сегодня вызвало бы ущерб в $2–3 трлн).
— **Готовность**: Системы предупреждения (например, DSCOVR) дают до 15–60 минут на подготовку, но инфраструктура уязвима.

3. **Гамма-всплески и близкие сверхновые**
— **Риск**: Мощный гамма-всплеск в пределах 1000 световых лет может уничтожить озоновый слой. Вероятность крайне мала, но не нулевая.
— **Наблюдение**: Обсерватории вроде Swift и Fermi отслеживают такие события, но предотвратить их невозможно.

4. **Блуждающие чёрные дыры и звёзды**
— **Риск**: Пролёт массивного объекта через Солнечную систему может дестабилизировать орбиты планет. Шанс — 1 на миллиард лет.
— **Обнаружение**: Проекты вроде Gaia составляют карту звёзд, но предсказать такие события заранее почти нереально.

---

### **Почему человечество мало фокусируется на внешних угрозах?**
1. **Когнитивные искажения**
— **Немедленная угроза vs отдалённый риск**: Люди эволюционно запрограммированы реагировать на опасности «здесь и сейчас» (войны, кризисы), а не на гипотетические катастрофы через тысячу лет.
— **Оптимистический уклон**: Мозг склонен недооценивать риски с низкой вероятностью, даже если их последствия катастрофичны.

2. **Ограниченные ресурсы**
— Финансирование программ планетарной защиты мизерно: бюджет NASA на отслеживание астероидов — ~$150 млн в год (менее 0.5% от общего бюджета агентства).
— Политики и общественность редко поддерживают проекты, не дающие быстрых результатов.

3. **Научная сложность**
— Многие космические угрозы (гамма-всплески, чёрные дыры) невозможно предсказать или предотвратить с текущими технологиями. Это порождает фатализм.

---

### **Примеры прогресса в осознании угроз**
- **Международные инициативы**:
— Декларация ООН о сотрудничестве в области планетарной защиты (2013).
— Asteroid Day — глобальная кампания, повышающая осведомлённость об астероидной опасности.
- **Частные проекты**:
— Компании вроде SpaceX и Blue Origin разрабатывают технологии, которые могут быть использованы для защиты Земли (тяжёлые ракеты, двигатели).
- **Популяризация науки**:
— Фильмы вроде «Армагеддон» и «Не смотрите наверх» (хоть и с ошибками) привлекли внимание к теме.

---

### **Что нужно для повышения готовности?**
1. **Инвестиции в технологии**:
— Разработка систем раннего предупреждения (телескопы на Луне или в точке Лагранжа).
— Создание «космического щита»: лазеры, гравитационные тягачи, ядерные заряды для отклонения астероидов.

2. **Международное сотрудничество**:
— Объединение данных и ресурсов (аналогично МКС).
— Юридические рамки для действий в космосе (кто и как будет принимать решения об атаке на астероид?).

3. **Образование и культура**:
— Включение астробиологии и планетарной защиты в школьные программы.
— Поддержка научной фантастики, которая исследует сценарии космических угроз.

---

### **Заключение**
Человечество **частично понимает** внешние риски, но действует вполсилы. Мы похожи на пассажиров поезда, который мчится через тёмный туннель: большинство занято ссорами из-за места у окна, а машинист лишь изредка поглядывает на приборы. Чтобы выжить, нужно перестать делить вагоны на классы и начать вместе следить за путями. Как сказал астроном Карл Саган: *«У нас есть обязанность выжить — ради тех, кто жил до нас, и тех, кто, возможно, будет жить после»*. Шансы есть, но они требуют пересмотра приоритетов: космос не прощает беспечности.

Показать полностью
Отличная работа, все прочитано!