8

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!»

Привет Пикабу 😃 Это продолжение наших размышлений о феномене данной площадки, о роли авторов и пользователей в создании уникальных и интересных материалов, а также о механизме их выхода в топ наряду с вирусным "легким" контентом — мемами, юмором, политикой, NSFW. Нам, ВКВАДРАТЕ, как абсолютно неизвестным авторам, без денег и связей, в условиях жесткого бана самых популярных площадок с мощными алгоритмами рекомендаций, Пикабу интересен тем, что, пожалуй, остается единственной крупной платформой с большим русскоязычным сообществом, где любой пост бесплатно, в условиях отсутствия подписчиков, фактически с нулевым стартом получает шанс "разогнаться" благодаря голосам обычных людей. Что, согласитесь, действительно круто! 😊🔥
Проследив за поведением ряда наших авторских постов, треть из которых побывали в "Горячем", у нас возникло ряд мыслей о сообществе, о роли + и -, работе алгоритмов, которыми хотелось бы поделиться. Заваривайте чайку, кофейку, устраивайтесь поудобнее — и поехали!

Предыстория: все началось с того, что нам пришла в голову идея создать интересометр ("Тинькометр") – наглядный инструмент(динамический знак), который поможет пользователям на этапе старта поста анализировать реакцию аудитории. Идея зашла, и возникло много интересных дискуссий, в том числе на тему существования супер активных пользователей (тех у кого не 49.5 по меркам пикабу, а все 50) на площадке. А также выявлена особенность (уязвимость) работы алгоритмов, напрямую связанная с такими пользователями. Если кратко, то среднестатистический пользователь пикабу ( с его ~1-10 оценками/сутки) практически не может повлиять на финальное место поста в горячем (со своим 6,5–15% удельным весом). Все зависит от первых 30-60 минут (старта поста). А в это время доминируют супер активные пользователи (~5% от всей аудитории) . Потенциально это может приводить к искусственному формированию контента в ленте "Горячее". В ответном посте мы предложили конкретные шаги, которые могут помочь решить эту проблему.

Сегодня затронем такую тему: что ждет Пикабу в ближайшем будущем? Какие у него плюсы и конкурентные преимущества, которые привлекут авторов? Где видятся проблемы и угрозы забвения?

Сначала поймем кто среднестатистический пользователь Пикабу? Согласно статистике1 и статистике2 : пик распределения приходится на людей в возрасте от 31 до 37 слет.

Рисунок 1. Распределение по возрастам

Рисунок 1. Распределение по возрастам


@kgam.tyhf выкатил свежую статистику.

Суммарное число зарегистрированных аккаунтов растёт. "В январе на Ресурсе зарегистрировалось 174 178 Пользователей (на 9 092 больше к предыдущему месяцу) и всего их стало 10 214 643." Темп регистрации новых аккаунтов постепенно начал расти, после драматического спада 2023-середина 2024 года.

Рисунок 2. График зависимости числа всех зарегистрированных аккаунтов (синяя) и число вновь зарегистрированных аккаунтов на площадке от времени.

Рисунок 2. График зависимости числа всех зарегистрированных аккаунтов (синяя) и число вновь зарегистрированных аккаунтов на площадке от времени.

Количество создаваемых постов и их просмотры растут. "Всего за все время их стало 1 078 426 (на 5 677 больше к предыдущему месяцу). Сумма всех просмотров всех постов составила 2 563 037 858 (на 2 % больше к предыдущему месяцу)."

Рисунок 3. График зависимости создания новых постов и их просмотров на площадке от времени.

Рисунок 3. График зависимости создания новых постов и их просмотров на площадке от времени.

Это очень здорово, но вот, что настораживает. Мы рассмотрим динамику изменения постов баянов, постов повторов, постов с тегом ТГ за последние пол года, приведенную у @kgam.tyhf:

Мы видим, что в % соотношении (если за 100% брать число соответствующих постов пол года назад, в июне 2024), что число таких постов увеличилось. Баянов и повторов на ~ 25%, постов со ссылкой на ТГ ~40%. Очевидно, что в данную статистику не входят посты, у которых, по разным причинам, эти теги не отмечены. Следовательно число таких постов вероятно выше. Отметим, что рост новых постов за это же время составляет ~ 30% (Рисунок 3).

Рисунок 4. График зависимости числа баянов, повторов и постов с тегом Телеграмм на площадке от времени.

Рисунок 4. График зависимости числа баянов, повторов и постов с тегом Телеграмм на площадке от времени.

Кроме того, если мы посмотрим на динамику изменения постов с тегом [моё], то можно заметить плавную стагнацию в процентном соотношении от общего числа постов (Рисунок 5, синяя кривая). Если же взять их соотношение среди постов в "Горячем" (к сожалению, такая статистика доступна только за последние пару месяцев — спасибо @kgam.tyhf за её добавление), то наблюдается существенное падение (Рисунок 4, оранжевая кривая).

Из Рисунке 3 видно, что после блокировки YouTube в июле-августе 2024 года произошел существенный всплеск активности пользователей на платформе. При этом с временным лагом наблюдается и рост новых регистраций с сентября 2024 года. Однако, несмотря на это, число постов с тегом [моё] не увеличилось — наоборот, их доля в "Горячем" резко сократилась!

Рисунок 5. График зависимости числа постов с тегом [моё] на площадке от времени в процентах от всех постов и от постов из горячего.

Рисунок 5. График зависимости числа постов с тегом [моё] на площадке от времени в процентах от всех постов и от постов из горячего.

К чему мы всё это ведём, спросите вы? А к тому, что с закрытием альтернативных площадок и огромным ростом влияния Telegram важно сохранить уникальность контента и авторов на Пикабу. И алгоритмы должны делать всё, чтобы поддерживать, продвигать и удерживать их.

Telegram сегодня имеет огромную аудиторию, которая использует его не только для общения, но и для создания и распространения контента. Явно видно, что доля контента с этой платформы на Пикабу растет. Добавьте сюда видеоролики и мемы из заблокированных социальных сетей, и Пикабу рискует стать не уникальной площадкой с авторами, а кладбищем с бесконечными повторами и репостами. А ведь если это произойдёт, какой тогда будет резон пользователям сидеть здесь, а не подписываться на соцсети отдельных авторов? По состоянию на 28 декабря 2024 года в РКН было подано 135 тыс. заявлений о регистрации каналов с 10К+ подписчиками.

Фух, мы закончили! Спасибо за внимание!

Показать полностью 6
50

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!»

В прошлом посте мы поднимали проблему влияния "супер активных пользователей", тех у кого не 49.5 по меркам пикабу, а все 50, на формирование контента в ленте "горячее". Их оценка или бездействие может играть существенную роль в искажении общего восприятия популярности постов. Т.н. "тирания меньшинства", небольшой группы активных участников доминирующей над большинством, сводящаяся к проблемам алгоритмической фильтрации. В коментах спрашивали, как можно попытаться решить эту проблему, давайте разбираться и предложим конкретные шаги решения.
Заваривайте чайку, кофейку, устраивайтесь поудобнее — и поехали!

Проблема в цифрах и её суть
Согласно статистике, отраженной в посте Как формируется рейтинг постов на Пикабу и кто это делает и приведенной на рисунке 1.

  • 62% пользователей ставят от 1–5 оценок в сутки (79% — если включить 5–10 оценок).

  • 3,5% пользователей ставят более 50 оценок в сутки (включая супер активных пользователей, о которых шла речь в предыдущем посте и роль которых туманна, т.к. вроде бы их оценки не учитываются #comment_242894369, но при этом в их профиле все равно видно изменения кол-ва, поставленных ими + и - #comment_341650409 ) доминируют, обеспечивая более 43% всех оценок.

Т.о. средний пользователь ( с его ~5 оценками) почти не влияет на систему (6,5–15% веса), а супер активные пользователи доминируют.

Рисунок 1. (Слева) Суммарное число оценок(серым) и доля этих оценок (красным) в зависимости от типа активности аккаунта: от 1 до 4 оценок/сутки, от 5 до 10 оценок/сутки, от 11 до 20 оценок/сутки, от 21 до 50 оценок/сутки и свыше 50 оценок в сутки. (справа) распределение числа оценок и среднее число оценок (зеленым) в зависимости от типа активности аккаунта: от 1 до 4 оценок/сутки, от 5 до 10 оценок/сутки, от 11 до 20 оценок/сутки, от 21 до 50 оценок/сутки и свыше 50 оценок в сутки.


Критические моменты:

  • Первые 30–60 минут определяют судьбу поста. В этот период супер активные пользователи успевают "задать тон", пока обычные пользователи ещё не проявили активность.

  • Их оценки могут либо резко поднять пост в топ, либо похоронить его. Более того даже простое игнорирование нового поста этими пользователями теоретически может разительно сместить баланс голосов для свежих постов в пользу иных в рамках их интересов. Ведь игнорирование постов (отсутствие оценок) снижает шансы поста на ранний старт в горячее,

  • Супер активные пользователи продвигают контент, соответствующий их предпочтениям, что может не совпадать с интересами большинства.

Что же можно сделать?

Чтобы сделать ленту "горячее" более сбалансированной и отражающей интересы большинства, нужно снизить влияние супер активных пользователей, сохранив их вклад, и дать шанс менее активным пользователям влиять на систему. Вот несколько стратегий:

  1. Первая идея заключается в том, чтобы ограничить влияние отдельных пользователей, нормализуя их вклад в зависимости от активности, например, введя весовой коэффициент для каждой оценки, обратно пропорциональный количеству оценок пользователя за сутки.

Например, если пользователь ставит 5 оценок, его вес ~1; если 100 оценок — вес падает до ~0.2–0.5.

При этом можно периодически пересчитывать веса динамически (например, раз в час). Таким образом суперпользователи сохранят влияние, но их "голос" станет менее доминирующим.

2. Сделать рейтинг поста менее зависимым от мгновенной активности пользователей и более устойчивым к долгосрочным трендам, Используя формулу активности с временным затуханием

В этом случае оценки супер активных пользователей в первые минуты теряют вес со временем, если пост не получает поддержки от других. Посты с постепенным ростом (от большинства) получают преимущество.Оценки от менее активных пользователей получают больший вес, что выравнивает баланс

3. Можно разделить влияние супер активных пользователей и большинства через разные подходы к ранжированию. Например, можно сделать несколько скрытных "слоев" в ленте "горячее". В случае двух слоев получится "Глобальный топ" — который учитывает оценки всех пользователей с нормализацией и слой "тренды большинства" — который учитывает только пользователей с низкой и средней активностью (например, до 10 оценок в сутки).

Далее, показываем пользователям смешанную ленту (например, 70% "тренды большинства", 30% "глобальный топ").

4. Можно стимулировать активность обычных пользователей. Идея заключается в том, чтобы мотивировать менее активных пользователей ставить больше оценок, чтобы их вклад вырос, путем награды за оценки, например, дополнительный временный буст видимости своих постов постов, дополнительные стартовые плюсы при публикации поста.

5. Также можно мониторить и учитывать "бездействие" супер активных пользователей на конкретных постах.Если супер активный пользователь просматривает пост (например, проводит >3 секунд в зоне видимости) и не ставит оценку, это снижает рейтинг поста лишь на небольшую величину (например, -0.1 с учётом веса). Таким образом игнорирование становится менее разрушительным для постов, а активное продвижение их конкурентов теряет силу.

6. Можно использовать вспомогательные сигналы (время просмотра, скроллинг, клики) как индикатор интереса и включать их в рейтинг поста, особенно для менее активных пользователей. Создать "виртуальный лайк". Например, собираем такие данные как:

  • Время просмотра: сколько секунд пользователь провёл на посте (например, >5 секунд = интерес).

  • Глубина скроллинга: дошёл ли до конца текста/изображения.

  • Действия: клики на ссылки, увеличение изображения, копирование текста.

  • Т.о. метрика "внимания":

Присваиваем "виртуальный лайк" за высокий уровень внимания (например, A>1.5 A > 1.5 A>1.5). Вес виртуального лайка можно сделать ниже явного (например, 0.3 вместо 1), чтобы не переоценивать пассивных пользователей.

Такая система позволит дать "голос" большинству (~62–79% аудитории), которое редко ставит лайки/дизлайки. Т.о. посты, интересные пассивным пользователям, также получают шанс выйти в горячее, даже если супер активные их игнорируют. Снижается влияние "тишины" супер активных пользователей, так как рейтинг начинает зависеть от поведения большинства. А лента должна стать более репрезентативной для всей аудитории, а не только для активного меньшинства.

7. Интеграция машинного обучения для предсказания "интересности" контента. Идея заключается в том, чтобы использовать исторические данные, для того, чтобы модель предсказывала потенциальную популярность поста и корректировала его вес в реальном времени, помогая новым постам "взлететь" или компенсируя перекос от супер активных пользователей.

Фух, мы закончили! Спасибо за внимание!
Ребята, оцените: @kgam.tyhf, @Vseslogno, @CryptoBomj, @Relictor, @zoom100, @spawn652, @Lebedun, @PandaMedved, @Shoewreck, @Tulumbaec, @Mandalorian1984, @lelikness, @ShadowyIrbis.

Подписывайтесь! Мы — супер авторский проект. Наши посты вызывают живой интерес, но порой балансируют на тонкой грани между плюсами и минусами. Нам действительно непросто конкурировать в горячем с вирусным, развлекательным контентом.

Просто почитайте или послушайте наши музыкальные повести! Всем добра!

Показать полностью 6
59

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!»

Пикабушечка любит интересные истории и расследования — их есть у нас! Оно посвящено потенциальной возможности манипуляции выходов постов в "Горячее" и формирования определенной повестки дня на Пикабу. Заваривайте чайку, кофейку, устраивайтесь поудобнее — и поехали!

Предыстория, на днях в коментах к одному из наших постов мы встретили пикабушника с размером не 49.5, а все 50. @shiftalt — настоящий ветеран Пикабу! На площадке он уже 9 лет, 6 месяцев, 3 недели и 3 дня, а это почти 5 000 000 минут (365 дней × 24 часа × 60 минут). За это время он успел накидать в панамку 3 924 001 минуса! 🚀

То есть все эти 9 лет он стабильно, каждый день и каждую ночь без выходных и праздников раздавал минусы со скоростью 1 минус в минуту! 😲

@Lebedun в комментариях нам подсказал, что такие интересные персонажи на пикабу не редкость и дал ссылку на пост 22 года, где уже поднималась эта тема: Ответ @Lebedun "Интересно, есть ли статистика - сколько плюсов в день ставят, самые активные плюсаторы/минусаторы, акк, пост и коммент?". На тот момент лидирующую позицию занимал @2tps, но он уже давно не активен. Позже, к нам в диалог вступил @kgam.tyhf, профессиональный автор, который уже долгие годы выкатывает интереснейшую информативную статистику о пользователях и о пикабу в целом. Мы обратились к его посту Как формируется рейтинг постов на Пикабу и кто это делает.

И вот на что мы хотели бы обратить внимание — на две очень важные детали:

  1. Ни для кого не секрет, что после публикации у постов есть определённое разгонное время. В среднем первые 30–60 минут решают судьбу поста: наберёт ли он популярность или утонет в бесконечности. (См. Рисунок 1.). Реакции (+/-) напрямую влияют на продвижение поста.

Рисунок 1. График зависимости рейтинга поста от времени (в минутах). Цветом обозначены кривые для постов с различными финальными рейтингами: 0 — красная, 0–20 — черная, 20–50 — светло-зеленая, 50–100 — синяя, 100–1000 — фиолетовая, >1000 — зеленая.

Рисунок 1. График зависимости рейтинга поста от времени (в минутах). Цветом обозначены кривые для постов с различными финальными рейтингами: 0 — красная, 0–20 — черная, 20–50 — светло-зеленая, 50–100 — синяя, 100–1000 — фиолетовая, >1000 — зеленая.

2. Важным условием получения оценок и продвижения поста является наличие потенциальных читателей в момент публикации, которым этот пост зайдёт и которые его оценят. Ведь помимо интересной тематики, нужно ещё и попасть во время активности подходящей аудитории поста. Если публикация наткнется не на ту аудиторию — даже крутой пост рискует остаться незамеченным. Это логично и справедливо. Но вот тут-то и скрывается дьявол.
Рассмотрим среднюю аудиторию и среднее число оценок, которое они выставляют в сутки на Пикабу, рисунок 2.

Рисунок 2. Серым изображено распределение числа оценок, а зеленым среднее число оценок в зависимости от типа активности аккаунта: от 1 до 4 оценок/сутки, от 5 до 10 оценок/сутки, от 11 до 20 оценок/сутки, от 21 до 50 оценок/сутки и свыше 50 оценок в сутки.

Рисунок 2. Серым изображено распределение числа оценок, а зеленым среднее число оценок в зависимости от типа активности аккаунта: от 1 до 4 оценок/сутки, от 5 до 10 оценок/сутки, от 11 до 20 оценок/сутки, от 21 до 50 оценок/сутки и свыше 50 оценок в сутки.

Вот что об этом пишет @kgam.tyhf

Понятно, что не все оценки этих пользователей поставлены постам в течение суток с момента их публикации. Но как мы помним из графика с маленькими столбиками (% плюсов и минусов, набираемых постами за 12, 24 и 48 часов), в зависимости от итогового рейтинга, за сутки посты получают от 70 до 80% всех своих финальных оценок.
Таким образом, речь идет о 10-12 тысячах пикабушниках, определяющих почти 2/3 рейтинга всего контента.

Чтобы осознать это, давайте перестроим эти графики вот в таком виде:

Рисунок 3. Суммарное число оценок(слева), и доля этих оценок (справа) в зависимости от типа активности аккаунта: от 1 до 4 оценок/сутки, от 5 до 10 оценок/сутки, от 11 до 20 оценок/сутки, от 21 до 50 оценок/сутки и свыше 50 оценок в сутки

Рисунок 3. Суммарное число оценок(слева), и доля этих оценок (справа) в зависимости от типа активности аккаунта: от 1 до 4 оценок/сутки, от 5 до 10 оценок/сутки, от 11 до 20 оценок/сутки, от 21 до 50 оценок/сутки и свыше 50 оценок в сутки

Согласно данным графика выше, большинство пользователей (`~62%) ставят от 1 до 5 оценок в сутки (а если учитывать группу 5–10, то ~79%). Однако их влияние минимально — их удельный вес в общей системе оценок за сутки всего 6,5% (или 15% если брать диапазон 0–10).

Вот наибольший удельный вес ~43% имеет небольшая группа лиц — около 3.5% супер активных пользователей, которые ставят более 50 оценок в сутки.

Вы можете сказать, да они не смогут потопить или поднять пост своими минусами и плюсами, их мало и их могут забанить, их голоса могут не учитывать т.к. есть #comment_341525500


В счетчик плюсов/минусов постов, имеющих рейтинг менее 500, просто не записываются данные по истечению недели. Также не засчитываются оценки после 10-й, поставленная одним пользователем другому в течение последних 24 часов.

В профиле же пользователя эти поставленные оценки фигурируют.


Хитрость в том, что эти ограничения не важны. Для таких пользователей не имеет значения, ставят ли они оценки постам одного автора или разным — главное, что их бешеная активность может влиять на формирование популярной тематики на платформе и продвигать в топ определённых авторов.

Как это так, спросите вы? Суть в том, что они очень активы и у них огромный удельный вес ~43%. Ведь судьба поста решается в первые 30–60 минут. А их активность и вклад в оценки в этот момент существенно выше по сравнению с обычными пользователями, которые в среднем ставят ~5 оценок в сутки.

И самое интересное — не так важно, оценивают ли они твой пост или нет. Одним только бездействием (отсутствием любой оценки) они могут сильно сместить баланс голосов для свежих постов. Если пост не соответствует их повестке, они его просто проигнорируют — а значит, он не наберёт нужного импульса и дальше не пойдёт. Более того, вместо этого они раздадут плюсы постам, которые вписываются в их интересы, продвигая именно их в топ, задвигая их на второй план.

@kgam.tyhf утверждает, что на пикабу "существуют шедоу на оценки Теневой бан оценкам на Пикабу? Или как это называется? [Есть ответ]" и вероятно такие супер активные пользователи не могут оценивать посты или их оценки просто не учитываются. Мы актуализировали таблицу топ минусаторов из поста 22 года Ответ @Lebedun "Интересно, есть ли статистика - сколько плюсов в день ставят, самые активные плюсаторы/минусаторы, акк, пост и коммент?".

И вот что мы видим: наш @shiftalt прекрасно себя чувствует и продолжает активно минусить, оставаясь в топе этого рейтинга. Таблица основана на данных пользователей, засветившихся в 2022 году. В сутки он выдаёт 1777 минусов! Как видно, абсолютное число его минусов постоянно растёт, как и у других суперактивных пользователей.

Помимо минусаторов есть и супер активные плюсаторы. Сколько их всего? Судя по графику (Рисунок 2), таких пользователей около четырёх тысяч.

Возможно ли что пикабу не учитывает их голоса? Возможно! Или нет?

Рисунок 4. главные минусаторы Пикабу

Рисунок 4. главные минусаторы Пикабу

Показать полностью 4
100

Истинный пикабушник! Не 49.5, а все 50!!!

Ребята, на днях в коментах мы встретили истинного пикабушника.
Нет, не так. П И К А Б У Ш Н И К А.
Встречайте @shiftalt - респект, ты красава😂 У него не то что 49.5, а все 50!


Как правильно заметил @rainwalker101, будучи пикабушником уже 9 лет, 6 месяцев, 3 недели и 3 дня — что составляет почти 5 000 000 минут (365 дней в году × 24 × 60) — shiftalt успел поставить 3 921 234 минуса! 🚀 Представь, мой друг, если предположить, что ты никогда не спишь и не отдыхаешь, то для достижения такого результата на протяжении 9 лет тебе придётся кидать в панамку со скоростью 1 минус / минуту!

@Lebedun подсказал в комментариях, что @shiftalt относится к мастодонтам Пикабу наравне с @2tps, @morpheus017 и другими. Спасибо, что живой и уделил внимание нашему посту!

Показать полностью 2
Отличная работа, все прочитано!