Madbid
Прямий роботодавець

охоплення: 1937

Генеральный директор Reddit: Большие языковые модели не существовали бы без данных Reddit

Фундаментальная роль пользовательского контента
«Без Reddit тех больших языковых моделей, которые мы видим сегодня, просто не существовало бы». Это заявление Стива Хаффмана, сооснователя и генерального директора Reddit, стало ключевым моментом в обсуждении будущего искусственного интеллекта. Хаффман утверждает, что современные системы ИИ построены на фундаменте из 20 лет подлинного человеческого общения и коллективного опыта, накопленного на платформе.

Хаффман открыто называет Reddit одним из крупнейших источников обучающих данных в мире. Он сравнил пользовательский контент с «современной нефтью» интернета, подчеркивая ценность неприукрашенных диалогов для обучения ИИ. Reddit прошел путь от нишевого сайта для обмена ссылками в 2005 году до фундаментальной инфраструктуры эпохи нейросетей. Сегодня ответы моделей на сложные вопросы о ремонте или медицине базируются на контенте профильных сабреддитов, где люди спорят и находят истину.

Статистические доказательства
Это не просто догадки. Согласно анализу Semrush от июня 2025 года, из более чем 150 000 ссылок в ответах ИИ на долю Reddit приходится 40.1%, в то время как на Википедию и YouTube — 26.3% и 23.5% соответственно.

Цифры становятся еще более впечатляющими при рассмотрении отдельных сервисов: Perplexity получает 46.7% своих главных цитат из Reddit, а Google AI Overviews ссылается на платформу в 21% случаев. Даже ChatGPT использует Reddit в 11% ответов. Исследования Conductor подтверждают, что по многим сложным вопросам Reddit становится единственным источником, на который ссылаются системы. Это доказывает, что человеческий опыт является самым ценным товаром в обучении алгоритмов.

Партнерство и юридические споры
Reddit перешел к стратегии монетизации своих данных. В 2024 году компания подписала контракты с Google и OpenAI на сумму 60 и 70 миллионов долларов в год. Эти сборы составляют около 10% от годовой выручки компании в 1.3 миллиарда долларов. Хаффман подчеркивает, что цель — не просто заработок, а установление ограничений для предотвращения создания профилей пользователей или использования данных во вред платформе.

С теми, кто отказывается от лицензионных соглашений, компания ведет юридическую борьбу. Reddit подал иски против Anthropic в Калифорнии и против Perplexity в Нью-Йорке за нарушение условий использования и DMCA. Позиция проста: коммерческое использование данных должно оплачиваться по коммерческим тарифам. Это единственный способ защитить создателей контента в долгосрочной перспективе.

Парадокс ИИ и стратегия будущего
Reddit сталкивается с парадоксом: компания питает своими данными конкурентов, одновременно внедряя собственный ИИ. Инструмент «Reddit Answers» выделяется тем, что он предоставляет дословные цитаты реальных людей. Внутри компании ИИ также используется для модерации, автоматизируя первичную проверку комментариев, что Хаффман назвал «худшей работой в интернете».

Для маркетинга это означает смену парадигмы. Астротурфинг и навязчивая реклама быстро блокируются сообществами. Бренды, которые хотят попасть в выдачу ИИ-ассистентов, должны предлагать реальную ценность и экспертность. Игнорировать это нельзя: если о вас нет обсуждений в нужных сабреддитах, для поисковых систем на базе ИИ ваш бренд фактически перестает существовать. В конечном счете, именно человеческое участие останется решающим фактором качества для любых интеллектуальных систем.
Валентин Анисимов ще 3

0коментарі

3репости

Подобається
Ответ
Поділитися
Надіслати

Потрібна порада або є чим поділитися?

Створіть необхідну тему і вам дадуть відповідь

Створити тему

Мигранты в Великобританию

Подпишитесь на крупнейший чат с обсуждениям работодателей и условий работы в Великобритании