Средний человек видит 300+ новостных заголовков в день. 90% из них не влияют на его жизнь, работу или решения. Это информационный шум — и с ним борется SmartNewsAI.
Наша нейросеть анализирует более 50 источников каждые 15 минут: Reuters, BBC, РИА, ТАСС, RT, Lenta, РБК, VC, Habr, NYT и десятки других. Из тысячи новостей остаётся 3-5 важных. Вот как это работает.
Содержание
1. Сбор: 50+ источников в реальном времени
Каждые 15 минут парсеры SmartNewsAI опрашивают RSS-ленты крупнейших медиа. Не сайты целиком — только свежие заголовки и анонсы. Это экономит трафик и ускоряет процесс.
Источники разделены на категории:
- Мировые: Reuters, BBC, CNBC, NYT, The Guardian
- Российские: РИА, ТАСС, RT, Lenta, РБК, Интерфакс
- Технологии: VC, Habr, TechCrunch, Ars Technica
- Крипто: CoinDesk, CoinTelegraph
- Наука: Nature, Science Daily
За один цикл сбора (≈30 секунд) система получает 100-200 свежих новостей со всех источников.
2. Первичная фильтрация: отбрасываем мусор
Не все новости одинаково полезны. На этом этапе отсекаются:
- Кликбейт («Шок!», «Срочно!», «Вы не поверите!»)
- Таблоиды и слухи
- Новости без подтверждённых источников
- Рекламные материалы под видом новостей
- Дубли одного события от одного агентства
После первичной фильтрации из 200 новостей остаётся 30-50.
3. AI-анализ: что действительно важно
Здесь работает нейросеть. Каждая новость оценивается по нескольким параметрам:
Весовые коэффициенты:
- Геополитическая значимость (×3) — войны, санкции, договоры
- Экономическое влияние (×2.5) — курсы валют, рынки, крипто
- Технологический прорыв (×2) — AI, космос, медицина
- Социальный резонанс (×1.5) — законы, протесты, выборы
- Экстренность (×2) — стихии, теракты, ЧП
Новость про повышение ставки ФРС получит высокий балл. Новость про победу футбольной команды — низкий (если только это не финал ЧМ).
4. Дедупликация: убираем повторы
Одно событие освещается 10-15 источниками. Reuters, BBC и РИА могут написать про одно и то же заседание ФРС.
Алгоритм сравнивает заголовки и тексты на схожесть. Если similarity > 0.85 — оставляем только один вариант, приоритет отдаём:
- Источнику, который опубликовал первым
- Более авторитетному агентству
- Более полному тексту
5. Финальная выборка: 3 поста из 1000
После всех фильтров остаётся 5-7 новостей. Из них выбираются 3 лучшие по суммарному score.
Каждый пост обогащается:
- AI-анализом события (2-3 предложения контекста)
- Подходящим изображением
- Кнопками реакций (👍 👎 🔥)
"За 3 месяца работы мы проанализировали 2.3 млн новостей. Опубликовали 5738. Это 0.25% от всего потока — и именно эти 0.25% действительно важны."
Результаты: 98% точности
Мы провели опрос среди 500 подписчиков:
- 94% считают, что не пропускают важные новости
- 89% экономят 30+ минут в день
- 97% доверяют отбору AI
Это не замена чтению новостей — это фильтр шума. Вы получаете только то, что влияет на мир, экономику и ваши решения.