Перейти к содержимому

Глава 3. Практическое применение RAG

Это продолжение перевода книги Кит Борн. Раскрытие потенциала данных с помощью генеративного ИИ и технологии RAG. В главе 1 мы перечислили несколько применений генерации, дополненной поиском (RAG), а в главе 2 разобрали код конвейера RAG.

В этой главе мы рассмотрим следующие темы:

  • Поддержка клиентов и чат-боты
  • Автоматизированная отчетность
  • Поддержка электронной коммерции
  • Использование баз знаний
  • Поиск инноваций и анализ тенденций
  • Персонализация контента для медиа и контент-платформ
  • Персонализированные рекомендации в маркетинговых коммуникациях
  • Обучение и образование
  • Лаборатория кода 3. Добавление исходных кодов в RAG

Подробнее »Глава 3. Практическое применение RAG

Кит Борн. Раскрытие потенциала данных с помощью генеративного ИИ и технологии RAG

Я уже более двух лет использую ChatGPT в быту, при подготовке публикаций и в преподавательской деятельности. В последнее время я думаю над внедрением LLM в процессы по основному месту работы. Готового решения на базе ChatGPT я не нашел, и все дороги, похоже ведут к использованию технологии Retrieval-Augmented Generation (RAG, Генерация, дополненная поиском). Я попросил ChatGPT рекомендовать мне книгу практической направленности для первого знакомства с RAG. И получил книгу Кита Борна, опубликованную на amazon в сентябре 2024 г.

Keith Bourne. Unlocking Data with Generative AI and RAG. – Packt Publishing, 2024. – 346 p.

Подробнее »Кит Борн. Раскрытие потенциала данных с помощью генеративного ИИ и технологии RAG

Томас Нилд. Математика для data science

Растущая доступность данных привела к тому, что data science и машинное обучение стали востребованными профессиональными областями. Если вы стремитесь сделать карьеру в области data science, искусственного интеллекта или инженерии данных, вам просто необходимо разбираться в основах теории вероятностей, линейной алгебры, математической статистики и машинного обучения. В книге ровно столько высшей математики, математического анализа и статистики, сколько нужно, чтобы лучше понимать, как работают библиотеки, с которыми вы встретитесь.

Томас Нилд. Математика для data science. – Астана: Спринт Бук, 2025. – 352 с.

Подробнее »Томас Нилд. Математика для data science

Люба Макарина. Действуй как ChatGPT: Неполное и неточное руководство по работе с лучшей нейросетью

Это руководство по работе с ChatGPT написано редактором издательства Альпина Digital Любой Макариной. Любопытно, что я наткнулся на книгу в корпоративной библиотеке Альпины. На основных площадках и в самом издательстве книгу найти не удалось. Это очередная книга по ChatGPT, который[1] увлекает меня все больше и больше. В книге довольно много интересных советов, а главное, я впервые нашел краткое руководство по созданию агента GPTs.

Люба Макарина. Действуй как ChatGPT: Неполное и неточное руководство по работе с лучшей нейросетью. – М.: Альпина Digital, 2024. – 100 стр. электронного издания.

Подробнее »Люба Макарина. Действуй как ChatGPT: Неполное и неточное руководство по работе с лучшей нейросетью

Дамир Халилов. ChatGPT на каждый день: 333 промта для бизнеса и маркетинга

Промт-инжиниринг – искусство ставить нейросети правильный промт (задачу). Познакомившись с ChatGPT Дамиру стало очевидно, что началась новая эпоха. И главным навыком этой эпохи станет работа с нейросетями. Ведь ChatGPT и другие новейшие сервисы позволят каждому человеку избавиться от рутины, выполнять больше важных для его работы, бизнеса и жизни задач. В течение следующих нескольких месяцев Дамир погрузился в изучение нейросетей и начал пробовать применять их для самых разных сфер своей деятельности: бизнеса, саморазвития, творчества, онлайн-образования. В каждой задаче Дамир видел одну и ту же закономерность: качество результата зависит от качества промта. Цель книги – дать вам готовые промты, которые вы сможете адаптировать под свои задачи. AI-стратегия Дамира на 2024 г.

Халилов Дамир. ChatGPT на каждый день: 333 промта для бизнеса и маркетинга. – М.: Альпина Паблишер, 2025. – 308 стр.

Подробнее »Дамир Халилов. ChatGPT на каждый день: 333 промта для бизнеса и маркетинга

Геннадий Михайлов, Антон Войтишек. Статистическое моделирование. Методы Монте-Карло

Читая книгу Нассима Талеба Статистические последствия жирных хвостов, я моделировал в Excel иллюстрации, представленные автором. Особенно мне было интересно генерировать непрерывные случайные величины, заданные различными распределениями. В процессе этой работы я понял, что мне не хватает теоретических знаний в этой области, и нагуглил книгу Геннадия Михайлова и Антона Войтишека Статистическое моделирование. Методы Монте-Карло. Предлагаю вашему вниманию отдельные фрагменты книги. Мои комментарии и примеры в Excel набраны с отступом.

Геннадий Михайлов, Антон Войтишек. Статистическое моделирование. Методы Монте-Карло. – М.: Юрайт, 2024. – 324 с.

Подробнее »Геннадий Михайлов, Антон Войтишек. Статистическое моделирование. Методы Монте-Карло

Глава 16. Включение расширений

Это продолжение перевода книги Грегори Декер, Рик де Гроот, Мелисса де Корте. Полное руководство по языку М Power Query. Power Query поддерживает широкий спектр коннекторов для доступа и извлечения данных из различных источников. Power BI Desktop поддерживает почти 200 различных коннекторов, большинство из которых были рассмотрены в главе 3 Доступ к данным и их объединение. Многие из этих коннекторов являются общими для различных стандартов и протоколов форматов данных, таких как Open Data Protocol (OData), Open Database Connectivity (ODBC), JavaScript Object Notation (JSON), Extensible Markup Language (XML) и Parquet. Поддержка этих стандартов и протоколов значительно расширяет возможные источники данных для Power Query до тысяч, если не десятков тысяч.

Мои комментарии набраны с отступом.

Предыдущая глава       Содержание

Подробнее »Глава 16. Включение расширений

Глава 15. Оптимизация производительности

Это продолжение перевода книги Грегори Декер, Рик де Гроот, Мелисса де Корте. Полное руководство по языку М Power Query. Хотя важно получать точные данные, скорость выполнения запросов существенно влияет на пользовательский опыт. Длительное обновление может привести к таймауту, а ожидание результатов преобразований в редакторе Power Query может быть раздражающим. В этой главе мы погрузимся в стратегии оптимизации производительности запросов. Сначала рассмотрим использование памяти при оценке запросов и как чрезмерное использование памяти замедляет их выполнение. Затем мы изучим различные стратегии, чтобы предотвратить это.

Мои комментарии набраны с отступом.

Предыдущая глава       Содержание    Следующая глава/a>

Подробнее »Глава 15. Оптимизация производительности

Глава 14. Проблемные паттерны данных

Это продолжение перевода книги Грегори Декер, Рик де Гроот, Мелисса де Корте. Полное руководство по языку М Power Query. Изменение и подготовка данных к анализу часто представляют собой комбинацию искусства и науки, сочетая теорию и навыки с творческим решением задач. Существует широкий спектр проблемных шаблонов данных, от работы с данными в стеке до многострочных заголовков. Проблемы не ограничиваются только структурой данных, но часто включают несоответствия и другие сложности, которые могут возникнуть из-за уникального характера данных или конкретных бизнес-правил и требований.

Мои комментарии набраны с отступом.

Предыдущая глава       Содержание    Следующая глава

Подробнее »Глава 14. Проблемные паттерны данных

Fantasy Premier League. Отбор элиты к сезону 2024/25

В прошлом сезоне я начал вести онлайн страничку статистики Fantasy Premier League. Основная идея – показать, в чем действия элитных игроков отличаются от действий поляны. Для этого я по сложному алгоритму отобрал 10 000 элитных игроков и с помощью генератора случайных чисел получил 10 000 аккаунтов поляны. По окончании сезона 2023/24 анализ элиты показал, что сложный алгоритм отбора был излишним, а 10 000 слишком большое число, размывающее качество группы. Перед стартом сезона 2024/25 я изменил подход, сузив выборку до 1000 элитных игроков, отобрав их по сумме очков, набранных за последние пять сезонов. Проходной балл получился чуть менее 12 500 Pts или в среднем за сезон впечатляющие 2500 очков!

Но начнем с общих параметров игрового ландшафта.

Сезон 2024/25 на сайте FPL стартовал 17 июля 2024 г. в 13:30 по Гринвичу. Кстати, я узнал, что время в Лондоне может отличаться от времени по Гринвичу: в Англии действует летнее время, а по Гринвичу время не изменяется. Таким образом в Лондоне было 14:30, а в Москве 16:30. Первые 100 000 аккаунтов зарегистрировались в течение 30 минут, а вообще в первый день зарегистрировались 721k аккаунтов. К первому дедлайну (16.08.2024, 17:30 по Гринвичу) зарегистрировались более 8,6М аккаунтов. На 600k аккаунтов больше, чем годом ранее. Регистрация шла не равномерно:

Рис. 1. Регистрация к сезону 2024/25

Подробнее »Fantasy Premier League. Отбор элиты к сезону 2024/25