Перейти к содержимому

Глава 9. Оценка RAG количественно и с использованием визуализаций

Это продолжение перевода книги Кит Борн. Раскрытие потенциала данных с помощью генеративного ИИ и технологии RAG. Оценка играет важную роль в создании и поддержке систем генерации, дополненной поиском (RAG). Во время построения конвейера оценка помогает выявлять области для улучшения, оптимизировать производительность системы и измерять влияние улучшений. После развертывания системы RAG оценка обеспечивает ее эффективность, надежность и производительность. В этой главе будут рассмотрены следующие темы:

  • Оценка на этапе создания приложения RAG
  • Оценка приложения RAG после развертывания
  • Стандартизированные структуры оценки
  • Эталонные данные
  • Лаборатория кода 9.1: ragas
  • Дополнительные методы оценки для систем RAG

Подробнее »Глава 9. Оценка RAG количественно и с использованием визуализаций

Глава 8. Поиск сходства с помощью векторов

Это продолжение перевода книги Кит Борн. Раскрытие потенциала данных с помощью генеративного ИИ и технологии RAG. Мы обсудим компонент Извлечение (retrieval) в рамках Генерации, дополненной поиском (RAG). Рассмотрим четыре темы, связанные с поиском сходства: индексация, метрики расстояния, алгоритмы сходства и сервисы векторного поиска. В этой главе вы изучите:

  • Метрики расстояния, алгоритмы сходства и векторный поиск
  • Векторное пространство
  • Лаборатория кода 8.1: Метрики семантического расстояния
  • Разные парадигмы поиска: разреженный, плотный, гибридный
  • Лаборатория кода 8.2: Гибридный поиск с пользовательской функцией
  • Лаборатория кода 8.3: Гибридный поиск с использованием LangChain’s EnsembleRetriever
  • Алгоритмы семантического поиска
  • Улучшение поиска с помощью методов индексации
  • Варианты векторного поиска

Подробнее »Глава 8. Поиск сходства с помощью векторов

Глава 7. Ключевая роль векторов и векторных хранилищ в RAG

Это продолжение перевода книги Кит Борн. Раскрытие потенциала данных с помощью генеративного ИИ и технологии RAG. Векторы являются ключевым компонентом генерации, дополненной поиском (RAG). В этой главе мы вернемся к коду из предыдущих глав, уделяя внимание тому, как векторы влияют на него. Мы поговорим о том, что такое вектор, как они создаются и где их хранить. Мы сосредоточимся на том, как векторы связаны с RAG, но мы призываем вас потратить больше времени на более глубокое понимания векторов. Чем лучше вы понимаете векторы, тем эффективнее будут ваши конвейеры RAG. Обсуждение векторов настолько важно, что мы посвятим ему две главы. В этой главе мы рассмотрим вектора и векторные хранилища, а в главе 8 – векторный поиск, то есть то, как векторы используются в системе RAG. В этой главе мы рассмотрим следующие темы:

  • Основы векторов
  • Где в вашем коде скрываются векторы
  • Объем текста, который вы векторизуете, имеет значение!
  • Не все семантики одинаково хороши!
  • Лаборатория кода 7.1 – Распространенные методы векторизации
  • Факторы выбора варианта векторизации
  • Начало работы с векторными хранилищами
  • Векторные хранилища
  • Выбор векторного хранилища

Подробнее »Глава 7. Ключевая роль векторов и векторных хранилищ в RAG

Глава 6. Добавляем пользовательский интерфейс RAG с помощью Gradio

Это продолжение перевода книги Кит Борн. Раскрытие потенциала данных с помощью генеративного ИИ и технологии RAG. Глава 6 открывает вторую часть книги – Компоненты RAG. В этой части вы узнаете о ключевых компонентах системы RAG и о том, как их реализовать с помощью LangChain. Вы изучите, как создавать интерактивный пользовательский интерфейс в Gradio, вектора и векторные хранилища, методы оценки RAG и визуализацию. Вы научитесь использовать компоненты LangChain: загрузчики документов, разделители текста, парсеры вывода.

В этой главе мы предоставим практическое руководство по созданию интерактивного приложения на основе RAG с использованием Gradio в качестве пользовательского интерфейса. Мы настроим среду Gradio, интегрируем модель RAG, создадим web-интерфейс, и разместим приложения в Интернете. Вы узнаете, как быстро создавать прототипы и развертывать приложения на базе RAG.

Подробнее »Глава 6. Добавляем пользовательский интерфейс RAG с помощью Gradio

Глава 5. Управление безопасностью в приложениях RAG

Это продолжение перевода книги Кит Борн. Раскрытие потенциала данных с помощью генеративного ИИ и технологии RAG. В зависимости от среды, в которой создается приложение RAG, сбои в системе безопасности могут привести к юридической ответственности, ущербу репутации и дорогостоящим сбоям в обслуживании. Системы RAG несут уникальные риски безопасности, в первую очередь из-за их зависимости от внешних источников данных для улучшения генерации контента. Чтобы устранить эти риски, мы углубимся в мир безопасности приложений RAG, исследуя как преимущества, так и потенциальные риски, связанные с технологией. В этой главе мы рассмотрим следующие темы:

  • Как RAG может быть использована в качестве решения для обеспечения безопасности
  • Проблемы безопасности RAG
  • Красная команда
  • Общие зоны для целей с красными командами
  • Лаборатория кода 5.1 – Защита ключей
  • Лаборатория кода 5.2 – Атака красной команды!
  • Лаборатория кода 5.3 – Синяя команда защищается!

Подробнее »Глава 5. Управление безопасностью в приложениях RAG

Глава 4. Компоненты системы RAG

Это продолжение перевода книги Кит Борн. Раскрытие потенциала данных с помощью генеративного ИИ и технологии RAG. В главе 1 мы познакомили с генерацией, дополненной поиском (RAG), в главе 2 разобрали код конвейера RAG, в главе 3 рассмотрели области применения RAG. При разработке RAG важно понимать тонкости каждого компонента, способы их интеграции и технологии, которые расширяют возможности этих систем. В этой главе мы рассмотрим следующие темы:

  • Обзор ключевых компонентов
  • Индексация
  • Извлечение и генерация
  • Создание промтов
  • Определение языковой модели
  • Пользовательский интерфейс
  • Оценка

Подробнее »Глава 4. Компоненты системы RAG

Глава 3. Практическое применение RAG

Это продолжение перевода книги Кит Борн. Раскрытие потенциала данных с помощью генеративного ИИ и технологии RAG. В главе 1 мы перечислили несколько применений генерации, дополненной поиском (RAG), а в главе 2 разобрали код конвейера RAG.

В этой главе мы рассмотрим следующие темы:

  • Поддержка клиентов и чат-боты
  • Автоматизированная отчетность
  • Поддержка электронной коммерции
  • Использование баз знаний
  • Поиск инноваций и анализ тенденций
  • Персонализация контента для медиа и контент-платформ
  • Персонализированные рекомендации в маркетинговых коммуникациях
  • Обучение и образование
  • Лаборатория кода 3. Добавление исходных кодов в RAG

Подробнее »Глава 3. Практическое применение RAG

Кит Борн. Раскрытие потенциала данных с помощью генеративного ИИ и технологии RAG

Я уже более двух лет использую ChatGPT в быту, при подготовке публикаций и в преподавательской деятельности. В последнее время я думаю над внедрением LLM в процессы по основному месту работы. Готового решения на базе ChatGPT я не нашел, и все дороги, похоже ведут к использованию технологии Retrieval-Augmented Generation (RAG, Генерация, дополненная поиском). Я попросил ChatGPT рекомендовать мне книгу практической направленности для первого знакомства с RAG. И получил книгу Кита Борна, опубликованную на amazon в сентябре 2024 г.

Keith Bourne. Unlocking Data with Generative AI and RAG. – Packt Publishing, 2024. – 346 p.

Подробнее »Кит Борн. Раскрытие потенциала данных с помощью генеративного ИИ и технологии RAG

Томас Нилд. Математика для data science

Растущая доступность данных привела к тому, что data science и машинное обучение стали востребованными профессиональными областями. Если вы стремитесь сделать карьеру в области data science, искусственного интеллекта или инженерии данных, вам просто необходимо разбираться в основах теории вероятностей, линейной алгебры, математической статистики и машинного обучения. В книге ровно столько высшей математики, математического анализа и статистики, сколько нужно, чтобы лучше понимать, как работают библиотеки, с которыми вы встретитесь.

Томас Нилд. Математика для data science. – Астана: Спринт Бук, 2025. – 352 с.

Подробнее »Томас Нилд. Математика для data science

Люба Макарина. Действуй как ChatGPT: Неполное и неточное руководство по работе с лучшей нейросетью

Это руководство по работе с ChatGPT написано редактором издательства Альпина Digital Любой Макариной. Любопытно, что я наткнулся на книгу в корпоративной библиотеке Альпины. На основных площадках и в самом издательстве книгу найти не удалось. Это очередная книга по ChatGPT, который[1] увлекает меня все больше и больше. В книге довольно много интересных советов, а главное, я впервые нашел краткое руководство по созданию агента GPTs.

Люба Макарина. Действуй как ChatGPT: Неполное и неточное руководство по работе с лучшей нейросетью. – М.: Альпина Digital, 2024. – 100 стр. электронного издания.

Подробнее »Люба Макарина. Действуй как ChatGPT: Неполное и неточное руководство по работе с лучшей нейросетью