Эта книга о том, как создавать профессиональную визуализацию с помощью диаграмм в Excel. Ведь качественная визуализация делает принятие решения в разы более быстрым и легким. Эта книга – практическое руководство на каждый день для тех, кто работает с числами и хочет упростить анализ информации. Книга содержит чек-листы и памятки, анализ реальных кейсов известных компаний, готовые решения, лайфхаки Excel и главу об оформлении таблиц.
Ольга Базалева. Мастерство визуализации данных. Как доносить идеи с помощью графиков и диаграмм. – СПб.: ООО «Диалектика», 2020. – 192 с.
Скачать краткое содержание в формате Word или pdf
Купить цифровую книгу в ЛитРес, бумажную книгу в Ozon или Лабиринте
Глава 1. Немного теории
Есть всего четыре вида диаграмм, которые понятны всем и при этом подходят для большинства данных. Старайтесь использовать их.
Рис. 1. Простые диаграммы
Когда не обойтись без более сложного вида диаграммы, обязательно давайте пояснения, как читать диаграмму, или проговаривайте это вслух, если вы выступаете с презентацией.
Построение диаграммы начинается с определения цели. Например, у вас есть данные по выручке компании и конкурентов за два года в разбивке по месяцам. Цели могут быть следующие:
- Рассмотреть продажи компании.
- Сравнить динамику продаж компании и конкурентов.
- Выявить изменения выручки компании год на год.
- Показать динамику долю компании и конкурентов.
Определившись с целью, можно выбрать диаграмму (по моему опыту, схема охватывает 90% всех аналитических задач):
Рис. 2. Алгоритм выбора простых диаграмм
Глава 2. Одиннадцать правил визуализации данных
Не пытайтесь уместить на одну диаграмму всю имеющуюся информацию. Визуальный ряд не должен быть перегружен сложными и многоярусными диаграммами. Когда необходимо визуализировать много разных типов данных и категорий, целесообразнее разделять диаграмму на несколько частей. Например, если на линейном графике больше четырех-пяти линий или на столбиковой диаграмме больше двух категорий, не стоит умещать их на одном графике.
Рис. 3. Если данных много, разделите их
Числа должны быть с разделителями разрядов и без лишних знаков после запятой. У диаграммы должны быть название и полная легенда. Есть несколько основных категорий, которые у нас всегда ассоциируются с определенным цветом.
- Положительные и отрицательные значения – зеленый и красный.
- Да/нет, согласен/не согласен – зеленый и красный.
- Мужчины и женщины – голубой и розовый.
- Прочее/другое/остальное/нет ответа/затрудняюсь ответить – серый цвет.
Для сравнения показателей текущего года и прошедшего сделайте прошедший год более бледным. Оба года покажите в оттенках одного цвета.
Три кита удачной визуализации:
- Акцент на главной идее, которая может быть прописана в названии, показана с помощью цвета или добавлена как комментарий на график.
- Цвет помогает акцентировать главную идею, сделать легенду понятной, структурировать информацию, отделить менее значимые элементы.
- Чем проще, тем лучше. Для восприятия диаграммы не должны требовать долгого чтения сопроводительного текста. Диаграммы должны заменять текст.
Глава 3. Анализ ошибок на примере реальных кейсов
Семь главных ошибок: неверно выбран тип графика, плохо подобраны цвета, есть лишние элементы, не указана единица измерения, неудобный формат больших чисел — ненужные знаки после запятой, нет разделителей разрядов, в круговой диаграмме много секторов, в круговой диаграмме сумма секторов не равна 100%.
Рис. 4. Пример улучшения диаграммы
Рис. 5. Еще один пример; чтобы увеличить изображение кликните на нем правой кнопкой мыши и выберите Открыть картинку в новой вкладке
Глава 4. Приемы визуализации
Приемы использования цвета помогают читателю быстрее считывать идею ваших графиков. С помощью цвета можно показать положительные и отрицательные значения, ответы Да-Нет-Не знаю, максимум и минимум, прогнозные значения, текущий и прошлый период; расставить акценты; отделить менее значимую информацию; подчеркнуть фирменный стиль.
Рис. 6. Пример выделения отрицательных значений
Чтобы понятно показать на графике текущий и прошлый годы, достаточно сделать текущий год ярче, а прошлый – бледнее:
Рис. 7. Выделение данных за текущий и прошлый год
Помимо цвета, есть и другие способы сделать вашу визуализацию более наглядной и понятной: настройте на диаграмме перекрытие столбцов, уменьшите пространство между столбцами, используйте гладкий график на основе скользящего среднего, сделайте одну подпись для нескольких диаграмм, воспользуйтесь вспомогательной осью.
Если нужно сравнить показатели текущего года с показателями прошедшего, информация считывается легче, когда текущий год выводится на первый план, а прошлый остается на заднем:
Рис. 8. Сравнение показателей прошлого и текущего годов: а) стандартная диаграмма Excel, б) диаграмма с перекрытием столбцов
Чтобы добиться эффекта перекрытия, щелкните правой кнопкой мыши на любом столбце. Выберите Формат ряда данных… В группе Параметры ряда установите Перекрытие рядов 100%.
Глава 5. Готовые решения для различных бизнес-данных
Рис. 9. Целевая аудитория на примере сайта РБК
Индекс соответствия (Affinity index) показывает, насколько данной группе свойственно посещение сайта. Если индекс больше 100, значит, свойственно, а если меньше – нет. Индекс превышает 100, когда доля этой аудитории на сайте выше, чем в населении России в целом. Например, в населении всего 48% мужчин, а на РБК доля мужчин равна 57%. Индекс будет равен 118 (считается он по формуле 57/48*100).
Глава 6. Как оформлять таблицы
Если ряды и столбцы данных хорошо структурированы, не используйте сетку. Если она всё же нужна, сделайте линии сетки светлыми. Числа должны быть с разделителями разрядов и без лишних знаков после запятой. Если применяете автоматическую поочередную заливку строк, используйте неяркие цвета. Не стоит перебарщивать, иначе все внимание будет направлено на форму, а не на содержание. Логика размещения данных в таблице может быть разная, но она должна быть. Обычно данные принято располагать от больших значений к меньшим. Выделяйте отрицательные значения красным. Если в таблице присутствует много нулевых значений или ошибок (#Н/Д, #ДЕЛ/0!), окрасьте их в бледный серый цвет (с помощью пользовательского формата чисел или условного форматирования). Выделяйте шапку и итоги. Помогайте цветом и отступами понять иерархическую структуру данных:
Рис. 10. Выделение иерархической структуры таблицы
Из плюсов показали как было и как стало — побольше бы таких примеров.
Из минусов: круговые диаграммы табу — они бесполезны и всегда можно придумать как лучше обойтись без них, если вы, конечно же, не хотите манипулировать данными.
В последнем примере с таблицами рубли вынести в название таблицы, данные показывать в миллонах — таблица сразу станет чище визуально. Почему автор не довел таблицу хотя бы до приемлимого уровня. Я уже не говорю об том, чтобы показать отклонения и какой-то анализ данных.
И странно, что автор не упомянула о диаграммах типа водопад. По моему мнению они обладают сильной визуальной сосовляющей.
1) +1 к водопаду
2) Рис.8 — насколько я понимаю, подходит только для такого идеального примера, когда все значения текущего года меньше соответствующих прошлогодних
3) Рис.9 — не уверен, что удачный пример, интерпретация информации достаточно в обоих случаях (ИМХО)
4) Глава 6 — неудачный пример, на мой взгляд, я в качестве памятки по оформлению таблиц использую gif «Remove to improve» (https://external-preview.redd.it/P_zkehUJJ5PfPqKp9jpVCS1uq7ywK1U27dVtpr0yNbM.gif?format=mp4&v=enabled&s=985d22f9036db0f67ac158abbf0066b1f40167d7), как метко назвали ее на Reddit — «How to make your tables less terrible»
5) как всегда — Сергей Викторович, спасибо за Ваш труд!
CONSTANTINE, замечательное видео Remove to improve! Не хотите по мотивам этого видео написать небольшую заметку для моего блога? Я опубликую под вашим именем.
Сергей, т.к. CONSTANTINE не откликнулся, позволил себе сделать такую заметку, т.к. видео мне чрезвычайно понравилось.
CONSTANTINE отдельное спасибо за наводку.
Вложение Ubiraj-i-uluchshaj.doc
Алексей, спасибо. Опубликовал.