Перейти к содержимому

Июль 2016

Определение выбросов

Выбросы — точки, сильно выбивающиеся из последовательности, не вписывающиеся в модель по какой-либо причине. Люди озаботились выбросами, желая избавиться от них. Выбросы оттягивают на себя средние значения и сдвигают распределение данных. [1] Иногда выбросы – просто ошибка ввода. Поэтому первая причина обращать внимание на выбросы — это обеспечение чистоты анализа данных и моделирования. Но есть и другая – определение выбросов интересно само по себе!

Рис. 1. Вероятность 349-дневной беременности

Рис. 1. Вероятность 349-дневной беременности

Подробнее »Определение выбросов

Прогнозирование на основе экспоненциального сглаживания

Задачи прогнозирования построены на изменении неких данных во времени (продаж, спроса, поставок, ВВП, выбросов углерода, численности населения…) и проецировании этих изменений на будущее. К сожалению, выявленные на исторических данных, тренды могут нарушаться множеством непредвиденных обстоятельств. Так что данные в будущем могут существенно отличаться от произошедшего в прошлом. [1] В этом и состоит проблема прогнозирования.

Однако, существуют методики (под названием экспоненциальное сглаживание), позволяющие не только попытаться предсказать будущее, но и выразить численно неопределенность всего, что связано с прогнозом. Численное выражение неопределенности с помощью создания интервалов прогнозирования поистине неоценимо, но часто игнорируется в прогностическом мире.

Рис. 1. Временной ряд данных

Рис. 1. Временной ряд данных

Подробнее »Прогнозирование на основе экспоненциального сглаживания

Педро Домингос. Верховный алгоритм

Машинное обучение преображает науку, технологию, бизнес и позволяет глубже узнать природу и человеческое поведение. Программирующие сами себя компьютеры — одна из самых важных современных технологий, и она же — одна из самых таинственных. Ученый-практик Педро Домингос приоткрывает завесу и впервые доступно рассказывает о машинном обучении и о поиске универсального обучающегося алгоритма, который сможет выуживать любые знания из данных и решать любые задачи (он называет его Верховный алгоритм). Чтобы заглянуть в будущее и узнать, как машинное обучение изменит наш мир, не нужно специального технического образования — достаточно прочитать эту книгу. См. также. Джон Форман. Много цифр: Анализ больших данных при помощи Excel, Идеи Байеса для менеджеров.

Педро Домингос. Верховный алгоритм. Как машинное обучение изменит наш мир. – М.: Манн, Иванов и Фербер, 2016. — 336 с.

Педро Домингос. Верховный алгоритм. Обложка

Подробнее »Педро Домингос. Верховный алгоритм

Глава 23. Можете ли вы понять, как работает огромная формулу массива?

Это заключительная глава книги: Майкл Гирвин. Ctrl+Shift+Enter. Освоение формул массива в Excel.

Предыдущая глава                          Оглавление

Что, если перед вами огромная формула массива, и вы не можете понять, как она работает? Вспомним подходы, изложенные в предыдущих разделах.

Разбейте формулу на минимально возможные фрагменты и каждый фрагмент поместите в отдельную ячейку. Это особенно актуально, когда фрагмент формулы изменяется, при копировании формулы вдоль столбца (строки).

Рис. 23.0. Выделение фрагмента формулы, соответствующего аргументу

Рис. 23.0. Выделение фрагмента формулы, соответствующего аргументу номер_строки

Подробнее »Глава 23. Можете ли вы понять, как работает огромная формулу массива?

Глава 22. Функция массива ЛИНЕЙН

Это глава из книги: Майкл Гирвин. Ctrl+Shift+Enter. Освоение формул массива в Excel.

Предыдущая глава                          Оглавление                               Следующая глава

Функция ЛИНЕЙН рассчитывает статистику для ряда с применением метода наименьших квадратов, чтобы вычислить прямую линию, которая наилучшим образом аппроксимирует имеющиеся данные и затем возвращает массив, который описывает полученную прямую. Функция ЛИНЕЙН может также возвращать дополнительную регрессионную статистику (подробнее см. справку MS Excel).

Рис. 22.1. Четыре аргумента функции ЛИНЕЙН

Рис. 22.1. Четыре аргумента функции ЛИНЕЙН

Подробнее »Глава 22. Функция массива ЛИНЕЙН

Ицхак Адизес. Новые размышления о менеджменте

Новые размышления о менеджменте — это сборник статей, посвященных менеджменту. Они основаны на опыте Ицхака Адизеса — одного из ведущих бизнес-гуру в мире, консультировавшего сотни корпораций и правительств. Если вы поклонник Адизеса и уже знакомы с его концепцией жизненного цикла организаций и моделью PAEI, то сможете узнать о самых актуальных наблюдениях автора. Если же только знакомитесь с его творчеством, то все равно сможете начать с этой книги, воспользовавшись краткой справкой во введении. Статьи Ицхака Адизеса затрагивают следующие проблемы управления: обучение менеджменту, курсы и бизнес-школы; критика современного бизнес-образования; принятие решений; управление изменениями; стили управления; жизненный цикл компаний; лидерство. См. также Адизес. Как преодолеть кризисы менеджмента, Ицхак Калдерон Адизес. Стили менеджмента.

Ицхак Адизес. Новые размышления о менеджменте. – М.: Манн, Иванов и Фербер, 2016. – 208 с.

Ицхак Адизес. Новые размышления о менеджменте. Обложка

Подробнее »Ицхак Адизес. Новые размышления о менеджменте

Глава 21. Таблицы данных

Это глава из книги: Майкл Гирвин. Ctrl+Shift+Enter. Освоение формул массива в Excel.

Предыдущая глава                          Оглавление                               Следующая глава

В этой главе рассматривается таблица данных, которая создает массив, как результат работы функции Таблица (эту функцию нельзя ввести в ячейки вручную). Таблица данных – это быстрый и простой способ выполнить анализ «что если» для сложных взаимосвязанных вычислений на основе формул. Эта функция позволяет изменять одну или две формулы входов и отображение того, что результаты. В главах 4, 5 и 10 уже были приведены примеры таблиц данных, которые использовались в сочетании с функциями базы данных.

Рис. 21.1. Ячейка В6 содержит формулу, которая косвенно зависит от значения ячейки В2

Рис. 21.1. Ячейка В6 содержит формулу, которая косвенно зависит от значения ячейки В2

Подробнее »Глава 21. Таблицы данных

Глава 20. Условное форматирование и формулы массива

Это глава из книги: Майкл Гирвин. Ctrl+Shift+Enter. Освоение формул массива в Excel.

Предыдущая глава                          Оглавление                               Следующая глава

Несколько важных фактов об условном форматировании на основе формул:

  • Проверка условия возвращает значения ИСТИНА/ЛОЖЬ и применяется к диапазону ячеек.
  • Условие проверяется для каждой ячейки в диапазоне. Если условие выполнено, ячейка получает форматирование. Если условие не выполнено, ячейка не форматируется.
  • Для создания условия подходит любая формула, возвращающая значения ИСТИНА/ЛОЖЬ (если формула возвращает число, то любое число, кроме нуля приравнивается к значению ИСТИНА, а значение ноль – ЛОЖЬ).
  • Условное форматирование можно использовать, как с обычными формулами, так и с формулами массива.
  • Условное форматирование является волатильным (летучим): оно пересчитывается довольно часто, даже, когда вы напрямую не задействуете диапазон, в отношении которого применено условное форматирование (см. главу 13). Это замедляет работу.

Подробнее »Глава 20. Условное форматирование и формулы массива

Грэм Робб. Открытие Франции

Автор книги «Открытие Франции» – знаменитый историк и биограф, страстно любящий Францию и посвятивший ее изучению многие годы. Большинство историков фокусировали свое внимание на Париже. Г.Робб увлечен иной задачей. Объехав Францию вдоль и поперек, побывав в самых дальних ее уголках, он меняет привычные представления о стране с помощью огромного исследовательского материала, начиная с дорийской Галлии и завершая началом XX в., – и все это в форме увлекательных новелл о малоизвестных и прославленных на весь мир исторических событиях и персонажах. Он блестяще достигает поставленной цели – открыть читателю неизвестную прежде Францию.

Ссылку на эту книгу я нашел у Талеба в Антихрупкости… См. также Что почитать по менеджменту.

Грэм Робб. Открытие Франции. Увлекательное путешествие длинной 20 000 километров по сокровенным уголкам. – М.: Центрполиграф, 2013. – 576 с.

Грэм Робб. Открытие Франции. Обложка

Подробнее »Грэм Робб. Открытие Франции

Глава 19. Формулы сортировки и извлечения уникальных списков

Это глава из книги: Майкл Гирвин. Ctrl+Shift+Enter. Освоение формул массива в Excel.

Предыдущая глава                          Оглавление                               Следующая глава

Эта заметка для тех, кого по-настоящему интересуют сложных формулы массива. Если вам просто нужно один раз извлечь список уникальных значений, гораздо проще использовать Расширенный фильтр или сводную таблицу. Основные преимущества использования формул – автоматическое обновление при изменении/добавлении исходных данных или критериев отбора. Перед прочтением желательно освежить в памяти идеи, содержащиеся в предыдущих материалах:

Рис. 19.1. Извлечение уникальных записей с помощью опции Расширенный фильтр

Рис. 19.1. Извлечение уникальных записей с помощью опции Расширенный фильтр

Подробнее »Глава 19. Формулы сортировки и извлечения уникальных списков