Не все прямые одинаково полезны
«Линейная регрессия представляет собой замечательный инструмент: гибкий, масштабируемый и легкий в применении (вы просто нажимаете соответствующую кнопку электронной таблицы). Этот инструмент можно применять к двум наборам данных с участием двух переменных, но он работает не менее эффективно и в случае трех или даже тысячи переменных. Каждый раз, когда вам нужно понять, как одни переменные меняют другие переменные и в каком направлении, линейная регрессия — это первое, что следует использовать. Этот инструмент применим буквально к любому набору данных.
Однако в этом заключается не только сильная, но и слабая сторона линейной регрессии. Вы можете применить этот метод, не задумываясь, действительно ли феномен, который вы пытаетесь моделировать, близок к линейному. Но вы не должны так делать»
Предположим, мы запустили ракету и нанесли на график ее положение в нескольких точках по вертикали по времени. Если сделать это в самом начале движения ракеты с небольшим временным интервалом, практически через все эти точки можно будет провести прямую. Но если использовать это линейное приближение для описания движения нашего снаряда, то «за каждую минуту ракета поднимается вверх на определенное фиксированное расстояние, скажем на 400 метров. Через час ракета окажется в 24 километрах над поверхностью земли. Когда же она опустится на поверхность? Никогда! Направленная вверх наклонная прямая линия по-прежнему стремится вверх. Именно так ведут себя прямые. (Кровь, травмы, вопли.)»
По материалам книги Джордана Элленберга «Как не ошибаться» (http://www.mann-ivanov-ferber.ru/books/kak-ne-oshibatsya/ )
#МИФ #книги #научпоп #математика #статистика