Как появилось понятие о среднем значении?

В 1906 году известный специалист и великий учёный по евгенике Фрэнсис Гальтон посетил птицеводства и достижений ежегодную выставку животноводства в западной Англии, где совсем случайно совершил увлекательный опыт.

Как отмечает Джеймс Суровецки, создатель книги «Мудрость толпы», на ярмарке Гальтона заинтересовало одно соревнование, в рамках которого люди должны были предугадать вес забитого быка. Назвавший самоё близкое к подлинному число объявлялся победителем.

Гальтон был известен своим презрением к интеллектуальным свойствам простых людей. Он считал, что лишь настоящие специалисты смогут сделать правильные утверждения о весе быка. А 787 участников соревнования не были специалистами.

Ученый планировал доказать отсутствие компетенции толпы, вычислив среднее число из ответов участников. Каково же было его удивление, в то время, когда оказалось, что полученный им итог практически в точности соответствовал настоящему весу быка!

  • Пивовар, революционизировавший прикладную статистику

Среднее значение — позднее изобретение

Само собой разумеется, точность ответа поразила исследователя. Но еще более примечательным есть тот факт, что Гальтон по большому счету додумался воспользоваться средним значением.

В сегодняшнем мире средние, и без того именуемые медианные показатели видятся на каждом шагу: средняя температура в Нью-Йорке в апреле равняется 52 градусам по Фаренгейту; Стивен Карри в среднем получает 30 очков за игру; медианный домашний доход в Соединенных Штатах образовывает $51 939/год.Как появилось понятие о среднем значении?

Но же мысль о том, что множество разных результатов возможно репрезентировать одним числом, довольна нова. До 17-ого века средние числа по большому счету не употреблялись.

Каким же образом показалась и развилась концепция медианных значений и средних? И как ей удалось стать основной измерительной методикой в наши дни?

Преобладание средних значений над медианными имело далеко идущие последствия для на отечественного понимания информации. И часто оно приводило людей в заблуждение.

медианное значения и Среднее

Представьте, что вы говорите историю о четырех людях, ужинавших прошлым вечером с вами в ресторане. Одному из них вы бы дали 20 лет, второму — 30, третьему — 40, а четвертому — 50. Что вы сообщите об их возрасте в собственной истории?

Вероятнее, вы назовете их средний возраст.

Среднее значение довольно часто употребляется для передачи информации о чем-либо, и для описания некоего множества измерений. Технически, среднее значение — это то, что математики именуют «средним арифметическим» — сумма всех измерений, поделённая на число измерений.

Не смотря на то, что слово «среднее» (average) довольно часто употребляется как синоним слова «медианное» (median), последним чаще обозначается середина чего-либо. Это слово происходит от латинского «medianus», что означает «середина».

  • Занимательная статистика

Медианное значение в Греции

История медианного значения начинается с учения древнегреческого математика Пифагора. Для его школы и Пифагора медиана имела четкое определение и очень сильно отличалась от того, как мы понимаем среднее значение сейчас. Оно употреблялось лишь в математике, а не в анализе данных.

В школе пифагорейцев медианное значение было средним числом в трехчленной последовательности чисел, находящемся в «равном» отношении с соседними участниками. «Равное» отношение имело возможность означать одинаково расстояние. К примеру, число 4 в последовательности 2,4,6. Но оно кроме этого имело возможность высказывать геометрическую прогрессию, к примеру 10 в последовательности 1,10,100.

Статистик Черчилль Эйзенхарт растолковывает, что в Греции, медианное значение не употреблялось в качестве репрезентирующего либо заменяющего какой-либо комплект чисел. Оно просто обозначало середину, и довольно часто употреблялось в математических доказательствах.

Эйзенхарт посвятил целых десять лет изучению медианного значений и среднего. Изначально он пробовал найти репрезентирующую функцию медианы в ранних научных построениях. Но вместо этого он понял, что большая часть ранних астрономов и физиков опирались на единичные, умело совершённые измерения, и у них не было методологии, разрешавшей выбрать отличных показателей среди множества наблюдений.

Современные исследователи основывают собственные выводы на сборе громадных количеств данных, как, к примеру, биологи, изучающие человеческий геном. Древние ученые же имели возможность совершить пара измерений, но выбирали только наилучшее для построения собственных теорий.

Как писал историк астрономии Отто Нойгебауэр, «это согласуется с осознанным рвением древних людей минимизировать количество эмпирических данных в науке, по причине того, что они не верили в точность ярких наблюдений».

К примеру, астроном и греческий математик Птолемей вычислил угловой диаметр Луны, применяя способ наблюдения и теорию перемещения почвы. Его итог был равен 31 20. Сейчас же мы знаем, что диаметр Луны колеблется от 29 20 до 34 6 в зависимости от расстояния от Почвы.

Птолемей в собственных вычислениях применял мало данных, но у него были все основания считать, что они были правильными.

Эйзенхарт пишет: «Нужно иметь в виду, что связь между теорией и наблюдением в античном мире была другой, нежели сейчас. Результаты наблюдений понимались не как факты, под каковые обязана подстраиваться теория, но как конкретные случаи, каковые смогут быть нужны только в качестве иллюстративных примеров истинности теории»

В итоге, ученые обратятся к репрезентативным измерениям данных, но изначально ни средние, ни медианные значения не употреблялись в данной роли. Со времен античности по сей день в качестве для того чтобы репрезентативного средства употреблялся второй математический концепт — полусумма крайних значений.

  • Занимательная статистика. Часть вторая, огромная

Полусумма крайних значений

Новые научные средства практически в любое время возникают из необходимости решить определенную задачу в какой-либо дисциплине. Необходимость отыскать лучшее значение среди множества измерений появилось из потребности определить расположение.

Интеллектуальный гигант 11-ого века Аль-Бируни известен как один из первых людей, применявших методику репрезентирующих значений. Аль-Бируни писал, что в то время, когда в его распоряжении было множество измерений, и он желал отыскать лучшее среди них, он применял следующее «правило»: необходимо найти число, соответствующее середине между двумя крайними значениями. При вычислении полусуммы крайних значений не принимаются во внимание все числа между большим и минимальным значениями, а находится среднее лишь для этих двух чисел.

Аль-Бируни использовал данный способ в различных областях, а также для вычисления долготы города Газни, что находится на территории современного Афганистана, а также в собственных изучениях особенностей металлов.

Но в последние пара столетий полусумма крайних значений употребляется все реже. В действительности, в современной науке она и вовсе не актуальна. На место полусуммы пришло медианное значение.

Переход к средним значениям

К началу 19-ого века применение медианного/среднего значения стало распространенным способом нахождения самый совершенно верно репрезентирующего значения из группы данных. Фридрих фон Гаусс, выдающийся математик собственного времени, в 1809-ом году писал: «Считалось, что в случае если некое число было выяснено несколькими прямыми наблюдениями, идеальными в однообразных условиях, то среднее арифметическое значение есть самоё истинным значением. Если оно и не совсем строгое, то, по крайней мере, оно близко к действительности, и исходя из этого на него неизменно возможно положиться».

«Не смотря на то, что среднее значение и не совсем строгое, оно близко к действительности, и на него возможно положиться», — Гаусс

Твитнуть цитату

Из-за чего случился подобный сдвиг в методологии?

На данный вопрос достаточно тяжело ответить. В собственном изучении Черчилль Эйзенхарт предполагает, что способ нахождения среднего арифметического имел возможность зародиться в области измерения магнитного отклонения, другими словами в отыскании отличия между направлением стрелки компаса, говорящей о севере, и настоящим севером. Это измерение было очень важным в эру Великих Географических Открытий.

Эйзенхарт узнал, что до конца 16-ого века большая часть измерявших магнетическое отклонение ученых применяли способ ad hoc (от лат. «к этому, для данного случая, для данной цели») при выборе самоё точного измерения.

Но в 1580-ом году ученый Уильям Боро подошел к проблеме в противном случае. Он забрал восемь разных измерений отклонения и, сравнив их, заключил, что самоё точное значение было между 11 ? и 11 ¼ градусами. Возможно, он вычислил среднее арифметическое, которое пребывало в этом диапазоне.

Но сам Боро открыто не называл собственный подход новым способом.

До 1635-ого года по большому счету не было однозначных случаев применения среднего значения в качестве репрезентирующего числа. Но как раз тогда британский астролог Генри Геллибренд забрал два разных результата измерения магнетического отклонения. Одно из них было сделано утром (11 градусов), а второе — днем (11 минуты и 32 градусов). Вычисляя самоё истинное значение, он писал:

«В случае если мы отыщем среднее арифметическое, мы вполне возможно можем утверждать, что итог правильного измерения должен быть около 11 градусов 16 мин.».

В полной мере возможно, что это первенствовалслучай применения среднего значения как самоё близкого к подлинному!

Слово «среднее» (average) использовалось в английском в начале 16-ого века для обозначения денежных утрат от ущерба, которое взяло судно либо груз на протяжении плавания. В течение следующих ста лет оно обозначало эти утраты, каковые высчитывались как среднее арифметическое.

К примеру, в случае если корабль на протяжении плавания был поврежден, и команде приходилось выбрасывать за борт кое-какие товары, дабы сохранить вес судна, инвесторы несли денежные утраты, эквивалентные сумме их инвестиции — эти утраты вычислялись так же, как среднее арифметическое. Так неспешно значения среднего (average) и среднего арифметического сближались.

  • Как морское страхование содействовало процветанию Древнего Рима

Медианное значение

Сейчас среднее значение либо среднее арифметическое употребляются как главный метод для выбора репрезентативного значения множества измерений. Как же это случилось? Из-за чего эта роль не была отведена медианному значению?

Френсис Гальтон был чемпионом медианного значения

Термин «медианное значение» (median) — средний член в ряде чисел, разделяющий данный последовательность наполовину — показался приблизительно одновременно с этим, что и среднее арифметическое. В 1599-ом году математик Эдуард Райт, трудившийся над проблемой обычного отклонения в компасе, в первый раз внес предложение применять медианное значение.

«Допустим, множество лучников стреляют в некую мишень. Цель потом убирают. Как именно возможно определить, где была цель? Необходимо отыскать среднее место между всеми стрелами.

Подобно, среди множества результатов наблюдений ближе всего к истине будет то, которое находится посередине».

Медианное значение обширно употреблялось в девятнадцатом столетии, став необходимой частью любого анализа данных в то время. Им кроме этого пользовался и Френсис Гальтон, выдающийся аналитик девятнадцатого века. В истории о взвешивании быка, поведанной сначала данной статьи, Гальтон изначально применял медианное значение как воображающее вывод толпы.

Множество аналитиков, включая Гальтона, предпочитали медианное значение, потому, что его легче вычислить для маленьких комплектов данных.

Однако, медианное значение ни при каких обстоятельствах не было более популярным, чем среднее. Вероятнее, это случилось из-за особенных статистических особенностей, свойственных среднему значению, и его отношения к обычному распределению.

  • Кто изобрел понятие о статистической регрессии?

Сообщение нормального распределения и среднего значения

В то время, когда мы проводим множество измерений, их результаты, как говорят статистики, «нормально распределены». Это значит, что в случае если эти сведенья нанести на график, то точки на нем будут изображать что-то похожее на колокол. В случае если их соединить, окажется «колоколообразная» кривая.

Обычному распределению соответствуют многие статистику, к примеру, рост людей, показатель интеллекта, и показатель самой большой годовой температуры.

В то время, когда эти нормально распределены, среднее значение будет весьма родным к высшей точке на колоколообразной кривой, и очень много измерений будет родным к среднему значению. Существует кроме того формула, предвещающая, как много результатов измерений будут пребывать на некоем расстоянии от среднего значения.

Так, вычисление среднего значения дает исследователям большое количество дополнительной информации.

Сообщение среднего значения со стандартным отклонением дает ему громадное преимущество, поскольку у медианного значения таковой связи нет. Эта сообщение — неотъемлемая часть анализа экспериментальных данных и статистической обработки информации. Как раз исходя из этого среднее значение стало ядром всех наук и статистики, надеющихся в собственных заключениях на множественные эти.

Преимущество среднего значения кроме этого связано с тем, что оно легко вычисляется компьютерами. Не смотря на то, что медианное значение для маленькой группы данных достаточно легко вычислить самостоятельно, все же существенно проще разработать компьютерную программу, которая обнаружила бы среднее значение. Если вы пользуетесь Микрософт Excel, то точно понимаете, что медианную функцию не так, как функцию среднего значения.

В итоге, благодаря громадному простоте использования и научному значению среднее значение стало основной репрезентативной величиной. Однако, данный вариант далеко не всегда является самым лучшим.

  • Что такое статистическая значимость при оптимизации конверсии?

Преимущества медианного значения

Во многих случаях, в то время, когда мы желаем вычислить центральное значение распределения, медианное значение есть лучшим показателем. Так происходит вследствие того что среднее значение во многом определяется крайними результатами измерений.

Многие аналитики уверены в том, что бездумное применение среднего значения отрицательно отражается на отечественном понимании количественной информации. Люди наблюдают на среднее значение и считаюм, что это «норма». Но в действительности оно возможно выяснено каким-нибудь одним очень сильно выдающимся из однородного последовательности участником.

Представьте себе аналитика, желающего определить репрезентативное значение для цены пяти домов. Четыре дома стоят $100,000, а пятый — $900,000. Среднее значение, так, будет равняться $200,000, а медианное — $100,000.

В этом, как и во многих вторых случаях, медианное значение дает лучшее познание того, что возможно назвать «стандартом».

Осознавая, как очень сильно крайние значения смогут сказаться на среднем, для отражения трансформаций в домашних доходах США употребляется медианное значение.

Медианные показатель кроме этого менее чувствителен к «нечистым» данным, с которыми сейчас имеют дело аналитики. Многие статистики и аналитики собирают данные, опрашивая людей в сети. В случае если пользователь случайно добавит в ответ лишний ноль, что перевоплотит 100 в 1000, то эта неточность намного посильнее скажется на среднем значении, чем на медианном.

Среднее либо медианное?

Выбор между медианным и средним значением имеет далеко идущие последствия — от отечественного понимания влияния лекарств на здоровье до знаний относительно того, какой домашний бюджет возможно назвать стандартным.

Потому, что анализ и сбор данных все больше определяет то, как мы понимаем мир, растет и значение применяемых нами размеров. В совершенном мире аналитики применяли бы и среднее, и медианное значение для графического выражения данных.

Но мы живем в условиях ограниченного времени и внимания. Из-за этих ограничений довольно часто нам нужно выбрать только что-то одно. И во многих случаях предпочтительней как раз медианное значение.

Высоких вам конверсий!

По данным: priceonomics.comimage source jerrygodwinfoto

Случайные статьи:

1002.Теорема о среднем значении (MVT)


Подборка похожих статей:

riasevastopol