Вычислить сумму квадратов (SSE)

Автор: Charles Brown
Дата создания: 9 Февраль 2021
Дата обновления: 1 Июль 2024
Anonim
Сумма квадратов натуральных чисел
Видео: Сумма квадратов натуральных чисел

Содержание

Сумма квадратов или SSE - это предварительный статистический расчет, который приводит к различным значениям данных. Когда у вас есть набор значений данных, полезно иметь возможность определить, насколько тесно связаны эти значения. Вы должны организовать свои данные в таблице, а затем выполнить довольно простые вычисления. Как только вы найдете SSE для набора данных, вы сможете найти дисперсию и стандартное отклонение.

Шагать

Метод 1 из 3: вычислить SSE вручную

  1. Создайте таблицу из трех столбцов. Самый простой способ вычислить SSE - начать с таблицы из трех столбцов. Обозначьте три столбца Значение{ displaystyle { text {Значение}}}Заполните детали. Первый столбец содержит значения ваших измерений. Заполните столбец Значение{ displaystyle { text {Значение}}}Рассчитайте среднее значение. Прежде чем вы сможете рассчитать ошибку для каждого измерения, вы должны вычислить среднее значение всего набора данных.
    • Среднее значение набора данных - это сумма значений, деленная на количество значений в наборе. Это можно представить символически с помощью переменной μ{ displaystyle mu}Рассчитайте индивидуальные значения ошибок. Во втором столбце таблицы вы должны ввести значения ошибок для каждого значения данных. Ошибка - это разница между измерением и средним значением.
      • Для данного набора данных вычтите среднее значение 98,87 из каждого измеренного значения и заполните второй столбец результатами. Эти десять расчетов выглядят следующим образом:
        • 99,098,87=0,13{ displaystyle 99,0–98,87 = 0,13}Рассчитайте SSE. В третьем столбце таблицы найдите квадрат каждого из результирующих значений в среднем столбце. Они представляют собой квадраты отклонения от среднего для каждого измеренного значения данных.
          • Для каждого значения в среднем столбце используйте калькулятор, чтобы вычислить квадрат. Запишите результаты в третьем столбце следующим образом:
            • 0,132=0,0169{ displaystyle 0,13 ^ {2} = 0,0169}Сложите квадраты ошибок. Последний шаг - найти сумму значений в третьем столбце. Желаемый результат - SSE или сумма квадратов ошибок.
              • Для этого набора данных SSE рассчитывается путем сложения десяти значений в третьем столбце:
              • С.С.E=6,921{ displaystyle SSE = 6.921}Обозначьте столбцы таблицы. Вы создаете в Excel таблицу с тремя столбцами с теми же тремя заголовками, что и выше.
                • В ячейке A1 введите заголовок «Значение».
                • В поле B1 введите «Отклонение» в качестве заголовка.
                • В поле C1 введите "Отклонение в квадрате" в качестве заголовка.
              • Введите свои данные. В первом столбце вы должны ввести значения ваших измерений. Если набор небольшой, вы легко можете набрать его вручную. Если у вас большой набор данных, вам может потребоваться скопировать и вставить данные в столбец.
              • Определите среднее значение точек данных. В Excel есть функция, которая рассчитывает для вас среднее значение. В пустой ячейке под таблицей данных (неважно, какую ячейку вы выберете) введите следующее:
                • = Среднее (A2: ___)
                • Не вводите пустое место. Заполните это пространство именем ячейки вашей последней точки данных. Например, если у вас есть 100 точек данных, вы должны использовать функцию:
                  • = Среднее (A2: A101)
                  • Эта функция содержит данные из ячеек с A2 по A101, поскольку верхняя строка содержит заголовки столбцов.
                • Когда вы нажимаете Enter или щелкаете по другой ячейке в таблице, новая запрограммированная ячейка автоматически заполняется средним значением ваших данных.
              • Введите функцию измерения погрешности. В первой пустой ячейке столбца «Отклонение» введите функцию для вычисления разницы между каждой точкой данных и средним значением. Для этого используйте имя ячейки, в которой находится среднее значение. Предположим, вы сейчас использовали ячейку A104.
                • Функция вычисления ошибки, которую вы вводите в ячейку B2:
                  • = A2- 104 австралийских доллара. Знаки доллара нужны, чтобы запереть ящик A104 для любых расчетов.
              • Введите функцию квадратов ошибок. В третьем столбце вы можете указать Excel вычислить желаемый квадрат.
                • В ячейке C2 введите следующую функцию:
                  • = B2 ^ 2
              • Скопируйте функции, чтобы заполнить всю таблицу. После ввода функций в верхнюю ячейку каждого столбца, B2 и C2 соответственно, вам необходимо заполнить всю таблицу. Вы можете повторно ввести функцию в любой строке таблицы, но это займет слишком много времени. С помощью мыши выделите ячейки B2 и C2 вместе и, не отпуская кнопку мыши, перетащите их в нижнюю ячейку каждого столбца.
                • Предполагая, что у вас есть 100 точек данных в вашей таблице, перетащите указатель мыши на ячейки B101 и C101.
                • Когда вы отпускаете кнопку мыши, формулы копируются во все ячейки таблицы. Таблица должна автоматически заполняться рассчитанными значениями.
              • Найдите SSE. Столбец C вашей таблицы содержит все квадратичные значения ошибок. Последний шаг - позволить Excel вычислить сумму этих значений.
                • В ячейке под таблицей, в данном примере, вероятно, C102, введите следующую функцию:
                  • = Сумма (C2: C101)
                • Если вы нажмете Enter или щелкните в другой ячейке таблицы, вы получите значение SSE для ваших данных.

Метод 3 из 3. Свяжите SSE с другой статистикой

  1. Рассчитайте отклонение от SSE. Поиск SSE для набора данных обычно является строительным блоком для поиска других, более полезных значений. Первый из них - это дисперсия. Дисперсия - это мера того, насколько измеренные данные отклоняются от среднего. На самом деле это среднее значение квадратов отличий от среднего.
    • Поскольку SSE представляет собой сумму квадратов ошибок, вы можете найти среднее значение (то есть дисперсию), просто разделив на количество значений. Однако, если вы вычисляете дисперсию выборочного ряда, а не всей генеральной совокупности, вы делите дисперсию на (n-1), а не на n. Так:
      • Дисперсия = SSE / n, если вы рассчитываете дисперсию всей генеральной совокупности.
      • Дисперсия = SSE / (n-1) при вычислении дисперсии выборки данных.
    • Для задачи выборки температуры пациентов мы можем предположить, что 10 пациентов являются только выборкой. Следовательно, дисперсия рассчитывается следующим образом:
      • Дисперсия=SSE(п1){ displaystyle { text {Variance}} = { frac { text {SSE}} {(n-1)}}}Рассчитайте стандартное отклонение SSE. Стандартное отклонение - это часто используемое значение, которое указывает, насколько значения набора данных отклоняются от среднего. Стандартное отклонение - это квадратный корень из дисперсии. Помните, что дисперсия - это среднее значение квадрата ошибок измерения.
        • Поэтому после расчета SSE вы можете найти стандартное отклонение следующим образом:
          • Стандартное отклонение=SSEп1{ displaystyle { text {Стандартное отклонение}} = { sqrt { frac { text {SSE}} {n-1}}}}Используйте SSE для определения ковариации. В этой статье основное внимание уделяется наборам данных, которые измеряют только одно значение за раз. Однако во многих исследованиях вы можете сравнивать два разных значения. Например, вы хотите знать, как эти два значения соотносятся друг с другом, а не только со средним значением набора данных. Это значение ковариации.
            • Расчеты ковариации слишком подробны, чтобы описывать их здесь, за исключением того, что следует отметить, что вы будете использовать SSE для каждого типа данных, а затем сравнивать его. Для более подробного описания ковариации и соответствующих вычислений вы можете найти статьи по этой теме на wikiHow.
            • В качестве примера использования ковариации вы можете сравнить возраст пациентов в медицинском исследовании с эффективностью лекарства в снижении лихорадки. Затем у вас есть один набор данных о возрасте и второй набор данных о температурах. Затем вы найдете SSE для каждого набора данных, а оттуда - дисперсию, стандартные отклонения и ковариацию.