Статистическа значимост: дефиниция, концепция, значимост, регресионни уравнения и тестване на хипотези

Съдържание:

Статистическа значимост: дефиниция, концепция, значимост, регресионни уравнения и тестване на хипотези
Статистическа значимост: дефиниция, концепция, значимост, регресионни уравнения и тестване на хипотези

Видео: Статистическа значимост: дефиниция, концепция, значимост, регресионни уравнения и тестване на хипотези

Видео: Статистическа значимост: дефиниция, концепция, значимост, регресионни уравнения и тестване на хипотези
Видео: Die 5 Biologischen Naturgesetze - Die Dokumentation 2024, Може
Anonim

Статистиката отдавна е неразделна част от живота. Хората се сблъскват с това навсякъде. Въз основа на статистически данни се правят заключения за това къде и какви заболявания са често срещани, какво е по-търсено в определен регион или сред определен сегмент от населението. Дори изграждането на политически програми на кандидатите за държавни органи се базира на статистически данни. Те се използват и от търговските вериги при закупуване на стоки и производителите се ръководят от тези данни в своите предложения.

Статистиката играе важна роля в живота на обществото и засяга всеки негов отделен член, дори и в малки неща. Например, ако според статистиката повечето хора предпочитат тъмните цветове в дрехите в определен град или регион, тогава намирането на ярко жълт дъждобран с флорален принт в местните магазини ще бъде изключително трудно. Но какви количестватези данни се сумират, за да имат такова въздействие? Например, какво е „статистически значимо“? Какво точно се има предвид под това определение?

Какво е това?

Статистиката като наука се състои от комбинация от различни количества и понятия. Едно от тях е понятието "статистическа значимост". Това е името на стойността на променливите, вероятността за поява на други индикатори в които е незначителна.

Изчисляване на статистически показатели
Изчисляване на статистически показатели

Например, 9 от 10 души обуват гумени обувки на краката си по време на сутрешна разходка за гъби в есенната гора след дъждовна нощ. Вероятността в даден момент 8 от тях да облекат платнени мокасини е незначителна. Така, в този конкретен пример, числото 9 е това, което се нарича „статистическа значимост“.

Съответно, ако доразвием дадения практически пример, магазините за обувки купуват гумени ботуши до края на летния сезон в по-големи количества, отколкото през друго време на годината. По този начин величината на статистическата стойност оказва влияние върху обикновения живот.

Разбира се, при сложни изчисления, да речем, когато се прогнозира разпространението на вируси, се вземат предвид голям брой променливи. Но самата същност на определянето на значим показател от статистически данни е подобна, независимо от сложността на изчисленията и броя на променливите стойности.

Как се изчислява?

Използва се при изчисляване на стойността на индикатора за "статистическа значимост" на уравнението. Тоест може да се твърди, че в този случай всичко се решава от математиката. Най-простият вариант за изчисление е верига от математически операции, в която участват следните параметри:

  • два вида резултати, получени от проучвания или изследване на обективни данни, като например сумата на покупките, означена с a и b;
  • индикатор за размера на извадката за двете групи – n;
  • стойност на комбинирания дял на извадката - p;
  • стандартна грешка - SE.

Следващата стъпка е да се определи общият резултат от теста - t, неговата стойност се сравнява с числото 1,96. 1,96 е средната стойност, предаваща диапазон от 95%, според функцията за t-разпределение на Студент.

Формула за просто изчисление
Формула за просто изчисление

Често възниква въпросът каква е разликата между стойностите на n и p. Този нюанс е лесно да се изясни с пример. Да кажем, че се изчислява статистическата значимост на лоялността към всеки продукт или марка на мъже и жени.

В този случай буквите ще бъдат последвани от следното:

  • n - брой респонденти;
  • p - брой доволни от продукта.

Броят на интервюираните жени в този случай ще бъде обозначен като n1. Съответно мъжете - n2. Същата стойност ще имат числата "1" и "2" на символа p.

Сравняването на резултата от теста със средната стойност на електронните таблици на ученика става това, което се нарича "статистическа значимост".

Какво се има предвид под проверка?

Резултатите от всяко математическо изчисление винаги могат да бъдат проверени, това се преподава на децата в началното училище. Логично е да се предположиче тъй като статистическите данни се определят с помощта на веригата от изчисления, те се проверяват.

Въпреки това, тестването за статистическа значимост не е просто математика. Статистиката се занимава с голям брой променливи и различни вероятности, които далеч не винаги могат да бъдат изчислени. Тоест, ако се върнем към примера с гумени обувки в началото на статията, тогава логическата конструкция на статистически данни, на които ще разчитат купувачите на стоки за магазини, може да бъде нарушена от сухо и горещо време, което не е типично за есента. В резултат на това явление броят на хората, които купуват гумени ботуши, ще намалее и търговските обекти ще претърпят загуби. Разбира се, математическата формула не е в състояние да предвиди метеорологична аномалия. Този момент се нарича „грешка“.

Инструменти за визуализиране на статистически данни
Инструменти за визуализиране на статистически данни

Това е само вероятността от такива грешки и взема предвид проверката на нивото на изчислената значимост. Той взема предвид както изчислените показатели, така и приетите нива на значимост, както и количествата, условно наречени хипотези.

Какво е нивото на значимост?

Понятието "ниво" е включено в основните критерии за статистическа значимост. Използва се в приложната и практическа статистика. Това е вид стойност, която отчита вероятността от възможни отклонения или грешки.

Нивото се основава на идентифицирането на разликите в готови проби, позволява да се установи тяхната значимост или, обратно, случайност. Това понятие има не само цифрови значения, но и техните особени интерпретации. Те обясняваткак трябва да разберете стойността и самото ниво се определя чрез сравняване на резултата със средния индекс, това разкрива степента на надеждност на разликите.

Обсъждане на статистиката
Обсъждане на статистиката

По този начин можем да си представим понятието ниво просто - то е индикатор за приемлива, вероятна грешка или грешка в изводите, направени от получените статистически данни.

Какви нива на значимост се използват?

Статистическата значимост на коефициентите на вероятността за грешка на практика се основава на три основни нива.

Първото ниво е прагът, при който стойността е 5%. Тоест, вероятността от грешка не надвишава нивото на значимост от 5%. Това означава, че увереността в безупречността и непогрешимостта на изводите, направени въз основа на данни от статистически изследвания, е 95%.

Второто ниво е прагът от 1%. Съответно тази цифра означава, че човек може да се ръководи от данните, получени по време на статистически изчисления с 99% увереност.

Трето ниво - 0,1%. С тази стойност вероятността от грешка е равна на част от процента, тоест грешките са практически елиминирани.

Какво е хипотеза в статистиката?

Грешките като концепция са разделени на две области, отнасящи се до приемането или отхвърлянето на нулевата хипотеза. Хипотезата е понятие, зад което според дефиницията се крие набор от резултати от проучването, други данни или твърдения. Тоест, описание на разпределението на вероятностите за нещо, свързано с предмета на статистическото счетоводство.

статистическа значимост на регресията
статистическа значимост на регресията

В простите изчисления има две хипотези - нулева и алтернативна. Разликата между тях е, че нулевата хипотеза се основава на идеята, че няма фундаментални разлики между извадките, участващи в определянето на статистическата значимост, а алтернативната е напълно противоположна на нея. Тоест алтернативната хипотеза се основава на наличието на значителна разлика в тези проби.

Какви са грешките?

Грешките като понятие в статистиката са правопропорционални на приемането на тази или онази хипотеза за вярна. Те могат да бъдат разделени в две посоки или типа:

  • първият тип се дължи на приемането на нулевата хипотеза, която се оказа неправилна;
  • втора - причинена от следване на алтернативата.
Преглед на статистически графики
Преглед на статистически графики

Първият тип грешка се нарича фалшиво положителен и е доста често срещан във всички области, където се използва статистика. Съответно грешката от втория тип се нарича фалшиво отрицателна.

Защо се нуждаем от регресия в статистиката?

Статистическата значимост на регресията е, че с нейна помощ е възможно да се установи доколко моделът на различните зависимости, изчислен на базата на данните, отговаря на реалността; ви позволява да идентифицирате достатъчността или липсата на фактори за отчитане и заключения.

Стойността на регресията се определя чрез сравняване на резултатите с данните, изброени в таблиците на Фишер. Или с помощта на анализ на дисперсията. Индикаторите за регресия са важни когасложни статистически изследвания и изчисления, включващи голям брой променливи, произволни данни и вероятни промени.

Препоръчано: