семестр 2 / Коэффициент детерминации
.htmlКоэффициент детерминации (Coefficient of determination) · Loginom Wiki <meta name="keywords" content=", , Коэффициент смешанной корреляции, Коэффициент R-квадрат" /> (function(w,d,s,l,i){w[l]=w[l]||[];w[l].push({'gtm.start': new Date().getTime(),event:'gtm.js'});var f=d.getElementsByTagName(s)[0], j=d.createElement(s),dl=l!='dataLayer'?'&l='+l:'';j.async=true;j.src= 'https://www.googletagmanager.com/gtm.js?id='+i+dl;f.parentNode.insertBefore(j,f); })(window,document,'script','dataLayer','GTM-N3BR64K'); Вики Закрыть Главная
Бизнес-задачи
Алгоритмы
Визуализация
Источники данных
Метрики
Документация Демопримеры Коэффициент детерминации (Coefficient of determination) Синонимы: Коэффициент смешанной корреляции, Коэффициент R-квадрат
Разделы: Метрики
Loginom: Статистика (визуализатор)
Статистический показатель, отражающий объясняющую способность регрессии f:X→Y и определяемый как доля дисперсии зависимой переменной, объясненная регрессионной моделью с данным набором независимых переменных. Обычно определяется как единица минус доля необъясненной дисперсии, т.е:
R2=1−∑i(yi−ˆy)2∑i(yi−¯y)2=1−SSESST,(1)
где:
SSE=∑i(yi−ˆyi)2 — сумма квадратов остатков (ошибок) регрессии (sum square of errors),
SST=∑i(yi−¯¯¯yi)2 — полная сумма квадратов (sum square total), т.е. сумма квадратов отклонений точек данных от среднего значения,
Xn=(xi,yi)ni=1 — набор данных из n наблюдений,
yi∈Y, ¯¯¯yi=∑iyin,
ˆyi=f(xi).
Коэффициент детерминации является статистической мерой согласия, с помощью которой можно определить, насколько модель линейной регрессии соответствует данным, на которых она построена.
Коэффициент детерминации изменяется в диапазоне от −∞ до 1. Если он равен 1, это соответствует идеальной модели, когда все точки наблюдений лежат точно на линии регрессии, т.е. сумма квадратов их отклонений равна 0. Если коэффициент детерминации равен 0, это означает, что связь между переменными регрессионной модели отсутствует, и вместо нее для оценки значения выходной переменной можно использовать простое среднее ее наблюдаемых значений.
На практике, если коэффициент детерминации близок к 1, это указывает на то, что модель работает очень хорошо (имеет высокую значимость), а если к 0, то это означает низкую значимость модели, когда входная переменная плохо «объясняет» поведение выходной, т.е. линейная зависимость между ними отсутствует. Очевидно, что такая модель будет иметь низкую эффективность.
Кроме того, бывают случаи, когда коэффициент детерминации принимает отрицательные значения (обычно небольшие). Это случается, когда ошибка модели простого среднего становится меньше ошибки регрессионной модели. Таким образом, добавление в модель с константой некоторой переменной только ухудшает ее.
Иногда коэффициент детерминации вводят как отношение:
R2=∑i(ˆyi−¯yi)2∑i(yi−¯yi)2,
где SSR=∑i(ˆyi−¯¯¯yi)2 — сумма квадратов регрессии (sum square of regression). Хотя данное определение является более простым, оно может использоваться только для регрессии с константой (если свободный член в уравнении регрессии не равен нулю), когда знаменатель не обращается в 0. В противном случае необходимо использовать общее соотношение (1).
Недостатком коэффициента детерминации при его применении в качестве меры значимости регрессионных моделей заключается в том, что его значение возрастает (по крайней мере не уменьшается) при добавлении в модель новых зависимых переменных, даже если они никак не связаны с независимой. Это делает сравнение регрессионных моделей с разными наборами предикторов с использованием коэффициента детерминации некорректным.
Поэтому для сравнения моделей используют скорректированный коэффициент детерминации, при вычислении которого вводится штраф за дополнительно вводимые в модель переменные. Скорректированный (adjasted) коэффициент детерминации вычисляется по формуле:
R2adj=1−∑i(yi−ˆy)2(n−k)∑i(yi−¯y)2(n−1)=1−SSE(n−k)SST(n−1),
где k — число независимых переменных модели, n — количество наблюдений в наборе данных.
Очевидно, что R2adj≤R2. При этом скорректированный коэффициент детерминации может принимать значения в том же диапазоне, что и обычный от −∞ до 1.
var gitbook = gitbook || []; gitbook.push(function() { gitbook.page.hasChanged({"page":{"description":"Отражает объясняющую способность регрессии. Равен отношению суммы квадратов регрессии к общей вариации. Является статистической мерой согласия. Позволяет определить, насколько уравнение регрессии соответствует реальным данным.","search":{"keywords":["Coefficient","of","determination"]},"title":"Коэффициент детерминации (Coefficient of determination)","level":"1.6.10.37","depth":3,"next":{"title":"Коэффициент детерминации МакФаддена (Coefficient of determination McFadden's)","level":"1.6.10.38","depth":3,"path":"articles/coefficient-mc-fadden.md","ref":"./articles/coefficient-mc-fadden.md","articles":[]},"previous":{"title":"Коэффициент вариации (Variation coefficient)","level":"1.6.10.36","depth":3,"path":"articles/variation-coefficient.md","ref":"./articles/variation-coefficient.md","articles":[]},"dir":"ltr"},"config":{"plugins":["-sharing","-search","-lunr","-theme-default","-fontsettings","anchors@0.7.1","anchor-translit@0.0.2","mathjax-commonhtml@0.0.6","styled-blockquotes-ex@1.2.0","metadata-processing@1.0.0","introductory-text@1.0.0","alphabet-tiles@~1.1.3","theme-loginom-website@~1.7.0","sitemap"],"buttons":{},"root":"../data","styles":{"website":"styles/website.css","pdf":"styles/pdf.css","ebook":"styles/ebook.css","print":"styles/print.css"},"pluginsConfig":{"anchor-translit":{},"mathjax-commonhtml":{"defaultScaling":true},"alphabet-tiles":{"alphabetIndexTitle":"Алфавитный указатель"},"metadata-processing":{"types":{"pages":null,"synonyms":{"title":"Синонимы"},"categories":{"title":"Разделы","pages":{"business-tasks":"Бизнес-задачи","algorithms":"Алгоритмы","visualization":"Визуализация","data-sources":"Источники данных","metrics":"Метрики"}},"loginom":{"title":"Loginom"},"solutions":{"title":"Решения"}}},"theme-loginom-website":{"buttons":{},"styles":{"website":"styles/website.css","pdf":"styles/pdf.css","ebook":"styles/ebook.css","print":"styles/print.css"},"links_related":{"Документация":{"url":"https://help.loginom.ru/","num":"3"},"Демопримеры":{"url":"https://samples.loginom.ru/","num":"5"}},"showLevel":false,"js":{"website":"js/website.js"},"resource_type":"Вики","banner":null,"rootUrl":"/","showNavigationButtons":false,"embedded_mode":false,"alphabet_tiles":true,"local_search":false},"introductory-text":{},"highlight":{},"sitemap":{"hostname":"https://wiki.loginom.ru/"},"styled-blockquotes-ex":{},"anchors":{}},"links_related":{"Документация":{"url":"https://help.loginom.ru/","num":"3"},"Демопримеры":{"url":"https://samples.loginom.ru/","num":"5"}},"alphabet_index":{"title":"Алфавитный указатель","link":"./letter-ru-a.md"},"showLevel":false,"js":{"website":"js/website.js"},"theme":"default","resource_type":"Вики","banner":null,"rootUrl":"/","showNavigationButtons":false,"pdf":{"pageNumbers":true,"fontSize":12,"fontFamily":"Arial","paperSize":"a4","chapterMark":"pagebreak","pageBreaksBefore":"/","margin":{"right":62,"left":62,"top":56,"bottom":56}},"structure":{"langs":"LANGS.md","readme":"README.md","glossary":"GLOSSARY.md","summary":"SUMMARY.md"},"variables":{},"embedded_mode":false,"title":"Loginom Wiki","language":"ru","gitbook":"*","local_search":false},"file":{"path":"articles/coefficient-of-determination.md","mtime":"2024-05-04T15:57:26.000Z","type":"markdown"},"gitbook":{"version":"3.2.3","time":"2024-05-04T16:00:07.444Z"},"basePath":"..","book":{"language":""}}); }); (function(m,e,t,r,i,k,a){m[i]=m[i]||function(){(m[i].a=m[i].a||[]).push(arguments)}; m[i].l=1*new Date();k=e.createElement(t),a=e.getElementsByTagName(t)[0],k.async=1,k.src=r,a.parentNode.insertBefore(k,a)}) (window, document, "script", "https://mc.yandex.ru/metrika/tag.js", "ym"); ym(49236556, "init", { clickmap:true, trackLinks:true, accurateTrackBounce:true }); ym(72997045, "init", { clickmap:true, trackLinks:true, accurateTrackBounce:true, webvisor:true }); window.addEventListener('gitbookContentChanged', function(event) { var currentUrl = window.location.href, refererUrl = event.detail.referer; ym(49236556, "hit", currentUrl, { referer: refererUrl }); ym(72997045, "hit", currentUrl, { referer: refererUrl }); });
