Daugiakolinisiškumas yra dažnas ekonometrinės analizės iššūkis, ypač modeliuose, kuriuose naudojami keli aiškinamieji kintamieji. Tai atsitinka, kai du ar daugiau nepriklausomų kintamųjų regresijos modelyje labai koreliuoja, todėl sunku nustatyti jų individualų poveikį priklausomam kintamajam. Ši koreliacija tarp prognozių gali lemti nepatikimus koeficientų įverčius ir galiausiai pakenkti ekonometrinio modelio pagrįstumui. Šiame įraše mes gilinsimės į:

  • Daugiakolineariškumo apibrėžimas ir poveikis
  • Metodai, kaip aptikti jūsų modelių daugiakolineariškumą
  • Metodai sprendžiant daugiakolineariškumą siekiant tikslių rezultatų
  • Praktinis pavyzdys naudojant ekonominius duomenis

Daugiakolineariškumo apibrėžimas

Daugelyje regresijos modelių pagrindinė prielaida yra ta, kad nepriklausomi kintamieji nėra visiškai koreliuojami vienas su kitu. Tačiau daugiakolineariškumas atsiranda, kai ši prielaida pažeidžiama – kai du ar daugiau nepriklausomų kintamųjų yra stipriai koreliuojami. Ši tarpusavio priklausomybė gali iškreipti vertinimo procesą, todėl gali būti sudėtinga atskirti kiekvieno aiškinamojo kintamojo individualų poveikį priklausomam kintamajam.

Daugiakolineariškumą galima suskirstyti į du tipus:

  1. Tobulas daugiakolineariškumas

    Taip atsitinka, kai aiškinamasis kintamasis yra tiksli tiesinė kito funkcija. Pavyzdžiui, jei \( X_2 = 5 + 2,5 X_1 \), yra tobulas tiesinis ryšys tarp \( X_1 \) ir \( X_2 \). Dėl tokių scenarijų regresijos modelis tampa neišsprendžiamas, nes tampa neįmanoma atskirti unikalių kiekvieno kintamojo indėlių.

  2. Netobulas (arba artimas) daugiakolineariškumas

    Tai dažniau pasitaiko, kai ryšys tarp dviejų ar daugiau nepriklausomų kintamųjų yra stiprus, bet netikslus. Jis dažnai atsiranda dėl nedidelio klaidos termino arba nedidelių kintamųjų ryšio pokyčių.

Daugiakolineariškumo pavyzdys

Norėdami geriau suprasti sąvoką, įsivaizduokite regresijos modelį, įvertinantį pajamų ir likvidaus turto įtaką namų ūkių vartojimui. Kadangi pajamos ir likvidus turtas yra glaudžiai susiję – didesnes pajamas gaunantys namų ūkiai paprastai turi daugiau turto, tampa sunku nustatyti, kuris kintamasis lemia vartojimo pokyčius. Šis pajamų ir likvidaus turto sutapimas įveda į modelį daugiakolineariškumą, todėl atsiranda padidintų standartinių klaidų ir nestabilių koeficientų įvertinimų.

Daugiakolineariškumo įtaka ekonometriniams modeliams

Daugiakolinisiškumas regresijos modelius veikia įvairiais būdais, darydamas įtaką tiek įverčių patikimumui, tiek iš jų daromoms išvadoms:

Išpūstos standartinės klaidos

Daugiakolinisiškumas padidina apskaičiuotų koeficientų dispersiją, todėl atsiranda didesnės standartinės paklaidos. Dėl to sunku nustatyti, kurie kintamieji yra statistiškai reikšmingi, nes net teoriškai svarbūs prognozuotojai gali pasirodyti nereikšmingi.

Nepatikimi t testai

Kai išpūstos standartinės klaidos, tai kenkia t testų patikimumui. Dėl to kintamieji, kurie turėtų būti statistiškai reikšmingi, gali pasirodyti kitaip, o tai turi įtakos rezultatų aiškinimui.

Nestabilūs koeficientai

Dėl daugiakolineariškumo koeficientai gali smarkiai pasikeisti įtraukiant arba neįtraukiant kitų kintamųjų. Šis nestabilumas reiškia, kad net ir nedideli duomenų rinkinio pakeitimai gali sukelti didelių apskaičiuotų parametrų pokyčių, todėl daromos nenuoseklios išvados.

Klaidinanti modelio išvada

Dėl daugiakolineariškumo gali būti neteisingai interpretuojamas ryšys tarp kintamųjų, nes modelis tampa jautresnis nedideliems duomenų pokyčiams. Tai gali pakenkti bendram regresinės analizės patikimumui.

    Atliekant ekonometrinę analizę, daugiakolineariškumo aptikimas ir sprendimas yra labai svarbus siekiant užtikrinti, kad modelio įverčiai būtų prasmingi ir patikimi.

    Daugiakolineariškumo aptikimas

    Daugiakolineariškumui nustatyti gali būti naudojami keli metodai, pradedant nuo pagrindinių vaizdinių priemonių iki pažangių statistinių testų:

    Porinės koreliacijos koeficientai

    Paprastas daugiakolineariškumo nustatymo metodas yra porinės koreliacijos tarp aiškinamųjų kintamųjų tyrimas. Aukšti koreliacijos koeficientai (arti +1 arba -1) rodo stiprų tiesinį ryšį, o tai rodo galimą daugiakolineariškumą. Šis metodas geriausiai veikia modeliuose su keliais prognozėmis.

    1 lentelė: koreliacijos matrica, rodanti dideles koreliacijas tarp aiškinamųjų kintamųjų.

    1 lentelė. Koreliacijos matrica, rodanti aukštas koreliacijas, vizualizuota naudojant šilumos žemėlapį. Matrica rodo porų koreliacijos koeficientus tarp aiškinamųjų kintamųjų. Kaip matyti iš matricos, yra didelė teigiama koreliacija tarp kintamųjų A ir kintamųjų B (0,99), o tai rodo galimą daugiakolineariškumą tarp šių kintamųjų. Tarp kitų kintamųjų porų pastebimos mažesnės koreliacijos, o tai rodo silpnesnius ryšius. Ši matrica naudinga regresijos modelių daugiakolineariškumui nustatyti. ,

    Dispersijos infliacijos koeficientas (VIF)

    Dispersijos infliacijos faktorius (VIF) yra plačiai naudojamas matas regresijos modelio daugiakolineariškumo laipsniui įvertinti. Jis kiekybiškai įvertina, kiek regresijos koeficiento dispersija padidėja dėl daugiakolineariškumo. VIF formulė yra tokia:

    \(VIF_i = \frac{1}{1 – R_i^2} \)

    • \(R_i^2 \) yra \(R^2 \) reikšmė, gauta regresuojant \(i \)-ąjį aiškinamąjį kintamąjį visuose kituose modelio prognozuotojuose.

    Didesnis nei 10 VIF paprastai laikomas didelio daugiakolineariškumo požymiu, nors kai kuriose srityse slenksčiai gali skirtis.

    Savosios vertės metodas

    Taikant savųjų reikšmių metodą, apskaičiuojamos aiškinamųjų kintamųjų koreliacijos matricos savosios reikšmės. Mažos savosios reikšmės rodo galimą daugiakolineariškumą. Sąlygos skaičius, apskaičiuojamas kaip didžiausios ir mažiausios savosios reikšmės santykis, yra dar vienas rodiklis – vertės, viršijančios 30, dažnai rodo rimtą daugiakolineariškumą.

    Daugiakolineariškumo sprendimas

    Nustačius daugiakolineariškumą, jo poveikiui sušvelninti galima taikyti keletą strategijų:

    Vieno iš kolinearinių kintamųjų pašalinimas

    Kai du kintamieji labai koreliuoja, vieno iš jų pašalinimas gali sumažinti daugiakolineariškumą. Šis metodas yra efektyviausias, kai pašalintas kintamasis reikšmingai neprisideda prie modelio aiškinamosios galios.

    Kintamųjų derinimas

    Jei kintamieji matuoja panašius ekonominius reiškinius, juos galima sujungti į vieną indeksą. Pavyzdžiui, užuot įtraukę pajamas ir likvidų turtą atskirai, galima naudoti sudėtinį turto matą. Šis metodas padeda sumažinti modelio perteklių.

    Pagrindinių komponentų analizė (PCA)

    Pagrindinių komponentų analizė (PCA) yra statistinis metodas, paverčiantis koreliuojamų kintamųjų rinkinį į mažesnį nesusijusių komponentų rinkinį. Naudodamas šiuos komponentus kaip aiškinamuosius kintamuosius, PCA efektyviai sumažina modelio matmenis ir pašalina daugiakolineariškumą.

    Ridžo regresija

    Ridge Regression yra reguliarumo metodas, padedantis stabilizuoti regresijos koeficientus, kai yra daugiakolineariškumas. Tai įveda baudos parametrą \( \lambda \), kuris sumažina koeficientus iki nulio, sumažindamas jų dispersiją ir sušvelnindamas daugiakolineariškumą: \( \hat{\beta}_{ridge} = (X’X + \lambda I)^{ -1} X’Y \)

    • \(\lambda \) yra reguliavimo parametras.

    Ridge regresija yra ypač naudinga didelės apimties duomenims, kai tradiciniai metodai gali būti sudėtingi.

    Praktinis ekonominių duomenų daugiakolineariškumo pavyzdys

    Apsvarstykite pavyzdį, kuriame analizuojamas BVP augimo, infliacijos ir nedarbo poveikis vartotojų išlaidoms. Atsižvelgiant į atvirkštinį ryšį tarp infliacijos ir nedarbo (kaip aprašyta Phillipso kreivėje), tikėtinas daugiakolineariškumas.

    Daugiakolineariškumo aptikimas

    Apskaičiavus koreliacijos matricą paaiškėja, kad infliacija ir nedarbas koreliuoja 0,85, o tai rodo daugiakolineariškumą. Taip pat apskaičiuojame VIF reikšmes ir nustatome, kad abiejų kintamųjų VIF reikšmės viršija 10, o tai dar labiau patvirtina problemą.

    Daugiakolineariškumo sprendimas

    Norėdami tai išspręsti, naudojame pagrindinio komponento analizę (PCA), kad sukurtume naują kintamąjį, fiksuojantį bendrą infliacijos ir nedarbo poveikį vartotojų išlaidoms. Šis naujas kintamasis sumažina daugiakolineariškumą ir stabilizuoja regresijos koeficientus, todėl modelis yra patikimesnis.

      Išvada

      Daugiakolinisiškumas yra dažnas ekonometrinės analizės iššūkis, ypač modeliuose su keliais aiškinamaisiais kintamaisiais. Tai gali užgožti tikrąjį ryšį tarp kintamųjų, todėl gali atsirasti nepatikimų įverčių ir nestabilių modelių. Tačiau taikydami tinkamus aptikimo metodus, tokius kaip VIF ir koreliacinės matricos, ir tokius sprendimus kaip PCA, keteros regresiją arba supaprastindami modelį, ekonometrikai gali sušvelninti neigiamą jo poveikį. Daugiakolinisiškumas yra labai svarbus siekiant užtikrinti ekonometrinių modelių tikslumą ir aiškinamumą, kad būtų galima daryti patikimesnes išvadas ir priimti duomenimis pagrįstus sprendimus.

      Kitame įraše papasakosime, kaip pasirinkti geriausią ekonometrinį modelį jūsų duomenims.

      Ačiū, kad skaitėte! Jei tai buvo naudinga, pasidalykite ja su draugais ir paskleiskite žinias.
      Laimingo mokymosi su MASEconomics



Source link

By admin

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -