Eno od orodij za reševanje gospodarskih problemov je grozdna analiza. Uporaba tega, grozdov in drugih predmetov v nizu podatkov se razvrsti v skupine. Ta metoda se lahko uporablja v Excelu. Poglejmo, kako se to izvaja v praksi.

Uporaba analize grozdov

S pomočjo analize grozdov je mogoče na podlagi tega, kar se preiskuje, vzorčiti. Njena glavna naloga je razdeliti večrazsežnostno matriko v homogene skupine. Kot merilo združevanja se uporabi korelacijski koeficient par ali evklidska razdalja med predmeti glede na določen parameter. Najbližje vrednosti so združene.

Čeprav se tovrstna analiza najpogosteje uporablja v gospodarstvu, se lahko uporablja tudi v biologiji (za klasifikacijo živali), psihologiji, medicini in na mnogih drugih področjih človeške dejavnosti. Analiza grozdov lahko uporabite s standardnim orodjem Excel v ta namen.

Primer uporabe

Imamo pet predmetov, za katere so značilni preučevani parametri - x in y .

  1. Za te vrednosti uporabimo formulo evklidske razdalje, ki se izračuna iz predloge:

    =КОРЕНЬ((x2-x1)^2+(y2-y1)^2)

  2. Izučeni predmeti v programu Microsoft Excel

  3. Ta vrednost se izračuna med vsakim od petih objektov. Rezultati izračuna se nahajajo v matriki razdalj.
  4. Matrika razdalj v Microsoft Excelu

  5. Poglejmo, med katerimi vrednostmi je najmanj razdalja. V našem primeru so to predmeti 1 in 2 . Razdalja med njima je 4,123106, kar je manj kot med drugimi elementi danega prebivalstva.
  6. Razdalja med predmeti je minimalna v programu Microsoft Excel

  7. Te podatke združimo v skupino in oblikujemo novo matriko, v kateri so vrednosti 1,2 ločen element. Pri sestavljanju matrike pustimo najmanjše vrednosti iz prejšnje tabele za kombinirani element. Spet vidimo, med katerimi elementi je razdalja minimalna. Tokrat je to 4 in 5 , pa tudi predmet 5 in skupina predmetov 1,2 . Razdalja je 6,708204.
  8. Razdalja med predmeti je minimalna v drugi matriki v programu Microsoft Excel

  9. V splošni skupini dodamo navedene elemente. Oblikujemo novo matrico na enakem principu kot v prejšnjem času. To pomeni, da iščemo najnižje vrednosti. Tako vidimo, da je naš nabor podatkov razdeljen na dva sklopa. V prvi skupini so najbližji elementi 1 , 2 , 4 , 5 . V drugi grozdi, v našem primeru, je zastopan le en element - 3 . Relativno je daleč od drugih predmetov. Razdalja med grozdi je 9,84.

Skupna vrednost v programu Microsoft Excel

S tem se zaključi postopek razdelitve zbiranja v skupine.

Kot lahko vidite, čeprav je analiza grozdov na splošno lahko zapleten postopek, ni tako težko razumeti nianse te metode. Glavna stvar je razumeti osnovni vzorec združevanja.