FormatieVoortgezet onderwijs en scholen

Naaste buur methode: voorbeeld van het werk

de naaste buur is de gemakkelijkste gegeven classificator is gebaseerd op de evaluatie van de overeenstemming van verschillende objecten.

Geanalyseerd object behoort tot de klasse waartoe zij behoren onderwerpen van oefensteekproef. Laat ons weten wat de naaste buur. Probeer om de ingewikkelde materie, voorbeelden van verschillende technieken te begrijpen.

hypothese werkwijze

naaste buur methode kan worden beschouwd als de meest gebruikte algoritme dat wordt gebruikt voor de indeling. Object ondergaan classificatie behoort tot de klasse ÿ_í, waaraan de dichtstbijzijnde object leren x_i monster.

Specificiteit van methoden naaste buren

k naaste buur werkwijze kan de nauwkeurigheid van classificatie te verbeteren. Geanalyseerd object behoort tot dezelfde klasse als het grootste deel van zijn buren, dat wil zeggen, k nabij het bezwaar van het geanalyseerde monster x_i. Bij het oplossen van problemen met de twee klassen van het aantal buren vreemd om een situatie van dubbelzinnigheid te vermijden zijn, als hetzelfde aantal buren zullen behoren tot verschillende klassen.

De techniek van gesuspendeerde buren

-Postgresql geanalyseerd methode tsvector naaste buren wordt gebruikt wanneer het aantal klassen ten minste drie, en je kunt niet een oneven nummer te gebruiken. Maar onduidelijkheid zelfs in deze gevallen. Vervolgens wordt de i-de buurman krijgt w_i gewicht, die afneemt met de buurman rang i. Het verwijst naar de klasse van het object, dat een maximaal totaal gewicht over naaste buren zal hebben.

De hypothese van compactheid

In het hart van al het bovenstaande methoden is de hypothese van compactheid. Het suggereert een verband tussen de maatregelen van de gelijkenis tussen objecten en hun behoren tot dezelfde klasse. In deze situatie is de grens tussen de verschillende soorten een eenvoudige vorm, en klassen van objecten in de ruimte compacte mobiele omgeving. Onder dergelijke gebieden in de wiskundige analyse meegenomen naar een gesloten Begrensdheid betekenen. Deze hypothese is niet gerelateerd aan de dagelijkse beleving van het woord.

De basisformule

Laten we eens kijken meer naaste buur. Indien de voorgestelde oefensteekproef type "object-reactie» X ^ m = \ {(x_1, y_1), \ dots, (x_m, y_m) \}; Als een veelheid voorwerpen met de afstandsfunctie \ rho (x, x ') definiëren, die wordt voorgesteld in de vorm van een adequaat model soortgelijkheid van voorwerpen door het verhogen van de waarde van de functie afneemt gelijkenis tussen objecten x, x'.

Voor elk object, zal u het bouwen van een oefensteekproef x_i objecten met toenemende afstanden tot u:

\ Rho (u, x_ {1; u}) \ leq \ rho (u, x_ {2; u}) \ eq \ cdots \ leq \ rho (u, x_ {m; u}),

waarbij x_ {i; u} karakteriseert het object leren monster dat ie buurman bronobject u. Een dergelijke notatie en gebruik te antwoorden op i-de buurman: y_ {i; u}. Als gevolg daarvan vinden we dat elk object u provoceert vernummering eigen monster.

Bepaling van het aantal k van de buren

naaste buur methode wanneer k = 1 kunnen geven een foutieve classificatie niet alleen voorwerpen-uitstoot, maar ook voor andere klassen die nabij is.

Als we k = m, zal het algoritme zo stabiel en zal verworden tot een constante waarde. Dat is de reden waarom de betrouwbaarheid is van belang om te voorkomen dat extreme indices k.

In de praktijk, als de optimale index k gebruikte criterium schuifregelaar.

screenings-uitstoot

De objecten van de studie zijn grotendeels ongelijk, maar onder hen zijn er degenen die de kenmerken van een klasse en worden aangeduid als normen. In de buurt van het onderwerp om het ideale model van de hoge waarschijnlijkheid van het behoren tot deze klasse.

Hoe rezultativen methode van de dichtstbijzijnde buren? Een voorbeeld is te zien aan de hand van perifere en niet-informatieve categorieën van objecten. Aangenomen wordt dichte omgeving van het object andere vertegenwoordigers van deze klasse. Als je ze verwijderen uit de indeling van de bemonstering van de kwaliteit zal niet lijden.

Stap in een bepaald aantal monsters kan ruis uitbarstingen dat "op de grond" van een klasse zijn. Het verwijderen van substantieel positief effect hebben op de kwaliteit van de classificatie.

Als het monster genomen uit de nietszeggende en om ruis te elimineren objecten, kunt u rekenen op een paar positieve resultaten op hetzelfde moment.

De eerste interpolatie methode van de naaste buur classificatie maakt het mogelijk om de kwaliteit te verbeteren, de hoeveelheid opgeslagen data te verminderen, de tijd van de classificatie, die wordt besteed aan de keuze van de volgende normen.

Het gebruik van ultra-grote steekproeven

naaste buur methode is gebaseerd op de reële opslag van leerobjecten. Tot zeer grote schaal monsters met behulp van een technisch probleem te maken. Het doel is niet alleen om een aanzienlijke hoeveelheid informatie op te slaan, maar ook in het minimum van tijd tot tijd om een object Uk tot de naaste buren te vinden.

Om te gaan met deze taak, worden twee methoden gehanteerd:

  • verdunde monster via een afvoerleiding niet-gegevensobjecten;
  • effectief gebruik van speciale datastructuur en codes voor onmiddellijke zoek naar de dichtstbijzijnde buren.

Regels van selectiemethoden

De bovenstaande indeling werd beschouwd. Naaste buur wordt gebruikt bij het oplossen van praktische problemen, die vooraf bekend is de afstandsfunctie \ rho (x, x '). Bij het beschrijven van objecten numerieke vectoren gebruiken Euclidische metriek. Deze keuze heeft geen bijzondere rechtvaardiging, maar heeft betrekking op de meting van alle borden "in dezelfde schaal." Als deze factor niet in aanmerking wordt genomen, dan zal de metrische functie met de hoogste numerieke waarden overheersen.

Als er een aanzienlijke hoeveelheid functies, berekenen van de afstand als de som van de afwijkingen op specifieke symptomen verschijnen ernstig probleem dimensie.

In hoge dimensionale ruimte ver van elkaar verwijderd zullen alle objecten. Uiteindelijk zal elk monster naast het object dat wordt onderzocht k buren. gekozen voor een klein aantal informatieve functies om dit probleem op te lossen. Algoritmen voor het berekenen van de ramingen voort te bouwen op basis van verschillende sets van tekens, en voor elk individu op te bouwen hun nabijheid functie.

conclusie

Wiskundige berekeningen gaat het vaak om het gebruik van een verscheidenheid aan technieken die hun eigen onderscheidende kenmerken, voor- en nadelen hebben. Bekeken naaste buur methode kan nogal een serieus probleem op te lossen, als gevolg van de kenmerken van wiskundige objecten. De experimentele concept, gebaseerd op de geanalyseerde methode wordt actief gebruikt in kunstmatige intelligentie.

In de expert-systemen is het niet alleen noodzakelijk om objecten te classificeren, maar tonen ook de gebruiker een toelichting op de indeling in kwestie. Bij deze werkwijze wordt een verklaring van dit verschijnsel wordt uitgedrukt in verhouding tot het doel van een bepaalde klasse en de ligging ten opzichte van het gebruikte monster. Juridische sector specialisten, geologen, artsen, neem deze "precedent" logica actief te gebruiken in hun onderzoek.

Om te analyseren werkwijze was de meest betrouwbare, efficiënte, waardoor het gewenste resultaat moet een minimum waarde k nemen, maar ook de emissies van de geanalyseerde objecten te vermijden. Dat is de reden waarom het gebruik van standaarden en de selectiemethode, evenals de optimalisatie statistieken.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 nl.atomiyme.com. Theme powered by WordPress.