Hvorfor følger det av distribusjonshypotesen at synonymer får liknende vektorer?
Klikk for å snu kortet
Distribusjonshypotesen sier at ord som forekommer i lignende kontekster har lignende betydning. Synonymer (f.eks. «bil» og «kjøretøy») opptrer typisk med de samme nabokordene (kjøre, vei, motor). Når en ordvektor læres ut fra hvilke kontekstord et ord opptrer sammen med, vil to ord med nesten identiske kontekstfordelinger ende opp med nesten identiske vektorer, og dermed ligge nær hverandre i vektorrommet. Antakelsen er distribusjonell (basert på fordeling i tekst), ikke leksikalsk.
Space / Enter for å snu