Ngram, taip pat dažnai vadinamas N-gramu, yra teksto ar kalbos turinio statistinė analizė, kurią reikia surasti n (skaičius) tam tikros rūšies elemento tekste.
Paieškos elementas gali būti visų rūšių daiktai, pvz., Fonai, prefiksai, frazės ar raidės. Nors N-gramas yra šiek tiek neaiškus už mokslinių tyrimų bendruomenės ribų, jis naudojamas įvairiose srityse ir turi daug pasekmių programuotojams, koduojantiems kompiuterines programas, kurios supranta ir reaguoja į natūralią kalbinę kalbą.
"Google Books Ngram Viewer" atveju analizuojamas tekstas gaunamas iš didžiulės knygų, kurias "Google" nuskaito iš viešųjų bibliotekų, kad būtų užpildyta "Google" knygų paieškos sistema. "Google Books Ngram Viewer" jie nurodo tekstą, kurį ketinate ieškoti kaip korpusas . "Ngram Viewer" apibendrina pagal kalbą, nors jūs galite atskirai analizuoti britų ir amerikiečių anglų kalbą arba juos vienkartėtis.
Kaip veikia "Ngram"
-
Eikite į "Google Books Ngram Viewer" adresu books.google.com/ngrams.
-
Įveskite bet kokią frazę ar frazes, kurias norite analizuoti. Atskirkite kiekvieną frazę kableliais. "Google" siūlo "Alberto Einšteino, Šerloko Holmso, Frankenstein", kad pradėtumėte. Skirtingai nuo "Google" žiniatinklio paieškų elementai yra didžiosios ir mažosios raidės.
-
Įveskite dienų seką. Numatyta nuo 1800 iki 2000.
-
Pasirinkite korpusą. Galite ieškoti užsienio kalbos tekstų ar anglų kalbos, o be standartinių pasirinkimų galite pastebėti apačioje tokius dalykus kaip "Anglų k. (2009)" arba "Amerikos anglų k. (2009)". Tai senesni korporai, kuriuos "Google" atnaujino, tačiau gali būti priežasčių palyginti senus duomenų rinkinius. Daugelis vartotojų gali ignoruoti juos ir sutelkti dėmesį į naujausias korpusas.
-
Nustatykite lyginimo lygį. Smoothing reiškia, kaip sklandžiai grafika yra pabaigoje. Labiausiai tikslus vaizdas būtų lyginamasis lygis 0, tačiau šį nustatymą gali būti sunku perskaityti. Numatytasis nustatytas kaip 3. Daugeliu atvejų jums nereikia jo sureguliuoti.
-
Paspauskite Ieškoti daug knygų mygtukas.
"Google" leidžia jums nugriauti su "Ngram Viewer" gana šiek tiek. Jei norite ieškoti žuvų veiksmažodžio vietoj žuvies, galite tai padaryti naudodami žymes. Tokiu atveju ieškosite "fish_VERB"
"Google" pateikia išsamų komandų, kurias galite naudoti, sąrašą ir kitus papildomus dokumentus jų svetainėje.
Kas rodomas Ngram?
"Google Books" "Ngram Viewer" išves iš grafiko, kuris parodo konkrečios frazės naudojimą knygose per laiką. Jei įvedėte daugiau nei vieną žodį ar frazę, kontrastingos skirtingos paieškos terminų pamatysite spalvines eilutes. Tai gana panaši į "Google Trends", tik paieškos trukmė ilgesnė.
Atvejo analizė
Apsvarstykite acto pyragų atvejo analizę. Jie paminėti Laura Ingallso Wilderio Mažasis namas "Prairie" serija. Su "Google" žiniatinklio paieška, kad sužinotumėte daugiau apie acto pyragelius, tyrinėjama, kad jie laikomi Amerikos pietų virtuvės dalimi ir yra pagaminti iš acto. Jie klausosi atgal į tuos laikus, kai ne visuose metų laiku jie negalėjo gauti šviežių produktų. Bet ar visa istorija?
Ieškoti "Google Ngram Viewer" acto pyragas ir jūs pamatysite keletą minčių apie pyragą tiek ankstyvojoje, tiek ir pabaigoje 1800-ųjų, daug paminėjo 1940-aisiais ir pastaruoju metu vis daugiau paminėjimų. Tačiau, lyginant 3 lygį, 1800 m. Pamatysite plokštumą virš paminimų. Kadangi per tą laiką nepaskelbta daug knygų ir kadangi mūsų duomenys yra lygūs, tai iškraipo vaizdą. Tikriausiai buvo viena knyga, kurioje paminėta acto pyragas, ir ji buvo vidutiniškai, kad būtų išvengta spike. Nustatydami lyginimą iki 0, matome, kad tai būtent taip. Smegenų centrai yra 1869 m., O dar vienas smailis - 1897 m. Ir 1900 m.
Mažai tikėtina, kad likusį laiką niekas nekalbėdavo apie acto pyragaičius: visur buvo tikimybė, kad receptai plaukioja visur, bet žmonės tiesiog to nepadarė parašyk apie juos knygose, ir tai yra svarbus šių "Ngram" paieškų apribojimas.