/ Rozšírené vyhľadávanie a jazyk dopytu. Jazyk vyhľadávacieho nástroja

Pokročilé vyhľadávanie a jazyk dopytu. Jazyk vyhľadávacieho nástroja

Jazyk dopytu je umelo vytvorený programovací jazyk používaný na zadávanie dopytov v databázach a informačných systémoch.

jazyk dopytu

Vo všeobecnosti môžu byť takéto dotazovacie metódypodľa toho, či slúžia na databázu alebo na vyhľadávanie informácií. Rozdiel je v tom, že žiadosti o takéto služby sú určené na získanie skutočných odpovedí na kladené otázky, zatiaľ čo vyhľadávací nástroj sa pokúša nájsť dokumenty obsahujúce informácie týkajúce sa oblasti záujmu používateľa.

databázy

Jazyky dopytu pre databázy obsahujú nasledujúce príklady:

  • QL - objektovo orientované, odkazuje na relačné databázy; nástupcu spoločnosti Datalog.
  • Kontextová (CQL) je formálny jazyk reprezentácie dotazov pre systémy na vyhľadávanie informácií (ako sú webové indexy alebo bibliografické adresáre).
  • CQLF (CODYASYL) - pre databázy CODASYL-TYPE.
  • Kontextovo orientovaný jazyk dopytov (COQL) -sa používa v príslušných modeloch (com). Je založený na princípoch dátové construpt modelovanie a používa operácie, ako je projekcia a de projekciu viacrozmerné analýzy, analytické činnosti a závery.
  • DMX - používaný pre modely dolovania dát.
  • Datalog je jazyk dotazov na deduktívne databázy.
  • Gellish English je jazyk, ktorý dokážePoužíva sa pri dotazoch v želaných anglických databázach a umožňuje vám viesť dialógy (otázky a odpovede) a tiež slúži na informačné modelovanie vedomostí.
  • HTSQL - prekladá požiadavky http na SQL.
  • ISBL - používaný pre PRTV (jeden z prvých systémov riadenia relačných databáz).
  • LDAP je protokol pre požiadavky a adresárové služby, ktoré prebiehajú cez protokol TCP / IP.
  • MDX je potrebná pre databázy OLAP.

Jazyk dotazu Yandex

Vyhľadávače

Jazyk vyhľadávacích dopytov, podľa poradia,je zameraná na vyhľadávanie údajov vo vyhľadávačoch. To sa líši v tom, že požiadavky často obsahujú jednoduchý text alebo hypertext s prídavnou syntaxou (napríklad "a" / "alebo"). Výrazne sa líši od štandardných podobných jazykov, ktoré sú regulované prísnymi pravidlami syntaxe príkazov alebo obsahujú pozičné parametre.

Ako sú vyhľadávacie dopyty klasifikované?

Existujú tri široké kategóriepokrývajú väčšinu vyhľadávacích dopytov: informácie, navigáciu a transakcie. Hoci táto klasifikácia nebola teoreticky opravená, bola empiricky potvrdená prítomnosťou aktuálnych dopytov vo vyhľadávačoch.

Požiadavky na informácie sú taképokrývajú široké témy (napríklad konkrétne mesto alebo model nákladných automobilov), pre ktoré je možné získať tisíce relevantných výsledkov.

Navigácia - ide o dopyty, ktoré vyhľadávajú jednu stránku alebo webovú stránku na konkrétnu tému (napríklad YouTube).

jazyk vyhľadávacích dopytov

Transakčné - odrážajú úmysel používateľa vykonať určitú akciu, napríklad uskutočniť nákup auta alebo rezervovať lístok.

Vyhľadávače často podporujú štvrtýtyp žiadosti, ktorý sa používa oveľa menej často. Ide o tzv. Žiadosti o pripojenie, ktoré obsahujú prehľad o pripojení indexovanej webovej grafiky (počet odkazov na určitú adresu URL alebo počet stránok indexovaných z určitej domény).

Ako sa vykonáva vyhľadávanie informácií?

Väčšina vyhľadávacích zdrojov ich nezverejňujevyhľadávanie denníkov, takže informácie, ktoré používatelia hľadajú na webe, sú veľmi ťažké nájsť. Napriek tomu sa prvý vedecký výskum objavil v roku 1998. Neskôr sa v roku 2001 uskutočnil následný prieskum, ktorý analyzoval dopyty, ktoré boli zobrazené ako veľmi relevantné. Takisto sa ukázalo, ako vyhľadávací nástroj používa jazyk dopytov.

Zaujímavé vlastnosti týkajúce sa vyhľadávania na webe sa stali známe:

Priemerná dĺžka vyhľadávacieho dotazu bola 2,4 slov.

  • Asi polovica používateľov odoslala jednu žiadosť a menej než tretina používateľov urobila tri alebo viac jedinečných dopytov jeden po druhom.
  • Takmer polovica používateľov zobrazila iba prvú jednu alebo dve stránky výsledkov.
  • Menej ako 5% používateľov používa pokročilé vyhľadávacie schopnosti (napríklad výber určitých kategórií alebo vyhľadávanie vo vyhľadávaní).

Vlastnosti vlastných akcií

Štúdia tiež zistila, že 19% dotazov(napr. názvy, poštové smerovacie čísla, geografické objekty atď.). Treba tiež poznamenať, že okrem krátkych otázok (tj s niekoľkými podmienkami) boli často prítomné predvídateľné schémy, podľa ktorých používatelia zmenili svoje vyhľadávacie frázy.

jazyk logického dopytu

Zistilo sa tiež, že 33% žiadostí odjeden používateľ sa opakuje a v 87% prípadov používateľ klikne na ten istý výsledok. To naznačuje, že veľa používateľov používa opakované žiadosti o preskúmanie alebo opätovné vyhľadanie informácií.

Frekvenčné rozdelenie dopytov

Navyše odborníci to potvrdiliŽiadosti prideľovanie frekvencií zodpovedajú výkonu práva. To znamená, že malá časť kľúčové slovo vyskytuje v najväčšej zozname otázok (napríklad viac ako 100 miliónov), a sú najčastejšie používané. Zvyšok trestu za rovnakých predmetov sa používajú menej často a viac individuálne. Tento jav sa nazýva princíp Pareto (alebo "80-20 pravidlo"), a je možné použiť také vyhľadávačov optimalizačných techník ako je indexovanie alebo rozdeľovanie databázy, caching a predpätie, a tiež možnosť zlepšiť jazyka otázok vyhľadávačov.

V posledných rokoch sa ukázalo, že priemerná dĺžkadopyty postupne rástli. Takže priemerný dopyt v angličtine sa stal dlhším. V tomto ohľade, Google zaviedol aktualizáciu s názvom "Hummingbird" (august 2013), ktorý je schopný zvládnuť dlhé vyhľadávacie dotazy s žiadnym protokolom "hovorí" dopytovací jazyk (napríklad "Kde je najbližší obchod s kávou?").

žiadosť v angličtine

Pri dlhších dopytoch sa používa ich spracovanie - sú rozdelené na frázy formulované v štandardnom jazyku a odpovede na jednotlivé časti sa zobrazujú samostatne.

Štruktúrované dopyty

Vyhľadávače, ktoré podporujú logickéoperácií a syntaxe, používajte rozšírenejšie jazyky dopytu. Používateľ, ktorý vyhľadáva dokumenty, ktoré pokrýva niekoľko tém alebo tvárí, môže každý z nich opísať logickou charakterizáciou slova. V jeho jadre je jazyk logického dopytu súborom špecifických fráz a interpunkčných znamienok.

Čo je pokročilé vyhľadávanie?

Jazyk dopytu "Yandex" a "Google" je schopnýVykonajte užšie zamerané vyhľadávanie za určitých podmienok. Rozšírené vyhľadávanie môže vyhľadávať časť názvu alebo predpony hlavičky, ako aj niektoré kategórie a zoznamy mien. Môže tiež obmedziť vyhľadávanie stránok, ktoré obsahujú konkrétne slová v názve alebo sa nachádzajú v určitých skupinách tém. Pri správnom používaní jazyka dopytu môže spracovať parametre sériovo väčšie ako povrchové výsledky väčšiny vyhľadávacích nástrojov, vrátane tých, ktoré používateľ dáva slovami s premenlivým koncom a podobným hláskovaním. Keď zobrazíte výsledky rozšíreného vyhľadávania, zobrazí sa odkaz na príslušné časti stránky.

jazyk vyhľadávača

Je tiež možné vyhľadať všetky stránky,obsahujúce určitú frázu, zatiaľ čo so štandardným dopytom, vyhľadávacie nástroje sa nemôžu zastaviť na žiadnej stránke diskusie. V mnohých prípadoch môže jazyk dopytu viesť k akejkoľvek stránke umiestnenej v značkách noindex.

V niektorých prípadoch dobre formulovaný dopyt umožňuje nájsť informácie obsahujúce množstvo špeciálnych znakov a písmen iných abecedov (napríklad čínske znaky).

Ako sa čítajú znaky jazyka dopytu?

Horné a malé písmená, rovnako ako niektorédiakritické znamienka (umlauts a accents) sa pri vyhľadávaní nezohľadňujú. Napríklad hľadanie kľúčového slova Citroen nenašlo stránky obsahujúce slovo "Citroen". Niektoré ligatúry však zodpovedajú jednotlivým písmenám. Napríklad hľadanie slova "aeroskop" ľahko nájde stránky obsahujúce "Ereskebing" (AE = Æ).

Mnoho nealfanumerických znakov je neustálesú ignorované. Napríklad, to je nemožné nájsť informácie pre otázky, ktoré obsahujú reťazec | l | (Písmeno medzi dvoma zvislými pruhmi), a to napriek skutočnosti, že tento symbol sa používa v niektorých šablón pre prevod. Výsledkom bude len "LT" dáta. Niektoré symboly a frázy sú riešené rôznymi spôsobmi: dotaz "pôžičky (financie)" zobrazuje článok s slov "úver" a "financie", ignoruje zátvorky, a to aj v prípade, že je výrobok s presným názvom "credit (financie)".

jazykov dopytov pre databázy

Existuje veľa funkcií, ktoré možno použiť s jazykom dopytu.

syntax

Jazyk dopytu "Yandex" a "Google" môžepoužite niektoré interpunkčné znamienka na upresnenie vyhľadávania. Príkladom sú zátvorky - {{search}}. Priložená veta bude prehľadaná úplne, nezmenená.

Fráza v dvojitých úvodzovkách vám umožňuje rozhodnúťobjekt vyhľadávania. Napríklad slovo v úvodzovkách bude rozpoznané ako používané v obrazovom zmysle alebo ako fiktívny znak bez úvodzoviek - ako informácia o zdokumentovanejšom princípe.

Okrem toho všetky hlavné vyhľadávacie nástroje podporujú symbol "-" pre logické "nie", ako aj / alebo. Výnimkou sú výrazy, ktoré nie je možné oddeliť pomlčkou alebo pomlčkou.

Nepresné zhody vyhľadávacej frázy sú označené.symbol ~. Ak napríklad nepamätáte presné znenie výrazu alebo mena, môžete ho uviesť na vyhľadávacom paneli so zadaným symbolom a budete môcť získať výsledky, ktoré majú maximálnu podobnosť.

Vlastné možnosti vyhľadávania

K dispozícii sú aj možnosti vyhľadávania, ako napríklad intitle,a. Sú filtre oddelené hrubým črevom vo forme filtra: reťazec dopytu. Reťazec dopytu môže obsahovať hľadaný výraz alebo frázu alebo časť alebo celé meno stránky.

Funkcia "intitle: dotaz "uprednostňuje výsledky vyhľadávania podľa názvu, ale zároveň zobrazuje zvyčajné výsledky týkajúce sa obsahu titulu. Niektoré z týchto filtrov je možné použiť súčasne. Ako využiť túto príležitosť?

Žiadosť formulára "intitle: názov letiska "zobrazí všetky názvy s názvom letiska v názve. Ak ju formulujeme ako "parkovanie intitle: názov letiska", potom dostanete články s názvom letiska v názve a s odkazom na parkovanie v texte.

Vyhľadávanie podľa filtra "inkategória: Kategória "funguje na princípe počiatočného vydania článkov patriacich do určitej skupiny alebo zoznamu stránok. Napríklad vyhľadávací dotaz, ako napríklad "Chrámy: História", prinesie výsledky v oblasti histórie chrámov. Táto funkcia môže byť použitá ako rozšírená aj nastavením rôznych parametrov.

Čítajte viac: