Seznam.cz - Nová verze přepisu dotazu

Seznam.cz - Nová verze přepisu dotazu

V příštích dnech budeme nasazovat novou verzi našich vyhledávacích algoritmů. Drobné změny pouštíme každou chvíli, ale tahle bude větší. Tentokrát měníme interní způsob přepisu dotazu.

Pro naše hledající uživatele by změna neměla být nijak zásadně patrná. Stále platí, že naše algoritmy se snaží do výsledků dávat co nejrelevantnější výsledky. Z našich interních měření vyplývá, že nová verze dosahuje stejné kvality řazení výsledků.

Naopak ti, kdo pravidelně sledují pozici svých stránek na různé dotazy, změnu pravděpodobně zaregistrují. Přepis dotazu do strojově uchopitelné formy stojí totiž na začátku procesu hledání, a tak má na výpočet pořadí výrazný vliv. Porovnáním obou verzí nám medián změny výsledků vyšel kolem 28 procent. To lze přibližně interpretovat tak, že se po nasazení změn mezi deseti výsledky na první stránce objeví tři jiné. Ze zkušenosti očekáváme, že se více změn objeví v komerčních dotazech, protože ty jsou konkurenčnější a každá větší změna algoritmů v nich udělá vítr.

Přepis dotazu měníme kvůli tomu, abychom ho mohli do budoucna rozvíjet, a tím vyhledávání dále zlepšovat. Například tak, že k jednomu dotazu poskytneme odpovědi, které zahrnují více různých významů dotazu. Dosavadní verze přepisu dotazu byla na limitu svých možností.

Jako přepis dotazu označujeme soustavu algoritmů, která dotaz zadaný uživatelem upraví do formy, se kterou umí pracovat vyhledávač procházející index. Během přepisu dotazu se například provádí oháčkování, skloňování slov, expanze zkratek a zapojuje se mnoho dalších modulů. Tyto moduly sice necháváme stejné, ale měníme formát jejich komunikace a následné procházení indexu. Interně tuto změnu označujeme jako „grafy a varianty“.

Sdílet článek:

Novinky eABM

Novinky nejen ze světa IT
Václav Dobiáš | 16. únor 2020

Pro známý Beskydský pivovárek jsme dodali online prodejní systém pro prodej pivního merche a vstupenek nejen na kulturní akce. 

Tomáš Musil | 14. únor 2020

V reakci na zvýšený počet útoků na počítačové systémy nabízíme nově kurz “Kybernetické bezpečnosti” určený pro všechny uživatele počítačů. I přesto, že se neustále zvyšuje technické zabezpečení, největším rizikem zůstává uživatel, který z důvodu neznalosti problematiky může například spustit nebezpečný script, díky kterému budou vaše data odcizeny nebo zašifrovány. I proto dle statistik je 80% bezpečnostních incidentů způsobeno lidskou chybou. 

Václav Dobiáš | 9. únor 2020

Reklamní agentura informovala klienta, u zcela nového webu, že ukončuje webové služby a web je třeba převést pod jinou společnost. To vše za 30 dní. I přes spoustu problémů se nám to však podařilo a web massag.com nyní běží na našem redakčním systému