Упутство
Број пописаних сајтова и страница
Укупно је пописано више од 165.000 сајтова на „rs“ и „срб“ доменима, са преко 1.300.000 страница.
Дословна претрага (претрага по фрази)
Ако желите да претражите две или више речи дословно како се појављују у тексту на страници, ставите их све под наводнике у пољу за претрагу, нпр. "Петар Петровић Његош".
Оваква претрага ће вратити све странице на којима се дословно појављује "Петар Петровић Његош".
Обична претрага
Ако речи претражујете на уобичајени начин (без наводника), као резултат претраге вратиће се све странице које садрже барем један од термина претраге.
У нашем примеру, вратиле би се странице које садрже барем један од термина Петар, Петровић или Његош.
Претрага на оба писма
Можете претраживати равноправно користећи оба писма: ћирилицу или латиницу, а наш програм ће претражити све странице без обзира на писмо.
Резултати претраге не зависе од писма којим претражујете, тј. увек се враћају исти резултати без обзира на писмо.
Резултати претраге
Наш програм враћа везе (линкове) до првих 50 страница које су најрелевантније за одговарајући термин претраге.
Уколико има више од 50 нађених страница, њихов укупан број се наводи иза броја 50, нпр. 50/1500.
Резултати претраге се приказују на ћирилици као вид подршке што широј употреби ћирилице на интернету.
Проценат ћирилице на страници
После сваке везе до сајта, са десне стране се налази проценат заступљености ћирилице на дотичној страници, нпр. 99%.
Сматрамо да је страница ћириличка ако је најмање 60% текста на страници написано ћирилицом и тада је ознака у зеленој боји, нпр. 60%.
Уколико је заступљеност ћирилице на страници испод 60%, ознака за заступљеност ћирилице је у сивој боји 59%.
Страничење резултата
Тренутно, не подржавамо страничење, тј. функционалност да прикажемо наредних 50 резултата претраге, али је та функционалност планирана да се реализује у скоријој будућности.
Ако желите да добијете мањи број прецизнијих резултата, наведите специфичније и конкретније термине претраге.
Прецизност резултата
Не препоручује се употреба „ошишане“ или „ћелаве“ латинице јер то лоше утиче на прецизност резултата претраге.
У „ошишаној“ латиници се слова са дијакритицима замењују њима блиским словима, попут:
- č → c
- ć → c
- đ → dj
- š → s
- ž → z
Дијакритик је графички знак који се додаје неком слову (изнад, испод или преко слова) да би означио његову другачију гласовну вредност у односу на слична слова.
Који домени су „прочешљани“?
Тренутно су „прочешљани“ сви сајтови на „rs“ и „срб“ доменима, а у плану је да се прочитају и сајтови на српском језику са интернационалних домена попут „com“, „net“, „org“, „info“ и сл.
Број страница по сајту
Наш програм-бот посети сваки сајт без обзира на писмо које користи (ћирилица или латиница) и прочита око 20 најважнијих страница на сајту, чији садржај потом похрани у базу и тиме учини доступним за претрагу.
Наш програм-бот је врло увиђаван према сајтовима које претражује у смислу да их не оптерећује великим бројем захтева (~ 20 захтева по сајту) и не упућује те захтеве све одједном, већ са задршком од ~ 3 секунде између сваког захтева.
Такво обзирно понашање се у техничкој терминологији претраживања интерента, зове увиђавност, пристојност (енгл. politeness).
Ћирилички сајтови
На страници Ћирилички сајтови можете прочитати како проналазимо ћириличке сајтове и шта значи када кажемо да је сајт ћирилички.
Контактирајте нас
Уколико поседујете активни ћирилички сајт, а не можете га наћи у резултатима претраге или
није наведен на сајту Ћирилизатора,
контактирајте нас на info[et]cirilizator.com