SEO Блогът на Lilacor

Блог за начинаещи в сферата на SEO & SEM (Search Engine Optimization & Marketing)

Лекота на свързване

Публикувано от lilacor на 11 май, 2008

Ако сайтът SEOBook.com беше изцяло насочен към търсенето и бях написал електронна книга, щеше да бъде далеч по-лесно за автора да получи линкове към сайта си, отколкото ако е както сега – сайт, посветен на SEO. Поради много причини, концепцията на SEO е мразена в много кръгове. От своя страна, тази на търсенето като цяло, е много по-лесна за възприемане. Понякога чрез разширяване, стесняване или промяна на темата, се оказва много по-лесно за останалите потребители да се свържат с вас.

Примитивни технологии за търсене

С разрастването на мрежата, контентът нараствал по-бързо, отколкото самата технология. Примитивната природа на търсещите машини допринесла за създаването на съдържание като цяло, но не и на качествено такова. Търсачките трябвало да се осланят на самите документи, за да определят тяхната стойност. Най-ранните сред тях дори не използвали съдържанието на цялата страница, като вместо това разчитали единствено на заглавието на страницата и името на документа. Тогава се появили мета таговете.

Мета тагове

Мета таговете били използвани, за да помагат на търсещите машини да организират мрежата. Документите включвали ключови думи и описания, които били използвани, за да улеснят отговарянето на потребителски запитвания. В началото тези тагове били ефективни, но впоследствие маркетинговите експерти започнали да ги преексплоатират (да злоупотребяват с тях) и те постепенно изгубили значимостта си.

Всички започнали да тъпчат мета таговете с огромни количества повтярящи се думи (много често такива, които дори нямат общо със съдържанието на съответната страница), за да се позиционират на по-добре в търсачките. По онова време, да имаш добри позиции в търсещите машини означавало, че си повтарял ключовите думи в мета таговете си няколко пъти повече от конкурентите си.

Банери, банери, банери

В началото на създаването си, мрежата била изцяло ориентирана не към доходите, а към импресиите. Това означава, че хората били заети да купуват всякакъв тип публичност (внимание), което приключило с превръщането на спама в търсачките в изключително доходоносно занимание, тъй като те показвали банерите на спамерите из всякакви сайтове.

Публикувано в SEO на български | Tagged: , , | Няма коментари »

Превръщане в уеб ресурс

Публикувано от lilacor на 8 май, 2008

Въпреки, че мразя да цитирам източници, които не си спомням добре, ще направя едно изключение. Веднъж четох някъде, че един на всеки трима човека вярват, че сайтовете, които излизат на най-предните места в търсачките, са най-релевантни спрямо търсенето. Представете си само огромното предимство на това, хората да попадат първо именно на вас. Каквото и да продавате, хората ще го купуват!

Веднъж бях цитиран (става дума за автора на книгата Аарон Уол) от един ислямски информационен сайт по повод на мой разговор, който бях провел с гражданин на Кувейт, който се свърза с мен, искайки съвета ми по мрежата. Аз не знам нищо за исляма като религия, но с изненада открих постинга (мнението) си чрез една от търсачките. Понякога ти се случват хубави неща, а друг път - конкуренцията печели. Като цяло, колкото по-усърдно работите и по-оригинална информация предоставяте, толкова по-често вие ще сте в ролята на късметлията, а не вашите конкуренти.

Бизнес линкове

Колкото е лесно е да се обвържете сайта си с полезна и интересна информация, толкова значително по-трудно е да го обвържете с печеливши комерсиални идеи, особено ако той не прибавя особена стойност на дадена сделка. Много често линкове свързани с комерсиални сайтове представляват вид бизнес партньорства.

Много хора се справят добре с това да споделят информация и след това да „прикачат” даден продукт към техния бизнес модел. Вие най-вероятно никога нямаше да попаднете и да прочетете тази книга (става дума за книгата на Аарон Уол), ако аз не си бях направил блог, който е обвързан с нея. Аналогично, би било значително по-лесно за мен да създам множество линкове водещи към SEOBook.com , ако не продавах тази електронна книга на него.

В зависимост от вашите умения, допуснати грешки и бизнес модел, понякога е за предпочитане да създадете свои основен официален сайт и след това да създадете друг, който да е посветен изцяло на онлайн продажби или да добавите комерсиални елементи към сайта след като той се е сдобил с така желаните известност и доверие (потребителска лоялност). Без да ви познават е много трудно да изградите трайно доверие у читателите без да сте обзети от фикс идеята за бърза и лесна печалба. Проявеното търпение в случая, обаче, определено си струва.

Публикувано в SEO на български | Tagged: , , | Няма коментари »

Произход на мрежата

Публикувано от lilacor на 7 май, 2008

Мрежата била създадена с идеята за свободен поток от информация, както я е виждал Тим Бърнърс Лий, нейният създател. Той работил в CERN – Европа. CERN е била уеб-ориентирана компания, като много от служителите й идвали и си отивали постоянно и работели по много и различни проекти едновременно.

Тим създал сайт, който описвал как работи мрежата и го качил на техния сървър на адрес

info.cern.ch . По онова време, Европа проявявала нищожен интерес към мрежата, така че неговите американски колеги били на практика първата група, която пускала такива сървъри. Тим Лий добавил линкове от този сървър към неговата директория, известна още като Виртуална библиотека (Virtual Library), като създал първата по рода си уеб директория, естествено адски опростена.

Към момента, линковете от и към университетски сайтове имат по-голяма тежест, отколкото тези към други уеб адреси. Това е проста функция от следните факти:

  • Корените на WWW (World Wide Web) могат да бъдат открити в лабораториите на университетите и колежите. Едва в края на 90-те години на миналия век мрежата е започнала да се комерсиализира;
  • Тя съдържа самоподсилващи се социални мрежи;
  • Университетите винаги са били лансирани като източници на автентичност;
  • На университетите се отпускат големи бюджети;
  • Университетите имат качествен контрол над голяма част от съдържанието публикувано на техните сайтове.

Ранните търсачки

В началото си глобалната мрежа не е имала сложно устроени търсещи машини. Най-напредналият метод за събиране на информация се е базирал на принципа на примитивно съвпадащите имена на файлове. Трябвало е да знаете точното име на файла, който търсите, за да можете да го намерите чрез тогавашните търсачки. Първият файл, чието име съвпаднело с това на търсения, бил връщан като резултат на получателя. Не съществувало такова понятие като релевантност на търсенето. Именно липсата на такава релевантност довела до бързата популяризация на търсещите директории като Yahoo!

Много търсачки като AltaVista и по-късно Inktomi, били лидери в бранша за известно време, но заради бързо променящия се пазар и липсата на усъвършенстван търсещ алгоритъм и качествена онлайн рекламна кампания, попречили на тези примитивни машини да се превърнат във функциониращи бизнес модели.

Първоначалната сериозна инициатива за разработване на уеб-базирана търсачка била стартирана като pay-per-click реклама през 1998 г. Независимо, че идеята (понастоящем известна като Yahoo! Search Marketing) била доходоносна, повечето портали продължавали да губят пари. Появили се и таргетираните реклами, които довели до нарастване популярността сайтове от типа на Yahoo! и в крайна сметка – до създаването на първите наистина функциониращи бизнес модели.

Мрежата = Евтин, таргетиран маркетинг

В началото, докато интернет печелел все по-голяма популярност, било изключително евтино да създадеш работеща маркетингова платформа. Тогава се появил и спамът. Той пълнел електронните пощи на интернет потребителите и губел тяхното време, като същевременно не струвал нищо (освен малко свободно време) на разпращащите го.

Търсещите машини трябвало да се преборят и с този нарастващ и все по-агресивен поток от нежелана информация, за да могат да запазят акуратността (точността) си. Това наложило внасяне на подобрения в търсещите алгоритми. Една от основните задачи на търсачките се състои във филтрирането на спама и изкарването на релевантни резултати.

В мрежата винаги ще се намери някой, който да иска да изкара някой бърз лев. Кой може да вини някои маркетингови специалисти за това, че се опитват да открият дупка в алгоритмите на системите за търсене, които ги облагодетелстват и им дават нечестно предимство пред конкуренцията?

Очаквайте „Превръщането в уеб ресурс”…

Публикувано в SEO на български | Tagged: , , | Няма коментари »

Search Algorithm Shifts (Смяна на търсещите алгоритми)

Публикувано от lilacor на 6 май, 2008

Tърсещите машини като Google и Yahoo! могат да ъпдейтват (обновяват) своите алгоритми десетки пъти на месец. Когато забележите бързи промени в класирането на вашата страница, това обикновено се дължи смяна на търсещите алгоритми, ъпдейтване на индексната база данни на търсачката или нещо друго извън вашия контрол. SEO е маратон, а не спринт и на някои от промените им трябва време, за да сработят.

Обикновено, когато промените нещо по съдържанието на вашата страница, това не се отразява в резултатите от търсенето веднага, понякога не дори и в същия ден. Линковите промени също отнемат време, за да се отразят в резултатите, защото търсачките трябва първо да открият новите линкове преди да могат да ги оценят. Важно е да се отбележи, че някои търсещи алгоритми „вярват” (дават по-добра оценка) на по-старите линкове.

Ключът към успешното SEO е в това да запомните, че ранговете винаги се променят, но колкото повече време и знания влагате, за да изградите качествен сайт и лоялна аудитория, толкова по-често ще излизате по-напред в резултатите от конкуренцията.

Релевантността печели разпостранение!

Колкото повече пъти едно търсене води до желаните от потребителя резултати, толкова по-голяма е вероятността този потребител да използва тази търсачка отново. Ако тя работи добре, потребителят не само ще я използва повторно, той ще разкаже и на приятелите си за нея, а те от своя страна могат да я сложат и като своя начална страница или да си я прикачат към своите любими bookmarks. Главната цел на всички големи търсещи машини е да бъдат релевантни (приложими на практика). Ако не са такива, те ще загинат (както много от тях вече го сториха).

Бизнес модел на търсачките

Търсачките правят пари, когато потребителите кликат на рекламите поместени в тях. В резултата от търсенето на картинката отдолу ще видите, че и Viagra и Levitra са се показали на първите места при търсене по ключова дума Viagra. Полето вдясно показва платените реклами на Виагра, като на Google се плаща всеки път, когато се кликне върху някоя от тях.

Viagra Search Results

Бялото поле отляво показва резултатите от органичното търсене, т.е. от безплатното търсене. Google не печели нищо от показването на тези резултати. Всички търсачки целят да направят по-трудно манипулирането на резултатите (каквато е нашата цел като SEO специалисти), за да запазят релевантността колкото се може по-добра и да насърчават хората да купуват платени реклами. По-нататък в блога ще дискутираме подробно органичната оптимизация и pay-per-click маркетинга.

Публикувано в SEO на български | Tagged: , | Няма коментари »

Search Interface (Търсещ интерфейс)

Публикувано от lilacor на 6 май, 2008

Търсещият алгоритъм и търсещият интерфейс се използват, за да открият най-релевантния документ в индекса, базиран на запитването. Най-напред, търсещата машина се опитва да определи намерението на потребителя, „гледайки” думите, които той е написал.

Тези думи могат да бъдат разглеждани по опростен начин, като остава само техния корен (например: да отпадне ing формата и други наставки при търсене на английски език) и те са проверявани в лексикалната (словесната) база данни, за да се прецени какви идеи представляват те. Думи и изрази, които са много близки до търсените, ще ви помогнат да оцените други подобни термини. Например, търсенето по ключова дума swims, може да ви бъде полезно и когато търсите по думите swim или swimming.

Търсачките могат да опитат да съчетаят векторите на ключовата дума с всеки от специфичните термини в запитването. Ако те се появяват в близост един до друг често, търсещите машини могат да разгледат съответните думи като едно цяло и да връщат документи свързани с тях. WordNet е най-популярната лексикална база данни.

Searcher Feedback (Обратна връзка от потребителите)

Някои търсачки, като Google и Yahoo!, имат тул-барове и системи като Google Search History and My Yahoo! , които събират информация за даден потребител. Търсещите машини могат също така да преглеждат последните търсения или да проследяват търсенията, които е направил потребителят и да търсят такива страници, които са най-релевантни с неговите нужди.

Отнема известно време, за да се изгради такава история на потребителското търсене и click-through профил. В последствие, обаче, той може да бъде използван, за да:

  • помага за персонализация на търсенето;
  • събира потребителски фийдбек (обратна информация), за да определи колко добре работи алгоритъмът;
  • помага на търсачките в определянето на качеството на документа (например, ако много потребители посещават дадена уеб страница и после веднага кликат върху бутона “back”, търсачките могат да спрат да я индексират добре).

Ако на високо ранкната (оценена) страница никога не се клика често или хората натискат back бутона на браузърите си веднага след попадането в нея, тя може бързо да бъде понижена в търсените резултати. В някои случаи, това може да доведе и до набелязване на страницата за ръчен преглед (от човек).

Докато потребителите дават на търсачките все повече обратна информация, те ще събират все по-голямо количество данни и ще става все по-трудно да оценяват добре даден документ, използвайки само линкове. Колкото повече доволни потребители има сайта ви, толкова по-добър ще става той с развитието на търсещите алгоритми.

Real-Time срещу Prior-to-Query изчисления

В повечето големи търсачки част от изчисленията за релевантност се складират напред във времето, а други – в реално време (в момента). Технологиите, които са прекалено скъпи и бавни процеси, като изчисляването на цялостната вътрешна обвързаност (т. нар. Google Page Rank), се изчисляват предварително.

Много търсещи машини имат различни центрове за складиране на данни и когато се появи ъпдейт, те преминават от старата към обновената база данни. Тези центрови са разположени из целия свят, за да минимализират времето за забавяне (т. нар. лаг). При нормални обстоятелства, вие обикновено получавате резултатите от вашето търсене от центровете, които се намират най-близо до вас. Ако има технически проблем или претоварване, то бива прехвърляно към друг такъв център.

Очаквайте Search Algorithm Shifts & Search Engine Business Model…

Публикувано в SEO на български | Tagged: , | Няма коментари »

Паякът и индексът (четвърта последна част)

Публикувано от lilacor на 5 май, 2008

Keyword Density, Term Frequency & Term Weight

Повтаряемостта на изразите (Term Frequency - TF) е мерна единица за това колко често се появява определена дума в даден документ (уеб страница). Изразите, които са употребявани най-често в даден текст, се считат за най-важните в него. Ако една дума се среща във всеки (или почти във всеки) документ, тогава едва ли можете да научите кой знае колко за цялостното съдържание на страницата от нея. Следователно, често повтарящите се думи в уеб страниците имат малка или никаква стойност за търсачките, тъй като те ги игнорират по подобие на стоп-фразите (например: the, and, или or).

Рядко употребяваните думи и изрази, такива, които присъстват по-рядко в цялостното съдържание на уеб сайта, имат много по-голям signal-to-noise рейтинг. Този рейтинг представлява най-общо съотношението между качествения контент и боклука (реклами, банери, повтарящо се съдържание) и може в най-голяма степен да ви ориентира за какво се отнася съответният документ.

Инверсионната честота (Inverse Document Frequency IDF) може да бъде използвана за по-нататъшно определяне на стойността на повтаряемостта на изразите (TF), преценявайки колко начесто са разположени те в съдържанието на документа. Думите и изразите, които са по-малко на брой, и съответно се срещат по-рядко в съдържанието на сайта, обикновено могат да ви кажат много повече за него, отколкото тези, които се срещат почти навсякъде из страниците му.

Когато хората преценяват честотата на употреба на дадени думи или фрази, те обикновено пропускат да забележат други важни фактори, като например описаните дотук Inverse Document Frequency, Index Normalization, Word Proximity , докато търсещите машини отчитат различните видове елементи: удебелен шрифт, заглавия, линкове и др.

Търсачките може също да използват други технологии, например скритото семантично индексиране (latent semantic indexing), което представлява математичен модел за оценка на обвързаността на страниците. Google сканира милиони книги от университетски библиотеки. Колкото идеята на този процес е да се помага на хората в търсенето и намирането на информация, толкова и то помага на Google да „разбере” лингвистичните (словесен) модели.

Ако създадете нарочно уеб страница натъпкана от горе до долу с една и съща ключова дума или израз, без да добавяте никакво друго съдържание в нея, много е вероятно да се окаже, че няма да можете да я намерите с нито една търсачка или в най-добрия случай ще я намерите, но накрая на резултатите, тъй като търсещите машини ще е оценят като крайно нерелевантна. Идеята е да пишете по естествен начин, като използвате различни синоними на избраните от вас ключови думи и да структурирате добре страниците на сайта си.

Multiple Reverse Indexes (Многократни обратни индекси)

Търсачките могат да използват многократни обратни индекси (Multiple Reverse Indexes) за различен контент. Повечето от настоящите търсещи алгоритми са склонни да отдават по-голямо значение на заглавията на страниците и на линк текстовете, отколкото на останалите части от уеб съдържанието.

За повечето търсения, търсещите машини могат да намерят отговор на запитването ви само като обходят заглавията и линковете в документите, без да имат нужда да да губят излишно време и да обхождат цялостното им съдържание. Всичко, което може да спести време от компютърни цикли, без това да се отрази негативно на релевантността на резултатите, е нещо, за което можете изцяло да се доверите на търсачките.

След като най-релевантните документи са събрани, те могат да бъдат сортирани повторно на база на взаимната им обвързаност или други фактори. Около 50 % от запитванията, отправени към търсачките, са уникални и по-дълги, отколкото е необходимо, което налага да се поддържа огромна база от аналогични съвпадащи документи, които да удовлетворят всякакви желания от страна на интернет потребителите.

Очаквайте следващата тема Search Interface (Търсещ интерфейс)…

Публикувано в SEO на български | Tagged: , , | Няма коментари »

Паякът и индексът (част трета)

Публикувано от lilacor на 4 май, 2008

Proximity (Съседство)

Складирайки местоположението на изразите, търсачките могат да „разбират” колко близки са те едни с други. Като цяло, колкото по-близки са думите помежду си, толкова по-вероятно е страницата с резултатите от търсенето да задоволи запитването ви. Ако използвате важна група от думи само веднъж, уверете се, че те се намират близо една до друга. Ако думите са разпръснати по естествен начин из страницата на много места, няма да е нужно да се опитвате да пренаписвате съдържанието, за да разположите ключовите изрази близо едни от други. Естественото звучене на текста винаги е най-доброто решение!

Stop Words (Стоп-фрази)

Думи, които са много често употребявани, не помагат на търсещите машини да „разберат” документа. Пример за такава дума е “the”, която още е наричана стоп-фраза. Търсачките индексират такива стоп-фрази, но те по никакъв начин не помагат в оценяването на релевантността на страницата в търсещите алгоритми. Ако търсите по израза the Cat in the Hat, търсещите машини ще разглеждат запитването ви като * cat * * hat.

Index Normalization (Индекс нормализация)

Всяка страница е стандартизирана по размер. Това не позволява на по-дългите страници да получат несправедливо предимство (тъй като в тях има повече пространство за повторение на ключови фрази) пред по-късите такива. Също така, не позволява на по-късите страници да получат по-добър резултат, поради това, че съдържанието им е съставено от по-голям процент ключови фрази. Следователно, няма идеална дължина за уеб страниците, която да се котира най-добре в търсачките.

Уникалността на съдържанието на една страница е много по-важно от нейната дължина. Това съдържание има 3 основни цели:

  • Да бъде достатъчно уникално, за да бъде индексирано и оценено (ранкнато) в резултатите от търсенето;
  • Да е достатъчно интересно, за да искат потребителите да се линкват към него;
  • Да привлича посетителите на страницата да се абонират за нея, да купуват от нея и да кликат по текстовите реклами и банери поместени в нея.

Не всяка страница би могла да реализира продажби или да бъде достатъчно привлекателна, за да искат посетителите да се линкват към нея. Но ако много от страниците във вашия уеб сайт са с качествено съдържание, което остава такова с течение на времето, това неминуемо ще повиши ранга на почти всяка страница от сайта ви.

Очаквайте последната част от “Паякът и индексът” - Keyword Density, Term Frequency, Term Weight & Multiple Reverse Indexes…

Публикувано в SEO на български | Tagged: , , | Няма коментари »

Паякът и индексът (част втора)

Публикувано от lilacor на 3 май, 2008

Складирани атрибути (Storing Attributes)

Тъй като търсачките „виждат” страниците откъм техния изходен код (от англ. source code) в линеен формат, най-добре е да преместите JavaScript-а и другите допълнителни кодове във външни файлове, за да помогнете с преместването на копието на страницата по-нагоре в изходния код.

Някои хора предпочитат да използват т. нар каскадни стилови таблици (от англ. Cascading Style Sheets (CSS)) или празна клетка от таблица, за да разположат съдържанието на страницата преди навигацията. За да могат търсещите машини да преценят кои думи са първи, те „оглеждат” как са разположени думите в изходния код. Не съм се занимавал специално да тествам дали си струва усилията да направите кода на вашата страница да е разположен преди навигацията, но в случай, че това няма да ви отнеме много време и усилия, нищо не пречи да опитате. Линк анализът (който ще разгледаме подробно по-нататък) е много по-важен отколкото подредбата на думите в сорс кода, но всяко дребно нещо може да се окаже от полза.

Гугъл са наели група служители от Мозила и е много вероятно да работят върху задачата да помогнат на своите паяци да разберат по-добре начина, по който браузърите интерпретират (тълкуват) страниците. Майкрософт публикуваха проучване, което може да се окаже много полезно за Гугъл в опитите им да разберат коя част от съдържанието на уеб страницата е най-важно.

Освен да складират позицията на думата, търсачките могат също така да „запомнят” как са складирани данните. Например, къде е разположена съответната дума в заглавието на страницата (page title)? Част от заглавие ли е (heading)? Какво заглавие (H1, H2… H6)? С удебелен шрифт ли е написана? Подчертана ли е? Намира ли се в текст на линк? и т.н.

Думите, които са в заглавие или са отделени по друг начин от нормалния текст на страницата, могат да получат допълнителна тежест в много търсещи алгоритми. Имайте предвид, обаче, че може да се стори подозрително на търсачките, ако дадени ключови фрази се появяват многократно с удебелен шрифт или под формата на заглавия, без да участват в останалата част от съдържанието на страницата. Също така, ако страницата ви изглежда твърде тясно обвързана с дадена тема, т.е. има много голяма гъстота на ключовите думи, тогава тя може да получи по-ниска оценка за релевантност, отколкото страница с по-малка наситеност с ключови думи, но звучаща по-естествено.

Следващият път очаквайте: Proximity, Stop Words и Index Normalization…

Публикувано в SEO на български | Tagged: , , | Няма коментари »

Паякът и индексът

Публикувано от lilacor на 2 май, 2008

Паякът (Crawler, Spider)

Паякът прави точно каквото предполага името му. Той претърсва мрежата, следвайки линковете, ъпдейтва (обновява) страниците и добавя нови, когато попадне на такива. Всяка търсачка има периоди на „дълбоко” и „плитко” търсене. Съществува и индексен механизъм, който не позволява на паяка да претоварва сървърите и който му посочва кои документи да обхожда и колко често да ги обхожда.

Често променящите се или много важни документи биват обхождани по-често. Честотата на обхода няма директно отношение към релевантността на търсенето, тя просто помага на търсачките да поддържат актуално съдържанието в техния индекс (списък). Например, страницата на CNN (www.CNN.com) може да бъде обхождана веднъж на всеки 10 минути. Популярните, бързо разрастващи се форуми биват обхождани десетки пъти на ден. Един статичен сайт, с ниска линкова популярност (от англ. link popularity) и рядко променящо се съдържание, може да бъде обновяван от търсачките по един два пъти месечно.

Най-голямата полза, от това да имате често обхождана от паяците страница, се състои в това, че можете да я линкнете (свържете посредством линкове) към някой нов сайт, страница или проект, като по този начин и те ще бъдат обхождани по-често от търсещите машини.

Индексът (The Index)

Индексът (още наричан каталог) е мястото, където събираната от паяците информация бива складирана. Когато извършите търсене посредством голяма търсачка (напр. Google или Yahoo!), вие не претърсвате цялата мрежа, а само кеш паметта на мрежата, съдържаща се в каталога на съответната търсачка.

Обратен индекс (Reverse Index)

Търсещите машини организират своето съдържание по метод наречен обратен индекс. Когато търсите с Google и ви излезе резултат 1-10 out of 143,000 websites, това означава, че съществуват приблизително 143 000 уеб страници, които или съдържат търсените от вас ключови думи в себе си, или имат вътрешни връзки (линкове), които ги съдържат. Също така, забележете, че търсачките не складират пунктуация, само думи!

Следващото е пример за обратно индексиране и демонстрира как типичните търсачки класифицират съдържанието (контента). Имайте предвид, че това е крайно опростена версия на действителността, но илюстрира метода достатъчно ясно. Представете си, че всяко от следващите две изречения представлява съдържанието на една уникална страница:

The dog ate the cat.

The cat ate the mouse.

Word Document # Position #
The 1,2 1-1, 1-4, 2-1, 2-4
Dog 1 2
Ate 1,2 1-3, 2-3
Cat 1,2 1-5, 2-2
Mouse 2 5

Очаквайте продължение…

Публикувано в SEO на български | Tagged: , , | Няма коментари »

Кратка история на мрежата

Публикувано от lilacor на 1 май, 2008

Накратко за мрежата

Мрежата се превърна в сбъдната маркетингова мечта. В началото си, мрежата била базирана на идеята за споделяне на знания. Колкото повече се доближават идеите ви до тази основна идея, толкова по-лесно ще ви бъде да промотирате (рекламирате) своя сайт.

Основна цел на търсачките и начин на работа

Много хора смятат, че търсачките имат скрит режим на работа. Това просто не е вярно. Целта на търсещите машини е да предоставят висококачествено съдържание на потребителите, които търсят в интернет. Тези от тях, които имат най-широка мрежа на разпространение, успяват да продадат най-голямо рекламно пространство. Към момента на издаване на тази книга, Google е признат за търсачката с най-високо ниво на релевантност, т.е. техните технологии оглавяват класацията за най-добри резултати при търсене в мрежата.

Проблемът с индексирането (регистрацията) на нов сайт

Най-големият проблем, с който ще се сблъскате при пускането на нов сайт, е че търсачките няма и да подозират за съществуването му. Дори когато търсачка попадне на нов документ, на нея ще й е необходимо доста време, за да определи неговото качество. Търсачките разчитат на линкове, които да им помогнат в определянето на качеството на даден документ (страница). Някои от тях, например Google, имат повече „доверие” на домейни, които съществуват от повече време.

Съставни части на търсачките

Докато има най-различни начини за организиране на уеб съдържанието, всяка „пълзяща” (от англ. crawling) търсеща машина се състои от едни и същи основни части:

  • Паяк (от англ. crawler, spider);
  • Индекс или каталог;
  • Търсещ интерфейс

Очаквайте продължение…

Публикувано в SEO на български | Tagged: , , | Няма коментари »