24
Николай Галинов Вътрешен анализ на сайт СофтУни 09.04.2015

Nikolai galinov-onpage-analysis

  • Upload
    netpeak

  • View
    53

  • Download
    4

Embed Size (px)

Citation preview

Николай Галинов

Вътрешен анализ на сайт СофтУни 09.04.2015

Николай Галинов

● Лектор в DM&SEO курса на СофтУни● SEO Specialist в Netpeak Bulgaria● Занимава се с [SEO на настоящето] за клиентските проекти● Участник на безплатните уебинари на Netpeak

Защо е важна вътрешната оптимизация?

Динамика на органични посещения, постигната с вътрешни и контент фактори

Вътрешен анализ на сайт: Техническа част

1. Основен домейн на сайта, 301 редиректи.2. Съставяне на robots.txt.3. Определяне на канонични URL.4. SEO-оптимизация на страници от странициране.5. SEO-оптимизация на вътрешни връзки в сайта.6. Вътрешна линк структура.7. Външни връзки, броячи.8. Формиране на xml карта на сайта.9. Формиране на html карта на сайта.10. Формиране на коректни http-хедър.11. Страница за грешка 404.12. Страница за грешки 50X.13. Анализ на хостинга за достъпност: uptimerobot.com, loadimpact.com14. Оптимизация на изображения15. Използване на микроформати в сайта16. Дублирано съдържание http://advego.ru/plagiatus/

Основен домейн на сайта, 301 редиректи.

Google Webmaster Tool Определяне на основен домейн за сайт (с WWW или без)Как се определя?за нов сайт - по желаниеза стар сайт - с какво е индексирана главната (info:domain.com)

Основен домейн на сайта, 301 редиректи.

● Google Webmaster Tool ● Определяне на основен домейн за сайт (с WWW или без)● .htaccess

RewriteEngine OnRewriteCond %{HTTP_HOST} ^example.com [nocase]RewriteRule ^(.*) http://www.example.com/$1 [last,redirect=301]

● Дублиране от index.php/html

RewriteEngine On RewriteCond %{REQUEST_URI} index\.php RewriteRule ^(.*)index\.php$ /$1/ [R=301,L]

● Стари страници (404)● разлика между 301 и 302

Създаване на файл Robots.txt

Файл Robots.txt е предназначен за ботовете и редовният им достъп до част или целия сайт. Тъй като ние се интересуваме от моментната ситуация, то ние няма да говорим за всички ботове, за по-специални търсения. И не задостъп, а по-специално за индексация.

Повечето търсещи машини спокойно реагират на липсата на този файл. Но някои чужди търсещи машини прекратяват индексацията при лиспата на robots.txt.

Затваряне на съдържание за индексация през robots.txt трябва да се използва само ако е трудно да се затвори по други начини.Също в robots.txt може да се изберат няколко търсещи машини (например Bing, Yandex).

Този файл е необходимо да бъде поставен в главната директория на сайта и да е достъпен на адрес site.com/robots.txt.

Създаване на файл Robots.txt

Синтаксис и директиви:User-agent: *Disallow: /dir/Sitemap: http://www.domain.com/sitemap.xml

Manual: https://support.google.com/webmasters/answer/6062608?hl=enrobots.txt Tester Google webmaster Tools

Определяне на канонични URL

От индекса на търсещите машини е важно да изключите страници дублиращи напълно или значително голяма степен от съдържанието на други страници: страници за сортиране, филтри.

За страници, дублиращи съдържанието на други страници, е важно да определите каноничен URL. Каноничния URL адрес се дефинира с помощта на вмъкване на ред в Head часта на сайта <link rel="canonical" href="http://url" />, където вместо url е нужно да поставите съотвеният каноничен url на страницата. Най-често тези страници се определят лесно от наличието на GET параметри в тях.

Manual: https://support.google.com/webmasters/answer/139066?hl=en

SEO-оптимизация на страници от странициране.

За да се покаже на търсачката, че това са страници от страницирането, е нужно да се разглеждат като едно цяло в тага <head> следва да се добави мета таг rel="next" и rel="prev".

Например, ако имате странициране http://site.com/page/1/ http://site.com/page/2/ http://site.com/page/3/

На страница http://site.com/page/1/ в <head> добавете <link rel="next" href="http://site.com/page/2/">.

На страница http://site.com/page/2/ в <head> добавете <link rel="prev" href="http://site.com/page/1/"> <link rel="next" href="http://site.com/page/3/">

На страница http://site.com/page/3/ в <head> добавете <link rel="prev" href="http://site.com/page/2/">

Manual: https://support.google.com/webmasters/answer/1663744?hl=en

SEO-оптимизация на вътрешни връзки в сайта

Връзките е нужно да се отличават от основният текст на сайта (друг цвят и подчертаване) този метод помага на потребителите за качествено навигиране в сайта. Връзките трябва да съдържат атрибут title съответстващ на анкора на връзката. Възможно е малко да се допълни или като вариант да се използва title на целевата страница.

Всички връзки на популярните страници, които се виждат в началото на страницата, е необходимо да бъдат абсолютни и имат анкор-текстове, съответстващи на ключовия въпрос, на който отговарят тези страници. Ако за по-голямо удобство на потребителя, сте поставили няколко препратки към една и съща страница, тези повтарящи се връзки е желателно да се придружават от релация NoFollow.

Manual: https://support.google.com/webmasters/answer/96569?hl=en

Вътрешна линк структура

Важно е правилно да се организира вътрешна линк структура на сайта. Базов принцип на вътрешната линк структура е дървовидна структура, когато към страници препращат други страници от същото ниво в същата категории, към страници от по-ниско ниво, както и към страници на родителска категория.

Правилна структура за разпределяне на вътрешна линк тежест трябва да съответства на избраната стратегия за класиране и се основава върху калкулация на вътрешния PageRank. Важно е да се максимизира вътрешната тежест, която да се съсредоточи към основни страници на сайта от гледна точка на избраната стратегия за класиране.

Външни връзки и броячи

Наличие на изходящи линкове от сайта води до изтичане на линк тежестта, натрупаната външна лик маса се разпределя между всички връзки и страници, включително и към външни източници.

Съответно всички външни връзки по възможност трябва да се изтрият, а в случай че са необходими за потребителите, да бъдат придружени от релация NoFollow.

Изключение могат да бъдат връзки към разработчиците на сайта и връзки към доверени (авторитетни) сайтове във вашата тематика.

Също така често на сайтовете са инсталирани различни броячи или рейтинги. Такива връзки е жалателно да бъдат изтрити, но ако тяхното наличие е необходимо, следва да се придружават от релация NoFollow.

Форматиране на XML карта на сайта

XML картата на сайта е нужно да съдържа само канонични, открити за индесация страци които връщат HTTP отговор 200.

Всички останали страници е нужно да бъдат изключени от този файл. За тази цел, е желателно модулът за генериране на XML картата на сайта да провери съдържанието:

- robots.txt;

- <link rel="canonical" href="">;

- X-Robots-Tag;

и кодовете за отговор на сървъра.

Този файл трябва да се генерира автоматично, да се изтриват старите несъществуващи URLs, както и да добавя нови.

Manual: https://support.google.com/webmasters/answer/183668?hl=en

Форматиране на HTML карта на сайта

HTML картата на сайта служи в качеството на каталог за всички страници на сайта, помага както на потребители така и на търсещите машини да намерят нужни страници на сайта. Картата на сайта помага също при индексация на динамични страници и увеличава класирането по много фрази.

HTML картата на сайта трябва да съдържа връзки към всички страници, които са полезни за индексацията на сайта. Изключение могат да бъдат крайни страници със стоки, статии, при условие, че тяхното количество се указва доминиращо в картата на сайта, а също страници, които не е нужно да бъдат индексирани. Ако картата е твърде обемна е възможна друг тип реализация, така че всяка част от картата да е не повече от 150 връзки към крайни страници.

Manual http://googlewebmastercentral.blogspot.com/2008/01/sitemaps-faqs.html

Формиране на коректни HTTP-хедър.

При заявкa към URL, сървърът връща http хедър, в който сред много данни се посочва и отговор на сървъра, енкодинга на документа, датата на последната промяна и expire date - моментът от времето, до когато информацията на посочения URL адрес е актуална.

Датата влияе с по-малка сила, но това може да се отрази върху честотата на обхождането, както и върху позицията на документа при търсене с посочване на дата. Expire date влия върху способността на сървъра да кешира съдържанието на URL за да може да не тегли цялото съдържание отново при последващи заявки.

Формиране на коректни HTTP-хедър.

Инструменти за проверка:

Chrome Addon HTTP Headers

http://headers.cloxy.net/

Netpeak Spider

Страница за грешка 404

● Отговор на сървъра при липсваща страница● Наличие на пренасочване при липсващи страници● Създаване на страница за грешка 404● Проверка на прехода към страница 404

Страница за грешка 50X

За всеки акаунт на сървъра се разпределя определено количество от ресурси за обработка на потребителските заявки. Исканията пристигнат в сървъра и се нареждат на опашка. Леки заявки се обработват бързо, а тежките проблемно - бавно, спира опашката. Когато дължината на опашката достигне определена стойност, сървърът спира приемането на нови заявки и започва да връща отговор за грешка 503 (Service Temporarily Unavailable, услугата е временно недостъпна). За да не се губят потребители при възникване на грешка 503 е необходимо:

- Да се създаде специална страница за грешка 503 с надпис по средата «Cайтът е временно недостъпен». А също да съдържа контактна информация за сайта.

- При поява на грешка 503, потребителя трябва да види тази страница (страница за грешка).

Анализ на хостинга за достъпност

В случай че сайта често прекъсва в процеса на работа, то това влияе крайно негативно върху класирането на сайта, тъй като робота на търсачката открива недостъпните страници и ги премахва от индекса, както и върху отношението на потребителя към дадения ресурс. За дадената проверка може да се използва безплатно услугата Uptimerobot.com

Оптимизация на изображения

● Адрес на изображенияИзображения е желателно да се съхраняват в директория на второ ниво и да бъдат разделени в съответствие с техния тип, т.е. за изображения с пълен размер трябва да има директория: http://site.bg/image/За малки изображения създайте папка: /images/thumbnails/За пълен размер на изображенията създайте папка: /images/full/

● Тагове alt и title за картинкиВ случай, ако потребителя изключва зареждането на картинки в браузъра или възникват някакви проблеми при зареждане на изображенията, съдържанието на параметъра alt за изображенията ще се визуализира на мястото на изображението. Title се визуализира от повечето браузъри, когато мишката е върху изображението, като текст, обясняващ тази снимка. Препоръчително е alt и title да не се отличават значително един от друг. Желателно е всяко отделно изображение да съответства на своите уникални alt и title.

Използване на микроформати

Много желателно е информацията в сайта да се описва с помощта на микроформатите, които не се виждат от потребителя, но същевременно съобщават на ботовете на търсещите машини за структурата на съдържанието на страницата. В резултат на което има вероятност на попадане на дадена информация в разширени снипети.

Микроформатите съществуват за маркиране на различна информация: продукти, ревюта, информация за хора, рецепти и т.н. Подробна инструкция за маркиране на страница с използване на микроформати от търсачката на Google може да намерите на адрес: http://schema.org/

Използване на микроформати

Manual: https://developers.google.com/structured-data/schema-org

Testing Tool https://developers.google.com/structured-data/testing-tool/