آموزش مهم خارج كردن صفحات از گوگل

مي پردازيم به يكي ديگر از مباحث مهم آموزش سئو سايت :

پرسش چگونگي خارج كردن صفحات از ايندكس گوگل دوبار طي چند روز گذشته توسط مشتريان سئو مطرح شده است.

اين فرايند بسيار واضح است اما اغلب يك مورد ساده باعث سردرگمي مي شود. در اينجا نحوه انجام صحيح اينكار (خصوصاً اطمينان حاصل كردن از اينكه صفحات كاملاً حذف شده اند و ديگر برنميگردند) آمده است.

اما ابتدا…

چرا مي خواهيد صفحات خود را از ايندكس گوگل خارج كنيد؟

اساساً اگر الگوريتم پانداي گوگل مقدار بسياري صفحه مشابه يا مطلب جزئي و كوچك در سايت شما ثبت كرده است، امكان بروز مشكل وجود دارد.

بدون در نظر داشتن پاندا، اگر صفحه اي خيلي كم كيفيت باشد، ايندكس نمي شود يا در رنك قرار نميگيرد، اما با وجود پاندا مقدار زيادي مطلب و صفحه كوچك باعث مي شود كه تمام سايت شما مورد مجازات قرار گيرد و رنك خود را از دست بدهد.

نمي خواهم در اين مقاله زياد وارد جزئيات شوم كه چه چيزي باعث ايجاد مطالب سطح پايين و كم كيفيت مي شود ، اما اجالتاً تعدادي مثال از مطالبي كه بايد به دنبالشان باشيد آورده ام:

  • صفحات جستجو
  • اضافه كردن صفحات مرور
  • صفحات رده بندي محصولات
  • صفحات آرشيو مطالب

اگر در پاسخ سوال سئو چيست صادقانه از خودتان بپرسيد “آيا اين صفحه لياقت ايندكس شدن در گوگل و كسب رنك را دارد؟”

اگر پاسختان منفي است، آن صفحه را از ايندكس خارج كنيد.

مختصر و مفيد به اين معني است كه سايتي با 100 صفحه با كيفيت ، خيلي ارزشمندتر است (و اين كار بصورت سيستماتيك باعث افزايش ترافيك جستجو شما مي شود) نسبت به 10000 صفحه كه پر از چرت و پرت است.

سايت خود را براي يافتن مطالب سبك و كم كيفيت جستجو كنيد

خيلي خوب است كه بدانيم گوگل در حال حاضر چه چيزي را در سايت ما ايندكس كرده است.

مي توانيد اينكار را با تايپ كردن اين عبارت در صفحه جستجوي گوگل انجام دهيد:

site:www.yoursite.com

اگر به عنوان مثال سايت newseo را جستجو كنم گوگل به من مي گويد كه در حال حاضر اين سايت 305 صفحه ايندكس شده دارد!

آموزش robot.txt,آموزش استفاده از Remove URLs,آموزش حذف صفحات از گوگل

  • در حال حاضر 43 مطلب منتشر شده در اين سايت وجود دارد بنابراين با صفحات دسته بندي و غيره تقريبا عدد 305 درست است.
  • اگر عدد 100 باشد، من احتمالا علاقه مند مي شدم كه بررسي كنم چه صفحاتي ايندكس شده است.
  • اگر عدد 2000 باشد، قطعا بايستي نگاه دقيقي به مطالب ايندكس شده بياندازم.(چراكه برايم عجيب خواهد شود كه چرا اين همه لينك از سايت من ايجاد شده است)

البته سايت من سايتي كوچك است (بر اساس تعداد صفحات!)، بنابراين اگر شما صاحب سايت بزرگتري هستيد، زمان بيشتري نياز داريد كه بررسي كنيد چه چيزهايي ايندكس شده است و چه چيزهايي نياز است كه حذف شود! اما مطمئن باشيد كه زماني كه مي گذاريد ارزش دارد.

بر اساس مقالات كتاب آموزش سئو به اينجا مي رسيم كه مطالب حذفي را شناسايي كرده‌ايد، چگونه آن ها را حذف مي كنيد؟

من فقط صفحات را در robot.txt بلاك مي كنم آيا اينكار درست است؟

اين كار اشتباهي است كه بسياري از افراد انجام مي دهند.

بلاك كردن يك پوشه (مانند /search/ ) در robot.txt بخشي از كار (كه بعدا به آن خواهم پرداخت) است اما درواقع نه تنها اولين گام نيست بلكه آخرين گام است.

بلاك كردن روبوت ها از ديدن پوشه هاي اصلي فقط به اين معناست كه آنها نمي توانند صفحه را بازبيني كنند (اينكار به آنها نمي گويد كه صفحه موردنظر را حذف كن) و ممكن است به خوبي آدرس هاي سبك، منقضي، قديمي را دور از دسترس ايندكس قرار دهيد (و سايت خودتان را پايين بكشيد).

پس اولين گام چيست؟

خروج صفحه، گام نخست: robot meta tag را در حالت noindex, follow قرار دهيد.

اولين گام در خارج ساختن صفحه اي از ايندكس گوگل، اضافه كردن robot meta tag و تنظيم آن است لذا سايت شما فرمان بازديد عنكبوتي و دنبال كردن هر لينكي در آن صفحه را صادر مي كند نه ايندكس كردن آن.

tag شبيه اين است و بايد در بخش

صفحه قرار گيرد:

<“meta name=”robots” content=”noindex, follow>

در تئوري كار، حالت پيشفرض عنكبوت جستجوگر تحت هر شرايطي بايد بصورت دنبال كردن تمامي لينك ها باشد، اما من معمولاً جهت اطمينان “follow” را اضافه مي كنم.

من براي سئو سايت ام noindex tag را صفحات آرشيو سايتم قرار داده ام (غير از صفحه‌ي اول). بنابراين به عنوان مثال، اگر ما نگاهي به سورس براي بررسي سئو‌ي صفحه 2 بياندازيم در خط 18 تگ موردنظر را مي بينيم:

آموزش سئو,تگ follow چيست,تگ noindex چيست

جستجوي سريع (cache:http://www.newseo.ir/page/2) تاييد مي كند كه گوگل مطابق با درخواست شما صفحه را ايندكس نكرده است.

جلوگيري از ايندكس شدن در گوگل

اضافه كردن تگ روبوت بايستي نخستين گام شما باشد، اما صفحه از ايندكس خارج نمي شود تا زمانيكه مجددا بازبيني شود. بنابراين چگونه مي توان فرآيند را تسريع نمود؟

خارج سازي صفحه، گام دوم: تسريع كردن فرآيند با استفاده از ابزار وبمستر براي خارج ساختن دايركتوري

اگر زمان داريد مي توانيد از ابزار وبمستر استفاده كنيد و آدرس به آدرس چك كنيد و فرآيند خارج‌سازي را تسريع كنيد. قطعا تا زماني كه انجام كار راحت است بايد هر دايركتوري كه مدنظر است (خصوصا شامل مطالب تكراري/سبك) را برطرف نماييد.

به عنوان مثال مي توانيد هرچيزي را با يك درخواست در مسير زير حذف كنيد.

yourdomain.com/search/

روش كار در اينجا آمده است:

  1. وارد ابزار وبمستر شويد و روي عبارت مسير زير كنيد.

Google Index > Remove URLs > Create A New Removal Request

  1. بعد از كليك بر روي اين كليد آدرس دايركتوري مورد نظر را وارد نماييد. مانند: yourdomain.com/search و سپس روي continue كليك نماييد.
  2. Remove Directory را از باكس كشويي انتخاب نماييد و سپس روي Submit Request كليك كنيد.

آموزش robot.txt,آموزش استفاده از Remove URLs,آموزش حذف صفحات از گوگل

بعد از انجام دادن اين مراحل گوگل هرچيزي در اين مسير را از ايندكس خود خارج مي كند.

براي خارج ساختن صفحه اي خاص فقط كافيست روي آدرس كليك كنيد وfrom search results and cacheRemove page را انتخاب نماييد.

تگ روبوت در مرحله اول مطمئن مي شود كه چيزي ايندكس نشده است اما محض اطمينان …

خارج سازي صفحه، گام سوم: بلاك كردن دايركتوري در robot.txt

مهم: تا زمانيكه صفحه كاملا از ايندكس خارج نشده است اين مرحله را انجام ندهيد. مي توانيد مجدداً از عبارت site:… در جستجوي گوگل استفاده كنيد تا مطمئن شويد تمامي مطالب خارج شده اند.

site:yourdomain.com/search

زمانيكه مطلب خارج شد، مي توانيد از robot.txt استفاده كنيد تا در آينده جلوي جستجوي هرچيزي در دايركتوري مدنظر را بگيريد.

بنابراين براي بلاك كردن مسير yourdomain/search بايستي اين دستورات را در فايل robot.txt دنبال كنيد:

 

User-agent: *

Disallow: /search/

User-agent به اين معني است كه دستورالعمل براي تمامي روبوت‌ها (اسپايدرها) مي باشد و ِ Disallow به اين معني است كه روبوت نبايد هيچ مطلبي را در اين دايركتوري جستجو كند.

شما مي توانيد از ابزار آدرس هاي بلاك شده در ابزار وبمستر گوگل استفاده كنيد (Crawl > Blocked URLs) تا مطمئن شويد كه دستور مورد نظر بدرستي كار مي كند.

و اين آن چيزي است كه مي خواهيد!

خب اين مطلب دستورالعملي بود براي فرآيند خارج سازي صفحات از ايندكس گوگل و اطمينان از پايدار بودن آن. سخت كه نبود؟

با بيرون آمدن نسخه 4.0 پاندا اهميت انجام اين فرآيند و خارج ساختن صفحات اضافي از ايندكس گوگل، بيشتر به چشم مي آيد.

هر سوالي داريد فقط كافيست نظر خود را در زير همين پست بگذاريد يا از طريق ايميل و موبايل با بنده در ارتباط باشيد.

من لحظه به لحظه با شما هستم …

تا كنون نظري ثبت نشده است
ارسال نظر آزاد است، اما اگر قبلا در مونوبلاگ ثبت نام کرده اید می توانید ابتدا وارد شوید.