حسابداری هلو

همه چیز در مورد فایل robots.txt به زبان ساده

در بحث همه چیز در مورد فایل robots.txt به زبان ساده ابتدا به تعریف فایل robots.txt می پردازیم.

فایل roobots.txt چیست ؟

تعریف فایل robots.txt

فایل robots.txt یک فایل متنی با پسوند txt  است که خط مشی های مربوط به خزش روبوتهای گوگل را تعیین میکند .

برای مثال می توانید برای  ربات های گوگل تعیین گنید که کدام صفحات سایتتان را ایندکس کنند و در نتایج  نمایش دهند و کدام صفحات نیاز نیست  در نتایج  نمایش داده  و ایندکس شوند .

معمولا زمانیکه قصد محدود کردن روبات های گوگل را داشته باشیم  از  robots.txt استفاده میکنیم

فایل robots.txt در کجا قرار دهم؟

این فایل را  باید در public_html سایت قرار دهید .

لازم به ذکر است اگر از ساب دامین استفاده میکنید در صورت نیاز باید برای زیر دامنه نیز فایل robots.txt   جدا گانه ایجاد کنید

در بحث همه چیز در مورد فایل robots.txt به زبان ساده ابتدا به تعریف فایل robots.txt می پردازیم

در ادامه  بحث همه چیز در مورد فایل robots.txt به زبان باید آشنایی مختصری با رباتهای گوگل پیدا کنیم .

همه چیز در مورد فایل robots.txt به زبان ساده

ربات گوگل یا  کِراولر یا  Crawler چیست ؟

کلمه Crawle به معنی خزیدن و کلمه Crawler به معنی خزنده  است.

ربات های گوگل در  سراسر وب میخزند  و وب سایت های جدید  را می یابند .

همچنین این رباتها  سایتهایی که قبلا  ایندکس کرده اند را به روز رسانی میکنند .

مهمترین ربات های گوگل:

•           Bot desktop : بات   ایندکس گر  صفحات برای کامپیوتر های دسکتاپ

•           Bot mobile   :   ایندکس کننده  صفحات برای موبایل

•           Media Bot  : ربات مدیا و چند  رسانه ای

•           Bot image  : رباتهای تصاویر و عکسها

•           Ads Bot  : بات تبلیغات 

مهمترین  دستورات فایل  robots.txt

دستور User-agent

 :User-agent تعیین میکند که مخاطب  دستورات کدام  روبوت گوگل است

  • مثال 1 :
User-agent: *  

دستورات بعدی، برای همه ربات‌ها  عمل کند.

  • مثال 2
User-agent: Googlebot

اجرای دستورات بعدی تنها برای ربات گوگل الزامی است.

دستور (Disallow)

دستور Disallow  تعیین میکند که صفحات یا بخشهای ذکر شده ایندکس نشوند .

  • مثال :

دستور زیر به هیچ یک از ربات‌ها اجازه ورود به فولدر عکس ها را نمی‌دهد

User-agent:*
Disalow: /itvisit-picture

دستور Allow

دستور Allow عکس دستور Disallow عمل می کند.

 این دستور به ربات های موتور جستجوی گوگل اجازه ایندکس کردن را می دهد.

دستور Crawl-delay

 Crawl-delay  : به موتورهای جستجو دستور می دهد که صفحه را با تاخیر ایندکس کنند.

برای  مثال  دستور زیر باعث میشود صفحه بعد از تاخیر 20 ثانیه ای ایندکس شود .

 crawl-delay: 20 

دستور Sitemap

دستور Sitemap  (نقشه سایت) برای معرفی کردن نقشه سایت (Sitemap ) به  خزنده ها به کار می رود.

Sitemap:url
مهرداد یاری

Recent Posts

اتصال دائم به پایگاه داده در PHP

اتصال دائم (Persistent Connection) به پایگاه داده یکی از روش‌های بهینه‌سازی ارتباطات در برنامه‌های PHP…

7 دقیقه ago

افزودن عکس در پایگاه داده با PHP

ذخیره و نمایش تصاویر و مدیا در پایگاه داده یکی از نیازهای رایج در پروژه‌های…

3 هفته ago

بررسی خطاهای کوئری‌ پایگاه داده در PHP

هنگام کار با پایگاه داده در PHP، ممکن است خطاهایی ناشی از کوئری‌های ناقص یا…

4 هفته ago

آموزش ایجاد پایگاه داده در PHP

ایجاد پایگاه داده در PHP یکی از مباحث اساسی برای ساخت وب‌سایت‌ها و برنامه‌های تحت…

4 هفته ago

کلاس‌ها در PHP به زبان ساده

کلاس‌ها در PHP یکی از اصلی‌ترین مباحث برنامه‌نویسی شیءگرا (Object-Oriented Programming) هستند. با استفاده از…

4 هفته ago

آموزش try در PHP

استفاده از ساختارهای کنترل خطا در برنامه‌نویسی از اهمیت ویژه‌ای برخوردار است. در زبان PHP،…

1 ماه ago