در بحث همه چیز در مورد فایل robots.txt به زبان ساده ابتدا به تعریف فایل robots.txt می پردازیم.
تعریف فایل robots.txt
فایل robots.txt یک فایل متنی با پسوند txt است که خط مشی های مربوط به خزش روبوتهای گوگل را تعیین میکند .
برای مثال می توانید برای ربات های گوگل تعیین گنید که کدام صفحات سایتتان را ایندکس کنند و در نتایج نمایش دهند و کدام صفحات نیاز نیست در نتایج نمایش داده و ایندکس شوند .
معمولا زمانیکه قصد محدود کردن روبات های گوگل را داشته باشیم از robots.txt استفاده میکنیم
این فایل را باید در public_html سایت قرار دهید .
لازم به ذکر است اگر از ساب دامین استفاده میکنید در صورت نیاز باید برای زیر دامنه نیز فایل robots.txt جدا گانه ایجاد کنید
در بحث همه چیز در مورد فایل robots.txt به زبان ساده ابتدا به تعریف فایل robots.txt می پردازیم
در ادامه بحث همه چیز در مورد فایل robots.txt به زبان باید آشنایی مختصری با رباتهای گوگل پیدا کنیم .
کلمه Crawle به معنی خزیدن و کلمه Crawler به معنی خزنده است.
ربات های گوگل در سراسر وب میخزند و وب سایت های جدید را می یابند .
همچنین این رباتها سایتهایی که قبلا ایندکس کرده اند را به روز رسانی میکنند .
مهمترین ربات های گوگل:
• Bot desktop : بات ایندکس گر صفحات برای کامپیوتر های دسکتاپ
• Bot mobile : ایندکس کننده صفحات برای موبایل
• Media Bot : ربات مدیا و چند رسانه ای
• Bot image : رباتهای تصاویر و عکسها
• Ads Bot : بات تبلیغات
دستور User-agent
:User-agent تعیین میکند که مخاطب دستورات کدام روبوت گوگل است
User-agent: *
دستورات بعدی، برای همه رباتها عمل کند.
User-agent: Googlebot
اجرای دستورات بعدی تنها برای ربات گوگل الزامی است.
دستور (Disallow)
دستور Disallow تعیین میکند که صفحات یا بخشهای ذکر شده ایندکس نشوند .
دستور زیر به هیچ یک از رباتها اجازه ورود به فولدر عکس ها را نمیدهد
User-agent:*
Disalow: /itvisit-picture
دستور Allow
دستور Allow عکس دستور Disallow عمل می کند.
این دستور به ربات های موتور جستجوی گوگل اجازه ایندکس کردن را می دهد.
دستور Crawl-delay
Crawl-delay : به موتورهای جستجو دستور می دهد که صفحه را با تاخیر ایندکس کنند.
برای مثال دستور زیر باعث میشود صفحه بعد از تاخیر 20 ثانیه ای ایندکس شود .
crawl-delay: 20
دستور Sitemap
دستور Sitemap (نقشه سایت) برای معرفی کردن نقشه سایت (Sitemap ) به خزنده ها به کار می رود.
Sitemap:url
اتصال دائم (Persistent Connection) به پایگاه داده یکی از روشهای بهینهسازی ارتباطات در برنامههای PHP…
ذخیره و نمایش تصاویر و مدیا در پایگاه داده یکی از نیازهای رایج در پروژههای…
هنگام کار با پایگاه داده در PHP، ممکن است خطاهایی ناشی از کوئریهای ناقص یا…
ایجاد پایگاه داده در PHP یکی از مباحث اساسی برای ساخت وبسایتها و برنامههای تحت…
کلاسها در PHP یکی از اصلیترین مباحث برنامهنویسی شیءگرا (Object-Oriented Programming) هستند. با استفاده از…
استفاده از ساختارهای کنترل خطا در برنامهنویسی از اهمیت ویژهای برخوردار است. در زبان PHP،…