سایت مپ چیست؟

 

سایت مپ در واقع، فایلی است که لیستی از مهم ترین محتواهای موجود در سایت را در بر دارد تا خزنده‌های گوگل بتوانند به راحتی این محتواها را ببینند و ایندکس کنند. همچنین سایت مپ به موتورهای جستجو می‌گویند که کدام محتواها از بقیه مهم‌تر است.

در مقابل این نوع Sitemap یک نوع نقشه سایت دیگر نیز وجود دارد که مبتنی بر HTML است و در آن لیستی از مهم ترین فایل های موجود در سایت قرار دارد. این نوع نقشه سایت، بیشتر برای کاربران مورد استفاده قرار میگیرد تا بتوانند محتوای موجود در سایت را بیابند و از آن استفاده کنند.

موتورهای جستجو از نقشه سایت XML (همان نوع اول) استفاده می‌کنند تا ساختار سایت‌ها را یاد بگیرند. باید به خاطر داشته باشید که قرار دادن URL صفحاتِ سایت در سایت مپ، ایندکس شدن سایت را تضمین می‌کند.

این موضوع به این معنی است که اگر نقشه سایتی از کدهای XML خوب استفاده کند، آدرس‌های معتبر و مرتبی را برای کراولرها فراهم کند و سایر نیازمندی‌های موتورهای جستجوگر را برآورده سازد، URL‌های موجود در آن در Crawl‌های بعدی مورد توجه قرار خواهند گرفت. همین امر شانس دیده شدن صفحات مختلف در موتورهای جستجوگر را افزایش می‌دهد.

 

انواع سایت مپ

1-سایت مپ از نوع XML

این نوع سایت مپ ساختار سازمان یافته شده ای دارد و مخصوص موتورهای جستجو است و احتیاج به مشاهده کاربران وب سایت ندارد. سایت مپ از نوع XML می تواند در فایل Robots.txt آدرس دهی شود تا به موتورهای جستجو کمک نماید راحتر این فایل را پیدا نمایند. 

سایت مپ

 

2-سایت مپ از نوع HTML

این نوع سایت مپ مخصوی کاربران بازدید کننده وب سایت است و به آنها کمک می کند که محتویات صفحات مورد نظرشان را براحتی پیدا نمایند. سایت مپ از نوع HTML قابل استفاده در گوگل وبمستر نیست.

 

آیا شما به یک sitemap نیاز دارید؟

 

اگرچه سایت مپ در هر شرایطی برای وبسایت مفید خواهد بود، اما در شرایط زیر بسیار موثر و کارساز است:

  •  سایت جدید با صفحات جدیدی دارید که هنوز به خوبی به آن‌ها لینک داده نشده است (لینک داخلی و خارجی). می‌دانید که ربات‌های گوگل و سایر crawlهای سطح وب، لینک‌ها را دنبال می‌کنند و از صفحه‌ای به صفحه دیگر می‌روند؛ بنابراین اگر سایت شما لینکی نداشته باشد ممکن است صفحات شما را پیدا نکنند.
  • سایت شما واقعاً بزرگ است و ممکن است خزنده‌های Google از خزیدن در برخی از صفحات به روز شده شما غافل شوند.
  • در سایتتان از URL‌های داینامیک برای محتوای خود استفاده می‌کنید.
  •  محتوای آرشیو شدۀ سایتتان به خوبی به صفحات فعال، لینک نشده‌اند.
  • اگر تشخیص و شناسایی صفحات سایتتان بسیار دشوار است یا دارای محتوای غیر متنی سنگین، مانند فلش هستند.

 

ساختار نقشه سایت XML

 

همه موتورهای جستجوی مهم از پروتکل های XML رسمی که در سایت Sitemaps.org تعریف شده است، استفاده می‌کنند

سایت مپ

کدهای XML سایت مپ شامل تگ‌های اختیاری و الزامی هستند. کدهای XML معتبر با تگ‌های شروع (بازشونده) “<?xml> “  آغاز می‌شوند که یک تگ الزامی است. سپس این تگ با تگ دیگری همچون “<urlset>” دنبال می‌شود که حاوی حداقل یک صفت Xmlns است که ساختار کلی XML را تعریف می‌کند.

هر آدرسی که در سایت مپ قرار می‌گیرد باید دارای دو تگ <url> و یک تگ <loc> باشد. بقیه تگ‌ها اختیاری هستند.

 

فرمت فایل نقشه سایت و انواع آن

 

موتورهای جستجوی گوگل و بینگ، فرمت XML را برای نقشه سایت به عنوان یک پروتکل پذیرفته‌اند. با این حال، آنها Feed نقشه سایت را که از پروتکل های RSS 2.0، Atom 1.0 و فایل های متنی ASCII استفاده می‌کنند را نیز می‌پذیرند. سایت مپ را می‌توان به شکل XML نیز مورد استفاده قرار داد یا در صورتی که حجم بالایی دارد با استفاده از ابزار Gzip، فشرده‌سازی کرد.

علاوه بر استانداردهای نقشه سایت برای محتوای وب، گوگل از فرمت‌های خاصی برای سایت مپ پشتیبانی می‌کند که برای رسانه‌های خاصی مورد استفاده قرار می‌گیرد. این موارد شامل نقشه‌هایی برای فایل‌های ویدئویی، تصاویر، محتوای موبایلی، کد منبع نرم افزار و محتوای خبری هستند. بعد از اینکه فرمت مناسب نقشه سایت در فضای نام اعلام شد، می‌توان تمامی محتواهای اضافی دیگر را به آن افزود.

 

نکات مهم درباره فرمت فایل سایت مپ

 

1. موتور جستجوی بینگ (Bing) از فرمت‌هایی که توسط گوگل پشتیبانی می شود حمایت نمی‌کند، اما یکی از مسئولان بینگ بیان کرده است هر چیزی که پشتیبانی نشود، نادیده گرفته خواهد شد. بنابراین وبمسترها می‌‌توانند از این موارد در سایت مپ خود به راحتی استفاده کنند.

گوگل توصیه می‌کند که نقشه سایتِ حاویِ محتوایِ خبری را به عنوان یک فایل جداگانه در نظر بگیرید زیرا این نوع سایت مپ بیشتر از سایر فایل‌ها خزیده می‌شوند.

موتورهای جستجوی گوگل و بینگ از فایل های Media RSS به عنوان جایگزینی برای تشخیص توضیحات متای فایل های ویدئویی استفاده می کنند. از آنجایی که بینگ نیز از این نوع فایل پشتیبانی می‌کند، توسعۀ Feed ویدئویی mRSS راهکاری هوشمندانه خواهد بود که از هدر رفتن وقت‌تان جلوگیری می‌کند.

سایت مپ

محدودیت های موجود در فایل سایت مپ

 

بهتر است بدانید در فایل نقشه سایت، قوانین و محدودیت‌هایی نیز وجود دارد. این محدودیت‌ها شامل موارد زیر هستند:

  • فضای نام یا namespace

نقشه سایت حتماً باید namespace داشته باشد و فضای نام پیش فرض را به خوبی مشخص کند: xmlns=http://www.sitemaps.org/schemas/sitemap/0.9

  • محدودیت در اندازه

فایل نقشه سایت نباید بیشتر از 50000 آدرس در خود داشته باشد.  اندازه این فایل هم نباید بیشتر از 50 مگابایت باشد. اگر بیشتر از 5000 آدرس داشتید، از فایل ایندکس نقشه سایت استفاده کنید که در بخش بعد توضیح داده می‌شود.

  • نیازمندیهای متنی

فایل نقشه سایت باید به صورت UTF-8 باشد و از کاراکترهای entity-escaped در URL استفاده شود (به عنوان مثال جایگزین کردن کاراکتر “&” با کاراکتر “&amp;” در آدرس‌های داینامیک).

  • آدرس‌هایی با فرم یکسان

همه آدرس‌هایی که در نقشه سایت نوشته می‌شوند باید از قواعد یکسانی پیروی کنند. این موضوع به این معناست آدرس هایی که با WWW آغاز می‌شوند را نمی‌توان با آدرس‌های بدون پیشوند WWW ترکیب کرد. همچنین آدرس‌هایی که دارای شناسه جلسه (session ID) هستند را نیز در این فایل قرار ندهید.

  • موقعیت

فایل نقشه سایتی که در دایرکتوری ذخیره شده است، تنها می‌تواند آدرس‌هایی را نشان دهد که در آن دایرکتوری یا زیر دایرکتوری‌های آن ذخیره شده‌اند. آدرس‌های موجود در دایرکتوری‌های موازی، دایرکتوری‌های والد، Subdomain های مختلف یا آن‌هایی که از پروتکل متفاوت استفاده می‌کنند مرجع‌های معتبری نیستند. ذخیره کردن نقشه سایت در دایرکتوری ریشه می‌تواند از به وجود آمدن مرجع نامعتبر جلوگیری کند.

  • لینک‌های سالم

به این نکته توجه داشته باشید که نقشه سایت تان نباید بیش از 1% خطای لینک داشته باشد. در غیر اینصورت کل نقشه دور انداخته می‌شود. خطای لینک، هر نوع کد پاسخ HTTP است که شامل تغییر مسیر 404 برای لینک های شکسته و ریدایرکت 301 و 302 برای لینک‌های تغییر مسیر یافته است. این موضوع برای بینگ نیز یک قانونِ شناخته شده است. استفاده از لینک‌های صحیح در قوانین سئو برای تمامی موتورهای جستجو الزامی است. شما می‌توانید کد پاسخ HTTP برای هر URL را با استفاده از ابزار Header Checker بررسی کنید. برای آدرس‌های متعدد در یک سایت، می توان از ابزارهایی همچون Find Broken Link و Find Broken Links, Redirects & Google Sitemap Generator Free Tool استفاده کرد.

فایل ایندکس نقشه سایت

 

بیشتر سایت‌های بزرگ بیش از 50000 آدرس URL دارند که ایندکس شدنشان در موتورهای جستجو خیلی برایشان اهیمت دارد. از آنجایی که در نقشه سایت تنها اجازه ورود 50000 آدرس وجود دارد، وبمسترها می‌توانند یک فایل ایندکس نقشه سایت برای خود ایجاد کنند. فایل ایندکس نقشه سایت می‌تواند بیش از 50000 ورودی داشته باشد.

 

نقشه سایت XML چه فایل‌هایی را پشتیبانی می‌کند؟

 

موتور جستجوی گوگل می‌تواند پسوندهای متفاوتی را در هر نقشه سایت شناسایی کند. این موضوع بستگی به محتویات هر سایت دارد. شما با استفاده از نقشه سایت، کار را برای موتورهای جستجو راحت‌تر می‌کنید. نقشه سایت XML پسوندهای HTML، Video، Image، Mobile و News را پشتیبانی می‌کند.

 

 

پست مرتبط

نظر خود را بگذارید