سایت مپ در واقع، فایلی است که لیستی از مهم ترین محتواهای موجود در سایت را در بر دارد تا خزندههای گوگل بتوانند به راحتی این محتواها را ببینند و ایندکس کنند. همچنین سایت مپ به موتورهای جستجو میگویند که کدام محتواها از بقیه مهمتر است.
در مقابل این نوع Sitemap یک نوع نقشه سایت دیگر نیز وجود دارد که مبتنی بر HTML است و در آن لیستی از مهم ترین فایل های موجود در سایت قرار دارد. این نوع نقشه سایت، بیشتر برای کاربران مورد استفاده قرار میگیرد تا بتوانند محتوای موجود در سایت را بیابند و از آن استفاده کنند.
موتورهای جستجو از نقشه سایت XML (همان نوع اول) استفاده میکنند تا ساختار سایتها را یاد بگیرند. باید به خاطر داشته باشید که قرار دادن URL صفحاتِ سایت در سایت مپ، ایندکس شدن سایت را تضمین میکند.
این موضوع به این معنی است که اگر نقشه سایتی از کدهای XML خوب استفاده کند، آدرسهای معتبر و مرتبی را برای کراولرها فراهم کند و سایر نیازمندیهای موتورهای جستجوگر را برآورده سازد، URLهای موجود در آن در Crawlهای بعدی مورد توجه قرار خواهند گرفت. همین امر شانس دیده شدن صفحات مختلف در موتورهای جستجوگر را افزایش میدهد.
1-سایت مپ از نوع XML
این نوع سایت مپ ساختار سازمان یافته شده ای دارد و مخصوص موتورهای جستجو است و احتیاج به مشاهده کاربران وب سایت ندارد. سایت مپ از نوع XML می تواند در فایل Robots.txt آدرس دهی شود تا به موتورهای جستجو کمک نماید راحتر این فایل را پیدا نمایند.
2-سایت مپ از نوع HTML
این نوع سایت مپ مخصوی کاربران بازدید کننده وب سایت است و به آنها کمک می کند که محتویات صفحات مورد نظرشان را براحتی پیدا نمایند. سایت مپ از نوع HTML قابل استفاده در گوگل وبمستر نیست.
اگرچه سایت مپ در هر شرایطی برای وبسایت مفید خواهد بود، اما در شرایط زیر بسیار موثر و کارساز است:
همه موتورهای جستجوی مهم از پروتکل های XML رسمی که در سایت Sitemaps.org تعریف شده است، استفاده میکنند
کدهای XML سایت مپ شامل تگهای اختیاری و الزامی هستند. کدهای XML معتبر با تگهای شروع (بازشونده) “<?xml> “ آغاز میشوند که یک تگ الزامی است. سپس این تگ با تگ دیگری همچون “<urlset>” دنبال میشود که حاوی حداقل یک صفت Xmlns است که ساختار کلی XML را تعریف میکند.
هر آدرسی که در سایت مپ قرار میگیرد باید دارای دو تگ <url> و یک تگ <loc> باشد. بقیه تگها اختیاری هستند.
موتورهای جستجوی گوگل و بینگ، فرمت XML را برای نقشه سایت به عنوان یک پروتکل پذیرفتهاند. با این حال، آنها Feed نقشه سایت را که از پروتکل های RSS 2.0، Atom 1.0 و فایل های متنی ASCII استفاده میکنند را نیز میپذیرند. سایت مپ را میتوان به شکل XML نیز مورد استفاده قرار داد یا در صورتی که حجم بالایی دارد با استفاده از ابزار Gzip، فشردهسازی کرد.
علاوه بر استانداردهای نقشه سایت برای محتوای وب، گوگل از فرمتهای خاصی برای سایت مپ پشتیبانی میکند که برای رسانههای خاصی مورد استفاده قرار میگیرد. این موارد شامل نقشههایی برای فایلهای ویدئویی، تصاویر، محتوای موبایلی، کد منبع نرم افزار و محتوای خبری هستند. بعد از اینکه فرمت مناسب نقشه سایت در فضای نام اعلام شد، میتوان تمامی محتواهای اضافی دیگر را به آن افزود.
1. موتور جستجوی بینگ (Bing) از فرمتهایی که توسط گوگل پشتیبانی می شود حمایت نمیکند، اما یکی از مسئولان بینگ بیان کرده است هر چیزی که پشتیبانی نشود، نادیده گرفته خواهد شد. بنابراین وبمسترها میتوانند از این موارد در سایت مپ خود به راحتی استفاده کنند.
گوگل توصیه میکند که نقشه سایتِ حاویِ محتوایِ خبری را به عنوان یک فایل جداگانه در نظر بگیرید زیرا این نوع سایت مپ بیشتر از سایر فایلها خزیده میشوند.
موتورهای جستجوی گوگل و بینگ از فایل های Media RSS به عنوان جایگزینی برای تشخیص توضیحات متای فایل های ویدئویی استفاده می کنند. از آنجایی که بینگ نیز از این نوع فایل پشتیبانی میکند، توسعۀ Feed ویدئویی mRSS راهکاری هوشمندانه خواهد بود که از هدر رفتن وقتتان جلوگیری میکند.
بهتر است بدانید در فایل نقشه سایت، قوانین و محدودیتهایی نیز وجود دارد. این محدودیتها شامل موارد زیر هستند:
نقشه سایت حتماً باید namespace داشته باشد و فضای نام پیش فرض را به خوبی مشخص کند: xmlns=http://www.sitemaps.org/schemas/sitemap/0.9
فایل نقشه سایت نباید بیشتر از 50000 آدرس در خود داشته باشد. اندازه این فایل هم نباید بیشتر از 50 مگابایت باشد. اگر بیشتر از 5000 آدرس داشتید، از فایل ایندکس نقشه سایت استفاده کنید که در بخش بعد توضیح داده میشود.
فایل نقشه سایت باید به صورت UTF-8 باشد و از کاراکترهای entity-escaped در URL استفاده شود (به عنوان مثال جایگزین کردن کاراکتر “&” با کاراکتر “&” در آدرسهای داینامیک).
همه آدرسهایی که در نقشه سایت نوشته میشوند باید از قواعد یکسانی پیروی کنند. این موضوع به این معناست آدرس هایی که با WWW آغاز میشوند را نمیتوان با آدرسهای بدون پیشوند WWW ترکیب کرد. همچنین آدرسهایی که دارای شناسه جلسه (session ID) هستند را نیز در این فایل قرار ندهید.
فایل نقشه سایتی که در دایرکتوری ذخیره شده است، تنها میتواند آدرسهایی را نشان دهد که در آن دایرکتوری یا زیر دایرکتوریهای آن ذخیره شدهاند. آدرسهای موجود در دایرکتوریهای موازی، دایرکتوریهای والد، Subdomain های مختلف یا آنهایی که از پروتکل متفاوت استفاده میکنند مرجعهای معتبری نیستند. ذخیره کردن نقشه سایت در دایرکتوری ریشه میتواند از به وجود آمدن مرجع نامعتبر جلوگیری کند.
به این نکته توجه داشته باشید که نقشه سایت تان نباید بیش از 1% خطای لینک داشته باشد. در غیر اینصورت کل نقشه دور انداخته میشود. خطای لینک، هر نوع کد پاسخ HTTP است که شامل تغییر مسیر 404 برای لینک های شکسته و ریدایرکت 301 و 302 برای لینکهای تغییر مسیر یافته است. این موضوع برای بینگ نیز یک قانونِ شناخته شده است. استفاده از لینکهای صحیح در قوانین سئو برای تمامی موتورهای جستجو الزامی است. شما میتوانید کد پاسخ HTTP برای هر URL را با استفاده از ابزار Header Checker بررسی کنید. برای آدرسهای متعدد در یک سایت، می توان از ابزارهایی همچون Find Broken Link و Find Broken Links, Redirects & Google Sitemap Generator Free Tool استفاده کرد.
بیشتر سایتهای بزرگ بیش از 50000 آدرس URL دارند که ایندکس شدنشان در موتورهای جستجو خیلی برایشان اهیمت دارد. از آنجایی که در نقشه سایت تنها اجازه ورود 50000 آدرس وجود دارد، وبمسترها میتوانند یک فایل ایندکس نقشه سایت برای خود ایجاد کنند. فایل ایندکس نقشه سایت میتواند بیش از 50000 ورودی داشته باشد.
موتور جستجوی گوگل میتواند پسوندهای متفاوتی را در هر نقشه سایت شناسایی کند. این موضوع بستگی به محتویات هر سایت دارد. شما با استفاده از نقشه سایت، کار را برای موتورهای جستجو راحتتر میکنید. نقشه سایت XML پسوندهای HTML، Video، Image، Mobile و News را پشتیبانی میکند.
1400 © حق نشر برای میرسافت محفوظ است
نظر خود را بگذارید