چکیده
با پیدایش دنیای مجازی شاهد ظهور انقلاب دیگری تحت نام انقلاب اطلاعات هستیم. از سوی دیگر حجم انبوه اطلاعات کاربران را بر آن داشته تا به کیفیت اطلاعات بیش از کمیت آن بیندیشند. اطلاعات روز آمد، دقیق و معتبر سه ویژگی مهمی است که لازمه کار هر محقق می باشد. لذا رشد فناوری های نو ظهور، روشهاي جدیدی را به منظور سازماندهی اطلاعات جهت بازیابی دقیق آن به یاری می طلبد.
با استفاده از روشهای نوین سازماندهی، اطلاعات مفید از اطلاعات سیال و ناپایدار استخراج شده و کاربر به سهولت می تواند به اطلاعات مورد نياز خود دسترسی پیدا کند. یکی از مهمترین این راهکارها، نمایه سازی وب است. دنیای وب با مدد از این راهکار دریچه ای نو را به روي کابرانمي‌گشايد. در این مقاله می کوشیم تا با نگاهی به نمایه سازی وب، به بررسی انواع نمایه، نمایه سازی در موتورهای جستجو، ابر موتورها و ابر داده ها از جمله ابر داده دوبلین کور ، بازنمود نمایه در وب و معرفی نرم افزارهای نمایه سازی بپردازيم و بستری مناسب جهت اهمیت و نقش آن در بازیابی اطلاعات جهان مجازی فراهم آوریم.
کلید واژه ها: نمايه[1]، نمایه سازی وب[2] ، موتور جستجو[3]، ابر موتور جستجو[4]، ابر داده[5]،دوبلين كور[6]، بازنمود نمایه

مقدمه
رشد تصاعدی فضای اطلاعاتی وب، آلودگی اطلاعات را دامن زده است، از سوی دیگر وجود اطلاعات میرا و سیال اهمیت نمایه سازی وب را بیش از پیش مطرح می سازد. لذا آنچه که براي كاربران وب مهم است، دستيابي سريع و آسان به اطلاعات دقيق، روزآمد و داراي اعتبار مي باشد، نه حجم انبوه اطلاعات. نمایه سازی کارآمد، به کاربر امکان بازیابی اطلاعات دقیق، صحیح و روز آمد را می دهد. به بيان ديگر نمایه سازی وب فرآیند پالایش و فیلتر اطلاعات دنیای وب است و نمایه ساز پالاینده اطلاعات آن. بايد دانست كه نمايه سازي وب مفهوم جديدي نيست.

نمایه سازی وب
با گسترش حجم انبوه اطلاعات و به اشتراک گذاری آن و رویکرد روز افزون برقراری ارتباطات از طریق اینترنت بحث سازمان دادن اطلاعات به قصد سهولت در بازیابی مطرح می باشد. یکی ازکارآمدترین روشهای بازیابی، نمایه سازی وب می باشد. نمایه وب منابعی را که از طریق world wide webدر دسترس هستند جمع آوری و سازماندهی مینماید و نقطه شروعی برای یافتن اطلاعات می باشد. در وب نمایه ها ممکن است به روشهای گوناگونی سازماندهی شوند. شیوه سازماندهی یک نمایه با نمایه دیگر فرق میکند، نمایه ها می توانند به طور الفبایی، موضوعی (رده ای) و ... سازماندهی شوند. نمایه های موضوعی اغلب منابع شان را طبق یک نظم سلسله مراتبی از اعم به اخص مرتب می کنند.. نمایه های وب برای نشان دادن لیستهای منابع خود ازپیوندهای فرا متن استفاده می کنند، آنها این امکان را دارند تا از طریق لینک ها صدها و بلکه هزاران منبع را در بر بگیرند. عموما تمام نمایه ها یک نقطه اتصال دهنده مستقیم به منابع فهرست شده را به کاربران عرضه می کنند.
لذا این نکته به خوبی قابل احساس است که ساختارهای وسیع و جامع یک متن برای دسترسی آسان تر نیاز به سازماندهی و نظم منطقی دارند. از دید یک محقق یا کاربرمعمولا دسترسی آسان به اطلاعات به بیش از یک استراتژی جستجو نیازمند است و نهایتا همه آنها به فرآیند سازماندهی فایلهای HTML درزیر فهرستهایی منتهی می شوند.
این زیر فهرستها هم به تهیه کننده اطلاعات و هم به کاربر وب سایت کمک می کند. در این حالت کاربر می تواند براساس یک کد، یک نام فایل،یا محتوای یک عنوان جستجو کند.به عنوان مثال يكي از راههاي دسترسي به اين موارد برنامه ای به نام CGI مي باشد.
نمایه های وب برای نشان دادن لیستهای منابع خود از پیوندهای فرا متن استفاده می کنند، آنها این امکان را دارند تا از طریق لینک ها صدها و بلکه هزاران منبع را در بر بگیرند.

تعدادی از نمایه های مشهور وب به شرح ریر می باشند

●Yahoo!TM
●The WWW Virtual Library
●Trade Wave Galaxy
●فهرست خدمات اینترنتی Yanoff
●The Argus Clearinhouse
●Magellan
●Point

دو عامل مهم در نمایه سازی وب
نمایه، یک مخزن جامع از اطلاعات در دسترس نیست اگر چه آنها می توانند هزاران منبع را فهرست کنند. در واقع نمایه های وب ما را به فهرستها و راهنماها ارجاع می دهند. این نوع نمایه ها نیاز به یک نرم افزار و یک زبان نمایه سازی خاص دارند.

الف- زبان نمایه سازی
زبان نمایه سازی آن دسته از واژگان نمایه سازی است که در نظام خاصی از ذخیره و بازیابی مورد استفاده قرار می گیرد. "زبان " می تواند طبیعی، یعنی زبان مدرک نمایه سازی شده باشد، یا ساختگی یا کنترل شده باشد(یعنی از نوعی تنظیم برخوردار باشد. (سلطانی، 1382، ص 180)
عملکرد نظام بازیابی متاثر از کیفیت زبان نمایه است. وجود نمایه سازی و جستجوی خوب نمی تواند زبان نمایه نامناسب را جبران کند به عبارت دیگر کاربران اطلاعات فقط به آن اندازه می توانند عمل نمایند که زبان نمایه مجاز می شمارد. ناتواناییهای زبان نمایه بر دو نوع است: 1-عدم توانایی به خاطر ویژگی در اصطلاحات 2-عدم توانایی به خاطر ابهام یا روابط کاذب بین اصطلاحات. (لانكاستر، 1379، ص179)
عمدتا زبانها دو نوع هستند:
1- زبانهاي مهار شده (Controlled language)
اين زبانها، حاوي اصطلاحاتي هستند كه براي نمايه سازي مدارك انتخاب و پذيرفته شده اند، فهرست ها سر عنوانهاي موضوعي و اصطلاحنامه ها دو شيوه متفاوت زبان نمايه سازي مهار شده است. اصطلاحنامه پس از شرح زبانهاي آزاد توصيف مي شود.
2- زبانهاي آزاد (Free language)
در اين نوع زبانها محدوديتي ازنظر نوع واژه وجود ندارد، هر واژه يا اصطلاح مي تواند بدون قيد و شرط از زبان طبيعي گرفته شود، يعني عينا از زبان مدرك نقل گردد و يا متناسب با موضوع مدرك تعيين شود. ازنمايه سازي به زبان طبيعي هم مي توان در ساخت واژگان موضوع الكترونيكي و هم در توليد نمايه نامه هاي چاپي استفاده كرد. يكي از كاربردهاي نمايه سازي به زبان طبيعي توليد نمايه هايي است كه مبتني بر واژه هاي عنوان مي باشد. مانند: نمايه كوئيك، نمايه كووك و نمايه جايگشتي.(داورپناه،1381،ص33)
ب- نرم افزارهای نمایه سازی وب
بسته به اینکه در وب مورد نظر چه اطلاعاتی را می خواهیم نمایه سازی کنیم (اطلاعات می توانند یک سند، یک Full text ، تصاویر و ... باشند) نرم افزارهای گوناگونی برای نمایه سازی وب موجود می باشد:

نرم افزارهای نمایه سازی وب

Advanced Java Tree Menu
PHP Lightning Portal (PLP)
PHP Portal Builder (PPB)
ActMon Password Recovery XP
Internet Macros Web Test Recorder

نرم افزارهای نمایه سازی لینکها

PHP Lightning Portal (PLP)
PHP Portal Builder (PPB)
Registry First Aid
IEManager
Advanced Java Tree Menu

نقش موتورهای جستجو در نمایه سازی وب
حجم انبوه اطلاعات وب و عدم نمایه سازی جامع، متخصصان این حوزه را برآن داشته تا با مدد از فن آوری افکار، موتورهای جستجو را بکار گیرند و راهکاری مناسب جهت نمایه سازی را فراهم آورند. از سوی دیگر برخی از وب سایت ها برای اطمینان از بازیابی بیشترین رتبه بندیهای مرتبط، از اصطلاحات کلیدی استفاده می کنند، این در حالی است که تعدادی دیگر از نمایه سازی کور بهره می گیرند.
مشکل اصلی این نوع نمایه سازی اضافه بازیابی است که حجم زیاد اطلاعات نامرتبط را شامل می شود، لذا جهت افزایش جامعیت و مانعیت بازیابی، موتورهای جستجو به عنوان یک راهکار مطرح شدند. (دیگان، 1382، ص 161)
موتورهای جستجو، ابر موتورها و ابر داده ها در واقع ابزارهای کمکی برای نمایه سازی و ارائه اطلاعات مرتبط با موضوع مورد جستجو در اینترنت هستند.
نمايه ها اساس كار موتورهاي جستجو در رتبه بندي نتايج جستجو و تركيب منطقي واژه ها (جستجوي بولي) براي بازيابي اطلاعات در اينترنت را تشكيل مي دهد. اما بزرگترين موتورهاي جستجو هم قادر به نمايه سازي وب نيستند. برخي از اين موتورها نظام نمايه سازي تمام متن دارند و هر واژه موجود درمتن به جز واژه هاي فاقد بار اطلاعاتي مانند حروف اضافه، ربط و تعريف را نمايه مي كند. برخي بخشي از منبع را نمايه مي كنند.برخي ديگر، سرعنوانها، عناوين فرعي و فراپيوندها را همراه 20 خط ابتداي متن و 100 كلمه اي كه از بسامد بالايي برخوردار است، نمايه مي كنند. (داورپناه،1381،ص 84)
از دیدگاه مدیریت نظام اطلاعاتی چهار ویژگی اصلی برای اطلاعات بازیابی شده قابل لحاظ است: دقت[7]، پیوستگی زمانی[8]، بهنگام بودن[9] و مرتبط بودن[10].(منتظر،1380، ص 31) لذا نمایه سازی باید بر مبنای چهار ویژگی مذکور انجام پذیرد. بنابراین جهت رسیدن به نمایه سازی جامع و مانع وب به نمایه سازی دقیق موتورهای جستجو نیاز داریم.

از سایت ترفندستان

با تشکر از دوستان عزیز