ایندکس(INDEX) چیست؟

Rebuild و Reorganize کردن ایندکسها
در این مقاله روش بهینه سازی ایندکسها در SQL Server با استفاده از دو ابزار Rebuild و Reorganize شرح داده خواهد شد.
در این مقاله چگونگی reorganize و rebuild کردن ایندکس تکه تکه شده (Fragmented Index) در SQL Server 2014 با استفاده از محیط SSMS یا SQL Server Management Studio و T-SQL یا Transact-SQL شرح داده خواهد شد. SQL Server Database Engine به صورت خودکار ایندکسها را هنگام ایجاد دادههای پایه توسط عملیاتهای درج (Insert)، به روز رسانی (Update) یا حذف (Delete)، نگهداری میکند. با گذشت زمان این تغییرات میتواند باعث تکه تکه شدن یا پارگی (Fragmentation) ایندکسها در دیتابیس شوند (تکهتکه شدن-Fragmentation : در ذخیرهسازی کامپیوتری پدیدهای است که در آن فضای ذخیرهسازی بهطور ناکارآمد استفاده میشود و منجر به کاهش ظرفیت واقعی ذخیرهسازی میشود. همچنین به آن فضای هدر رفته نیز اطلاق میگردد؛ جهت کسب اطلاعات بیشتر به مقاله پارگی رجوع کنید). Fragmentation ایندکس(INDEX) چیست؟ زمانی به وجود میآید که ایندکسها دارای صفحاتی باشند که مرتبسازی منطقی، بر اساس مقدار کلید (Key Value) ، با مرتبسازی فیزیکی درون دادههای فایل (Data File) مطابقت و همخوانی نداشته باشد. تکه تکه شدن بیش از حد ایندکسها میتواند کارایی Queryها را کاهش دهد و باعث شود برنامه شما با سرعتی بسیار ایندکس(INDEX) چیست؟ کند اجرا گردد.
میتوان تکه تکه شدن ایندکس را توسط Reorganize و Rebuild کردن آن ایندکس برطرف کرد. برای ایندکسهای پارتیشنبندی شده (Partitioned) که بر اساس یک طرح پارتیشن ایجاد شده است، میتوانید از این دو روش جهت اعمال بر روی یک ایندکس کامل و یا یک پارتیشن از یک ایندکس استفاده کنید. Rebuild کردن یک ایندکس، ایندکس را از بین برده و آن را مجدد ایجاد میکند که این ویژگی تکه تکه شدگی را از بین برده، فضای دیسک را با فشرده کردن صفحات بر اساس تنظیمات Fill Factor موجود و مشخصی آزاد میکند و سطرهای ایندکسها را در صفحاتی پیوسته مرتب خواهد کرد (Fill Factor مقداری است که درصد استفاده هر صفحه Leaf-Level را که با داده پر شده است مشخص میکند. جهت کسب اطلاعات بیشتر مقاله What is Fill Factor and what is the best value for it? را مطالعه نمایید).
هنگامی که از کلمه کلیدی ALL استفاده گردد، تمامی ایندکسها در جدول در یک تراکنش مستقل بازسازی (Rebuild) خواهند شد. سازماندهی مجدد (Reorganizing) یک ایندکس از حداقل منابع سیستمی استفاده میکند. Reorganizing پایینترین سطح (Leaf Level-سطح برگ: پایینترین گرههای یک درخت گرههای برگ نام دارند) ایندکسهای کلاستر شده و غیر کلاستر را بر روی جداول (Tables) و نماها (Views) با استفاده از مرتبسازی صفحات در پایینترین سطح ادغام میکند تا مرتبسازی نودهای برگ در پایینترین سطح با منطق همخوانی داشته باشد. reorganization همچنین صفحات ایندکسها را فشرده میکند که این فشرده سازی بر اساس مقدار Fill Factor موجود صورت خواهد پذیرفت.
شناسایی تکه تکه شدگی (Fragmentation)
اولین قدم در تصمیم گیری اینکه از کدام روش ادغام (defragmentation) استفاده شود، آنالیز و تعیین درجه تکه تکه شدن ایندکس(INDEX) چیست؟ ایندکسهاست. با استفاده از تابع سیستمی sys.dm_db_index_physical_stats میتوانید Fragmentation را بر روی یک ایندکس خاص، تمامی ایندکسها در جداول یا نماهای ایندکس شده، تمامی ایندکسها در یک دیتابیس و یا تمامی ایندکسها در تمامی دیتابیسها شناسایی کنید. همچنین برای ایندکسهای پارتیشن بندی شده، sys.dm_db_index_physical_stats اطلاعات Fragmentation را برای هر پارتیشن بدست میآورد.
مجموعه نتایج برگشتی توسط تابع sys.dm_db_index_physical_stats شامل ستونهای زیر میباشد:
پس از اینکه درجه Fragmentation مشخص گردید، از جدول زیر جهت تعیین بهترین روش جهت تصحیح این تکه تکه شدگی استفاده میکنیم:
Rebuild کردن یک ایندکس میتواند به صورت Online و یا Offline صورت گیرد. در صورتی که Reorganize کردن یک ایندکس همواره به صورت Online انجام میشود. جهت دستیابی به در دسترس بودن ایندکسها، مشابه ویژگی Reorganize، میبایست انجام عملیات Rebuild ایندکسها نیز به صورت Online انجام گیرد.
این مقادیر یک دستورالعمل نامناسب را برای تعیین آن نقطهای که میبایست جابهجایی بین ALTER INDEX REORGANIZE و ALTER INDEX REBUILD صورت گیرد، فراهم میآورد. اگر چه مقادیر واقعی ممکن است در یک مورد نسبت به مورد دیگری متفاوت باشد. این مسئله مهمی است که شما بتوانید بهترین آستانه (Threshold) را برای محیط خود بیابید. در صورتی که تکه تکه شدن در سطوح بسیار پایین (کمتر از 5 درصد) باشد، نمیبایست از هیچ کدام ازین دستورات استفاده کرد، زیرا مزیت حذف چنین مقدار کوچکی از تکه تکه شدگی اغلب با هزینه بالای Reorganize و Rebuild کردن ایندکسها از بین میرود.
نکته: در حالت کلی، تکه تکه شدن بر روی ایندکسهای کوچک اغلب غیر قابل کنترل است. صفحات ایندکسهای کوچک بر روی بازههای (Extents) درهمی ذخیره میشود (Extentها واحدی پایهای هستند که بوسیله آن فضا مدیریت میشود. یک Extent هشت صفحه فیزیکی متوالی با سایز 64kb است. این به این معنی است که دیتابیسهای SQL Server، در هر مگابایت 16 Extent دارند. جهت کسب اطلاعات بیشتر مقاله Understanding Pages and Extents را مطالعه نمایید). Extentهای درهم بوسیله بیش از 8 Object به اشتراک گذاشته میشود، بنابراین تقسیم کردن یک ایندکس کوچک ممکن است پس از Reorganize و Rebuild کردن ایندکس کاهش نیابد.
محدودیتها
- ایندکسهایی با بیش از 128 Extent، در دو فاز عملیات Rebuild بر روی آنها اجرا میشود: منطقی و فیزیکی. در فاز منطقی، واحدهای تخصیص موجود که توسط ایندکس استفاده شده است، جهت اعطای مجوز به آنها مشخص میشوند، سطرهای داده کپی شده و مرتب میشوند، سپس به واحدهای تخصیص جدید که برای ذخیره ایندکس Rebuild ذخیره شده اند، منتقل میشوند. در فاز فیزیکی، واحدهای تخصیص که پیش تر برای اعطای مجوز انتخاب شده اند به صورت فیزیکی در یک تراکنشهایی کوتاه که در پس زمینه اتفاق میافتد رها میشوند.
- تا هنگامی که یک ایندکس Reorganize میشود، ویژگیهای ایندکسها مشخص نخواهد شد.
دسترسیها
به دسترسی ALTER بر روی جدول یا نما نیاز میباشد. کاربر میبایست در Server Role عضو Sysadmin و یا در Database Role، عضو db_ddladmin و db_owner باشد.
مشخصات ایندکسها
- در Object Explorer، پوشه دیتابیس مورد نظر را جهت تقسیم بندی ایندکسها بسط دهید.
- پوشه Table و سپس جدول موردنظر را بسط دهید.
- از پوشه Indexes، بر روی ایندکسی که میخواهید تقسیم بندی آن را بررسی کنید، راست کلیک کنید و گزینه Properties را انتخاب نمایید.
- در صفحه باز شده بر روی Fragmentation کلیک کنید.
در صفحه Fragmentation اطلاعات زیر در دسترس میباشد:
Page fullness: میانگین پر بودن صفحات ایندکس را به درصد نمایش میدهد. 100% به این معناست که صفحات ایندکس به طور کامل پر هستند و 50% به این معنی است که به طور میانگین هر صفحه ایندکس تا نیمه پر شده است.
Total fragmentation: درصد تقسیم بندی منطقی را نمایش میدهد. در واقع تعداد صفحات ایندکس که به ترتیب ذخیره نشده است را نمایش میدهد.
Average Row Size: میانگین اندازه سطر Leaf-Level را نمایش میدهد.
Depth: تعداد سطوح ایندکس را که شامل Leaf-Level نیز میباشد نمایش میدهد.
Forwarded Records: تعداد رکوردها در یک پشته که دارای نقاط ارسال مجدد به سایر مکانهای داده است (این حالت در زمان به روز رسانی، هنگامی که فضایی خالی جهت ذخیره سطری جدید در مکان اصلی وجود نداشته باشد رخ میدهد).
Ghost Rows: تعداد سطرهایی که جهت حذف انتخاب شدهاند، اما هنوز حذف نشدهاند. این سطرها هنگامی که سرور مشغول نباشد توسط یک عملیات پاکسازی حذف میشوند. این مقدار، سطرهایی را که به علت انجام تراکنش ایزوله (Snapshot Isolation Transaction) بازگردانده شدهاند شامل نمیشود.
Index Type: نوع ایندکس را نشان میدهد. مقادیر ممکن در این قسمت عبارتند از Clustered Index ،Nonclustered Index و Primary XML. جداول همچنین میتوانند به عنوان یک پشته هم ذخیره شوند (بدون ایندکسها)، اما پس از آن صفحه تنظیمات این ایندکس نمیتواند باز شود.
Leaf-Level Rows: تعداد سطرهای Leaf-Level را نمایش میدهد.
Maximum Row Size: سایز سطر Leaf-Level را نمایش میدهد.
Pages: تعداد کل صفحات داده را نمایش میدهد.
ID Partition :Partition ID یک b-tree شامل ایندکسها میباشد (یک درخت بی یا B-tree داده ساختاری درختی است که دادهها را به صورت مرتبشده نگه میدارد و جستجو، درج و حذف را در زمان مصرفی لگاریتمی میسر میسازد).
Version Ghost Rows: تعداد رکوردهای ghost recorder که به علت انجام یک تراکنش ایزوله بازگردانده شدهاند.
شبکه و سرور های خود را زیر نظر بگیرید و بلادرنگ از رخداد ها آگاه شوید.
ایندکس گوگل چیست و از چه راه هایی می توان صفحات را ایندکس کرد؟
آیا می خواهید جستجوی سایت شما به صورت ارگانیک افزایش یابد؟ قطعا جواب شما بله است. شما میدانید که افزایش ترافیک آن هم به صورت ارگانیک، چقدر می تواند در سوددهی و افزایش درآمد به شما کمک نماید. اگر شما بخواهید به چنین نتیجه مهمی دست یابید، باید سایت و صفحات شما در فهرست گوگل ذخیره شده باشند یا به اصطلاح ایندکس (index) شده باشند. قطعا شما نمی خواهید که یک بار سایت یا صفحه ای را ایندکس کنید و نیاز دارید به ازای هر تغییر و ایجاد صفحه ای، سایت شما در مورد index گوگل قرار گیرد. google’s indexation یک فرآیند موثر و تاثیرگذار است که اگر درست استفاده نشود، یک صاحب کسب و کار نمی تواند به هدفی که دارد و نتیجه ای که برای او مهم است برسد. خوشبختانه راه های زیادی وجود دارد تا بتوان صفحات را ایندکس نمود، که یکی از راحت ترین راه ها، معرفی سایت به سرچ کنسول گوگل است.
به نظر شما گوگل چطور سایت ها را در دیتابیس خود ذخیره می کند؟
گوگل دارای crawler (خزنده) یا spider است که با خزیدن در سایت و صفحات، تمامی اطلاعات موجود در آن سایت را در خود ذخیره می کند. وقتی که اسپایدر، به صفحه یا سایت جدیدی می رسد، دوست دارد بفهمد که محتویات درونی آن چیست و از چه عکس و لینک هایی تشکیل شده است و اگر لینک داخلی در آن به کار نرفته باشد، فقط همان صفحه را مورد ارزیابی قرار می دهد، پس برای خزش بهتر و بررسی صفحات داخلی، حتما از لینک سازی داخلی استفاده نمایید.
چگونه گوگل فرایند ذخیره سازی در اینترنت را انجام می دهد؟
ساخت یک کتابخانه با میلیاردها صفحه، نیاز به یک ابزار قوی و قدرتمند دارد. به مهمترین این ابزارها، spider یا عنکبوت گفته می شود. این ربات ها، تمامی صفحات و لینک ها را مورد بررسی قرار داده و سپس در گوگل ایندکس، ذخیره می کنند. Google’s spider، مدام در حال کراول کردن صفحاتی است که یا تازه ایجاد شده اند و یا به روز رسانی شده اند. همانطور که در بالا ذکر شد، نتایج جستجو به سرچ های کاربران و با توجه به الگوریتمهای گوگل، نمایش داده می شود، هر چند که نمایش این اطلاعات مدام در حال آپدیت و بروزرسانی می باشد.
[irp posts=”9447″ name=”بهینه سازی بودجه خزش (crawl budget)، با روش های طلایی | تاثیر کرال باجت بر سئو”]
چطور از ایندکس یک سایت اطلاع پیدا کنیم؟
از راه های متفاوتی می توان اطمینان پیدا کرد که صفحات سایت ما در گوگل ایندکس شده است یا خیر.
آسانترین راه برای چک کردن سایت در گوگل، استفاده از عبارت زیر است:
site:yourdomains
مثلا برای سایت ویکی دمی باید به صورت تصویر زیر نوشته شود:
در تصویر بالا، عدد ذکر شده بیانگر تعداد صفحاتی است که در گوگل ایندکس شده اند.
حال اگر بخواهید یک صفحه را در گوگل چک کنید باید از دستور نام دامنه شما/ نام صفحه :site استفاده نمایید.
راه دومی که می توان برای چک کردن صفحات از آن استفاده نمود، استفاده از سرچ کنسول است.
بعد از وارد شدن به اکانت سرچ کنسول، وارد بخش index و سپس coverage شوید. در تصویر زیر، تعداد صفحاتی که دارای تایید (valid) یا دارای خطا (Error) می باشد، به وضوح قابل مشاهده است.
یکی دیگر از راه هایی که با سرچ کنسول می توان از ایندکس شدن صفحه در گوگل اطمینان پیدا کرد، استفاده از بخش URL Inspection می باشد. شما می توانید آدرس (url) صفحه مورد نظر خود را در این بخش قرار دهید و اگر پیغامی مانند تصویر زیر ( url is on google) نمایش داده شد، یعنی صفحه شما در گوگل index شده است.
اما اگر پیغامی متفاوت (url is not on google) نمایش داده شود، به معنی ایندکس نشدن و حضور نداشتن در گوگل است.
Indexing یا شاخص گذاری موتورهای جستجو چیست؟
یکی از مهمترین عواملی که در سئو و بهینه سازی سایت ها باید به آن توجه نمود طریقه ی شاخص گذاری (Indexing) موتورهای جستجو می باشد.
موتورهای جستجوی پیشتاز همچون Yahoo!، Google و Bing از خزندهها (Spiders) جهت یافتن صفحات برای نتایج جستجوی الگوریتمیک استفاده میکنند. صفحاتی که از داخل باقی صفحات ایندکس شده، توسط موتورهای جستجو Link شدهاند و نیاز به ارسال، به موتور جستجو نداشته و بصورت خودکار پیدا میشوند. بعضی از موتورهای جستجو از جمله !Yahoo سرویس پولی ارسال را راه اندازی کرده اند که استفاده از خزندهها را هم بصورت مجموعهای از قیمتها و نیز بصورت سیستم بها به ازاء هر Click، اجرا میکند. این برنامهها معمولاً قرارگیری در بانک اطلاعاتی موتور جستجو را ضمانت کرده و در قبال رتبهای مشخص برای صفحه در لیست نتایج جستجو ضمانتی نمیکنند.
دو فهرست اصلی اینترنتی یعنی Yahoo Directory و Open Directory Project، هردو نیاز به ارسال دستی و بررسی انسانی دارند. Google ابزاری به نام Google Webmaster Tools ارائه میدهد که در آن میتوان نقشه سایت را توسط خوراک XML ایجاد کرده و بصورت رایگان ارسال نمود تا از یافته شدن تمام صفحات حتی صفحاتی که بصورت خودکار از طریق دنبال کردن Link ها پیدا نمیشوند، اطمینان حاصل نمود. خزندههای موتور جستجو میتوانند به عوامل مختلفی در هنگام خزیدن در یک سایت توجه کنند. نکته مورد نظر این است که تمامی صفحات سایت ایندکس نمیشوند. همچنین فاصله یک صفحه از ریشه سایت میتواند عاملی در پیدا شدن یا عدم آن توسط خزندههای موتورهای جستجو باشد. امروزه بسیاری از شرکتهای مطرح در دنیا از جمله تیم حرفه ای سئوخانه به بررسی و اجرای خدمات سئو و بهینه سازی سایت ها برای شرکتهای مختلف مشغول هستند.
شاخص اچ ایندکس H-Index چیست | نحوه محاسبه شاخص اچ ایندکس H-Index
اگر بخواهیم این پاسخ را بدهیم که شاخص اچ ایندکس (H-Index) چیست؟ باید اینگونه پاسخ دهیم که شاخص اچ ایندکس «H-Index »، شاخصی برای ارزیابی علمی مقالات پژوهشگران و محققان است که میزان تأثیر گذاری آنها را در پیشبرد علم نشان می دهد. این شاخص در حال حاضر به عنوان بهترین معیار موجود در ارزیابی علمی افراد به کار برده می شود.
دانشمندان همواره در جستجوی راه های جدید برای تجزیه و تحلیل ، اندازه گیری و مقایسه چیزهای مختلف هستند .شاخص « H-Index » در سال ۲۰۰۵ توسط Jorge Hirsch شرح داده شد .این شاخص نوعی اندازه گیری است که با هدف توصیف بهره وری علمی و تأثیر پژوهشگر بوجود آمده است .
« h-index » ایندکس(INDEX) چیست؟ ، نیز مانند بقیه معیارها ، شاخصی کامل نیست ، اما آن بیشتر مسائل و مشکلات مرتبط با ایمپکت فاکتور و روند چاپ را نشان می دهد و تجزیه و تحلیل های جالبی را بوجود می آورد . امروزه شاخص های کمی و کیفی زیادی برای سنجش تولیدات علمی نویسندگان و محققان ، مؤسسات و کشورها وجود دارد .
شاخص های کمی ، تعداد مقالات منتشر شده در مجلات علمی معتبر جهان است و شاخص کیفیت تعداد استنادها و ارجاعات داده شده به مقالات علمی افراد ، مؤسسات و کشورهاست . دانشمندان با ادغام این دو فاکتور کمی و کیفی ، معیارهای جدیدی را ابداع کرده اند که از جمله این معیارها می توان به شاخص اچ ایندکس« H-Index » اشاره کرد.
H-Index چیست؟
شاخص اچ ایندکس« H-Index » ، معیاری است برای اندازه گیری تعداد مقالات مؤثر یک محقق که چاپ کرده است . هر چه قدر تعداد مقالات با اهمیت یک نویسنده یا یک مجله بیشتر باشد ، شاخص اچ ایندکس « H-Index » آن بالاتر خواهد بود وجایی که آن مقاله به چاپ رسیده است ، تأثیری در میزان این شاخص ندارد . به عبارت دیگر، زمانی که ایندکس فردی به اندازه ی h باشد ، یعنی تعداد h مورد مقاله منتشر شده دارد که برای هر کدام از آنها h بار استناد شده است.
برای محاسبه ی شاخص H-Index اطلاعات زیر مورد نیاز است :
- تعداد کل مقالات چاپ شده (NP)
- تعداد استنادات برای هر مقاله (NC)
- بنابراین محقق می تواند از خودش بپرسد که” آیا مقاله چاپ شده ای دارد که حداقل یک بار توسط دیگران به آن استناد شده باشد؟” اگر این چنین باشد محقق « H-Index » یک دارد و می تواند به سؤال بعدی اقدام کند ، “آیا محقق دو مقاله چاپ شده دارد که برای هر یک دوبار استناد شده باشد؟” اگر این چنین باشد ، پس این بار هم عدد اچ ایندکس « H-Index » او ۲ است ومحقق می تواند سؤالات را به همین شیوه ادامه دهد تا زمانی که نتواند به سؤال پاسخ مثبت دهد .
دلیل اهمیت H-Index
این شاخص به منظور ارتقای سایر شاخصهای اندازهگیری علم مانند تعداد کل مقالات و تعداد کل استنادات طراحی شده است تا محققان تأثیرگذار را از آنهایی که صرفاً تعداد زیادی مقاله منتشر میکنند ، متمایز کند. این شاخص نسبت به سایر معیارها چندین مزایا دارد که عبارتند از :
- این شاخص متکی به استنادات مقالات یک نویسنده است و ارتباطی با استنادات مقالات مجلات ندارد.پس یک اندازه گیری صحیح و واقعی از کیفیت است .
- این شاخص به واسطه ی ارجاع دهی به یک مقاله موثر زیاد تغییر نمی کند .
- تعداد زیاد مقالاتی که به طور ناچیزی مورد استناد قرار گرفته اند ، باعث افزایش این شاخص نمی شود .
- این شاخص ، چاپ کردن مقاله را به حداقل می رساند ، یعنی فرد تلاش می کند هر مقاله ای را چاپ نکند و به منتشر کردن مقالات با کیفیت بپردازد .
- این شاخص برای سنجیدن و مقایسه کردن دانشمندان هم رشته و هم شغل مناسب است .ایندکس(INDEX) چیست؟
- این شاخص علاوه بر سنجیدن اشخاص ، به مقایسه بخش ها ، برنامه ها و گروه های دیگری از دانشمندان می پردازد.
ابزارهای محاسبه H-Index
سه پایگاه اطلاعاتی معروف وجود دارد که شاخص « H-Index » را محاسبه می کنند . پایگاه های Web of Knowledge و Scopus که نیاز به اشتراک دارند و Google Scholar که این کار را به صورت رایگان انجام می دهد.
Web of Knowledge
شبکه دانش ، یکی از پایگاه متعلق به موسسه اطلاعات علمی (ISI) است . یکی از بهترین ابزارها برای محاسبه شاخص « H-Index » ، ابزار Web of Science می باشد که از بخش های Web of Knowledge (WOK) است. این ابزار برای محاسبه شاخص H ، کلیه مقالات یک نویسنده را از ابتدا تا زمان حال مد نظر قرار می دهد .
در صورتی که از طریق دانشگاه یا حساب شخصی به این پایگاه دسترسی داشته باشید ، می توان به راحتی با جستجوی نام نویسنده مورد نظرتان ،« H-Index » و بسیاری اطلاعات آماری دیگر راجع به آن را در این پایگاه مشاهده کرد .
Scopus
این پایگاه اطلاعاتی که همانطور که قبلا گفته شده متعلق به انتشارات الزویر است ، یکی دیگر از پایگاه هایی می باشد که شاخص « H-Index » و بسیاری اطلاعات آماری دیگر را برای نویسندگان مختلف در اختیار محقق قرار می دهد. نکته ای که در مورد این پایگاه باید بدانید این است که تنها مقالات سالهای ۱۹۹۵ به بعد را که در این پایگاه ثبت شده اند، برای محاسبه شاخص « H-Index » مد نظر قرار می دهد .
Google Scholar
این ابزار که برای شرکت گوگل می باشد، رایگان بوده و محقق یا پژوهشگر می تواند به راحتی با ثبت یک حساب کاربری در گوگل شاخص « H-Index » خود را محاسبه کنید.
در مورد این ابزار، باید به این نکته توجه کرد که به دلیل مد نظر قرار دادن طیف گسترده ای از مقالات در محاسبه شاخص « H-Index » (حتی مقالاتی که به صورت رایگان در اینترنت وجود دارند و در مجلات معتبر منتشر نشده اند)، به اندازه ابزار های دیگر دقیق نیست.
اما از آنجا که ابزاری رایگان بوده و نرم افزار های زیادی برای استفاده از آن وجود دارد، مناسب است. Publish or Perish و Scholar H-Index Calculator دو نرم افزار خوب می باشند که برای محاسبه این شاخص از اطلاعات گوگل اسکولار استفاده می کنند.
تفاوت در شاخص های محاسبه شده پایگاه های مختلف
برای پژوهشگرانی که سال های بسیاری را به پژوهش و تحقیق اختصاص داده اند ، شاخص های H محاسبه شده در پایگاه های مختلف می تواند تفاوت قابل توجهی داشته باشد. این تفاوت از عواملی ناشی می شود که به برخی از آن ها پیش تر اشاره گردید . برخی از مهمترین عوامل را می توان به صورت زیر بر شمرد :
تفاوت در بازه زمانی انتشار مقالات برای محاسبه شاخص
از آن جایی که پایگاه اسکوپوس برای محاسبه شاخص « H-Index » ، مقالات فهرست شده از سال های ۱۹۹۵ به بعد این پایگاه را مد نظر قرار می دهد، عملا مقالات که قبل از این سال منتشر شده اند ، نادیده گرفته می شوند. حال آنکه ممکن است همان مقالات به دفعات مورد استناد قرار گرفته باشند . بنابراین اثر این تفاوت بیشتر در پایگاه اسکوپوس خود را نشان می دهد .
تفاوت در پوشش مقالات
گاهی ممکن است یک مقاله به دلایل مختلفی در یک پایگاه ثبت نشده باشد . البته اثر این تفاوت معمولاً زیاد نیست . علاوه بر این محقق می تواند با امکاناتی که در Scopus و WOK وجود دارد، تقاضای تغییرات در مقاله های خود را بدهد . بدین ترتیب این پایگاه ها پس از بررسی، مقالات و یا تعداد استناد های مد نظر شما را کم و یا زیاد خواهند کرد.
تفاوت در تعداد مقالات و مشابهت های اسمی
در پایگاه های ایندکس(INDEX) چیست؟ Scopus و WOK هر نویسنده برای خود یک صفحه دارد و کلیه اطلاعات مربوط به وی در آن ثبت می شود به طوری که احتمال جابجایی تحقیقات پژوهشگران به صفر تمایل می کند . از طرفی هر مقاله منتشر شده تنها یک بار در این پایگاه ها ثبت می شوند . حال آنکه در گوگل اسکولار اینگونه نیست .
در صورت وجود مشابهت اسمی، امکان تداخل وجود دارد و این گاهی باعث ایجاد تفاوت در نتایج می شود. همچنین ممکن است یک مقاله دو یا چند بار در اسکولار فهرست شده باشد. این امر در شرایط خاص می تواند باعث افزایش و یا کاهش کاذب شاخص « H-Index » شود .
معایب و نقاط ضعف H-Index
نقاط ضعف شاخص اچ ایندکس « H-Index » عبارت است از:
- این شاخص ،تعداد مقالات استناد شده را اندازه گیری می کند بدون اینکه در نظر بگیرد دلیل استناد کردن و یا استفاده از این مقاله چه بوده است؟شاید دلیل منفی داشته است.
- این شاخص،تغییرات در میانگین تعداد استنادات یا انتشارات در رشته های مختلف را محاسبه نمی کند.
- این شاخص،تعداد و جایگاه نویسندگان مقاله را نادیده می گیرد.
- این شاخص نیز مانند سایر معیارها ، بر اساس داده های قبلی پایه گذاری می شودو یک پیش بینی کننده معتبر از عملکردهای آینده نیست .
با این حال جورج هیرش با پیگیری یک نشریه ثابت کرده است که شاخص اچ ایندکس « H-Index » در پیشگویی عملکردهای علمی آینده ، نسبت به سایر شاخص ها بهتر است.
شاخص H-index چیست؟
H-Index، شاخصی برای ارزیابی علمی پژوهشگران است که میزان تأثیر گذاری آن ها را در پیشبرد علم نشان می دهد. این شاخص در حال حاضر به عنوان بهترین معیار موجود در ارزیابی علمی افراد به کار برده می شود.
h-index چیست؟
اچ ایندکس یک شاخص عددی است که میزان تاثیر گذاری مقالات علمی استناد شده توسط دانشمندان و پژوهشگران را بررسی وتعیین می کند. این شاخص اطلاعات را به صورت کمی نمایش می دهد. این شاخص در سال ۲۰۰۵ توسط فیزیکدانی به نام جورج ای. هیرش پیشنهاد شد و گاهی با نام شاخص هیرش نیز شناخته می شود.
اچ ایندکس علاوه بر ارزیابی علمی دانشمندان، مشخص می کند که کدام محقق از نظر استناد تعداد مقالات نسبت به دیگران بالاتر است. این شاخص بیشتر برای محققانی که در یک حوره کاری مشخص فعالیت می کنند کاربرد دارد. این شاخص توسط پایگاه های مختلفی محاسبه می شود که در مقالات انگلیسی زبان، پایگاه اسکوپوس، گوگل اسکالر، آی اس آی و برای مقالات فارسی در پایگاه آی سی اس است.
H به عنوان یک شاخص کمی، تعداد مقالات استناد شده یک محقق را نشان می دهد. در واقع وقتی می گوییم یک مقاله h بار منتشر شده یعنی میزان استناد های آن نیز مشخص می شود. اگر میزان استناد های شخصی ۳ باشد یعنی ۳ بار به این مقاله استناد شده است.
این شاخص، ضریب تاثیر بالایی دارد و به خاطر استناد بالای آن به آسانی محاسبه می شود. حتی می توان برنده جایزه نوبل را به وسیله این شاخص پیش بینی کرد.
H-Index با چه هدفی استفاده می شود؟
پس از پاسخ به این سوال که H-Index چیست ، این سوال پیش خواهد آمد که هدف استفاده از H-Index چیست؟ تعریف اچ ایندکس بدین شکل است که وقتی محققی دارای اچ ایندکس h است منظور آن است که دارای h مقاله منتشر شده است که در مقالات دیگر، حداقل h بار به آن استناد شده است. به طور مثال H-index برابر با ۱۰ به این معنی است که نویسنده مورد نظر ۱۰ مقاله دارد که برای آن ها حداقل ۱۰ ارجاع دریافت کرده است. بنابراین اچ ایندکس هم تعداد مقالات و هم تعداد استنادات برای هر مقاله را نشان می دهد. این شاخص تنها در مقایسه دانشمندان فعال در یک حوزه مشترک، عملکرد مناسبی دارد.
دلیل ایجاد اچ ایندکس
پیش از ابداع اچ ایندکس، تعداد استنادات به مقالات یک پژوهشگر یا یک مجله، به عنوان معیاری برای ارزیابی آن محقق یا آن مجله بودند. اما مشکلی که ایجاد می شد، این بود که ممکن بود یک پژوهشگر یک مقاله مورد توجه به چاپ برساند که استناد های زیادی دریافت کند و با وجود اینکه آن فرد مقالات چندانی نداشت، اما به عنوان یک محقق تأثیر گذار محسوب می گردید.
از سوی دیگر این امکان وجود داشت که یک پژوهشگر مقالات بی کیفیت زیادی را منتشر کند و به واسطه تعداد بالای مقالات خود، تعداد استناد های قابل توجهی را جمع آوری کند. در چنین شرایطی، شاخص H خلق شد که هم زمان تعداد مقالات و تعداد ارجاعات به آن ها را در نظر می گرفت و معیار دقیق تری برای سنجش محققان و مجلات بود.
H-Index چه تاثیری دارد؟
در حالیکه ممکن است به نظر برسد شاخص H صرفا به منظور امتیازدهی به محققان در زمینه های مختلف به کار می رود اما کارایی های بیشتری دارد. اول اینکه خود محققان می توانند فعالیت خودشان و دیگران را با توجه به این امتیاز بسنجند. بخصوص برای شغل هایی در زمینه های علمی، شاخص H بسیار موثر است.
همچنین این امتیاز به افرادی که در یک زمینه ی خاص اطلاعات ندارند یا متخصص نیستند کمک می کند بتواند راحت تر اعتبار یک محقق را ارزیابی کند. مثلا در یک مصاحبه کاری برای یک شغل تحقیقاتی یا علمی خاص که مصاحبه کننده اطلاعات خیلی خاصی درباره زمینه ی علمی شخص مصاحبه شونده ندارد، با توجه به امتیاز شاخص H او می تواند بهتر تصمیم بگیرد که چقدر این شخص می تواند موثر و کارآمد باشد.
ایراد شاخص H چیست؟
با وجود اینکه شاخص H بسیار موثر عمل کرده است و فواید زیادی داشته است اما هنوز مشکلات و کمبودهایی دارد. یکی از این موارد زمانیست که امتیاز H را در فیلدهای مختلف مقایسه می کنیم. در برخی از فیلدها ( مثل اقتصاد) معمولا شاخص H محققان امتیاز بالاتری نسبت به برخی فیلدهای دیگر (نظر ادبیات) دارد. بنابراین ممکن است این اشتباه برداشت شود که دو شخص با یک میزان علم در زمینه ی تخصصی خودشان از یک اندازه تاثیر برخوردار نیستند.
همچنین، امتیاز H نیز ایندکس(INDEX) چیست؟ قابل دستکاری شدن است، مثلا یکی از مشکلاتی که وجود دارد اینست که اشخاص می توانند از دوستان و آشنایان خود بخواهند دائم در مقالاتشان به مقاله آن ها اشاره کنند تا با این کار تعداد ارجاعات به مقالاتشان بالاتر برود. اما این لزوما به معنی اینکه مقالات او بار علمی بالایی دارند نیست.
شاخص H در پایگاههای اینترنتی علمی
شما می توانید H-Index نویسنده مورد نظرتان را در پایگاههای اینترنتی نظیر اسکوپوس یا گوگل اسکولار پیدا کنید.
شاخص H در پایگاه اسکوپوس
در پایگاه اسکوپوس کافیست وارد صفحه جستجوی نویسنده (Author Search) شوید و نام مورد نظر را وارد کنید. پس از اینکه نویسنده مورد نظرتان را در لیست پیدا کردید روی اسم او کلیک کرده و وارد صفحه پروفایل وی شوید. در این صفحه در سمت راست می توانید h-index فرد و تعداد مقالاتی که در سایت قرار داده است و تعداد ارجاعاتی که به مقاله فرد شده است را ببینید. در پایین صفحه در قسمت Documents نیز می توانید مقالاتی که منتشر کرده و تعداد ارجاعات به هر مقاله را ببینید.
شاخص H در پایگاه گوگل اسکولار
در گوگل اسکولار به سه طریق می توانید به امتیاز h-index یک محقق دست پیدا کنید. ابتدا اگر نام محقق را می دانید می توانید در بخش Advanced Setting وارد کنید تا وی را پیدا کرده و پروفایل او را ببینید. یا در فیلد مربوط به جستجو نام او را به این شکل جستجو کنید author:author name، با جستجوی نام محقق مورد نظرتان ابتدا پروفایل وی و سپس مقالاتی که منتشر کرده است دیده می شود.
اگر نام محقق را نمی دانید و فقط می خواهید بدانید نویسنده مقاله ای که می خواهید به آن استناد کنید چه امتیازی دارد فقط کافیست پس از جستجوی موضوع مورد نظرتان و انتخاب مقاله، به روی نام نویسنده کلیک کنید تا صفحه پروفایل وی باز شود. در سمت راست صفحه پروفایل یک نویسنده در گوگل اسکولار می توانید تعداد ارجاعاتی که به مقالات این نویسنده شده ، تعداد مقالات ایندکس(INDEX) چیست؟ و امتیاز h وی را ببینید و در سمت چپ نیز به ترتیب مقالاتی که منتشر کرده است را پیدا کنید. مقالات یک نویسنده به ترتیب بیشترین ارجاعات نشان داده می شود، این می تواند به شما در انتخاب مقاله ای که از نظر علمی بار بیشتری دارد کمک کند.
H-index در پایگاه ISI
در سایت ISI باید دسترسی به این بخش برقرار باشد تا بتوانید نام نویسنده مورد نظرتان را جستجو کرده و H-index وی را بیابید.
برخی انتقادات وارد بر H-Index
اگر چه شاخص H در حال حاضر مهمترین معیار برای ارزیابی پژوهشگران به شما می رود، اما از سال 2005 تا کنون انتقاداتی بر آن وارد شده ایندکس(INDEX) چیست؟ که برخی از آن ها را عنوان می کنیم.
- این شاخص تعداد نویسندگان یک مقاله و سهم آن ها در پژوهش را مد نظر قرار نمی دهد.
- این شاخص محدودیت های موجود در تعداد ارجاعات زمینه های مختلف علمی و مجلات مختلف را مد نظر قرار نمی دهد. برخی رشته های علمی و به تبع آن برخی مجلات، محدودیت ها و شیوه های مختلفی برای استناد مقالات دارند، گاها دیده می شود یک مقاله چند صد رفرنس دارد اما مقاله ای در زمینه علمی دیگر تعداد رفرنس های به مراتب کمتری دارد که این ناشی از تفاوت مجلات و رشته های علمی است.
- شاخص H محدود به تعداد مقالات منتشر شده است. به عبارت دیگر اگر یک محقق تعداد محدودی مقاله داشته باشد که به دفعات بسیار ارجاع داده شده اند، شاخص H بالایی نخواهد داشت.
- شاخص H متن ارجاعات را مورد بررسی قرار نمی دهد. برای مثال در یک مقاله ممکن است به مقالات زیادی استناد شده باشد، اما از بسیاری تنها یک جمله از آورده شود و محوریت پژوهش تنها بر چند مقاله خاص باشد.
- این شاخص خود ارجاعی را نیز مد نظر قرار می دهد. به این ترتیب یک محقق می تواند بار ها به تحقیقات پیشین خود استناد کند و این استناد ها در شاخص H وی ایندکس(INDEX) چیست؟ تاثیر می گذارند.
تفاوت های H-Index در رشته های مختلف
در میان ۲۲ رشته علمی فهرست شده در بررسی حداقل تعداد استنادات Essential Science Indicators مربوط به تامسون روترز، فیزیک دومین علم پراستناد پس از علوم فضاییست. در طول بازه زمانی ۱ ژانویه ۲۰۰۰ تا ۲۸ فوریه ۲۰۱۰، یک فیزیکدان باید 2073 استناد را دریافت می کرد تا جزء %۱ پراستنادترین فیزیکدانان جهان به شمار برود. حد مشخص شده برای علوم فضایی از همه علوم بیشتر است (۲۲۳۶ استناد)، پس از آن فیزیک، پزشکی بالینی (۱۳۹۰) و بیولوژی و ژنتیک مولکولی (۱۲۲۹) قرار دارند. اکثر رشته ها نظیر محیطزیست/اکولوژی (۳۹۰)، تعداد محققان کمتر، مقالات کمتر و استنادات کمتر دارند. بنابراین حدود مشخص شده برای این رشته ها در Essential Science Indicators نیز پایین تر است. کمترین مقدار استناد برای قرار گیری نویسنده در بین ۱% برتر آن رشته، علوم اجتماعی (۱۵۴)، علوم کامپیوتر (۱۴۹) و علوم بین رشته ای (۱۴۷) هستند.
این ارقام در سایر رشته ها بسیار متفاوت است: تیم تأثیر علوم اجتماعی در مدرسه اقتصاد لندن به این نتیجه رسیده است که دانشمندان علوم اجتماعی در بریتانیا به طور متوسط اچ ایندکس پایینتری داشتند. اچ ایندکس برای استادان (تمام) بر اساس داده های گوگل اسکولار در بازه ۲/۸ (حقوق)، ۳/۴ (علوم سیاسی)، ۳/۷ (جامعه شناسی)، ۶/۵ (جغرافیا) و ۷/۶ (اقتصاد) قرار داشت. به طور متوسط در تمام رشته ها، اچ ایندکس یک پروفسور علوم اجتماعی دو برابر اچ ایندکس یک مدرس یا مدرس ارشد بود، با این حال کمترین تفاوت در رشته جغرافیا وجود داشت.
جایگزین های H-Index چیست و چه اصلاحاتی نیاز است؟
H-index جایگزین های مختلفی دارد که تقریبا همگی مشابه خود H-index هستند.
پیشنهادهای مختلفی برای اصلاح اچ ایندکس با هدف تأکید بر ویژگی های مختلف ارائه شده است. اکثر این پیشنهادات ارتباط زیادی با اچ ایندکس اصلی دارند، با این حال شاخص های جایگزین ممکن است برای تصمیم گیری میان CVهای (رزومه های) مشابه مهم باشند، همان طور که در اغلب فرآیندهای ارزیابی چنین است.