دیتا مایند

راه حل برای مشکل ناسازگاری مجموعه داده در داده کاوی

زیر مجموعه : مفاهیم داده کاوی

مشکل ناسازگاری مجموعه داده، به شکل تفاوت مجموعه داده‌ها در تحقیقات داده‌کاوی و مقایسه نتایج به‌دست‌آمده گفته می‌شود. برای حل این مشکل راه‌حل‌هایی ارائه‌شده است . ازجمله استفاده از چندین مجموعه داده برای تست مدل . با این کار بیشتر می‌توان به نتایج به‌دست‌آمده تکیه کرد .

راه‌حل بعدی ارائه‌شده ، استفاده از مجموعه داده مشترک برای اعتبار سنجی دقت مدل طبقه‌بندی است . در این حالت تمامی محققین مدل خود را بر روی یک دیتاست مشترک تست می‌کنند .

در شرایطی که این 2 شرط رعایت شود بیشتر می‌توان به نتایج به‌دست‌آمده اطمینان کرد زیرا در این شرایط مجموعه داده‌های بیشتری موردتوجه محققین قرار می‌گیرد و روش بر روی دیتاست های بیشتری تست می‌شود ، این عمل کیفیت ارزیابی مدل ارائه‌شده را بهبود می‌بخشد .