دیتا مایند

داده کاوی چیست؟

"داده کاوی به تکنیکی گفته می شود که ارتباط ناشناخته بین داده ها را کشف می کند"  این تعریف متعلق به شرکت اوراکل است .در تمام تعاریفی که برای داده کاوی ذکر شده حتما اشاره ای به کشف داده می شود .این حوزه سعی میکند مجموعه داده عظیمی را تحلیل کند و بر اساس آن الگو یا دانش پنهان در داده را کشف کند. به طور مثال در تمام منوهای مربوط به ورزش کلمات خاصی مثل سرمربی ، بازیکن و .... ذکر می شود .داده کاوی با استفاده از تحلیل مجموعه عظیمی از متون می تواند  الگوی استفاده شده در این خبرها را کشف کند . کسب این دانش هدف اصلی داده کاوی است به همین دلیل به  داده کاوی "کشف دانش داده" نیز می گویند . ادعا می شود که با استفاده از داده کاوی می توان به دانشی دست یافت که خود انسان قرن ها بعد این دانش را کسب خواهد کرد .  بنابرابن تمرکز اصلی داده کاوی بر روی کشف دانش پنهان داده است . یعنی پیدا کردن نظمهای پیچیده موجود در نهان داده های حجیم . تفاوت داده کاوی با سیستمهای ساده سوال جواب و پایگاه داده نیز در این است به دنبال پیدا کردن طلا در معدن و کشف روابط پیچیده بین داده هاست .  داده کاوی را می توان به فرایند کشف طلا از معدن تشبیه کرد . همانطور که میدانیم فرایند استخراج طلا از معدن حجم عظیمی از فلزاتی که از معادن استخراج می شوند دور ریخته می شوند و بعد از مراحل بسیار طلا از بین این فلزات استخراج می شود . در داده کاوی نیز چنین است ما برای استخراج دانش مورد نظر باید داده های نویز  بسیاری دور ریخته شود به صورت عادی 90% داده ها نویز و 10% داده قابل استفاده وجود دارد . کار داده کاوی نیز استخراج این 10% از 100% داده ها میباشد . 

# داده کاوی