با توجه به امکانات بیشماری که دادهکاوی در اختیار همه از جمله کسب و کارها و حتی افراد میدهد، لزوم استفاده از آن بر کسی پوشیده نیست. اما با توجه به تکنیکها و مدلهای دادهکاوی، مسئله مهم این است که با توجه به نوع نیاز، مدل و تکنیک مناسب را انتخاب کنید.
در این مقاله قصد داریم تا مدلهای مهم و کاربردی دادهکاوی را به شما معرفی کنید تا بتوانید در انتخاب درست مدل دادهکاوی موفق عمل کنید.
مدلسازی پیشبینانه
یکی از مدلهای بسیار کاربردی و پرطرفدار در دادهکاوی، مدلسازی پیشبینانه است. این مدل به این شکل عمل میکند که تلاش میکند اتفاقات و رویدادهای آینده را دستهبندی و متناسب با آن پیشبینیهای لازم را به عمل آورد.
یکی از کاربردهای مهم در این مدل، برای حوزه بانکداری است، زمانی که برای پرداخت وام به مشتری، احتمال پرداخت اقساط محاسبه میشود و در نتیجه احتمال پرداخت وام به مشتری محاسبه میگردد.
در این مدل تکنیکهای زیادی استفاده میشود که در اینجا بعضی از آنها را برای شما بیان میکنیم:
- درختهای تصمیمگیری: در این تکنیک، نمودارهایی به شکل درخت وجود دارد که شاخههای درخت، رویدادهای که احتمال وقوع دارند را نشان میدهند.
- شبکههای عصبی: با استفاده از این تکنیک میتوان از طریق برنامههای تعریف شده با کامپیوتر، الگوها را تشخیص داد، پیشبینی کرد و سپس از آنها یاد گرفت.
- رگرسیون: در این تکنیک که کاملا ریاضی و عددی است، شدت ارتباط بین متغیرهای وابسته و مستقل را اندازهگیری میکنند.
- ماشینهای بردار پشتیبان: در این تکنیک مدلهای یادگیری بر پایه نظارت را در هماهنگی با الگوریتمهای یادگیری استفاده میکنند.
مدلسازی توصیفی
در این مدل از مدلهای دادهکاوی که قرار است دادهکاوی را به صورت توصیفی انجام دهیم، دادهها را در دستهها و گروههای مشابه تقسیمبندی میکنیم تا عمل پردازش و در نهایت تحلیل و نتیجهگیری درستتر و راحتتر باشد.
بعضی از تکنیکهایی که در این روش استفاده میشود عبارتند از:
- خوشهبندی: گروهبندی و دستهبندی دادههای مشابه
- تحلیل مولفههای اصلی: تشخیص رابطه میان متغیرها
- قانون وابستگی: تشخیص رابطه میان دادهها و رکوردها
- کشف ناهنجاری: شناسایی الگوهای نامتعارف و غیرمعمول
مدلسازی تجویزی
همانطور که میدانید عموما دادههایی که در فضای وب وجود دارند، ناهمگن و غیرساختار یافته هستند مثلا انواع فایلهای متنی، صوتی، تصویری، پی دی اف، نظرات و…. که همگی باعث به وجود آمدن شاخهای در دادهکاوی به نام متنکاوی (Text Mining) شدهاند.
در این مدل باید از تجزیه و تحلیل و پردازش و تبدیل دادههای غیرساختار یافته برای گرفتن خروجی برای مدلهای پیشبینی وقایع برای افزایش میزان دقت استفاده کرد.