درباره کتاب پاکسازی داده ها (رفع ناسازگاری، تکرار، مقدار از دست رفته و اغتشاش)
کتابی که در پیش رو دارید به نام پاکسازی داده ها (رفع ناسازگاری، تکرار، مقدار از دست رفته و اغتشاش) به تالیف دکتر نگین دانشپور و مهدیه عطابیان که انتشارات دانشگاه تربیت دبیر شهید رجائی آن را چاپ و روانه بازار کرده است.
داده های جمع آوری شده از منابع مختلف و توزیع شده برای اتخاذ تصمیمات مفید و سودمند باید به اطلاعات و دانش تبدیل شوند.
به طور سنتی استخراج دانش را تحلیل گران داده انجام می دهند. اما با توجه به رشد روز افزون داده ها نیازمند روش هایی مبتنی بر رایانه هستیم. فرآیند های مبتنی بر رایانه برای کشف دانش را داده کاوی می گویند کیفیت داده های مورد بررسی در هنگام استخراج دانش اهمیت بسزایی دارد.
صحت کامل بودن و سازگاری از جمله معیار های مورد بررسی در بحث کیفیت داده ها هستند. داده های دنیای واقعی ممکن است به دلایل مختلفی دخار مشکل عدم کیفیت شوند.
مقادیر جا افتاده، داده های مغشوش، ناسازگاری و مقادیر تکراری ازذجمله مشکلات عمده داده ها هستند.
از این رو پیش پردازش که اغلب به منظور رفع این مشکلات انجام می شود، یکی از مهم ترین مراحل کشف دانش است.
علاقمندان به این کتاب و دیگر کتاب های مشابه می توانند از سایت خوان آخر دیدن کنند.
فهرست مطالب کتاب
- فصل اول: پیش پردازش داده ها
- فصل دوم: شناسایی تناقضات محدودیت های یکپارچگی و تعمیر داده ها
- فصل سوم: جایگذاری مقادیر جا افتاده
- فصل چهارم: شناسایی رکورد های تکراری
- فصل پنجم: تشخیص داده های مغشوش
- فصل ششم: تشخیص داده های پرت
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.