کاربردهای داده کاوی به زبان ساده

کاربردهای داده کاوی به زبان ساده

کاربردهای داده کاوی به زبان ساده

به مناسبت هفته فناوری اطلاعات همایشی در خصوص جایگاه IT در حوزه سلامت در دانشگاه جندی شاپور اهواز برگزار شد. دعوت شده بودم تا ارائه ای در خصوص هوش تجاری و داده کاوی داشته باشم. داده کاوی یکی از علایق شخصی من بوده و هست. سعی کردم از فرصتی که در اختیار دارم استفاده کنم و با زبانی ساده در مورد کاربردهایی که داده کاوی در علوم پزشکی دارد صحبت کنم. در این حوزه پژوهش ها و مقالات زیادی وجود دارد اما در عمل استفاده چندانی ( تا تاریخ این نوشته و در ایران) در محیط عملیاتی علوم پزشکی یعنی درمانگاه و بیمارستان ها مشاهده نمی شود و مدیران هم استقبالی از آن نکرده اند.

ما در عصر اطلاعات نیستیم. در عصر انفجار اطلاعات هستیم. سیلابی که از همه چیزهای اطراف ما در گستره وسیع و متنوعی از همه فعالیت های سیاسی، اجتماعی، اقتصادی، زیستی و زیست محیطی و ... با یا بدون مشارکت ما بوجود آمده است.

مهمترین ارزش افزوده ای که این حجم وسیع از اطلاعات برای ما ایجاد می کند بدست آوردن دانش است. آنچه داده کاوی و روش های آن به ما وعده می دهند کشف الگوهای جالب و دانش مستتر از دل این داده هاست.

داده کاوی دو کارکرد اصلی دارد: پیش بینی رفتار آینده داده ها و توصیف و تفسیر الگوها

پیش بینی همیشه جزیی از آمال و آرزوهای انسان ها بوده و می توانیم رد پای آن را در داستان ها و افسانه ها  مشاهده کنیم. به همین دلیل فهم این کارکرد داده کاوی برای همه ساده است. اما کارکرد توصیفی داده کاوی که از دید من هیجان انگیز ترین بخش آن نیز هست کمی نیاز به توضیح و تفسیر دارد.

پیش از هرچیز باید دو پیش شرط اصلی برای تحقق صحیح کارکردهای داده کاوی را متذکر شوم. اگر انتظار استخراج دانش از داده کاوی داریم باید از:

  • با کیفیت بودن داده ها (دقت، سازگاری، کامل بودن، به هنگام بودن، اطمینان از درستی داده ها و قابلیت تفسیر)
  • داشتن عمق مناسب داده ها

خاطرجمع باشیم.

با فرض رعایت این دو پیش شرط، خروجی کارکرد توصیفی بصورت مجموعه ای از الگوهاست که تلازم بین داده ها را نمایان می کنند.

برای درک بیشتر این کارکرد و ملموس تر شدن روش کار داده کاوی یکی از پژوهش های انجام شده را مهندسی معکوس کردم. فرض کنید داده های ما مربوط به مادران باردار و وضعیت سلامت آنها در طول بارداری و تولد نوزاد است.

نتایجی زیر می توانند نمونه ای از کارکرد توصیفی داده کاوی باشند:

در مادران دارای گروه خونی A+ ، احتمال بیماری دوران بارداری نسبت به سایر گروه خونی بیش تر است.

بیماری دوران بارداری در زنانی که جنسیت نوزاد آنها دختر است، نسبت به جنسیت نوزاد پسر بیش تر است.

نکته مهم این نتایج این است که ما از ابتدا به دنبال اثبات یا کشف چنین روابطی نبوده ایم و اینجاست که داده کاوی راهش را از آنالیز آماری جدا می کند. نتایج حاصل از داده کاوی بدون هیچ پیش فرض اولیه ای در مورد داده ها استخراج شده اند در حالی که در آنالیزهای آماری ما همیشه بدنبال اثبات یک فرضیه هستیم.

دقت داشته باشید تلازم بین داده ها با رابطه علت و معلولی تفاوت دارد و نتایج را نباید بصورت علت و معلولی تفسیر کرد.

برچسب ها
اشتراک گذاری در :
امین برهمند
مشاور و مدرس کسب و کارها در حوزه فن آوری اطلاعات

مطالب مرتبط

ارسال دیدگاه